Wan2.2のt2iワークフロー(2)｜Stable Diffusion｜Blog

Stable Diffusion 2025.08.22

今回は同じような画像がたくさん出てきます

Lowモデルのみで画像を生成するワークフロー

　今回扱うワークフローはWan2.2のLowモデルを2回使って画像を生成します。前回使ったものはHiモデル4Steps＋Lowモデル4Stepsに対し，今回使うものはLowモデル2Steps＋Lowモデル7Stepsになっています。仕組みが異なるので，今回はワークフローのカスタマイズを行ってから生成される画像を比較したいと思います。

フローの流れを見やすくしてLLMプロンプト生成機能をつける

　まずは配線整理から取りかかりました。前回のワークフローと比べるとシンプルなワークフローなので，配線が見えるようにノードの大きさと場所を変更しました。LLMを使ったプロンプト生成機能は前回のワークフローからコピーして貼りつけるだけなので，基本的なカスタマイズはあっという間に終わりました。
ワークフローを見ると上記のSteps以外にも異なる点がありました。

高速化に使っている技術が異なります。前回使ったワークフローはtorch.compileで，今回のはsage_attentionというもののようです。
今回使ったワークフローにはネガティブプロンプトがあります。KSamplerノードを見ると前半1.5で後半1.0なので，前半の2Step分にだけかけているようです。
LoRAは後半の7Steps分にだけかけています。前回使ったワークフローは前後半どちらにもかけていました。設定しているのは高速化LoRAのLightX2Vです。

画像を生成してみる

　この段階で画像を生成したところ，生成時間は1枚1分台前半～4分台後半でした。時々5分以上かかることもあります。生成時間にばらつきがあるところは同じですが，全体的には前回使ったワークフローよりも速いです。
タスクマネージャーを見るとGPUはメモリもほぼすべて使ってフルパワーで動いていますが，メモリは10GB程度で少し余裕がある感じです。
生成される画像はリアルで写真っぽいところは同じですが，前回のワークフローで生成した画像よりもコントラストが低めであっさりした印象です。

設定を変更して好みの画像に近づける

　上記のサンプル画像はダウンロードしたワークフローの設定を少し変更していたので，元の設定に戻して生成してみました。
上の画像：サンプラー：dpm++2m ，スケジューラー：beta，LoRA（Lightx2v）：0.5
下の画像：サンプラー：euler ，スケジューラー：beta，LoRA（Lightx2v）：1.0

LoRAの強度の違いで，あっさりした感じが改善されていい感じになったようです。ここから好みの画像の感じにするために調整をしました。

スケジューラーをチェックする

　サンプラーをeulerに固定してスケジューラーを色々変更してみました。細かい部分は変化しますが，betaとsgm_uniform，simpleは同じような仕上がりになり，kl_optimalとkarrasはうまく生成できませんでした。

kl_optimal

sgm_uniform

karras

simple

サンプラーをチェックする

　次にスケジューラーをbetaに固定してサンプラーを色々変更してみました。こちらも細かい部分は変化しますが，生成された画像はどれもいい感じです。euler_a，dpm++ 2m，uni_pc，dpm++ 2s_aを試しましたが，_aがついているモデルどうし，ついていないモデルどうしは似た感じになりました。表情や雰囲気を替えたいときはサンプラーを変えると良さそうです。

euler_a

dpm++ 2m

uni_pc

dpm++ 2s_a

CFGを変更する

　サンプラーとスケジューラーはデフォルトのeuler，betaを選び，1回目のksamplerノードのCFGをデフォルトの1.5から2.5，3.5，4.5と変化させてみました。4.5はアニメ調になってしまいました。ここは一番好みの感じだった2.5をデフォルトで使おうと思います。
Wan2.2で画像生成をしているとアニメ調の画像になることが結構ありました。私の推測ですが，アニメ調の画像が生成されるのを抑制するにはCFGを下げるといいのかもしれません。