この記事のアイキャッチ画像は以前SD1.5で生成したものをWan2.2でi2iしたものです
Text to Imageにチャレンジするも失敗
EasyWan22をインストールしてWan2.2環境で動画が生成できるようになりました。生成速度も個人的には許容範囲でしたので,今後は動画生成もすこしずつやっていきたいです。
Web上の情報をみていると,Wanは動画生成AIなのですが,高品質の画像が生成できるようで,あちこちで話題になっています。そこで次に私がやってみようと考えたのが画像の生成です。
最初はこちらの記事を参考にして,配布されているワークフローを利用してText to Imageに挑戦しました。私の環境ではGGUFモデルがインストールされているので,モデル読み込みのノードを変更して生成してみました。かすかにそれらしいものは見えるのですが,何度やってもうまくいきませんでした。Civitaiで配布されているText to Image用のワークフローもいくつか試してみましたが,同じような感じで画像を生成することはできませんでした。
このときはまだ生成できない理由がわかっていませんでした
気を取り直してImage to Imageにチャレンジ
Text to Imageについては対応を考えることにして,こちらの記事を参考にしてImage to Imageに挑戦しました。こちらもワークフローが配布されていたのでダウンロードして,自分の環境用に書き換えて生成したところ,無事に画像が出力されました。
アップスケールなしで元画像と同じ大きさで生成した場合,1回目は3分程度かかりますが,2回目以降は50秒前後になりました。元画像はPony系モデルで生成した画像ですが,雰囲気も変わって個人的にはよいと感じました。以前つくったPony系モデルで生成した画像をFLUX.1でImage to ImageしてFLUX.1風にするのと似ていると思いました。
サンプラーとスケジューラーを元画像と同じにすると元画像に近くなるようです。以下のサンプル画像は左(上)がPony系モデルで生成した元画像,右(下)がWan2.2でImage to Imageした画像です。
Text to Imageできない原因がわかりました
詳しくは別記事で書きますが,無事にText to Imageで画像が生成できました。最初にうまく生成できなかった画像もきれいに生成されました。
うまくいったのはいいですが,NEXTGEARのSSD容量が100GB近く減ってしまいました。どうしよう…



















Comment on this article
コメントはまだありません。
Send comments