Wan2.2環境で画像を生成したい パート2です
Text to Imageで画像が生成できなかった理由
前回うまく画像が生成できなかったText to Imageについて,Web上の情報を色々調べていましたが,解決方法が見つかりませんでした。
EasyWan22と一緒にインストールされたモデルは高速化LoRAであるLightX2Vを組み込んだものだったので,そうでないモデルならうまくいくかと思ってモデルを検索しているときにあることに気づいたのです。
それはText to VideoとImage to Videoでモデルが異なるということでした。上記モデルはImage to Videoモデルなので,Text to ImageするならText to Videoモデルを使わないといけないという基本的なことを見落としていたのです。
Text to Imageできました
早速Text to Videoモデルと高速化LoRaのLightX2Vをダウンロードして確かめたところ,無事に画像を生成することができました。私が使っているNEXTGEARはGPUがRTX 4060ti 8GBと低スペックマシンなので,容量7GBのwan2.2_t2v_high(low)_noise_14B_Q3_K_Mを選びました。
Text to Image用のワークフローを4つダウンロードしていたので,動作チェックも兼ねてテストをしてみました。私の環境にないカスタムノードは削除するか,他のもので代替していますし,プロンプトやシード値などの設定もすべて異なるので,参考程度にご覧ください。
ワークフロー(1)
こちらの記事中で配布されている8stepsのワークフローです。作者様が作成されたカスタムノードでHigh,Lowモデルに同一LoRAを設定することが簡単にできるようになっています。生成時間も2回目以降は速くなり,今回のテストでは最速2分でした。
ワークフロー(2)
Civitaiで検索し,こちらで配布されている10stepsのワークフローです。Lowモデルのみを使い,2回に分けて画像を生成している点が他のワークフローと異なるところです。生成時間も2回目以降は速くなり,今回のテストでは最速で1分台後半でした。
ワークフロー(3)
Civitaiで検索し,こちらで配布されている8stepsのワークフローです。生成した画像をフィルム写真っぽくしたり,ノイズを加える効果のノードがあります。最初気づかずに画像生成して変な感じだなと思っていました。このワークフローは2回目以降も生成時間が変わらず,今回のテストでは最速で3分台でした。
ワークフロー(4)
Civitaiで検索し,こちらで配布されている10stepsのワークフローです。このワークフローは最速で2分台でしたが,特に1回目の生成が遅かったです。フリーズした?と思うくらいでした。
気になるWan2.2の画像は
今回のサンプル画像のプロンプトは以前私が生成した画像で使っていたものですが,可愛い女の子がたくさんでてきて驚きました。いつも使っているPony系モデルと比べるとリアルな写真っぽい感じで好印象です。FLUX.1と比べると柔らかい印象になるのもいいです。FLUX.1の画像が硬い感じなのでSD3.5環境を構築して使ってみようかなと考えていたのですが,Wan2.2の画像がとてもよかったのでこちらをしっかり使おうと思います。ワークフローは2回目以降に生成時間が短くなる(1)と(2)をしばらく使い込んで研究する予定です。
テスト中にタスクマネージャーを見たところ,メモリを上限まで使い,SSDががっつり動いていました。おそらくメモリ不足でSSDにスワップしていると思われるので,現在16GBのメモリを増設してSSDをいたわってあげないといけないと感じています。現在使用しているメモリもそのまま使いたいので,16GBを2枚増設して合計48GBにしたら今よりも画像・動画の生成が速くなるかなぁ…

















この記事へのコメント
コメントはまだありません。
コメントを送る