Blog

Hunyuan Image 2.1を使ってみました

次々に新しいものが出てきますね

Xのポストで話題になっていました

 Wan2.2とQwen-Imageを使ってみて私も最新の画像生成AIを体験できたと思っていたら,XのポストではHunyuan Image 2.1というものが話題になっていました。また新しいものが出たのかと思い,試してみました。

まずは環境構築

 こちらのWebサイトの記事を参考にして,GGUFモデルを利用した環境構築をしました。丁寧に説明している記事通りにファイルをダウンロードして指定された場所に入れ,提供されているワークフローをDrag&Dropして不足しているノードをインストールして完了しました。
記事通りにしなかったのはインストールしたモデルを容量が小さいhunyuanimage2.1-q3_k_mに変更したことくらいです。Q4モデルは私の環境では厳しいと感じたのが理由です。

OOMエラーがでる

 生成ボタンを押してしばらくするとOOM(Out Of Memory)エラーが出て止まってしまいました。Hunyuan Imageはテキストエンコーダーを2つ使うので,その部分でメモリ不足になっているようでした。2つのうちの1つはQwen-Imageで使っていたQwen2.5-VL-7B-Instruct-UD-Q4_K_XLだったので,これを容量が小さいQwen2.5-VL-7B-Instruct-Q3_K_Mに変更したところエラーは出なくなりました。

画像生成できました

 ワークフローに設定されていた20stepsで私の環境では最初の1枚は3~4分,プロンプトを変更しなければ2枚目以降は2分台で画像が生成できました。高速化する方法がまだないので今のところという感じですがWan2.2とQwen-Imageの間くらいの生成時間です。
生成された画像の印象は目元の描画が微妙な感じがしますが全体的にはいい感じです。Web上の画像ではそのようなことはなさそうなので私の環境だけなのかもしれません。そのほかにも意図せずにアニメ顔になったり,プロンプトで胸元を強調するとかなりの確率で公開できない画像になってしまうなど,まだうまく扱えないです。プロンプトの書き方を変えると解決するのかもしれませんので,Web上の画像で勉強したいと思います。
Wan2.2やQwen-Imageと同じく自然言語のプロンプトをしっかり反映した画像で,同じ設定で複数枚生成しても大きく変わることはない印象です。
メモリは結構厳しい感じで,一度生成した後に別のプロンプトで続けて画像を生成するとほぼ確実にOOM(Out Of Memory)エラーが出ます。その都度メモリをクリアしないといけないので手間がかかります。

s1.jpg
s2.jpg
s3.jpg
s4.jpg

画像生成を高速化したい

 distilled版だと8steps生成ができるということで,モデルをインストールして試してみましたがエラーが出てうまくいきませんでした。モデルを変更する以外にも設定が必要なようです。ここはもう少し調べてから取り組もうと思います。

この記事へのコメント

コメントはまだありません。

コメントを送る

必須
 
※ メールアドレスは公開されません
任意
必須
Loading...  画像の文字を入力してください
9
10
11
12
13
14
15
16