どんどん新しいものが出てついていけない
Xで話題になっていた新しい画像生成AI
最近は画像も動画も新しい生成AIがどんどんでてくるのでついていけない感じです。今回は新しいものが色々ある中でZ-Image-Turboという画像生成AIを使ってみることにしました。
選んだ理由は画像の生成が速いということで,私の環境でも使えるかなと感じたからです。
断片的な情報をもとに環境構築
Web上の情報を検索しながら必要なファイルをダウンロードして配置しました。
モデルはいつも通りですがGGUFモデルを使うことにし,以下のリンク先からz_image_turbo-Q4_K_M.ggufをダウンロードしました。ComfyUI/models/diffusion_modelsフォルダに入れます。
jayn7/Z-Image-Turbo-GGUF at main
テキストエンコーダーは最初GGUF版をダウンロードしたのですがうまく動かなかったので,以下のリンク先からダウンロードしました。ComfyUI/models/text_encodersフォルダに入れます。
split_files/text_encoders/qwen_3_4b.safetensors · Comfy-Org/z_image_turbo at main
VAEはFLUX.1で使っていたae.safetensorsを使うようなので特にダウンロードはしていません。(ダウンロードは以下のリンク先からどうぞ)ComfyUI/models/vaeフォルダに入れます。
split_files/vae/ae.safetensors · Comfy-Org/z_image_turbo at main
ワークフローは以下のリンク先で配布されているものをダウンロードしました。
Z image turbo (Low vram workflow) GGUF
そのままではうまく動作しなかったので,環境構築ではいつも参考にしているまゆひらaさんがXにポストされている画像を参考にしてワークフローを作りかえたところ,動くようになりました。
気になる画像と生成速度は…
画像の生成速度は1枚目が50秒台で,プロンプトを変更しなければ2枚目以降は20秒台前半でした。この速度で画像が生成できるならいろいろ検証ができてよさそうです。
生成される画像はリアル系でプロンプトをしっかり理解している印象です。いきなりアニメ調になることもなくいい感じの画像を生成してくれます。プロンプトが良くないためだと思いますが,意図せずにNSFWな画像になることもありました。
テストして感じたことはプロンプトを変更しないと2枚目以降の画像は微妙に変わる程度の変化で,大幅に変わることが少ないことです。この点は引き続き検証したいと考えています。
最近の画像生成AIの中では一番使いやすい
Wan2.2はとにかく生成に時間がかかる,Qwen-Imageは生成時間は速いけど人物の顔がすべて同じになる,Hunyuan Imageはメモリが厳しく,画像がアニメ調になることが多いなど,私の環境ではなかなかうまく動かせていませんでした。今回使ってみたZ-Image-Turboは生成時間が速く,画像がリアル系で安定しているのでとても使いやすいです。
ワークフローを整理して高速化やi2iもできるようにしたいです。
今後の展開にも期待
現在はZ-Image-Turboのみですが,今後基盤モデルのZ-Image-Baseや画像編集できるZ-Image-Editもリリースされるそうなので,楽しみな画像生成AIです。















この記事へのコメント
コメントはまだありません。
コメントを送る