ここにきてZ-Image-Turbo関連の情報が増えてきました
t2iワークフローにLLM連携機能を追加する
基本のワークフローにLLM連携機能を追加しました。まず,日本語のプロンプトを英文にする機能を追加しようとしたのですが,いつも使っているOllamaノードでLLMの切替ができなくなってしまいました。原因はよくわからないのですが使えないわけではなく,現在はLLMが固定の状態で使っています。英文でプロンプトを作成するのは苦手なのであると便利な機能です。
次に画像から英語のプロンプトを生成する機能を追加しました。以前使っていたjanus proが使えたのでこれを利用しています。
どちらの機能も最初の1枚はLLMの処理時間が入るので時間がかかりますが,2枚目からは1枚20秒台で生成できます。

完成したt2iワークフローです。左側のブロックがLLM連携エリアです
i2iのワークフローをつくる
次に基本のワークフローにi2iの機能を追加しました。これも以前FLUX.1を使っていたときに作成したワークフローからノードを移植しました。元画像との比較が便利なImage Comparer(rgthree)ノードがなぜか使えなかったので,普通の画像保存ノードに変更しました。生成時間は30秒台前半でした。
Denoise設定で生成される画像を元画像寄りにするか,プロンプト(Z-Image-Turbo)寄りにするかを調整することができます。0.3だと元画像寄りな感じですが,0.4より大きくするとプロンプト寄りになる印象です。他のモデルで生成した画像をZ-Image-Turboテイストにできるので,色々使ってみたいです。

完成したi2iワークフローです。基本のワークフローに画像を読み込むノードを加えただけのシンプルなものです
スケジューラーにddim uniformを設定すると…
こちらのWebサイトで紹介されていたのですが,スケジューラーをddim uniformにして,バッチサイズを4などにすると,複数画像を高速に生成することができます。同一シード値でもバリエーションをつけてくれるのでたくさん生成したいときは便利な機能です。
上記サイトの記事はZ-Image-Turboについて,プロンプトの作成や得意・苦手な領域について書かれれていて参考になりました。

__midium.jpg)














この記事へのコメント
コメントはまだありません。
コメントを送る