Blog

WebUI ForgeでFLUX.1を使ってみた

謎のボタンの正体が(少し)わかりました

FLUX.1は新しい画像生成AI

 私はまったく知らなかったのですが,Stable Diffusion関連の話題を調べていたら出てきました。こちらこちらのサイトを見ると,以前Stable Diffusionの開発をしていた方々が新たに作った画像生成AIのようです。
Stable Diffusion3 Mediumが今一つだったこともあってか結構注目されているようで,ウェブ上には多くの記事がありました。こちらのサイトを見ると,何とWebUI ForgeがFLUX.1に対応しているということで,早速使ってみることにしました。

必要なファイルの容量が大きい

 上記のサイトの記事を見ながらとりあえず必要なファイルをダウンロードすることにしましたが,モデルの容量が12GBとかなり大きいことに驚きました。全部で30GB近くダウンロードして,説明通りの場所においてWebUI Forgeを起動しました。

謎のボタンの正体

 以前の記事で,WebUI Forgeをアップデートしたら謎のボタンが表示されるようになったとお伝えしましたが,FLUX.1を使うときに利用するみたいで,fluxを選んで設定をするようです。ちなみにSDXLを使うときにはxlを選ぶようです。(知らなかった…)
上記のサイトの記事通りに設定をして画像を生成してみましたが,うまくいきません。プロンプトを少なくしたりしましたが効果ありませんでした。再度記事の画像を見直してサンプラーをEuler,スケジューラーをSimpleにしたところ,画像が生成されました。

プロンプトは文章で書く

 私が試した感じでは,プロンプトは単語よりも文章で書いた方がよい印象でした。フォトリアルな画像を生成したかったのですが,アニメ系の画像になることが多かったです。こちらのサイトを見ると,プロンプトにjapaneseが入っているとアニメ寄りになると書いてあったので,japaneseを外すといいのかもしれません。試しに外して画像生成してみましたが,その時のプロンプトではフォトリアルには変化しませんでした。
何枚も生成すると,フォトリアルな画像が生成されることもありましたが,好みの画像にはなかなかならない印象です。アニメ系の画像の方が好みに近い結果になりました。

生成時間やGPUの動作状況は…

 生成時間は1024×1536ピクセルで1枚約2分台前半の時間でした。GPUは7GB程度のメモリを使用して動いていますが,共有GPUメモリは使っていませんでした。時間はかかりますが,安定して動いている印象です。
(追記:共有GPUメモリは使用していなかったのですが,メモリはかなり使っていました。)
もしかしたら生成が速くなるかもと考えて謎のボタンの設定の中にあるSwap MethodをQuenceからAsyncにしたところメモリ不足で画像生成はできませんでした。また,Swap LocationをCPUからSharedにするとCUDA errorが起こってこれまた画像生成はできませんでした。

FLUX.1を使ってみて

 Stable Diffusiuon3 Mediumよりは良好な印象でしたが,今のところはSDXLの方が使いやすいかなと感じました。FLUX.1用のモデルやLoRAも色々出ているようなので,色々調べながら試していきたいです。

この記事へのコメント

コメントはまだありません。

コメントを送る

必須
必須  
※ メールアドレスは公開されません
任意
必須
Loading...  画像の文字を入力してください
1
2
3
4
5
6
7
8