Blog

Qwen-Image関連記事を調べる

画像生成AIとしての実力は高いと思うけど…

今ひとつなのは私だけ?

 話題の画像生成AI,Qwen-Imageを使ってみましたが,私の環境で画像を生成したときの印象は今ひとつな感じでした。そこで,Web上の情報を色々集めてみようと考えました。
こちらのYoutubeの動画内で登場した生成画像も同じ系統の顔でした。環境は違っても同じ系統の顔が生成されやすいのではないかと感じました。
こちらのWebサイトでは,私と同じようにGGUF版のモデルとテキストエンコーダを使っていました。記事内の画像を見たところ,私の環境で生成した女の子の顔と同じ感じです。さらに記事内のプロンプトで画像を生成したところ,構図は異なりますが生成される顔は同じでした。複数人を生成したときも同じ顔になってしまうのはどうかと感じるところです。
こちらのWebサイトではメカニカルガールのプロンプトが公開されていたので試したところ,記事内の画像と似た感じになりました。

ComfyUI_00032_.jpg
ComfyUI_00027_.jpg

こちらのWebサイトは女の子ではなく,建築画像を生成されています。記事内のプロンプトで画像を生成したところ,縦長設定でしたが雰囲気は同じ感じになりました。

ComfyUI_00028_.jpg
ComfyUI_00029_ (2).jpg

こちらのWebサイトではQwen-Imageで注目されている文字入り画像のプロンプトが紹介されていたので試してみました。英語ですが指示した文章を表示できているのはすごいと感じました。

ComfyUI_00029_.jpg
ComfyUI_00031_.jpg

こちらのWebサイトの画像は私の環境で生成した画像とは顔が異なる感じでしたが,なんと顔だけFLUX.1に入れ替えているとのことでした。顔が微妙と感じている人がいたのでほっとしています。

私だけではなさそう

 Qwen-Imageのレビュー記事をたくさん調べて,公開されているプロンプトで画像を生成して確認した感想としては,微妙な感じになっているのは私だけではなさそうということです。しかし,プロンプトを忠実に理解して同じ雰囲気の画像を生成するところや,いままで画像生成AIではできなかった文字が入った画像を生成できるところはすごいと感じました。4Steps生成LoRAを使って,1分台で画像生成できるのもありがたいです。
Qwen-Imageの利点を生かして使っていくには顔の生成を何とかしたいところです。更にWeb上の情報を集めて対応していこうと思います。

この記事へのコメント

コメントはまだありません。

コメントを送る

必須
必須  
※ メールアドレスは公開されません
任意
必須
Loading...  画像の文字を入力してください
9
10
11
12
13
14
15
16