Blog

Stable DiffusionとChatGPT

色々なところで紹介されている,話題の生成AIのコラボです

画像生成にはプロンプトが重要

 Stable DIffusionにはまって約1カ月,Web上の情報を頼りにさまざまな方法で画像生成をやってみました。なかなかこちらが意図した画像が生成されませんが,ときどきうまくいくことがあると嬉しいですね。

色々試してみて感じたのは,プロンプトに入力する言葉や順序が画像生成のポイントであるということでした。(当たり前かもしれませんが…)

プロンプト作成の情報を集める

 プロンプトに入力する言葉は英語なので,Webで英訳したり,プロンプト集を掲載しているWebサイトの記事を参考にしていました。書籍を調べたところ,KindleにStable Diffusion関連の電子書籍が結構あることを知り,Kindle Unlimited1カ月お試しで,電子書籍を読みあさったりしています。

プロンプト作成にChatGPTを利用するという内容は多くのWebサイトでも書かれていたので,私も試してみようと思いました。

ChatGPTにプロンプトを生成してもらう

 ChatGPTは少し前にアカウントを取得していたので,Kindleの電子書籍の内容を参考にして以下のような内容でChatGPTにプロンプトの生成を依頼しました。

(依頼内容) 【①画質(綺麗さや描画を入力】 最高品質,傑作,超高解像度,きめ細かい,写真風 【②人物、キャラ設定】 10代の可愛い日本人女性,学生 【③人物が向いている方向(カメラアングル)、見える部位、目線やポーズなどを入力】 膝から顔,こちらをみて歩いている 【④顔(表情)】 笑顔,楽しそう,わくわくした感じ 【⑤体型】 背が低い,目が綺麗 【⑥服装(上半身、下半身)頭に被る帽子や飾り物、首の装備品など】 ワンピース,ネックレス,バッグ 【⑦髪(長さや色)などを入力】 黒髪,ハーフアップ 【⑧時間軸(朝、昼、夕方、夜など)や明るさなど】 夏の夕方,晴れていて夕日がまぶしい 【⑨背景や風景などを詳細に入力】 海辺の公園

(生成されたプロンプト)

Highest quality, masterpiece, ultra-high resolution, intricate, photo-realistic; featuring a teenage, cute Japanese female student; facing the camera from knee to face, walking towards here; with a smiling, joyful, excited expression; short stature, captivating eyes; dressed in a dress, wearing a necklace and carrying a bag; black hair, half-up hairstyle; set during a summer evening, sunny with dazzling sunset; situated by a seaside park

ChatGPTが生成したプロンプトで画像生成

 下の画像は上記のプロンプトを使ってStable Diffusionで生成した画像です。想像していた以上にプロンプトの内容が反映されていたので驚きました。ChatGPT,侮れないですね。

wu1.jpg

髪型や服の色などのプロンプトを少し変更して,好みの感じにしたのが下の画像です。

wu3.jpg

試行錯誤するにはPC環境が貧弱

 まだ数枚試した程度ですが,ChatGPTが生成したプロンプトで画像を生成すると,日本語でリクエストした内容を反映した画像を作ってくれる印象でした。反映されないこともありますが,プロンプトの言葉や順序を変更することで対応できる部分もありました。

問題は試行錯誤して画像を生成するにはPC環境が貧弱なために時間がかかることです。画像生成するためにGPU性能が高いゲーミングPCを購入しようかなと考えたりしています。

この記事へのコメント

コメントはまだありません。

コメントを送る

必須
必須  
※ メールアドレスは公開されません
任意
必須
Loading...  画像の文字を入力してください
1
2
3
4
5
6
7
8