AI魔術師の記録

GPT(Generative Pre-trained Transformer)を中心にしたAIの最新動向や応用事例、その社会への影響などを紹介するブログです。

GPTとStable Diffusionでいろいろなコスプレ美女の画像を大量に作ってみた。

今回はgptとStable Diffusionを使って複数のプロンプトで様々な種類のコスプレ美女の画像を大量出力してみました。

手順としては、以下の➀~➂の手順で行いました。

➀gptを使って様々な種類のコスプレ美女を表現するプロンプトを作ってもらう。

実際に今回gptに入力したプロンプトは以下のもの

女性がするとかわいいコスプレをカンマ区切りでたくさん作ってください。

上記でさまざまな種類のコスプレを案として出してもらう。次に
②エクセルVBAを使って、stable diffusionに生成してもらうための実際のプロンプトを大量生成する。
stable diffusion web ui srcriptsでは、1行ごとがプロンプトになるので、その部分に配慮し、案を膨らめせるようにgptに指示を与えるのと、①のプロンプトは画質の調整等のプロンプトが抜けているのでそれらも合体させる。

上記プログラムで作成したプロンプトは以下のような感じ(全部で411個のプロンプトを作成しましたが、量が多いので、そのうちの一部を抜粋したものが下記)

(upper body:1.1),(Japanese, beautiful, woman, Sailor Moon cosplay, in a room    :1.3),(8k, RAW photo, best quality, masterpiece:1.2), ultra detailed, ultra high res, high detail RAW color photo, professional photograph, an extremely delicate and beautiful, Amazing, finely detail, extremely detailed beautiful girl, extremely detailed face, extremely detailed eyes, extremely detailed skin, extremely detailed fingers, extremely detailed nose, extremely detailed mouth, perfect anatomy,Photo of Japanese
(upper body:1.1),(Japanese, beautiful, woman, in, a, room, dressed, as, Hello Kitty.    :1.3),(8k, RAW photo, best quality, masterpiece:1.3), ultra detailed, ultra high res, high detail RAW color photo, professional photograph, an extremely delicate and beautiful, Amazing, finely detail, extremely detailed beautiful girl, extremely detailed face, extremely detailed eyes, extremely detailed skin, extremely detailed fingers, extremely detailed nose, extremely detailed mouth, perfect anatomy,Photo of Japanese
・・・・・
・・・・・
(upper body:1.1),(A Japanese beauty, dressed in a NeoN cosplay, is sitting in a room.    :1.3),(8k, RAW photo, best quality, masterpiece:1.412), ultra detailed, ultra high res, high detail RAW color photo, professional photograph, an extremely delicate and beautiful, Amazing, finely detail, extremely detailed beautiful girl, extremely detailed face, extremely detailed eyes, extremely detailed skin, extremely detailed fingers, extremely detailed nose, extremely detailed mouth, perfect anatomy,Photo of Japanese


実際のものは、下記の場所にアップしますので、興味ある方はダウンロードください。
(411個のコスプレ美女を生成するプロンプトです。)
drive.google.com



➂stable diffusion web uiのscriptsを使って、上記のプロンプトを入力する。

以上の➀~➂の手順でさまざまな種類のコスプレ美女を無事411人作成することができました。
指がおかしかったり、不自然なものも画像として生成されましたが、実際の業務などで応用するには、バッチサイズを大きくして、人間が校正して取捨選択をするのがよさそう。
指がおかしかったりしたときには、以下のようなAIサイトを使って不自然な部分を除去します。

remove-ac.com


上記のような作業ができるので、たとえば、単語帳を作成するさいに、それぞれの単語のイメージ画像のようなものを自動で生成することができますね。
普通単語帳では大量の単語数があるので、それらを一つ一つイラスト化するのはかなりの手間だが、この技術があれば、大幅なコストカットと質の向上が狙えますね。

上記の技術は、職業別のイメージ作成、擬人化のようなものにも使える。たとえば、元素の擬人化などにも使えますね。

利用用途はかなりありそう。

実際に生成された画像のいくつかを紹介します。

マリオのピーチ姫のコスプレ


ミニーマウスのコスプレ


ワンダーウーマンのコスプレ

スーパーウーマンのコスプレ


バットマンガールのコスプレ

ストリートファイターチュンリーのコスプレ

ピカチューのコスプレ

キャットウーマンのコスプレ

ハーマイオニー・グレンジャー(ハリーポッター)のコスプレ

チョコボのコスプレ

セーラームーンのコスプレ

鎧のコスプレ

プリンセス・フィオナ(シュレック)のコスプレ


なかなか面白いですね。このレベルの画像を個人でかなりの低コストで作成できるのは驚異的ですね。実際にかかっている費用はgptの月額費用2800円,google colaboの月額費用1000円、google drive月額300円とgpt tutb3.5のapi料金(量によるが今回レベルなら千画像でも100円もいかないレベル。)ですね。もしaiを使わずに人間だけでこの作業を行ったら、何百万、何千万もかかるようなレベルのものでしょう。大量のの美女に様々なコスプレさせてそれを撮影するわけですからね。場所代、コスプレ代、撮影代、人件費、などなど考えただけでも恐ろしい費用がかかりますね。

今回の411枚の画像生成の場合、校正をいれなければ、実際の作業時間は2時間たらず、画像生成(自動)は半日足らずです。
人間がする作業のほとんどは校正に注がれることになりますね。

gptとstable diffusionなどの様々なAIツールを連携させることで、このような面白いことがたくさんできそうです。
いずれ美女に擬人化してみたシリーズでも何か制作して販売しようかなと思っています。