e-bike日々徒然

お絵描きAIにe-bikeの画像を生成させてみた

e-bikeの記事ですが、いきなりe-bikeから逸れた話から。話題の生成系AIの件。

流暢な会話をしたり、美しいイラストや写真を生成したりする人工知能の話題が尽きない昨今。2022~2023年にかけてのこれら生成系AIの発展は凄まじく、これまでAIに興味を示さなかった多くの人が強い興味を抱き、使い始めてもいます。

かく言う筆者が現在頻繁に使っているのが「Midjourney(ミッドジャーニー)」。米国のファインアートコンテストで1位を取ったり、トランプ元大統領のディープフェイク画像を生成したりして(最近はとくに)注目されている「お絵描きAI」です。1位とかディープフェイクは「Midjourneyを悪用した人の問題」ですが、それほど「実用性の高い生成系AI」が使われ始めたということですね。

Midjourneyを使うとどんな画像が作れるのか? まずは例を見てみましょう。なお、以下の画像はすべて、5世代あるMidjourneyのうち最新のV5で生成しています。

Midjourneyに猫の画像を生成させてみました。生成させたい画像の内容を言葉で指示すると、1分かからずこんな猫画像が。画像の内容を示す言葉をプロンプトといいますが、この画像のプロンプトは「adorable cat(愛らしい猫)」です
怒っている猫も。プロンプトは「The cat is threatening us. It is baring its fangs. No background. Background is white.(猫が威嚇している。牙をむいている。背景はない。背景は白)」
複合技も。プロンプトは「Cat and Siberian husky get along.(猫とシベリアンハスキーは仲良し)」。左下は猫が大きすぎるかも?

ここまでリアルで精細な画像を生成できるようになったのは、MidjourneyがV5になってからだと思います。それ以前でもプロンプトを工夫すると十分リアルな画像が出力されましたが、V5になったら簡単なプロンプトでも出せるようになりました。

人間もリアルに生成するようになりました。以前は日本人の顔を生成させようとすると、中国~モンゴル系の雰囲気になったり、明治時代以前の日本という雰囲気だったりしました。でも現在は解消されています。

プロンプト「Japanese woman(日本人女性)」で生成された画像
プロンプトを「Japanese women in the 2000's(2000年代の日本女性)」にしたらこんな画像が

ちなみに、4枚セットなどになっているのはMidjourneyの仕様が関係しています。Midjourneyでは、プロンプトを与えるとまず4枚組のラフ画像を生成し、ユーザーはその4枚のうち1枚を高解像度化(アップスケール)して使ったり、4枚のうちの1枚から新たなラフ画像を生成させたりして「よりイメージに近い画像に近づけていく」というわけです。

Midjourneyを使っている様子。MidjourneyはDiscordという「Midjourneyとは別のチャットサービス」を経由して使います。そこでMidjourney Botにプロンプトなどのコマンドを話しかけることで、Midjourneyを使っていけます。これはプロンプト「Bouquet of bright red roses(真っ赤なバラの花束)」を与え、4枚のラフ画像を生成させた様子
ラフの左下が気に入ったので、それを高解像度化した様子。生成させた画像は自由にダウンロードなどできます

で、ここからがe-bikeの話。

このMidjourneyに、以前何度か自転車の画像を生成させてみました。ですが、微妙に自転車じゃないような形状が混ざったりしてイマイチ。プロンプトをいろいろ工夫しても、いまひとつの結果となっていました。

しかしMidjourneyが最新版のV5になってから、簡単なプロンプトで自転車の絵が! 例えばロードバイクだと……。

プロンプトを「road bike」とだけして生成させた結果、あらリアル!
こんなロードバイクも。ペダルがないのは……自転車カタログサイトで学習してきた?

リアルなロードバイクが描かれました。だったら、電動アシストのロードバイクもイケるのでは? と思って試してみました。

プロンプト「Electric-assisted road bike」で生成させた画像。クロスバイクではありますが、悪くないデキです
非常にイイ感じです! ダウンチューブにバッテリー内蔵で、その上にエクステンドバッテリー装着?

Midjourney V5さん、自転車にも詳しくいらっしゃる。じゃあ、もしかして、「e-MTB」とかでもイケる? 試してみると……。

プロンプトは「e-mtb」。おおカッコいい! ……でもソレって普通のMTB?
こっちもカッコイイ! けど、e-bikeなのか? ダウンチューブにバッテリー?

もしかすると「MTB」という単語に引っ張られて、Midjourneyが「典型的なMTBの写真」として出してきたのかもしれません。ではもう少々詳しく、プロンプトを「Electric-assisted MTB(電動アシストMTB)」としてみました。

おっイイ感じ! バッテリー外付けだけどイイ感じ!
こっちはさらにイイ! バッテリー外付けだけど、さらにイイ!

というわけで、最近のMidjourneyは自転車の絵も得意になったという話でした。でも、もう、こうなってくると、AI生成の妄想e-bikeとかの写真を掲載するときは、写真の上に「by AI」などの表示が必要になるのかもしれません。

ちなみに、Midjourney、以前は無料トライアルでも使えましたが、現在は無料トライアルは休止中。現在は月額US10$からの有料プランのみ利用可能です。また、Midjourneyが生成した画像は、有料プランのStandard以上を使っている場合は商用利用可能。本記事に掲載した画像はMidjourneyのStandard Planで生成しています。

スタパ齋藤