Amazon Novaで画像生成を試してみた

technologies

ベンジャミンのクワバラです。

re:Invent2024でAmazon Bedrockの新しいモデル「Amazon Nova」がリリースされました。

Amazon Nova は、最先端のインテリジェンスと業界をリードする価格性能を実現する、Amazon Bedrock で利用できる新世代の最先端の基盤モデルです。Amazon Nova モデルには、3 つの理解モデルと 2 つのクリエイティブ コンテンツ生成モデルが含まれています。(Chrome翻訳)
https://docs.aws.amazon.com/nova/latest/userguide/what-is-nova.html

クリエイティブ コンテンツ生成モデルの1つである「Amazon Nova Canvas」を利用して早速画像生成を試してみました。比較するために既存の画像生成モデルの「Amazon Titan」と「SDXL 1.0」も同時に試しました。

SDXL 1.0

会社の新しいロゴを作ってほしいと要望しましたが、漫画のようなキャラクターが出来てしまいました。今回の要望にはマッチしないモデルに思えます。

Titan Image Generator G1(v1)

オシャレな看板の画像が生成されました。質問を工夫すればロゴになりそうな印象です。

Titan Image Generator G1(v2)

Titanのバージョンを変えてみましたが、あまり変化がないように見受けられます。

Amazon Nova Canvas

Titanの結果と比べるとすぐに使えそうなロゴ画像も生成されました。Amazon Novaの自然言語理解の高さからこのような結果になったと考えられます。更に使えるロゴにするため「Conditioning image」に会社ロゴ画像をインプットして再度生成してもらいました。

使えそうなロゴには近づいてきましたが、生成される画像はインプットされた画像を強めに参照するようで、オリジナリティが失われてしまった印象です。(色を変えただけ)

まとめ

Amazon Nova Canvasで画像生成をサクッと試してみました。他のモデルと比べると自然言語理解の高さ(複数モデル試しての結果)と低価格(公式ドキュメントより)という優位性があるようです。今後、画像生成をする機会があれば試してみようと思います。

Related posts