目次
Fireflyについて
Fireflyについて簡単に確認しておこう。Fireflyはアドビが開発したAIベースのクリエイティブツールである。ユーザーの声を反映しながら日々開発が進められており、現在はベータ版が公開されている。現段階では商用利用をすることはできないが、ユーザーが自身の創造性を最大限に引き出すための支援ツールとして開発が進んでいる。生成したい画像を表現した文字列を「プロンプト」として使うことで、高品質なコンテンツを生成してくれる。今回のアップデートでは、Fireflyが100以上の言語でのテキストプロンプト入力サポートを開始した。日本語をはじめとする多言語でのプロンプト入力が可能となったため、これまで以上に多くのユーザーが、母語を使ってFireflyを利用できる。これまで日本語から英語へ翻訳したプロンプトを用意する必要があったが、日本語をそのまま使用して、求めている画像を生成可能になる。ただし、開発段階の機能なのでフィードバックをもとに今後も改良が重ねられる予定である。
日本語プロンプトでの生成
試してみた結論としては、日本語でのプロンプト入力はかなり精度が高いと言えそうだ。実際に日本語と英語で生成した違いを比べてみよう。左側が「古城に住むアオサギ」、右側が「A blue heron living in an old castle」というプロンプトで生成した画像だ。どちらも命令に忠実な画像が生成されていると言えるだろう。









複雑な画像を生成するにはプロンプトエンジニアリングと呼ばれる知識が求められるため、言語をうまく使い分けるというよりも、生成AIへの指示をうまく出すためのプロンプトを組み立てる技術が重要になりそうだ。それなので、英語への抵抗感があるが生成AI、特にFireflyを使ってみたいという場合は、無理に英語を使わずに日本語を中心に生成を行っていくのが良いだろう。現時点では日本語プロンプトへの対応はほとんど問題がないと思われる。
Fireflyの特徴は日本語でも反映されるか
Fireflyの特徴はやはり「著作者許諾済みデータのみ学習している」とされるデータセットにあると言える。日本語で使用した場合も英語版と同様に問題ない画像を生成することができるのか、よく知られるキャラクターなどのキーワードで生成してみよう。まずは「ピカチュウ」と入力して、生成してみた。







「1本のバナナ問題」をFireflyはクリアしているのか
生成AIの問題の一つとして、「1本のバナナ問題」という議論がある。DIGITAL SCIENCEに掲載された生成AIが数の概念を持たないかもしれないという問題のことで、例えばAIに「1本のバナナ」を生成させると、2本以上のバナナが生成される場合がある。何故かというとAIが学習するためのデータセットにおいて、「バナナ」とラベル付けされている画像は多く含まれているものの、バナナの本数までは紐付いて学習していないためだと考えられる。つまりAIはバナナの形状を学習できても、バナナの本数を学習することはできないということになる。AIが物理的な世界の感覚を持たず、物体を認識する方法が人間とは異なることを示していると議論されている。
実際にFireflyで「1本のバナナ」とプロンプトを入力してみよう。「1本のバナナ」という簡素なプロンプトだがきちんとバナナが1本だけ生成された。




まとめ
日本語でのプロンプト入力はかなり精度が高く、日本語と英語での出力結果はほぼ同等であることが確認された。ただし言語に関係なく、複雑な単語の組み合わせでは、求める画像をうまく生成できない場合もある。言語の違いというよりもプロンプトエンジニアリングに関する知識を身に付けて、課題を克服していく必要がありそうだ。Fireflyの特徴とされている著作権を持つキャラクターの生成もしっかりと避けられていることから、今後もFireflyは企業による活用が期待できそうな生成AIと言うことができそうだ。現時点では商用利用は不可とされているが、クリエイターが実務で活用できる日を楽しみに待ちたい。
Adobe Firefly:https://www.adobe.com/jp/sensei/generative-ai/firefly.html
アドビ株式会社
URL:https://www.adobe.com/jp/
2023/07/20
