Googleは8月26日(現地時間)、対話型AIアプリ「Gemini」の画像編集機能に、Google DeepMindが開発した新モデルを導入した。このアップデートにより、写真に写る人物やペットの見た目の一貫性を保ったまま、より自由で精度の高い画像編集が可能になる。


GoogleはGeminiアプリのアップデートの発表で、新モデルについて「早期プレビューの段階から、人々が”go bananas(熱狂)”した、世界で最も高く評価されている画像編集モデル」と説明している。数週間前からLMArena(AIモデル評価のためのクラウドソース型プラットフォーム)において、「nano-banana」というモデルの”テキスト-画像”生成能力が話題になっていた。Geminiアプリのアップデートの発表とともに、nano-bananaは「gemini-2.5-flash-image-preview」に改められており、Geminiアプリに導入されたのはこのモデルであるとみられる。

写真の編集や加工にAIが用いられる場面が増えているが、新モデルで重視されている「一貫性の維持」は、AI画像ツールにおける大きな課題のひとつである。従来のAI画像編集では、「髪型を変える」「背景を差し替える」といった操作を行うと、顔立ちや雰囲気が微妙に変化し、同じ人物に見えなくなることが多かった。それが自分自身や身近な人物、ペットの画像の場合、わずかな差異でも違和感を覚えやすい。

この課題を解決するために、新モデルは同一性を高度に制御し、編集を重ねても被写体の一貫性が損なわれないよう設計されている。たとえば、60年代風の髪型にしたり、チワワにチュチュを着せたりといった大胆な変更を行っても、元の写真の「らしさ」は保たれるという。

使い方は簡単である。Geminiに写真を渡し、編集ポイントを伝えるだけだ。以下のような高度な編集や加工も自然言語による指示で簡単に行える。

衣装や場所の変更: 人物やペットの写真をアップロードし、服装や職業、異なる時代背景などに置き換えることができる(例:「90年代のシットコム風」「10年後の姿」など)。


写真の合成: 複数の写真を組み合わせ、新しいシーンを生成できる。例えば、自分と愛犬の写真を融合させ、一緒に写っているポートレートを作ることが可能である。

対話による編集の積み重ね: 段階的な編集が可能。例えば、何もない部屋の画像に対し、「壁を青く塗って」「次に本棚を追加して」といった指示を重ねることで、イメージ通りの空間をつくり上げることができる。

デザインの適用: ある画像のスタイル(色や質感)を別の画像のオブジェクトに転用できる。例えば、蝶の羽の模様をドレスのデザインに取り入れたり、花びらの質感を長ぐつに適用したりすることが可能である。

Geminiアプリで作成または編集されたすべての画像には、目に見える透かしと、目に見えないSynthIDデジタル透かしが含まれる。
編集部おすすめ