OpenAIは12月16日(現地時間)、画像生成AIの最新フラッグシップモデル「GPT Image 1.5」を発表し、ChatGPTの画像生成機能「ChatGPT Images」を刷新した。新モデルは、プロンプト指示への追従性を高めるとともに、画像編集時の一貫性を改善し、生成速度を最大4倍に高速化した。
同日よりBusinessおよびEnterpriseを除くChatGPTプラン、およびAPI経由で利用可能となる。

OpenAIは、新しいChatGPT Imagesを「ポケットの中のクリエイティブスタジオとして機能する」と説明している。GPT Image 1.5アップデートを通じて、従来の「画像生成を体験して楽しむ機能」から「より実用的で高精度なビジュアル制作」への移行を図る。

GPT Image 1.5の最大の特徴は、ユーザーの指示や意図を正確に反映する能力の向上である。特に、既存画像を編集する際の性能が大きく改善された。従来の画像生成AIでは、「表情を変えて」「照明を暗くして」といった部分的な変更を依頼しても、画像全体を作り直してしまい、構図や人物の顔立ちまで変わってしまうケースが少なくなかった。

GPT Image 1.5では、ライティング、構図、人物の外見といった重要な要素を保ちながら、要求された細かな変更を反映しやすくなっている。これにより、画像の追加、削除、結合、ブレンド、配置など写真の実用的な編集に加え、服装や髪型の試着シミュレーション、スタイルフィルターの適用などでも、ユーザーの意図に沿った結果が得られやすくなったという。

テキストのレンダリング能力も強化され、新聞記事のような密度の高い文章や小さな文字を含む画像でも、より判読しやすく生成できるようになった。また、画像生成が最大4倍高速化されたことで、複数のバリエーションを素早く試したり、生成処理の待ち時間中に次の指示を送れるなど、効率的に作業を進められる。

ChatGPT Imagesのアップデートでは、新たに専用の「画像」タブがサイドバーに設けられた。プリセットのスタイル(フィルター)やトレンドのプロンプトが表示され、プロンプト作成に慣れていないユーザーでも画像生成を容易に試せる導線となっている。


なお、今年初めにリリースされたChatGPT Imagesのバージョンについても、カスタムGPTとして引き続き利用可能である。

API経由では「GPT-image-1.5」として提供されており、画像による入力・出力コストがGPT Image 1比で20%安価になった。
編集部おすすめ