Apple、GitHubにてAI画像編集のための大規模データ...の画像はこちら >>

Pico-Banana-400K

Appleが、GitHubにて、テキストガイド型画像編集の研究を推進するために設計された、約40万件のテキスト-画像-編集トリプレットからなる大規模データセット「Pico-Banana-400K」を公開しています。

Googleの世界最大の画像データセットOpen Imagesから取得したSFT用シングルターンテキスト-画像-編集トリプレット約257,000件、選好学習用シングルターンテキスト-画像(肯定的)-画像(否定的)-編集約56,000件、マルチターン応用向けマルチターンテキスト-画像-編集約72,000件を学習させています。



画像解像度は512–1024 Pixel、プロンプト生成はGemini-2.5-Flash、編集モデルはNano-Bananaとなります。

編集部おすすめ