Gemini 1.5 Flashは、Geminiの高性能モデル「Gemini 1.5 Pro」を用いて蒸留(Distillation)技術で開発された。Googleが5月にGoogle I/O 2024で発表し、パブリックレビューを開始した。蒸留とは、既存モデル(Gemini 1.5 Flashの場合はGemini 1.5 Pro)の出力を教師モデルとしてトレーニングする手法で、生徒モデルはより小型で推論能力が高速になり、リアルタイム処理や大規模なデータへの適用が可能となる。
Gemini 1.5 Flash導入に伴い、Geminiのコンテキスト・ウィンドウが8000トークン(Gemini 1.0 Pro)から32000トークンに拡張された。これにより、より長い会話や複雑な質問に対応できるようになった。この大きなコンテキストウィンドウを活用できるよう、Googleは近々、ファイルをGoogleドライブから、またはデバイスから直接アップロードできる機能をGeminiに追加する予定である。