Googleは6月3日、新しいAIモデルとして「Google Gemma 4 12B」を公開した。よりシビアなエッジ環境向けの「E4B」と、強力な環境向けの「26B Mixture of Experts」のギャップを埋めるとしており、ミッドサイズモデルとして初めてネイティブオーディオ入力に対応している。


要求するメモリの量が16GBと比較的少なく、主要なゲーム向けグラフィックスカードやユニファイドメモリアーキテクチャを採用する環境で利用できるというAIモデル。Googleが公開したベンチマークではより大きい26Bモデルに近い性能を提供しつつ、メモリの使用量が半分以下とコンパクトな点が特徴。

マルチモーダルエンコーダが不要で、エンコーダを通さずオーディオ入力できる。自動音声認識、エージェント推論、日記化、映像理解、コーディングなどに活用でき、LM Studio、Ollama、Google AI Edge Gallery App、Google AI Edge Eloquentアプリ、LiteRT-LM CLIで利用できる。事前訓練済みのチェックポイントがHugging FaceとKaggleで公開されている。
編集部おすすめ