CyberAgentLM3
サイバーエージェントが、225億パラメータの日本語LLM「[CyberAgentLM3](https://huggingface.co/spaces/cyberagent/calm3-22b-chat-demo)」を公開したと[発表](https://www.cyberagent.co.jp/news/detail/id=30463)しています。サイバーエージェントは、2023年5月に独自の日本語LLMである「[CyberAgentLM](https://www.cyberagent.co.jp/news/detail/id=28817)」を一般公開し、その後、2023年11月にバージョン2となる「[CyberAgentLM2](https://www.cyberagent.co.jp/news/detail/id=29479)」を、2024年6月には視覚を付与した[VLM](https://www.cyberagent.co.jp/news/detail/id=30344)(大規模視覚言語モデル)を公開しています。
これらの技術はサイバーエージェントが提供する「[極予測AI](https://www.cyberagent.co.jp/news/detail/id=28828)」をはじめとするサービスにおいて広く活用されているそうです。
今回公開したモデルは、既存モデルをベースに用いずスクラッチで開発を行なった225億パラメータのCyberAgentLM3-22B-Chatです。
LLMの日本語能力を評価する[Nejumi LLM リーダーボード3](http://nejumi.ai/)においては、700億パラメータのMeta-Llama-3-70B-Instructと同等の性能となっており、スクラッチ開発のオープンな日本語LLMとしてはトップクラスの性能となるそうです(2024年7月現在)。