中国メディアの快科技は28日、「中国・海外AI(人工知能)モデル対決、国産三強は世界5位を争うしかできない」とする記事を掲載した。

記事によると、中国語に対応した汎用大規模言語モデル(LLM)の性能評価基準であるSuperCLUEの最新結果が公表された。

トップグループは海外モデルによって独占され、国産モデルの中でも特に高性能な三つは世界5位を争うしかできない状況だ。

今回対象となったのは、国内外の主要21モデル。評価項目は、数学的推論、科学的推論、コード生成、インテリジェントエージェント(タスクプランニング)、精密な指示の順守、幻覚制御の全6タスク・計492問から成る。

上位4位までを、Gemini-3.1-Pro-Preview(high)、GPT-5.5(high)、Claude-Opus-4.7(high)、Gemini-3.5-Flash(high)の海外勢が独占した。

国産モデルのDeepSeek-V4-Pro(max)、Qwen3.7-Max(Thinking)、Doubao-Seed-2.0 Pro-260215(high)は性能が拮抗し、5~7位に入った。

コストパフォーマンスの面では、国産モデルに優位性があり、低コストでほぼトップレベルの性能を実現している。推論性能に関しては、高性能領域では依然として海外モデルが優勢で、国産モデルは主に低~中性能領域にとどまっており、改善の余地があることが示された。(翻訳・編集/柳川)

編集部おすすめ