対話型AIが最も得意とする言語は何か。多くの人は英語や中国語を思い浮かべるかもしれない。
しかし、2025年に発表された26言語を調査した国際研究によると、最もAIが理解しやすい言語は英語でも中国語でもなかった。
トップに立ったのは、意外にもポーランド語で、英語は6位、中国語は21位にとどまった。言語の構造がAIの理解力に大きく影響していたのだ。
ちなみに日本語は15位という結果だった。では詳しく見ていこう。
26言語でAIの理解度を比較
アメリカのメリーランド大学、マイクロソフト、マサチューセッツ大学アマースト校の研究チームは、対話型AIがどの言語を最も理解しやすいのかを調べるために、「ワンルーラー」と呼ばれる新しい評価テスト(ベンチマーク)を使って26言語の比較を行った。
ワンルーラーでは、AIに十万語規模の文章を読み込ませ、その中に埋め込まれた情報を探させたり、複数の記述をまとめて答えを導かせたりする課題が出される。
文章を読むだけでなく、長い文脈を保持する力、必要な部分を抜き出す力、指示文の意図を正しく読み取る力、そして文全体から結論を導く推論力など、複数の能力が同時に試されるように設計されている。
たとえば「干し草の中の針探し(Needle in a Haystack)」というテストでは、数万語にも及ぶ長文の中にわずかに書かれた答えを探し出す必要があり、情報検索力と推論力の双方が求められる負荷の高い課題として知られている。
今回の比較では、アメリカ企業のOpenAIのChatGPT、GoogleのGemini、MetaのLlama、そして中国企業のAlibabaが開発するQwenの4つの主要モデルが同じ条件でテストされた。
複数企業のAIが横並びで比較されたことで、言語ごとの理解度の違いがより明確に示されることになった。
ポーランド語が1位に、英語と中国語が予想外の順位
今回の結果で最も意外だったのは、ポーランド語が平均88%と、AIにとって最も理解しやすい言語として首位に立った点である。ポーランド語はスラヴ語に分類されるが、英語やフランス語と同じアルファベット(A・B・Cの文字)を使って書かれている。
研究チームは、文法的な規則性の高さを理由の一つとして挙げている。語尾の変化によって文中の関係が明確に示されるため、長い文脈の中でも意味のつながりを見失いにくいとされる。
さらに、ポーランド語の学習データは量こそ多くないものの、内容が比較的整っており、誤字や崩れた文章が少ない傾向があるという。AIにとっては学習データの量だけでなく、文の一貫性や品質が理解度に影響する可能性が示唆された。
一方で英語は曖昧な表現が多いことや、同じ綴りで異なる意味を持つ語が多いことが、長文処理において不利に働いたとみられている。中国語は単語の区切りを示す空白がなく、文字そのものに複数の意味が含まれているため、AIが文を区切って処理する段階で誤差が蓄積しやすい構造を持つ。
学習データが豊富であるにもかかわらず、英語が6位、中国語が21位にとどまった背景には、こうした言語構造の違いが影響したと考えられる。
日本は15位、その他の言語のランキング
今回のテストでは、ポーランド語が1位となったほか、続いてロシア語、フランス語、イタリア語、スペイン語が上位を占めた。
これらの言語はいずれもアルファベットを使用し、文法的な規則性が比較的明確である点が共通している。
一方、日本語は26言語中15位という結果だった。
日本語は漢字・ひらがな・カタカナの三種類の文字を併用し、単語の境界が明確でないという特徴を持つ。AIが文章を読み取る際には文を細かく区切る「トークン化」と呼ばれる工程が必要だが、日本語ではこの区切りが難しく、処理の段階で誤差が生じやすいとされる。
語順が柔軟で、主語や目的語が省略されることも多いため、文脈を把握するには前後の関係をより慎重に追う必要がある。
こうした構造的な特徴が、日本語の理解度に影響した可能性がある。
以下は、研究チームが発表した26言語の理解度ランキングである。
言語別AIの読解精度ランキング(※64K・128K平均)26言語対象
1位 ポーランド語 (88%で最高精度)
2位 ロシア語
3位 フランス語
4位 イタリア語
5位 スペイン語
6位 英語 (世界最大の学習データ量)
7位 ウクライナ語
8位 スウェーデン語
9位 ポルトガル語
10位 ドイツ語
11位 ノルウェー語
12位 オランダ語
13位 ハンガリー語
14位 デンマーク語
15位 日本語
16位 チェコ語
17位 ベトナム語
18位 フィンランド語
19位 ペルシア語
20位 セルビア語
21位 中国語 (データ量は多いが低精度 )
22位 韓国語
23位 スワヒリ語 (東アフリカで使われる言語)
24位 タミル語 (南インドおよびスリランカで使われる言語)
25位 セソト語 (南部アフリカで使われる言語)
26位 ヒンディー語(インドの主要言語)
※「64K」「128K」は、AIが一度に読み込む文章量を示す数字で、それぞれ約6万字分と12万字分の長文に相当する。今回のテストでは、この長さの文脈をどれだけ正確に理解できるかが比較された。
この研究成果は『One ruler to measure them all: Benchmarking multilingual long-context language models(arXiv:2503.01996)[http://chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://arxiv.org/pdf/1908.02205]』(2025年9月30日付)に事前公開された。
References: Arxiv[https://arxiv.org/abs/2503.01996] / Polish May Be the Most Effective Language to Prompt AI, According to New Study[https://www.zmescience.com/science/news-science/polish-effective-prompting-ai/]











