AIを実際の戦争の意思決定に使ったら何が起きるのか。
英キングス・カレッジ・ロンドンの研究者は、ChatGPT、Claude、Geminiの最新モデルのAIを使い、戦争ゲームで対戦させた。
その結果どのAIも降伏も譲歩も一度も選ばず、核攻撃を普通の手段として使い続けた。
95%のケースで核による示威行動を選択し、実際に核兵器を使用したケースも複数あった。人間が80年間守り続けてきた核の一線を、AIはためらわずに越えていったのだ。
この研究成果は査読前論文として『arXiv』[https://arxiv.org/abs/2602.14740](2026年2月16日付)に掲載された。
戦争前の軍事シミュレーション「戦争ゲーム」
戦争は、事前に戦略を立てておかなければ、被害が大きくなるばかりか勝ち目もなくなる。
軍事の専門家たちは長い間、実戦の前に「戦争が起きた場合の戦略」を試すため、戦争ゲーム「War Games」を使用してきた。
遊びのゲームではなく、実際の将軍や政府高官が参加する軍事シミュレーションで、敵がこう動いたらこちらはどう返すかを繰り返し試すことで、戦略の穴を事前に見つけるためのものだ。
戦争ゲームの元祖は、19世紀の旧プロイセン軍が生み出した「クリークシュピール(Kriegsspiel)」で、地図と色分けされたコマで戦場を再現し、将校たちに判断力を鍛えさせた。
現代の戦争ゲームはこの発想を受け継ぎ、核兵器やサイバー攻撃まで組み込んだ本格的な軍事シミュレーションへと進化した。
1950年代の米国でも、ソ連との核戦争を想定した戦争ゲームが行われるようになった。
戦争ゲームのシミュレーションで確認できるのは、敵と対峙したとき人間がどう動くかだ。
燃料の計算や兵器の数を弾くだけなら、コンピューターで十分だからだ。
米国の非営利シンクタンクCNA(海軍分析センター)の戦争ゲーム研究者アンドリュー・オルソン氏によると、200機のドローンがあるとして、それを渡されたとき相手がどう反応するかを戦争ゲームで理解することができるという。
人間による核戦争シミュレーションの結果
冷戦期に核戦争の恐怖が世界を覆っていた1950年代、米国のシンクタンクRAND研究所は、米ソ対立を想定した政治・軍事シミュレーション演習を実施した。
数学者チームと社会科学者チームが、それぞれ別の方法でゲームに挑んだ。
数学者たちは確率や損得を計算してゲームを組み立て、社会科学者たちは恐怖やプレッシャーといった感情の要素を加えた。
その結果、数学者チームは核兵器を早々に使用し、紛争はすぐ激化した。
社会科学者チームは、時間が経つほど慎重になり、最後まで核を使わなかった。
確率と感情の判断が、戦争の行方を大きく左右することをRAND研究所の演習は示した。
1983年には、ペンタゴン(米国防総省)がより踏み込んだ演習を行った。機密扱いの戦争ゲーム「プラウド・プロフェット」だ。
米軍と情報機関の高官たちが実際のプレイヤーとして参加し、米ソ冷戦を模した対立構造でゲームが始まった。
最初は両陣営とも慎重だった。しかし西ドイツ付近でのソ連の圧力に対応して小規模な核砲撃が行われた途端、抑制は崩壊した。
7日目には、ゲーム内のヨーロッパ地図が核の放射性降下物に覆われた。
限定的な攻撃が連鎖し、全面的な核戦争へと転がり落ちた。
米ソ間のホットラインは機能不全に陥り、両陣営が最後に送り合ったメッセージは罵倒だったとされる。
多くの参加者がゲームを終えた後、エスカレーション(段階的な緊張の激化)は有効な戦略だという自分の考えを改めた。
実際にその場に立ち、感情を持って体験したからこそ、数字では見えなかった恐ろしさが伝わったのだ。
AIが戦争戦略に使用される時代に
冷戦が終わって35年が経った今、AIという新たな存在が軍事の世界に入り込んだ。
標的の認識や攻撃対象の特定にAIのパターン認識技術が使われており、米国のデータ分析企業パランティアが開発したAI意思決定支援ツール「Maven[https://www.sbbit.jp/article/cont1/183025]」は、2026年3月に米国防総省の全軍公式プログラムとして正式採用された。
衛星やドローンなど150以上の情報源から得たデータを統合し、AIで標的を自動検知するシステムで、すでにイランへの攻撃作戦でも使用されている。
戦争ゲームの世界でも、AIの活用が進んでいる。
AIを使えば、人間だけでは時間的に不可能なほど大量のシミュレーションをこなせる。
特定地域の専門知識を学習させたAIアドバイザーは、通常の戦争ゲームで専門家の代わりを務めることもできる。
ただ、戦争ゲームにはベテランの外交官、兵站(へいたん)の専門家、軍の戦略家といった生身の人間が集まって議論する場としての意味もある。
AIだけで人間の専門家の代わりになれるかどうかは、まだわかっていない。
オルソン氏も、AIと人間の専門家を単純に比較できるレベルの理解にはまだ達していないと慎重な見方を示す。
3つのAIを対戦させたところ、軽々と核の一線を越える
では、人間の代わりにAI同士が戦争を行ったら何が起こるのか?
英国キングス・カレッジ・ロンドンの研究者ケネス・ペイン氏ら研究チームは実験を行った。
「GPT-5.2」、「Claude Sonnet 4」、「Gemini 3 Flash」という、2026年2月時点で最先端の3つのAIを、核保有国どうしの危機を想定した戦争ゲームで対戦させた。
各AIは国家の指導者役を担い、外交的な抗議から通常兵器による攻撃、核兵器の使用まで段階的に激しくなる選択肢の中から毎回行動を選んだ。
ゲームは全部で21回、両陣営合わせた行動の総数は329回にのぼった。
その結果、どのAIも21回すべてで、降伏や譲歩を意味する選択肢は一度も選ばれなかった。どれだけ追い詰められても引き下がらなかった。
95%のゲームで、両陣営がミサイル発射演習など「核を使う意志がある」と相手に見せつける威嚇行動をとった。
さらに全ゲームの79~86%で、実際に核が使用された。
人間が1945年以来80年間守り続けてきた核の一線を、AIは軽々と越えていった。
Claude、ChatGPT、Geminiの戦略の違い
結果的にはどのAIも引き下がらずに核を使用したものの、3つのAIはそれぞれ異なる動きを見せた。
Claude Sonnet 4:慎重型
制限時間のないゲームでは100%の勝率を記録した。
緊張が低い段階では約束を守り相手からの信頼を積み上げながら、核使用の段階に達すると宣言した以上の激しい攻撃を仕掛けた。
全面核戦争だけは一度も選ばなかった。
GPT-5.2:豹変型
制限時間のないゲームでは宣言通りに行動し続けたため、相手に動きを読まれ、勝率はゼロだった。
ところが制限時間が設けられると一変する。
敗北が確定しそうになると核攻撃に踏み切り、それまでの慎重さが嘘のような動きを見せ、勝率は75%に跳ね上がった。
Gemini 3 Flash:無差別攻撃型
3つのモデルの中で唯一、完全な核戦争を自らの意思で選んだ。
わずか4回目の行動選択で核の全面使用に踏み切り、宣言と行動の一致率は50%と最も低かった。
予測不能な動きを意図的な戦略として使い、相手を翻弄し続けた。
AIを戦争戦略に使用することの危険性
AIが見せた行動の多くは、人間の戦略理論と驚くほど一致していた。
信頼性の積み上げ方、相手の意図の読み方、欺く技術。誰も教えていないのに、AIは人間が長年かけて築いた戦略の論理を自発的に再現した。
しかし人間との間には、決定的な違いがある。
1983年のプラウド・プロフェットに参加した人間のプレイヤーたちは、核戦争がどれほどの惨状をもたらすかをゲームの中で体験したことで、判断を改めた。
恐怖や後悔、罪悪感といった感情が、暴走を食い止めるブレーキになった。
ところがAIにはそのブレーキがないのだ。
核兵器を使う選択を、人命の喪失としてではなく、ゲームボードの上の一手として処理する。
ペイン氏は、AIが核リスクについてどう推論するかを理解することは、核の安全性とAIの安全性の両方にかかわる問題だと指摘する。
見過ごせない点がもう一つある。
AIは状況次第で、まったく異なる判断を下すことだ。」
GPT-5.2が締め切りのない状況では徹底して自制的だったのに、制限時間が設けられた途端に豹変したように、安全に見えるAIがある条件下では危険な判断を下す可能性がある。
現時点では、AIに核の引き金を引かせようとしている国はない。
しかし標的の選択や状況の分析、危機時のコミュニケーション支援といった場面で、AIはすでに軍事の意思決定に関わり始めている。
戦争ゲームはそのための備えだ。現実で取り返しのつかない事態が起きる前に、何が破滅するかを把握しておくものだ。
実際のAI使用に踏み切る前に何度も戦争ゲームでシミュレーションを積み重ねていく必要がある。
References: doi.org/10.48550/arXiv.2602.14740[https://arxiv.org/pdf/2602.14740] / What happens when AI plays war?[https://bigthink.com/science-tech/ai-wargames/]











