チャットGPTは同じ質問を繰り返すと答えが二転三転する。一貫性に欠けることが判明

2026年03月20日(金) 18:00

チャットGPTは同じ質問を繰り返すと答えが二転三転する。一貫性に欠けることが判明

チャットGPTは同じ質問を繰り返すと答えが二転三転する。一貫...の画像はこちら >>

　チャットGPTは、最新の研究論文に書かれた仮説が「研究で証明された（ホント）」か「否定された（ウソ）」かを当てるテストで、全く同じ質問をされても回答が二転三転し、その実力は最低ラインにとどまることが最新の研究で判明した。

　ワシントン州立大学の研究チームが700以上の問いを10回ずつ繰り返したところ、AIは「さっきはホントと言ったのに次はウソと言う」といった矛盾を連発。

　文章はもっともらしいが、実は内容を論理的に理解していない実態が明らかとなった。

この研究成果は『Rutgers Business Revie［https://rbr.business.rutgers.edu/article/unstable-intelligence-genai-struggles-accuracy-and-consistency］』誌（2026年3月17日付）に掲載された。

参考文献：
AI gets a D: Study shows inaccuracies, inconsistency in ChatGPT answers
https://news.wsu.edu/press-release/2026/03/12/ai-gets-a-d-study-shows-inaccuracies-inconsistency-in-chatgpt-answers/［https://news.wsu.edu/press-release/2026/03/12/ai-gets-a-d-study-shows-inaccuracies-inconsistency-in-chatgpt-answers/］

同じ質問で答えがコロコロ変わる

　米国ワシントン州立大学のマーケティング・国際ビジネス学准教授メスト・チチェク氏らの研究チームは、チャットGPTが研究論文の内容をどの程度正しく判断できるのかを調べた。

　研究チームは2021年以降に発表されたビジネス分野の学術論文から、719個の仮説を集めた。

　仮説とは、研究者が「もしAが起きればBが起きるのではないか」と予測する考えであり、研究データによって正しいかどうかが検証される。

　研究では、こうした仮説が実際の研究によって支持されたのか、それとも支持されなかったのかをチャットGPTに判定させた。

　そしてAIの回答が安定しているかを調べるため、まったく同じ質問を10回ずつ繰り返して入力した。

　その結果、チャットGPTは同じ質問に対して、ある時は「ホント」、別の時は「ウソ」と答えを変えるケースが確認された。

　10回とも同じ答えを維持できたのは全体の約73％にとどまり、AIの回答に一貫性がない実態が明らかになった。

［画像を見る］

偶然の正解を除くと実力は最低ライン

　2024年に行われた最初の実験では、無料版のチャットGPT-3.5が使われ、正解率は76.5％だった。

　翌2025年には更新版のチャットGPT-5 miniで同じ実験が行われ、正解率は80％にわずかに上昇した。

　一見すると高い成績に見えるが、このテストは「正しいか間違いか」の二択問題である。内容が分からなくても適当に答えれば半分は当たる可能性がある。

　そこで研究チームが偶然の正解を考慮して計算し直したところ、AIの実力はランダムな予測より約60％上回る程度にとどまった。

　研究者はこの水準を大学の成績に例えると低いD評価に近いと説明している。

　さらに分析すると、チャットGPTは「間違いの仮説」を見抜くのが特に苦手だった。

　研究によって支持されなかった仮説を正しく「偽」と判断できた割合は16.4％しかなかった。

　もっともらしい文章を作りながら、実際には誤った判断をしているケースが多かったのである。

［画像を見る］

AIは内容を理解しているわけではない

　チチェク准教授は、この結果の理由について現在のAIの仕組みを挙げている。

　チャットGPTのようなAIは、大量の文章を学習し、次に来る可能性が高い言葉を予測して文章を作る「大規模言語モデル（LLM）」という技術で動いている。

　この仕組みは、人間が書いたような自然で説得力のある文章を作ることができる。しかしAIが文章の意味を人間のように理解しているわけではない。

　そのため複雑な研究内容や論理的な判断が必要な問題では、学習した情報のパターンに頼って答えることが多くなる。今回の実験で同じ質問でも答えが変わったのは、そのためだと研究チームは説明している。

［画像を見る］

AIの答えは必ず確認する必要がある

　今回の研究は、生成AIの便利さと同時に限界も示している。チャットGPTは文章作成や情報整理では大きな力を発揮するが、複雑な判断や研究内容の評価では誤った結論を出すことがある。

　研究チームは、AIの回答をそのまま信じるのではなく、人間が内容を確認しながら使う必要があると指摘している。

　チチェク准教授は、AIそのものを否定しているわけではないと強調する。

　自身も日常的にAIを利用しているという。そのうえで、AIの答えをそのまま信じるのではなく、人間が内容を確認しながら慎重に使うことが重要だと説明している。

編集部おすすめ

カラパイアの記事をもっと見る

トピックス

新名神で多重事故　6人死亡、3人が子ども　大型トラック追突　乗用車が炎上

新名神で多重事故 6人死亡

今日の主要ニュース

新名神で多重事故　6人死亡、3人が子ども　大型トラック追突　乗用車が炎上

新名神で多重事故 6人死亡

国内の主要ニュース

中国、少林寺の元住職起訴　横領や収賄の罪で

少林寺の元住職を起訴中国

海外の主要ニュース

アンジェラ・アキ「ハーフであることが嫌でたまらなかった」「怒りを燃料にしていた」子供時代→今は「抱きしめてあげたい」

アンジェラ・アキハーフの葛藤語る

芸能の主要ニュース

【阪神】２年連続開幕投手の村上頌樹が上々の仕上がり　ＯＰ戦最終登板で６回３安打２失点　３・２７巨人戦へ視界良好

村上頌樹開幕へ視界良好

スポーツの主要ニュース

『ポケモン』最終決戦の映像公開！映像最後のピカチュウに異変？　4・17新情報発表

ポケモン最終決戦映像を公開

トレンドの主要ニュース

姉に『1万円を貸した』結果→ダラダラしていたら『犬』が近づいてきて…思わず吹き出す『衝撃の返金方法』が252万再生「優秀ｗ」「プロで草」

犬が姉へ衝撃の返金方法

おもしろの主要ニュース

元銀行員は見た！老後破産しないためのコンビニの使い方

老後破産を防ぐコンビニの使い方

コラムの主要ニュース

漫画「半分夫」連載特集

漫画「半分夫」連載特集

漫画の主要ニュース

びっくりニュースランキング

もっと見る

Amazonおすすめランキング PR

Amazonマンガ

更新:2024-09-10 14:44

Amazonでもっと見る

Amazonデバイス

更新:2024-09-10 14:44

Amazonでもっと見る

ペット

更新:2024-09-10 14:44

Amazonでもっと見る

ゲームアプリ

更新:2024-09-10 14:44

Amazonでもっと見る

お買いものリンク PR