
政府統計や人口調査と聞けば、私たちはつい「信頼できるもの」だと思い込んでしまう。しかし、その数字は必ずしも額面通りに受け取れるものではない。
「常に男性のほうが平均人数が多い」という謎
「出生、死亡、移動などによる人口の増減がない集団では、一定の期間における異性のセックスパートナーの平均人数は、男性・女性ともに等しくなる」ということは、事実として一般に認められている。つまり、「現在までに異性のセックスパートナーは何人いたか」を男性と女性に尋ねれば、セックスパートナーの平均人数は男女ともに等しくなるということだ。
だが、このトピックについてのさまざまな標本調査によると、実際にはそうではないことがわかる。常に女性より男性のほうが、セックスパートナーの人数が多いと答えている。
この現象を解明するために、グラスゴー大学とユニバーシティ・カレッジ・ロンドンの研究者たちは、チームを組んで調査に乗り出した。1990年以降、「性に対する考え方と性生活についての全国調査」という全国レベルでの大規模な標本調査が行われており、分析に使えるデータは十分にあった。
この標本調査の回答者である1万5000人の成人のデータを調べたところ、女性による回答ではセックスパートナーの平均人数が7人だったのに対し、男性による回答では平均人数は14人だった。
この大きな差の原因を突き詰めると、次の2点が浮かび上がった。まず、セックスパートナーの人数がきわめて多かった層では、女性より男性のほうが挙げた人数がずっと多かった(この層での平均人数は、男性の場合は110人、女性の場合は50人だった)。
2つ目の原因は、男性の場合、大まかな人数を答える傾向が強かったことだ。研究チームは回答者に実際に尋ね、その回答がだいたいの人数だったことを確認している。
平均人数の差について得られた結論は、男性の場合は実際より多く答え、女性の場合はおそらく少なく答えているのではないかということだった。
「セックス」や「パートナー」の解釈の違い
こうしたことがなぜ起きるのかについさらに分析したところ、これまでの経験人数を多く、または少なく答えたいかどうかはジェンダー規範の影響があることに加えて、この質問での「セックス」や「パートナー」の解釈が人によって異なっているのが原因だったという。
これは、自己申告に基づく調査だったために、個々の回答者がつくった指標が実際と合わなかった例だ。自己申告によってつくりだされた指標は事実を歪めてしまうことが多い。なぜなら、人は自分の都合のいいように答えるからだ。回答者は物事を大げさに、または控え目に言ったり、あるいは意図的であろうとなかろうと、自分自身について本人が理想とするような印象を他人に与えようとしたりする。
だとすると、標本調査のすべての質問は、そういった自己申告がもたらす問題に影響を受けているのではないかと思われる。確かに、ある程度はそのとおりなのだろう。なぜなら、どんな調査も、回答者が正直に答えることが前提とされているからだ。
とはいえ、「右利きか、左利きか」「コーヒーか紅茶のどちらが好きか」といった質問に対して、回答者が噓をついたり事実より大げさに語ったりすることはまず考えられない。
世論調査においてさえ、論争が続いている話題に対する意見や、首相についての正直な感想を求められたとき、あえて噓をつく動機は回答者にはない。ここ英国では、そうした質問に対して自分の見解を恐れずに語れるからだ。
事実と異なる回答が多いのは、セックス、食事、飲酒、収入といった、プライバシーに関する質問の場合だ。こうした質問内容は、回答者にとって、後ろめたさや恥ずかしさ、自信喪失といった感情を引き起こすものなのかもしれない。
飲酒量や食事量の調査で大量発生する「嘘つき」たち
飲酒量については、回答者の答えと実際の酒類の販売量が一致していない。回答者の答えから推計された総飲酒量は、酒類の販売量の4割から6割にすぎない。
確かに金曜の夜にはパブの床に大量に酒がこぼされているのかもしれないが、それでもこの数字が示しているのは、標本調査の回答者は自身の飲酒量を大幅に少なく答えているということだ。
その原因の1つは、飲酒に関する標本調査で通常使われている「ユニット」という数え方にある。読者のみなさんは、英国の標準的なグラスワイン1杯の量(175ミリリットル)が「2.1ユニット」であることをごぞんじだろうか。
こういった数字はなんとなく覚えてはいても、いざアンケートに記入するとなると、「グラス1杯分が1ユニット」と大まかに計算してしまうものだ。おまけに、各種の酒のグラス1杯分のユニット数を示したうえで飲酒量を尋ねても、実際の量より少なく答える回答者も多い。
これと同じことは、食事の量を記録するよう依頼した場合にも起こりがちだ。一人前の食事の量は飲酒量のユニットに相当するような標準的な単位がないため、各自が抱いている一人前の感覚はそれぞれ相当に異なっている可能性が高い。
ただし、それより大きな理由は、飲みすぎと同じく食べすぎにもマイナスイメージがあるので、本人が意識しているかどうかにかかわらず、回答者は自分の食事量を少なめに記入する傾向があることだ。
とある米国の研究に、肥満で体重を減らしたい被験者に対して、食事量を1日1200カロリーに抑えるよう指示したものがある。
結局、彼ら自身による食事量の計算が、実際より常に少なかったこと判明したのだった。なかには、食事量の目算が実際の量の半分程度だった被験者もいた。同様に、運動量も記録するよう指示された被験者は、実際より多く運動したと申告し、なかには申告した運動量が実際の運動量の倍だった人もいた。
被験者たちが(おそらく無意識に)噓をついていることを研究者が把握できたのは、調査期間を通じて、食事量や運動量の記録とは別に、「二重標識水法」という科学的手法を用いた検査も行っていたからだ。これは、特別につくられた水を被験者に飲ませ、一定期間後の排出量を測定することによって、各自のエネルギー代謝を正確に推定できるという評価法だ。
2018年に、英国国家統計局も同様の手法で新たに研究を行った。そのときの被験者は、英国の「全国食事栄養調査」の回答者のなかから改めて抽出された人々(副標本)だった。その結果、被験者の平均カロリー摂取量は、彼らが申告した食事量よりおおむね3割増しだったことがわかった。なかには、実際より7割も少なく申告する「噓つき」もいた。
「自己申告」はどこまで信頼できるのか?
こうした過少申告がなぜ困るのかというと、飲酒や肥満から生じる問題に対処するための保健サービスへのリソースの割り当てが「バッドデータ」(注:統計学的に理想的なデータに紛れ込んで分析を邪魔する粗悪なデータ)に基づいて行われてしまうことになるからだ。
摂りすぎると体に悪いとわかっているものについて、摂取量を過少申告するという現象があることには十分な裏づけがある。にもかかわらず、国民保健サービスが集めるデータの大半は自己申告に基づいている。
ユニバーシティ・カレッジ・ロンドンの研究者たちは、「飲酒量は、実際より4割から6割少なく申告されている」という研究結果から、英国における実態を推測しようとした。そこで、過少申告と思われる数字を調整したところ、女性の3分の1、および男性の5分の2が、日常的に大幅に飲みすぎていることが判明した。
体に悪い行動を制限して健康を向上させるための、さまざまな方法の効果について調べる場合も、過少申告の影響が少ない調査方法を考える必要がある。
肥満でダイエット中の人に関する米国の研究では、一部の被験者がカロリー摂取を減らしていると主張しているにもかかわらず体重が減っていなかったため、研究者は被験者の食事内容を念入りに調べることにした。
もしも被験者たちの自己申告がそのまま受け入れられていたら、「体重が減っていない被験者は、まだ食べすぎている」という明白な原因を検証することなく、研究者は稀な病気の可能性を調べることになっていただろう。
ヤバい統計 政府、政治家、世論はなぜ数字に騙されるのか
著者:ジョージナ・スタージ訳者:尼丁 千津子

政策はAI(人工知能)では作れないことを、徹底的にわからせてくれる。
――藻谷浩介氏(『里山資本主義』)
その数字は、つくり笑いかもしれないし、ウソ泣きかもしれない。
データの表面を信じてはいけない。その隠された素顔を知るための一冊!
――泉房穂氏(前・兵庫県明石市長)
【データの“罠”が国家戦略を迷走させる!? ビッグデータ時代の必読書!】
「データ」や「エビデンス」に基づいてさえいれば、その政策や意思決定は正しく、信用できると言えるのか?
私たちは政府統計を信頼しきっているが、その調査の過程やデータが生み出されるまでの裏側を覗けば、あまりにも人間臭いドタバタ劇が繰り広げられていて驚くはずだ。本書は英国国家統計局にも関わり、政府統計の世界を知りつくす著者が、ユーモア溢れる筆致でその舞台裏を紹介した一冊である。
扱われるのは、英国の移民政策、人口、教育、犯罪数、失業者数から飲酒量まで、実に多彩な事例。それぞれの分野で「ヤバい統計」が混乱をもたらした一部始終が解説される。
現在、この国では「根拠(エビデンス)に基づいた政策決定(EBPM)」が流行り言葉のようになっている。人工知能の発達も急速に進みつつあり、アルゴリズムに意思決定や判断を任せようとの動きも見られる。「無意識データ民主主義」といった言葉も脚光を浴びつつある。しかし本書を読めば、数字やデータだけを頼りに物事を決めることの危うさが理解できるはずだ。
数学や統計学の予備知識はいっさい不要。楽しみながらデータリテラシーが身に着く、いま注目の集英社シリーズ・コモン第3弾!
【目次】
第一章 人々
第二章 質問する
第三章 概念
第四章 変化
第五章 データなし
第六章 モデル
第七章 不確かさ