「数字を使って騙す人」を減らすためにも、投資家が知っておきた...の画像はこちら >>


選挙を見ていると、開票率0%なのにすでに「当選確実」と報じられるケースがあります。なぜ開票し始めたばかりで“確実”とまで結果を予測できるのかというと、「統計学」が活用されているからです。



お金にまつわる学問について深掘りする本連載。統計学がテーマの今回は、著書に『これから学ぶ人のための統計学超入門』がある西紘永氏に話を聞きました。

「統計学」は全社会人の“必須スキル”に

「数字を使って騙す人」を減らすためにも、投資家が知っておきたい統計学とは


――最近は「データサイエンス」の注目度が増していますが、それらと密接に関わる統計学の重要性も高まっているのではないでしょうか。

西 そうですね。デジタルの発展にともない、収集・蓄積できるデータの量や種類は格段に増えました。たとえばスマホの閲覧データや電車の乗降データ、商品の購入データなど、人が活動するあらゆるところでデータが生まれます。今後も増え続けることは間違いなく、データ分析や統計学の重要性は日増しに高まるでしょう。

関連する学問を学べる大学も増えていますし、近年話題のAI(人工知能)や機械学習にも、データからパターンを学び予測する考え方が使われています。これからのビジネスパーソンにとって“必須スキル”になるのではないでしょうか。

――どんな職種の人でも、ですか?

「数字を使って騙す人」を減らすためにも、投資家が知っておきたい統計学とは


西 はい。私は大学を出て人事や経理、コンサルティングやマーケティングなど、幅広い職種に携わったのですが、一貫して必要だったのがデータ活用でした。

人事なら、前年度までの採用実績を分析して今年度の計画を立てますし、どの求人プラットフォームを使うか、どの採用イベントに出展するかもデータをもとに考えます。また、経理なら会社の業績予測に、Webマーケティングなら広告ごとの効果測定に用いました。

コンサルティングも、各施策の費用対効果を測るためにデータ分析が行われます。

あらゆる職種・業種で必要な知識であり、どんなキャリアを歩んでも有用になるでしょう。

――ちなみに、データサイエンスと統計学は同じものと捉えて良いのでしょうか。

西 私の考えでは、統計学はデータサイエンスの一部という認識です。データを収集・整理・分析し、有用な情報を引き出す方法や理論を研究するのが統計学。データサイエンスはさらに広く、集めたデータを使いやすいように加工したり、分析のためのプログラミングを作ったりということも含まれます。

統計学には、「記述統計」と「推測統計」があります。記述統計は、データを分かりやすく可視化するための学問。数字が羅列されただけのデータでは、何が示されているかわからないこともあるので、表やグラフにして相手に伝えやすくするなどが一例ですね。

もう1つの推測統計は、全体の姿を一部のデータから推測したり、過去のデータから未来を予測したりというもの。近年、特に注目されているのはこちらです。

迷惑メールの判別にもこの理論が使われている

「数字を使って騙す人」を減らすためにも、投資家が知っておきたい統計学とは


――私たちに身近な範囲で「実はこんなところに統計学が使われている」という事例はありますか。

西 全体の姿を一部のデータから予測する、という意味でわかりやすいのが「テレビの視聴率」です。

テレビを視聴している全世帯を調べるのではなく、ランダムに選ばれた特定の世帯の視聴データをもとに、「区間推定」と呼ばれる統計学の手法で全体の視聴率を予測しています。

ただし区間推定には誤差もあり、仮に視聴率20%としても、実際は17%~23%ほどの幅を持つ可能性もありますね。

ちなみに、選挙の開票速報にも区間推定が一部使われていて、開票率0%で当選確実と出るのは、集めた一部のデータをこの手法で分析し、さらに出口調査や過去の選挙データと組み合わせて最終結果を予測しているためです。

「数字を使って騙す人」を減らすためにも、投資家が知っておきたい統計学とは


――だからあんなに早く判明するんですね。

西 そうですね。このほかには、迷惑メールの自動判別にも「ベイズ統計」という統計学の手法が活用されています。過去のデータから未来を予測する考え方で、簡単に言うと、過去のメールから「迷惑メールに多い特徴」を学び、それをもとに新着メールが迷惑メールか否かを判断します。

文章の構成や使用している単語、本文にURLが含まれているか、含まれているならどの位置にどのようなアドレスがあるか、メールのタイトルなど……。さまざまな要素を見ています。

ベイズ統計の特徴は、新しいデータを蓄積して次の分析に活用すること。そうしてどんどん精度を高めていきます。医療や金融市場の予測でも使われており、AIの登場でさらに存在感が増していますね。



――投資や貯蓄においても、統計学は関わりが深いのでしょうか。

西 非常に深いですね。投資の「移動平均線」はその代表でしょう。25日移動平均線であれば、25日間の終値を平均してグラフ化したもので、株価の動きや傾向が見えやすくなります。

貯蓄と統計学のつながりで言うと、よく議論になるのが「平均値」と「中央値」の違いです。平均値は全データをならすので、仮に大富豪が1人入ると平均貯蓄額は非常に高くなる。一方、中央値は全体の真ん中に位置する値を取るため、平均値とは異なります。

SNSではいろいろなデータが流れてきますから、こうした違いを知っておくだけでも正しい理解につながるのではないでしょうか。

「嘘つきは数字を使う」からこそ、確かな知識を

「数字を使って騙す人」を減らすためにも、投資家が知っておきたい統計学とは


――今のお話にあるように、最近はさまざまなデータを目にする機会が増えました。これらの情報に触れるとき、心がけることはありますか。

西 データの背景や裏側を確かめることではないでしょうか。「数字は嘘をつかないが、嘘つきは数字を使う」という話もあり、悪意を持ってデータを都合よく見せる人もいます。

また、悪意はなくても、統計の知識が十分ではないために不自然なグラフを作っているケースもあります。

データに触れた時、調査の対象者やデータの収集方法、分析の仕方までチェックすることが大切であり、統計学の知識があるとその思考が身につくでしょう。

――数字は説得力があるからこそ、適切に扱うことが大切ですね。

西 もう1つ、投資でいえば、株価や業績が変化した要因を考える力をつける上でも、統計学の知識は役立つでしょう。

回帰分析という統計学の手法では「目的変数」と「説明変数」という言葉がよく使われます。目的変数とは、簡単に言えば何かの結果を表す変数で、説明変数はその要因となる変数です。

仮に企業の業績が目的変数なら、その要因となった説明変数は何か。統計学の視点からこうした探究ができるでしょう。

――統計学の知識をつけると、投資の見え方も大きく変わるかもしれません。

西 その通りで、時系列でデータ分析ができるようになると、過去のデータから今後の動きを推測する力が身につきますし、夏に特定の商品が売れるなどの「季節性のトレンド」も発見しやすくなるでしょう。「何となく」ではない、「数字に基づいた判断」につながるのではないでしょうか。

「数字を使って騙す人」を減らすためにも、投資家が知っておきたい統計学とは


(取材・文/有井太郎 撮影/森カズシゲ)

※記事の内容は2025年3月現在の情報です

編集部おすすめ