平凡社 世界大百科事典

統計的検定

事物の集合を定量的に比較する目的で用いられる数理統計学の方法を統計的検定(または検定)という。応用としては,例えば,化学反応の収率を上げる目的で使用する触媒の比較とか,現在の日本の成人男子の身長を10年前と比較するとか,あるいは,ある病気に対する2種の治療法を比較するなど数多くの例を挙げることができる。この場合,収率,身長など比較したい事物の集合を母集団といい,無作為にとった少数の標本に基づいて元の母集団を比較するという形式をとる。母集団の記述にはいろいろな方法が考えられる。もっとも単純なのは母集団の要素をすべて書き出すことだが,これは要素数が大きいときには不可能である。むしろ平均やばらつきなど,少数の特性値でおおづかみに記述するほうが便利かつ現実的である。さらに収率や身長のように連続値をとり,単峰かつ対称で平均から極端に隔たる要素が存在しないと思われる場合には正規分布を仮定することができる。平均μ,分散σ2の正規分布N(μ,σ2)の密度関数は,

で与えられる。これはμを中心とし,富士山を投影したような形をしている。

 正規分布を仮定すると母集団の比較はパラメーターに関する仮説検定の問題として定式化することができる。次のデータはある食品会社の製品濃度の10個の測定値である。

 データ:9.1,8.1,9.1,9.0,7.8,9.4,

  8.2,9.1,8.2,9.3(単位%)

この製品について標準値がμ0=8.5,σ0=0.5とされている。このデータに基づいて母集団の平均が標準値に合致しているかどうかの検定は次のように行う。

 検定したい仮説は,

 H0:μ=8.5

である。これをとくに帰無仮説という。一方,標本の平均は,

 x=(9.1+8.1+9.1+9.0+7.8+9.4+8.2+9.1+8.2+9.3)÷10=8.73

である。標本の平均は確率変数だから,その一つの実現値である8.73が標準値に一致しないからといって仮説H0が真でないということにはもちろんならない。H0を真と考えるか否かの判定を,x=8.73がH0の下での確率分布の実現値として自然な値なのか,あるいはきわめて珍しい値で,むしろ母平均が8.5とは異なるある値μ1と考えるほうが自然なのかによって行うのが統計的検定である。この場合,帰無仮説に対して想定する仮説,

 H1:μ=μ1

は対立仮説という。対立仮説としては,H0での値と異なるすべての値を想定して,

 H1′:μ≠8.5

とすることもある。H1′の下ではμの値によって複数の確率分布を考えることになるのでとくに複合対立仮説と呼ぶ。複合対立仮説としては,

 H1″:μ>8.5やH1:μ<8.5

のようにH0での値より大きいほうまたは小さいほうだけを考えることもある。H1′を両側対立仮説,H1″を右片側対立仮説,H1を左片側対立仮説と呼んで区別する。

 検定方式としては帰無仮説が真のときにはそれを採択する確率がなるべく大きく,逆に対立仮説が真ならば帰無仮説を棄却する確率がなるべく大きいことが望ましい。

 一般に,x1,……,xnが正規分布N(μ,σ2)に従うとき,平均xは正規分布N(μ,σ2/n)に従う。そこでx=8.73がH0の下での分布N(8.5,0.52/10)の実現値として自然な値か否かを考える。まず対立仮説としてH1を考え,μ1が8.5より大きなある値とするとxが不自然に大きいと思われるときにH0を棄却することになる。対立仮説として右片側対立仮説H1″を考えるときも同様である。いま,正規分布N(8.5,0.5/102)に従う確率変数Yが8.73より大きな値をとる確率は,

である。ただし,記号prはprobabilityの略で,( )内の事象が起きる確率を表す。Yを規準化したUは標準正規分布に従うので,最後の値は正規分布表から求めることができる。確率0.074はかなり小さいがきわめて珍しいというほどでもないだろう。次に,両側対立仮説H1′を考えるときには,xが8.5から下方に大きく隔たってもH0を棄却すべきである。H0の下でxが下方に2.3以上隔たる確率も先と同様に0.074である。したがってH0の下でxが8.5から±0.23以上隔たる確率は約0.148,いいかえると100回中15回くらいある。これはそう珍しい事象とはいえない。ここでこれらの確率の大きさをどう評価するかが問題になるが,ふつうは0.05および0.01を規準とし,0.05以下のときは有意,0.01以下のときは高度に有意といってH0を棄却する。規準にとる0.05や0.01などは検定の有意水準という。これはまた,H0が真のときに誤って棄却する確率でもあり,この意味では危険率と呼ぶ。

 検定の有意水準αを定めると,あらかじめある領域を設定し,観測値がその領域に属せばH0を棄却するという検定方式をとることができる。この領域を有意水準αの棄却域と呼ぶ(図)。N(0,12)の上側α点をKαと置くと,上の両側検定の例についてH0の下で標本平均xについて,

で与えられる。

 このほか,分散に関する仮説の検定も同様の考え方で構成することができる。

 母集団に想定する分布はいつも正規分布とは限らない。信頼性の分野で寿命や故障時間を対象とするときには指数分布やワイブル分布を想定することが多いし,事故件数や病気の治癒の有無など離散データを対象とするときにはポアソン分布や二項分布などの離散分布が用いられる。さらに特定の母集団分布を仮定しないで,平均的な大小関係を論ずるノンパラメトリック法もある。

広津 千尋
図-有意小準αの棄却域
図-有意小準αの棄却域