統計学: 検定の基本的考え方
統計的検定という結構難解な概念が日常に侵入したこの3年半。だた、大多数の人がそもそも定義すら理解していない状況は変わらない。ここでは統計学で仮説の確からしさを評価するための方法である「検定」について、考え方に重点を置いて書いてみる。 統計的検定のためにはまず、一つの仮説(仮説1としよう)を立てる。手元にデータがあるとき、仮説1が成り立って「いない」ときにそのデータが得られる確率を考える。つまり、仮説1は正しくないのに、あたかも仮説1が成り立つかのように見える偶然がどのくらい起きうるかを計算する。 その確率がある値pよりも小さければ「偶然ではない」と判断するわけだ。アルファベットpは確率(probability)の意味で使われる。ここで、仮説1が成り立って「いない」という仮説を帰無仮説と呼ぶ。偶然に仮説1を支持するかに見えるデータが生じる確率がそこそこ大きい(pより大きい)ときは、帰無仮説が否定されない。つまり、積極的に仮説1を支持する根拠はないと判断する。応用上、この検定をするのは仮説1を主張する側なのが普通である。「支持するデータが得られた!」という主張の背後には、帰無仮説の確率が非常に小さいということが根拠としてある。 ここで注意すべきなのは、この設定の検定には仮説1を積極的に否定する機能はないということだ。そして統計的根拠は仮説1を主張する側が積極的に示さなくてはいけない。続
コメント