ブログで100万の秘訣ってなに?
詳しくはコチラ

2024年11月8日 雑記「なんでも統計を見ればよいというわけではない」

 「なんかそういうデータあるんですか?」が"必殺技"扱いされるこの時代、調べればだいたいの統計は見つかるし、何かを主張するとすぐに統計を求められるようになった。主張にはその根拠が必要であるというのは真だが、多くの人には「主張」と「統計」という単純な対応関係しか見えていないような印象を受ける(この"印象"にも統計を求められてしまいそうだが……)。 統計を主張に結び付けるには、必ず「解釈」が必要となる。単なる数値の羅列が、本当にその主張を補強するような意味を帯び得るものなのか? ということはきっちりと考えておいてほしい。 極端な例を挙げよう。「日本の高校生の平均身長」を調べるために、ある高校のすべての生徒の身長を測定した。地域差は考慮しないとすると、これでだいたい「日本の高校生の平均身長」に近いものが得られそうだ。 しかし、実はこの高校が男子校だったということが発覚した。先ほど得られた「平均身長」を見た者は「これでは実際の平均身長よりも大きな値になってしまっているじゃないか」と言うだろう。このようなサンプルの全体(今回の場合は日本の全高校生)に対する偏り(今回の場合は性別の偏り)を「サンプリングバイアス」という。 上記の例なら気づきやすいが、サンプリングバイアスを完全に取り除くことは不可能だ。なぜなら、その偏りが「集めていない/集めることのできない情報」についてのものかもしれないからだ

リンク元

コメント

タイトルとURLをコピーしました