統計データに基づかない分析とは何か
私が経済を議論するときデータを使わないと言っているのは、統計データを使わないという意味だ。具体的にはデータの分布を表す指標を使わないという意味だ。指標とは平均とか中央値とか最頻値とか分散とか歪度とか尖度などを指す。指標の種類は分布によって異なる。正規分布したデータを議論するとき、通常なら平均と分散の数値だけで議論する。本当に正規分布だったらそれでも良いが、正規分布の形をしていないのにそれをやったら正しいデータの解釈ができない。よく持ち出される例が日本人の世帯収入のデータだ。平均値が552万円なのだが、そんなにもらってないぞという人が多いので「平均は普通ではない」とか「平均値でなく中央値を使おう」とかが指摘される。じゃあ平均値の代わりに中央値の437万円を使えば日本人の暮らしぶりが分かるかと言えば、それも違う。5000万世帯の暮らしぶりを理解するためには、5000万世帯の世帯年収を一列に5000万個並べて、それを全て眺めないと真理は分からない。私の考え方の基本は「データはひとつひとつみる」「まとめない」だ。この世の中の系はたいてい複雑系なので、複雑系は複雑なまま扱うのが私の方針だ。それでは多すぎて処理できないって。大丈夫だ。ヒトの大脳のニューロンは100~200億個あって、小脳のニューロンは600~800億個ある。ニューロン間をつなぐシナプスは数百兆個ある。たくさんのデータを入力して
コメント