明治満150年の2018年のNHK大河ドラマは、明治維新期に日本の礎を築いた西郷隆盛の一生を描く「西郷どん」です。この記事では、統計的手法を用いて「西郷どん」の年間平均視聴率を、あくまでも「予想」ではなく「予測」したいと考えます。
プロローグ
大河ドラマといえば、毎年話題となるのが年間平均視聴率です。
作品自体の出来栄えを評価する上で、必ずしも「視聴率」は有効なインデックスにはならないと私は考えますが、長期にわたる日本人の歴史ドラマへの嗜好性を分析する上では、一つの有効なインデックスになるかと思います。換言すれば、どのような思考回路で、大河ドラマが支持/不支持されるのか?・・・そのメカニズムを把握することは、日本人の歴史観をひも解く鍵といえるかもしれません。
さて思考回路のメカニズムを把握するにあたって有効と思われるのが、質的データを用いて量的データを予測する統計手法である数量化理論Ⅰ類です。
この手法は、「大河ドラマ作品の時代が平安時代/戦国時代/幕末」、「大河ドラマの主人公が男性/女性」といったような質的データ(カテゴリカルデータ)をダミー変数というテクニカルな変数を使って数量化することによって「視聴率」などの量的データ(数値データ)を予測するものです。一般化して言えば、世の中に存在する非線形な因果関係を質的変数の線形結合でモデル化するものです。
この手法のパフォーマンスはかな
コメント