こんにちは。新宿区議会議員の伊藤陽平です。
文系の初心者からAI議員を目指す宣言を行い、ここ1年くらいで改めてプログラムや数学を学びなおしながら、政策立案におけるコンピュータの活用について研究を続けてまいりました。
本日は、今回の議会で質問するテーマの一つでもある、「テキストマイニング」についてお伝えします。
一般的に統計で用いられるデータとは、四則演算など計算を行うことができるものです。
ICT化の時代ではデータの管理や活用が求められていますが、まず想定されるのは、表やグラフを作成して分析することです。
一方で、新宿区では区民意識調査を行っていますが、選択式の設問ように数値化できるものだけではなく、自由記述による設問もあります。
また、コールセンターでは音声を通じて日々様々なご意見が届いています。
例えば、区民意識調査では、数値で表現可能な部分はExcelで扱える形式で公開されています。
しかし、自由記述については、抜粋されたものが報告書に記載されている程度ですが、担当者の主観が反映されてしまう可能性もあるでしょう。
テキストデータを人力で評価すると、主観が反映されることに加え、多大なリソースがかかってしまいます。
やはりコンピュータで分析をすることを検討しなければなりません。
そこで、テキストマイニングという手法を導入することを検討しました。
この手法では、文章を単語等に分割し
行政が主観で抜粋してた自由記述もテキストマイニングで分析を
![](https://xn--9ckkn2541by7i2mhgnc67gnu2h.xyz/wp-content/uploads/2017/02/6c9a3a8e-779c-4d37-be6c-ff924997e27b-1.jpg)
コメント