コンピュータシステムが人間の話すことを理解する能力は、かなり良くなって来ているが、いくつかの大きな弱点もある。なかでも、複数の意味や複雑な意味を持つ単語の扱いに問題があるのは事実だ。ELMoと呼ばれる新しいシステムは、重要な文脈を単語に加えることで、全体的に良い理解を導こうとするものだ。
問題を説明するために”queen”(女王)という単語を考えてみよう。あなたと私が話しているときに、私がその単語を話した場合、あなたは文脈からそれが、エリザベス女王か、チェスの駒か、蜂の巣の女王か、あるいはRuPaul’s Drag Raceを指しているのかを判断できる。
複数の意味を持つことのできる、このような単語の特性は、多義性(polysemy)と呼ばれる。そして実際に、それは例外的なものではなく慣例的に決まるものなのだ。通常はフレーズによって、その解釈は曖昧さなく決めることができる ―― 例えば “God save the queen!” (女王陛下万歳!)と “I saved my queen!”(クイーンの駒を守ったぞ!)など ―― そしてもちろん、これはトピック、文章の構造、返答が期待されているかどうかなどを伝えている。
しかし、機械学習システムは、こうしたレベルの柔軟性を持っていない。彼らが単語を表現
コメント