OpenAI(オープンエーアイ)のすばらしいAI言語モデルであるGPT-3は、多くの機能を備えているが、1750億個のパラメータを備えたそのモデルを、特にすっきりしているという人はいないだろう。このたびAllen Institute for AI(AI2、アレン・インスティチュート・フォー・エーアイ)が、GPT-3と同等もしくはそれ以上の質疑応答能力を持ちながら、サイズが10分の1というモデルのデモを行った。
AI2のモデルであるこのMacaw(マカー)は、標準的なテストで人間レベルのパフォーマンスを発揮するAIを作ることを目的として、非営利団体AI2で行われてきた研究から生まれた。
AI2の責任者であるOren Etzioni(オーレン・エチオーニ)氏は「非常に高いスコアを得た後、モデルはより難しい問題に移っていきました。人間にとって最も簡単な質問が、機械にとっては最も難しいというパラドックスがありますが、このときの最大のギャップは『常識』でした」と語る。
たとえば「トム・ハンクスが月に降り立ったのはいつですか?」と尋ねてみるのがその例だと彼はいう。GPT-3はこの質問に1995年と答える、なぜなら映画『アポロ13』が公開されたのが1995年だったからだ。しかしMacawは、私たちが知る限り、トム・ハンクスが実際に月に行ったことはないと正しく指摘する。
AI2は、その違いを示す例
コメント