アクセシビリティに向けた新たな取り組みの一環として、Googleは5月のGoogle I/OでProject Euphonia(プロジェクト・ユーホニア)を発表した。これは標準的ではない発声を行う人や、障害を持つ人の発話を理解する音声認識を開発しようとする試みである。同社は、この新しい機能を可能にしてくれるAIの一部を説明する投稿とその論文を公開した。
問題を理解することは簡単だ。筋萎縮性側索硬化症(ALS)などの変性疾患によって生じる運動障害を持つ人の話し声は、単純に既存の自然言語処理システムでは理解されないのだ。
その様子は、自らも発話に問題を抱えるGoogleリサーチサイエンティストのDimitri Kanevsky(ディミトリ・カネフスキー)氏が、Googleのプロダクトの1つと対話しようとする以下のビデオの中に見ることができる(最後には関連する仕事であるParrotronの助けを借りている)。
研究チームはこのプロジェクトを次のように説明している。「ASR(自動音声認識)システムは、ほとんどの場合、『典型的な』音声を使ってトレーニングされています。つまり、発話障害や強いアクセントを持っていたりする少数派のグループは、同じような利便性を受けることができません。現在の最先端のASRモデルは、ALSによって中程度の発話障害しか持たない話者に対して高い単語エラー率(WER:Wo
スポンサーリンク
GoogleがProject Euphoniaの包括的な音声認識を支えるAIの詳細を発表
最近の投稿
- 【人気特集】日産CFO退任観測で波乱!「内田社長の後継候補」とは?特許の取得件数から日産とホンダの技術力を徹底分析 – 見逃し厳禁!編集部イチ推し 人気特集
- 「上司よりも優秀な人」は職場で出世しない。悲しすぎるその本当の理由 – 雑用は上司の隣でやりなさい
- 貧乏人は「社会や政府が悪い」と考える。では、お金持ちはどう考える? – 投資の教室 人生を変えるマネーマシンのつくり方
- 【大人の教養】ハプスブルク家の結婚政策を「1枚の図」で語る! – 地図で学ぶ 世界史「再入門」
- 中国「時速400km」高速列車は本当に走れるのか 車両の性能は高くても運行できる路線がない? | 海外 | 東洋経済オンライン
- 【就活生保存版】面接官絶賛のケース面接回答、人気外資コンサルから内定が出る人の話し方 – 問題解決力を高める 外資系コンサルの入社試験
- 【ニフティ温泉】男性サウナー向けスキンケア商品体験企画のご案内
- Google is adding digital watermarks to images edited with Magic Editor AI
- Snapchat+ subscribers can now create custom AI-generated stickers
- Ford goes protectionist as EV losses top $5B
コメント