文字で読むより、口で言ってもらったほうがいいことは多い。しかし、今のところ最高の音声技術は音声アシスタントが独占していて、画面の読み上げやオーディオブックの自動生成などには使えていない。WellSaid(「うまい言い方」という意味)は、人の声の代わりになる高品質な合成音声による語りを、クリエイターにも使えるようにしたいと考えている。もしかしたら、自分自身の声を合成できるかもしれない。
この数年間で、ニューラル技術が手作業に頼っていた従来のアプローチを大幅に改善したことにより、音声合成は大きな進歩を遂げた。しかし、GoogleもAppleもAmazonも、その高度な音声技術をスマートフォンやホームハブのおしゃべりに限定して、それ以外の利用は決して許さない。
WaveNetのことを聞き、そのあとTacotronのことを聞いた私は、Googleの担当チームに連絡をとり、Google Booksの全書籍を対象とした自然な読み上げによるオーディオブックの開発をいつ始めるのか、または、AMP(Accelerated Mobile Pages)の機能やユーザー保護機能に採り入れる予定はあるのか尋ねてみた。だが返事はなかった。そのようなサービスを必要としている人は大勢いるのに、彼らはチャンスを逃していると私は感じた。
それだけに、私はWellSaidがその市場を奪おうとしていることを聞いて、私は喜
スポンサーリンク
WellSaidは人間の代役が務まるほど自然な合成音声を公開
最近の投稿
- Former TuSimple co-founder urges courts to block asset transfer to China
- 【読書メモ #14】お金のむこうに人がいる
- 中学生でも解ける「素数はほぼ6の倍数±1」の証明 ただし「2と3」は除く。あなたは解けますか? | リーダーシップ・教養・資格・スキル | 東洋経済オンライン
- バドミントン塾「KSLA」のPTPで日本を再定義
- OpenAI’s tumultuous early years revealed in emails from Musk, Altman, and others
- 今週の投資関連注目記事(11月第3週-2)
- 2025年ブランディングが必須になる理由
- 24.縮小するのではなく、クラファンで支援を募るに至った背景
- Here’s the full list of 44 US AI startups that have raised $100M or more in 2024
- 外向型?内向型?「夫婦の性格調査」で意外な結果 ナンパやお見合い…結婚のきっかけ別で違い | ソロモンの時代―結婚しない人々の実像― | 東洋経済オンライン
コメント