ブログで100万の秘訣ってなに?
詳しくはコチラ

東京大学齊藤研究室とバベルがAIエンジニアコミュニティ設立、wav2vec 2.0利用し日本語関連OSSプロジェクト開始

AIオートメーション技術を軸にグローバルで事業展開を行うバベルは8月24日、東京大学大学院工学系研究科齊藤研究室(東京大学 齊藤研究室)と、誰でも参加可能なAIエンジニアコミュニティ「AI Automation Lab」(AIオートメーション・ラボ)を設立。日本語学習済みAIモデルのオープンソースソフトウェア(OSS)化を前提とする日本語音声書き起こし・会話の解析技術の共同研究を開始したと発表した。ベースとなるモデルとして、音声認識フレームワーク「wav2vec 2.0」を利用し、日本語に合わせて調整する。
wav2vec 2.0と呼ばれる書き起こしのモデルは、大規模なラベルなしデータを利用した事前学習を行うことで、少数のラベル付きデータセットでも高精度の書き起こしが可能という。日本語のような少数派の言語では、大規模なラベル付きデータを学習に利用することが困難な状況なものの、wav2vec 2.0はまさにそのような状況にある言語に適しているとした。
AI Automation Labには、connpass上の「AI Automation Lab(AI オートメーション・ラボ)」より参加できる。
昨今「音声書き起こし」に関する技術は全世界で著しく発展しており、英語や中国語を中心とした各国の言語に対して、wav2vec 2.0などの最新の学習済みAIモデルがOSSで公開され、それらを活

リンク元

コメント

タイトルとURLをコピーしました