ブログで100万の秘訣ってなに?
詳しくはコチラ

江戸時代のくずし字をAIにより文字認識し現代の書体に変換(翻刻)するアプリ「みを」をCODHが無料公開

データサイエンス共同利用基盤施設(ROIS-DS)人文学オープンデータ共同利用センター(CODH)は8月30日、江戸時代の版本に書かれているくずし字を現代の書体に変換(翻刻)するアプリ「みを」(miwo)を無料公開した(Android版・iOS版)。開発者は、カラーヌワット・タリン氏。共同開発者は北本朝展氏とMikel Bober-Irizar氏。共同研究者はAlex Lamb氏、Siyu Han氏。
AIくずし字認識については、CODH開発の「KKuroNetくずし字認識サービス(AI OCR)」および「Kaggleくずし字認識コンペ」1位のtascj氏が開発したくずし字認識モデルを用いている。また両AIモデルの学習には、同センターが開発し国文学研究資料館が公開している「日本古典籍くずし字データセット」を利用。Flutterを活用したクロスプラットフォーム開発により、Android・iOS対応アプリを作成した。
みをでは、カメラでくずし字を撮影し、画面下中央の「認識ボタン」をタップすると、ほぼ瞬時にして画像の個々のくずし字の上に、対応する現代の書体が緑色で示される。画面下のスライダーを動かすと、翻刻されたレイヤーを部分的に隠せるので、原文との比較がしやすくなる。まだ完ぺきではないとCODHも言っているように、実際に使ってみると、たまに文字が抜けたり違っていたりもするが、まったく

リンク元

コメント

タイトルとURLをコピーしました