Google(グーグル)が視覚障害者のためのAIアプリ「Lookout」をアップデートし、長い文書のスキャンと食品ラベルの読み上げ機能という2つの便利な新機能を追加した。店頭にある紙のフォームや同様の形状の製品は、視覚障害者にとっての課題であり、アプリはこれらの問題を容易にするはずだ。
考えてみれば、食品ラベルはコンピュータの視覚システムが認識するのはかなり難しいものだ。これらは人の注目を集め特徴的であるようにデザインされているが、必ずしも非常に読みやすかったり、情報が多いわけではない。目が見える人でも間違った種類のピーナツバターを買ってしまうのだから、ラベルを読めない人にとっては非常に高いハードルだ。
画像クレジット:Google
新たな食品ラベルモードはテキストを読むことよりも、見ている商品を正確に認識することを重視している。カメラによく映るように缶や瓶を回転させる必要がある場合は、アプリがそれを教えてくれる。そして被写体と製品画像のデータベースと比較し、それが一致した場合にはブランド、製品、フレーバー、その他の関連情報を引き出す。もし問題があれば、アプリはいつでもバーコードをスキャンできる。
ドキュメントのスキャンは必ずしもエキサイティングなものではないが、汎用の人工視覚アプリにこのオプションが簡単な方法で組み込まれているのは良いことだ。スマートフォンにドキュメントを向ければ
コメント