日本の共同通信社の3月14日の報道によると、東芝は同日、人工知能(AI)を使い、会議や講演の音声を瞬時に文章に変え、字幕で表示する技術を開発したと発表した。この技術は発言者の「えー」「あのー」などの間に挟み込む意味を持たない言葉を区別・除去し、簡潔な文章に変換することができる。聴覚障害者が情報を理解しやすくするのが狙い。
現在、AIの音声認識技術を使った自動書き起こしが普及している。しかし、話者の言葉をそのまま文字に変換するため、視覚から情報を得る聴覚障害者にとっては理解しづらかった。
東芝のAI技術は言いよどみなどを認識するほか、次に来る単語を予測し、文章に不要な単語を省く。
東芝は2017年に音声を字幕に転換する技術の実証テストを開始。すでに発言内容を把握して転換できるようになり、実用化も検討するという。
「中国網日本語版(チャイナネット)」 2019年3月15日