【ちょいレポ!】ビックリするほど正確に変換! 話した言葉がリアルタイムに文字になる「LiveTalk」を使ってみた

こんにちは、FUJITSU JOURNAL編集部です。

最近、私たちの日常生活にも浸透してきた音声認識。精度が向上し、マイクに向かって言葉を発するだけで調べたいことがわかったり、とても便利ですよね。
今回ご紹介するは、マイクを通して発言したことを音声認識しリアルタイムにテキスト化してくれる「FUJITSU Software LiveTalk(ライブトーク)」。

聴覚障がい者の会議参加を支援するために生み出された技術です。
2015年度グッドデザイン賞の「グッドデザイン・ベスト100」にも選出されたこの「LiveTalk」(注)を、FUJITSU JOURNAL編集部が実際に体験してみました!

驚きの文字変換スピードと正確さ。 どんな言葉もしっかりと認識

必要なものはLiveTalkアプリと音声認識ソフトがインストールされたごくごく普通のノートPCと小型のハンドマイク、そして無線LANのみ。さっそくマイクを手に持ち、話してみると・・・

発言者ごとに文字の背景色が異なるので、誰が発言しているのか一目でわかりやすい

発言からほとんどタイムラグがなく、話した言葉がリアルタイムにどんどんモニターに表示されていきます。話すスピードや話し方は普段通りでほとんど問題ありませんが、アナウンサーのように一つひとつの言葉を丁寧に話してみると、より一層正確にテキスト化されます。
驚いたのが、「つくる」⇒「創る」などの同音異義語も会話の内容に合った適切な漢字に変換されたことです。
それぞれのマイクを通して二人で同時に発言した場合も、変換の精度やスピードが落ちることなくきちんと一人ひとりの発言が正確に文字として画面に表示されていきます。
しかもモニターに表示される文字は発言者ごとにきちんと色分けされて見えるので、今誰が何を話しているのかがすぐに理解することができます。これなら会議のスピードでも問題なく使えそうですね!

使い続ければ、発言者のクセを覚えて精度がアップするスグレモノ

今回、実際に体験してみて最も驚いたのが文字変換の正確さです。短い単語や早口言葉、難しい文章など色々試してみましたが、基本的には大きな変換ミスはありませんでした。

早口言葉もきちんと認識、表示された

はじめのうちは多少の誤変換もありましたが、使っていくうちにだんだんと正確に変換されるようになっていきました。
LiveTalkには発言者のクセを学習する機能が備わっているため、長く使えば使うほど、どんどん変換の精度が上がっていきます。
しかも、前後の文脈を読んで発言内容をテキスト化してくれるため、接続詞や同音多義語までほぼ正確に認識されるのです。

また、万が一変換ミスがあっても、すぐにパソコンやタブレットからディスプレイに表示された文字を修正できるので、聴覚に障がいのある方も健聴者と同じタイミングで会議の内容を理解することができると思います。

まとめ

これまで聴覚障がい者が会議に参加するとき、筆記通訳などでは議論の内容をリアルタイムに把握することが難しく、適切なタイミングで発言機会が得られないという課題があったそうです。
今回実際に「LiveTalk」を体験してみて、これなら聴覚障がい者の方も安心して会議に参加でき、より円滑なコミュニケーションができるようになると実感できました。
また、既に富士通グループでは、聴覚に障がいを持つ従業員が、チームメンバーとの日々のコミュニケーションはもちろん、ワークショップや新人教育、チームでの懇親会など様々な場で「LiveTalk」を利用し始めています。

モニターに表示された発言テキストは、もちろんその場で保存が可能なので、議事録作成や取材時にも活躍してくれそうです。私たち編集部のような記事を作る人間にとっても非常に便利で、一般商品化が待ち遠しい技術。皆さんなら、どんな使い方をされますか?

(注)富士通株式会社 総合デザインセンターがプロトタイプを開発し、富士通ソーシアルサイエンスラボラトリが製品化
声認識技術には、株式会社アドバンスト・メディアの音声認識ソ フトウェア「AmiVoice® SP2」を使用