身に付けて利用可能! 自分と相手の音声を操作せずに自動で翻訳できる「音声翻訳端末」

増え続ける外国人患者とのコミュニケーションの壁

最近、街を歩いていると、沢山の外国人観光客に出会います。日本政府観光局の発表によると、2017年6月の訪日外客数は234 万 7000人。前年同月比 の18.2%も増加しています。

異国を訪れるとどうしても乗り越えなければならないのが「言語の壁」。ちょっと前のSF映画に出てきたような、異なる言語による会話を自動で翻訳する夢の装置を、ICTの力で実現できないものでしょうか。

ハンズフリーでスムーズな応対が可能に

このたび富士通研究所では、完全にハンズフリーな状態での音声翻訳を可能とした「IDカード型ハンズフリー音声翻訳端末」を開発しました。胸元に装着すると、話している人と会話の切れ目を自動的に認識し、会話の内容を翻訳します。特に今回の音声翻訳端末は、外国人とのコミュニケーションの必要性が急速に高まっている医療現場にフォーカスしました。

医療の現場では医師や看護士などの医療関係者が両手を使って診察や看護等をします。今回の音声翻訳端末は小型軽量(注1)で、装着する人の負担になりません。もちろん、移動しながらでも使うことができます。

(注1)縦75mm×横95mm×厚7mm。65g。

筐体の構造設計やデザインにおいては、富士通コネクテッドテクノロジーズ株式会社が携帯電話やスマートフォンの開発でこれまで培ってきた小型化・軽量化の技術を基に、医療現場の使い勝手を考慮した音道形状のデザイン最適化と小型化を実現しました。形状は、医療関係者の両手が自由に使えるネームプレート型で直感的に操作できるキーアイコン・形状・印字とし、医療関係者と患者の両方にとってやさしい印象で安心感を与えるラウンドフォルムとしました。

開発したIDカード型ハンズフリー音声翻訳端末の外観

雑音が多い医療現場でも発話検出精度95%

コンパクトで軽量な本体を実現するため、この端末では様々な工夫をしています。その一つが「無指向性マイク」の採用です。

音声翻訳端末のように発話者を特定したい場合、通常は発話された音声をしっかりと拾えるように、指向性を持ったマイクを使います。しかし、指向性マイクは小型化が難しく、IDカード型端末に搭載する際の大きなネックとなっていました。

この課題に対し、富士通研究所は発話者の音声がマイクに伝わる際の通り道である“音道(おんどう)”に注目。音道をL字型の形状とすることで、翻訳すべき発話者の音声とそれ以外の音を区別することに成功しました。

また、この端末では患者の声を拾うマイクに高感度の素子を使い、患者の音声レベルを大きくしています。これと雑音抑圧技術を組み合わせることにより、空調機器や検査機器などが発する雑音が多い医療の現場でも、発話の検出精度95%という高精度の発話検出を可能としています。

もう一つ、実際の翻訳をサーバ上で行っているのも特長です(注2)。現時点では英語と中国語の2カ国語に対応していますが、サーバ側の機能を拡張することで、さらなる多言語への対応も可能です。端末には変更を一切加えずに、多言語対応が簡単にできるため、医療分野以外でも利用可能なポテンシャルを備えています。

(注2)国立研究開発法人情報通信研究機構(NICT)の多言語音声翻訳技術を使用。

多言語の翻訳により、“おもてなし”の実現へ

今回ご紹介した音声翻訳は、人間が端末を身に付け、クラウド上の翻訳プログラムと連携することも可能です。このため、用途に応じたプログラムをクラウド上に用意すれば、あらゆる目的に対応できることになります。

特に、2020年の東京大会では、各種のインフォメーションや“おもてなし”提供にこの音声翻訳端末は適していると言えるでしょう。今後どのように進化をするのか、その機能と性能にご期待ください。