バックナンバー一覧 >> 2013 Vol.25 No.3 >> 特集 |
近年知的な音声言語インタフェースを利用したサービスが注目されている。本特集ではNTTメディアインテリジェンス研究所で取り組んでいるさまざまなサービスを支える音声言語インタフェース技術の概要、および各要素技術について紹介する。 |
知的な音声言語インタフェース技術に向けた取り組み
近年スマートフォンに対して音声で知りたい情報を検索したり、音声で質問することにより回答を合成音声などでも提供するサービスが普及するなど、音声言語インタフェースがますます重要な役割を担うようになりました。本稿では、さまざまなサービスを支える知的な音声言語インタフェース技術の実現に向けたNTTメディアインテリジェンス研究所の取り組みを紹介します。 |
サービスや利用環境の変化に柔軟に対応する音声認識技術
音声認識技術は、人の声を機械が聞き取る技術です。音声認識は、音声言語インタフェースの入り口にあたる技術で、インタフェース全体の性能を左右するため、常に高い精度で認識することが重要ですが、現在の音声認識技術はサービスの種類や利用環境によっては認識精度が大きく低下する場合があります。本稿では、その課題を克服するための最新の取り組みを紹介します。 |
知的な応答を実現するためのテキストからの知識獲得技術
本稿では、膨大なWebテキストの中から有益な知識を獲得するための言語解析技術について解説します。はじめにコンピュータが扱う知識のキーとなる固有表現獲得技術について紹介した後、その応用である固有表現間の関係抽出について紹介します。 |
幅広い質問にピンポイントで答える質問応答技術
ユーザのさまざまな質問にピンポイントで回答する質問応答技術は、音声インタフェースをより知的にすると期待されています。本稿では、質問応答技術の概要とNTTにおける取り組みについて解説します。 |
多様性豊かな音声合成技術
私たちは、これまでの電話音声応答のような特定の用途向けの、話者や表現が限定された合成音声ではなく、さまざまな用途に利用できる、多様で表現豊かな合成音声を実現するユーザデザイン音声合成技術を開発しています。本稿では、ある人の極短時間の音声からその人に似た声での音声を合成する技術、多様な口調の音声で表現が可能な技術、騒音下でも聞き取れる明瞭な音声を生成する技術、そして音声合成の将来像について紹介します。 |
□主役登場 |
|