Focus on the News
NTTグループのAI技術を自動車のAIエージェントに展開
NTTが開発した「インテリジェントマイク」は、現在国内外において、約800万台の自動車に展開しています。このたび、NTTの「インテリジェントマイク」「音声認識」「音声合成」技術と、NTTドコモが開発した「行動先読み」技術を、トヨタ自動車㈱が実施するコンセプトカー「LQ」の試乗会「トヨタYUIプロジェクトTOURS 2020」の車載AIエージェントに展開します。
「LQ」の試乗会「トヨタYUIプロジェクトTOURS 2020」のAIエージェントに技術提供
NTTの「インテリジェントマイク」「音声認識」「音声合成」、NTTドコモの「行動先読み」を、トヨタのお客さま1人ひとりに寄り添い、特別な移動体験を提供するために開発した「LQ」(図)のAIエージェント「YUI」に提供します。
会話を中心とした「YUI」とのコミュニケーションに「インテリジェントマイク」「音声認識」「音声合成」技術、事前に公開されるスマートフォンアプリからお客さま1人ひとりの趣味・嗜好を「YUI」に学習させることに「行動先読み」技術が使用されます。
なお、「LQ」の試乗拠点にはNTTドコモが5G(第5世代移動通信システム)基地局を設置し、高速かつ安定した通信環境を提供します。
図 コンセプトカー「LQ」
(画像提供:トヨタ自動車株式会社2019年10月11日 ニュースリリース)
技術の特徴
「インテリジェントマイク」「音声認識」「音声合成」は、NTTが長年培ってきたAI技術を結集し、自動車内における背景音を抑えながら、乗員の音声だけを抜き出し、深層学習を活用したDNN(Deep Neural Network)技術を駆使して、高い音声認識率および人の声に遜色ない合成音声を提供することができます。
「行動先読み」は、NTTグループのAI技術ブランド「corevo®」の1つで、NTTドコモが開発した「先読みエンジン」を活用し、日常の行動データからそのユーザの生活習慣や趣味・嗜好を学習することで行動を予測し、ユーザに合った情報を適切なタイミングで提供することを可能にします。
今後の予定
NTT、NTTドコモは、さまざまなパートナーとのコラボレーションを通じ、コネクティッドカーや自動運転車など将来の自動車がより豊かな体験を提供できるような技術開発に取り組んでいきます。
問い合わせ先
NTT広報室
TEL 03-5205-5550
E-mail ntt-cnr-ml@hco.ntt.co.jp
URL https://www.ntt.co.jp/news2019/1911/191120a.html
NTTドコモ 第二法人営業部 第五営業
TEL 03-5156-2588
E-mail docomo-5houjin-pr-ml@nttdocomo.com
URL https://www.nttdocomo.co.jp/binary/pdf/info/news_release/topics_191120_00.pdf
担当者紹介
お客さまのことを深く理解し、行動を支援する先読みエンジンの研究開発
山田 直治
NTTドコモ R&Dイノベーション本部 サービスイノベーション部 第2サービス開発
担当課長
私たちは、スマートフォンから得られる行動データを通して、お客さまのことを深く理解し、お客さまにとって必要な情報やサービスを最適なタイミングで提供する、先読みエンジンの研究開発に取り組んでいます。先読みエンジンは、NTTドコモのAIエージェントサービス「my daiz」や、自動車向けの音声エージェントサービス「AIインフォテイメントサービス」で利用されています。
今回のプロジェクトでは、トヨタ自動車様のAIエージェント「YUI」が、先読みエンジンを活用することで、お客さまのことを少しずつ理解し、それに応じてお客さまを支援できる内容を増やしていくことで、YUIが成長していく様子を体感いただきたいと考えています。
近年、スマートフォンが高機能化し、スマートフォンでできることが増える一方で、スマートフォンを十分に使いこなせないお客さまも存在します。また、たとえスマートフォンを使いこなせたとしても、スマートフォンの操作や、「スマートフォンで調べる」という行為自体が面倒に感じるときもあります。それに対して、先読みエンジンを搭載したAIエージェントが、お客さまの今の状況や気分、さらには潜在的な欲求を理解し、それに応じてお客さまが求める情報やサービスを最適なタイミングで提供することで、お客さまにとってなくてはならないパートナーとなり、今よりも、便利で、新たな発見に満ちた、豊かな生活を過ごせる世界をめざしています。
研究者紹介
人とコンピュータのコミュニケーションに向けた研究開発
小林 和則
NTTメディアインテリジェンス研究所
主幹研究員
私たちは、長年にわたり音声・音響の研究開発に取り組んできました。近年は、電話やTV会議といった人と人とのコミュニケーションから、人とコンピュータのコミュニケーションへとテーマをシフトし、人と同レベルのコミュニケーションが可能なAIの実現に向け研究開発を進めています。今回、この研究成果である「インテリジェントマイク」「音声認識」「音声合成」を、トヨタYUIプロジェクトのAIエージェントのキーコンポーネントとして提供しました。
「インテリジェントマイク」は、走行音や音楽など音声以外の音を除去し、AIが理解しやすいように音声を抽出します。また、話している人が、どの座席に座っているかを自動判別します。これにより、走行音や音楽のある自動車内においても正確な音声認識と座席に応じた適切な応答を実現します。「音声認識」は大語彙の辞書を用いても素早く正確に音声を文章へ変換することが可能です。これにより、コマンドではない自然に話した音声を瞬時に文章へと変換し、テンポのよい対話を実現します。「音声合成」は肉声に近い音声を合成することができ、感情豊かなコミュニケーションを実現します。
今後は、人の感情や意図の理解や、音声以外も含むあらゆる音の識別や周囲環境の理解、人の温かさを感じられるようなコミュニケーションなど、人とコンピュータのいい関係を実現する研究開発をさらに進めていきます。