バックナンバー一覧 >> 2009 Vol.21 No.5 >> 特集 |
NTTコミュニケーション科学基礎研究所の最新技術を融合する研究領域として、同研究所が2008年度に開催したイベント「オープンハウス×未来想論2008」で紹介した2つの融合研究、世界メディアブラウザとマルチモーダル会話シーン分析について紹介する。 |
情報通信技術カンブリア紀──技術融合が拓く可能性
|
世界メディアブラウザ
世界中の音・映像コンテンツを日本語で視聴するシステム「世界メディアブラウザ」は、高度な音声言語処理技術によって外国語コンテンツの日本語による検索や日本語字幕付き再生を可能にします。本稿では、これを実現する私たちの世界最先端技術とマサチューセッツ工科大学の講義ビデオを用いたプロトタイプシステムを紹介します。 |
会話シーン分析のための音声映像技術
複数の人物が対面で会話を交わす場面を対象として、その会話の状況、例えば、「いつ誰が誰に向かって話しているか?」「誰が注目を集めているか?」といったことを自動的に分析するマルチモーダル会話シーン分析システム、および本システムで使われている画像技術、音声技術を紹介します。 |
□主役登場 |
|