バックナンバー一覧 >> 2018 Vol.30 No.9 >> 特集 |
NTTコミュニケーション科学基礎研究所は、人と人、あるいはコンピュータと人の間の「こころまで伝わる」コミュニケーションの実現をめざして、人間と情報の本質に迫る基礎理論の構築と社会に変革をもたらすコア技術の創出に取り組んでいる。本特集では、一段と深化するコミュニケーション科学の取り組みの一端を紹介する。 |
新たな次元へとシフトする――さらに深化するコミュニケーション科学の取り組み
NTTコミュニケーション科学基礎研究所は、人と人、あるいはコンピュータと人の間の「こころまで伝わる」コミュニケーションの実現をめざして、人間と情報の本質に迫る基礎理論の構築と社会に変革をもたらすコア技術の創出に取り組んでいます。本稿では、音声音響処理、対話処理、人間情報科学、スポーツ脳科学、機械学習と最適化など、一段と深化するコミュニケーション科学の取り組みの一端を紹介します。 |
SpeakerBeam: 聞きたい人の声に耳を傾けるコンピュータ――深層学習に基づく音声の選択的聴取
パーティ会場などの騒がしい環境の中でも、人は、聞きたい人(目的話者)の声に注目して、その声を聞き取ること(選択的聴取)ができます。一方、従来のコンピュータでも、話者の位置が分かっていれば、その位置から来る音だけを抽出することはできました。これに対し、本稿では、目的話者の声の特徴だけが分かっているときに、深層学習技術を用いて、その特徴に合致する声を抽出する新しい技術SpeakerBeamを紹介します。 |
二分決定グラフを用いたネットワーク信頼性最適化法
通信ネットワークの故障に対する強さを定量化する尺度の1つとして、ネットワーク信頼性が知られています。ネットワーク信頼性の値が大きいほど故障に強い通信ネットワークということになります。しかし、ネットワーク信頼性が最大となる通信ネットワークの形を見つけるためには膨大な量の計算が必要なため、これまでは非常に小規模なネットワークに対してしか最適な答えを見つけることができていませんでした。本稿では計算機を用いて故障に強い通信ネットワークの形を自動的に見つけ出す方法を紹介します。 |
「浮像」(うくぞう)――影を利用して印刷物に見かけの奥行きを与える光投影技術
「浮像(うくぞう)」は、2次元平面に描かれた対象に対して、その対象の影のように見える影パターンをビデオプロジェクタから投影することで、あたかもその対象が浮かび上がって見えるように錯覚させることのできる光投影技術です。ただ浮かび上がらせるだけではなく、浮かび上がって見える対象の見た目の質感を操作することもできます。広告や視覚芸術における新たな奥行き表現手法としての利用が期待されます。 |
音から画像認識結果を予測するクロスメディア情景分析技術
人間は、聞こえてくる音から周囲の状況を理解し、情景を視覚的にイメージすることができます。コンピュータにも同様の能力を与えることはできるのでしょうか。本稿では、複数のマイクにより収録した音を頼りに、まるでカメラで画像認識したかのように、そこにある物体の種類や位置、形状を推定する「クロスメディア情景分析技術」を紹介します。 |
ウェルビーイングを測る、知る、育む
情報通信技術の発展は、私たちの日常生活に効率性・利便性をもたらしましたが、その一方でユーザの心の状態への負の影響も指摘されています。現在、「テクノロジによって、どのように心の豊かさをサポートできるのか」という情報通信技術による「ウェルビーイングの設計論」は大きな注目を集めています。本稿では、テクノロジ元来の目的である人間のウェルビーイング実現に、医療活動や啓蒙活動としてではなく、研究として取り組む際に何が必要なのか? どのように計測すれば良いのか? 実社会で何の役に立つのか? といった疑問に答えます。 |