バックナンバー一覧 >> 2017 Vol.29 No.9 >> 特集 |
人間とAI(人工知能)との豊かな関係構築に向けて、現状をできるだけ正確に認識し、将来への投資が求められている。本特集では、NTTコミュニケーション科学基礎研究所でのAI研究の最新動向を紹介する。 |
AI×IoT×BigData時代における基礎研究 ──科学と工学の融合による新しい研究のデザイン
人間とAI(人工知能)との豊かな関係構築に向けて、現状を正確に認識し、将来への適切な投資をすることが求められています。基礎技術の研究開発を推進するという立場から、AI×IoT×BigData時代をどのように読んでいるかについて述べます。 |
あなた専用のお手本映像で上達支援
近年の深層学習の発展は著しく、少し前までは想像もつかなかったことが実現されつつあります。メディア生成はその代表例であり、世界中で驚くような研究成果が報告され始めています。本稿では、深層学習によるメディア生成の研究動向、およびメディア生成のアプリケーションの中で着目している「上達支援のためのメディア生成」を題材に、従来技術の課題とNTTコミュニケーション科学基礎研究所の取り組みについて紹介します。 |
厳密被覆問題の高速な全解列挙法
本稿では、NTTと北海道大学で開発した、厳密被覆問題と呼ばれる問題のすべての解を高速に見つけることができるアルゴリズムを紹介します。マンションの間取り決め、電子回路の部品の配置決め、ポリオミノパズルは厳密被覆問題として定式化して解くことができます。本方法は、既存法よりも最大1万倍高速にすべての答えを発見するだけでなく、見つけたすべての解を圧縮して記憶しておき、条件に応じて取り出すことができるので、良い解を効率的に探すことが可能になります。 |
単語埋め込みベクトルの圧縮法
単語間の意味的な関係をコンピュータ上で上手に扱う方法論として「単語埋め込みベクトル」と呼ばれる技術が注目されています。単語埋め込みベクトルを用いることで、例えば、単語間の意味的な関係を類推する演算に関して、より人間の感覚に近い結果が得られるようになりました。本稿では、単語埋め込みベクトル利用時の利便性を高めるために、意味関係に関する演算の精度を保ったまま必要記憶容量を大幅に削減する方法を紹介します。 |
裸眼で2D映像がクリアに見える3D映像生成技術
NTTコミュニケーション科学基礎研究所は、3Dメガネをかけない視聴者には2D映像がクリアに見え、メガネをかけた視聴者には自然な3D映像が見えるというステレオ映像の生成技術を開発しました。本技術は既存の3D表示装置をそのまま用いますが、メガネなしで見ても画質が全く低下しません。この技術により、1つの表示コンテンツに対して、その場にいる視聴者1人ひとりが楽しみ方を自由に選択できるという「人にやさしい3D表示」が実現できます。 |
コンテキスト適応型ニューラルネットワークを用いた音声インタフェースのパーソナライズ化
近年、音声インタフェースの普及が急速に進んでいますが、音声認識結果の詳細を分析すると、必ずしもすべての話者に対して同程度の音声認識性能が得られているわけではなく、うまく認識ができる話者、できない話者がいるのが現実です。この問題に対応するため、NTTコミュニケーション科学基礎研究所ではニューラルネットワークの新たな構造に関する研究を行い、コンテキスト適応型ニューラルネットワークを開発しました。本稿では、自動音声認識システムの中で用いられる音のモデル(音響モデル)の話者適応に関する最新研究成果を紹介します。 |
□主役登場 |
|