NTT技術ジャーナル記事

   

「NTT技術ジャーナル」編集部が注目した
最新トピックや特集インタビュー記事などをご覧いただけます。

PDFダウンロード

主役登場

デジタルトランスフォーメーションの未来を切り拓く先進的メディア処理技術 ―― コンタクトセンタAI

機械読解のState of the Artをめざして

西田 京介

NTTメディアインテリジェンス研究所
特別研究員

私たちが今取り組んでいる機械読解(テキストを知識源とした自然言語理解に基づく質問応答)は、言語処理分野における流行のテーマで、過去に類をみないスピードで研究が進んでいます。最近ではコンペティション形式で取り組まれる研究課題(データセット)が多く、オンラインでリアルタイムに順位を確認可能なリーダーボード上で、世界中の企業・大学が機械読解モデルの質問応答精度を競っています。参加者の多いコンペティションでは、最高の性能(State of the Art)を達成してリーダーボードのトップに立てたとしても数日で他の研究者に抜かれてしまうことがあり、いわゆるレッドオーシャンに分類される研究領域となります。
レッドオーシャンと知りつつも機械読解に取り組むことにしたのは、機械読解の論文を初めて読んだとき「こんなことができるようになったのか!」と感動し、これを実用化できれば大きく世界が変わるだろう、自分でも取り組んでみたい、という気持ちを強く持ったためです。しかし、いざ機械読解の研究を開始してみると、私の予想を超えて競争は激化しました。リーダーボードが物凄い勢いで更新されるのを見ながら、この世界のスピードに追いつくことができるのか? と不安になりましたし、自分の考えていたアイデアを先にやられてしまうこともありました。その一方で、流行に真正面から取り組むことの楽しさと重要さも知りました。最新の知見が日々発表されるテーマを学ぶことは刺激的ですし、社会に必要とされている技術であるからこそ機械読解が世界中で取り組まれている研究テーマになっていることを確信できました。
激しい競争の中1人で戦うのは難しいと感じ、周囲のメンバに協力してもらいチームとしての研究スタイルを大きく変えました。個々人が関連の少ないテーマに取り組むのを止め、「全員が機械読解に近いテーマに取り組んで情報を共有しつつ、それぞれが個別にインパクトのある研究を行う」という方針に変更しました。毎週読んだ論文の内容をお互いに共有したり、プログラミング言語や深層学習のフレームワークもできる限り統一して知見やテクニックを共有しています。また、社外からも情報が入るように、勉強会への参加やTwitterでの情報収集にも力を入れています。こうした「チーム戦」「情報戦」は優秀なチームメンバに恵まれたことで期待以上の成果を上げ、この半年間で、まだ公開になっていない物も含めて、私たちの技術が5つのデータセット・7つのタスクで世界一の精度を達成しました。私たちもやればできる、世界と闘える技術力があることを十分に示せたと思います。
機械読解の研究と実用化にはまだギャップがあります。世界一の技術でもすべてのテキストを理解して質問応答することはできないのが現状で、たくさんの課題が残っています。今後もチームとしてコンペティションなどで技術を磨きつつ、着実に実用化を果たしてNTTのAI(人工知能)事業へ貢献できるよう取り組んでいきます。