挑戦する研究者たち
研究者は「やりたいことドリブンで何でも実行」。好奇心優先で、まずは何でもやってみる
スマートフォン上の音声エージェントやパーソナルロボットなどの対話ができるシステムの増加やディープラーニングの適用により、ここ数年で大きな進化を遂げた対話システム。人間とコンピュータが自然な対話インタラクションを行うための原理の解明をとおして、人間と分かり合い、知的協働を行う対話システムの実現をめざす東中竜一郎客員上席特別研究員、名古屋大学大学院情報学研究科教授に研究の進捗と研究者としての姿勢を伺いました。
東中 竜一郎
客員上席特別研究員
NTT人間情報研究所
NTTコミュニケーション科学基礎研究所
共通基盤を追究し、人間とコンピュータが理解し合える世界を実現したい
約3年半ぶりのご登場ですね。現在、手掛けている研究から教えていただけますでしょうか。
前回、2018年はしゃべってコンシェルや自然対話システムを中心にお話しさせていただきましたが、この間に研究はさらに発展、拡張しています。前回と比較して、自然言語処理分野はディープラーニングによって急速に性能が向上し、できることがずいぶん増えました。例えば、自然言語処理モデルの1つであるBERT(Bidirectional Encoder Representations from Transformers)の登場は、ある種のパラダイムシフトを起こして言語処理の能力が飛躍的に向上しました。この数年間、こうしたディープラーニングに基づく自然言語処理技術の適用を進めています。
2019年には、「ロボットは東大に入れるか」プロジェクトにおいて、BERTに似た技術を用い、当時の最新技術によるAI(人工知能)が大学入試センター試験の英語筆記科目に挑戦した結果、185点(偏差値64.1)を獲得したことを報告しました。NTTからもプレスリリースを配信しました。
最近の成果「なりきりAIアマデウス紅莉栖」(図1)は、以前紹介した「あやせAI」と比べて対話における回答の精度が非常に上がっています。なりきりAIは、ユーザやファンに当該キャラクターの話し方等を記述してもらったものを学習データとしてキャラクターをつくるという非常にユニークな手法を取っています。約4万5000件のデータをいただき、ディープラーニングと組み合わせることで、とても精度の高いキャラクターをつくることができました。そして、2021年7月にTwitterのダイレクトメッセージ機能を使ってファンの方々とシステムとが対話できる機会を設けました。3日間という期間限定ではありましたが非常に好評で、中には会話を数百回もしてくださった方もいて、アンケートでは5段階中4.59の高い評価を得られました。このなりきりAIに関する論文は言語処理のトップ会議でも採録されたことから、学術的にも意義のある到達点になったと自負しています。ただ、キャラクターにそぐわない反応がみられたこともあり、この課題に対してユーザによるフィードバックを分析して改善をしている最中です。
コンピュータと人間の会話が進化しているのですね。会話を相互に理解し合えるレベルまで到達しているのでしょうか。
残念ながら、まだそのレベルにはありません。コンピュータと人間が理解し合ってコミュニケーションを図るには、共通基盤(common ground)を構築できるシステムが必要です。共通基盤とは、対話している者どうしが理解し合っている内容のことです。共通基盤が構築できるようになれば、理解を積み上げていくことができるため、システムと人間のコミュニケーションは飛躍的に進化し、対話システムと人間による協働が可能になると思います。共通基盤は10年、20年前の教科書にも載っている古くからある概念ですが、工学的に実現したり、システムに搭載したりすることはできていません。しかし、共通基盤を構築できなければ対話システムは先細りし、次世代のシステムは成り立たないと考え、これをテーマに追究していくことにしました。
共通基盤は心の中にあるものなので目に見えません。これが、共通基盤の研究を難しくしていました。そこで、共通基盤が構築されるプロセスを見える形にしようと、2名の作業者がそれぞれ自分の図形配置画面のみを見て、互いにテキストチャットにより対話をしながら図形配置を共同で決定していく、共同図形配置課題を設定し、この課題を行う人間どうしの対話データを大規模に収録しました(1)。この際、作業中の図形配置を常に記録し、図形配置間距離(任意の2図形間で定義されるベクトルの差の距離の総和)を測ることで共通基盤を定量化しました。すなわち、対話の各時点での共通基盤の構築度合いを可視化できるようにしたのです。このデータを分析することで、共通基盤の構築過程がいくつかのクラスタに分類されることが分かりました。この研究は言語処理学会年次大会にて発表し優秀賞を受賞しました(図2)。加えて、このデータを分析する過程で、共通基盤の構築には「名づけ」が重要な役割を果たすことも分かってきました。人間は、図形に名前を付けて、その認識を相手とすり合わせていくことで、共通基盤を構築しているようです(2)。
このほか、モダリティ(テキスト、音声、映像などの情報のチャネル)や社会的関係性が共通基盤の構築過程に与える影響を明らかにするために、テキストチャットで行われた共同図形配置課題の研究を拡張し、新たに音声や映像を用いたコーパス(自然言語等のデータを大規模に集積したもの)を構築・分析しています。その結果、音声のみの場合と音声および映像の場合を比較すると、映像が存在するほうが共通基盤構築を行いやすいことが分かりました。また、初対面条件よりも知り合い条件のほうが共通基盤構築を行いやすいことが分かりました。これは当たり前の結果だと思うかもしれません。ただ、条件によって共通基盤構築の過程にはそれぞれ違いがあり、この違いが重要な知見につながっていくのではないかと思っています。今後はモダリティ・社会的関係性が共通基盤構築に与える影響を分析していくことで、コンピュータと人間の間でスムーズな共通基盤構築ができる対話ロボットをつくりたいと考えています。
共通基盤の構築については、共通図形配置課題以外にも、タングラム(正方形を分割したピースを用いるパズル)の形について、対話をしながら名前を付けていくタングラム命名課題などに取り組んでおり、さまざまな角度から共通基盤にアプローチしていきたいと考えています。
先駆的存在として一気呵成に領域を広げていきたい
共通基盤の研究は盛んに行われているのでしょうか。
言語哲学的分野において、人間どうしがいかにして共通基盤を実現しているかを検討している研究者はいますが、工学的なアプローチは少なく、世界的にみればこの領域の研究者は数えるほどしかいません。私もアンテナを張って文献を見ているのですが、現状の関連研究はそれほど多くはありません。
そこで、AIと人間が共同作業できる未来に向けて、共通基盤構築の研究を、信念をもって一気呵成に進めています。共同研究も推進しており、例えば、先述のタングラム命名課題は静岡大学との共同研究です。認知科学を専門とする竹内勇剛先生と共同で進めています。また、先ほど紹介した「名づけ」の研究は、電気通信大学の南泰浩先生と一緒に手掛けています。南先生は音声処理のほかに、幼児の言語発達を研究されていますから、工学と言語発達を組み合わせて追究することができています。さらに、モダリティと社会的関係性については、慶應義塾大学との共同研究ですが、ソーシャル・ロボティクスの専門家である高汐一紀先生とともに挑んでいます。このように、さまざまな専門領域との掛け算をしながら研究を広げています。
共同研究も盛んに行うなど学術的にも社会的にも意義のある活動を展開しているのですね。
「これまで避けてきたところ」をしっかりやっていることに学術的意義があると思っています。対話システムに関する研究をする際、文字として見える、現象として表れている交わされる言葉のやり取りを分析するのは比較的簡単です。しかし、相手がその言葉を発するときに何を考えているかを分析するのは非常に難しく、評価もしづらいのです。この部分を可視化して研究の俎上に載せたいと取り組んだのが共同図形配置課題の研究です。研究も進展しており、商品の配置等をAIと一緒に考え、決めていけるようなシステムが実現する日は近いという手ごたえがあります。
現在、対話システムの研究領域はある種「踊り場」にあると思います。ディープラーニングにできることはまだ限定されていて、AIと会話ができるとはいってもそれはまだ短時間です。昨日のコミュニケーションを忘れてしまうようなシステムでは、AIとの知的協働は成立しません。長期的なコミュニケーションにより、その人のライフタイムにずっと寄り添うことができるように、AIを私たち人間にとってのパートナーに値する存在まで押し上げたいですね。
私は共通基盤を追究することで10年、20年後の人間社会をより良いものにすることができると考えています。拙著『AIの雑談力』(角川新書)でも語っていますが、人間とコンピュータが双方向の関係性を築いて、お互いの理解を高め合える世界をつくっていけたらと思います。
専門領域を超えることを厭わない
今の時代の研究者に求められる資質について教えてください。
私がNTTに入社した2001年と比較して、今はクラウドソーシング等を利用して比較的安価に多くの実験ができるようになりました。研究者は恵まれた環境にいると思います。一方で、GAFA等の膨大な資源とヒューマンリソースを抱えている会社がどんどんと研究開発を進めて、新しいモノを世に送り出しています。研究環境が良くなることで、研究開発のテンポが速くなると同時に競争も激化しています。
こうした時代を生き抜くために、研究者には常に新しいことに挑むことが求められます。さらには社会へのインパクトや貢献も常に視野に入れて研究を進めることが必要です。そのために、自らの専門領域を越えることを厭わないことが大切だと考えています。他の領域の知見を持って臨まないと解けない問題も多くなっていますし、もはや「言語処理一筋」等と専門領域のみにこだわる時代ではありません。さらに多角的かつ、広い視野をも求められているでしょう。システムを構築する際には法整備なども念頭に置き、社会やユーザ等を複合的に検討しなければ、素晴らしい研究成果としてシステムを開発しても、それを普及させることはできません。
実は、対話システムは入社当時の私が望んでいたテーマではありません。言葉が好きでしたから翻訳を追究したかったのですが、配属された先のテーマが対話で、やってみたら面白くて20年も経ってしまいました。こんな経験から何事もやってみようの精神で取り組んでいます。基本的に、依頼は断らないスタンスです。
若い研究者の皆さんに一言お願いします。
研究者は「やりたいことドリブンで何でも実行すること」だと思っています。上席特別研究員は、やりたいことをしっかりと持って取り組んでいる姿を見せることも役割の1つで、重要だと思っています。
新しいものに興味を持つこと、そして、自らの専門領域を超え多角的で広い視野を持つこと、食わず嫌いはせずに何事もやってみることが大事です。まずは、好奇心を優先して何でもやってみることから始めてみてはいかがでしょうか。若いころは1つの失敗ですべてが終わったと思ってしまうことがあります。私もNTT入社直後は、3年くらいでトップ会議に論文を通さなければ追い出されるのではないかという意識がとても強くありました。幸いにして指導者にも恵まれて何とかトップ会議に論文を通すことができましたが、それでも失敗はとても怖かったし、研究者失格の烙印を押されるかもしれないと思いました。
しかし、失敗を糧に次の展開へ進むこともできるので、安心して失敗してほしいと思います。勤続年数を分母、失敗を分子と考えれば、若いうちは分母が小さいですから、失敗のダメージはつらいかもしれませんが、分母が大きくなるにつれて失敗の受け止め方も変わってきます。
また、会社組織に属している以上、会社の方針や上司の指示に従わなくてはならないときもありますが、任務に注力するために自分のやりたいことを捨て去るのではなく、同じようなテーマを持つ研究者とコネクションを持つ、仲間とつながりを持つのは重要です。私の場合は学会のコミュニティにおけるつながりが、おおいに助けになりました。若いころから組織だけではなく、社外とも関係を築いていくとよいのではないでしょうか。
■参考文献
(1) 光田・東中・大賀・杵渕:“共同図形配置課題における対話の共通基盤構築過程の分析,”言語処理学会第27回年次大会発表論文集, pp.1697-1701, 2021.
(2) 齋藤・光田・東中・南:“対話での共通基盤構築過程における名付けの分析,”言語処理学会第28回年次大会発表論文集, pp.38-42, 2022.