NTT技術ジャーナル記事

   

「NTT技術ジャーナル」編集部が注目した
最新トピックや特集インタビュー記事などをご覧いただけます。

PDFダウンロード

明日のトップランナー

AIと人のインタラクションが新たな世界へ導く「Human-AI協調基盤の構築」

NTTが独自開発したLLM(Large Language Model)「tsuzumi」をはじめ、チャットボットや画像生成などさまざまなサービスが提供されているAI(人工知能)分野。日々目まぐるしく状況が変化する中で、NTTがめざしている世界の1つが、「AIが自律成長しながら人間と協調する世界」です。従来のAI活動とは大きく異なるこの領域について、中辻真特別研究員は「より創造的な生産活動が可能になる」と提唱します。今回は、現在取り組まれている「生成型AIエージェントによるHuman-AI協調基盤構築」について伺いました。

中辻 真
NTT人間情報研究所 特別研究員

PROFILE

2003年京都大学大学院情報学研究科システム科学専攻修了。同年、NTT入社。2010年、京都大学大学院情報学研究科社会情報学専攻 博士課程修了。2013年レンセラー工科大学研究員。2015年NTTレゾナント。2023年よりNTT人間情報研究所。2015年人工知能学会論文賞、電子情報通信学会優秀論文賞などを受賞。深層学習を基にした対話システムの研究開発および実用化プロジェクトの推進を経て、現在はAIの自律成長・人間とAIの協調活動についてなどの研究開発に従事。情報学博士。2024年より特別研究員。

人間と協調してともに成長するAIエージェントが、より高度な創造的活動支援を可能に

■はじめに、現在進められている研究について教えてください。

私は現在、「生成型AIエージェントによるHuman-AI協調基盤構築」の研究に取り組んでいます。これは端的にいうと、AI(人工知能)が人間のように他者と協力して生産活動を行う「Human-AI協調社会基盤」の構築をめざすという研究です。従来のAIは、人に対話体験を提供することや人の作業を代行することが主な仕事でした。しかし本研究では、AIが人のパートナーとして協調する(力を合わせて事をなす)という従来のAIとは全く異なる役割を提供します(図1)。具体例として、自分のように思考し人や環境とインタラクションを行う分身AIエージェント(Another Me(1))をサイバー空間に生成して活動させて成長させ協力することで、そのAIエージェントが人に代わって、または人と一緒に新規サービス開発や研究開発を行うなど、より創造的な生産活動が可能になります。
このような協調関係を実現するために、3つの重要な技術課題(図2)があると考えています。まず技術課題1「今置かれた状況をAIが理解する」では、AIが人間と同じく多次元、例えば5W1Hのような複雑な状況をAIが理解できるようにすることです。従来のAIでは、人間との膨大なインタラクション履歴を学習するといったように、「応答」と「発話」の二次元関係(二次元アテンションモデル(2))を理解するという仕組みでした。しかし今後は、AIが知識トピック・時間・場所といったコンテクストに沿って発話と応答の関係を学習することで、より人間の知識にフィットした多次元のアテンションモデルを作成できると考えています。またAIの知識分布をコンテクスト軸で構造化して可視化できるため、人との知識共有が非常に容易になります。これまでの具体的な成果としては、複数データセットでの応答選択精度が従来手法より10~30%ほど高くなり、精度向上を達成しています。
次に技術課題2「人やAIとのインタラクションに応じ人間関係・知識が成長する」では、AIエージェントが記憶・知識を持って自律的にコミュニケーションを行うことで、人間関係や知識を獲得して成長することをめざしています。従来のAIのようにビッグデータを蓄積してマイニングする手法ではなく、人間のように行動を咀嚼して階層化することがポイントです。例えば、人間の脳と同じように会話記録などから得た記憶・知識を整理して抽象度順に管理しておくことで、将来の行動への再利用性を高め、次の行動を学習・予測して動的にプロンプトに反映することができます。
そして技術課題3「人や自律分散型AIと連携して生産活動をする」では、人間のAnother Meまたは身代わりである生成AIエージェントが、自律・分散しながら成長・連携して創造的な生産活動を支援することをめざしています。これまでの取り組みの例として、私はAIキャラクターのグループチャットモデルを過去に開発し、現在も同種の研究を進めています。このモデルでは、AIキャラクターがユーザの習慣や好みを学び、ニュースや検索エンジンから収集したトレンドや一般的な知識を吸収して、他の人間が所有する他のAIキャラクターから収集した知識を交換しようとします。そしてAIキャラクターが人間や他のAIキャラクターとかかわることで、自律的に成長し協力する関係をつくろうとしていました。つまりこの技術のビジョンは、個別成長したAIの経験や知識を活用して現在の生産活動に適用することで、多種多様で創造的生産活動を提供することをめざすという、従来のAIによる画一的な生産活動とは大きく異なるものになっています。

■これまでどのようなサービスにかかわられてきたのでしょうか。

本研究を開始した当時、私はNTTレゾナントに属していました。そこではAIの技術開発を行いながら同時にサービス提供を行っていたため、事業計画を達成するための仕組みづくりを多く経験しています。具体的なサービスとしては、教えて!goo上での「恋愛相談AIオシエル(3)(4)」や、日本テレビ放送網株式会社様の案件の中で制作協力したTVキャラクターAI「AI奈菜ちゃん(5)」「AIカホコ(6)」などです。これらはありがたいことに非常に好評で多くのユーザに使われ、メディアにも数多く取り上げていただきました。またそうしたことを受け、さらに対話型AIでサービスを提供する流れができ、「AI x Design(7)」というサービスが誕生、そしてそれを発展させた「AI suite(8)」というサービスを開発しました。これは時代の流れに先んじて、言語のみではなく音声・映像も組み込み、パーソナライズされたAI技術を搭載し、ビジネス機会を得ようとしました。私は立上げ後2年ほどでNTT研究所に所属が変更となったのですが、現在もAI suiteはNTTドコモで提供されています。
このようにNTTレゾナントに所属していた時代は、さまざまなサービスを提供しながら研究開発を行っていました。その中で、私なりに工夫をしてAI技術でどう市場を獲得するかを模索し、また新しい技術をサービスにいち早く取り入れ、そこから収益を生み出しつつ先の研究を行うという、自律的なサイクルを伴う仕組みを構築しようと工夫をしていました。そして結果的に約7年の間、AIビジネスと研究開発の両輪を回すことができ、いくつかのサービスは非常に多くのユーザに使われるに至りました。またその裏では、ISWC(International Semantic Web Conference)、AAAI(Association for the Advancement of Artificial Intelligence)やIJCAI(International Joint Conference on Artificial Intelligence)などのトップ会議にも採録されたアルゴリズムが動いており、サービス・技術両面において高いレベルの結果を出すことができました。また一部の技術は中国のデータセットに対する評価において、応答選択モデルとしては今でも世界一位の応答精度を持っています。
そして現在では「箱庭モデル」と呼ばれる、Human-AI協調の新たなモデルを開発しています(図3)。この技術は、AIエージェントが人間に代わってチームディスカッションや会話を行いながら知識を深め、最終的にビジネス企画書などをアウトプットするものです。生成された各エージェントは個別に専門知識を持ち、互いに議論をしながら知識を伝搬していくことで、各エージェントがそれぞれ持つ個別の目的と全体の目的をすり合わせた協調作業が行われ、最終的にサービスをまたがったアウトプットを生産することが可能になっています。

「スピード感」が大切なAI分野で、NTT研究所の層の厚い研究成果を活用

■ご研究において大切にされている考え方を教えてください。

特にAI分野の研究を行ううえでは、最新動向を押さえつつ次のトレンドを見極めて研究を模索することが非常に重要だと考えています。例えばChatGPT(9)のサービスがあれほどまで拡大した要因の1つは、いち早く市場にサービスを導入したからだと思います。さらにそれだけではなく、「果たして研究の方向性が合っているのか」といった疑問にもサービスを社会適用することで答えが見つかり、もし世の中に受け入れられればそれを担保としてさらに先の研究に進んでいけます。私自身NTTレゾナントに所属していたころは、時代の流れに沿ったAIサービスを即座に立ち上げ、フィードバックを受けながら次の研究ネタを考えていくということに日々取り組んでいて、世間やお客さまからの声を直に聞ける環境下で「どこに研究の方向性を持っていけばいいか」と日々考えていました。またAI suiteに関与する研究では、かかわった複数の上司やチームメンバーに恵まれ非常にスムーズにリリースができたものの、一方でChatGPTの登場や巨大な研究組織とどう戦っていくかなど、研究者としても非常に難しく苦しい局面に立たされてもいました。
こうした状況下で改めて考えさせられたのは、NTT研究所の幅広い研究者と多様な研究成果を活用して、シームレスかつ市場に合わせて計画的に市場投入する仕組みづくりが重要だということです。時間が限られた研究では、次から次へと新しいアイデアが出てくるものの、それを1日も早くつくり上げて実験をして特許を取って……、というように迅速に研究を積み上げていかなければ、他の競合に先に着手されてしまいます。特に目まぐるしく状況が変化するAI分野においてはそうしたリスクが常に隣り合わせで、研究者どうしにも「スピード感を持って研究を進めなければ」という共通認識は存在していると思います。こうした状況で後れを取らないために、私自身も論文や他の研究者とのディスカッションをとおして常にトレンドをキャッチアップをしていくことは意識しています。

■最後に、研究者・学生・ビジネスパートナーの方々へ向けてメッセージをお願いします。

私がNTTに入社した2003年当時、AIや検索システムやセマンティックWeb(10)に関する研究が盛り上がっていて、「この分野はまさにこれから時代を変えていくだろう」と感じていました。その中で私が関心を持ったのが、研究を軸に事業も行っているNTTです。NTT研究所は日本の中でも機械学習やAIに関する研究者の層が厚く、実際にAAAIやIJCAIなどのトップ会議でNTTの研究者は毎年多くの発表をしています。AI技術は今後のビジネス機会の核になるものなので、日本のAIビジネスを切り拓いていくうえで非常に強みがあると感じています。またその強みを活かしたサービスを創造できる事業会社の裾野も広く、何よりNTTの持つネットワークサービスやエンドユーザとの連携が取れることはNTTならではの大きな強みですし、やり方次第では次のゲームチェンジャーになり得る大きな可能性を持っていると考えています。またサービスの利用者の声を直に聞けることで、自身の研究結果として論文にまとめることもできますし、研究者のモチベーションにもなるので、その点とても恵まれた環境であると感じています。
私は2023年7月にNTT研究所に所属となり、現在では多様な方と議論をとおして研究を進めています。そうした中で、新たな視点からの気付きもありますし、分野のコミュニティにおける研究成果に真剣に向き合うことの大切さも感じています。これは私と同年代くらいの方に当てはまることだと思いますが、「相手のやりたいことがコミュニティの中でどのような価値を見出すのか」、そうしたことを念頭に置いて議論を進めることができれば生産性のある議論になり、前向きな成果が生み出せるのではないかと考えています。また、広い視野を持って全体としての成果を生んでいく方向に研究を進めていくことが必要だと思いますし、私もそうして真摯に研究に向き合っていきたいと思っています。
今後も社会実装機会を時代に先んじて示していきながら、トップ会議などにマイルストンを合わせて学術面からもインパクトを与えていくことが重要だと考えています。そして研究であれ社会実装であれ、研究者間のコラボレーションによって生まれる創造的な研究活動やわくわくする仕事を行っていくこと、そして、そうした関係づくりが大切であると思っています。もしこれを読んでいる方でご興味のある方がいらっしゃれば、ぜひどこかで分野を盛り上げる研究でコラボレーションできることを願っています。

■参考文献
(1) https://journal.ntt.co.jp/article/16956
(2) https://doi.org/10.48550/arXiv.1706.03762
(3) https://ai-biblio.com/articles/391/
(4) https://cdn.kyodonewsprwire.jp/prwfile/release/M101547/201901282607/_prw_PR1fl_QRWJFcAz.pdf
(5) https://kyodonewsprwire.jp/release/201908029369
(6) https://www.jstage.jst.go.jp/article/itej/73/1/73_173/_pdf/-char/ja
(7) https://aixdesign.goo.ne.jp/
(8) https://aisuite.jp/
(9) https://ja.wikipedia.org/wiki/ChatGPT
(10) https://ja.wikipedia.org/wiki/Semantic_Web

DOI
クリップボードにコピーしました