NTT技術ジャーナル記事

   

「NTT技術ジャーナル」編集部が注目した
最新トピックや特集インタビュー記事などをご覧いただけます。

PDFダウンロード

挑戦する研究開発者たち

AIに「Do you really want to hurt me?」と質問して、その回答が「君は完璧さ」と思える日を夢見て

AIは技術革新のスピードを増し、自然言語処理・理解を中心に実用化が進んでいます。中でも、Q&A対応などで活躍するチャットボットは、コールセンタの問い合わせ履歴から自動学習し、実務で人との応答を繰り返すことで、定型的な応答から脱却し、自然なコミュニケーションができるようになってきています。これらを支えるNTTコムウェア エバンジェリスト川前徳章氏に、研究開発の概要と研究開発者としての姿勢について伺いました。

川前 徳章
エバンジェリスト
NTTコムウェア

業務で使える、検索や自動発話生成の機能を備えたチャットボットの実現に挑む

現在、手掛けている研究開発を教えていただけますでしょうか。

NTTコムウェアはNTTグループの加入者情報や料金請求データ等大量のデータを扱うシステムを長年にわたり構築・運用しています。その過程で培ってきた技術をさらに磨き、重点技術領域の1つとして「データ・マネジメント」に取り組んでいます。
私はエバンジェリスト、データサイエンティストとしてレコメンド、情報探索、機械学習と自然言語処理の研究開発を担当し、AI関連技術によるサービスを創出、支援することでお客さまの顧客満足度を上昇させ、NTTコムウェアの付加価値を最大化することを目標としています。
このような研究開発の社会的背景として、AIの飛躍的な発展により、例えばQ&Aの回答を生成したのは人間なのかAIなのかの区別がつかなくなってきていることがあります。これは、機械学習の進化により、最初は画像認識処理の分野でAIが活躍していたものが、一気に自然言語処理の多くのタスクで実用化レベルまで達したことによります。
自然言語処理も当初はヘルプデスクやコールセンタのような問合せ対応で利用されていたものが、マーケティング等の分野においても導入が進み、販売のための対話や応対等の処理、レコメンド関連の分野まで展開され、注目が集まっています。

どのような技術なのかを分かりやすく説明していただけますでしょうか。

レコメンド、情報探索、自然言語処理の研究開発においては、表現学習、マルチモーダル、生成といった技術がコアになり、これらを組み合わせることで機能が実現されます。
表現学習とは、AIが入力されたデータの意味を理解するための表現形式にデータを変換してAIに読み込ませる技術です(図1)。この表現形式は、単語間、あるいは単語と画像領域の対応関係を計算要素(ベクトル)で表現したものです。機械学習を実行する際に必要な画像や音、自然言語、時系列のデータ等の特徴表現は、すべてベクトルで表現することができます。機械学習の性能はそのデータの表現の仕方によって変わってしまうため、これまでは試行錯誤して表現の対象に最適な特徴量を設定していたのですが、表現学習ではコンピュータがベクトルを用いて自動で特徴を学習します。私たちはこの性質を画像生成や自動翻訳などの手法の開発に活かしています。
マルチモーダルはテキスト、画像、動画、音声といった異種のデータをシームレスに扱う技術の総称です。マルチモーダル、マルチモーダル・カンバセーションリサーチと呼ばれる技術は、チャットボットの対話自動生成機能に使われています。自然文入力や画像などを併用して「人が専門家と対話しているような」検索サービスをECサイト等で実現しています。また、レコメンドシステムは、例えば観たい映画を検索する際、専門家ならではの解説や推薦理由を表示してレコメンドを提供します。
学習が進んでいないAIに「Do you really want to hurt me?」と質問しても、そこから得られる回答は「完璧」とは言い難いです。したがって、これらの対話自動生成には業務知識を持たせる必要があります。具体的には業界領域に特化したデータとWebなどで公開されているデータを合わせて学習させています。するとあたかも専門知識を持つ担当者と会話したときのような説明的な要素を含んだ発話の生成ができ、質問者が納得できる対象の表示やレコメンドを提供できるようになります。
私たちのモデルでは、発話のみのUni-modalと、画像を用いた発話が可能になるMulti-modalの両方を内包しています。さらに、Speaker/Attribute Embeddingによって話者(質問をする人)それぞれの特徴を発話に反映できます。これにより、話者の属性により答えやレコメンドする内容を変える。つまり、従来の発話自動生成ではできなかった「カスタマイズされた発話」を可能としているのです。私たちはこのMulti-modal search、Multi-modal Conversational searchの研究開発を進め、世界の先進企業の技術に負けない、そして実際の業務で使える、検索や自動発話生成の機能を備えたチャットボットを誕生させようとしています(図2)。その先に目的に合うテキストや画像や音声の自動生成をめざしています。この図は付加価値創造および新規サービス創出に向け、私たちが対象とするデータ、目的、フレームワークおよびモデルの取り組み概要となります。

研究は「設計」担当、開発は「建築」担当であるが、どちらも両方の技量が必要

研究者としてキャリアをスタートさせたと伺っています。研究開発者としてのキャリアはどのように築かれたのですか。

キャリアの出発点は大学時代までさかのぼります。統計学の演習でデータ分析をしている最中「データの分析はこれから大量のデータが得られそうなので、データ分析の重要性は増すだろう。同じデータに対し、同じツールや手法を適用すれば、誰が手掛けても同じ結果が得られるので、いずれは自動化されるだろう」と思い、周囲を見渡すと、適用できる領域が広いことに気が付いたことがきっかけです。例えば、当時はあまり理系と関連が弱いとされていたマーケティングの分野があります。実際に分析をしてみると、自分では気付かなかった結果が出てくることがあり面白いのです。これを解釈して意味付けすることでデータが情報となり、この付加価値が分析する人の強みとなるだろうと思いました。
例えば、演習で、不動産の価値と立地条件の相関を検討して、不動産価格を予測するプログラムを作成する宿題がありました。不動産の価値を駅からの距離やバスの頻度、沿線の鉄道等の条件で検討し、価格上昇に合致する条件をデータから学習させました。すると、ある値を境に不動産価格がグッと下がったのです。その理由に、雨が降っても傘を差さずに歩けるアーケードがある等の要因を見出すことができました。これはほんの一例ですが、分析によって何かが明らかになることに魅力を感じて、データサイエンティストの道に入りました。そして、2002年にNTTに入社し情報流通プラットフォーム研究所(当時)で研究者としてのキャリアをスタートさせたのですが、大学の研究室と違って多くの研究者が在籍していて、私の知らなかった分野の研究者との交流が図れる日常を魅力的に感じました。そこから7年間同研究所に在籍した後、NTTコムウェアに異動しました。ただ、所属する組織は変わっても、研究開発者と呼ばれるようになっても、20年近く同じ研究を続けています。
ところで、私は研究者と研究開発者、同じテーマを両方の立場で追究している者として、それぞれの立場の違いを実感しています。開発者はお客さまに「モノを直接届ける」サービスを手掛けていることから、お客さまに近いところに存在しています。一方で、研究者はジャストアイデアで論文を出すのが1つのゴールでもあります。これを建物の構築に例えると、研究は「設計」を、開発は「建築」を担っていると思います。
とはいえ、研究成果を評価する際に、大量のデータを動かせる、使えるモノにできるかが問われていますから、研究者であっても研究開発者の素養を備えることは大切です。その逆も然りで、研究内容・成果を理解できなければ、それを応用してお客さまに届けることもできません。まさに「設計」と「建築」の関係と同じなのです。

課題やテーマを探すときに心掛けていることや、意識して実行されてきたことはありますか。

まずは取り組む前に前提としていることがあります。それは自分が思いつきそうなことはすでに誰かが行っているはずであり、誰かが着手していないことは実現困難かあるいは実現しても効果がなかったのかどちらかの可能性が高いという考えです。したがって調査は徹底するものだと考えています。私たちが従事しているのは趣味ではなく仕事ですから、取り組みが無駄になってしまったら、何もしていないのも同然です。だからこそ、取り組み以前に十分な見極めが必要なのです。
それから、私は自分以外はすべて師匠と思い、中でも世界水準の研究者が誰かを意識しています。彼らは研究者と同時にトップレベルのエンジニアであり、企画や営業のスキルも持ち合わせているのだと認識しています。当該分野において、手掛けている研究開発をどう定義つけるのか、また、広い視野を持ってどう方向性を定めるかは重要です。これは企画に通じますし、それを専門以外の人に伝えることは営業に通じるでしょう。このような前提があり、研究や影響力やその先にあるポテンシャルクライアントを想像できるかということを大切にしています。
さらに、この力を養うために学会等で人に会うようにしています。研究者と話をすると、自分に不足していることが見えてきます。そこで足りない部分を正直かつ正確に認識するように努めます。ここでいう正直さというのは「分からなくてはいけないことを、今、私は知らない」という事実を素直に認めることが、研究者の伸びしろだと思います。
この姿勢は大学の研究室で研究に取り組んでいたころから心掛けています。素直にできないことを認めることが、自らの過小評価につながるのではないかと思う方もいるかもしれませんが、評価は他者がするものだと思います。研究者は世界各地で切磋琢磨し、技術の新陳代謝も早い分野なので、完璧な情報収集は困難ですが、可能な限り正確に自分の立ち位置を把握しておきたいと思います。

忍耐、柔軟、大胆さをキーワードに研究開発に挑む

人と会うことで自分が見えてくるとは深いですね。

多くの人、研究者に会うことは自らを評価する基準を身に付ける際にも役立ちます。当該分野で成果を出している研究者や自ら研究開発を手掛けている研究開発者に会うことは重要です。国際学会であれば、ハイレベルの方々にお会いする確率は高くなります。彼らの発表を聞くだけではなく、ちょっとした立ち話でもよいので直接、会話をできる機会をつくるようにしています。
立ち話であれば発表後の質疑応答でも聞くことのできない、試行錯誤やプロセスを聞くことができますから、私は積極的に話しかけています。多くの方が実感していることかもしれませんが、国際学会の貴重な場所で、日本人どうしが集まっていては人脈も視野も広がりません。別の機会にも会える日本の方ではなく、この機会にしか会えない人と話をするために、積極的に海外の方々が集まる輪に飛び込んでいくことを優先したいです。言語(英語)の心配をする人もいるかもしれませんが、それを気にしていたら何もできません。こちらがそれなりの価値ある話をすれば、多少発音が悪くても話は聞いてもらえる…と思っています。最近はAIや機械学習のトップカンファレンスであるICLRやKDDの論文査読などをすることになり、責任の重みを感じています。
それから、私は研究開発をするうえでモットーとしているのは他者への感謝の気持ちです。例えば、現在、私が在籍しているのは研究所ではなく事業会社です。ここで私が今の仕事を担えるのは、多くの理解者や賛同者の存在があってこそです。この方々への感謝の気持ちを忘れずに、期待にこたえていかなくてはいけないと思います。正直であることや日頃のコミュニケーションは重要で、立場によって態度を変えることなく、誰でも同じように丁寧、親切であるように心掛けています。

後輩の研究開発者の皆さんに一言お願いいたします。

何かお役に立てることをお伝えできればよいのですが、人それぞれですので、自分にとり役立った本を紹介します。それは中国の歴史書、『正史 三国志』で、そこから忍耐、柔軟、大胆を学びました。学生時代に『正史 三国志』を読んで、呉が一番長く続いたのはまさにこの基本方針であると気付き、これは活かせると思いました。すぐに結果が出なくてもあきらめない忍耐力、上手くいかなかったらスパッと切り替える柔軟性、そして常識に挑戦する、否定する大胆さを備えていたいと思います。
コロナ禍にあって在宅勤務がメインとなり、私は自分1人で何ができるかを意識するようになりました。そこでは、『正史 三国志』より後に知った東ローマ帝国の興亡から、自分自身が担うことにもっと厳しく、より正直にならなければいけないと危機感を感じることを学びました。仕事のプロセスを他者が直接見ることができないことから、評価は結果が重視されるようになるため、同じ時間を使うにしてもやることやできることを増やし、集中力を高めることが大切になってきます。私は細かい締め切りをいくつも設定してパフォーマンスを上げるようにしています。具体的には週単位で、現在手掛けている論文を実装する本数を定める、実装したモデルの性能を改善する等の目標を設定して、達成度やその結果を分析して次の目標に反映させるようにしています。仕事に納期や締め切りがあるのと同じように、研究にも締め切りは必ずやってきます。ちょうど魏や晋が長江を渡り呉に攻め込むように。
研究、研究開発活動は誰でもできることではありませんから、それができる環境はとても恵まれていると思います。私はこれに感謝して、活動させていただける期間に少しでも多くのことをできるように心掛け、周囲の方々に恩返しをしていきたいと思います。また、私の活動のモチベーションの1つにもなっていますし、会社で仕事をしている以上、目に見える成果を上げ、誰かの役に立ちたいと思います。
私は研究と芸術は紙一重だと考えています。なぜなら研究も芸術も新しい価値観を生み出し、それを社会に理解し受け入れられるか否かで点で共通しています。周囲に理解して支援する人が欠かせないのも一緒です。理解してもらうのは難しいことでもありますが、多くの人に正直に伝えていきましょう。この分野に限っていえば、研究も開発も、その対象は急速に増えています。これはと思うことがあればまず手を動かしてみましょう。そして話してみましょう。そのためにも外へ出ましょう。