NTT技術ジャーナル記事

   

「NTT技術ジャーナル」編集部が注目した
最新トピックや特集インタビュー記事などをご覧いただけます。

PDFダウンロード

特集1

真のヒューマニティを育むテクノロジの研究開発について

真のヒューマニティを育むテクノロジの研究開発を推進するNTT人間情報研究所

NTT人間情報研究所では人間中心を原則に、サイバー世界発展の急加速に伴う実世界(人・社会)とサイバー世界の新たな共生に関する研究開発に取り組んでいます。本特集ではNTT人間情報研究所の最新の取り組みについて紹介します。

日高 浩太(ひだか こうた)
NTT人間情報研究所 所長

NTT人間情報研究所のミッション

NTT人間情報研究所は、“真のヒューマニティを育むテクノロジの研究開発”をミッションに、“人間中心を原則に、あらゆるヒトの機能を情報通信処理可能にする”ことをビジョンに掲げます。具体的には、人間の特性のうち、知覚・感性・思考・行動・身体・環境の6つを対象とし、これらをデータ化して情報通信処理可能な機能にすることを要素技術としています。IOWN (Innovative Optical and Wireless Network)構想の実現に向けては、前記機能を活用した総合研究として、デジタルツインコンピューティング(DTC:Digital Twin Computing)とリモートワールドを推進しています。ここで、私たちを取り巻く環境の変化に着目すると、生成AI(人工知能)の登場、脳に関する機器の小型化・高精度化、メタバースやWeb3に対する幻滅期の到来、ポスト資本主義の変革等が挙げられます。これらにかんがみ、当研究所が取り組むべき課題を4つ抽出しています。1番目は汎用AIにて脳をブラックボックスとして扱う研究の加速、2番目は汎用AIにて脳をホワイトボックスとして扱う研究の着手、3番目はメタバースの本質的かつ普遍的価値の追求、4番目はヒューマニティ直結研究の加速となります。そして、これらの課題を踏まえ、「大規模言語モデル」および「ニューロテック・サイバネティクス」を、要素技術の研究開発を加速させるための重点化要素技術と定め、「Project Metaverse」および「Project Humanity」を総合研究具現化のための重点化ユースケースと定めました(図1)。

重点化要素技術と重点化ユースケースについて

4つの重点化要素技術と重点化ユースケースの方針について述べます。1番目の大規模言語モデル(LLM:Large Language Models)について、GPT-3の登場とさまざまな分野での活用により汎用AIの提供が現実味を帯びてきました。そこで、NTT人間情報研究所の数10年におよぶ言語処理研究の蓄積を活かして、ヒトの脳の仕組みを解析するNTT独自のLLMを研究開発します。そして、いち早く汎用AIを社会実装することで、新たなAI時代の最先端を行くとともに、汎用AIを核とした世界の革新にチャレンジします。2番目のニューロテック・サイバネティクスは、これまで培ってきた身体の仕組みの知見に加えてLLMを活用することで、暗黙知の獲得や人と機械をつなぐ直感的なインタフェースを実現し、ヒト単独ではできなかったことを可能にします。3番目のProject Metaverseは、LLMをベースにすることで、距離や時間を超えた新しいtele-を実現し、ありえないような出会い、今は存在しない仕事や余暇の体験、あるいは、自分というヒトを知る空間を創出します。4番目のProject Humanityは、2番目のニューロテック・サイバネティクスをベースにすることで、ダイバーシティ&インクルージョンを推進し、家族、友人、会社の同僚等の周囲の人たち、あるいは、病気や障がいを持った方やサポートする方々に対して、本人の意向を尊重したうえで、ヒトの機能を獲得できる世界を実現します(図2)。
本特集では、重点化要素技術と重点化ユースケースの最新の研究内容や直近の活動について報告し、本稿ではNTT独自のLLMについて紹介します。

NTT独自の大規模言語モデル「tsuzumi」

GPT等の大規模言語モデルの登場により、汎用AIの実現可能性が高まってきています。NTT人間情報研究所では、GPTの課題である、言語モデルサイズ、情報の信頼性、モデルの成長性、言語以外のモーダルへの適用性、大規模学習に伴う消費電力の問題を解決する独自の高効率なLLMである「tsuzumi」を2023年11月に発表しました。「tsuzumi」の差異化ポイントは①言語モデルの小型化(コスト削減)、②日本語処理性能の優位性、③カスタマイズ性の向上、④マルチモーダル対応(身体性保有)です。①について、「tsuzumi」はパラメータサイズが6億の超軽量版と、70億の軽量版の2種類があります。超軽量版はCPUで、軽量版は安価なGPU1台で高速な推論動作が可能です。これは、GPUクラウドの利用料金に換算すると、Open AI社「GPT-3」の1750億円と比べて、学習コストにおいて、超軽量版で約300分の1に、軽量版で約25分の1となります。また、推論コストにおいても、超軽量版で約70分の1に、軽量版で約20分の1となります(ともにNTT試算)。②は、NTT研究所の長年の言語処理研究の蓄積を活かすことで、小さなパラメータサイズであっても高い性能を実現しており、LLM向けのベンチマークである「Rakuda」ではGPT-3.5や国産トップのLLM群を上回ることを確認しています(図3)。③は、精度やコスト等の要件の違いに柔軟にこたえるために、「プロンプトエンジニアリング」「フルファインチューニング」「アダプタチューニング」という3つのチューニング方法を提供しています(図4)。これにより、業界ごと、組織ごと、個人等のカスタマイズを低コストで実現します。④は、言語だけでなく、画像、映像、センサデータ、音声のニュアンス、顔の表情等のさまざまなモーダルの入出力に対応していくことで、より広範な知識を獲得可能にします(図5)。そして、「tsuzumi」を中心に、40年以上の歴史を持つ音声・画像・映像処理を連動させ、同様にロボティクス研究で培ったセンサ・アクチュエータ技術や認知心理学の知見を活かしながら、ユースケースを創出していきます。

tsuzumiとIOWNの相互作用

IOWNの大容量・低遅延のネットワークは、LLMに必要な地理的に分散している各種リソースを1つにつなぎ、省電力化にも貢献する基盤となります。また、今後、何でも知っている1つの巨大なLLMではなく、「tsuzumi」をはじめ、専門性や個性を持ったさまざまな小さなLLMどうしが連携し、社会課題を解決するようになります。LLMが社会活動をすればするほど、大量のLLMの連携基盤として、IOWNが重要となっていきます。

皆様へのメッセージ

約3年におよぶコロナ禍は国民の生活を一変させました。誰かと会えることは当たり前ではないことに、私たちは改めて気付かされました。不要不急の活動が制限される中で、幸せだと感じることが必要火急とは限らないことも、今、私たちは知っています。NTT人間情報研究所は、“真のヒューマニティを育むテクノロジの研究開発”をミッションに、“人間中心を原則に、あらゆるヒトの機能を情報通信処理可能にする”ことをビジョンに掲げています。私たちを取り巻く環境は、めまぐるしく変化しています。令和が始まったころ、5年後を想像することは不可能でした。“遠い”を意味する“tele-”を英語社名に含む当社は、距離を超えたコミュニケーションを生業としてきました。この数年の変化においても、ICTを活用したリモートワールドの普及・推進に寄与してきました。いまだ激動の中にありますが、この数年で何が生み出され、後世に残していくべき本質は何か、人間中心の観点で検証するときです。大切な人と会えないとき、時間と距離の壁を超えるコミュニケーションは存在するのか、機械はどれだけ人間を模倣してよいのか、また、人間の能力を超えても許容される領域はあるのか、人が利便性や幸福を感じるために、技術はどのように支援するべきなのか。私たちは外部とのコラボレーションを通じて、自らに問い続けます。検証を重ね、後世に、例えば100年後にも残したいと心から願うテクノロジに、私たちのリソースを集中させます。NTT人間情報研究所のこれからにご期待ください。

日高 浩太

NTT人間情報研究所は、人を中心とし、人の能力を最大限に活かすICTの研究開発をとおして、新たな価値を創造し豊かな社会の実現をめざしていきます。

問い合わせ先

NTTサービスイノベーション総合研究所
情報戦略・広報担当
E-mail svkoho-ml@ntt.com

DOI
クリップボードにコピーしました