NTT技術ジャーナル記事

   

「NTT技術ジャーナル」編集部が注目した
最新トピックや特集インタビュー記事などをご覧いただけます。

PDFダウンロード

特集1

NTT R&D FORUM 2023 ― IOWN ACCELERATION

挑む 人と地球のために NTT R&Dの取り組み

本記事は、2023年11月14~17日に開催された「NTT R&D FORUM 2023 ― IOWN ACCELERATION」における、島田明NTT代表取締役社長の基調講演を基に構成したもので、人と地球のために挑戦し続けるNTTのR&Dについて紹介します。

島田 明
NTT代表取締役社長
社長執行役員

社会が抱える課題

現在社会が抱えるさまざまな課題のうち、3つを挙げたいと思います。
最初は労働力不足の問題です。労働人口の減少に加えて、直近ではいわゆる2024年問題を抱えていて、建設業界、運送業界などでは大変大きな問題となっています。
2番目は世界規模で課題となっている環境エネルギー問題です。データ量の飛躍的な増加により電力消費量が急増し、特に都市部のエネルギー需要は伸びる一方です。技術革新の歩みを止めず、環境とエネルギー問題の解決を調和していくことが求められています。
3番目は、高齢化社会の到来に伴い、日本の財政圧迫の大きな要因の1つになっている医療費増大の問題です。さらに、さまざまな人々が心身ともに満たされて、健やかに暮らせる生活を送れるWell-beingな社会の実現も求められています。
これらの課題を大容量、低遅延、低消費電力で実現する次世代コミュニケーション基盤である「IOWN(Innovative Optical and Wireless Network)」と、世界トップクラスの言語処理能力を持つ小型/省電力の大規模言語モデルであるNTT版LLM(Large Language Model)「tsuzumi」を中心としたNTTのR&Dで解決していきたいと考えています。

IOWN

増大するデータ量や電力消費量の課題に対し、IOWNの最終目標である、電力効率100倍、伝送容量125倍、エンドエンド遅延200分の1をめざして開発を進めています。
IOWNのロードマップとして、2022年末にIOWN1.0を商用化しました(図1)。具体的なユースケースについては後述します。IOWN2.0は2025年度までにボード接続用の光電融合デバイスを開発する予定です。その後2028年度までにIOWN3.0としてチップ間向けのデバイスを開発し、2032年度にIOWN4.0としてチップ内の光化を進めていきたいと考えています。
IOWN2.0のポイントは、光電融合デバイスをコンピューティング領域に適用していくことです(図2)。そのためのキーとなるのが大容量低消費電力小型の光エンジンです。この光エンジン、および光エンジンを搭載したスイッチボードを利用してxPUやメモリ間を電気ではなく、光で接続することで、超低消費電力であるIOWNコンピューティングを実現していきます。IOWNコンピューティングにより電力効率を従来に比較して8倍まで上げることが可能です。
現在光エンジンに関してはおおむね開発が完了しており、商用に向けた試験を実施しています。そして2025年度に光エンジンを搭載したスイッチボードの提供を開始する予定です。このIOWNを利用したサービスを2025年の大阪・関西万博で皆さんに体験していただこうと考えています。NTTパビリオンのテーマは「感情をまとう建築」です(図3)。パビリオンを覆う「布」が来場者の盛り上がりに応じて動く仕掛けや、自然の光や風に応じて表情を変えるなど、「生きているパビリオン」を表現していきたいと考えています。これらをオールフォトニクス・ネットワーク(APN)とIOWNコンピューティングを利用して、遠隔でAI解析を行うことで実現したいと考えています。

NTT版LLM「tsuzumi」

次に、40年以上の自然言語処理研究ノウハウを結集したNTT版LLM「tsuzumi」を紹介します。tsuzumiの特長は次の4つになります。
まず1番目は言語対応力です。日本語はもちろん英語、多言語にも対応していきます。特に日本語は各種ベンチマークにおいても世界トップクラスの性能を誇っています。
次に高いコストパフォーマンスです。GPT-3と同程度の高性能でありながら、少ない消費電力GPUで高性能を発揮できるサスティナビリティな点が特長となっています。
3番目の特長は低コストでチューニングができることです。業界や組織に固有のデータに基づくカスタマイズや頻繁に情報を最新化することもできます。
4番目の特長は、図表等、さまざまな形式にも対応できることです。国産モデルとして初めて、表が含まれる契約書や請求書を読み込むことが可能となります。
tsuzumiの日本語性能を他社と比較してみました。日本語はOpenAI社の大規模なChatGPT-3.5を上回り、同クラスの国産LLMを大きく上回る世界トップクラスの性能です。英語でも、世界トップクラスのMeta社のLLMと同程度の性能を実現し、多言語にも対応していきます。
高いコストパフォーマンスについて、GPT-3規模のLLMと比較したものが図4になります。tsuzumiは、必要とするGPU数が少ないので、GPT-3規模のLLMと同程度の性能を25分の1のハードウェアコストで実現します。利用するときも同様に20分の1程度で済むことになります。さらに、GPU数が少ないので消費する電力も少なくなります。
tsuzumiは、2024年3月にサービスを開始します。2023年10月から、社内外で幅広いトライアルを開始しており、すでに効果も出ているところです。また、2024年4月以降に、文書、図表の読み込みを行うだけではなく、例えば子どもの声、声色の読み込みや、日本語、英語に加えて多言語対応なども順次リリースしていきたいと思っています。

社会課題を解決する取り組み

ここからは、IOWNやtsuzumiといったNTTのR&D技術・サービスを用いて、社会課題を解決する取り組みについて紹介します。

■労働力不足への対応

最初は労働力不足への対応です。
昨今、建設業界では人手不足、長時間労働、技術者の高齢化などが深刻化しています。また、2024年度からは時間外労働の上限規制が適用されますので、作業の効率化、雇用の多様化などの働き方改革が求められています。
それに対して、NTTはEARTHBRAIN社様、ジザイエ様、竹中工務店様と協業して、効率的かつ安全な工事を実施するために、建設機械の遠隔操作を推進する営みを行っています。具体的には、遠隔操作に大容量、低遅延かつ遅延揺らぎのないIOWN APNを利用することで、あたかも現場で操作しているかのように建設機械を操作することができるようになります。
(1) リモートプロダクション
ソニー様と検討を進めているリモートプロダクションの事例を紹介します。
今までは、各地のスタジアム等で試合やイベントがあるたびに、大がかりな制作スペース、人員、機材、中継車等が必要となりました。APNで全国各地の放送局とスタジアムを接続することでリモートプロダクションを実現することができます。これにより、コンテンツ制作等は遠隔にて実施できるようになりますので、イベント時に必要となるスペース、人員、機材、中継車等のリソースの削減が可能になります。
(2) コンタクトセンタでの生産性向上
コンタンクトセンタでの生産性向上として、東京海上日動火災保険様との協業事例を紹介します。
tsuzumiを用いることでコンタクトセンタの生産性の向上をめざしていきます。東京海上日動火災保険様は、事故対応部門にて全国で1万人を超えるオペレータの方が日々お客さまの損害保険のサポートを対応されています。オペレータの皆様は、電話で事故の状況や怪我の状況などを丁寧にヒアリングされて、電話が終わった後に、対応内容を整理して必要な情報をシステムに投入していきます。そのアフターコールワーク(ACW)に年間約80万時間の稼働がかかっているとのことです。すでに音声マイニングなどによりACWが少しずつ削減されていますが、さらにtsuzumiを組み合わせることで応対内容の要約、整理が進展し、ACWの稼働を50%以上削減が見込めるのではないかと想定しています。
(3) 自動運転システムの提供
自動運転システムの提供について紹介します。
地域のバスやタクシーなどの公共交通において、地域における運転手不足が顕在化しています。自動運転技術によりさまざまな社会課題の解決が期待されています。NTTはこのたび自動運転技術に強みを持つ米国のMay Mobility社に出資をして、同社の自動運転ソリューションの日本国内独占販売権を獲得しました。交通課題を抱える複数の地方自治体との協業を通じて、まずはコミュニティバスによるサービスの提供に取り組み、その後、自動運転車両をさまざまな車両に拡大していくことで、運転手不足をはじめ、多くの社会課題の解決をしていきたいと考えています。

■環境・エネルギー問題への対応

環境エネルギー問題への対応について紹介します。
データドリブン社会では、急増するデータを処理するために膨大な電力が必要となります。例えば、データセンタの消費電力量は2018年と2030年では、日本で約6倍、世界では約13倍に増えると予測されています。またAI(人工知能)は今後ますます普及拡大していくことになりますが、ChatGPTのようなLLMの場合、1回当りの学習に必要な電力は1300MWhになるといわれています。これは原発一基を1時間稼働させた発電量以上に相当します。
このようにデータドリブン社会においては、データセンタのニーズはますます高まるとともに、これまで以上に膨大な電力を消費することになります。それに対してNTTはAPNを使った分散型のデータセンタによってこの課題を解決していきます。分散型データセンタの活用例をいくつか紹介します。
(1) APN×LLM
最初に国内のデータセンタ間をAPNで接続してLLMの学習に利用した事例です。tsuzumiの学習のために今回APNを利用したクラウドとオンプレミスとの連携環境を構築しました。
横須賀にあるNTTの研究所に膨大な学習データがありますが、電力の問題で近くにGPU装置の設置をすることが難しいということが分りました。そこで三鷹のデータセンタのGPUクラウドと横須賀の学習データストレージをAPNで接続して学習を行いました。その結果、ローカル環境と比較し、全く遜色のない環境を実現することができています。
(2) OracleクラウドとNTTのAPN接続
次にオラクル社様と協業している事例です。現在、オラクル社様とのクラウドとNTTのデータセンタ間をAPNで接続する実証を行っています。そうすることで大規模な大事なデータは手元に置いて、必要となるデータのみをリアルタイムでクラウドに連携させて分析することが可能となります。
(3) 海外データセンタ間のAPN接続
最後にNTTの海外のデータセンタ間にAPNを導入する事例です。
分散型のデータセンタの実現に向けて、国内だけではなく海外、まずは英国と米国でデータセンタ間のAPN接続の実証の準備を進めています。これにより例えば英国では、通信経路で約100km離れているデータセンタ間をあたかも1つのデータセンタとして運用が可能となります(図5)。この試験を2023年度中に完了させる予定です。また米英だけではなく、アジアなどの他のエリアでも同様に展開していく予定です。

■高齢化・医療費増大への対応、Well-beingの追求

高齢化による医療費増大への対応とWell-beingの追求について紹介します。
(1) LLMを活用した電子カルテの構造化
まず医療分野についての課題です。日本では電子カルテの導入は進んでいますが、例えば同じ症状でもカルテの書き方は病院、ドクターにより異なりますので、カルテデータを集積して分析活用することは非常に難しい状況でした。
tsuzumiは超軽量で柔軟にセキュアにカルテデータを学習できるため、ドクターが記録した医療データを読解し、共通フォーマットに適切に表現・配置し、分析できる状態にします。電子カルテデータの構造化にすでに取り組んでいる京都大学医学部附属病院様では、「tsuzumiによって電子カルテデータを統計データとして扱えるため、治療方針を決めるときに、サポーティブなデシジョンメイクとなり、1人ひとりの患者さんに適した効果的な治療、いわゆるプレシジョンメディシンが可能となる」とのことです。これによって、社会全体の医療費の適正化にもつながっていきます。
さらに、構造化された電子カルテデータにより投薬による効果や、副作用などの医療データの分析も容易となります。医薬品開発の時間の短縮や費用削減に貢献し、効果的な医薬品の開発につながると考えています。
(2) Project Humanity
最後にWell-beingの社会の実現に向けての取り組みを紹介します。
DJ MASAこと、武藤将胤さんは、元博報堂の社員でDJなどの音楽活動を行っていました。2014年、当時27歳のころに身体を動かす運動神経が老化し徐々に動かなくなっていく、難病のALSの宣告を受けられました。「声は聞こえるが、反応ができない。ここで俺の人生はもう終了なのか。なんで自分なのだろうか」と思われたそうです。
武藤さんは、たとえ体が不自由でもテクノロジの力で表現の可能性は必ず切り拓けると考え、DJとして視線操作で音楽を奏でるなど、さまざまなイベントに参加されています。NTTとしてもぜひ彼の取り組みに協力したいということで、武藤さんに「体を動かせるとしたら何をしたいか」を尋ねました。「お客さんと一緒に盛り上がりたい」との回答があり、それを実現するために仮想とリアルの融合が必要と考え、アバターを通じて体を動かすことに挑戦をしました。世界最高峰のメディアアートの祭典「Ars Electronica」で、MASAは自分の声で英語のコミュニケーショを行い、ライブパフォーマンスではアバターを通じて挙げられた彼の手に多くの人が呼応し、大成功をおさめました。
NTTではALSといった重度の障がい者であっても、コミュニケーションができるような技術の研究や開発を進めています。具体的には、例えば今回のようにわずかな筋肉の動きや脳波から意識を読み取る、身体能力転写技術を使い、アバターを介して身体表現をすることや声が出せなくなった人に対してクロスリンガル音声合成技術を使用して、過去の自分の声を合成することにより、自分の声で日本語だけでなく、英語など外国語で話すことも可能にする営みも進めています。
人と地球のためにこれからもNTTは挑戦し続けていきたいと思います。

DOI
クリップボードにコピーしました