Focus on the News
光通信で培った技術を応用し、情報処理システムの性能向上を実現する「光インターコネクト技術」を開発
NTTは、情報処理システムの高性能化をめざした光インターコネクト技術を開発し、AI(人工知能)処理を高速化することに成功しました。
LSIの大規模化・高速化による処理能力向上が限界を迎える時代(ポストムーア時代)においては、CPUといった演算資源をインターコネクトで複数接続する分散処理が情報処理システムの性能を向上させる手法として期待されますが、この場合はインターコネクトの性能がシステムの能力に大きな影響を与えます。
今回、NTTは光通信用に研究開発を続けてきた高速プロトコル技術・通信処理回路技術を活用し、情報処理システムの性能向上を実現する光インターコネクトを開発しました。本技術を複数のサーバで大量のデータを分担して処理する「分散深層学習」に適用した結果、学習速度を従来技術比で7%高めることに成功しました。この結果より、GPU台数を増やした場合の効果を見積もると、32GPU接続時に40%程度の速度向上が見込まれます。
本技術は、NTTのAI「corevo®」を支える技術であり、将来のIOWN構想実現につながる新たな情報処理技術として今後研究開発を続けます。
研究の背景
データ量の爆発的増大に伴い複雑化するデータ処理に対して、LSIの大規模化・高速化では処理能力向上の限界を迎える時代(ポストムーア時代)が到来しつつあります。ポストムーア時代に向け、演算リソースを複数接続し能力向上を図る分散処理が情報処理装置の性能向上の手法として期待されますが、そのためには演算リソース間のデータ共有が高速に行える高性能なインターコネクトが必要となります。
今回は、アプリケーションとしてAIに注目し、自動運転やゲノム解析などといった、リアルワールドの大量なデータを高速に処理するために数多くのサーバで分散処理を行う「分散深層学習」に適した光インターコネクトをめざしました。
研究の成果
分散深層学習においては、各サーバでの学習結果をインターコネクトを介し共有する通信を行いますが、この通信の早さがAIの学習速度に大きく影響します。今回、AIの学習結果共有を高速に行える光インターコネクトを新たに開発し(図)、AI学習の高速化を実現しました。
現在用いられている市販品で最速の構成と本技術を用いた場合の比較測定を行った結果、4台のサーバ(1台当り1GPU)を利用した場合、通信のために生じる演算待ち時間(通信オーバーヘッド)が84%以上削減されることを確認しました。この結果、学習速度が7%向上することを確認しました。
この測定結果を基に、GPU台数を増やした場合の見積もりを行うと、GPU台数を増やした場合では演算に対する通信の時間の比率が高まるため、通信時間短縮の効果が大きく現れ、32GPU利用時に40%以上学習速度が向上する見積もりが得られました。
図 今回成果の光インターコネクトによる通信
今後の展開
大規模なAI学習を行うデータセンタに今回の技術を導入することで、今後の自動運転・遺伝解析・気象予測など、大量のデータを扱うAI学習処理の高性能・低消費電力化が期待されます。そのため、NTTのAI「corevo®」を支える基盤技術の1つとして開発を続けていきます。
さらには今後、爆発的に増大するデータ量や、複雑化するデータ処理に対して、LSIの大規模化・高速化では処理能力の向上が限界を迎える時代(ポストムーア時代)が到来します。ポストムーア時代のIOWN構想の実現に向けた、光と電子の利点を結び付けた新アーキテクチャによる情報処理システムを実現する技術として、今回開発した技術を応用・発展させていきます。
問い合わせ先
NTT先端技術総合研究所
広報担当
TEL 046-240-5157
E-mail science_coretech-pr-ml@hco.ntt.co.jp
URL https://www.ntt.co.jp/news2019/1906/190618a.html
研究者紹介
Collaborative Intelligenceの実現をめざして
田仲 顕至
NTT先端集積デバイス研究所
光電子融合研究部
デバイスアーキテクチャ研究グループ
Collaborative Intelligence─協調的知能─という言葉をご存じでしょうか、人と機械が自律的・協調的なネットワークを形成し、問題解決を図るネットワークを指す言葉です。この“人と機械”のネットワークはすでに私たちの社会に浸透しており、時折ニュースで見かけるような、大きな社会的事象の契機となっています。例えば、ロボット技術や自動運転技術などは人と機械のCollaborative Intelligenceの最たる例ですし、ソーシャルネットワークサービスや機械翻訳サービスも人と機械と人のCollaborative Intelligenceでしょう。私は、これらのCollaborative Intelligenceの発展が私たちの社会の可能性の幅を大きく広げると確信しており、一段階進歩した人と機械のネットワークを支えるインフラストラクチャーの構築が必要だと考えます。その原初体験となっているのが、これまで私が行ってきた人間の知的処理の計算論的模倣と、スパースモデリングとデータ駆動科学を実現する計算機アーキテクチャに関する研究です。これらの研究は、アナログ情報から本質的な法則性を機械的に抽出し、その結果を人間が解釈しフィードバックすることの重要性を陽に示す一方、そのために膨大な計算量・時間が必要であることを暗に示しています。私は、そういった計算量・時間の問題を解決するために、光インターコネクトの研究に取り組んでいます。現時点では、夢の実現に向けた初段と存じますが、今後ますます研究に邁進し、1日も早いCollaborative Intelligence基盤の実現をめざします。