特集2
3GPP Release 18におけるネットワーク自動化およびAI/MLの高度化技術
- ネットワーク自動化
- AI/ML
- 連合学習
次世代ネットワークにおいて、AI/ML(Artificial Intelligence/Machine Learning)と通信の組合せが期待されています。本稿では、3GPP(3rd Generation Partnership Project) Release(Rel)-18で検討されている、ネットワークのためのAI/MLと、AI/MLアプリケーションに対するネットワークのサポート機能を解説します。特に、これらの機能を実現する5GC(5G Core network)の進歩について掘り下げ、5GCがどのように知的なネットワークの実現を促し、最先端のAI/MLサービスの展開をサポートするか述べていきます。
Bahador Bakhshi/Malla Reddy Sama
Riccardo Guerzoni/巳之口 淳(みのくち あつし)
NTTドコモ
まえがき
人工知能と機械学習〔(AI/ML(Artificial Intelligence/Machine Learning)*1〕は、さまざまな業界で大きな可能性を秘め、急速に発展している技術であり、AI/MLと通信ネットワークの組合せは、ネットワーク運用とユーザ体験の両方に大きな変化をもたらすことが期待されています。
AI/MLと通信ネットワークの関係は、次に示すように2つあります。まず、機械学習アルゴリズムは、ネットワークデータを分析することで、障害の予測および防止、リソース割当ての最適化、定型業務の自動化、知的な自律ネットワークを実現します。これにより、ネットワークの効率と信頼性が向上するだけでなく、移動通信事業者の運用コストも削減できます。次に、最新のネットワークによって提供される高データレートと低遅延な通信は、例えば、チャットボットやバーチャルアシスタントなどのAI/MLベースのリアルタイムアプリケーション*2をサポートします。
3GPP TSG SA(Technical Specification Group Service and System Aspects) WG2(SA2)は、Release(Rel)-18では、上記で述べたAI/MLと通信ネットワークの間の2つの関係を検討し、「AI for Network」と「Network for AI」の両方の側面に対処するために、次に示す2つの研究項目と対応する作業項目をそれぞれ定義しました。
・研究項目①:FS_eNA_Ph3*3では、5Gコアネットワーク(5GC:5G Core network)の自動化を目的としたAI/MLを実現するため、主要な問題とそれを解決するソリューションを検討し、TR23.700-81(1)に文書化しました。
・研究項目②:FS_AIMLsys*4では、AI/MLベースのサービスをサポートするための5GC拡張の主要な問題とそれを解決するソリューションを検討し、TR23.700-80(2)に文書化しました。
・作業項目①:eNA_Ph3では、FS_eNA_Ph3で結論付けられた内容を主にTS23.288(3)に規定するための作業が行われました。
・作業項目②:AIMLsysでは、主にTS23.288(3)、TS23.502(4)、TS23.503(5)に記載されているFS_AIMLsysのソリューションを規定するための作業が行われました。
本稿では、まず、Rel-18での5GCネットワーク自動化を実現する機能部の主な拡張の概要を示していきます。次に、5GCの新機能の紹介を通じて、AI/MLベースのサービスのサポートについて解説します。
* 本特集は「NTTドコモ・テクニカル・ジャーナル」(Vol.32, No.3, 2024年10月)に掲載された内容を編集したものです。
*1 AI/ML:モデルを用いて推論すること、および、推論に用いるモデルを機械学習により生成すること。
*2 リアルタイムアプリケーション:オンラインゲームやチャットアプリなど、即時更新やフィードバックが行われるアプリケーション。
*3 FS_eNA_Ph3:Study on Enablers for Network Automation for 5G - phase 3。3GPP SA2 Rel-18における検討アイテムの1つ。
*4 FS_AIMLsys:Study on 5G System support for AI/ML-based Services。3GPP SA2 Rel-18における検討アイテムの1つ。
3GPP Rel-18 5GCネットワーク自動化を実現する機能部の機能拡張
第5世代移動通信システム(5G)では、ネットワーク機能、OAM(Operations、Administration、Maintenance)などのさまざまなソースからデータを収集し、分析して統計や予測を提供するNWDAF(Network Data Analytics Function)*5がRel-15で導入されました。Rel-17におけるネットワークデータ分析アーキテクチャを図1に示します。なお、Rel-18においても同様の分析アーキテクチャとなります。
まず、MLモデルの訓練と推論機能は、それぞれMTLF(Model Training Logical Function)とAnLF(Analytics Logical Function)という2つの分離された論理ネットワーク機能によってサポートされています。NF(Network Function)からのデータ収集とその調整は、DCCF(Data Collection Coordination Function)によって行われ、NWDAFなどのデータコンシューマがデータ収集に要するリソースを削減することができます。さらに、収集されたデータと分析結果は、5GCのデータレイクとしてADRF(Analytics Data Repository Function)に格納され、データコンシューマがデータ収集に要するリソースを大幅に削減することができます。
Rel-18では、MLモデルの精度監視、複数のNWDAFによるMLモデルの連合学習(FL:Federated Learning)、エンド・ツー・エンド転送遅延といった機能が追加されました。以下では、NWDAFのサービスと機能のさらなる拡張について解説します。なお、技術詳細についてはNTTドコモ・テクニカル・ジャーナルに記載しています。
*5 NWDAF:5GCで規定されたネットワーク機能の1つ。ネットワーク内のさまざまなデータを収集、分析し結果を返します。
■精度監視
一般に、AI/MLを用いる利点は、ネットワークの性能と効率を向上させることですが、AI/MLベースのソリューションの有効性は、MLモデルの性能に依存します。Rel-18では、MLモデルの精度監視と、分析の精度監視の2つの概念が導入されました。前者は、MTLFを含むNWDAFによって提供されるMLモデルの精度指標で、後者は、AnLFを含むNWDAFによって提供される分析IDと呼ばれる特定の分析に対応した性能指標です。
Rel-18における精度監視アーキテクチャを図2に示します。
この精度監視アーキテクチャでは、デファクト機能であるNFコンシューマでのAI/MLを活用した意思決定、AnLFでの推論、MTLFでのモデル訓練に加えて、新たにAnLFとMTLFにおける「精度確認」機能が提供されます。
AnLFでの精度監視および確認では、例えば、特定の分析IDに関連する予測と予測に対応する正解データをAnLFの精度確認機能が比較することで、NFコンシューマに提供されたAnLFによる分析結果の精度を監視します。
MTLFの精度確認機能を使用すると、例えば、AnLFが提供する精度情報を利用する精度確認機能のロジックに基づいて、MTLFはMLモデルの性能を監視できます。精度監視の結果に基づいて、MTLFはMLモデルを再訓練し、更新されたモデルをAnLFに送信することを決定します。
■複数のNWDAF間のFL
5GCでの複数のNWDAFの配備はRel-17でサポートされていますが、NWDAF間の相互作用はありません。これは、NWDAFの訓練において各NWDAFがアクセス可能なデータベースの訓練データのみを使用してMLモデルを最初から訓練する必要があることを意味しますが、複数のNWDAFで同じMLモデルを訓練すると、計算資源が浪費されるといった問題が生じます。
この問題に対処するために、Rel-18において、NWDAF間のFLが導入されました。FLとは、複数のクライアントが中央サーバの監視下で、訓練データを交換することなく、各クライアントが独自に保持するデータを使用してモデルを共同で訓練する分散型MLモデル訓練手法です。
一般的なFLの訓練手順は、①FLサーバが複数のFLクライアントを選択し、モデルの現在のバージョンを共有する、②各FLクライアントがローカルの訓練データを使用してMLモデルを訓練し、MLモデルの更新情報をFLサーバに送信する、③FLサーバがFLクライアントからの更新情報を集約し、グローバルMLモデルの新しいバージョンを生成する、というステップで構成されます。これらの3つのステップは、停止判定がなされるまで続きます。
■モデルの格納と検索
Rel-17では、ADRFは分析結果やデータの格納先でしたが、Rel-18では、MLモデルの格納先としても使用できます。MTLFを含むNWDAFは、MLモデルをADRFに格納でき、この格納されたモデルをそのNWDAFまたは他のNWDAFが取得できます。このことは、NWDAF間で間接的にMLモデルを共有することを意味します。
■ネットワーク分析の拡充
Rel-18では、さまざまなNFがより知的な意思決定を行うために使用できる、多くの新しい分析が導入されています。分析の具体例を以下に示します。
(1) エンド・ツー・エンドのデータ量転送時間分析
時間制約の厳しいアプリケーションに対するリソース割当てとポリシー制御のために、エンド・ツー・エンドのデータ転送遅延を予測することは有益です。NWDAFは、OAM、SMF(Session Management Function)、AF(Application Function)からエンド・ツー・エンド遅延に影響を与える要因の情報を収集し、UL(UpLink)/DL(DownLink)データ量とそれに対応する転送時間の統計・予測を提供します。
(2) 移動行動分析
資源配分とネットワーク運用の最適化のために、例えば、ネットワークのホットスポットに影響を与える群衆の動きといった、不特定多数の端末から収集された移動情報を持つことは有益であり、Rel-18では移動行動分析が導入されました。移動行動分析では、分析対象地域における期間中の端末の数、移動方向、移動速度など、端末群の行動に関する統計または予測情報を提供します。
3GPP Rel-18 5GC AI/MLベースサービスのサポート
AI/MLを基盤とするサービスは、医療、産業、教育を含むさまざまな領域で急速に活用されています。これらのサービスは、非常に高い計算処理能力と大量の通信リソースを要求するため、通信ネットワークは、これらのサービスからの要求に適応する必要があります。
ここでは、まず、AI/MLを基盤とするサービスをサポートするためにSA1によって特定されたユースケースを述べます。次に、5GCの機能拡充がこれらのAI/MLによるアプリケーションの、特定の要件にどのように対処するかについて、解説します。
■ユースケースと要件
TR22.874(6)では、SA1は5GC上のAI/ML操作(ML訓練・デプロイなど)の主なユースケースとして、次の3つを特定しました。
(1) AI/ML操作の分割
AI/ML操作の分割では、主な焦点は(ML訓練段階ではなく)推論段階にあり、AI/MLの操作およびモデルは、例えば一部分は端末に、他の部分はAFに、といったように現在のタスクと環境に従って複数の部分に分割されます。例えば、AI/ML推論の計算集約的でエネルギー集約的な部分を5GCやAFにオフロード*6し、プライバシーや遅延に敏感な部分は端末に残すことができます。
(2) AI/MLモデルのダウンロード
AI/MLモデルについて、複数のAI/MLアプリケーションが端末上で動作することが想定されており、端末は、タスクや環境の変化に応じてさまざまなモデルを切り替える必要があります。しかし、端末のストレージが限られており、継続的なモデル更新(再訓練)の必要性もあるため、すべてのモデルを端末に直接保存することは現実的ではありません。したがって、端末がタスクや環境の変化に適応できるようにするためには、5GシステムがAI/MLモデルをAFから端末にオンデマンドでオンライン配信する仕組みが必要です。
(3) 5Gシステム上のFL
5GシステムはFL訓練のサポートと促進を含むFLをサポートします。まず、5GCは、端末(すなわち、FLクライアント)の選択を円滑化します。5GCは、AFに支援情報を提供し、FLプロセスに参加するのに適した端末の選択を支援します。さらに、FLサーバは学習を行う予定のFLクライアントに現在のバージョンのモデルを配布します。5GCは、複数の端末へのMLモデルの配布をサポートする仕組みを提供できます。
*6 オフロード:システムやサービス、ネットワークの処理を別の同様のサービスに振り分け本来のサービスの処理を軽減すること。
■ネットワーク開示の拡充
5GCでは、NEF(Network Exposure Function)*7はAFに5GC情報を開示する機能を担っています。AI/MLアプリケーションの場合、Rel-17でサポートされた情報開示に加え、Rel-18では、例えば、適切なAI/ML操作の分割を決定する際に、アプリケーション層をサポートするため、トラフィック量、UPF(User Plane Function)*8から取得したUL/DLデータレートなどの追加情報がAFに開示される場合があります。
*7 NEF:5GCで規定されたネットワーク機能の1つ。3GPP規定外の外部サーバやアプリケーションなどへのAPIを提供します。
*8 UPF:5Gコアネットワークのネットワーク機能の1つ。ユーザパケットのルーチングおよび転送、パケット検査、QoS処理を担う機能。
■AI/MLトラフィック転送サポート
AI/MLアプリケーションでは、AFから端末群へのMLモデルの配布と、MLモデルの計画的な更新という2つのトラフィックパターンが一般的です。これらのトラフィックパターンに対して、Rel-18の5GCでは、複数の端末に対するセッション要求を行うマルチメンバAFセッションと、QoS(Quality of Service)要件付計画的データ転送(PDTQ:Planned Data Transfer with QoS Requirement)ポリシー交渉を使用した計画的なデータ転送のサポートという2つの拡張機能が導入されています。
■アプリケーション層におけるFLの支援
Rel-18の5GCでは、AFがFLサーバとして機能し、端末がFLクライアントとして機能する場合において、アプリケーション層のFLを容易にするための拡張が導入されています。
AFは、端末をFLクライアントのメンバとして選択するために、端末の位置、端末の移動性、端末の5Gシステムへの接続性能など、多くの要因を考慮する必要があります。このような多くのパラメータを収集することは、AFにとって複雑な作業であり、5GCとAFの間の付帯的信号も増加させます。
Rel-18では、NEFは「メンバ端末選択支援機能」と呼ばれる新しいサービスを提供しています。この機能は、AFが提供する対象メンバ端末のリストの中から、1つまたは複数の候補端末のリストと、定義したフィルタリング基準に基づいて5Gシステムが生成した支援情報を基にした追加情報を、外部事業者が取得できるようにするものです。
あとがき
本稿では、Rel-18で規定されている5GCのAI/MLに関する機能拡張について解説しました。具体的には、5GCの運用を最適化するためのAI/ML手法の機能拡充と、AI/MLベースのサービスをサポートするための5GCの拡張について述べました。
まず、精度監視機能、複数のNWDAF間のFL、多数の新しい分析を含むNWDAFアーキテクチャ、機能およびサービスの拡張について説明しました。
次に、AI/ML操作分割を含むAI/ML操作、MLモデルのダウンロード、およびアプリケーション層FLをサポートするための5GCの拡張について述べました。
今後、通信ネットワークにおいてAI/MLはますます活用されることが想定されるため、NTTドコモは引き続きSA2での標準化活動を推進していきます。
■参考文献
(1) 3GPP TR23.700-81 V18.0.0:“Study of Enablers for Network Automation for the 5G System (5GS); Phase 3,”Dec. 2022.
(2) 3GPP TR23.700-80 V18.0.0:“Study on 5G System Support for AI/ML-based Services,”Dec. 2022.
(3) 3GPP TS23.288 V18.5.0:“Architecture enhancements for 5G System (5GS) to support network data analytics services,”March 2024.
(4) 3GPP TS23.502 V18.5.0:“Procedures for the 5G System (5GS); Stage 2,”March 2024.
(5) 3GPP TS23.503 V18.5.0:“Policy and charging control framework for the 5G System (5GS); Stage 2,”March 2024.
(6) 3GPP TR22.874 V18.2.0:“5G System (5GS); Study on traffic characteristics and performance requirements for AI/ML model transfer,”Dec. 2021.
(左から)Bahador Bakhshi/Malla Reddy Sama/iccardo Guerzoni/巳之口 淳
問い合わせ先
NTTドコモ
R&D戦略部
E-mail dtj@nttdocomo.com
NTTドコモは、お客さまに新しい体験を提供するため、また、お客さまのビジネスのデジタル化対応をお支えするため、今後とも研究開発や標準化活動に取り組んでいきます。