NTT技術ジャーナル記事

   

「NTT技術ジャーナル」編集部が注目した
最新トピックや特集インタビュー記事などをご覧いただけます。

PDFダウンロード

特集1

より強靭性の高いネットワークの実現に向けて

大規模システム故障時の「ネットワーク状況の早期把握」

NTT研究所では、ロバストなネットワークの実現に向け、その運用を高度化する技術開発を進めています。本稿では、複雑化・多様化するネットワークサービスのネットワーク状況とサービス影響の迅速な把握を可能とする研究開発の取り組みを紹介します。

明石 和陽(あかし かずあき)/金井 俊介(かない しゅんすけ)
NTTアクセスサービスシステム研究所

はじめに

NTT研究所では、ネットワークシステムの故障や大規模災害への耐性が強いロバストネットワークをめざして、ネットワークの故障の発見、故障個所の切り分け、サービス影響の把握を早く正確に行い、故障が発生したときにも迅速な対応を可能とするオペレーション技術の研究開発を進めています。
本稿では、これらを実現する技術の中で、多様な通信プロトコルで構成されるネットワークを一元管理することでサービス影響の早期把握を可能にするネットワークリソース管理技術(NOIM:Network Operation Injected Model)と、ネットワークから取得したアラーム等の情報から異常検知・故障個所推定を行うAI(人工知能)技術〔DeAnoS®(Deep Anomaly Surveillance)、Konan(Knowledge-based autonomous failure-event analysis technology for network)〕について紹介します。

ネットワークリソース管理技術

通信事業者のネットワークサービスは、光伝送ネットワークやイーサネットワーク、IPネットワーク等、異なる通信プロトコルを組み合わせたマルチレイヤのネットワークによって提供されています。通常、それらのネットワークは個別のシステムによって管理されているため、あるレイヤのネットワークの故障が他レイヤのネットワークやサービスに及ぼす影響は人手で分析する必要があります。しかし、大規模故障時は故障個所や影響が広範囲に及ぶため、ネットワーク状況やサービス影響の把握に長時間を要する可能性があります。
これまで私たちは、サービス影響の早期把握を実現するネットワークリソース管理技術(NOIM)の研究開発に取り組んできました(1)。本技術は、情報転送の終端点やパスなど、レイヤに依存しない汎用的なデータ形式でネットワーク情報を表現することで、多数の通信プロトコルを組み合わせた複雑なマルチレイヤネットワークを一元管理し、故障に伴うサービス影響を迅速に把握することを可能にするものです。
ネットワークリソース管理技術は、TM Forum(2)で議論されている情報フレームワーク(SID:Shared Information and Data Model)で定義されたエンティティを採用し、汎用的なデータ形式によるネットワークのリソース管理を実現します。具体的には、SIDのPhysical ResourceとLogical Resourceに規定されたエンティティを採用しています。Physical Resourceには、通信装置(PD:Physical Device)、光ファイバ等の物理リンク(PL:Physical Link)、それらを収容する通信ビル(PS:Physical Structure)やケーブル(AGS:Aggregate Section)など、ネットワークの物理的なリソースを表現するためのエンティティが定義されています。同様にLogical Resourceには、情報転送の終端点(TPE:Termination Point Encapsulation)、情報転送が可能な領域(NFD:Network Forwarding Domain)や情報転送のパス(FRE:Forwarding Relationship Encapsulation)など、ネットワークの論理的なリソースを表現するためのエンティティが定義されています。これらの汎用的なエンティティを用いて、図1のように各リソースやリソース間の接続関係を表現することで、多様な通信プロトコルで構成されるマルチレイヤのネットワークの管理を可能にします。
なお、ネットワークリソース管理技術は、各通信プロトコル固有の特性を外部定義し、上記の汎用的なエンティティに紐付けて管理する機構を備えています。固有の特性には、例えばIPネットワークにおけるIPアドレスやイーサネットワークにおけるVLAN IDなどが該当します。通信プロトコルによらない共通の特性は汎用的なSIDのエンティティで表現し、通信プロトコルによる固有の特性は外部定義として追加可能にすることで、通信プロトコルやサービスの追加や変更に柔軟に対応できます。
そして、本技術によって一元管理したネットワーク情報を基に、故障が発生したときの影響を迅速に把握可能です。例えば、自然災害によって図1のようにビル間のケーブルが切断された場合を考えます。このとき、そのケーブルに収容されている光ファイバ、ならびに、光ファイバ上の各レイヤの論理リソースが故障の影響を受けます。ネットワークリソース管理技術により各リソース間の関係を保持しているため、それらの関係を辿ることで、ケーブル故障の影響を受ける物理リソースや論理リソースを容易に判定できます。なお、この判定ロジックは、ケーブル(AGS)、光ファイバ(PL)、情報転送の終端点(TPE)やパス(FRE)といった汎用的なエンティティに基づくものであるため、ネットワークのレイヤ構成が変わった場合もロジックを変更する必要がありません。
一方、自然災害によるケーブル切断やビル停電等と異なり、ネットワークシステムの故障では、ネットワークの一部の通信が不安定になりサービスがつながりにくくなる事象が発生します。このような事象において、システム故障の影響エリアや利用者数を正確に把握するには、各サービスのトラフィックが流れている経路や通信が不安定な経路を考慮して、サービス影響を判定する必要があります。そこで、私たちは大規模故障対応支援に向けて、ネットワークリソース管理技術について以下の拡張に取り組んでいます(図2)。
(1) サービスパスレイヤの追加
より細かい粒度でサービスの影響を把握可能にするために、通信プロトコルごとのレイヤに加えて、サービスパスレイヤを追加します。このレイヤのリソースは、ネットワーク上で提供されるサービスのエンド・ツー・エンドの接続を表現します。従来は、通信プロトコルとおおむね同等の粒度でサービス影響を判定していましたが、サービスパスレイヤの追加によりエリア単位やユーザ単位といった任意の粒度でのサービス影響把握を可能にします。
(2) サービスの利用経路を考慮した影響把握
ネットワークシステムの故障によりつながりにくくなっているサービスを把握するために、各サービスのトラフィックが通信の不安定な経路を流れていないかを考慮した判定を行います。各サービスの利用経路(リソース)を汎用的なエンティティで表現し、それらのリソースの故障状況に基づいて影響を判定することで、つながりにくくなっているサービスを把握します。
(3) 不安定な経路の把握
通信が不安定になっている経路を把握するために、各サービスの必要帯域や利用経路情報を基にした判定を行います。各レイヤのリソースに帯域情報を追加し、各サービスの帯域と利用経路のリソースの帯域を比較することで、帯域逼迫により通信が不安定になっている経路を把握できます。ただし、ネットワークが不安定になる要因は帯域逼迫に限らないため、上記の方法に限らず他の技術も活用し、不安定な経路を把握することが必要です。

異常検知・故障個所推定AI技術

ネットワークの故障の早期発見、故障個所の迅速な切り分けを実現するために、アラーム等のネットワーク情報から異常検知・故障個所推定を行うAI技術の研究開発にも取り組んでいます。
・DeAnoS®:潜在的な性能劣化リスク(故障・輻輳等)や需要変化を予見的・早期に検知し、事前の制御、早期・自動復旧を行う「プロアクティブ制御型ネットワーク」をめざす技術です。
・Konan:マルチレイヤのネットワーク故障個所の推定を可能とする技術です。ネットワーク上で故障が起きた際のアラーム等の発生状況をルールとして学習します。故障発生時のアラーム情報とネットワーク構成情報ならびに学習したルールに基づいて物理装置の故障個所だけでなく、論理構成上の故障個所を推定し、効率的に故障の原因となった個所の候補を導出します。

おわりに

本稿ではロバストネットワークを実現するためのオペレーション技術について解説しました。NTT研究所では個々の技術開発だけではなく、それらの技術群の容易な連携・導入をめざしたゼロタッチオペレーションフレームワークの研究開発も推進し、さらなるネットワーク状況の早期把握ならびに復旧対応の迅速化に貢献していきます。

■参考文献
(1) 佐藤・西川・深見・村瀬・田山:“ネットワーク種別に依存しない統一管理モデルを用いたサービス影響把握技術,”NTT技術ジャーナル,Vol.32, No.8, pp.51-53, 2020.
(2) https://www.tmforum.org/

(左から)明石 和陽/金井 俊介

NTTアクセスサービスシステム研究所は、ネットワークリソース管理技術を検討・研究し、多様化・複雑化している社会課題をオペレーションの観点で解決していくことで「つながり続けるネットワーク」の実現に貢献していきます。

問い合わせ先

NTTアクセスサービスシステム研究所
アクセスオペレーションプロジェクト
E-mail ohoug-noim@ntt.com