NTT技術ジャーナル記事

   

「NTT技術ジャーナル」編集部が注目した
最新トピックや特集インタビュー記事などをご覧いただけます。

グローバルスタンダード最前線

ITU-T SG12 標準化動向

通信サービスを適切な品質で提供するために、ネットワークおよびサービスの設計・管理は極めて重要であり、そのためには、定量的に測定・評価する技術が必要となります。ITU-T(International Telecommunication Union - Telecommunication Standardization Sector) SG(Study Group)12では、ユーザがサービスに対し、体感する品質(QoE: Quality of Experience)とその目標値を達成するために要求されるネットワーク品質(QoS: Quality of Service)の評価法、測定法、規定値等に関する研究を行っています。ここでは、音声・映像メディアの品質評価・管理技術に関する最新の標準化動向を中心に紹介します。

松尾 洋一(まつお よういち)/山岸 和久(やまぎし かずひさ)
小池 正憲(こいけ まさのり)
NTTネットワークサービスシステム研究所

ITU-TSG12

ITU-T(International Telecommunication Union - Telecommunication Standardization Sector) SG(Study Group)12はITU-TにおけるQoS/QoE検討に関するリードSGです。欧州のETSI(European Telecommunications Standards Institute)や北米のATIS(Alliance for Telecommunications Industry Solutions)においてもメディア品質評価法の標準化は行われています。また、ネットワークQoS規定についても、IETF(Internet Engineering Task Force) や3GPP(Third Generation Partnership Project)等さまざまな標準化機関で行われています。そのため、ITU-T SG12がこれら地域標準を考慮しつつグローバルにリーダシップをとり、ドキュメントの整合性を確保しています。

音声通話品質推定技術(勧告G.107.2)

IP電話サービスを対象とした品質設計ツールとして勧告G.107(E-model)が標準化されており、世界中で広く用いられています。日本国内でも、IP電話サービスの品質を規定するJJ201.11がE-modelに基づいて算出されるR値によって規定されています。これまで、SG12ではE-modelをフルバンド(20~20000Hz)音声の評価に拡張する検討を進め、その基本アルゴリズムを勧告G.107.2として制定しています。今回、このアルゴリズムを背景ノイズ、バーストパケット損失、遅延に対応させるための拡張がされ、音質劣化量(le、eff)、遅延・エコー劣化量(ld)、音量劣化量(Ro、ls)の計算アルゴリズムの修正やパラメータ追加を行い、G.107.2を改訂しています。これにより、さまざまな条件下でフルバンドのE-modelが利用可能となりました。

マルチメディアアプリケーション、映像配信の映像品質、音声品質、視聴覚品質の主観評価法(勧告P.910、勧告P.911、勧告P.913)

マルチメディアアプリケーションや映像配信のサービス設計等を目的に、映像・音声品質の主観評価実験法が検討され、これまで勧告P.910(映像品質の主観実験法)、勧告P.911(視聴覚品質の主観実験法)、勧告P.913(映像配信の映像配信品質、音声品質、視聴覚品質の主観実験法)、が制定されてきました。しかし、P.910、P.911、P.913には重複する内容も多いため、P.913の記載をベースとしこれらを1つに統合する検討がされています。併せて、現在使用されていないMUSHRA(Multi-Stimuli with Hidden Reference and Anchor points)の記載の削除、P.910に記載されている映像の空間情報量、時間情報量の算出法をP.913に反映させること、などが検討されています。これらの検討は主に、VQEG(Video Quality Experts Group:映像品質専門家会合)で進められてきた経緯があり、今後もVQEGで進められた議論に基づき勧告が改訂される予定です。

アダプティブビットレートストリーミングに対する品質推定技術と劣化要因分析技術(勧告P.1203、勧告P.1204、勧告P.DiAQoSE)

これまでアダプティブビットレートストリーミングの品質監視のために、H.264/AVC(Advanced Video Coding)で符号化されたHD解像度の品質監視技術を規定する勧告P.1203や、4K映像およびH.265/HEVC(High Efficiency Video Coding)に対応した品質監視技術を規定する勧告P.1204.3、P.1204.4、P.1204.5が制定されてきました。近年では、AV1(AOMedia Video 1)による映像配信も増えているため、新しい符号化方式に対応させる検討が行われています。
また、より高度なアダプティブビットレートストリーミングサービスの管理のために、品質の劣化要因を解析する方法論(勧告P.DiAQoSE)の検討も行われています(図1)。勧告P.DiAQoSEでは、P.1203やP.1204.3、P.1204.4、P.1204.5などのモデルへの入力となった品質パラメータ(ビットレート、解像度、フレームレート、再生停止情報)が、品質値をどの程度下げたか(劣化量)を算出します。具体的には、ある視聴において選択できる最大の品質値と現在の品質値との差(総劣化量)を、Shapley理論を基に品質パラメータごとに分配することで、品質パラメータの劣化量を算出します。図1の例では、ユーザ1とユーザ2の映像の視聴履歴に対するP.1203で推定したMOS(Mean Opinion Score)の値は、それぞれ2.95、2.98と近い値となっていますが、P.DiAQoSEを用いて品質パラメータごとの劣化量を算出すると、ユーザ1は画質レベル2による影響が大きい一方、ユーザ2は再生停止がMOS値を大きく下げていることが分かります。このように、従来の品質監視技術に加え、品質パラメータごとの劣化量が分かることで、品質改善の検討がより行いやすくなります。
新しい符号化への対応により、引き続き映像配信の適切な品質監視が可能となるとともに、P.DiAQoSEにより品質劣化時の分析の高度化が期待できます。

自動運転における物体認識率の推定手法(P.Obj-recog)

自動運転では、運転主体や走行可能エリア別にレベル0からレベル5まで6段階の自動運転レベルがSAE(Society of Automotive Engineers: モビリティ専門委員会)で規定されており(1)、この中でも部分的に運転が自動化されるレベル2では、運転手に代わり遠隔地にある監視センタが車載映像を基に障害物の検知や緊急時の運転を支援するというサービスの提供が開始されています。このサービスでは、符号化され監視センタに送信された車載映像を基に、監視者が道路上の障害物の有無の確認を行います。そのため、車載カメラから送信される映像品質が、人が物体を認識できる程度に鮮明である必要があります。そこで、常時、物体認識に耐え得る映像が配信されていたことを確認するため、図2にあるように、人が符号化された映像から物体を認識できる確率を導出する技術を検討する、勧告P.obj-recogがワークアイテムとして立ち上がりました。これにより、車載カメラから送信された映像の品質監視が可能となります。今後、車載映像を用いた主観評価実験の結果を基にモデル化が進められる予定です。

ARサービスのQoE要因とXRサービスを対象とした客観品質評価法(勧告G.1036、PSTR-OQMXR)

AR(Augmented Reality)サービスの品質を評価できるようにするため、ARサービスのQoE要因を規定する勧告G.1036が制定されました。本勧告では、ユーザの顔の周辺に物体を付加してユーザの顔を加工するARサービスと、屋内外で現実空間に物体を付加して現実空間を加工するARサービスに関して、QoE要因となる項目を規定しています。従来の音声・映像のQoE要因で使用されるビットレート、解像度、フレームレート、伝送遅延、デバイスサイズなどの項目に加えて、ユーザの顔や現実空間に存在する物体の検出性能など現実空間の物体と付加する物体の融合度合いに関する品質と、ARサービスの応答性能や正確さなど、ユーザとARサービスの相互作用に関する品質を規定しています。
また、XRサービスを対象とした客観品質評価法に関するテクニカルレポートを作成するPSTR-OQMXRがワークアイテムとして立ち上がりました。本テクニカルレポートは、XRサービスを対象とした既存の客観品質評価法の現状や課題、および推定モデルを作成するために取り組むべき課題を明らかにすることを目的としています。

機械学習手法を用いたQoS/QoE予測のガイドライン(P.1402)

機械学習手法を用いた技術検討に対応するため、QoS/QoEなどの予測に機械学習手法を適用する場合のガイドラインを規定する勧告P.1402が制定されました。機械学習を使用する場合の学習・評価データの構築方法、機械学習手法のカテゴリ分け、過学習を回避する方法といった機械学習を使用するための基礎知識から、P.565シリーズのような音声・ビデオのQoS/QoE予測に機械学習を使用する場合の入出力例、手法などの具体的なユースケースが記載されています。これにより、適切にSG12の標準化技術に機械学習手法を適用することが期待されます。

チャットボットの主観実験法(P.852)

近年、さまざまなサービスにおいてユーザからの問合せの応答にチャットボットが使用されています。これに対応するため、テキストベースのチャットボットの主観品質評価法を規定する勧告P.852が制定されました。この勧告では、チャットボットの品質要因として、全体の印象、システム情報、システムの動作、システムに対するユーザの印象を記載しています。また、主観評価実験として、チャットボットと被験者が相互に会話をする実験の方法や留意点、被験者による評価方法について記載しています。

今後の展望

ITU-T SG12におけるメディア品質評価法の標準化においては、音声通話や映像配信への対応がおおむね整備されておりますが、映像配信において新たな符号化方式への対応や、フルバンドE-modelの改訂など既存の勧告のメンテナンスが行われています。さらに、自動運転に使用する監視映像の品質といった、これまでにないサービスの品質に関する検討も始まっています。
今後も、5G(第5世代移動通信システム)/6G(第6世代移動通信システム)の推進に合わせ多様なサービスが展開されることが期待されますので、各種サービスに対するQoS/QoEの設計・管理がますます重要になってくると考えられます。そのため、今後もSG12の検討状況を把握していくことが重要になると考えられます。

■参考文献
(1) SAE International:“Taxonomy and definitions for terms related to driving automation systems for on-road motor vehicles,” 4970.724, pp. 1-5, 2018.