グローバルスタンダード最前線
ISO/IEC JTC 1/SC 29/WG 11(MPEG)における次世代映像符号化標準化動向
ISO/IEC JTC 1のSC(Sub Committee)の1つであるSC 29は、音声・画像・マルチメディア情報符号化をスコープとし、特にそのWG(Working Group)の1つであるWG 11では、動画符号化、メディア伝送、ストリーミング、音声符号化、画像探索やゲノム情報符号化などを標準化しています。また、ITU-T SG19と合同で映像符号化のさらなる高圧縮化をめざした次世代動画符号化規格VVC(Versatile Video Coding)の標準化を2018年4月から本格始動しています。ここでは、VVCの標準化経緯と目標、現状の進捗を紹介します。
PROFILE
高村 誠之(たかむら せいし)
NTTメディアインテリジェンス研究所
次世代映像符号化の必要性
ISO(International Organization for Standardization)/ IEC(International Electrotechnical Commission) JTC(Joint Technical Committee)1 傘下のSC (Sub Committee)の1つであるSC 29(音声、画像、マルチメディア、ハイパーメディア情報符号化)は、マルチメディア符号化規格の標準化を行っています(1)、(2)。SC 29配下にはWG(Working Group)が2つ存在しており、うち1つであるWG 11は、Moving Picture Experts Group(MPEG)と呼ばれ、音声・動画像・システムの符号化伝送技術、高圧縮符号化、多重化、三次元映像符号化、動画像検索、伝送などの技術の標準化を進めています。これらの規格はMPEGシリーズと呼ばれています。
全世界のIPトラフィックは急激に増加しており、2017年には月間122 EB(エクサバイト、エクサは100京)であったと報告されています(3)。これは年平均成長率26%で増加しており、2022年には3倍強の月間387 EBに達する見通しです。しかも、2017年には全IPトラフィックの75%が動画データにより占められていましたが、2022年にはこの割合が実に82%に達するとみられています。これらの動画データの多くはMPEGが作成・標準化した映像符号化規格により非圧縮サイズの数100分の1程度にまで圧縮されています。当該規格がなければ世の映像サービスはおろか通信サービス全般が破綻することは明らかですし、動画データトラフィックの急速な増加傾向にかんがみますと、さらなる圧縮率向上が必要とされています。
最新の映像符号化規格H.265/HEVCの標準化とVVCへの道程
現在最新の映像符号化国際規格であるH.265/MPEG-H HEVC(High Efficiency Video Coding)は、WG 11とITU-T SG16 WP3 Q.6(VCEG)との合同組織JCT-VC(Joint Collaborative Team on Video Coding)により標準化作業が2010年に始められ、初版最終仕様(FDIS)が2013年1月に完成しました。4K/8K TV放送・配信などで用いられ、世界で20億台以上のHEVC対応機器が出荷されています。初版発行後も現在に至るまで拡張規格の追補やそれらの統合版などが出版されています(4)。
HEVCは従前の規格に比べ2倍以上と十分高い圧縮効率を誇っていますが、前述のような圧縮率向上への強い期待から、より優れた映像符号化規格への挑戦を続けるためにMPEGは2014年からFuture Video Coding(FVC)と呼ばれる次世代符号化規格をにらんだ活動を開始しました。
2014年10月のストラスブール会合内で、通信・ネットサービス・ハードウェア事業者を交えたブレーンストーミングを実施し、FVCの要求条件として放送・IPTV・素材伝送・デジタルシネマ・監視・モバイル視聴・TV会議・VR(Virtual Reality)などが挙げられ議論されました。2015年2月にはJCT-VCはKTA(Key Technical Area)という次世代映像符号化参照ソフトウェアの開発を開始しました。2015年10月のGeneva会合において次世代映像符号化規格の標準化を行う合同チーム Joint Video Exploration Team(JVET)が結成されました。またこのとき参照ソフトウェアKTAはJEM(Joint Exploration Model)に継承されました。2016年6月にはMPEGがFVCの機能・性能に関する要求条件を発行しました(5)。2017年1月にJEMがHEVCに対し有意な性能差を持つことが確認されました(6)。2017年4月にはCall for Evidence(CfE)(7)を発行しました。2017年10月には新規提案募集Call for Proposal(CfP)(8)発行にあたってチーム名をJoint Video Experts Team(同じくJVET)に改称しました。会合後21機関から26の方式提案(CfP Responses)があり、主観客観評価結果がまとめられました。それを受けて2018年4月のSan Diego会合において評価結果を検討し、新規格のベース方式となる参照ソフト(VTM1)と文書(WD1)を定め、標準化を開始しました。また同時に規格名称をISO/IEC 23090-3 MPEG-I VVC(Versatile Video Coding)と決定しました。MPEG-IのIはImmersive Media(没入型メディア)の略です。
VVCの標準化状況と今後の予定
VVCがカバーする範囲はStandard Dynamic Range(SDR)、High Dynamic Range(HDR)、360°(上下左右前後の全方向をカバーするVR向け映像)の3つであり、さまざまな候補技術の性能を確認する探索活動を行っています。目標とする性能はH.265/HEVC比で(同一の主観画質において)30%から50%のビットレート削減であり、2020年10月の標準化完了(FDIS化)を予定しています。
JVETは標準化会合を年に4回行い、会合ごとに提案ツールの評価実験結果を主観・客観的に精査し、さまざまなバックグラウンドを持つ参加者の合意に基づき、新規に採用するツール(圧縮アルゴリズム要素)を決定し、国際規格の基となる作業文書(WD)を更新しています。同時に、参照ソフトウェアVTMに対し採用ツールの実装、(標準化対象外ですが)エンコーダの高速化や高性能化、バグフィックスがオープンなリポジトリで施され、バージョンが更新されます。標準化の寄与文書数は2018年4月(標準化開始)118件、2018年7月559件、2018年10月690件、2019年1月903件と増加しており、これはHEVC標準化当初を上回るペースです。今後の会合はGeneva(2019年3月)、Gothenburg(2019年7月)、Geneva(2019年10月)、Brussels(2020年1月)、Alpbach(2020年4月)、Geneva(2020年6~7月)を経て、Rennes (2020年10月)でFDISとなります。
本稿執筆時点で最新の参照ソフトウェアVTM4.0の性能は、HEVC参照ソフトウェアHM-16.19比で31.52%の符号量減となっています(ランダムアクセス符号化条件下)。また演算量の目安として符号化(エンコード)時間は約8.1倍、復号(デコード)時間は約1.5倍となっています。
現状の主な採用技術を表に示します。このうち特にCST(Chroma Separate Tree)、 CCLM(Cross-Component Linear Model)、ALF(Adaptive Loop Filter)、AFF(AFFine transform)、MTS(Multiple Transform Set)、DQ(Dependent Quantization)等が性能向上に大きく貢献しています。さらにはニューラルネットワークを利用した高性能化の提案もあり、評価・検討がなされているところです。
表 主なH.265/HEVC採用技術とVVC採用予定技術
今後の展開
ここではVVCの標準化の経緯と最新動向、そして今後の予定を紹介しました。MPEGではVVC以外にも映像検索規格MPEG-7 Part 15 Compact Descriptors for Video Analysis(CDVA)、ニューラルネットワーク自体の圧縮やゲノム情報の圧縮を行うMPEG-Gの標準化を行っていますし、3D空間中に属性を持ついわゆる「点群」の圧縮(PCC: Point Cloud Compression)に関しVideoベース(V-PCC)、Geometryベース(G-PCC)の両方向からの標準化を行っており、V-PCCはMPEG-I Part 5として2020年1月FDIS予定、G-PCCは同Part 9として2020年4月FDIS予定です。また高密度光線空間符号化、広い空間で6自由度のフリーナビゲーションによる没入感体験を提供する6DoF符号化、 限定された空間で没入感体験を提供する3DoF+符号化も標準化しようとしています(9)。3DoF+は2019年1月のマラケシュ会合でCall for Proposals(CfP)文書(10)が発行され、MPEG-I Part 7として2020年7月のFDIS化をめざしています。さらに、二階層空間スケーラビリティを実現するLow Complexity Video Coding Enhancements(11)、HEVC以上の性能を有する代替規格Essential Video Coding(MPEG-5 Part 1)(12)の標準化も進められており、MPEGの活動はますます広範囲化・活発化しています。
■参考文献
(1) https://www.itscj.ipsj.or.jp/sc29/
(2) 高村:“ISO/IEC JTC 1/SC 29における画像・映像符号化関連の標準化動向、”NTT技術ジャーナル、Vol.27、No.8、pp.67-71、2015。
(3) https://www.cisco.com/c/ja_jp/solutions/collateral/service-provider/visual-networking-index-vni/white-paper-c11-741490.html
(4) JCT-VC:“Text of ISO/IEC FDIS 23008-2 (4th edition)、”N18277, Jan. 2019。
(5) ISO/IEC JTC 1/SC 29/WG 11:“Requirements for a Future Video Coding Standard v4、”N16359, June 2016。
(6) T. Suzuki:“BoG report on test material、”JVET-E0132, Jan. 2017。
(7) “Joint Call for Evidence on Video Compression with Capability beyond HEVC、”JVET-F1002, 6th JVET Meeting, March 2017。
(8) “Joint Call for Proposals on Video Compression with Capability beyond HEVC、”JVET-H1002, 8th JVET Meeting, Oct. 2017。
(9) ISO/IEC JTC 1/SC 29/WG 11:“Summary on MPEG-I Visual Activities、”N18166, Jan. 2019。
(10) ISO/IEC JTC 1/SC 29/WG 11:“Call for Proposals on 3DoF+ Visual、”N18145, Jan. 2019。
(11) ISO/IEC JTC 1/SC 29/WG 11:“Call for Proposals for Low Complexity Video Coding Enhancements、”N17944, Oct. 2018。
(12) ISO/IEC JTC 1/SC 29/WG 11:“Working Draft 1 of Essential Video Coding、”N18283, Jan. 2019。