見返りを期待せず、頼まれごとは断らない。損得勘定なしで臨めば、未来が切り拓かれる

2021年2月号

挑戦する研究者たち

見返りを期待せず、頼まれごとは断らない。損得勘定なしで臨めば、未来が切り拓かれる

インターネットの普及に伴い、映像は日常生活においてあらゆるところに存在し、利用されています。私たちがTV放送やインターネットにより映像が高品質で送受信され利用できる、ストレスフリーな状況は映像符号化技術が支えています。また、IoTセンサの普及・高度化により2040年ごろにはデータ量が40YBに増加すると予想され、こうした膨大なデータに対応する技術は国内外から大きな注目を集めています。この膨大なデータに対応する符号化技術「万象オーガナイズ技術」と、それを研究していく中での研究者としてのあり方について、高村誠之NTTメディアインテリジェンス研究所上席特別研究員にお話を伺いました。

高村　誠之　上席特別研究員
NTTメディアインテリジェンス研究所

従来とは違うアプローチで映像符号化技術の最先端を走る

現在、手掛けている研究について教えてください。

私が研究しているのは「万象オーガナイズ技術」です（図1）。2040年ごろには40YB（ヨタバイト、10¹²TB）にまで増加するといわれる膨大な生成データを、余さず利用可能にすることを目標とした超高圧縮符号化技術です。こうした膨大なデータの保存、流通において、ストレージ容量や伝送容量に収まるようにするために、情報トリアージ（選別）をベースとした検討が現在の主流となっています。この場合、トリアージの規則に従って優先度の低いデータは捨てられることになり、貴重なデータもこの中に含まれる場合もあります。こうした状況に対して、ノイズ除去や情報圧縮の視点を強化することで、データを捨てることなく保存、流通させるのが、万象オーガナイズ技術で、世の中で使われている一般的な技術よりも品質を高く保ちながら100～1000倍の圧縮を可能とします。この技術を使ってデータの流通基盤をデータ量からデータの質へと変化させればさまざまな応用先の開拓や新しいビジネスを創出できると考えます。特に、万象オーガナイズ技術ではデータ量の8割以上を占める映像データに着目しています。映像のデータ使用量は年々増大していますから、この整理が万象オーガナイズの大きなポイントとなります。

この技術で未来のIT生活も快適になりそうですね。柱となる技術について教えてください。

万象オーガナイズ技術は、点群処理・符号化、光線空間処理・符号化、認識誤差抑制型符号化、360°映像処理・符号化、符号化志向映像生成等、多くの技術要素から構成されているのですが、その中でも柱となるのは「実体マイニング符号化技術」です（図2）。これまでの符号化技術は実体を映した映像そのものに対して符号化を行うのですが、実体マイニング符号化技術は、撮影された映像からノイズ、歪、ピントのずれ、情報の欠落等の擾乱を除去し、被写体本来の姿を推測し、それを基に符号化する技術です。現実に存在している素材や物体の状態・情報をでき得る限り忠実に抽出（推測）して符号化するため、撮影された映像の品質を超え、本物に迫る映像を再現します。もちろん圧縮されたデータ量は従来の方式よりも少なくすることができます。
実体マイニング技術の応用としてはいくつかあるのですが、中でも、現在注力しているのが水面の揺らぎを通して見える映像の実体を、映像として再現する水底映像符号化技術です（図3）。映像に臨場感を与える重要な構成要素である水のシーンにおいて、従来方式では特に符号化が難しかったものです。国際会議で受賞するなど高い評価をいただきました。論文誌にも投稿をお誘いいただいています。現在は、さらにそれを進化させて、最新版の「国際規格参照ソフトウェア」との性能を比較するため、4～5カ月単位の非常に時間がかかるシミュレーションを一からやり直しています。
また、点群映像の符号化にも挑んでいます。点群は3次元空間中に格子点状に沿わず存在する（規則正しくない位置に存在する）点の集まりで、非常に自由度が高く、多量なデータで表現されます。これはすでに国際標準化された符号化技術もありますが、これとは異なったアプローチで、自由度を下げることで圧縮率を上げ、さらに映像の複数フレーム＊1間で情報をうまく統合することで、二律相反する品質と圧縮率の向上を両立できないかと考えています。
さらに、ある観察対象実体をさまざまなセンサによりさまざまな場所から取得する「マルチモ―ダル」信号の情報は、取得する時間サンプル位置も空間サンプル位置も格子点状になく、次元（温度、座標、色、音圧）も異なりますが、実体は1つなので、これらの情報は互いに相関があるはずで、それを見出せばノイズを低減したり、先を予測したり、データ量をコンパクトに圧縮して使いやすくする、といった有益なことができると考えられます。しかしながら、現在はそのような信号を統合的に扱う基盤理論がありません。単一モーダルの信号であればグラフ信号処理＊2（図4）という枠組みの研究が活発になされていますが、それをマルチモーダル信号へと発展させていくのが課題です。
そして、データの生成源であるセンサのところも、観察対象実体に対してあまりに潤沢にセンシングしてしまっている可能性があります。イメージセンサでいえば画素が間引かれた状態で取得しても、後段の計算処理によりある程度正確な画像信号を得ることができる「圧縮センシング」という技術があります。低消費電力化にもつながるため、将来IoTセンサが至る所に存在するようになればなるほど、この「入口でデータを絞る」行為は重要性を増すと考えています。後段の計算で信号を復元するところが鍵で、これが賢くなるほど正確な観測ができます。新たな計算原理に基づく復元の高精度化、またマルチモーダル環境における異モーダル間協調復元への発展などが課題と考えています。
今後は、こうした技術をJPEGやMPEGのような標準規格として確立していきたいと考えています。道のりは長く、ハードルも高いのですが、だからこそのやりがいを感じています。

＊1 フレーム：映像を構成する1枚の画像の単位。例えば日本の放送の映像は1秒間に30フレーム、一般的な映画は毎秒24フレームから構成されています。
＊2 グラフ信号処理：ノード（点）とエッジ（線または辺）で情報の構造を表現する方法の1つであるグラフを用いた信号処理。ソーシャルネットワークやセンサネットワークからの信号を適切・効率的に分析するのに利用される比較的新しい信号処理技術。

大成功以外にも中成功も、小成功も、それ以外もある

研究者として歩まれてきた中で得られた教訓をお聞かせいただけますか。

NTTに入社して数年は、時間を気にせずに試行錯誤を繰り返していました。これは若い人の特権で、時間が許すならぜひそうすべきだと思いますが、年を重ねると時間は無限ではないことを実感します。2006年、NTT OBの石井裕MIT（マサチューセッツ工科大学）教授が横須賀通研にいらして研究戦略について話をされました。石井教授は、研究のタイムラインにおいて自らの寿命を示して計画をせよと話されていましたが、当時の私はすぐには理解できませんでした。
ところが忙しくなって試行錯誤する時間が限られてきた今になって、時間は有限なリソースだと痛感しています。研究活動を吟味して行動せざるを得ませんから、テーマを絞って研究をするようになりました。
幸いにして、絞った結果のテーマの方向性はあまり外れてはおりませんが、逆にこれは若いころに試行錯誤しておいたからだと考えます。前述の水底映像符号化技術はそれが功を奏した例です。この技術の追究において、与えられた映像を圧縮するのに「あえてフレームを1枚増やす」というひねった発想に加え、1枚増やしたフレームがどのようになっていれば符号化がしやすいだろうか、ということを「符号化器（エンコーダ）」の立場にたって考え抜いた末に、「エンコーダに（増やすべき）フレームを生成させる」「一度で生成をやめず、何度も繰り返す」という発想にたどり着きました。言葉で示すと簡単に聞こえますが、1度の生成には15時間余りかかりますから、何度も繰り返すには相当な根気と努力を要しました。これについては、テーマを絞り込んだ後の話ではありますが、試行錯誤を繰り返すという体験がなければ、ここまでの発想に行きつかなかったと思います。
この水底映像符号化に特化した国際コンペを2年にわたり主催したのですが、そこで各国の研究者が競い合った中のトップデータを、本方式は上回るものでした。そして、国際会議に投稿すると3名の査読者が全員最高評価をくださるという初の経験をし、さらにその会議の優秀論文として表彰され、この分野の権威の一人であり尊敬するオーストラリアの教授に「水底に限らず他の用途にも使うことができるとても良い論文だ」と言っていただけました。
このように得られる結果については、大成功以外にも中成功も、小成功も、それ以外もあるのが世の常ではないかと思います。見える世界が広がれば広がるほど執着もなくなり、チャレンジできることも広がると思います。
ここでいう研究者としての成功とは、当初の目論見どおりの結果を得られたら成功で、思わぬ副産物が得られたらそれも成功かもしれません。逆に失敗は長い時間を費やしても結果が得られない、苦しい状況が続く、外圧がかかるなどして研究をやめてしまうことではないかと思います。

研究者として大切にしてきたことを教えていただけますでしょうか。

前回の取材でお話した短所の克服ではなく、長所を伸ばす姿勢で研究するという考えは変わっていません。オンリーワンをめざすのが研究者であり、突出しているところがないと生き残りは図れませんので、この姿勢は大切にしています。
加えて現在は、「Give and Give（見返りを期待しない）」「頼まれごとは（できるだけ）断らない」姿勢の大切さを感じています。何か企画する際は必ず各所にお願いごとをしなければなりません。お願いを聞いていただくには日頃から関係を構築しておく必要があるのです。そのためにもお願いされたことに誠意をもってこたえたいです。こうしたかかわりから頼まれる側の気持ちが分かるようになり、無理なお願いをすることも減るでしょう。このような信頼関係を築いていくとき、とても大事なのは「損得なし」の考え方だと思います。忙しいときに依頼ごとを受けるとそれに時間を取られてしまいますが、私は虚心坦懐でご依頼いただいたことにおこたえします。
そのうえで、私は「人とのつながりこそすべて」だと思っています。 IEEE等の学会をはじめ、対外役職をかなり多く引き受けていますが、その役職を通してご縁をいただいています。あるとき、学会の幹事の仕事が縁となって、お招きした先生のもとで客員研究員として滞在することにつながりました。
また、社外の方々とお話していて意外な方がつながっていて驚くことがあります。仕事でお世話になっていた社内の若手の方と、学会でお世話になっていた大御所の方が親子だと分かり、その若手の方との付き合いが面白くなったこともありました。とはいえ、私は聖人君子ではありませんから苦手な方もいますが、そういった方を反面教師として勉強させていただいています。しかし、大抵は尊敬する方ばかりです。70歳近くでも現役で働いていらっしゃる先輩も多くおられて、私も将来このようにありたいと思うこともあれば、若い人とのコミュニケーションで刺激をいただくこともあります。

世間は常に「その次はどうするのか」という眼で見ている

研究活動のみならず、世代を超えたつながりも紡いでいらっしゃるのですね。

人脈は本当に尊い財産だと思います。研究活動においてはこれに加えて、成果について欲張ることも大切だと考えています。一言で表現すると「二兎を追う者だけが二兎を得る」と考えてきました。例えば、論文の締め切りと飲み会等のイベントのスケジュールが重なった場合、一般的には論文を優先すると思いますが、私はイベントに参加してから論文に取り掛かれば良いと思うのです。二兎を追うものは一兎をも得ずという行動をしていると、二兎を得ることは決してありません。この考えに至ったのは私の周囲に素晴らしい才能を持った方々が多く存在していて、その方々の業績を常人の尺度で測ることはできないと実感しているからかもしれません。
さらに、どんな業績も、それを挙げた次の瞬間から過去のものとなります。素晴らしい発明をしたり、画期的な論文を書いたり、著名な賞をとることは誇らしく素晴らしいことです。しかし、世間は常にその次はどうするのかという眼で見ています。常に、次の何かをめざすために、自戒も含めて心に刻んでいます。

後進の研究者の皆さんに一言お願いいたします。

ロールモデルや目標となる人を決め、それをめざしてまっしぐらに進むのも良いですが、人はそれぞれ違いますから、結果的にそうならなかったとしてもごく自然なことです。世の中に同じ人は2人いなくても良いのです。私にも目標としていた人がいましたが、自らの足跡を見るとめざしていても違う結果を残し、違うアプローチをしていると感じます。
目標は、さまざまな状況や経験の中で随時修正して良いでしょうし、執着しないほうが良い結果を得られることもあると思います。ただ、どうしても達成したいとか、なりたい、ということはあきらめずに思い続けていると、意外に実現するものだと感じていますので、続けることは重要だと思います。それが実現したときは素直に喜ぶのですが、そこがゴールではなく通過点なのだという認識は重要です。人間万事塞翁が馬ではないでしょうか。
また、最近の若い方はまじめな人が多いと思います。かつては、研究所内にもっと破天荒な人もいたように感じています。昨今よく見聞きする、ダイバーシティに逆行しているように思えます。結果や評価にとらわれると萎縮してしまうのですが、長い研究生活の中でいつかは突き当たる難局を打破していくためには、こうした破天荒さも必要なのではないでしょうか。研究はカチカチに理詰めで考えたところで万事うまくいくものではなく、いろいろな可能性がある中から「当たり」を探すものであるとすれば、できるだけ柔軟な考え方で臨機応変に攻めていくほうが良いこともあるのではないでしょうか。態度は真摯でありつつ、もっと力を抜いて研究に臨みたいですね。

一覧に戻る

NTT技術ジャーナル記事

挑戦する研究者たち