NTT技術ジャーナル記事

   

「NTT技術ジャーナル」編集部が注目した
最新トピックや特集インタビュー記事などをご覧いただけます。

PDFダウンロード

挑戦する研究開発者たち

信念とパッションを胸に妄想しよう!心の声に耳を傾けてワクワクする未来を描く

NTTドコモは、「新しいコミュニケーション文化の世界の創造」に向けて、よりパーソナルなコミュニケーションを確立し、“Wellbeing Society”の実現をめざしています。その取り組みの1つである、「ライフスタイル共創ラボ」の一環として、「バーチャル銀座」を開発し、周遊体験やゲーミフィケーションを通じて地域活性化をめざす、NTTドコモ サービスイノベーション部(現:NTT新ビジネス推進室)池田大造担当部長に事業に寄せる思いと研究開発者の醍醐味を伺いました。

池田 大造
サービスイノベーション部
担当部長
NTTドコモ

メタバースの可能性を示す一大プロジェクト

これまで手掛けてこられた研究開発を教えていただけますでしょうか。

これまで、私はビッグデータ、AI(人工知能)の領域で、モバイル空間統計や画像認識を中心に研究開発を手掛けてきました。
「モバイル空間統計」はドコモの携帯電話ネットワークの仕組みを活用して生成される人口統計です(図1)。日本全国の人口を24時間365日把握でき、「分布統計」と「動態統計」を提供するサービスです。携帯電話の着信のために基地局で把握している位置データ・属性データを活用し、個人情報・プライバシを保護したうえで大規模データを集計処理することで、信頼性が高い統計情報を生成する技術を開発しました。モバイル空間統計は、調査期間を1日単位や年平均、平休日別の集計など、柔軟に設計することができ、空間解像度は500mメッシュなどの単位で人口を推計することができます。日本全国における人口分布の時間変動に加え、その属性(性別・年代)や、どこからどれだけの人が来ているか、あるエリアに住む人がどこに分布しているかが分かります(1)
画像認識は画像に何(例えば人や車)が写っているかをAIにより認識・識別する技術です。「ドコモ画像認識プラットフォーム」は、さまざまな業務の効率化やサービス性向上に貢献するソリューションのコアとなる画像認識エンジンをAPI(Application Programming Interface)として提供するクラウドサービスです(図2)。画像認識に関連する7つのAIエンジンを自在に組み合わせて利用できることが大きな特長です(2)。また、ユーザはアノテーションされた(メタデータが付与された)画像などのデータセットを用意することで、画像認識エンジンの学習モデルを自身で作成・カスタマイズすることができます。

これらのテクノロジから生まれたイノベーションの代表例を聞かせていただけますか。

VR(Virtual Reality)等により交流できる仮想空間、メタバースとして「バーチャル銀座」を開発しました(3)(図3)。国土交通省Plateauプロジェクトの3D都市モデルと独自に作成した建物CGモデルにより広大な銀座周辺のフィールドを再現しています、5G(第5世代移動通信システム)SA(Stand Alone)とクラウドダイレクトを用いたクラウドレンダリング型のマルチプレイ、アプリなしのWebブラウザ経由でのリアルタイムコミュニケーション、およびモバイル空間統計による人流データの3D空間表現や画像認識AIを活用した非言語コミュニケーションを実現しました。パートナー会社と連携し、バーチャル空間上に再現した銀座で、周遊やゲーム感覚で買い物をすることにより地域の魅力度向上や経済活動の活性化につなげることをめざしています。
コロナ禍により対面による直接的なコミュニケーションが難しくなり、外出にも制限がかかる社会状況において、これを打開し貢献できることはないかという想いがきっかけで、日本を代表する国際都市である銀座を舞台に、これまで手掛けてきたモバイル空間統計や画像認識AIを活用できるのではないかと考えました。
銀座周辺のフィールドを構築するのに、3D都市モデルを活用しながら周遊スポットとなる建物は1つずつつくり上げていくところからのスタートでした。銀座らしさを表現するために、モバイル空間統計の人流データを用いて、銀座の人波を3Dアバターの群衆として再現しました。バーチャル空間だからこそのワクワクする体験とは何かを突き詰め、街を舞台にしたeスポーツの要素を取り入れたゲーミフィケーションを導入し、画像認識AIを駆使して3Dアバターの表現を豊かにしたり、ジェスチャーができるようにしたり、3D空間で複数人での音声コミュニケーションを可能にするなど、さまざまな「しかけ」を組み込んで、テクノロジをエンタテインメントに転換しました。
歌舞伎座や数寄屋橋のほか、ポーラ ギンザ、NISSAN CROSSING(ニッサンクロッシング)をバーチャル銀座上に再現した実証実験では、3Dアバターを通じて、街を周遊しながら銀座の街並みの魅力に触れ、ゲーム感覚で街の歴史や文化を知り、デジタル広告を通じて新たなブランドに出会い、バーチャル店舗に訪れてデジタルアイテムの購入体験をしてもらいました。
この取り組みでは、バーチャル空間で街をつくることの意義を示すことができたと自負しています。テクノロジの使い方を示せただけではなく、これによりパートナーが集まり、街の活性化を促すことができる可能性を示しました。メタバースは初期投資が必要であるという事業課題はありますが、2008年に1枚の企画案から立ち上げたモバイル空間統計を5年余りの歳月をかけてサービスとして世の中に送り出し、現在ではさまざまな業界においてビジネスとしての価値を認められている経験を大きな糧に、メタバースは必ず到来する未来と確信していますから、長い道のりを覚悟して進めていきます。

テクノロジとビジネスは一体で検討する

これまで手掛けてきた研究開発は高く評価されていますね。

モバイル空間統計の取り組みでは、2つの大きな賞をいただきました。1つは、携帯電話基地局データから生成される人口流動統計の振興の功績により、令和2年度科学技術分野の文部科学大臣表彰 科学技術賞(科学技術振興部門)を受賞しました。これは携帯電話ネットワークの運用データを基に「人口流動統計」を開発し、24時間365日全国の交通総量と移動経路・手段別の交通量推計を可能とし、まちづくり、交通計画、防災計画、地方創生やマーケティングなど幅広い分野で活用されたことが認められたものです。大規模データを処理して生成された人口流動統計は、従来のアンケートベースの調査と整合する信頼性の高いビッグデータとして、パーソントリップ調査という公的統計でも活用されました。
そして、2022年には携帯電話基地局データから生成される人口流動統計の功績により、日本オープンイノベーション大賞(総務大臣賞)を受賞しました(4)。オープンイノベーションのロールモデルとして期待される先導性や独創性の高い取り組みとの評価をいただきました。これら2つの表彰を受けた人口流動統計は、国土交通省、東京大学・法政大学と産官学それぞれの強みを活かして共同開発したものです。ビッグデータが世の中に普及する前からその有用性を土木学会や地方公共団体に発信し続け、まちづくりや交通計画などで活用するべきだという機運や、活用事例の公開など社会が受容するために必要な土壌を創り上げたことが高く評価されました。

研究開発における価値創造で大切なことは何でしょうか。

私はテクノロジとビジネスは一体で検討するべきだと考えています。例えば、私の専門分野の1つである画像認識AIの研究開発において、橋梁と橋梁上を走行する車両を動画撮影し、橋梁の複数点のたわみ(変位)から橋梁が劣化しているかどうかをAIで推定する技術を開発しました。
このようなAIを活用した取り組みはほかにも数多くありますが、日常的に継続して使っていただくことの難しさから現時点ではビジネスにつながっていない技術も多くあります。素晴らしい技術開発をしても実証実験の段階で終結してしまうと、社会に貢献できるチャンスを逸してしまいます。もちろんマーケットに投入するタイミングが適切かという側面もありますが、こうした現状を打開するには、AI単体のプロダクトアウトではなく、人によるオペレーションとAIをセットで考えるビジネス、例えば運営事業やBPO(ビジネスプロセスアウトソーシング)としてとらえることが大切だと思っています。一例として、インフロニアグループとワンチームで道路運営事業のDX(デジタルトランスフォーメーション)化に向けた実証実験に取り組んでいます。技術者も現場に駆け付け、企画から開発・運用フェーズまで一体となって、画像認識AIによる道路のひび割れ検知と道路修繕計画策定の自動化、書類のデジタル化や、音声認識AIによる問い合わせ対応業務の効率化をめざしています(5)
また、AIによって新しい価値をつくり出すことにも挑戦しています。その事例として、ゴルフスイング診断にAIを活用した「GOLFAI」があります(6)。AIでゴルフスイングを解析し、プロコーチから上達支援のアドバイスを受けることができます。AIの1つである物体認識エンジンではゴルフヘッドの軌道、姿勢推定エンジンでは関節の位置を推定します。このサービスの出発点は、ゴルフスイングの診断はAIエンジンの組合せでできるかもしれないが、人によって見たいポイントは違う、ゴルフスイングの上達ポイントも当然違うと考えたことです。さらに、理想とするスイングも人それぞれです。こうした多様性に対応すれば良いサービスを生み出せることは分かっているのに、AIのみで対応できる範囲は限られています。しかし、こうした多様性にこたえるため、ビッグデータやAIのみに任せずに、あえて人の手を加えて、求められるものが手に入るようにしました。具体的には、AIで解析できるポイントをプロコーチとの対話から見出し、画像から認識したクラブヘッドの軌跡と関節をつないだフォームから、良いスイングかどうかを判定できるようにしました。また、上達支援につながるレッスン動画を用意することでAIだけでは難しい価値を加えました。これからもAIを活用して、スポーツ上達支援、新しい体験や観戦スタイル、コミュニティ形成につながるイノベーションを創造していきたいと考えています。
このようなテクノロジとビジネスは一体で検討するという視点は、モバイル空間統計の研究開発を担っていたときに獲得しました。ビッグデータという言葉が普及していない時代に、直感的に位置データから生成されるビッグデータが通信以外の業界にも役立てられる未来が見えたのです。人口統計を生成するテクノロジの新規開発も必要でしたが、モバイル空間統計をビジネスとして成立させるには、どのような形にすれば他の業界のお役に立てるのか、そのためには技術課題だけでなく、ビジネスモデル、法的側面や社会の受容性などクリアすべきさまざまな課題があり、いわゆるエンジニアという立場を越えてそれぞれ真正面から腰をすえて取り組みました。普段かかわりがなかった社内の関連部署や他の業界の方々と多くの対話を重ねる中、私の直感を胸にビッグデータを主軸とした新規事業会社の設立という企画に仕立てました。この企画はこれまでにないイノベーションとして、「テクノロジの専門家によるビジネスプランは説得力がある」と社内外の関係者やパートナーから信頼を勝ち取り、着想から5年以上もの歳月が必要となりましたが、信念とともにさまざまな困難を乗り越え世の中に送り出すことができました。

ビジョナリがテクノロジの出番をつくる

研究開発者にはビジネスの視点も必要なのですね。

ビジョナリの存在がテクノロジの出番をつくると考えています。テクノロジはある程度未来予測ができますが、ビジネスは信念のある人、実行力のある人がいないと生まれないからです。
私は1996年にNTTドコモに入社して以来、25年にわたり研究開発をしてきました。入社当時は多くの業界でテクノロジが成熟していなかったこともあり、どの企業も研究開発投資の意欲が旺盛でした。しかし、2000年あたりにテクノロジが成熟し始め、モバイルやインターネットなどのインフラが急速に整備され、ユーザは新しい体験やこれまでにない価値を求めるようになりました。2005年ごろでしょうか、これらのインフラを活用したビジネス関連のアイデア勝負へと潮目が大きく変わり、GAFA時代が到来しました。昨今では論理的な思考、これが最善、最適であるという価値観が終焉を迎えつつあり、今後は個人の時代が到来すると私は考えています。誰もがテクノロジを活用できる、個人が活躍できる舞台が整ったのです。
こうした時代の研究開発者には「感性」が求められているのではないでしょうか。私は日ごろから後輩の研究開発者にも「これからは感性を磨くことが重要であるから直感を信じて感性を磨こう」と話しています。これを実践するために、私は20年来「感性日記」と称して、出来事とそのときの感情をセットにしてノートに残しています。カフェなどで気付いたことをメモしているのですが、ここはアナログなノートのほうが感性をその場で記録できます。20年来のメモは時折見返すと、最初は小さなアイデアだったものがどんどん膨らんで、徐々に実現しているように感じます。ある意味で私のアイデア集ですね。

研究開発者として大切にしてきたことを教えてください。

私は研究開発者として信念、パッションを大切にしてきました。信念とはどうしてもやってみたいと思ったことを貫くことです。私は、これからの時代に求められるものを探索し、発信し続け、形にすることが研究開発者の使命であると考えています。情熱を傾けると徐々に周囲にもその熱、パッションが伝わり、社内外にファンができるものです。例えばバーチャル銀座の開発もスタートは私1人でした。それでも、1年余りで約50人規模のチームとなって実証実験が実現しました。また、面白いと思ったらそれを実感してもらう機会をつくることも大切です。そのためには、何よりもプロトタイプを構築して体験してもらうことです。実際に良さを体験してもらうと物事は早く進みます。例えば、バーチャル銀座は数カ月でプロトタイプをつくったからこそ、社内の協力者やパートナーの共感を得て短期間でプレスリリースの配信、実証実験開始に至りました。パッションがファンをつくり、信頼できるパートナーと共通の志を育む中で具体的な計画ができ、船出を迎え、やがて世の中を変えていきます。
そして、後輩にも日頃から「妄想しよう」「妄想を消してはいけない」と話しています。置き換えてみれば「妄想」は「理想」なのです。現実に抱いた疑問や課題をどうしたら解決できるかといった視点が検討のスタートではないでしょうか。ちなみに「妄想」は雑談の中で膨らませています。例えば、バーチャル銀座でいえば、「コロナ禍でみんな銀座に行けないけれど、どうしているのかな」「こんなの面白くない?」という雑談がサービスにつながりました。
現代の研究開発者には、どういう社会で生きたいかを考え、課題を自ら発見することが求められているのではないでしょうか。他者に課題を聞いても出てこない経験は誰しもがしたことがあると思います。課題は理想と現実のギャップです。自分の心の声に耳を傾けること、つまり、妄想して理想を描かない限り、課題は見つけようがありません。私が心掛けていることに、お客さまのところへ直接伺って話を聞くだけではなく、現場で仕事をしている様子を見せていただいて妄想することがあります。すると、お客さま自身が感じて言語化している課題とは別のところに課題があることを発見することができます。研究開発者がお客さまのところへ行く機会は少ない、あるいはないと言わず、営業担当に頼むなどして自らが率先して機会をつくる行動力も求められます。
概念的に表現すれば、新しい未来を創り、現状を全く異なる方向へ変えることができるのは研究開発者です。あるいは0から1をつくることができるのが研究開発者だと思います。1から10、10から100に仕上げていく段階では周りの人たちと協力していくことになりますが、そこまでの道のりを含めてそのスタートを切ることができ、アイデアをテクノロジにのせて実社会に貢献できることが、研究開発者にとっての最大の魅力であると考えます。
先ほど、ビジョナリがいればテクノロジの出番がつくれると話しましたが、私はこれからNTTの新しいポジションでビジョナリとして働きます。10年、20年後を見据えたNTTグループで取り組む未来サービスの妄想が私の仕事になります。私の感覚では私自身がこういうものが求められる時代がくると感じたことが5年、10年遅れで到来している気がします。技術が成熟するまでの期間や社会が受容するまでの期間は必要になりますが、そのスピードはだんだん速まっているように感じます。新たなポジションは私の妄想力を活かせる大きなチャンスと考えていますので、これから待ち受ける未来が楽しみです。

■参考文献
(1) https://mobaku.jp/
(2) https://www.docomo.ne.jp/biz/service/dirp/
(3) https://www.docomo.ne.jp/binary/pdf/info/news_release/topics_210831_01.pdf
(4) https://www.docomo.ne.jp/binary/pdf/corporate/technology/rd/technical_journal/bn/vol30_1/vol30_1_010jp.pdf
(5) https://www.docomo.ne.jp/binary/pdf/info/news_release/topics_220418_00.pdf
(6) https://golfai.jp/