NTT技術ジャーナル記事

   

「NTT技術ジャーナル」編集部が注目した
最新トピックや特集インタビュー記事などをご覧いただけます。

PDFダウンロード

挑戦する研究者たち

クロスモーダル表現学習技術によりバイオデジタルツインの実現をめざす

2020年11月に発表された「NTT医療健康ビジョン」の中では、医療資源の有効活用・物理的制約の緩和、予防から治療後まで連続的なケア、個人ごとに個別化された精密なケアの実現をめざして、バイオデジタルツイン(BDT)による生体シミュレーションの実現に取り組む、としています。BDTは実際の生体をデジタル世界に写し取ったものですが、そのためには生体の機能や、その背後にある物理的・化学的な機序をどのようにデジタル情報として表現(数値化や記号化)するかがポイントになります。このような観点からBDTの実現にチャレンジする、NTTコミュニケーション科学基礎研究所 柏野邦夫フェローに、バイオメディカル分野へのAIの活用、異分野の共同研究における刺激と気付き、新しいものを生み出す際の視点などについて伺いました。

柏野邦夫
フェロー
NTTコミュニケーション科学基礎研究所

クロスモーダルにより新たな知を生み出し、バイオメディカル分野に活用

現在、手掛けていらっしゃる研究について教えていただけますでしょうか。

「情報表現学習技術の研究」と「バイオメディカル情報処理基礎研究」に取り組んでいます。
私はかねてから、音や画像・映像の認識・検索に関する研究に継続して取り組んできました。そこでのポイントも、メディアの情報をいかに的確にかつ効率良く、デジタル情報として表現するかにあります。これも1つの「情報表現学習技術の研究」です。近年では精度や効率の観点だけでなく、データに隠れた構造を発見したり新しい知識の発見をサポートしたりできるような情報表現などにも研究を拡げています。そして、その技術の適用先として特に医療・健康分野に焦点を定めて取り組んでいるのが「バイオメディカル情報処理基礎研究」です。
昨今、大規模言語モデル(LLM:Large Language Models)などのいわゆる生成AI(人工知能)が注目を集めています。生成AIも事物の「情報表現」(情報をデジタル的に表したもの)に基づいて動作しており、情報表現を参照しながら、与えられた条件(例えば質問文など)にふさわしい出力を生成する仕組みです。情報表現の方法は大量のデータから学習されます。大量のデータの持つパワーは専門家の想像をも超えるほど圧倒的で、文章や画像や動画など、少し前には考えられなかったような有用な出力が得られるシステムが実現されてきています。しかしその一方で、なぜそのようなシステムの動作が得られるのか、システムの内部で特定の情報がどのように表現されているのかなどといった点では、まだ十分に解明されていないところがあります。前述の情報表現学習技術の研究はこのような問題意識にも通じるところがあり、大量のデータに基づく学習の長所と情報表現の透明性の両立を図るのが情報表現学習技術の研究、ということができます。したがって、この研究が成就すれば、例えばAIシステムの規模を最適化したり、出力に対する信頼性を確保したりといった要求に対して一定の回答を与えるものになるはずです。
研究課題は、情報表現の解明・解析・構成論・最適化・活用など多岐にわたります。その目標は、作用機序が明らかで最適化された情報表現やその構成方法を確立することにあります。そのために、今注目しているのは情報と情報の間の関係性の抽出と利用です。例として画像認識の問題を考えましょう。画像データだけしか参照するものがない状況では、画像とそこに映っているものの名前のペアを学習データとして、これを大量に用意してAIを学習させるのが普通のアプローチです。このような方法は、使える場面では非常に強力ですが、都合の良い学習データがいつも簡単に用意できるとは限りませんし、ものの名前のつけ方が変化していくような場合には適しません。しかし、ネット動画やテレビ番組や日常の風景のように、もし画像とそれに紐付く音声情報とが参照できる状況であれば、そのようなアプローチに頼らずとも、つまり学習データを人手で用意しなくても、画像と音声との関係性を手掛かりに、何の画像かを判別し、さらに映っているものの間の意味的な関係(意味の近さ)も判断できるようになるのです。私たちの実験例では、事前知識を全く与えず、数百時間の相撲中継を録画したものをシステムに与えると、その画像と音声の情報だけから、頻出(例えば上位10種類)の決まり手をかなりの精度で見分けられるようになることが示されています。この例のように、ある一種類のデータを見ているだけでは分かりにくかったことが、複数種類のデータを参照することで浮き彫りになるといったことが、この世界には多くあるのではないかと考えられます。情報の種類のことをモダリティと言いますが、それらを相互に見渡して、相互の関係を解析することが、これからの情報表現学習技術の1つの鍵になると考えているわけです。私たちはこのようなアプローチを、モダリティを横断するという意味で「クロスモーダル」と呼んでいます。
折しも、最近はさまざまな種類の大量の情報収集が可能となりました。医学や生物学の分野でも、遺伝子の情報、細胞レベルでの振る舞い、臨床検査の結果など、種類の異なる大量の情報を解析し、相互に照らし合わせることが、最近の研究や技術の進歩により徐々に可能になりつつあります。IOWN(Innovative Optical and Wireless Network)の普及はこれをさらに強力に後押しすることでしょう。このように集められた情報間の隠れた関係を明らかにし、推論・シミュレーションに反映させることで、数年後の健康状態の予測や薬・治療方法による効能や副作用の推測といったことが、遠くない将来に一定程度可能になってくると考えています。さらには、こういったクロスモーダルの研究を行うことで、人間がこれまで気付いていなかったような新たな知を生み出すAIができるのではないかと思います。科学技術の研究においても、人間の有用なパートナーとしてAIが創造性を発揮するようになるかもしれません。

クロスモーダルを生体情報に適用するとバイオデジタルツインにつながるのですね。

はい。医学や生物学の歴史はモデル化の歴史であるといってもいいぐらい、生体のモデル化は昔から行われていますが、従来は専門家の個別の実験や洞察に基づくものが多かったと思います。しかし生体は複雑な対象であるため、手作業で詳細なモデルをつくっていくことには限界もあるでしょう。そこで、大量、あるいは多種多様なデータの持つ潜在的なパワーを活かすべく、情報表現を自動的に学習する技術が重要になるのです。
NTTは、2020年11月、「NTT医療健康ビジョン」において、医療資源の有効活用・物理的制約の緩和、予防から治療後まで連続的なケア、個人ごとに個別化された精密なケアの実現をめざすことを発表しました。その核となるコンセプトがバイオデジタルツイン(BDT)による生体シミュレーションの実現でした。前回の取材(2021年6月号)で紹介した「AIテレ聴診器」は、そのためのセンシングツールの1つでした。その後、BDTを情報系基礎研究の観点から支えることも目的として、NTT コミュニケーション科学基礎研究所メディア情報研究部に、生体情報処理研究グループが新設され、私はそのリーダーに着任しました。このグループでは、多種多様な情報を対象とする機械学習、信号処理、パターン処理の新たな基礎技術自体の創出を基本的な活動としながら、それらを実地に生体情報に適用して、社会的に有用な新領域を開拓していく活動にも積極的に取り組んでいます。このため、NTT 物性科学基礎研究所バイオメディカル情報科学研究プロジェクトや研究開発マーケティング本部アライアンス部門との連携はもちろん、特有の強みを持つ大学や病院との連携も進めています。
以下、研究チームによる具体的な研究をいくつか紹介しましょう。
榊原記念病院と、心肺機能の高精度シミュレーションの共同研究を行っています。心臓病は多くの国で死因の1~2位に位置するような重要な疾患ですが、早期の発見・治療と、治療後のリハビリテーション(運動療法)の効果が特に高いことが知られ、そのうち運動療法については、その人に合った適切な強度で運動することで5年後の生存率が格段に向上することが知られています。そこで問題になるのが適切な運動強度の設定です。運動が弱すぎれば効果が乏しく、強すぎれば逆効果、もしくは危険を伴うこともあり得ます。そこで、運動の処方においては運動強度を設定するために心肺運動負荷試験(CPX:Cardiopulmonary exercise testing)という検査が行われるのですが、これは対象の方に限界に近い運動をしてもらう必要があることなどからあまり普及していないのが実状です。そこで、国内最多のCPX実施例を持つ榊原記念病院のデータから、機械学習により、実際にはCPX検査を行うことなくそれ以外の身体所見から CPX検査結果を推定するモデルを作成しました。これを用いれば、全国あるいは世界中で、より多くの人が適切な運動療法を受けられるようになることが期待されます。現在、さまざまな検証を重ねるなど、近い将来の実用化に向けた準備も進めています。
また、大阪大学のヒューマン・メタバース疾患研究拠点(PRIMe)とは、iPS細胞を用いた心筋細胞のパフォーマンス計測とモデル化の研究を進めています。iPS細胞は、ご存じの方も多いと思いますが、人工多能性幹細胞とも呼ばれ、人間の皮膚や血液などから採取した細胞に特定の操作を行って培養することで、さまざまな組織や臓器の細胞に分化する能力を持つようになった細胞です。大阪大学ではこれを活用した人工心筋細胞組織による疾患モデルの研究を行っています。つまり、遺伝的な要因を持つ重い心臓病の患者から採取した細胞を培養して心筋組織に育て、その心筋としての性質、例えば収縮力や拡張力を実際に計測しながら、疾患のメカニズムを解明したり治療法を開発したりしようという研究です。これは物理的な、つまり実物として存在する疾患モデルなのですが、私たちはこれのデジタル化に取り組んでおり、実際に共同で収縮力や拡張力を計測しながらモデル化を進めています。デジタルモデル化のメリットは数多く挙げられるのですが、中でも重要なのは、デジタル空間の中で心筋組織をつなぎ合わせて心臓(臓器)のモデルをつくれる可能性がある点でしょう。これによって、臓器に対して得られている数々の情報と、細胞や遺伝子といったミクロな生体情報とがモデルによってつながります(図1)。これはデジタル化ならではの利点です。現在、実際に培養によってつくれるのは、例えば数ミリ~数センチぐらいまでの、臓器に比べれば小さな細胞塊までで、複雑な構造を持った臓器までを物理的に構成することは困難です。ところがデジタル空間では、一定の条件や仮定を置いたうえで細胞塊をつなぎ合わせて、臓器としてのパフォーマンスを推計することができる可能性があります。これは、治療法の選択などに向けて大きな一歩になるのではないかと思います。
このほか、多チャネルマルチモーダル生体計測として、前回紹介した、心電図電極、マイクロホン、圧力センサ、加速度センサ等により収集したデータや心音、体内音等の音を遠隔でAI解析して身体状態を推測する「AIテレ聴診器」に引き続くフェーズで、測定されたデータをクロスモーダルエンコーダ・デコーダに入力し、獲得された情報表現に基づいて用途に応じた説明文を表示するなど、新たなユースケースの創出や精度向上をめざしています(図2)。また、北里大学病院との共同研究において、胸に当てる聴診器タイプのセンサ端末をお使いいただいて、その実用性の検証を進めています。その中で最近新知見が得られ、医学系の雑誌に論文が掲載されました。
機械学習の基礎研究に属する研究も推し進めています。例えば、細胞は分化過程において生物の組織ごとに機能が分かれていきますが、ある時点での観測からその元がどうだったのか(細胞分化過程)を解析・推定・モデル化することは重要な課題です。機械学習の観点では、不確定な要素が多い状況においていかに確からしいモデルを推定するか、という課題です。私たちはそれに対して新しい手法を提案して、効果の検証を進めています。

異分野間の常識の壁を乗り越えた共同研究

基礎研究でありながら実用化も期待できそうですが、どのような課題があるのでしょうか。

まず研究の面では、私や、研究チームのメンバーの多くが医学や生物学に関して専門外であったことが、苦労を伴う点だったと思います。コラボレーションを成立させるにもある程度の基礎知識が必要ですし、異分野間では、言葉から行動様式まで全く異なることが多くあり、想像力と歩み寄る姿勢が問われます。メンバー一同の苦労もまだ絶えませんが、一方では、サプライズや新たな発見を楽しめる面もあります。
実用化という面では、生体や医療にかかわる場合、定められたルールに従い、信頼性を担保していく必要があるわけですが、これも私たち自身にとっては専門外の領域でした。これについては幸い、多くの方々の協力をいただくことができ、慣れない中でも少しずつ前進できるようになってきているのは有難いことだと思います。

常識や文化の違いをお互いに理解し合っていくことで、その中に共通して存在する大事なものが浮かび上がってくる

研究者として心掛けていることを教えてください。

基礎研究を軸足にして仕事をするうえで、意外に聞こえるかもしれませんが、むしろ社会的な視点を強く意識するように心掛けています。それから、最近の変化といえば、世界を身近に感じられるようになったことでしょうか。NTTグループもどんどんグローバルな企業体になっているところですが、私はこれまで、気付いてみれば国際学会や国際会議への参加など、研究コミュニティとの接点のみが世界と接することの大半を占めていました。しかし最近は、生体情報の分野に接するようになったことで、地球上のさまざまな環境に暮らす一般の人たちの生活を思い浮かべることが増えたように思います。
もう1つ、心掛けていることを挙げるとすると、何をやるべきかと、どうやるべきかのバランスです。このうちのどちらが大事か、は場面により変わると思いますが、新しいものを生み出す場面に限っていえば、私は両方が大事だと思っています。新しい方法論によってできることが増え、やるべきことの追求が新しい方法論の誕生を加速するというダイナミズムが、世の中を変えていく原動力だと感じるからです。
最近の所感について付け加えると、医療者の方と接する機会が増え、一様に、その使命感や真摯に物事にあたる姿勢に感銘を受けるところが多くあります。異分野の方と、何が重要かを共有したうえで、常識や文化の違いをお互いに理解し合っていくことで、その中に共通して存在する大事なものが浮かび上がってくるように感じます。これは、クロスモーダルの情報処理によって本質的な情報が浮き彫りになってくる図式と似ていますね。

後進の研究者へのメッセージをお願いします。

新しいものを生み出す苦労や楽しさを共有できるとうれしいです。何が重要なのかを考えて、そこに意識を向けて常識にとらわれずにチャレンジしていきましょう。

DOI
クリップボードにコピーしました