ディープラーニングによって超多次元ネットワーク情報を縮約

――国内の研究成果について伺います。田中先生の研究室ではどのような取り組みを行っているのですか。

 ここまでお話しした通り、生体標的分子のターゲットが決まっていて、それに対して有効な化合物は何かを予測することは十分にできます。しかし、ある病気の薬をつくりたいときに、どの標的分子をターゲットにすればいいのかという点についてはまだまだうまくいっていないため、我々はこれに取り組んでいます。

 薬のターゲットとなるのは、生体のたんぱく質ですが、どういう範囲のたんぱく質をターゲットにするかという問題もあります。これらを解決するために、人のたんぱく質間の相互作用(PPIN)ネットワークのデータベースを使い、学習的アプローチによって、ある疾患に対して有効だということがわかっている標的分子がPPIN上でどのような位置にあるのかを帰納学習させ、それに近いものを探していきます。  ただ問題は、PPINの上で示された標的分子は、超多次元ネットワークになっており、通常の機械学習では扱いづらいことです。そこで開発したのが、ディープラーニングによるネットワーク埋め込み(Network Embedding)という手法です。これによって、超多次元ネットワークをそれよりはるかに低次元の直交座標上に表現することが可能になりました。つまり、薬剤と標的分子の超多次元に及ぶデータをディープラーニングに読み込ませ、特徴量を抽出し、低次元のデータに縮約します。ここで標的性を判定しようというものです。

 実際に選定された標的分子の10個のうち7個は、アルツハイマーの標的として分子生物学的な実験的研究が行われていることも後からわかりました。この結果から、本当に創薬に結びつくかどうかはまだわかりませんが、実験的研究との整合性によって、有効性は十分明らかにされたと思っています。

 ということで、疾患が決まれば、我々の研究によって、そこからターゲットになるたんぱく質が決まります。ターゲットとなるたんぱく質がわかれば、バーチャルスクリーニングによって、それにヒットする化合物もわかります。ビッグデータ創薬、AI創薬の現状はこのようにまとめられます。

――ディープラーニングによる多次元ネットワーク情報の縮約は、AI創薬の可能性を大いに期待させます。AI医療、ビッグデータ医療の今後の展望について、最後に伺います。

 IBMの「Deep Blue」に負けたカスパロフは、悔しかったのかこう言いました。「コンピューターの出す答えを見せてくれたら、それよりもっといい手を打てる」と。それを示すために、コンピューターと棋士の混成チームをつくって、リーグもつくりました。「ケンタウルス・リーグ」と言います。馬力が必要なところはAIを使う。でも、最終的には人の構想力を使うことで、AIよりも優れた答えを出せると言いたかったのです。そのことを私は深く受け止めています。つまり、これからは仮説駆動的な人間の知と、AIにどんどんデータをぶつけて、特徴要約から出てくる知を組み合わせた共創的(co-creative)な知が、カスパロフの言うように上であり、人類の未来の進むべき道の探索を可能にするのではないか。まさしく、“ケンタウロス的知性”が医学研究においても重要になるだろうと考えています。

(構成/堀田栄治 撮影/宇佐見利明)