AIの生物学的死角:遺伝子活性予測の課題

Arstechnica

人工知能と機械学習は、プラスチックを消化できる酵素の設計から、ヘビ毒を阻害できるタンパク質の工学まで、生物学の分野で実に目覚ましい成功を収めてきました。AIの誇大宣伝が際限なく広がる時代において、私たちがすでに蓄積した膨大なデータセットに強力なアルゴリズムを解き放つだけで、ほとんどの生物学的プロセスを包括的に理解できるようになり、労働集約的な実験や動物研究の倫理的な複雑さを回避できると考えるのは魅力的かもしれません。

しかし、生物学はタンパク質の構造だけにとどまりません。この複雑な科学のあらゆる側面に対してAIが同様に効果的であると示唆するのは、時期尚早です。このような背景から、最近の研究は特に興味深いものとなっています。研究者たちは、様々な条件下で細胞内の遺伝子がどの程度活性化するかを予測するために設計された一連のAIソフトウェアパッケージを評価しました。その結果、これらの洗練されたAIシステムは、意図的に単純化された予測手法よりも優れた性能を示しませんでした。この発見は、生物学が信じられないほど複雑であり、特定の生物学的側面でAIシステムを開発することに成功したとしても、その分野全体での一般化可能性は保証されないことを示す重要なリマインダーとなります。

この研究は、ハイデルベルクを拠点とする3人の研究者、コンスタンティン・アールマン=エルツェ、ヴォルフガング・フーバー、サイモン・アンダースによって主導されました。彼らは、彼らの研究がプレプリント段階で公開された他のいくつかの研究も、概ね同様の結論に達していると指摘しました。ハイデルベルクチームのアプローチは特に分かりやすく、現在の限界を示す優れた例となっています。

彼らの研究で調べられたAIソフトウェアは、遺伝子活性の変化を予測することを目的としていました。すべての細胞にはヒトゲノム内の約20,000個の遺伝子のコピーが含まれていますが、そのすべてが常に活性化しているわけではありません。この文脈での「活性化」とは、メッセンジャーRNA(mRNA)を生成する遺伝子を指し、これらは細胞機能にとって不可欠です。一部の遺伝子は常に高レベルで活性化しており、必須機能を提供しますが、他の遺伝子は神経細胞や皮膚細胞などの特定の細胞型でのみ活性化したり、低酸素や高温などの特定の条件によって活性化されたりします。

長年にわたり、科学者たちは様々な細胞タイプにおいて異なる条件下での各遺伝子の活動をマッピングするために数多くの研究を行ってきました。これらの調査は、遺伝子チップを使用して細胞集団に存在するmRNAを特定することから、個々の細胞からRNAをシーケンスして活性遺伝子を特定することまで多岐にわたります。これらの研究は全体として、遺伝子活性と多様な生物学的状況を結びつける、広範ではあるが不完全な全体像を構築してきました。この膨大なデータリポジトリは、理論的には、未試験の条件下での遺伝子活性を予測するためにAIを訓練するために使用できます。

アールマン=エルツェ、フーバー、アンダースは、この種の遺伝子活性データで訓練された、いわゆる単一細胞基盤モデルを具体的にテストしました。「単一細胞」という指定は、モデルが細胞集団全体で平均化されたデータではなく、個々の細胞で観察された遺伝子活性から学習したことを示します。「基盤モデル」とは、広範囲のデータで訓練されたが、特定のタスクのためにさらなる微調整が必要であることを意味します。

これらのモデルの具体的なタスクは、遺伝子が意図的に改変されたときに遺伝子活性がどのように変化するかを予測することでした。単一の遺伝子が失われたり活性化されたりすると、その遺伝子のmRNAのみが影響を受けることがあります。しかし、一部の遺伝子は他の遺伝子の集合全体を制御するタンパク質をコードしており、数十の遺伝子の活性変化につながります。他のケースでは、遺伝子を改変することが細胞全体の代謝に影響を与え、遺伝子活性の広範な変化をもたらすことがあります。2つの遺伝子が関与すると、複雑さはさらに増します。多くの場合、それらの効果は単純に加算的であり、それぞれの個別の改変によって引き起こされる変化の合計です。しかし、それらの機能が重複すると、一部の変化の相乗的な増強、他の変化の抑制、または完全に予期せぬ修飾が結果として生じる可能性があります。

これらの複雑な効果を探るため、研究者たちは歴史的にCRISPR遺伝子編集技術を使用して、1つまたは複数の遺伝子の活性を意図的に変更してきました。その後、すべての細胞RNAをシーケンスして、結果として生じる変化を観察します。このアプローチはPerturb-seqと呼ばれ、細胞内での遺伝子の機能に関する貴重な洞察を提供します。アールマン=エルツェ、フーバー、アンダースにとって、それは彼らが選択した基盤モデルが他の遺伝子活性におけるこれらの下流の変化を予測するために訓練できるかどうかを判断するために必要な重要なデータを提供しました。

事前学習済み基盤モデルから始めて、研究者たちは、CRISPRで1つまたは2つの遺伝子が活性化された実験からのデータを使用して追加の学習を行いました。この学習データセットには、100の個別の遺伝子活性化と、2つの遺伝子が同時に活性化された62の事例からの情報が含まれていました。その後、AIパッケージは、他の62対の活性化された遺伝子の結果を予測するタスクを課せられました。比較のために、研究者たちは2つの非常に単純なモデルを使用しても予測を生成しました。1つは常に遺伝子活性に変化がないと予測するモデル、もう1つは常に単純な加算的効果を予測するモデル(遺伝子AとBを活性化すると、Aを活性化した場合とBを活性化した場合の合計の変化が生じることを意味します)です。

結果は期待外れでした。「すべてのモデルは、加算的ベースラインよりも実質的に高い予測誤差を示しました」と研究者たちは結論付けました。この発見は、AI予測精度の代替測定値を使用した場合でも当てはまりました。問題の核心は、学習済みの基盤モデルが、特に遺伝子ペアの改変が相乗的な相互作用を生み出す場合に、複雑な変化パターンを正確に予測できないことにあるようでした。「ディープラーニングモデルが相乗的な相互作用を予測することはめったになく、それらの予測が正しかったことはさらにまれでした」と研究者たちは述べました。これらの遺伝子相乗効果に特化した別のテストでは、どのAIモデルも、まったく変化がないと予測する単純化されたシステムよりも優れた性能を示しませんでした。

この研究の全体的な結論は明確です。研究者自身が書いているように、「私たちの意図的に単純なベースラインが現実的な生物学的複雑性を表現できないにもかかわらず、基盤モデルによって凌駕されなかったため、後者の目標である細胞状態の一般化可能な表現を提供し、まだ行われていない実験の結果を予測することは、依然としてとらえどころのないものであると結論付けます。」「依然としてとらえどころのない」という表現は、この問題に役立つAIを開発する能力がまったくないことを意味するものではないことを強調することが重要です。また、これらの発見がすべての細胞状態に、あるいはそれよりもはるかに少ないですが、生物学全体に適用されることを意味するものでもありません。しかし、この研究は、AIがいくつかの特定の分野で成功を収めたことが、それが普遍的に適用できる世界を告げるという考えに immense な熱意がある時代において、貴重な警告を提供します。