AI的生物盲点：基因活动预测力不从心

人工智能和机器学习在生物学领域取得了许多惊人的成功，从设计能够消化塑料的酶，到工程化能够阻断蛇毒的蛋白质。在一个看似无边无际的AI炒作时代，人们可能很容易认为，只要将强大的算法应用于我们已经积累的巨大数据集，就能全面理解大多数生物过程，从而可能绕过劳动密集型实验和动物研究的伦理复杂性。

然而，生物学所包含的远不止蛋白质结构。现在就断言AI能够同样有效地处理这门复杂科学的所有方面，还为时过早。在这样的背景下，最近的一项研究显得尤为引人入胜。研究人员评估了一套旨在预测细胞在不同条件下基因活跃程度的AI软件包。结果表明，这些复杂的AI系统表现并不比一种刻意简化的预测方法更好。这些发现提醒我们，生物学极其复杂，在特定生物学方面开发AI系统的成功，并不能保证其在该领域的普遍适用性。

这项研究由三位海德堡的研究人员主导：康斯坦丁·阿尔曼-埃尔策（Constantin Ahlmann-Eltze）、沃尔夫冈·胡贝尔（Wolfgang Huber）和西蒙·安德斯（Simon Anders）。他们指出，在他们的研究预印本发布期间，其他几项研究也得出了大致相似的结论。海德堡团队的方法特别直接，这使其成为当前局限性的绝佳例证。

他们的研究中审查的AI软件旨在预测基因活动的改变。虽然每个细胞都包含人类基因组中大约20,000个基因的副本，但并非所有基因在任何给定时间都是活跃的。“活跃”在这里指的是基因产生信使RNA（mRNA），这对细胞功能至关重要。有些基因持续高水平活跃，提供基本功能，而另一些基因只在特定细胞类型中活跃，如神经细胞或皮肤细胞，或由低氧或高温等特定条件触发。

多年来，科学家们进行了大量研究，以绘制各种细胞类型在不同条件下的每个基因的活动图谱。这些研究包括使用基因芯片识别细胞群中存在的mRNA，以及对单个细胞的RNA进行测序以精确定位活跃基因。总的来说，这项研究构建了一个广泛但仍不完整的图景，将基因活动与各种生物环境联系起来。理论上，这个庞大的数据存储库可以用于训练AI，以预测未经测试条件下的基因活动。

阿尔曼-埃尔策、胡贝尔和安德斯专门测试了所谓的单细胞基础模型，这些模型已在这种基因活动数据上进行了训练。“单细胞”的指定表明这些模型是从单个细胞中观察到的基因活动中学习的，而不是从细胞群的平均值中学习的。“基础模型”则意味着它们在广泛的数据集上进行了训练，但需要进一步微调以完成特定任务。

这些模型的特定任务是预测当基因被有意改变时基因活动可能如何变化。当单个基因丢失或激活时，有时只有该基因的mRNA受到影响。然而，有些基因编码的蛋白质可以调节整个其他基因集合，导致数十个基因的活动发生变化。在其他情况下，改变一个基因可能会影响细胞的整体代谢，导致基因活动发生广泛变化。当涉及两个基因时，复杂性进一步升级。通常，它们的影响只是简单的累加——由每个单独改变引起的总变化。但如果它们的功能重叠，结果可能是某些变化的协同增强，另一些变化的抑制，或完全意想不到的修饰。

为了探索这些复杂的效应，研究人员历来使用CRISPR基因编辑技术有意改变一个或多个基因的活动。然后，他们对所有细胞RNA进行测序以观察由此产生的变化。这种被称为Perturb-seq的方法为基因在细胞内的功能提供了宝贵的见解。对于阿尔曼-埃尔策、胡贝尔和安德斯来说，它提供了确定他们所选的基础模型是否可以训练来预测其他基因活动的这些下游变化所需的关键数据。

研究人员从预训练的基础模型开始，使用通过CRISPR激活一个或两个基因的实验数据进行了额外的训练。该训练数据集包括来自100个单独基因激活和62个同时激活两个基因的实例的信息。然后，AI软件包的任务是预测另外62对激活基因的结果。作为比较，研究人员还使用两个非常简单的模型生成了预测：一个总是预测基因活动没有变化，另一个总是预测简单的累加效应（意味着激活基因A和B将产生激活A加上激活B的组合变化）。

结果令人失望。研究人员总结道：“所有模型的预测误差都大大高于累加基线。”即使使用AI预测准确性的替代测量方法，这一发现也成立。问题的核心似乎是训练过的基础模型无法准确预测复杂的改变模式，特别是当基因对的改变产生协同作用时。研究人员指出：“深度学习模型很少预测协同作用，而这些预测正确的情况则更为罕见。”在专门针对这些基因协同作用的单独测试中，没有任何AI模型的表现优于仅仅预测没有变化的简化系统。

这项工作的总体结论是明确无误的。正如研究人员自己所写：“由于我们刻意简化的基线无法代表真实的生物复杂性，但却并未被基础模型超越，我们得出结论，后者提供细胞状态的可泛化表示并预测尚未进行实验结果的目标仍然难以实现。”必须强调的是，“仍然难以实现”并不意味着永远无法开发出能够帮助解决这一问题的AI。这也不意味着这些发现适用于所有细胞状态，更不用说适用于所有生物学。然而，在人们对AI在少数特定领域的成功预示着它可以普遍应用的世界充满巨大热情的时候，这项研究提供了一个宝贵的警示。

AI的生物盲点：基因活动预测力不从心

相关文章

AI信任危机：研究揭示边缘群体对AI的负面态度

上下文工程：解锁高级LLM应用的关键

2030年实现AGI？计算极限呼唤新AI算法