AI实验室搭载LLM智能体,成功发现抗病毒分子

2025-08-05T22:55:16.000ZTowardsdatascience

在科学研究领域,人工智能取得了重大进展:一个由GPT-4o驱动的自主AI智能体团队,成功开发并实验验证了能够阻断SARS-CoV-2的纳米抗体。这项突破性成果,由斯坦福大学和陈-扎克伯格生物中心的研究人员在近期发表于《自然》杂志的论文中详细阐述,标志着一个新时代的到来——AI不再仅限于数据分析和模拟,而是主动领导和执行复杂的科学项目,产出切实的、临床相关的成果。

这个名为“虚拟实验室”的新系统表明,人类研究员与大型语言模型(LLM)智能体团队协作,能够设计新型纳米抗体——这是一种微小的、类似抗体的蛋白质,旨在结合并抑制其他蛋白质的功能。具体解决的挑战是针对KP.3和JN.1等快速变异的SARS-CoV-2毒株,这些毒株已对现有治疗方法产生抗性。这并非简单的聊天机器人互动,而是一个由AI智能体驱动的复杂、多阶段研究过程,每个智能体都拥有专业知识和明确的角色。最终成果是:经过真实世界验证的生物分子,具有在疾病治疗下游研究中的潜力。

从助手到自主研究员

与以往LLM主要作为总结、写作支持或基本数据分析工具的应用不同,“虚拟实验室”将它们提升为自主研究员。其核心概念是模拟一个完全由AI智能体组成的多学科科学实验室。每个智能体都由GPT-4o实例化,并通过精心的提示工程被赋予特定的科学角色,如免疫学家、计算生物学家或机器学习专家。

这个团队由一个虚拟的首席研究员(PI)智能体和一个科学评论员智能体监督。PI智能体领导研究方向,而评论员智能体通过质疑假设和识别潜在错误发挥关键作用,充当内部的怀疑性评审员——论文强调这是项目成功的关键功能。人类研究员的角色是定义高层次的研究问题,引入特定领域的限制,并最终进行必要的湿实验室实验,以验证AI的计算输出。

纳米抗体设计过程

面对为进化的SARS-CoV-2变体设计纳米抗体的任务,AI智能体自主决定突变现有对祖先毒株有效但已失效的纳米抗体。它们的决定是基于更快的研发时间和现有结构数据的可用性。

人类研究员通过仅定义PI和评论员智能体来启动项目。随后,PI智能体组建了专业的科学团队,产生了免疫学家、机器学习专家和计算生物学家。在一次协作团队会议中,智能体们讨论了最佳方法,最终选择了纳米抗体突变而非从头设计。然后,它们选择了计算工具,包括用于点突变评分的ESM蛋白质语言模型、用于预测蛋白质结构的AlphaFold-Multimer,以及用于计算结合能的Rosetta。智能体们决定使用Python代码实施其策略,该代码在异步会议期间经过评论员智能体的多轮审查和完善。

由PI智能体设计的计算流程是迭代的:ESM对纳米抗体序列上的点突变进行评分,排名前列的突变体通过AlphaFold-Multimer预测结构,界面通过ipLDDT评分,Rosetta估算结合能。然后将这些分数结合起来对提议的突变进行排名,并根据需要重复循环以引入更多突变。

结果与效率

这个复杂的计算流程生成了92个纳米抗体序列。这些序列随后在物理实验室中进行合成和实验测试。结果令人鼓舞:大多数生成的序列被证明是可生产和易于管理的蛋白质。关键的是,其中两种蛋白质成功获得了与它们设计结合的SARS-CoV-2蛋白质的亲和力,显示出对现代突变体和病毒祖先形式的有效性。

虚拟实验室取得的成功率与人类团队进行的类似项目相当。然而,AI驱动的方法显著缩短了完成时间,并由于减少了人类参与而可能降低了总体成本。

模仿人类协作

虚拟实验室的运作模式与人类科学协作密切相似。它利用结构化的跨学科会议:“团队会议”用于广泛讨论,由PI领导,其他人贡献,评论员审查;以及“个人会议”,单个智能体(有时与评论员一起)专注于特定任务,如编码或输出评分。为了减轻AI“幻觉”或不一致等问题,系统还采用并行会议,其中相同的任务以不同的参数运行多次。然后将结果合并到一个单一的、更具确定性的“合并会议”中,以得出最连贯的结论。

在人力投入方面,该项目的计算阶段几乎没有直接的人工干预。LLM智能体撰写了总字数的98.7%(超过12万个token),而人类研究员在整个项目中仅贡献了1,596个单词。智能体编写了所有计算工具的脚本,人类主要负责促进代码执行和实际实验。“虚拟实验室”的整个流程在1-2天的提示和会议后建立起来,纳米抗体设计计算在大约一周内完成。

自主科学的未来

“虚拟实验室”代表了一种根本性新研究范式的原型,其中计算任务实现自动化,使人类能够专注于关键决策和高层次指导。这标志着LLM从被动工具转变为能够推动复杂跨学科项目从构想到实施的主动、自主合作者。

该模型的下一个雄心勃勃的前沿是通过机器人实验室技术员实现湿实验室实验的自动化。想象一个完全自主的研究流程:人类PI定义一个高层次的生物目标;AI智能体团队研究现有信息、集思广益、选择计算工具、编写并执行代码,并提出实验;机器人实验室技术员随后执行物理协议——移液、离心、成像和数据收集;最后,结果流回“虚拟实验室”,AI智能体分析、适应和迭代,从而闭合发现循环。

机器人生物实验室已在开发中,Emerald Cloud Lab、Strateos和Colabra(原Transcriptic)等公司提供“湿实验室即服务”。Future House等非营利组织正在为自动化研究构建AI智能体,一些学术机构也拥有自主化学实验室。智能AI与机器人自动化的这种整合可能会彻底改变科学和技术进步。这样的系统可以24/7不间断运行,进行数千次并行微实验,并快速探索目前人类实验室无法实现的大量假设空间。

尽管挑战依然存在——真实世界的科学本质上是复杂的,机器人协议必须高度稳健,意外错误仍需要人类判断——但AI和机器人技术的持续发展有望缩小这些差距。这一发展凸显了人工智能能力的深刻转变,表明它不仅能够协助重复性体力劳动,还能在人类最需要智力的努力中表现出色,开创了一个AI将越来越多地提问、辩论、决策并最终进行发现的时代。

AI实验室搭载LLM智能体,成功发现抗病毒分子 - OmegaNext AI 新闻