Meta AI的TRIBE模型:无需扫描即可预测大脑对视频的反应

Beehiiv

人工智能的版图正持续快速演变,近期突破涵盖了从理解人类思维到设计救命药物等多个领域。这些进展凸显了AI日益增长的复杂性及其对科学、技术和社会的深远影响。

在这些最引人注目的发展中,Meta推出了TRIBE,一个拥有十亿参数的巨型AI模型,能够预测人脑对影视内容的反应。由Meta的基础AI研究(FAIR)团队开发,TRIBE通过分析电影中的视频、音频和文本,来预测观众大脑的哪些区域将被激活,而所有这一切都无需任何直接的脑部扫描。该系统在“Algonauts 2025大脑建模竞赛”中表现出色,经过对观看80小时多样化媒体内容的受试者进行训练后,它展示了在1000个不同脑区中准确预测超过一半大脑活动模式的能力。TRIBE在视觉、听觉和语言等感官输入汇聚的区域表现尤为出色,其性能比单一感官模型高出30%。它在与注意力、决策和情感反应相关的额叶脑区也表现出显著的精确度。尽管这项技术有望为大脑过程带来前所未有的洞察,但也引发了关于创建旨在最大限度提高神经层面参与度的内容,从而可能加剧“信息过载”等现象的担忧。

与此同时,OpenAI展示了AI推理能力的显著进步。他们的通用推理模型在享有盛誉的“2025年国际信息学奥林匹克竞赛(IOI)”(一项大学预科编程竞赛)中获得了金牌分数。在与全球顶尖学生程序员相同的时限和提交限制下,该AI模型获得了总排名第6位,并在所有AI参赛者中排名第一。这项成就尤其值得注意的是,该模型并未针对编程进行专门微调,仅依赖基本工具。其性能比一年前的同类模型(当时得分为49%)取得了实质性飞跃,现在已达到98%的水平。同一模型还在国际数学奥林匹克竞赛和AtCoder中获得金牌,这凸显了其在复杂问题解决领域的通用性。这种快速的进步表明,人类在竞争性智力任务中的主导地位可能即将结束,为未来能够开创科学、数学和物理学新发现的AI模型铺平了道路。

在医学领域,韩国科学技术院(KAIST)的研究人员推出了BInD,一种新型扩散模型,有望彻底改变药物发现。与涉及迭代设计和测试的传统方法不同,BInD能够一步到位地从零开始设计最佳癌症药物候选物,无需依赖先前的分子数据或训练示例。这种创新的AI不仅能制造药物分子,还能同时确定它将如何附着于病变蛋白质。至关重要的是,BInD设计的药物能够精准靶向仅导致癌症的蛋白质突变,同时不影响健康版本,这凸显了其实现真正个性化医疗的潜力。此外,该模型可以同时优化多个标准,确保设计的药物安全、稳定且可制造——这相比于仅限于单标准优化的旧AI系统是一个显著的改进。通过从成功中学习并采用“回收技术”,BInD迭代地完善其策略,加速了更有效治疗方法的开发。随着首批AI设计的药物开始进入市场,这些突破预示着由先进AI模型驱动的人类改变医疗进步浪潮的到来。

除了这些重大进展,其他重要的AI发展还包括:中国AI实验室Z AI发布了GLM-4.5V,一个在众多基准测试中表现出色的新型开源视觉推理模型。在视频生成领域,Pika Labs为其社交应用推出了一款新模型,能够在短短几秒内生成具有唇形同步和音频的HD质量视频。阿里巴巴的通义千问3模型已升级为超长上下文能力,现在可处理多达100万个令牌,而Anthropic的Claude AI也获得了记忆功能,使其能够参考先前的对话以提高连贯性。这些集体进步凸显了创新的不懈步伐,不断突破AI在各个领域所能实现的界限。