GPT-5表现平平:AI创新是否已触及天花板?
OpenAI备受期待的新人工智能模型GPT-5于上周发布,本应是一个关键时刻。首席执行官萨姆·奥特曼将其誉为“通往AGI(通用人工智能)道路上的重要一步”,AGI指的是能够达到或超越人类智能水平的AI系统。高管们也曾希望该模型能优化ChatGPT的用户体验,这款多功能聊天机器人已成为历史上增长最快的消费应用。
然而,承诺的积极“氛围”很快消散。用户在社交媒体上发布了大量图片,展示了GPT-5的低级错误,例如错误标注美国地图——这是先前模型中反复出现的问题。更关键的是,高级用户对模型“个性”的感知变化表示失望,并指出其在标准基准测试中与竞争对手相比表现平平。尽管前期宣传声势浩大,GPT-5现在普遍被视为一次渐进式升级,而非早期GPT迭代中那样的革命性飞跃。Hugging Face的联合创始人托马斯·沃尔夫总结道:“人们期待发现全新的东西。但这次我们并没有真正看到。”
随着数千亿美元涌入生成式AI领域,一个紧迫的问题如今在硅谷回荡:难道这就是它的极限了吗?三年来,AI研究人员和投资者已习惯了创新永不停歇的步伐。OpenAI曾看似不可战胜,但谷歌、Anthropic、DeepSeek以及埃隆·马斯克的xAI等竞争对手正迅速缩小差距。这助长了对AGI即将到来的大胆预测,奥特曼甚至预测它会在唐纳德·特朗普总统任期内出现。这些高涨的预期(支撑着OpenAI预计5000亿美元的估值)在GPT-5未能留下深刻印象时,与现实发生了碰撞。著名AI评论家加里·马库斯直言不讳地表示:“GPT-5是整个通过规模化实现AGI方法的核心标志,但它没有奏效。”
加州大学伯克利分校计算机科学教授斯图尔特·拉塞尔将其与20世纪80年代的“AI寒冬”相提并论,当时创新未能达到预期并带来回报。他回忆说,那时“泡沫破裂”了,因为系统无法盈利。拉塞尔警告说,类似情景今天可能迅速上演,他将其比作一场“抢凳子”游戏,每个人都争先恐后地避免成为那个“抱娃”的人。尽管一些人认为这项技术仍处于萌芽阶段且资金持续流入,但拉塞尔警告说,过度膨胀的期望可能带来灾难性后果。
核心挑战源于构建大型语言模型的主流方法:更多数据和计算能力会产生更大、更强大的模型。尽管许多AI领导者认为这些“规模法则”将继续适用,但这种方法正遭遇资源限制。AI公司已基本耗尽了免费可用的训练数据,现在正积极寻求与出版商达成内容共享协议。此外,训练和运行大型模型需要极高的能源消耗。GPT-4使用了数千块英伟达芯片;据报道,GPT-5使用了数十万块下一代处理器。OpenAI首席执行官萨姆·奥特曼最近承认了这些限制,他表示,尽管底层AI模型“仍在快速改进”,但像ChatGPT这样的聊天机器人“不会有太大进步”。
一些AI研究人员认为,过度专注于扩展大型语言模型,无意中通过掩盖替代性研究而限制了进展。Meta首席科学家杨·勒昆认为:“我们正在进入一个纯文本训练的LLM回报递减的阶段。”然而,他强调这并不意味着“通过视频和其他模态理解真实世界的深度学习AI系统”达到了上限。这些“世界模型”从语言之外的物理世界元素中学习,从而实现规划、推理和持久记忆,可能推动自动驾驶汽车或机器人技术的发展。Cohere首席AI官乔尔·皮诺也表示同意:“仅仅继续增加计算能力和追求理论上的AGI是不够的。”
对AI发展放缓的怀疑已影响到美国的贸易和技术政策。在乔·拜登总统执政期间,重点明确放在安全和监管上,这是因为担心AI的快速增长会带来危险后果。唐纳德·特朗普的自由主义倾向一直暗示AI监管不会是优先事项,但即便最近,国家安全担忧也促使华盛顿威胁对英伟达销往中国的H20芯片实施出口管制。华盛顿立场转变的一个明确信号来自特朗普的AI沙皇戴维·萨克斯,他宣称“关于失业的末日预言与AGI本身一样被过度炒作了”。萨克斯认为AI市场已达到一种“金发姑娘”式的平衡状态,竞争激烈且人类角色明确。不久之后,特朗普与英伟达首席执行官黄仁勋达成协议,恢复H20对华销售,甚至考虑允许销售更强大Blackwell系统的修改版本。分析师认为,随着AGI不再被视为迫在眉睫的风险,华盛顿的重点已转向确保美国制造的AI芯片和模型在全球占据主导地位。
尽管可能并非OpenAI的本意,但GPT-5的发布凸显了一个根本性转变:普林斯顿大学研究员萨亚什·卡普尔表示,AI公司“正逐渐接受它们正在为产品构建基础设施的事实”。他的团队发现GPT-5的性能始终处于中等水平,但在“成本效益高且比其他模型快得多”方面表现出色。这种效率可以释放产品和服务领域的巨大创新,即使没有实现AGI的非凡突破。AI政策研究员迈尔斯·布伦戴奇观察到:“随着AI在许多有用的方面得到应用,人们将更多地关注应用程序,而不是像AGI这样更抽象的概念,这是有道理的。”领先的AI公司现在正在部署“前线工程师”,将模型直接嵌入客户系统。卡普尔指出:“如果公司认为它们即将自动化所有人类工作,它们就不会这样做。”
尽管基础AI发展似乎放缓了。