GPT-5表现平平：AI创新是否已触及天花板？

OpenAI备受期待的新人工智能模型GPT-5于上周发布，本应是一个关键时刻。首席执行官萨姆·奥特曼将其誉为“通往AGI（通用人工智能）道路上的重要一步”，AGI指的是能够达到或超越人类智能水平的AI系统。高管们也曾希望该模型能优化ChatGPT的用户体验，这款多功能聊天机器人已成为历史上增长最快的消费应用。

然而，承诺的积极“氛围”很快消散。用户在社交媒体上发布了大量图片，展示了GPT-5的低级错误，例如错误标注美国地图——这是先前模型中反复出现的问题。更关键的是，高级用户对模型“个性”的感知变化表示失望，并指出其在标准基准测试中与竞争对手相比表现平平。尽管前期宣传声势浩大，GPT-5现在普遍被视为一次渐进式升级，而非早期GPT迭代中那样的革命性飞跃。Hugging Face的联合创始人托马斯·沃尔夫总结道：“人们期待发现全新的东西。但这次我们并没有真正看到。”

随着数千亿美元涌入生成式AI领域，一个紧迫的问题如今在硅谷回荡：难道这就是它的极限了吗？三年来，AI研究人员和投资者已习惯了创新永不停歇的步伐。OpenAI曾看似不可战胜，但谷歌、Anthropic、DeepSeek以及埃隆·马斯克的xAI等竞争对手正迅速缩小差距。这助长了对AGI即将到来的大胆预测，奥特曼甚至预测它会在唐纳德·特朗普总统任期内出现。这些高涨的预期（支撑着OpenAI预计5000亿美元的估值）在GPT-5未能留下深刻印象时，与现实发生了碰撞。著名AI评论家加里·马库斯直言不讳地表示：“GPT-5是整个通过规模化实现AGI方法的核心标志，但它没有奏效。”

加州大学伯克利分校计算机科学教授斯图尔特·拉塞尔将其与20世纪80年代的“AI寒冬”相提并论，当时创新未能达到预期并带来回报。他回忆说，那时“泡沫破裂”了，因为系统无法盈利。拉塞尔警告说，类似情景今天可能迅速上演，他将其比作一场“抢凳子”游戏，每个人都争先恐后地避免成为那个“抱娃”的人。尽管一些人认为这项技术仍处于萌芽阶段且资金持续流入，但拉塞尔警告说，过度膨胀的期望可能带来灾难性后果。

核心挑战源于构建大型语言模型的主流方法：更多数据和计算能力会产生更大、更强大的模型。尽管许多AI领导者认为这些“规模法则”将继续适用，但这种方法正遭遇资源限制。AI公司已基本耗尽了免费可用的训练数据，现在正积极寻求与出版商达成内容共享协议。此外，训练和运行大型模型需要极高的能源消耗。GPT-4使用了数千块英伟达芯片；据报道，GPT-5使用了数十万块下一代处理器。OpenAI首席执行官萨姆·奥特曼最近承认了这些限制，他表示，尽管底层AI模型“仍在快速改进”，但像ChatGPT这样的聊天机器人“不会有太大进步”。

一些AI研究人员认为，过度专注于扩展大型语言模型，无意中通过掩盖替代性研究而限制了进展。Meta首席科学家杨·勒昆认为：“我们正在进入一个纯文本训练的LLM回报递减的阶段。”然而，他强调这并不意味着“通过视频和其他模态理解真实世界的深度学习AI系统”达到了上限。这些“世界模型”从语言之外的物理世界元素中学习，从而实现规划、推理和持久记忆，可能推动自动驾驶汽车或机器人技术的发展。Cohere首席AI官乔尔·皮诺也表示同意：“仅仅继续增加计算能力和追求理论上的AGI是不够的。”

对AI发展放缓的怀疑已影响到美国的贸易和技术政策。在乔·拜登总统执政期间，重点明确放在安全和监管上，这是因为担心AI的快速增长会带来危险后果。唐纳德·特朗普的自由主义倾向一直暗示AI监管不会是优先事项，但即便最近，国家安全担忧也促使华盛顿威胁对英伟达销往中国的H20芯片实施出口管制。华盛顿立场转变的一个明确信号来自特朗普的AI沙皇戴维·萨克斯，他宣称“关于失业的末日预言与AGI本身一样被过度炒作了”。萨克斯认为AI市场已达到一种“金发姑娘”式的平衡状态，竞争激烈且人类角色明确。不久之后，特朗普与英伟达首席执行官黄仁勋达成协议，恢复H20对华销售，甚至考虑允许销售更强大Blackwell系统的修改版本。分析师认为，随着AGI不再被视为迫在眉睫的风险，华盛顿的重点已转向确保美国制造的AI芯片和模型在全球占据主导地位。

尽管可能并非OpenAI的本意，但GPT-5的发布凸显了一个根本性转变：普林斯顿大学研究员萨亚什·卡普尔表示，AI公司“正逐渐接受它们正在为产品构建基础设施的事实”。他的团队发现GPT-5的性能始终处于中等水平，但在“成本效益高且比其他模型快得多”方面表现出色。这种效率可以释放产品和服务领域的巨大创新，即使没有实现AGI的非凡突破。AI政策研究员迈尔斯·布伦戴奇观察到：“随着AI在许多有用的方面得到应用，人们将更多地关注应用程序，而不是像AGI这样更抽象的概念，这是有道理的。”领先的AI公司现在正在部署“前线工程师”，将模型直接嵌入客户系统。卡普尔指出：“如果公司认为它们即将自动化所有人类工作，它们就不会这样做。”

尽管基础AI发展似乎放缓了。

GPT-5表现平平：AI创新是否已触及天花板？

相关文章

华尔街警报：GPT-5是否宣告传统软件的终结？

OpenAI拟估值5000亿美元，人才战中超越SpaceX

Claude 4.1 代码基准测试称霸，Anthropic 营收飙升但暗藏风险