盖瑞·马库斯炮轰GPT-5:过度炒作,表现平平

Decoder

GPT-5,OpenAI最新旗舰大型语言模型,最近的发布再次遭遇了著名人工智能批评家盖瑞·马库斯的熟悉质疑浪潮。在一篇措辞犀利的博客文章中,马库斯指责OpenAI助长了“过时、过度炒作和令人失望”的兴奋,认为新模型远非突破,而仅仅是人工智能持续演进中的又一个增量步骤,仍然饱受整个行业普遍存在的根本性问题困扰。

作为长期以来对单纯扩大神经网络规模以实现真正智能的有效性持怀疑态度的人,马库斯利用GPT-5的发布重申了他的核心批评。他将GPT-5描述为“最新的增量进展”,并补充说它“感觉仓促”。尽管OpenAI首席执行官萨姆·奥特曼吹捧GPT-5能提供“与……任何领域的合法博士级专家交谈”的体验,但马库斯仍不为所动。他尖锐地指出,GPT-5“仅比上个月的‘当红炸子鸡’(Grok 4)好一点点;在某些指标(ARC-AGI-2)上甚至更差”,他指的是衡量AI推理能力的常用基准。

事实上,马库斯强调,与大型语言模型相关的典型缺陷在GPT-5发布后几乎立即浮出水面。他渴望被“一个能在一周内不被社区发现大量荒谬错误和幻觉的系统”真正打动。然而,在首次亮相的几小时内,该系统就表现出了熟悉的缺点,包括发布直播中出现有缺陷的物理学解释、基本国际象棋谜题的错误答案以及图像分析中的失误。

马库斯认为,这些孤立的错误并非异常,而是行业性问题的症状。他提请注意亚利桑那州立大学最近的一项研究,该研究与他的担忧深度契合。该论文指出,“思维链”推理——一种旨在将复杂问题分解为更小、按顺序步骤的AI方法——是“一种脆弱的海市蜃楼,一旦超出训练分布就会消失”。马库斯指出,阅读该研究的摘要让他有一种似曾相识的感觉,这进一步强化了他长期以来的信念:“我当时指出的‘阿喀琉斯之踵’依然存在。”

马库斯认为,这种“分布偏移”问题——即当AI模型遇到超出其特定训练参数的数据或场景时就会出现困难——正是从Grok到Gemini等其他大型模型在需要将知识应用于新颖情况的更复杂“迁移任务”中同样失败的原因。他断言:“这不是偶然。这种失败是有原则的”,暗示这是一种根本性限制而非仅仅是错误。

除了GPT-5的技术细节,马库斯将他的批评范围扩大到人工智能领域的更广泛趋势。他谴责围绕通用人工智能(AGI)概念的猖獗炒作,对依赖精心挑选的演示视频来掩盖局限性、训练数据普遍缺乏透明度以及他认为优先考虑营销而非真正科学研究的行业表示不满。他直言不讳地评价道:“过去几年,我们一直被灌输着大量的废话。”

作为纠正措施,马库斯再次倡导神经符号方法,该方法将神经网络的模式识别优势与符号AI的逻辑推理能力相结合,通常融入“显式世界模型”,使AI更清晰地理解其环境中的规则。对马库斯而言,GPT-5的发布并非迈向AGI的一步,而是一个关键时刻,甚至连专注的技术爱好者也可能开始认真质疑“规模化假设”——即简单地将模型做得更大将不可避免地导致更智能、更有能力的AI的信念。