GPT-5发布引用户失望,引燃成本削减猜测

Futurism

8月8日星期四,OpenAI发布了备受期待的GPT-5人工智能模型,这款新的“推理”工具被首席执行官萨姆·奥特曼誉为全球最佳的编码和写作工具。然而,来自资深用户的初步反馈却出乎意料地平淡,引发了人们对这个不断向人才和基础设施投入巨资的行业是否存在边际效益递减的疑问。

许多早期使用者普遍感到极度失望。在ChatGPT的Reddit论坛上,一篇获得最多赞的帖子作者写道:“GPT-5太糟糕了。”他批评该模型“回复简短且不足,AI风格的对话更加令人厌烦,‘个性’更少,并且Plus用户在一小时内就达到了提示限制。”这种即时反弹表明公司宣传与用户体验之间存在显著脱节。

更复杂的是,OpenAI做出了淘汰所有先前模型的战略决策,这是该公司用于停用过时版本的术语。这一举动不出所料地激怒了许多资深用户,他们长期以来依赖更旧、通常更稳定的模型迭代来完成任务,而不是一味采纳最新版本。对于被广泛认为是AI竞赛前沿的OpenAI来说,随着行业持续证明巨额资本支出的合理性,其面临的风险无疑是巨大的。在一年半多的流言蜚语之后,许多用户期待GPT-5能代表一次划时代的飞跃。

然而,普遍共识认为GPT-5是进步与退步的费解结合。这种混合表现加剧了人们对OpenAI试图控制成本的广泛猜测,考虑到运行大型语言模型是一个众所周知的能源密集型且对环境要求高的过程,这一理论是合理的。一位Reddit用户将其比作“缩水式通货膨胀”,暗示这家据称估值高达5000亿美元的公司可能正在“偷工减料”。其他用户也对此表示赞同,评论道:“我想知道这其中有多少是为了通过提高效率来减轻他们的计算负担。”以及“感觉像是为了节省成本,而不是为了改进。”

主流观点认为,GPT-5是一款利用强大品牌名称的弱势产品。用户报告称,“答案更短,而且到目前为止,并不比之前的模型更好。”再加上更严格的使用政策,这让许多人感觉像是“一次被包装成新热点的降级”。被迫迁移到一个看似受限的模型,甚至导致一些用户幽默地“哀悼”他们曾经的AI伙伴的逝去。一位Reddit用户抱怨新模型的语气“突兀而尖锐”,将其比作“一个过度劳累的秘书”,并称其为“灾难性的第一印象”。

OpenAI自己的GPT-5系统卡——一份详细概述其能力和限制的文档,也未能给人留下深刻印象,似乎与奥特曼声称它是全球最佳AI编码助手的说法相矛盾。AI研究员伊莱·利夫兰在推特上写道:“第一个观察:在所有非SWEBench的编码评估中都没有改进。”SWEBench是评估大型语言模型的常用基准。

然而,GPT-5感知到的局限性在安全性方面可能提供了一线希望。专注于评估“前沿AI系统是否可能对社会造成灾难性风险”的研究非营利组织METR得出结论,GPT-5的思维“不太可能将AI研发人员的速度提高10倍以上”,也“不具备流氓应用的能力”。

尽管萨姆·奥特曼尚未直接回应普遍的负面反应,但他关于GPT-5的公开声明暗示他意识到了其受限的能力。他在推特上表示,虽然GPT-5是“我们迄今为止最聪明的模型”,但主要关注点是“实际效用和大众可及性/可负担性”。在面临五千亿美元估值的背景下,奥特曼继续承诺未来的改进,并补充道:“我们可以发布更、更、更聪明的模型,我们也会这样做,但这将是十亿多人会从中受益的东西。”OpenAI现在的挑战是如何将这些宏伟的承诺与即时且大部分是批评性的用户体验相协调。