GPT-5:AI进步微乎其微,过度炒作却甚嚣尘上

Technologyreview

OpenAI备受期待的新旗舰模型GPT-5终于面世,观察家们的共识很明确:尽管它提供了更精致的用户体验,但远非一场革命性的突破。正如一位同事简洁地指出,GPT-5“首先,是一个精致的产品”。这一评估与更广泛的情绪不谋而合,即近期整个行业的模型发布越来越像渐进式智能手机更新,旨在增强现有功能,而非引入全新的范式。OpenAI首席执行官萨姆·奥特曼本人将其比作苹果推出视网膜显示屏,这种比较虽然对迭代改进有效,但却引出了一个问题:从黑莓键盘到触摸屏iPhone的变革性飞跃在哪里?那种能够解锁全新应用和行业、类似于辅助GPS实现实时导航并催生优步等公司的根本性转变又在哪里?

事实上,GPT-5的发布遭遇了意想不到的用户反弹。习惯了GPT-4o独特“个性”的客户成功游说OpenAI,要求将其作为Plus订阅者的一个选项重新启用。这一事件进一步强调,GPT-5的发布优先考虑的是用户体验的微调,而非显著的性能提升。

然而,尽管事实如此,围绕GPT-5的炒作却异常巨大。在发布前几小时,奥特曼发布了一张正在浮现的死星图片来预告。发布当天,他吹嘘其拥有“博士级智能”,后来又在早间新闻节目中声称它将“拯救许多生命”。虽然此类言论常受质疑,但奥特曼并非唯一一个如此作秀的人。就在上周,Meta首席执行官马克·扎克伯格撰写了一篇长文,谈论AI超智能即将到来;今年早些时候,Anthropic首席执行官达里奥·阿莫代伊预测AI可能在一年内取代一半的入门级工作,引发了广泛恐慌。这些行业领袖经常讨论他们的创造物带来的生存风险,即使他们的先进模型在回答诸如数“blueberry”中有多少个“b”这样的基本问题时仍然力不从心。

这并非要贬低OpenAI、Anthropic及其他开发商产品的卓越能力。它们无疑是功能强大且实用性强的工具。然而,围绕这些模型发布的炒作周期已经变得过分。作为ChatGPT和Google Gemini的频繁用户,我经常一天使用多次,亲身体验了它们的实用性。最近,我妻子遇到了一头鲸鱼反复拍打水面尾巴,尽管她有丰富的海洋生物经验,但从未见过这种行为。好奇之下,我向ChatGPT求助,问道:“鲸鱼为什么会反复拍打水面尾巴?”聊天机器人自信地将这种行为识别为“拍尾(lobtailing)”,并提供了一系列潜在原因。虽然令人印象深刻,但标准的谷歌搜索也能提供类似信息。更重要的是,ChatGPT的解释虽然简洁,却过于武断。实际上,尽管理论众多,但拍尾背后的确切原因仍是一个科学谜团。

我对这个谜团的了解源于深入研究传统搜索结果,这使我读到了艾米丽·博林(Emily Boring)一篇富有洞察力的文章。她雄辩地描述了她对一头座头鲸拍尾的观察,并探讨了围绕这种耗能行为的科学不确定性。是为了觅食、交流还是展示?正如生物学家哈尔·怀特海德(Hal Whitehead)所说:“跃出水面和拍尾之所以能很好地传递信号,正是因为它们耗费能量巨大,因此能表明信息的重要性以及信号发出者的身体状况。”在这种语境下,一次拍尾就成了一个有力的宣告:“注意了!我很重要!注意到我!”

在许多方面,当前的AI炒作周期是激烈投资的必然产物。数不清的数十亿美元沉没成本,以及大规模数据中心建设及其带来的严重环境后果,所有这些都需要正当理由。如此巨大的资本处于风险之中,以至于该行业不得不不断地制造宏大承诺。

这并非说AI领域没有真正酷炫的事情发生。我确实被某些AI发布所震撼,例如ChatGPT 3.5、Dall-E、NotebookLM、Veo 3和Synthesia。就在本周,Google DeepMind的Genie 3能够将简单的文本提示转换为沉浸式、可导航的3D世界,这确实令人惊叹。然而,Genie 3本身就充分证明,AI中最有趣的进展往往发生在聊天机器人领域之外。

甚至有人可能会争辩说,在现阶段,对新大型语言模型聊天机器人发布最持续感到惊奇的观察者,往往是那些能直接从其推广中获利最多的人。也许这种观点有些愤世嫉俗,但我认为它比承诺一个死星却交付一个主要新吸引力是自动模型选择的聊天机器人,要不那么愤世嫉俗。它比承诺超智能却交付一个被过度炒作、常常武断但最终有限的工具,要不那么愤世嫉俗。这一切都只是大量的拍尾:“注意了!我很重要!注意到我!”