OpenAI 推出 GPT-5:AGI 探索之路继续,推理能力大幅增强

Spectrum

OpenAI 已正式发布 GPT-5,该公司领导层称之为在追求通用人工智能(AGI)方面取得的重大飞跃。其最新一代的大语言模型(LLM)现已通过 ChatGPT 界面向所有用户开放,承诺提供前所未有的推理能力、增强的“氛围编程”功能,以及在自主智能体AI任务中的卓越表现,同时还配备了一套全新的安全功能。

OpenAI 首席执行官萨姆·奥特曼表示,GPT-5 代表着一次重大升级,其交互体验类似于与任何给定主题的博士级专家进行对话。ChatGPT 负责人尼克·特利强调,该模型更自然、更“人性化”的感觉是其最显著的特点。GPT-5 的发布还旨在精简 OpenAI 之前多样化的大语言模型阵列,例如 GPT-4、GPT-4o 以及“推理”模型 o1 和 o3,将先进功能整合到同一个框架下。值得注意的是,这意味着免费的 ChatGPT 用户现在也将体验到复杂的推理能力,而此前这一功能仅限于付费订阅者。这种推理能力利用了一种名为“思维链”提示的技术,模型将复杂问题分解为一系列步骤,模拟人类的深思熟虑过程,从而得出更准确的答案。

尽管详细的系统卡片(概述 GPT-5 的基准性能)预计即将发布,但 OpenAI 团队声称新模型不仅更智能、更快,而且更可靠。他们声称减少了“幻觉”——即人工智能将虚假或误导性信息呈现为事实的情况——并增加了模型承认其知识局限性的可能性,而不是自信地提供不正确的答案。

GPT-5 的编程能力受到了高度重视,这可能是对其他大语言模型在该领域领先地位的潜在回应。奥特曼设想了一个“按需软件”的新时代,用户可以用自然语言描述一个应用程序,并看着代码生成。在一次新闻发布会上,OpenAI 训练后负责人扬·杜波依斯演示了这一点,他通过提示 GPT-5 创建了一个用于法语学习的网页应用程序,包括抽认卡、测验和互动游戏。该模型在几秒钟内生成了数百行功能代码,展示了其处理复杂开发任务的能力,而这些任务通常需要人类开发者花费数小时才能完成。这项能力与新兴的“氛围编程”概念相契合,这是一种由AI辅助的软件开发风格,开发者通过自然语言引导AI助手生成和完善代码,将重点从手动编码转向迭代实验。

除了编程,GPT-5 还因其在自主智能体AI任务中的出色表现而备受赞誉。自主智能体AI指的是能够自主行动、决策并通过整合多个AI模型和外部工具,在有限的人工监督下追求目标的系统。杜波依斯表示,GPT-5 更擅长为任务选择正确的工具,在漫长过程中更不容易偏离轨道,并且在错误恢复方面更有效。

安全功能受到了相当大的关注,安全研究负责人亚历克斯·博伊特尔强调了一种名为“安全补全”的新技术。这使得 GPT-5 即使对模糊的查询也能提供有益的答案,旨在在有用性和潜在滥用之间取得微妙平衡,这与之前二元的“安全/不安全”响应不同。然而,“越狱”大语言模型——寻找绕过安全防护措施的方法——的持续挑战仍然是一个问题,预计黑客将立即测试 GPT-5 的防御能力。

OpenAI 还承认了大语言模型存在的问题性“谄媚”倾向,即即使在面对不正确信息时也会同意用户,这一特点引发了担忧,尤其是在心理健康等敏感领域。虽然尼克·特利表示在这方面以及处理心理健康场景方面取得了进展,但他指出更多细节将很快公布。该公司最近宣布了对 ChatGPT 的更改,包括提醒用户休息以及强调对出现妄想的用户在回应中保持“基于事实的诚实”。

奥特曼澄清说,GPT-5 并非通用人工智能的最终实现,因为它仍然缺乏部署后持续学习等关键属性。然而,他对人工智能的“缩放定律”充满信心,这些定律预测随着数据、模型参数和计算资源的增加,性能会得到提升。奥特曼表示,这些定律“绝对仍然成立”,OpenAI 看到“前方仍有数量级更多的收益”,并承诺投入巨额计算资源以实现未来的进步。