OpenAI 推出 GPT-5：AGI 探索之路继续，推理能力大幅增强

OpenAI 已正式发布 GPT-5，该公司领导层称之为在追求通用人工智能（AGI）方面取得的重大飞跃。其最新一代的大语言模型（LLM）现已通过 ChatGPT 界面向所有用户开放，承诺提供前所未有的推理能力、增强的“氛围编程”功能，以及在自主智能体AI任务中的卓越表现，同时还配备了一套全新的安全功能。

OpenAI 首席执行官萨姆·奥特曼表示，GPT-5 代表着一次重大升级，其交互体验类似于与任何给定主题的博士级专家进行对话。ChatGPT 负责人尼克·特利强调，该模型更自然、更“人性化”的感觉是其最显著的特点。GPT-5 的发布还旨在精简 OpenAI 之前多样化的大语言模型阵列，例如 GPT-4、GPT-4o 以及“推理”模型 o1 和 o3，将先进功能整合到同一个框架下。值得注意的是，这意味着免费的 ChatGPT 用户现在也将体验到复杂的推理能力，而此前这一功能仅限于付费订阅者。这种推理能力利用了一种名为“思维链”提示的技术，模型将复杂问题分解为一系列步骤，模拟人类的深思熟虑过程，从而得出更准确的答案。

尽管详细的系统卡片（概述 GPT-5 的基准性能）预计即将发布，但 OpenAI 团队声称新模型不仅更智能、更快，而且更可靠。他们声称减少了“幻觉”——即人工智能将虚假或误导性信息呈现为事实的情况——并增加了模型承认其知识局限性的可能性，而不是自信地提供不正确的答案。

GPT-5 的编程能力受到了高度重视，这可能是对其他大语言模型在该领域领先地位的潜在回应。奥特曼设想了一个“按需软件”的新时代，用户可以用自然语言描述一个应用程序，并看着代码生成。在一次新闻发布会上，OpenAI 训练后负责人扬·杜波依斯演示了这一点，他通过提示 GPT-5 创建了一个用于法语学习的网页应用程序，包括抽认卡、测验和互动游戏。该模型在几秒钟内生成了数百行功能代码，展示了其处理复杂开发任务的能力，而这些任务通常需要人类开发者花费数小时才能完成。这项能力与新兴的“氛围编程”概念相契合，这是一种由AI辅助的软件开发风格，开发者通过自然语言引导AI助手生成和完善代码，将重点从手动编码转向迭代实验。

除了编程，GPT-5 还因其在自主智能体AI任务中的出色表现而备受赞誉。自主智能体AI指的是能够自主行动、决策并通过整合多个AI模型和外部工具，在有限的人工监督下追求目标的系统。杜波依斯表示，GPT-5 更擅长为任务选择正确的工具，在漫长过程中更不容易偏离轨道，并且在错误恢复方面更有效。

安全功能受到了相当大的关注，安全研究负责人亚历克斯·博伊特尔强调了一种名为“安全补全”的新技术。这使得 GPT-5 即使对模糊的查询也能提供有益的答案，旨在在有用性和潜在滥用之间取得微妙平衡，这与之前二元的“安全/不安全”响应不同。然而，“越狱”大语言模型——寻找绕过安全防护措施的方法——的持续挑战仍然是一个问题，预计黑客将立即测试 GPT-5 的防御能力。

OpenAI 还承认了大语言模型存在的问题性“谄媚”倾向，即即使在面对不正确信息时也会同意用户，这一特点引发了担忧，尤其是在心理健康等敏感领域。虽然尼克·特利表示在这方面以及处理心理健康场景方面取得了进展，但他指出更多细节将很快公布。该公司最近宣布了对 ChatGPT 的更改，包括提醒用户休息以及强调对出现妄想的用户在回应中保持“基于事实的诚实”。

奥特曼澄清说，GPT-5 并非通用人工智能的最终实现，因为它仍然缺乏部署后持续学习等关键属性。然而，他对人工智能的“缩放定律”充满信心，这些定律预测随着数据、模型参数和计算资源的增加，性能会得到提升。奥特曼表示，这些定律“绝对仍然成立”，OpenAI 看到“前方仍有数量级更多的收益”，并承诺投入巨额计算资源以实现未来的进步。

OpenAI 推出 GPT-5：AGI 探索之路继续，推理能力大幅增强

相关文章

OpenAI发布GPT-5：AI飞跃，强化推理与智能体技能

微软Copilot深度整合GPT-5：引入智能模式，能力跃升

OpenAI发布GPT-5：奥特曼盛赞“重大升级”