OpenAI 推出 GPT-5:更智能、更敏锐、面向真实世界的AI模型
在GPT-4发布两年多后,OpenAI揭示了GPT-5,这标志着其大型语言模型(LLM)技术的一次重大演进。该公司声称,新模型提供了更敏锐的推理能力、增强的多模态功能、更高的数学熟练度以及更精确的任务执行,使其成为处理真实世界挑战时更稳定、更通用、更像人类的专家。GPT-5目前正逐步向ChatGPT用户推出,并通过其应用程序编程接口(API)提供。
OpenAI声称GPT-5是迄今为止其最强大的编码模型,在基准测试和实际应用中都表现出优于GPT-o3的性能。该模型经过精心微调,可与“智能体工具”(即支持AI采取行动或自动化任务的软件,如Cursor、Windsurf、Copilot和Codex CLI)集成,并在内部测试中创下了新的性能记录。除了编码,GPT-5旨在提供更敏锐的推理能力,能够以更高的准确性和专注度熟练处理复杂问题和多步骤指令。OpenAI强调其能够保持方向、更精确地遵循指令,并生成更有用、更可靠的输出,同时显著减少“幻觉”(即AI产生不正确或无意义信息)的发生。用户还可以期待更强大的定制工具,使GPT-5在不同行业和特定需求中更加可靠和适应性强。在GPT-4o的基础上,GPT-5还在文本、图像和音频等多种模态之间提供更流畅的交互。
GPT-5的推出正值竞争激烈的市场环境。本周早些时候,主要竞争对手Anthropic发布了其聊天机器人Claude Opus 4.1的更新版本。据报道,Claude Opus 4.1在编码能力方面表现出显著改进,根据SWE Verified基准测试,能够解决高达75%的真实世界编程任务。它还在详细研究和分析方面展现出更强的熟练度,特别是在需要整合和智能检索大量信息的任务中。
对于OpenAI而言,GPT-5代表着一个关键时刻。AI教育平台Superintelligent的首席执行官Nathaniel Whittemore将其形容为OpenAI“迄今为止最关键的生死时刻”。他强调,尽管谷歌和Meta等竞争对手利用数亿现有用户,但OpenAI的战略在于通过持续领先其他AI实验室来吸引新用户。这一策略似乎正在奏效,OpenAI首席运营官Brad Lightcap报告称,ChatGPT目前已被超过五百万商业用户使用,比六月份的三百万有了显著增长。
早期采用者已经开始体验GPT-5的益处。例如,生物制药公司Amgen已将该模型整合到其工作流程中。Amgen人工智能与数据高级副总裁Sean Bruich证实,AI要在科学应用中发挥作用,必须达到最高标准,他认为GPT-5达到了这一门槛。他指出,该模型在Amgen的各项操作中展现出更高的准确性、更强的上下文理解能力和更快的处理结果,尤其赞扬了其在上下文至关重要的模糊性环境中进行导航的能力。Bruich进一步强调,与GPT-4及早期版本相比,该模型在速度、可靠性和输出质量方面都有所提升。
沃顿商学院副教授Ethan Mollick获得了GPT-5的早期访问权限,他将其描述为“一件大事”。他讲述了一个案例:他挑战该模型以戏剧性的方式展示其能力;经过24秒的思考,GPT-5发表了一篇关于AI潜力的诗意宣言,展示了其“多功能智能”。Mollick观察到,GPT-5经常“自己做事情,通常是非凡的事情,有时是奇怪的事情,有时是非常AI的事情”,他认为这特别引人入胜。
Mollick还指出了两个经常限制用户成功使用AI模型的重大障碍,GPT-5似乎都解决了这些问题。首先,许多用户不知道选择哪种AI模型,通常会默认选择更快、但功能较弱的选项,从而错过了更强大推理模型提供的全面答案。他指出,虽然更强大的模型需要更多的处理时间和成本,但OpenAI此前在默认ChatGPT使用中优先考虑速度,有效地“隐藏了最好的东西”不让大多数用户看到。因此,令人惊讶的是,许多人从未真正体验过AI的全部潜力,因为他们停留在像GPT-4o这样的模型上,被一系列命名模糊的替代品所困扰。其次,许多用户不了解AI的能力或如何有效地提示它们,特别是对于较新的智能体AI。GPT-5旨在通过智能地为给定任务选择合适的模型并主动建议行动来解决这些问题,使其成为一个高度直观和有用的工具。
GPT-5目前正在向ChatGPT Plus、Pro、Team和免费用户推出,企业和教育客户的访问权限定于下周开放。免费用户在达到使用限制后将过渡到GPT-5 mini。