OpenAI承认GPT-5发布遇挫,为用户恢复GPT-4o访问权限
OpenAI联合创始人兼首席执行官萨姆·奥特曼已公开承认,公司新旗舰大型语言模型(LLM)GPT-5近期发布后,面临重大挑战。GPT-5曾被誉为OpenAI迄今为止最强大、最能干的模型,但其发布却因一系列问题而受损,包括模型切换故障、性能不稳定以及用户普遍困惑。这些问题促使OpenAI部分撤销了一些平台更改,特别是恢复了用户对GPT-4o等早期模型的访问权限。
在Reddit和X(原Twitter)上与用户进行的坦诚交流中,奥特曼承认此次发布“比我们预期的要颠簸一些”。他将OpenAI GPT-5直播中显示的性能图表错误归咎于人为失误,指出“工作人员工作到很晚,非常疲惫”。尽管随附的博客文章和系统卡片是准确的,但这些失误进一步复杂化了本已面临早期采用者和开发者审查的发布。OpenAI此后已将ChatGPT Plus用户的GPT-5速率限制翻倍,并将继续允许Plus用户选择GPT-4o,同时监控使用情况,以考虑支持旧模型的时长。
据奥特曼称,导致此次中断的主要原因是OpenAI新型自动“路由器”的故障。该系统旨在将用户提示分配给四种GPT-5变体之一——常规、迷你、纳米和专业版——并提供可选的“思考模式”以处理更复杂的推理任务。奥特曼透露,该系统的一个关键组件“自动切换器”在“一天中的大部分时间都处于停用状态”,导致GPT-5显得“比预期更笨”。为此,OpenAI计划调整模型决策边界以获得更好的性能,并通过指示哪个模型正在响应给定查询来增强透明度。用户界面更新也在筹备中,以方便手动触发思考模式。
尽管OpenAI的内部基准测试表明GPT-5在大型语言模型中处于领先地位,但实际用户体验却呈现出不同的景象。自发布以来,众多用户分享了GPT-5在数学、逻辑和编码任务中出现基本错误的例子。例如,数据科学家科林·弗雷泽发布了屏幕截图,显示GPT-5错误地判断8.888循环等于9,而另一位用户则强调了其在简单代数问题上的失败。开发者也表达了失望,一些人报告称,GPT-5在“一次性”编程任务中的表现不如竞争对手AI实验室Anthropic的新Claude Opus 4.1,这些任务要求从单个提示准确完成。此外,安全公司SPLX指出,除非其安全层得到显著加强,否则GPT-5仍然容易受到提示注入和混淆逻辑攻击。
ChatGPT每周服务7亿用户,OpenAI凭借其庞大的用户群保持着生成式AI领域最大参与者的地位。然而,这种巨大的规模也带来了相当大的成长烦恼。奥特曼指出,GPT-5发布后24小时内API流量翻了一番,导致平台不稳定。尽管OpenAI旨在通过将ChatGPT Plus用户的速率限制翻倍并根据反馈不断调整其基础设施来缓解这一问题,但这些早期失误——加上令人困惑的用户体验变化和高调的发布错误——为竞争对手提供了抢占先机的机会。OpenAI面临的压力越来越大,需要证明GPT-5代表着一次实质性的飞跃,而不仅仅是增量更新。根据最初的发布情况,许多用户仍然不相信。