GPT-5表现不佳:OpenAI的成本节约策略?
OpenAI备受期待的GPT-5模型于上周发布,却出人意料地给这家人工智能巨头带来了一段动荡时期。尽管据报道内部指标显示性能略有提升,但用户体验却普遍令人失望,导致其忠实社区的强烈反弹。常见的抱怨集中在其简洁性、写作质量的明显下降,以及用户习以为常的个性缺失。更令人震惊的是,尽管号称拥有“博士级”智能,该模型仍被观察到犯下基本错误,例如错误地声称“blueberry”(蓝莓)一词包含三个字母“B”。
用户的不满如此之深,以至于许多人要求恢复之前的模型GPT-4o,而OpenAI在GPT-5首次亮相时曾大胆将其移除。在一个具有说服力的转折中,该公司迅速屈服于这些要求,恢复了对旧的、更受欢迎的版本的访问。这一立即的逆转给首席执行官萨姆·奥尔特曼(Sam Altman)早先关于GPT-5代表着“通用人工智能(AGI)道路上的重要一步”的声明蒙上了一层阴影。
一个有趣的理论浮出水面,解释了GPT-5令人失望的接收度:这可能与其说是在AI能力上的突破性飞跃,不如说是一项优化运营成本的战略举措。《The Register》等出版物探讨了这一观点,强调了新兴AI行业中巨大的财务压力,像OpenAI这样的公司在计算资源上烧掉了数十亿美元,而产生的收入却相对适中。这一转变可能是OpenAI为了遏制开支并提高其在本十年结束前实现盈利的可能性所做的努力,考虑到其预计高达约5000亿美元的估值,这是一项艰巨的挑战。
加重这一理论分量的是关于GPT-5底层架构的揭示。据报道,GPT-5并非单一的、庞大的模型,而是一个动态的二重奏:一个用于基本请求的轻量级模型,以及一个用于复杂推理任务的更强大、资源密集型模型。一个独立的“路由器”模型负责智能地将每个用户提示定向到两者中最合适的一个。据奥尔特曼称,这个路由器模型在发布当天出现故障,导致GPT-5“比预期笨得多”的看法。尽管路由器此后已重新上线并据称有所改进,但最初的混乱只会加剧用户的沮丧,尤其考虑到他们选择的感知限制。
这种“自动切换器”的部署标志着OpenAI与之前方法的显著不同,以前付费订阅者可以手动选择他们偏好的模型。同时维持多个大型语言模型在线是一项昂贵的 endeavor,这进一步强化了OpenAI正在经历一段紧缩时期的观念。成本节约措施的进一步证据包括对免费用户每小时仅限十条消息的严格限制。此外,该模型的“上下文窗口”,即其用于持续对话的短期记忆,对于Plus用户仍保持32,000个token,对于Pro用户则为128,000个token。许多订阅者,尤其是那些处于每月20美元更实惠的Plus级别(Pro每月200美元)的用户,一直恳求在此关键领域进行升级。
GPT-5主要是成本节约举措的观点在用户社区中引起了广泛共鸣。例如,r/ChatGPT subreddit上的一篇热门帖子明确指出,GPT-5“显然是成本节约的举措”,并详细说明:“他们移除了所有昂贵、有能力的模型,并用一个默认为成本优化的自动路由器取而代之……感觉像是成本节约,而不是改进。”
尽管不那么光鲜,但此类成本削减措施对OpenAI来说在战略上是明智的。该公司面临前所未有的竞争和巨大压力,需要通过展示可行的盈利路径来验证其巨大的估值。然而,在追求财务稳定性的过程中,OpenAI似乎低估了用户对其旧的、可能效率较低的模型所形成的细微之处和特点的深厚依恋。这种意想不到的用户忠诚度提出了一个新的、复杂的挑战,这家AI先驱在平衡创新与底线时将需要应对。