OpenAI CEO揭示用户为何未充分利用ChatGPT潜力
OpenAI最新版ChatGPT——GPT-5于8月7日发布,其反响呈现出鲜明对比。尽管公司将其发布誉为变革性时刻,并辅以数周的热切期待和精心策划的直播演示,但社交媒体用户却表现出困惑和沮丧,这很大程度上是由于几个熟悉且广泛使用的模型被意外移除。
在这次发布反响之后,OpenAI首席执行官萨姆·奥特曼无意中揭示了公司对GPT-5的宏伟期望与公众实际体验之间的巨大差异。他的解释是针对付费Plus订阅者(每月支付20美元以访问更高层级模型)关于速率限制大幅降低的投诉而做出的,这揭示了一个关键见解:绝大多数用户未能充分发挥AI的潜力。具体而言,在GPT-5发布之前,非付费用户中只有1%使用“推理模型”(如o3),而付费订阅者中也只有7%使用。
推理模型旨在在形成答案之前,细致地处理问题并进行深思熟虑。然而,至关重要的是要记住,这些AI模型不具备人类般的意识或思维过程。但这个类比是成立的:未能利用这些高级功能(绝大多数用户都是如此),就像购买了一辆高性能汽车却始终只用一档或二档驾驶,然后疑惑旅程为何效率低下。或者,换个比较,这就像参加一个问答节目,不假思索地脱口而出第一个想到的答案,而不是花点时间思考问题。
这种在AI聊天机器人交互中普遍存在的对速度和即时满足的偏好,而非深度和质量,解释了为何许多用户对GPT-4o(一个之前的模型,在公众强烈抗议后为付费ChatGPT用户恢复)最初被移除感到惋惜。虽然快速响应可能看起来很方便,但聊天机器人的真正价值在于其答案的准确性和洞察力。一个稍微慢一些、更深思熟虑但几乎总是正确的响应,其价值几乎总是超过一个快速但错误的响应。
推理模型本质上需要更多的计算工作,将资源投入到交付前的规划、验证和完善输出。这种增强的深思熟虑显著提高了结果的质量,尤其对于逻辑精度至关重要的任务。然而,这种彻底性是有代价的,无论是处理时间还是运营费用。因此,AI提供商通常默认提供速度更快、不那么“深思熟虑”的版本,要求用户通过下拉菜单主动选择功能更强大的替代方案。OpenAI过去通常不透明的模型命名约定进一步加剧了这个问题,使用户难以辨别哪个版本提供了卓越的推理能力。尽管GPT-5旨在简化这一点,但用户反馈表明清晰度仍然是一个挑战,促使公司进一步完善其界面。
对于许多人来说,等待一分钟以获得AI生成的全面响应,而不是仅仅一秒钟,是一个可以通过多任务处理轻松解决的小麻烦。然而,这种短暂的暂停似乎对另一些人构成了重大障碍。即使在GPT-5发布之后,它更明确地区分了“旗舰”GPT-5及其更彻底的“思考”变体,也只有四分之一的付费用户选择了深度答案。
这些数据为AI采用中的一个更广泛趋势提供了关键解释:为什么只有大约三分之一的美国人(曾使用过聊天机器人)认为它“极其”或“非常”有用——这一比例是AI专家报告的一半;以及为什么五分之一的人认为它“完全没用”——这一比例是专家中的两倍。答案现在更清晰了:很大一部分用户正在错误地使用AI。他们用复杂、多方面的查询来要求聊天机器人,却没有提示系统启用其更复杂、更深思熟虑的功能,这就像在要求很高的智力竞赛节目中提供一个快速、未经证实的猜测。
要真正利用现代聊天机器人的力量,用户应该拥抱更高级的推理模式。随着OpenAI和其他提供商越来越多地使这些强大选项更易于访问,现在是进行实验的绝佳时机。通过指示这些模型“思考”(同时记住它们并非真正有意识),用户可以解锁更丰富、更有价值的生成式AI体验,从而潜在地改变他们对其效用的看法。