OpenAI CEO:多数用户错失ChatGPT高级推理能力,速度至上掩盖AI潜力
备受期待的OpenAI GPT-5于8月7日发布,但各方反应却截然不同。尽管该公司在数周的强烈炒作和精心策划的直播发布后,将最新一代ChatGPT誉为一项改变世界的进步,但社交媒体用户却普遍感到困惑和沮丧,这主要是因为意外移除了几个受欢迎的旧模型。
事后,OpenAI首席执行官萨姆·奥特曼无意中揭示了该公司对GPT-5反响的预期与现实之间的巨大鸿沟。似乎绝大多数用户并未充分发挥人工智能的全部潜力。奥特曼在一篇解释针对付费Plus用户(每月支付20美元以获取更高级模型访问权限)的速率限制调整的帖子中,披露了一个惊人的统计数据:在GPT-5发布之前,只有1%的非付费用户和区区7%的付费用户主动查询了“推理模型”。
推理模型旨在在形成答案之前“深入思考”问题,从而参与到更精心推敲的计算过程中。这包括规划、检查和迭代以优化结果,尤其适用于逻辑准确性至关重要的任务。然而,重要的是要记住,尽管被称为“思考”,AI模型并非以人类认知或意识进行操作。绝大多数用户,无论是免费用户还是付费用户,都避开了这些功能更强大的模型,这就像购买了一辆高性能汽车,却始终只用一档或二档驾驶,然后疑惑其感知到的效率不足。这就像一个问答节目选手,不顾准确性,脱口而出第一个想到的答案。
许多用户似乎更看重即时速度和便捷性,而非AI聊天机器人交互的质量和深度。这种偏好在GPT-4o(一个旧模型,在用户集体呼吁后为付费ChatGPT用户恢复)被暂时移除时引发的普遍哀叹中显而易见。然而,在向复杂的AI寻求答案时,准确性和彻底性往往至关重要。一个稍慢、更经过深思熟虑的回答,通常优于一个快速但可能不正确的答案。
推理模型固有的权衡是,其增强的深思熟虑需要更多的计算量,使得它们运行速度更慢且成本更高。因此,AI提供商通常默认提供速度更快、计算密集度较低的版本,要求用户通过下拉菜单等方式主动选择更彻底的替代方案。OpenAI过去通常不透明的模型命名约定进一步使这种选择复杂化,使用户难以辨别他们是否正在访问功能更强大、“思考型”的版本。该公司此后已根据用户反馈开始调整这一点。
即使GPT-5发布后,旗舰模型与其“思考模式”(提供“更详尽的答案”)之间的区别变得更加明显,目前也只有四分之一的付费用户选择优先考虑彻底性。对许多人来说,AI响应等待一分钟而非一秒钟显然太长了,尽管模型处理时可以进行多任务处理。
这种用户行为为AI采用的一个重要问题提供了令人信服的答案:为什么只有大约三分之一使用过聊天机器人的美国人认为它“极其”或“非常”有用(这一比例是AI专家的一半),而五分之一的人认为它“完全没用”(是专家群体的两倍)?根本问题很清楚:很大一部分公众根本上误用了AI。他们试图解决复杂的、多部分的问题,却没有让AI参与必要的计算“思考”过程,有效地将一个复杂工具视为一个简单的即时回答机器。
要真正充分利用生成式AI,用户应该利用提供商为使功能更强大的模型易于访问所做的努力。让AI进入其“思考”模式,同时记住它并非人类思维,可以释放出更有价值、更准确的结果,从而与这项不断发展的技术建立更富有成效的关系。