OpenAI CEO揭秘:多数用户错用AI,潜力被严重低估

Fastcompany

OpenAI于8月7日发布的GPT-5,此前数周的密集宣传和精心策划的直播发布会将其誉为里程碑式的飞跃。然而,公众的反应却异常平淡,甚至因移除了几个用户已习惯依赖的聊天机器人模型而感到困惑和沮丧。

事后,OpenAI首席执行官萨姆·奥特曼无意中揭示了公司对GPT-5的宏伟预期与实际反响之间的巨大脱节。似乎绝大多数用户并未充分发挥人工智能的全部潜力。在最近一条社交媒体帖子中,奥特曼针对付费Plus订阅用户(每月支付20美元以获得增强访问权限)关于其聊天机器人使用限制大幅减少的担忧,披露了一个令人惊讶的统计数据:在GPT-5发布之前,非付费用户中只有1%,付费用户中也仅有7%使用过像o3这样的“推理模型”。

推理模型旨在在给出答案之前“深入思考”问题,进行更深思熟虑的处理。虽然必须记住AI模型不具备人类般的认知或意识,但这种内部的“深思熟虑”使它们与众不同。绝大多数用户忽视使用这些高级模式,这就像购买了一辆高性能汽车却只用最低档行驶,然后疑惑旅程为何如此低效。这就像一个问答节目选手脱口而出第一个想到的答案,而不是停下来思考最佳回应。

许多用户显然优先考虑即时速度和便利性,而非AI聊天机器人交互的深度和质量。这种偏好在GPT-4o(一个较早的模型,在公众巨大压力下最终恢复给付费ChatGPT用户)最初被移除后,引发的普遍抱怨中表现得淋漓尽致。然而,当从聊天机器人寻求可靠信息或创新解决方案时,一个稍微慢但准确的回复,几乎总是比一个快速但可能不正确的回复更可取。

这些“推理”模型本质上需要更多的计算工作,因为它们在生成输出之前会进行内部规划、检查和迭代。这种额外的深思熟虑显著增强了需要精确逻辑的任务结果。然而,这种彻底性是有代价的,包括处理时间和计算资源。因此,AI提供商通常默认提供速度更快、不那么“深思熟虑”的版本,要求用户通过下拉菜单主动选择功能更强大的替代品。OpenAI历史上复杂的模型命名约定进一步加剧了这个问题,尽管GPT-5旨在简化它,但并未完全成功。用户仍然难以轻易辨别他们访问的是否是GPT-5更复杂、具备“推理能力”的版本,还是一个能力较弱的迭代版本——据报道,OpenAI在收到用户反馈后正在解决这个问题。

即使在GPT-5推出后,旗舰模型与其“思考”变体(承诺“更全面的答案”)之间的区别变得更加明显,目前也只有四分之一的付费用户选择这种增强的全面性。这一观察为关于AI采纳的一个令人费解的问题提供了令人信服的答案:为什么只有大约三分之一使用过聊天机器人的美国人认为它“极其”或“非常有用”(是AI专家中该比例的一半),而五分之一的人认为它“根本没用”(是专家中该比例的两倍)?数据显示了一个清晰的模式:许多人根本没有充分利用AI的全部能力。他们用复杂的、多部分的问题来任务复杂的聊天机器人,却没有启用旨在有效处理这些挑战的内部流程。对于那些正在考虑或继续使用聊天机器人的人来说,利用OpenAI最近努力扩大其更强大模型访问权限的举措至关重要。激活这些“思考”模式——同时记住AI的“思考”是算法性的,而非人类的——可以从根本上改变生成式AI的效用和可靠性,有可能将怀疑者转变为支持者。