OpenAI修正GPT-5直播演示中的“图表错误”
备受期待的OpenAI GPT-5直播于2025年8月7日星期四举行,旨在展示该公司在人工智能领域的最新进展,但很快就因观众指出几张图表中明显的错误而受到审视。首席执行官萨姆·奥特曼迅速将其称为“巨大的图表失误”,一位OpenAI团队成员则称其为“无意的图表犯罪”,这立即在社交媒体和科技界引发了讨论。
其中一个最突出的错误出现在一张比较GPT-5“编码欺骗”率与OpenAI o3模型欺骗率的图表中。数据显示,GPT-5的欺骗率为50%,略高于o3的47.4%。然而,视觉呈现却将GPT-5的条形图画得不成比例地小,误导性地暗示其性能更优。OpenAI后来在博客文章中纠正了这一错误,将GPT-5的实际欺骗率修正为显著更低的16.5%。另一个有问题的图表比较了GPT-5、o3和GPT-4o在不同性能指标上的表现。尽管GPT-5得分为74.9,o3为69.1,GPT-4o为30.8,但o3和GPT-4o的图形条形图长度几乎相同,尽管数值差异巨大,这有效地淡化了模型之间的真实区别。另一个视觉误报的例子出现在准确性图表中,其中GPT-5在“思考”模式下52.8%的准确率被显示为视觉上高于o3的69.1%,而o3的69.1%则被描绘成与GPT-4o的30.8%相同水平。
公众的迅速反应,包括X(前身为Twitter)等平台上的用户指出差异,促使OpenAI领导层迅速做出回应。萨姆·奥特曼公开承认了这些错误,表示“哇,我们之前犯了一个巨大的图表失误。”与此同时,一名OpenAI营销人员在线发布了道歉,承认了“无意的图表犯罪”,并确认已将修正后的图表版本及时上传到公司官方博客。
此次事件发生在今年最受期待的人工智能发布之一期间,强调了数据完整性和技术公司透明沟通的至关重要性。它凸显了即使是微小的视觉误报也可能侵蚀信任并产生怀疑,特别是对于那些处于人工智能等变革性技术前沿的公司。OpenAI的迅速承认和纠正表明了其问责意识,但此次事件引发了关于内部质量控制和演示材料严格审查的更广泛问题,尤其是在涉及高风险产品演示时。一些旁观者甚至猜测OpenAI是否可能使用了自己的人工智能模型来生成这些有缺陷的视觉效果,该公司尚未对此做出回应。
尽管存在图表争议,GPT-5的发布本身标志着OpenAI的一个重要里程碑。该模型被誉为该公司迄今为止最强大的模型,有望在准确性、速度和推理能力方面实现显著提升。GPT-5引入了一个统一系统,旨在自动为给定提示选择最佳模型,拥有更好的“安全完成”功能以提供更有帮助和透明的回复,并展现出增强的逻辑和自我评估能力,从而报告减少了幻觉。它正在向所有用户层级推出,包括免费用户、Plus、Pro和团队用户,旨在使人工智能体验在从编码到健康相关指导的各种应用中变得更智能、更安全、更个性化。
虽然“图表犯罪”在GPT-5发布过程中出乎意料地偏离了轨道,但OpenAI对错误的迅速承认和纠正提供了一定程度的透明度。此次事件清楚地提醒我们,即使是行业领导者也必须坚持最高的数据呈现标准,确保视觉效果准确反映底层数据,尤其是在向全球受众介绍突破性技术时。