OpenAI GPT-5发布会遭遇“图表大乌龙”

在周四备受期待的GPT-5直播发布会上，OpenAI试图通过一系列图表展示新模型的先进能力来打动观众。然而，仔细检查发现，一些关键数据的视觉呈现存在显著差异，这迅速引来了公司领导层的坦率承认。

一个特别引人注目的例子出现在一张讽刺性地旨在展示GPT-5在“跨模型欺骗评估”中表现的图表中。对于一个标记为“编码欺骗”的指标，GPT-5显示其欺骗率为50.0%。然而，一个较小的OpenAI模型o3，其欺骗率为47.4%，却在图表上被莫名其妙地用一个更大的条形图表示。这种视觉扭曲暗示了o3表现更好，尽管其数值得分较低。

图表问题并非孤立存在。另一个有问题的图表显示GPT-5的一个分数在数值上低于o3，但它却被描绘成一个明显更大的条形图。此外，在同一张图表上，o3和GPT-4o的得分虽然数值不同，但却用相同大小的条形图表示，这进一步损害了数据的视觉完整性。

这些明显的矛盾甚至没有逃过OpenAI高层的注意。首席执行官萨姆·奥特曼公开承认了这一失误，称其为“巨大的图表失误”。除了自我检讨，一名OpenAI的市场营销人员也为所谓的“无意图表犯罪”发表了道歉。当被问及这些错误时，该公司没有立即提供进一步评论。

这些视觉误导的时机对OpenAI来说尤其尴尬。该公司一直在大力宣传GPT-5在“显著减少幻觉”方面的进展——这是大型语言模型中的一个核心挑战，即AI会生成看似合理但错误的信息。呈现本身在视觉上具有误导性的图表，无论其底层数据点如何，都为一家倡导其AI输出准确性和可靠性的公司制造了不幸的印象。虽然目前尚不清楚GPT-5本身是否被用于生成这些有缺陷的图表，但这一事件给旨在突出新模型精确性和保真度的发布会蒙上了一层阴影。这一事件强调了细致数据可视化的极端重要性，尤其是在向全球受众介绍突破性技术进步时。

OpenAI GPT-5发布会遭遇“图表大乌龙”

相关文章

GPT-5“路由器”：OpenAI实现AI效率与成本双重突破的关键

Grok 4智取ARC-AGI复杂推理榜首，成本高昂GPT-5性价比更高

OpenAI发布GPT-5：更智能、更快速、更可靠的AI模型