GPT-5 争议与“氛围编程”:Vergecast 的 AI 现实检验

Theverge

OpenAI 最新一代大型语言模型 GPT-5 的近期发布,伴随着高度期望和大量争议。尽管该模型承诺在人工智能能力,尤其是在编码方面取得飞跃,但其初期推出过程却坎坷不平,促使人们对其实际应用、企业技术策略的更广阔前景以及 AI 在日常生活中不断演变的角色进行了更深入的审视。

GPT-5 最受吹捧的特性之一是其增强的编码能力,以引人入胜的“氛围编程”概念进行营销。OpenAI 曾表示,这种改进的能力将使普通用户也能通过提示来创建有用的交互式体验。然而,最近的一项实验对这一承诺进行了检验,结果表明该工具对于没有基本编码知识的人来说尚未完全准备好。参与者都没有“氛围编程”的经验,他们尝试创建自己的项目。尽管 OpenAI 强调用户友好的 AI 驱动开发,但这项尝试很快演变成一系列的挫折,凸显出 AI 的潜力与对于真正新手而言的当前可访问性之间仍存在显著差距。

除了“氛围编程”的挑战,GPT-5 的发布还受到了更广泛的用户反弹影响。用户表达了对新模型的不满,导致 OpenAI 采取了纠正措施。该公司承诺不会在没有警告的情况下移除旧模型,特别是重新引入了许多用户怀念的流行 4o 选项。此外,OpenAI 宣布计划根据用户反馈更新 GPT-5 的“个性”,首席执行官萨姆·奥特曼也公开承认了模型初始性能图表出现的问题。在这些公共关系挑战中,据报道 OpenAI 还向一些员工发放了“特殊”的数百万美元奖金,此举引发了褒贬不一的反应。

与此同时,科技行业因一系列企业大戏而沸腾,这既突显了雄心勃勃的战略举措,也可能是潜在的公关噱头。AI 驱动的搜索引擎 Perplexity 以其大胆的 345 亿美元收购谷歌 Chrome 的报价而登上头条,此举如果成功,将重塑浏览器格局。苹果公司作为法律新闻的常客,也卷入了多起纠纷:起诉一家名为 Apple Cinemas 的独立影院连锁侵犯商标权;继续拒绝与医疗科技公司 Masimo 就其 Apple Watch 中的血氧监测功能(苹果后来恢复了该功能)的长期专利纠纷达成和解;并面临埃隆·马斯克的诉讼威胁,马斯克指控这家科技巨头操纵 App Store 排名。这些事件共同描绘了一个竞争激烈、法律纠纷像产品发布一样普遍的行业图景。

讨论还延伸到新兴技术的实用性和陷阱,特别是智能手表和人工智能的更广泛影响。关于智能手表,尤其是支持 LTE 的智能手表,是否能真正取代智能手机的问题得到了探讨,一位参与者将这种体验描述为“令人清醒”,表明智能手表虽然提供便利,但作为完整的手机替代品仍有不足。对话随后转向了围绕 AI 的更深层次担忧,特别是其可信度。医疗 AI 工具导致医生误读结果或谷歌的医疗 AI 捏造身体部位的案例,都强调了人工监督和怀疑态度的关键需求。大型语言模型固有的不透明性,常被称为聊天机器人不“透露其秘密”,引发了对其可靠性和潜在错误信息的进一步质疑,凸显出随着 AI 越来越融入关键领域,理解其局限性和出错的可能性变得至关重要。

因此,当前的技术格局是开创性 AI 承诺、其实施的挑战性现实、激烈的企业竞争以及个人设备持续演进的动态互动,所有这些都发生在对 AI 伦理和实际影响日益严格审查的背景下。