Gartner:GPT-5进步显著,但真正的智能体AI呼唤更强基础设施
想象一下,你拥有世界上最强大的跑车,却没有高速公路供其驰骋。根据高德纳(Gartner)的说法,这正是当今人工智能所处的境地。尽管AI模型变得日益复杂和强大,但释放其全部现实世界潜力所需的基础设施却在很大程度上尚未建成。高德纳杰出副总裁分析师阿伦·钱德拉塞卡兰将当前状况比作拥有出色的汽车引擎,却没有完善的高速公路系统,这导致模型能力进步明显放缓,即使是像OpenAI的GPT-5这样的先进模型也不例外。尽管GPT-5是一个重要的进步,但它只提供了真正自主的智能体AI的微弱曙光。
高德纳承认,OpenAI在GPT-5的几个关键领域取得了显著进展。该模型在编码任务中表现出更强的熟练度,这是OpenAI为利用企业软件工程的巨大机遇并挑战Anthropic等竞争对手而进行的战略性转变。此外,GPT-5在超越文本的多模态能力方面也取得了进展,尤其是在处理语音和图像方面,为企业开辟了新的集成途径。
GPT-5的一个显著进步是其改进的工具使用能力,这巧妙地推动了AI智能体和编排设计的发展。该模型现在可以调用第三方API和工具,甚至可以执行并行工具调用,同时处理多项任务。然而,这要求企业系统能够在一个会话中管理并发的API请求。GPT-5的多步骤规划还允许更复杂的业务逻辑驻留在模型内部,从而可能减少对外部工作流引擎的依赖。其扩展的上下文窗口——免费用户为8K,Plus订阅用户为32K,专业版用户更是高达128K——有望重塑企业AI架构模式。这意味着以前需要复杂检索增强生成(RAG)管道来应对上下文限制的应用程序,现在可以直接向模型馈送更大的数据集,从而简化某些工作流。然而,RAG远未过时;仅检索最相关的数据仍然比始终发送大量输入更快、更具成本效益。高德纳预计将转向混合方法,即开发人员利用GPT-5处理更大、非结构化的上下文,同时仍优化效率。
在财务方面,GPT-5显著降低了API使用费用,最高层级输入每百万Token成本为1.25美元,输出每百万Token成本为10美元,这使其与Gemini 2.5等模型具有竞争力,并显著低于Claude Opus。然而,其输入/输出价格比高于早期模型,这是AI领导者在高Token使用场景下应考虑的因素。
OpenAI正在战略性地整合其模型产品,GPT-5最终旨在取代GPT-4o及其o系列。这一战略部分受到用户在最初停用尝试后不满的影响,旨在向用户抽象化复杂性。引入三种模型尺寸——Pro、Mini和Nano——将使架构师能够根据成本和延迟对服务进行分层,允许较小的模型处理简单查询,而完整模型则处理复杂任务。采用GPT-5的企业应准备好潜在的代码审查和调整,因为输出格式、内存和函数调用行为存在差异,并审计现有提示模板,因为一些变通方法可能变得过时。这种整合也解决了OpenAI的计算能力挑战,需要与微软、甲骨文和谷歌等主要云提供商建立合作伙伴关系,因为运行多代模型需要相应的计算基础设施。
GPT-5还引入了有关风险和采用的新考量。OpenAI声称与之前模型相比,幻觉率降低了高达65%,这可以降低合规风险并增强其适用于企业用例的能力。其思维链(CoT)解释也支持可审计性和监管一致性。反之,较低的幻觉率结合GPT-5先进的推理和多模态处理能力,可能会放大滥用,例如生成复杂的诈骗和网络钓鱼尝试。分析师建议,关键工作流应继续进行人工审查,尽管可以适当减少抽样。高德纳建议企业领导者在任务关键型场景中试用和基准测试GPT-5,与其他模型进行并排评估,以评估准确性、速度和用户体验。他们还建议修订治理策略,尝试工具集成和推理参数,并审计基础设施计划以支持GPT-5的扩展能力。
尽管智能体AI是一个“超级热门话题”,并且是高德纳2025年生成式AI炒作周期中的首要投资领域,但它已达到“期望膨胀的顶峰”。这个阶段的特点是广泛的宣传和早期成功带来的不切实际的期望,通常 precedes “幻灭的低谷”,届时由于实施未能兑现夸大的承诺,兴趣和投资将减弱。许多供应商目前正在过度推销其产品,声称已为智能体部署做好了生产准备,但实际上,企业范围内的采用仍然稀缺。当前的部署仅限于狭窄的领域,例如软件工程或采购,即使这些也通常是人工驱动或半自动的。
阻碍真正智能体AI的一个关键障碍是缺乏强大的基础设施。智能体需要无缝访问各种企业工具,与各种数据存储和SaaS应用程序通信的能力,以及强大的身份和访问管理系统来控制其行为和数据访问。至关重要的是,企业必须对智能体生成信息的可靠性充满信心,确保其没有偏见、幻觉或虚假数据。为了弥补这一差距,供应商必须协作并采用更开放的标准进行智能体到企业和智能体到工具的通信。尽管底层AI技术正在进步,但智能体真正蓬勃发展所需的必要编排、治理和数据层仍在开发中,这在当前环境中造成了显著的摩擦。此外,尽管AI在推理方面取得了进展,但它主要在数字领域运作,尽管空间机器人技术不断改进,但仍难以理解物理世界。
最终,尽管GPT-5取得了显著进步,但该行业距离实现通用人工智能(AGI)——OpenAI为自己设定的最终目标——仍有很长的路要走。专家认为,实现AGI的真正进展,可能需要模型架构或推理方面的根本性革命,而不仅仅是扩展数据和计算能力。