OpenAI开源模型重磅发布,挑战中国AI领先地位
OpenAI在一次重大的战略转变中,公布了其多年来的首批开放权重语言模型,直接挑战了中国在开源人工智能领域的迅速崛起。这些于2025年8月5日发布的新模型,被命名为GPT-OSS-120B和GPT-OSS-20B,标志着OpenAI从其主要采用闭源开发理念的显著背离。据报道,这一转变受到了中国开源AI快速发展的影响。
GPT-OSS-120B及其较轻版本GPT-OSS-20B的推出,标志着OpenAI回归更开放的方法,这是自2019年GPT-2发布以来从未有过的举动。这些模型旨在以低成本实现强大的实际性能,并在允许商业使用和修改的Apache 2.0许可下提供。OpenAI强调其强大的推理能力、工具使用支持和思维链输出,使其适用于智能体工作流、编码、科学分析和数学问题解决等复杂任务。令人印象深刻的是,据报道GPT-OSS-120B模型在核心推理基准测试中与OpenAI的专有o4-mini几乎持平,而GPT-OSS-20B则提供了与o3-mini相当的性能,能够以低至16GB的内存高效运行在消费级硬件上。
OpenAI的这一转变在很大程度上被视为对中国公司在开源AI领域影响力不断扩大的直接回应。在过去一年中,像DeepSeek和阿里巴巴这样的中国公司取得了实质性进展,其模型如DeepSeek的R1和阿里巴巴的通义千问(Qwen)系列在全球基准测试平台上取得了顶尖排名。这些中国模型也大多是开源且免费使用,获得了大量开发者的采用,挑战了美国在AI创新领域长期以来的主导地位。中国在这一领域的成功并非偶然,而是更广泛国家战略的一部分,旨在培育国内AI生态系统并塑造未来的全球AI治理。
虽然中国模型通常拥有更高的总参数量,但OpenAI的新版本利用专家混合(MoE)架构来提高效率,每个token激活的参数更少,从而实现更快的推理。这种架构改进使OpenAI的模型能够以更小的活跃足迹提供有竞争力的性能。基准测试揭示了一个细致的画面:OpenAI的GPT-OSS模型在推理和数学任务方面表现出色,而中国同行则在多语言处理和智能体应用方面通常具有优势。
GPT-OSS模型的发布标志着全球AI竞赛的一个关键转折点,它正在拓展全球开发者可获得资源的边界。随着这些模型可以从Hugging Face等平台免费下载,并集成到AWS和Databricks等主要云服务中,OpenAI正在使强大的AI工具的访问民主化,加剧了竞争,并促进了一个更具协作性但竞争激烈的全球AI生态系统。OpenAI的这一战略性重新校准,继首席执行官萨姆·奥特曼早前承认该公司在开源问题上“站错了队”之后,强调了人们日益认识到开放模型对于加速研究、促进创新和确保未来AI发展更广泛可及性的重要性。