OpenAI开放权重模型:AI社区的颠覆性变革

Fastcompany

OpenAI,一家长期以来以对其最先进的人工智能模型保密而闻名的公司,通过发布两款强大的“开放权重”模型——gpt-oss-120bgpt-oss-20b——实现了重大转变。此举最初由《快公司》杂志报道,标志着OpenAI自2019年限制访问其尖端研究以来的一次显著转变,并有望为更广泛的开源AI社区提供实质性推动。

新发布的模型并非传统意义上的“开源”模型,因为它们的训练数据和完整源代码仍然是专有的。然而,它们是“开放权重”模型,这意味着预训练模型权重可供开发者免费下载、使用和改编,并遵循宽松的Apache 2.0许可证,甚至可用于商业应用。这带来了前所未有的灵活性,允许组织在自己的基础设施上运行和微调这些模型,确保更高的数据隐私和控制,这对于医疗和金融等受监管行业尤为关键。

OpenAI的这一战略决策是在Meta的Llama系列、DeepSeek和Qwen等其他高质量开放权重模型日益激烈的竞争中做出的,这些模型在AI领域已获得相当大的关注。OpenAI首席执行官萨姆·奥特曼(Sam Altman)此前曾暗示将重新评估公司的开源战略,这表明公司认识到AI创新的未来可能不再仅仅局限于封闭环境。通过提供这些模型,OpenAI旨在实现高级AI的民主化,加速研究,并促进不同社区和新兴市场的创新。此外,这种方法还有助于OpenAI通过将这些模型整合到其现有生态系统中来保持其影响力;任何基于开放权重模型构建的东西都可以无缝过渡到OpenAI的云服务。

gpt-oss-120b模型拥有1170亿个总参数,在复杂推理基准测试中表现出与OpenAI专有模型o4-mini近乎持平的性能,并且可以在单个高端GPU上高效运行。其较小的对应模型gpt-oss-20b拥有210亿个总参数,提供了与o3-mini相似的功能,并且非常紧凑,只需16 GB内存即可在边缘设备或消费级笔记本电脑上运行。这两个模型都利用了专家混合(MoE)架构,通过每个令牌仅激活一部分参数来提高效率。它们特别擅长需要强大推理、编码、科学分析、数学问题解决和工具使用的任务,并支持长达128K的上下文窗口。

gpt-oss-120bgpt-oss-20b在HuggingFace、Azure AI Foundry和Amazon Bedrock等平台上的发布标志着AI行业的关键时刻。尽管OpenAI强调了彻底的安全评估,包括针对恶意微调版本的测试,但一些基准测试表明,与闭源的o系列模型相比,这些开放权重模型可能表现出更高的幻觉率。尽管如此,此举从根本上赋予了开发者和企业权力,提供了强大、适应性强的人工智能工具,可以根据特定需求进行定制,而无需承担基于API服务持续产生的按令牌计费的成本。这一转变不仅加剧了AI模型领域的竞争,也凸显了行业日益增长的趋势,即在专有进步与开放创新的协作精神之间取得平衡。