OpenAI五年重磅回归开源：首发开放权重AI模型，赋能开发者

OpenAI在五年多来首次发布了其开放权重AI模型，标志着一项重要的战略性转变，旨在扩大开发者访问权限并影响全球AI政策。此次发布引入了两个强大的推理模型：gpt-oss-120b和gpt-oss-20b，它们现在已在Hugging Face上以高度宽松的Apache 2.0许可公开可用。此举标志着OpenAI回归其开源根基，与其近期专注于专有、API驱动模型的做法有所不同。

发布这些开放权重模型（意味着其底层参数可免费下载、修改和部署）的决定，强调了AI技术民主化的转变。这使得开发者和组织能够在自己的基础设施上定制、微调和运行这些模型，减少对远程云API的依赖，并增强数据隐私。Apache 2.0许可尤其值得关注，因为它允许无限制的商业使用、修改和分发，包括保护用户免受侵权索赔的专利授权。这种宽松的许可与某些其他开源模型形成对比，后者可能包含对商业使用或规模的限制。

gpt-oss-120b模型拥有1170亿个参数，专为高性能应用而设计，在核心推理基准测试中达到了与OpenAI的o4-mini近乎相同的性能。令人印象深刻的是，这个更大的模型可以在单个80GB的Nvidia GPU上高效运行。较轻的gpt-oss-20b模型拥有210亿个参数，性能可与OpenAI的o3-mini媲美，并针对消费级硬件进行了优化，能够在仅有16GB内存的设备上运行，非常适合设备端用例和本地推理。这种可访问性是一项颠覆性创新，它为可能缺乏大量云基础设施预算的小型组织、新兴市场和个人开发者打破了障碍。

两款gpt-oss模型在推理任务中均表现出色，展示了强大的工具使用能力，并支持少样本函数调用和思维链（CoT）推理。它们与OpenAI的Responses API兼容，并专为代理工作流设计，为各种任务提供可调节的推理努力。尽管这些模型功能强大，但OpenAI强调了安全性，实施了全面的训练和评估以最小化风险，即便在恶意微调下也是如此。然而，为了透明度，思维链的结果未经筛选，这可能导致更高的幻觉分数，这是为了可监控性而做出的权衡。

OpenAI的这一战略转变，是在来自其他开源AI倡议（如Meta的LLaMA和DeepSeek等中国模型）日益激烈的竞争中发生的，这些倡议已经展示了开放权重方法的强大力量和协作潜力。OpenAI首席执行官Sam Altman此前承认在开放性方面“站在了历史的错误一边”，而此次发布标志着对使AI广泛可用的重新承诺。该公司旨在通过开放协作促进创新，相信更广泛的开发者基础将加速研究并带来更安全、更透明的AI发展。

此外，这些模型现在已在Amazon Bedrock和Amazon SageMaker JumpStart等主要云平台上可用，将其覆盖范围扩展到数百万AWS客户。微软还将gpt-oss-20b的GPU优化版本集成到Windows设备中，进一步增强了本地部署选项。这种广泛的可用性和宽松的许可将赋能新一波的AI创新，允许开发者根据自己的条件，从云端到边缘，创建和部署AI解决方案。

OpenAI五年重磅回归开源：首发开放权重AI模型，赋能开发者

相关文章

OpenAI 发布首批开放权重AI模型，GPT-2后重大突破

微软通过AI Foundry将OpenAI的gpt-oss-20b引入Windows 11

OpenAI 发布 Apache 许可的 GPT-OSS 模型，挑战竞争对手