OpenAI五年重磅回归开源:首发开放权重AI模型,赋能开发者

Theaiinsider

OpenAI在五年多来首次发布了其开放权重AI模型,标志着一项重要的战略性转变,旨在扩大开发者访问权限并影响全球AI政策。此次发布引入了两个强大的推理模型:gpt-oss-120b和gpt-oss-20b,它们现在已在Hugging Face上以高度宽松的Apache 2.0许可公开可用。此举标志着OpenAI回归其开源根基,与其近期专注于专有、API驱动模型的做法有所不同。

发布这些开放权重模型(意味着其底层参数可免费下载、修改和部署)的决定,强调了AI技术民主化的转变。这使得开发者和组织能够在自己的基础设施上定制、微调和运行这些模型,减少对远程云API的依赖,并增强数据隐私。Apache 2.0许可尤其值得关注,因为它允许无限制的商业使用、修改和分发,包括保护用户免受侵权索赔的专利授权。这种宽松的许可与某些其他开源模型形成对比,后者可能包含对商业使用或规模的限制。

gpt-oss-120b模型拥有1170亿个参数,专为高性能应用而设计,在核心推理基准测试中达到了与OpenAI的o4-mini近乎相同的性能。令人印象深刻的是,这个更大的模型可以在单个80GB的Nvidia GPU上高效运行。较轻的gpt-oss-20b模型拥有210亿个参数,性能可与OpenAI的o3-mini媲美,并针对消费级硬件进行了优化,能够在仅有16GB内存的设备上运行,非常适合设备端用例和本地推理。这种可访问性是一项颠覆性创新,它为可能缺乏大量云基础设施预算的小型组织、新兴市场和个人开发者打破了障碍。

两款gpt-oss模型在推理任务中均表现出色,展示了强大的工具使用能力,并支持少样本函数调用和思维链(CoT)推理。它们与OpenAI的Responses API兼容,并专为代理工作流设计,为各种任务提供可调节的推理努力。尽管这些模型功能强大,但OpenAI强调了安全性,实施了全面的训练和评估以最小化风险,即便在恶意微调下也是如此。然而,为了透明度,思维链的结果未经筛选,这可能导致更高的幻觉分数,这是为了可监控性而做出的权衡。

OpenAI的这一战略转变,是在来自其他开源AI倡议(如Meta的LLaMA和DeepSeek等中国模型)日益激烈的竞争中发生的,这些倡议已经展示了开放权重方法的强大力量和协作潜力。OpenAI首席执行官Sam Altman此前承认在开放性方面“站在了历史的错误一边”,而此次发布标志着对使AI广泛可用的重新承诺。该公司旨在通过开放协作促进创新,相信更广泛的开发者基础将加速研究并带来更安全、更透明的AI发展。

此外,这些模型现在已在Amazon Bedrock和Amazon SageMaker JumpStart等主要云平台上可用,将其覆盖范围扩展到数百万AWS客户。微软还将gpt-oss-20b的GPU优化版本集成到Windows设备中,进一步增强了本地部署选项。这种广泛的可用性和宽松的许可将赋能新一波的AI创新,允许开发者根据自己的条件,从云端到边缘,创建和部署AI解决方案。

OpenAI五年重磅回归开源:首发开放权重AI模型,赋能开发者 - OmegaNext AI 新闻