OpenAI发布GPT OSS:面向开发者的全新开源AI模型家族

Huggingface

OpenAI通过发布其全新的“GPT OSS”开放权重模型家族,包括gpt-oss-120bgpt-oss-20b,标志着一项重要的战略转变。该举措于2025年8月5日宣布,并已在Hugging Face上提供,代表了OpenAI自2019年GPT-2以来首次发布开放权重大型语言模型(LLM),预示着AI生态系统朝着更大开放性迈出了显著一步。

gpt-oss-120bgpt-oss-20b的推出与传统的开源发布有所不同。这些模型是“开放权重”的,这意味着OpenAI公开了模型在大量训练过程中学习到的数值。这使得开发者和研究人员能够下载、使用、微调并在此基础上构建系统,提供了极大的灵活性。然而,它不包括底层代码或用于训练的专有数据,这使其与完全开源模型有所区别。这些模型在宽松的Apache 2.0许可证下发布,该许可证赋予用户极大的自由来修改和部署它们以用于各种应用。

OpenAI声称,新的GPT OSS模型表现出强大的性能,在复杂推理任务中超越了同等规模的开放模型,并展现出强大的工具使用能力。具体而言,gpt-oss-120b在编码挑战中表现出竞争力,接近OpenAI内部最先进的推理模型o3的能力。较小的gpt-oss-20b在基准测试中也表现出色,介于o3-minio4-mini之间。这两个模型都设计为可在消费级硬件上高效部署,从而使先进AI更易于访问。

这一战略转变与OpenAI的根本使命相符,即确保通用人工智能(AGI)造福全人类。通过使这些强大的模型更易于访问,该公司旨在促进新的研究途径,并促进创新产品的创建。此次发布也反映了与美国政策优先事项保持一致的举动,这些政策倡导在植根于民主价值观的“美国轨道”上构建AI,并为具有严格数据驻留或安全要求的政府和机构提供解决方案,使它们能够在本地利用先进AI。

GPT OSS模型的推出也加剧了快速发展的AI领域的竞争。OpenAI传统上以其闭源、专有模型(如GPT系列)而闻名,现在正进入一个日益受到Meta(及其Llama系列)和Mistral AI等公司开放权重模型影响的领域。尽管此次发布标志着重要一步,但OpenAI将其视为一项实验,未来是否发布开放权重模型将取决于社区对这些新产品的参与和利用。

从技术角度来看,gpt-oss-120bgpt-oss-20b都构建为混合专家(MoE)模型,这可以提高效率。需要注意的是,这些初始版本主要是指令或微调版本,目前不支持图像、视频或语音等多模态输入。这些模型可在Hugging Face上随时下载,该平台的博客提供了详细的使用和优化指南。