OpenAI lance GPT OSS : L'IA open-source pour développeurs
OpenAI a marqué un virage stratégique significatif avec la sortie de sa nouvelle famille de modèles à « poids ouverts » nommée « GPT OSS », comprenant gpt-oss-120b
et gpt-oss-20b
. Annoncée le 5 août 2025 et disponible sur Hugging Face, cette initiative représente la première publication par OpenAI de grands modèles linguistiques (LLM) à poids ouverts depuis GPT-2 en 2019, signalant un pivot notable vers une plus grande ouverture dans l’écosystème de l’IA.
L’introduction de gpt-oss-120b
et gpt-oss-20b
se distingue des publications open-source traditionnelles. Ces modèles sont à « poids ouverts », ce qui signifie qu’OpenAI a rendu accessibles les valeurs numériques que les modèles ont apprises lors de leur entraînement intensif. Cela permet aux développeurs et aux chercheurs de télécharger, d’utiliser, de fignoler et de construire sur ces systèmes, offrant une flexibilité substantielle. Cependant, cela n’inclut pas le code sous-jacent ni les données propriétaires utilisées pour leur entraînement, ce qui les différencie des modèles entièrement open-source. Les modèles sont publiés sous la licence permissive Apache 2.0, qui accorde aux utilisateurs une liberté considérable pour les modifier et les déployer pour diverses applications.
OpenAI affirme que les nouveaux modèles GPT OSS démontrent de solides performances, surpassant les modèles ouverts de taille similaire dans des tâches de raisonnement complexes et présentant de robustes capacités d’utilisation d’outils. Plus précisément, gpt-oss-120b
montre une performance compétitive dans les défis de codage, s’approchant des capacités du modèle de raisonnement interne de pointe d’OpenAI, o3
. Le plus petit gpt-oss-20b
se positionne également efficacement, se situant entre o3-mini
et o4-mini
dans les benchmarks. Les deux modèles sont conçus pour un déploiement efficace, même sur du matériel grand public, rendant l’IA avancée plus accessible.
Ce virage stratégique s’aligne sur la mission fondamentale d’OpenAI de garantir que l’Intelligence Artificielle Générale (AGI) profite à toute l’humanité. En rendant ces modèles puissants plus accessibles, l’entreprise vise à favoriser de nouvelles voies de recherche et à faciliter la création de produits innovants. Cette publication reflète également un mouvement visant à s’aligner sur les priorités politiques américaines qui préconisent la construction de l’IA sur des « rails américains » enracinés dans les valeurs démocratiques, et offre des solutions aux gouvernements et institutions ayant des exigences strictes en matière de résidence ou de sécurité des données, leur permettant d’exploiter l’IA avancée localement.
Le lancement des modèles GPT OSS intensifie également la concurrence dans le paysage de l’IA en évolution rapide. OpenAI, traditionnellement connue pour ses modèles propriétaires à code fermé comme la série GPT, entre désormais dans un domaine de plus en plus influencé par les modèles à poids ouverts d’entreprises telles que Meta (avec sa série Llama) et Mistral AI. Bien que cette publication marque une étape significative, OpenAI la considère comme une expérience, le potentiel de futures publications de modèles à poids ouverts étant subordonné à l’engagement et à l’utilisation de ces nouvelles offres par la communauté.
Techniquement, gpt-oss-120b
et gpt-oss-20b
sont tous deux construits comme des modèles Mixture-of-Experts (MoE), ce qui peut améliorer l’efficacité. Il est important de noter que ces premières versions sont principalement des versions d’instruction ou fignolées, et qu’elles ne prennent pas actuellement en charge les entrées multimodales telles que les images, la vidéo ou la voix. Les modèles sont facilement disponibles en téléchargement sur Hugging Face, le blog de la plateforme fournissant des conseils détaillés sur leur utilisation et leur optimisation.