OpenAI lance des modèles ouverts : Révolution pour l'IA !

Fastcompany

OpenAI, une entreprise longtemps associée à la confidentialité de ses modèles d’intelligence artificielle les plus avancés, a opéré un pivot significatif en publiant deux puissants modèles à “poids ouverts” : gpt-oss-120b et gpt-oss-20b. Cette initiative, d’abord mise en lumière par Fast Company, marque un changement notable par rapport à sa décision de 2019 de restreindre l’accès à ses recherches de pointe et pourrait apporter un coup de pouce substantiel à la communauté plus large de l’IA open source.

Les modèles nouvellement publiés ne sont pas “open source” au sens traditionnel, car leurs données d’entraînement et leur code source complet restent propriétaires. Cependant, ils sont à “poids ouverts” (open-weight), ce qui signifie que les poids des modèles pré-entraînés sont librement disponibles pour les développeurs, qui peuvent les télécharger, les utiliser et les adapter sous une licence permissive Apache 2.0, même pour des applications commerciales. Cela permet une flexibilité sans précédent, permettant aux organisations d’exécuter et d’affiner ces modèles sur leur propre infrastructure, garantissant une plus grande confidentialité et un meilleur contrôle des données, particulièrement crucial pour les industries réglementées comme la santé et la finance.

Cette décision stratégique d’OpenAI intervient au milieu d’une concurrence croissante d’autres modèles à poids ouverts de haute qualité, tels que la série Llama de Meta, DeepSeek et Qwen, qui ont gagné une traction considérable dans le paysage de l’IA. Le PDG d’OpenAI, Sam Altman, avait précédemment laissé entendre une réévaluation de la stratégie open source de l’entreprise, suggérant une reconnaissance que l’avenir de l’innovation en IA pourrait ne pas résider uniquement derrière des portes closes. En offrant ces modèles, OpenAI vise à démocratiser l’accès à l’IA avancée, à accélérer la recherche et à favoriser l’innovation dans diverses communautés et marchés émergents. De plus, cette approche aide OpenAI à maintenir son influence en intégrant ces modèles dans son écosystème existant ; tout ce qui est construit avec les modèles à poids ouverts peut passer de manière transparente aux services cloud d’OpenAI.

Le modèle gpt-oss-120b, doté de 117 milliards de paramètres au total, démontre des performances quasi équivalentes à celles du o4-mini propriétaire d’OpenAI sur des benchmarks de raisonnement complexes et peut fonctionner efficacement sur un seul GPU haut de gamme. Son homologue plus petit, gpt-oss-20b, avec 21 milliards de paramètres au total, offre des capacités similaires à o3-mini et est remarquablement compact, capable de fonctionner sur des appareils périphériques ou des ordinateurs portables grand public avec seulement 16 Go de mémoire. Les deux modèles exploitent une architecture de Mixture-of-Experts (MoE), améliorant l’efficacité en n’activant qu’un sous-ensemble de paramètres par jeton. Ils sont particulièrement adaptés aux tâches nécessitant un raisonnement solide, du codage, de l’analyse scientifique, de la résolution de problèmes mathématiques et l’utilisation d’outils, supportant une fenêtre de contexte étendue de 128K.

La publication de gpt-oss-120b et gpt-oss-20b sur des plateformes comme HuggingFace, Azure AI Foundry et Amazon Bedrock signifie un moment charnière pour l’industrie de l’IA. Bien qu’OpenAI ait mis l’accent sur des évaluations de sécurité approfondies, y compris des tests contre des versions malveillamment affinées, certains benchmarks indiquent que ces modèles à poids ouverts peuvent présenter des taux d’hallucination plus élevés par rapport à leurs homologues de la “série o” à code fermé. Néanmoins, cette initiative donne fondamentalement le pouvoir aux développeurs et aux entreprises, en offrant des outils d’IA puissants et adaptables qui peuvent être personnalisés pour des besoins spécifiques sans les coûts continus par jeton associés aux services basés sur API. Ce changement non seulement intensifie la concurrence dans l’espace des modèles d’IA, mais souligne également une tendance croissante de l’industrie à équilibrer les avancées propriétaires avec l’esprit collaboratif de l’innovation ouverte.