OpenAI lance des IA gratuites et personnalisables pour défier Meta
OpenAI a annoncé le lancement de ses propres modèles d’intelligence artificielle librement disponibles, marquant un virage stratégique pour concurrencer Meta et DeepSeek dans le paysage de l’IA en évolution rapide. Le développeur derrière ChatGPT met à disposition deux grands modèles linguistiques “open-weight”, gpt-oss-120b et gpt-oss-20b-two, téléchargeables et personnalisables gratuitement par les utilisateurs. Cette initiative contraste avec le fleuron d’OpenAI, ChatGPT, qui fonctionne sur un modèle “fermé” ne pouvant être modifié par des utilisateurs externes.
Cette démarche d’OpenAI reflète l’approche de Meta avec ses modèles Llama, également proposés sur une base similaire. Sam Altman, directeur général d’OpenAI, a exprimé son enthousiasme à contribuer à la collection croissante de modèles d’IA librement accessibles, soulignant leur fondement dans les “valeurs démocratiques” et leur potentiel de “bénéfice étendu”. Il a déclaré que rendre ces modèles, fruits de milliards de dollars de recherche, accessibles au monde entier vise à démocratiser l’accès à l’IA.
Ce sentiment est partagé par Mark Zuckerberg, PDG de Meta, qui a également soutenu que rendre les modèles librement disponibles et personnalisables élargit l’accès aux avantages et opportunités de l’IA, empêchant ainsi la concentration du pouvoir entre quelques entreprises. Cependant, Meta a également indiqué qu’il pourrait être nécessaire d’exercer une certaine prudence lors de l’application de cette approche à des modèles d’IA très avancés.
Ajoutant au paysage concurrentiel, DeepSeek, un rival chinois d’OpenAI et de Meta, a également publié des modèles puissants qui peuvent être téléchargés et personnalisés sans frais.
OpenAI affirme que ses nouveaux modèles gpt-oss démontrent des performances supérieures dans les tâches de raisonnement par rapport aux modèles de taille similaire. Notamment, le modèle plus grand gpt-oss-120b aurait atteint une performance de raisonnement fondamentale quasi égale à celle du modèle o4-mini d’OpenAI. En termes de sécurité, OpenAI a déclaré que lors des tests, ils avaient créé des versions des modèles “ajustées de manière malveillante” pour simuler des menaces biologiques et de cybersécurité, mais ont constaté que ces versions étaient “incapables d’atteindre des niveaux de capacité élevés” pour de tels dommages.
L’émergence de modèles d’IA puissants, librement disponibles et personnalisables a suscité des inquiétudes chez certains experts. Ils avertissent que de tels modèles pourraient potentiellement être adaptés pour causer de graves dommages, y compris le développement de bio-armes, s’ils sont mal utilisés.
La terminologie entourant l’accessibilité des modèles varie. Meta définit ses modèles Llama comme “open source”, ce qui implique que leurs ensembles de données d’entraînement, leur architecture et leur code d’entraînement sont également fournis avec les options de téléchargement et de personnalisation gratuites. Cependant, l’Open Source Initiative, une organisation industrielle basée aux États-Unis, soutient que les restrictions imposées par Meta sur l’utilisation de ses modèles les empêchent de se qualifier comme entièrement open source. OpenAI, en revanche, utilise le terme “open weight”, ce qui signifie que si le modèle peut être affiné, son fonctionnement interne n’est pas entièrement transparent pour le développeur – un cran en dessous du “full open source”.
L’annonce d’OpenAI intervient au milieu des spéculations continues sur la sortie potentielle de GPT-5, une nouvelle version du modèle fondamental de ChatGPT. Sam Altman, PDG d’OpenAI, a récemment partagé une capture d’écran qui semblait provenir du dernier modèle d’IA de l’entreprise.
Pendant ce temps, Google a également présenté ses dernières avancées vers l’intelligence artificielle générale (AGI) avec un nouveau “modèle du monde” appelé Genie 3. Développé par Google DeepMind, ce modèle permet aux systèmes d’IA d’interagir au sein de simulations convaincantes du monde réel. Google suggère que Genie 3 pourrait être essentiel pour l’entraînement des robots et des véhicules autonomes en leur permettant d’interagir avec des reconstitutions réalistes d’environnements tels que des entrepôts. Google DeepMind postule que de tels “modèles du monde” sont une étape cruciale vers l’atteinte de l’AGI – un niveau hypothétique d’IA où un système peut effectuer la plupart des tâches à un niveau humain, plutôt que de simples fonctions spécialisées, et pourrait même prendre en charge des emplois humains. Ces modèles devraient jouer un rôle important dans le développement d’agents d’IA, qui sont des systèmes conçus pour effectuer des tâches de manière autonome.