Les géants de l'IA dévoilent de nouveaux modèles : OpenAI, Anthropic, Google
Le paysage de l’intelligence artificielle a été le théâtre d’une série d’avancées majeures la semaine dernière, alors que les titans de l’industrie, OpenAI, Anthropic et Google, ont chacun dévoilé des mises à niveau significatives de leurs modèles fondamentaux, repoussant les limites des capacités de raisonnement, de codage et de résolution de problèmes de l’IA. Ces lancements soulignent le rythme accéléré de l’innovation et l’intense concurrence à l’avant-garde de la course à l’IA.
OpenAI a fait un retour notable à ses “principes open source” avec la sortie de deux nouveaux modèles de raisonnement à “poids ouverts”, gpt-oss-120b et gpt-oss-20b, le 5 août 2025. Bien qu’ils ne soient pas entièrement open source, car les données d’entraînement restent propriétaires, ces modèles offrent des paramètres accessibles au public, permettant aux développeurs de les personnaliser et de les déployer sur leur propre infrastructure. Le plus grand, gpt-oss-120b, avec 117 milliards de paramètres, est conçu pour les tâches de haute performance et peut fonctionner efficacement sur un seul GPU de 80 Go, atteignant une quasi-parité avec le o4-mini propriétaire d’OpenAI sur les principaux benchmarks de raisonnement. Le plus compact, gpt-oss-20b, avec 21 milliards de paramètres, est optimisé pour les appareils périphériques et les ordinateurs personnels avec seulement 16 Go de mémoire, offrant des performances comparables à celles de o3-mini. Les deux modèles, publiés sous la licence Apache 2.0, excellent dans le raisonnement avancé, le codage, les mathématiques compétitives et les requêtes liées à la santé, prenant également en charge l’utilisation d’outils et l’effort de raisonnement ajustable. Leur architecture de Mixture-of-Experts (MoE) contribue à une inférence rapide et rentable, ce qui en fait des outils polyvalents pour la recherche, le développement et les applications d’entreprise.
Parallèlement, Anthropic a dévoilé Claude Opus 4.1 le 5 août 2025, une mise à niveau incrémentielle mais impactante de son modèle phare Claude Opus 4. Cette nouvelle itération améliore considérablement les performances de codage, atteignant un impressionnant 74,5 % sur le benchmark SWE-bench Verified, une augmentation par rapport aux 72,5 % d’Opus 4. Opus 4.1 dispose également de capacités de raisonnement et d’agent avancées, se montrant apte à la recherche approfondie, à l’analyse de données et à la résolution de problèmes complexes en plusieurs étapes avec une précision accrue. Sa capacité à gérer des tâches à long terme et à synthétiser des informations provenant de vastes ensembles de données le positionne comme un puissant collaborateur virtuel pour la prise de décision stratégique dans divers domaines. Le modèle est disponible pour les utilisateurs payants de Claude et via l’API d’Anthropic, Amazon Bedrock et Google Cloud Vertex AI, conservant le même prix que son prédécesseur.
Pour ne pas être en reste, Google a déployé Gemini 2.5 Deep Think AI, un mode de raisonnement avancé pour son modèle Gemini 2.5 Ultra, à partir du 1er août 2025. Deep Think introduit une architecture révolutionnaire de “pensée parallèle”, permettant à Gemini de générer et d’évaluer simultanément plusieurs idées, un peu comme un brainstorming humain. Cette approche innovante offre à Gemini un “temps de réflexion” étendu, stimulant considérablement sa capacité à résoudre des problèmes complexes nécessitant de la créativité, une planification stratégique, un développement itératif et un codage avancé. Le modèle, dont une variante a obtenu une médaille d’or aux Olympiades internationales de mathématiques 2025, a démontré des performances supérieures à celles de rivaux comme o3 d’OpenAI et Grok 4 de xAI sur des benchmarks clés tels que Humanity’s Last Exam et LiveCodeBench V6. Actuellement, Gemini 2.5 Deep Think est exclusivement disponible pour les abonnés Google AI Ultra, avec des plans d’accès API plus larges pour les testeurs de confiance dans un avenir proche.
Ces lancements simultanés mettent en lumière un moment charnière dans le développement de l’IA, avec des entreprises leaders qui repoussent les limites en matière de raisonnement, d’efficacité et d’accessibilité. À mesure que les modèles deviennent plus performants et spécialisés, l’accent se déplace vers le déploiement pratique et l’équilibre nuancé entre l’accessibilité ouverte et l’avantage propriétaire. L’évolution continue de ces puissances de l’IA promet de remodeler les industries et de redéfinir l’interaction homme-ordinateur dans les années à venir.