Google lance Gemini Deep Think : L'IA Révolutionnaire pour le Raisonnement Parallèle
Google DeepMind a commencé le déploiement de Gemini 2.5 Deep Think, un modèle de raisonnement IA avancé conçu pour améliorer la résolution de problèmes en explorant et en évaluant simultanément plusieurs idées. Cette nouvelle capacité, qui sélectionne ensuite la réponse optimale parmi ces explorations, est désormais accessible aux abonnés de l’abonnement Ultra de Google à 250 $ par mois au sein de l’application Gemini, à compter de ce vendredi.
Présenté pour la première fois lors de Google I/O 2025 en mai, Gemini 2.5 Deep Think marque le premier modèle multi-agents de Google disponible publiquement. Ces systèmes fonctionnent en déployant plusieurs agents IA qui abordent une seule question en parallèle. Bien que cette méthode exige considérablement plus de ressources computationnelles qu’une approche à agent unique, elle produit généralement des réponses plus précises et complètes.
Une variante de Gemini 2.5 Deep Think a notamment obtenu une médaille d’or lors de l’Olympiade Internationale de Mathématiques (OIM) de cette année. Parallèlement au lancement public de Gemini 2.5 Deep Think, Google met le modèle spécifique lauréat de l’OIM à la disposition d’un groupe sélectionné de mathématiciens et d’universitaires. L’entreprise note que ce modèle d’IA spécialisé nécessite des heures, plutôt que des secondes ou des minutes, pour achever ses processus de raisonnement, contrairement à la plupart des IA grand public. Google espère que cela favorisera la recherche et fournira des retours pour affiner les systèmes multi-agents pour les applications académiques.
Google affirme que Gemini 2.5 Deep Think représente une amélioration substantielle par rapport à la version prévisualisée lors de l’I/O. L’entreprise souligne également le développement de “nouvelles techniques d’apprentissage par renforcement” pour optimiser l’utilisation des voies de raisonnement du modèle. Dans un article de blog, Google a déclaré que “Deep Think peut aider les gens à aborder des problèmes qui nécessitent de la créativité, une planification stratégique et des améliorations étape par étape.”
Lors du Humanity’s Last Exam (HLE), un test rigoureux évaluant la compétence de l’IA à travers des milliers de questions issues de la foule en mathématiques, sciences humaines et sciences, Gemini 2.5 Deep Think a obtenu un score de 34,8 % sans l’aide d’outils externes. Cette performance dépasse celle de Grok 4 de xAI, qui a marqué 25,4 %, et de o3 d’OpenAI, à 20,3 %. De plus, le modèle de Google a surpassé ses concurrents sur LiveCodeBench 6, un benchmark difficile pour les tâches de codage compétitif, marquant 87,6 % contre 79 % pour Grok 4 et 72 % pour o3 d’OpenAI.
Gemini 2.5 Deep Think s’intègre parfaitement avec des outils tels que l’exécution de code et Google Search, et est capable de générer des “réponses beaucoup plus longues” que les modèles d’IA conventionnels. Les tests internes de Google indiquent que le modèle produit des résultats plus détaillés et esthétiquement raffinés pour les tâches de développement web par rapport à d’autres systèmes d’IA, ce qui pourrait aider les chercheurs et accélérer les processus de découverte.
L’adoption des systèmes multi-agents semble être une tendance croissante parmi les principaux laboratoires d’IA. Grok 4 Heavy d’Elon Musk, son propre système multi-agents, a été récemment lancé par xAI et revendique des performances de pointe dans l’industrie sur plusieurs benchmarks. De même, le modèle d’IA non publié d’OpenAI, qui a également remporté une médaille d’or lors de l’Olympiade Internationale de Mathématiques de cette année, serait un système multi-agents. L’agent de recherche d’Anthropic, connu pour générer des synthèses de recherche complètes, est également alimenté par une architecture multi-agents.
Malgré leurs fortes capacités de performance, les systèmes multi-agents sont considérablement plus gourmands en calcul et, par conséquent, plus coûteux à exploiter que les modèles d’IA traditionnels. Cette réalité économique suggère que les entreprises technologiques pourraient continuer à réserver ces systèmes avancés à leurs niveaux d’abonnement premium, une stratégie désormais employée par xAI et Google.
Dans les semaines à venir, Google prévoit d’étendre l’accès à Gemini 2.5 Deep Think à un groupe sélectionné de testeurs via l’API Gemini, dans le but d’obtenir des informations sur la manière dont les développeurs et les entreprises pourraient tirer parti de son système multi-agents.