Google lance Gemini 2.5 Deep Think AI : une version 'bronze' aux capacités avancées
Google a officiellement lancé Gemini 2.5 Deep Think, une nouvelle itération de son modèle d’IA conçue pour améliorer le raisonnement et la résolution de problèmes complexes. Cette publication publique fait suite à une version avancée du modèle qui a fait les gros titres le mois dernier pour avoir remporté une médaille d’or aux Olympiades Internationales de Mathématiques (OIM) – une première pour une IA. Cependant, la version désormais accessible au public n’est pas le modèle identique lauréat de la médaille d’or.
Selon le billet de blog de Google et Logan Kilpatrick, chef de produit pour Google AI Studio, le modèle publié publiquement est une “version ‘bronze’ moins puissante”. Kilpatrick a précisé sur les réseaux sociaux que cette variante est “plus rapide et optimisée pour une utilisation quotidienne”, tandis que le modèle complet en or des OIM est fourni à un groupe restreint de mathématiciens pour des tests approfondis de ses capacités.
Comprendre les Capacités de Gemini 2.5 Deep Think
Construit sur la famille de grands modèles linguistiques (LLM) Gemini, Deep Think introduit de nouvelles capacités pour aborder des problèmes sophistiqués. Il utilise des techniques de “pensée parallèle” pour explorer plusieurs idées simultanément et emploie l’apprentissage par renforcement pour renforcer sa capacité de résolution de problèmes étape par étape au fil du temps.
Le modèle est conçu pour les cas d’utilisation qui bénéficient d’une délibération prolongée, tels que le test de conjectures mathématiques, la conduite de recherches scientifiques, la conception d’algorithmes et le raffinement de tâches créatives comme le code et le design. Les premiers testeurs, y compris le mathématicien Michel van Garrel, l’ont utilisé pour enquêter sur des problèmes non résolus et générer des preuves potentielles. Ethan Mollick, professeur à la Wharton School of Business et expert en IA, a noté sur les réseaux sociaux que Deep Think était le premier modèle à générer avec succès un graphique 3D en réponse à une invite complexe qu’il utilise pour tester les capacités de l’IA, démontrant ses capacités d’interprétation et de création avancées.
Performances et Références
Deep Think présente de solides performances dans plusieurs domaines d’application clés :
Mathématiques et Science : Il peut simuler le raisonnement pour des preuves complexes, explorer des conjectures et interpréter de la littérature scientifique dense.
Codage et Conception d’Algorithmes : Le modèle fonctionne bien sur les tâches impliquant des compromis de performance, la complexité temporelle et la logique multi-étapes.
Développement Créatif : Dans des scénarios de conception tels que l’art voxel ou la construction d’interfaces utilisateur, Deep Think démontre une amélioration itérative et une amélioration des détails accrues.
Le modèle est en tête des évaluations de référence, y compris LiveCodeBench V6 (pour la capacité de codage) et Humanity’s Last Exam (couvrant les mathématiques, la science et le raisonnement). Il a nettement surpassé Gemini 2.5 Pro et les modèles concurrents comme GPT-4 d’OpenAI et Grok 4 de xAI avec des marges à deux chiffres dans des catégories telles que le raisonnement et la connaissance, la génération de code et les mathématiques des OIM 2025.
Deep Think vs. Gemini 2.5 Pro : Une Comparaison
Bien que Deep Think et Gemini 2.5 Pro fassent tous deux partie de la famille de modèles Gemini 2.5, Google positionne Deep Think comme une variante plus capable et analytiquement plus performante, en particulier pour le raisonnement complexe et la résolution de problèmes en plusieurs étapes. Cette amélioration découle de son utilisation de techniques de pensée parallèle et d’apprentissage par renforcement, qui permettent au modèle de simuler une délibération cognitive plus profonde.
Google affirme que Deep Think est meilleur pour gérer les invites nuancées, explorer plusieurs hypothèses et produire des résultats plus raffinés. Ceci est étayé par des comparaisons côte à côte dans des tâches comme la génération d’art voxel, où Deep Think ajoute plus de texture, de fidélité structurelle et de diversité compositionnelle que 2.5 Pro.
Bien que Deep Think surpasse Gemini 2.5 Pro sur plusieurs benchmarks techniques liés au raisonnement et à la génération de code, ces gains s’accompagnent de compromis. Deep Think est plus lent, nécessitant un “temps de réflexion” prolongé, et présente un taux de refus plus élevé pour les invites bénignes – un domaine que Google étudie activement. En revanche, 2.5 Pro reste mieux adapté aux utilisateurs qui privilégient la vitesse et la réactivité, en particulier pour les tâches plus légères et à usage général. Cette différenciation permet aux utilisateurs de choisir en fonction de leurs priorités : 2.5 Pro pour la vitesse et la fluidité, ou Deep Think pour la rigueur et la réflexion.
L’Exploit de la Médaille d’Or aux OIM
En juillet, une version plus avancée du modèle Gemini Deep Think a obtenu le statut officiel de médaille d’or aux OIM 2025, la compétition de mathématiques la plus prestigieuse au monde pour les lycéens. Ce système a résolu cinq des six problèmes difficiles, devenant la première IA à recevoir un score de niveau or des OIM. Demis Hassabis, PDG de Google DeepMind, a annoncé l’exploit, déclarant que le modèle avait résolu les problèmes de bout en bout en langage naturel, sans nécessiter de traduction en syntaxe de programmation formelle. Le conseil des OIM a confirmé que le modèle avait obtenu 35 points sur un total possible de 42, bien au-dessus du seuil d’or. Le président de la compétition, Gregor Dolinar, a décrit les solutions de Deep Think comme claires, précises et, dans de nombreux cas, plus faciles à suivre que celles des concurrents humains. Il est important de réitérer que le Gemini 2.5 Deep Think mis à la disposition du public est une version plus rapide et moins performante, et non le modèle exact de la compétition.
Accéder à Gemini 2.5 Deep Think
Actuellement, Gemini 2.5 Deep Think est disponible exclusivement sur l’application mobile Google Gemini pour iOS et Android pour les utilisateurs abonnés au plan Google AI Ultra. Ce plan, qui fait partie de la gamme d’abonnements Google One, coûte 249,99 $ par mois, avec une offre promotionnelle de 124,99 $ par mois pour les trois premiers mois pour les nouveaux abonnés. Le plan AI Ultra comprend 30 To de stockage, l’accès à l’application Gemini avec Deep Think et Veo 3, ainsi que des outils comme Flow et Whisk, et 12 500 crédits d’IA mensuels. Les abonnés peuvent activer Deep Think dans l’application Gemini en sélectionnant le modèle 2.5 Pro et en activant l’option “Deep Think”. Il prend en charge un nombre fixe d’invites par jour et est intégré aux capacités telles que l’exécution de code et la recherche Google, générant des sorties plus longues et plus détaillées par rapport aux versions standard. Le plan Google AI Pro de niveau inférieur, au prix de 19,99 $/mois, et le service gratuit Gemini AI n’incluent pas l’accès à Deep Think. Deep Think sera également disponible pour les “testeurs de confiance” via l’interface de programmation d’applications (API) de Gemini dans les prochaines semaines.
Signification pour les Décideurs Techniques d’Entreprise
Le lancement de Gemini 2.5 Deep Think représente l’application pratique d’une étape de recherche majeure. Bien qu’actuellement accessible via des comptes d’utilisateurs individuels, il offre aux entreprises et organisations un aperçu des capacités d’un modèle d’IA qui a remporté une médaille aux Olympiades de Mathématiques. Pour les chercheurs recevant le modèle complet de niveau OIM, il offre un aperçu de l’avenir de l’IA collaborative en mathématiques. Pour les abonnés à AI Ultra, Deep Think constitue une étape puissante vers une assistance IA plus capable et contextuellement consciente, désormais disponible sur les appareils mobiles.