Google dévoile Genie 3 : Modèle IA révolutionnaire pour la robotique

Aibusiness

Google DeepMind a dévoilé Genie 3, son dernier et plus réaliste modèle mondial d’IA à ce jour, marquant un bond en avant significatif dans le développement de simulations d’entraînement réalistes pour les agents autonomes et la robotique. Ce système avancé est conçu pour générer des environnements virtuels 3D dynamiques et interactifs directement à partir de simples invites textuelles, repoussant les limites de ce que l’IA peut simuler en temps réel.

Genie 3 se distingue par la création de mondes navigables fonctionnant à 24 images par seconde avec une résolution de 720p, maintenant une cohérence visuelle et physique pendant plusieurs minutes. Une innovation clé est sa « mémoire mondiale », permettant au modèle de se souvenir des actions passées et des placements d’objets pendant une minute maximum, assurant une expérience plus cohérente et immersive. Les utilisateurs peuvent modifier dynamiquement ces environnements simulés à l’aide d’invites textuelles supplémentaires, par exemple, en introduisant un troupeau de cerfs sur une piste de ski ou en changeant instantanément les conditions météorologiques. Cette capacité s’étend à la modélisation de propriétés physiques complexes comme le flux d’eau et l’éclairage, ainsi qu’à la simulation d’écosystèmes naturels, de scénarios animés et même de décors fictifs. S’appuyant sur ses prédécesseurs, Genie 1 et Genie 2, cette troisième itération améliore considérablement l’interaction en temps réel et intègre des techniques du générateur vidéo Veo 3 de Google pour parvenir à une compréhension plus profonde de la physique intuitive.

L’application principale de Genie 3 réside dans la révolution de l’entraînement des robots et des agents d’IA. L’entraînement de ces systèmes intelligents dans le monde réel est souvent prohibitif, chronophage et potentiellement dangereux. Genie 3 offre un curriculum illimité d’environnements simulés riches où les agents d’IA peuvent apprendre à prédire comment un environnement évoluera et comment leurs actions l’affecteront, accélérant ainsi efficacement le développement de la robotique, des véhicules autonomes et d’autres recherches en IA incarnée. Google DeepMind considère les modèles mondiaux comme Genie 3 comme un tremplin crucial vers la réalisation de l’Intelligence Artificielle Générale (AGI), un niveau hypothétique d’IA où les systèmes peuvent effectuer des tâches à un niveau équivalent à celui de l’être humain dans un large éventail de domaines.

Au-delà de son utilité principale pour l’entraînement de l’IA, Genie 3 promet également des applications centrées sur l’humain. Il pourrait fournir des simulations immersives pour diverses expériences, du ski virtuel et l’exploration de lacs de montagne à la pratique de scénarios critiques du monde réel comme les sauvetages en montagne ou le base-jump, le tout dans un environnement sûr et simulé. La technologie pourrait également transformer la prochaine génération de jeux et de divertissements, permettant la création de mondes dynamiques basés sur la physique à partir de simples commandes textuelles. Les applications futures potentielles couvrent diverses industries, y compris la préparation aux catastrophes, la formation d’urgence, l’agriculture, la fabrication et la création de « jumeaux numériques » scientifiques.

Malgré ses capacités impressionnantes, Genie 3 n’est pas encore prêt pour une publication publique complète et est actuellement disponible en tant qu’aperçu de recherche limité pour certains universitaires et créateurs. Google DeepMind reconnaît plusieurs limitations, notamment un « espace d’action » contraint pour les agents, des défis liés à la modélisation précise d’interactions complexes multi-agents, et l’incapacité de simuler des lieux du monde réel avec une précision géographique parfaite. Bien que plus stable que les versions précédentes, sa cohérence n’est actuellement maintenue que pendant quelques minutes, et il a du mal à rendre un texte clair, sauf s’il est explicitement fourni dans l’invite initiale. Ces domaines restent des défis de recherche en cours, l’entreprise adoptant une approche mesurée pour son déploiement afin de répondre aux préoccupations de sécurité et de responsabilité. Le dévoilement de Genie 3 intervient dans un paysage de l’IA hautement compétitif, d’autres acteurs de l’industrie réalisant également des progrès significatifs dans l’IA générative et les modèles mondiaux.