Google DeepMind dévoile Genie 3: L'IA entraîne les robots en virtuel

Theguardian

Google DeepMind a dévoilé Genie 3, un nouveau « modèle mondial » capable de générer des environnements virtuels réalistes pour l’entraînement des systèmes d’intelligence artificielle. Ce développement, selon le géant technologique, représente un pas significatif vers l’atteinte de l’Intelligence Artificielle Générale (AGI), un état hypothétique où l’IA peut effectuer un large éventail de tâches au niveau humain, plutôt que d’être limitée à des fonctions spécialisées.

Le modèle Genie 3 permet aux systèmes d’IA d’interagir au sein de simulations convaincantes du monde réel. Google suggère qu’il pourrait être instrumental dans l’entraînement des robots et des véhicules autonomes, par exemple, en leur permettant de naviguer et d’apprendre dans des entrepôts virtuels très réalistes. DeepMind, la division IA de Google, souligne que de tels modèles mondiaux sont une composante cruciale pour le développement d’agents IA – des systèmes conçus pour accomplir des tâches de manière autonome. L’entreprise anticipe que cette technologie jouera un rôle essentiel à mesure que les agents IA deviendront plus répandus et que l’entreprise progressera vers l’AGI.

Genie 3 crée ces scénarios simulés instantanément à partir de requêtes textuelles. Les utilisateurs peuvent également modifier rapidement l’environnement virtuel avec d’autres commandes textuelles ; par exemple, introduire un troupeau de cerfs sur une piste de ski. Au-delà de l’entraînement de l’IA, Google note que Genie 3 pourrait également permettre aux humains d’expérimenter diverses simulations pour l’entraînement ou l’exploration, telles que le ski virtuel ou la marche autour d’un lac de montagne.

Bien que Google ait démontré des scénarios de ski virtuel et d’entrepôt aux journalistes, l’entreprise a déclaré que Genie 3 n’était pas encore prêt pour une publication publique complète et n’a pas fourni de date de lancement, citant une série de limitations. La qualité de ces simulations serait comparable au dernier modèle de création vidéo de Google, Veo 3, mais les simulations de Genie 3 peuvent durer des minutes, significativement plus longtemps que les clips de huit secondes de Veo 3. Cette annonce intervient au milieu d’une concurrence croissante dans le secteur de l’IA, suite aux récentes allusions du PDG d’OpenAI, Sam Altman, concernant leur prochain modèle GPT-5.

Alors que les discussions autour de l’AGI se concentrent souvent sur son impact potentiel sur les emplois de bureau à mesure que les systèmes autonomes assument divers rôles, Google considère principalement les modèles mondiaux comme une technologie fondamentale pour faire progresser la robotique et les véhicules autonomes. Par exemple, un entrepôt simulé, complet avec une physique réaliste et des interactions humaines, pourrait entraîner efficacement un robot, lui permettant d’apprendre et d’affiner ses actions dans un environnement sûr et contrôlé. Google a également développé Sima, un agent virtuel capable d’effectuer des tâches dans des environnements de jeux vidéo, bien que, comme Genie 3, il ne soit pas publiquement disponible.

Des experts dans le domaine soulignent l’importance de tels modèles. Le professeur Subramanian Ramamoorthy, président de l’apprentissage des robots et de l’autonomie à l’Université d d’Édimbourg, a décrit les modèles mondiaux comme « extrêmement importants » pour le développement des robots. Il a expliqué : « Pour atteindre une prise de décision flexible, les robots doivent anticiper les conséquences de différentes actions afin de choisir la meilleure à exécuter dans le monde physique. »

Andrew Rogoyski de l’Institute for People-Centred AI de l’Université de Surrey a ajouté que les modèles mondiaux pourraient également bénéficier aux grands modèles de langage (LLM), la technologie sous-jacente aux chatbots comme ChatGPT. Il estime que fournir à une « IA désincarnée la capacité d’être incarnée, bien que virtuellement », lui permet « d’explorer le monde, ou un monde – et de développer ses capacités en conséquence ». Cette exploration physique virtuelle, suggère-t-il, ajouterait une dimension vitale à la création d’IA plus puissantes et intelligentes, complétant leur entraînement existant sur de vastes quantités de données Internet. Les chercheurs de Google ont précédemment noté que si les LLM excellent dans la planification, ils manquent souvent de la capacité d’agir au nom d’un humain, une lacune que les modèles mondiaux pourrait aider à combler.

Google DeepMind dévoile Genie 3: L'IA entraîne les robots en virtuel - OmegaNext Actualités IA