Google intègre des agents IA dans ses plateformes de données et dev

Datanami

Le paysage de la technologie d’entreprise subit une profonde transformation, propulsée par l’émergence de l’“IA agencée”. Loin d’être de simples concepts théoriques ou des prototypes expérimentaux, ces agents IA intelligents assument de plus en plus des rôles opérationnels tangibles au sein des environnements de production. De l’orchestration de pipelines de données complexes à la génération de code et à l’interprétation d’une logique métier complexe, ces systèmes autonomes redéfinissent les flux de travail, incitant les géants de la technologie comme Google à établir rapidement l’infrastructure fondamentale pour ce domaine en plein essor.

La dernière incursion de Google dans cet espace a été dévoilée lors de son événement Cloud Next Tokyo, où l’entreprise a présenté une suite complète d’agents IA et d’améliorations significatives de l’infrastructure. Ces nouvelles capacités sont conçues pour autonomiser les ingénieurs de données, les scientifiques, les analystes et les développeurs. Plutôt que de présenter des outils autonomes ou des interfaces entièrement nouvelles, Google a intégré de manière transparente ces versions préliminaires directement dans ses plateformes principales, notamment BigQuery, Vertex AI et GitHub. Cette intégration stratégique est renforcée par des mises à jour qui intègrent la recherche vectorielle et le raisonnement des grands modèles de langage directement dans les services de données de Google, garantissant une utilité immédiate sans perturber les flux de travail existants. Si certains de ces nouveaux agents IA opèrent discrètement en arrière-plan, d’autres s’engagent plus directement, mais tous partagent un objectif unique : réduire drastiquement le temps passé sur les tâches répétitives.

Dans le domaine du développement logiciel, le Gemini CLI se distingue, offrant un support robuste aux équipes travaillant au sein de GitHub. Il rationalise les processus critiques tels que les révisions de demandes de tirage (pull requests), le triage des problèmes et la gestion des tâches de codage mineures acheminées via les commentaires. Une simple mention dans un problème suffit pour que Gemini CLI revienne avec le code proposé, les tests d’accompagnement et une ébauche de modification prête à être examinée. En complément de cet agent, Google publie également des workflows open source conçus pour automatiser les tâches courantes comme l’étiquetage ou le tri des problèmes entrants. Ce changement apparemment mineur promet d’empêcher considérablement les équipes de s’enliser dans l’accumulation des retards.

Pour les ingénieurs de données, Google a introduit l’Agent d’ingénierie des données au sein de BigQuery, un outil conçu pour éliminer la configuration manuelle des pipelines. Au lieu de créer des requêtes SQL à partir de zéro ou de naviguer entre plusieurs interfaces, les utilisateurs peuvent simplement décrire leurs exigences en langage clair – par exemple, “Charger un CSV, nettoyer des colonnes spécifiques et le joindre à une autre table”. L’agent gère ensuite de manière autonome l’ensemble du workflow, de l’initialisation à la fin. Google souligne que cette innovation n’a pas pour but de remplacer les ingénieurs, mais d’accélérer les aspects les plus répétitifs et les plus chronophages de leur travail. La sortie de l’agent reste entièrement modifiable, garantissant que les ingénieurs conservent un contrôle total, permettant ainsi aux équipes d’avancer plus rapidement, en particulier lorsqu’elles traitent de grands volumes de données complexes ou fragmentées.

Ce principe d’accélération s’étend de manière transparente à la science des données avec l’introduction d’un nouvel Agent de science des données, intégré à Colab Enterprise. Conçu pour prendre en charge le cycle de vie complet de l’analyse exploratoire et de la modélisation, cet agent se connecte directement à BigQuery et Vertex AI. Il répond aux invites en langage naturel pour diverses tâches, y compris le profilage de données, la génération de fonctionnalités et l’exécution de modèles d’apprentissage automatique. Ce qui distingue vraiment cet agent, c’est sa capacité à suivre chaque étape dans le cadre d’un workflow continu. Google affirme qu’il peut planifier, exécuter, raisonner et présenter des résultats au cours d’une seule session, permettant aux équipes de revoir, d’affiner et de guider les résultats sans perdre de leur élan. Comme pour ses autres agents, Google réitère que l’objectif n’est pas de remplacer les data scientists, mais d’accélérer considérablement leur processus pendant les étapes initiales, souvent répétitives, de l’expérimentation.

Pour les analystes métier, Google améliore son Agent d’analyse conversationnelle avec un nouvel interpréteur de code. Cet outil puissant traduit les invites en langage naturel en code Python exécutable, effectue l’analyse demandée, puis présente les résultats et les visualisations correspondantes. Il est spécifiquement conçu pour aborder des questions complexes qui vont au-delà des simples requêtes SQL, telles que la segmentation client ou la prévision. L’objectif de Google ici est de permettre aux équipes de passer de questions vagues à des informations structurées sans avoir besoin d’écrire ou de gérer du code elles-mêmes.

Ces nouvelles capacités d’agents sont étayées par des mises à niveau substantielles de l’infrastructure de la pile de données de Google. Spanner dispose désormais d’un moteur en colonnes optimisé pour les charges de travail analytiques, offrant des gains de performances allant jusqu’à 200 fois sur certaines requêtes. BigQuery obtient un accès amélioré aux données transactionnelles en direct grâce à une nouvelle fonctionnalité appelée Data Boost. En outre, Google intègre directement la recherche vectorielle et la génération augmentée par récupération (RAG) dans sa plateforme, fournissant aux agents une mémoire persistante qui reste solidement ancrée dans les données réelles de l’entreprise.

« La façon dont nous interagissons avec les données subit une transformation fondamentale, passant de l’analyse dirigée par l’homme à un partenariat collaboratif avec des agents intelligents », a déclaré Yasmeen Ahmad, Directrice générale de l’activité Données de Google Cloud, dans un article de blog annonçant le lancement. Elle a décrit cela comme le « virage agencé », annonçant une nouvelle ère où des agents IA spécialisés opèrent de manière autonome et coopérative pour débloquer des informations à des échelles et des vitesses auparavant inimaginables.

Au-delà des agents eux-mêmes, Google jette activement les bases d’une adoption plus large. La nouvelle API Gemini Data Agents, lancée initialement sous le nom d’API d’analyse conversationnelle, permettra aux développeurs d’intégrer les capacités agencées de Google directement dans leurs propres outils et workflows. Parallèlement, l’API Data Agents et le kit de développement d’agents (ADK) permettront aux équipes de construire des agents personnalisés à partir de zéro, adaptés à leur logique interne et à leurs exigences métier uniques. Ces outils transforment le modèle agencé de quelque chose que les équipes utilisent simplement en quelque chose qu’elles peuvent activement façonner. Pour garantir que ces agents fonctionnent dans des limites définies, Google déploie également le protocole de contexte de modèle (MCP) et le serveur MCP de Looker, qui garantissent que les agents travaillant avec des données structurées respectent le contexte, les autorisations et les définitions corrects.

L’introduction de ces agents et outils de support souligne la refonte fondamentale de Google sur la façon dont les gens interagissent avec les données. L’objectif global n’est pas de remplacer les workflows existants, mais de les rendre intrinsèquement plus rapides, plus légers et plus ciblés. Ce changement stratégique promet de réduire considérablement le temps que les équipes consacrent à la configuration et aux tâches banales, leur permettant de consacrer plus d’énergie à la résolution de véritables problèmes commerciaux.