L'agent IA Gemini CLI de Google s'intègre à GitHub Actions pour l'automatisation
Google a étendu son agent Gemini CLI, un outil d'IA open-source accessible via le terminal, à GitHub avec l'introduction des Gemini CLI GitHub Actions. Cette intégration permet aux développeurs de tirer parti de l'agent IA directement au sein de leurs workflows GitHub, lui permettant de traiter de manière asynchrone des problèmes allant des corrections de bugs aux ajouts de nouvelles fonctionnalités. L'agent fonctionne en utilisant GitHub Actions, la plateforme d'intégration continue/livraison continue (CI/CD) de GitHub, comme son backend de calcul.
Selon Ryan J. Salva, directeur principal des produits pour les expériences développeurs chez Google, le projet est né du volume significatif de contributions et de demandes de fonctionnalités reçues après le lancement initial de Gemini CLI. Cet engagement élevé a incité Google à automatiser nombre de ses processus GitHub internes, une initiative qui a suscité l'intérêt de la communauté.
« La communauté a remarqué par hasard. Ils ont vu ce que nous faisions et ont voulu utiliser ces mêmes outils pour eux-mêmes », a déclaré Salva lors d'une conférence de presse à Google Cloud Next Tokyo. Il a décrit l'agent comme un « agent autonome pour toutes les tâches routinières normales que vous devez effectuer au sein de GitHub, qu'il s'agisse de trier les problèmes, d'effectuer des revues de code ou, franchement, d'ouvrir les limites et d'en faire un collaborateur général à la demande pour toutes sortes de tâches que vous pourriez vouloir déléguer. »
Les développeurs peuvent configurer des automatisations pour invoquer l'agent Gemini lorsque des événements spécifiques du cycle de vie du développement logiciel (SDLC) se produisent, tels que le dépôt d'un nouveau problème, la soumission d'une pull request ou l'application d'une nouvelle étiquette à un problème. Salva a souligné que « en automatisant via ces événements SDLC, vous pouvez effectivement prendre tout le travail de gestion de ce SDLC et le déléguer au CLI. »
Pour commencer à utiliser le service, les utilisateurs doivent installer l'outil Gemini CLI et exécuter la commande /setup-github
. Bien que l'utilisation de l'agent soit gratuite, elle nécessite une clé API Google API Studio, et l'utilisation ultérieure de l'API au-delà du niveau gratuit entraînera des frais. De même, GitHub Actions, qui héberge les opérations de l'agent, facture également à la minute une fois que son niveau gratuit est épuisé. L'accès au service est disponible pour les utilisateurs de Vertex AI, ainsi que ceux des niveaux standard et entreprise de Gemini Code Assist. Les utilisateurs individuels de la version gratuite de Code Assist devraient également y avoir accès prochainement.
Un avantage clé de l'utilisation de GitHub Actions, comme l'a noté Salva, est que chaque instance de Gemini CLI démarre un nouveau conteneur isolé. Cela garantit que les processus de l'agent sont isolés des autres activités sur la plateforme, améliorant ainsi la stabilité et la sécurité. Sur le plan de la sécurité, le service utilise la fédération d'identité de charge de travail de Google Cloud, ce qui élimine le besoin de clés API de longue durée. Cette approche permet des contrôles d'accès granulaires, permettant aux développeurs de restreindre l'accès de l'agent à des branches spécifiques, par exemple. Salva a souligné que « le verrouillage et l'octroi du moindre privilège garantissent que lorsque vous utilisez Gemini CLI de manière autonome, vous ne mettez pas en péril une fuite ou une destruction automatique de données. »
L'incursion de Google dans les agents IA intégrés à GitHub fait partie d'une tendance plus large. GitHub a lui-même lancé son propre agent d'ingénierie logicielle (SWE) en mai, conçu pour fonctionner de manière asynchrone au sein de l'écosystème GitHub. De même, Anthropic a récemment démontré la compatibilité de son agent Claude Code avec GitHub Actions, un outil actuellement en version bêta. Augment Code a également introduit un agent asynchrone, qu'il appelle un « agent distant ». Alors que l'agent de GitHub utilise le modèle Claude Sonnet d'Anthropic, l'offre de Google exploite naturellement ses modèles propriétaires Gemini.
Google souligne que son outil, comme celui de GitHub, est conçu en pensant à la collaboration d'équipe, étant donné le rôle de GitHub en tant que hub central pour les équipes de développement logiciel. L'agent bénéficie du contexte complet d'un projet donné au sein de GitHub. Lors d'une démonstration, Google a montré comment un développeur pouvait taguer l'agent dans un problème, incitant l'agent à proposer un plan de tâches. Après approbation, l'agent opère ensuite en arrière-plan, offrant une transparence totale au développeur à mesure qu'il accomplit les tâches décrites.
Ce n'est pas la première incursion de Google à intégrer des agents IA dans l'écosystème GitHub ; Gemini Code Assist pour GitHub a été lancé en février, se concentrant principalement sur les revues de code. Cependant, Salva a clarifié que les développeurs recherchaient un outil plus polyvalent. « Les développeurs recherchaient un outil plus généraliste qui pourrait être utilisé pour une grande variété de cas d'utilisation, pas seulement la revue de code, mais des événements d'automatisation dans le SDLC de toutes sortes », a-t-il expliqué. Il a ajouté que Gemini CLI étend la gamme des cas d'utilisation possibles en fournissant un agent généralisable, avec la même équipe derrière l'agent de revue de code existant et Gemini CLI, indiquant une stratégie à long terme de convergence.