El Agente Gemini CLI de Google se integra con GitHub Actions para automatizar el desarrollo
Google ha extendido su agente Gemini CLI, una herramienta de IA de código abierto accesible a través de la terminal, a GitHub con la introducción de Gemini CLI GitHub Actions. Esta integración permite a los desarrolladores aprovechar el agente de IA directamente dentro de sus flujos de trabajo de GitHub, permitiéndole abordar asincrónicamente problemas que van desde correcciones de errores hasta la adición de nuevas características. El agente opera utilizando GitHub Actions, la plataforma de integración continua/entrega continua (CI/CD) de GitHub, como su backend computacional.
Según Ryan J. Salva, director senior de producto de Google para experiencias de desarrolladores, el proyecto se originó a partir del significativo volumen de contribuciones y solicitudes de características recibidas después del lanzamiento inicial de Gemini CLI. Este alto nivel de participación llevó a Google a automatizar muchos de sus procesos internos de GitHub, una medida que generó interés en la comunidad.
“La comunidad se dio cuenta. Vieron lo que estábamos haciendo y quisieron usar esas mismas herramientas para sí mismos”, afirmó Salva durante una conferencia de prensa en Google Cloud Next Tokyo. Describió el agente como un “agente autónomo para todo tipo de tareas rutinarias que tienes que realizar dentro de GitHub, ya sea la clasificación de incidencias, la realización de revisiones de código o, francamente, la ampliación de los límites y convertirlo en un colaborador general bajo demanda para todo tipo de tareas que quieras delegar”.
Los desarrolladores pueden configurar automatizaciones para invocar al agente Gemini cuando ocurren eventos específicos del ciclo de vida del desarrollo de software (SDLC), como la presentación de una nueva incidencia, la presentación de una solicitud de extracción o la aplicación de una nueva etiqueta a una incidencia. Salva enfatizó que “al automatizar a través de estos eventos SDLC, puedes efectivamente tomar todo el trabajo de gestionar ese SDLC y delegarlo al CLI”.
Para comenzar a usar el servicio, los usuarios deben instalar la herramienta Gemini CLI y ejecutar el comando /setup-github
. Aunque el uso del agente es gratuito, requiere una clave API de Google API Studio, y el uso posterior de la API más allá del nivel gratuito incurrirá en cargos. De manera similar, GitHub Actions, que aloja las operaciones del agente, también cobra por minuto una vez que se agota su nivel gratuito. El acceso al servicio está disponible para los usuarios de Vertex AI, así como para aquellos en los niveles estándar y empresarial de Gemini Code Assist. Se espera que los usuarios individuales de la versión gratuita de Code Assist también obtengan acceso pronto.
Una ventaja clave de usar GitHub Actions, como señaló Salva, es que cada instancia de Gemini CLI inicia un nuevo contenedor aislado. Esto asegura que los procesos del agente estén aislados de otras actividades en la plataforma, mejorando la estabilidad y la seguridad. En cuanto a la seguridad, el servicio emplea la federación de identidades de carga de trabajo de Google Cloud, lo que elimina la necesidad de claves API de larga duración. Este enfoque permite controles de acceso granulares, permitiendo a los desarrolladores restringir el acceso del agente a ramas específicas, por ejemplo. Salva destacó que “bloquear eso y darle el menor privilegio asegura que cuando usas Gemini CLI de manera autónoma, no estás poniendo en peligro ninguna fuga o destrucción automática de datos”.
La incursión de Google en los agentes de IA integrados en GitHub es parte de una tendencia más amplia. GitHub mismo lanzó su propio agente de ingeniería de software (SWE) en mayo, diseñado para trabajar asincrónicamente dentro del ecosistema de GitHub. Asimismo, Anthropic demostró recientemente la compatibilidad de su agente Claude Code con GitHub Actions, una herramienta actualmente en beta. Augment Code también ha introducido un agente asincrónico, al que denomina “agente remoto”. Mientras que el agente de GitHub utiliza el modelo Claude Sonnet de Anthropic, la oferta de Google aprovecha naturalmente sus modelos propietarios Gemini.
Google subraya que su herramienta, al igual que la de GitHub, está diseñada pensando en la colaboración en equipo, dado el papel de GitHub como centro central para los equipos de desarrollo de software. El agente se beneficia del contexto completo de un proyecto dado dentro de GitHub. En una demostración, Google mostró cómo un desarrollador podía etiquetar al agente en una incidencia, lo que provocaba que el agente propusiera un plan de tareas. Tras la aprobación, el agente opera en segundo plano, proporcionando total transparencia al desarrollador a medida que completa las tareas descritas.
Esta no es la primera incursión de Google en llevar agentes de IA al ecosistema de GitHub; Gemini Code Assist para GitHub se lanzó en febrero, centrándose principalmente en las revisiones de código. Sin embargo, Salva aclaró que los desarrolladores buscaban una herramienta más versátil. “Los desarrolladores buscaban una herramienta más de propósito general que pudiera usarse para una amplia variedad de casos de uso, no solo la revisión de código, sino eventos de automatización en el SDLC de todo tipo”, explicó. Añadió que Gemini CLI expande el rango de posibles casos de uso al proporcionar un agente generalizable, con el mismo equipo detrás del agente de revisión de código existente y Gemini CLI, lo que indica una estrategia a largo plazo para la convergencia.