谷歌Gemini CLI AI智能体深度整合GitHub Actions,赋能开发自动化
谷歌已将其Gemini CLI代理(一个可通过终端访问的开源AI工具)扩展到GitHub,推出了Gemini CLI GitHub Actions。这项集成允许开发者直接在他们的GitHub工作流中利用AI代理,使其能够异步处理从错误修复到新功能添加等各种问题。该代理使用GitHub的持续集成/持续交付(CI/CD)平台GitHub Actions作为其计算后端。
据谷歌开发者体验产品高级总监Ryan J. Salva称,该项目源于Gemini CLI首次发布后收到的巨大贡献量和功能请求。这种高参与度促使谷歌自动化了其许多内部GitHub流程,此举引起了社区的兴趣。
Salva在Google Cloud Next东京峰会的新闻发布会上表示:“社区偶然注意到了。他们碰巧看到了我们正在做的事情,并希望自己也能使用同样的工具。”他将该代理描述为“一个用于你在GitHub内部必须执行的所有日常任务的自主代理,无论是问题分类、执行代码审查,或者坦率地说,是打破限制,使其成为一个可按需调用的通用协作者,处理你可能希望委托的各种任务。”
开发者可以配置自动化,以便在特定的软件开发生命周期(SDLC)事件发生时调用Gemini代理,例如提交新问题、提交拉取请求或向问题应用新标签。Salva强调:“通过这些SDLC事件进行自动化,你可以有效地将管理SDLC的所有工作委托给CLI。”
要开始使用该服务,用户必须安装Gemini CLI工具并执行/setup-github
命令。虽然代理的使用本身是免费的,但它需要一个Google API Studio API密钥,超出免费层的后续API使用将产生费用。同样,托管代理操作的GitHub Actions在其免费层耗尽后也会按分钟收费。Vertex AI用户以及Gemini Code Assist标准版和企业版用户均可访问该服务。Code Assist免费版的个人用户也预计很快能获得访问权限。
Salva指出,使用GitHub Actions的一个关键优势是,Gemini CLI的每个实例都会启动一个新的、隔离的容器。这确保了代理的进程与其他平台活动隔离,从而增强了稳定性和安全性。在安全性方面,该服务采用了Google Cloud的工作负载身份联邦,这消除了对长期API密钥的需求。这种方法允许细粒度的访问控制,例如,使开发者能够限制代理对特定分支的访问。Salva强调:“锁定并赋予其最小权限,确保你在自主使用Gemini CLI时,不会危及任何数据泄露或自动销毁。”
谷歌进军GitHub集成AI代理是更广泛趋势的一部分。GitHub本身于5月推出了自己的软件工程(SWE)代理,旨在GitHub生态系统内异步工作。同样,Anthropic最近也展示了其Claude Code代理与GitHub Actions的兼容性,该工具目前处于测试阶段。Augment Code也引入了一个异步代理,它称之为“远程代理”。GitHub的代理使用Anthropic的Claude Sonnet模型,而谷歌的产品自然利用其专有的Gemini模型。
谷歌强调,鉴于GitHub作为软件开发团队的中心枢纽作用,其工具与GitHub的工具一样,都是以团队协作为核心设计的。该代理受益于GitHub内给定项目的完整上下文。在一次演示中,谷歌展示了开发者如何在一个问题中标记代理,促使代理提出任务计划。获得批准后,代理便在后台运行,并在完成概述任务时向开发者提供完全的透明度。
这不是谷歌首次将AI代理引入GitHub生态系统;Gemini Code Assist for GitHub已于2月发布,主要侧重于代码审查。然而,Salva澄清说,开发者们寻求一种更通用的工具。“开发者们正在寻找一种可用于各种用例的更通用工具,不仅仅是代码审查,而是各种SDLC中的自动化事件,”他解释道。他补充说,Gemini CLI通过提供一个通用代理扩展了可能的用例范围,现有代码审查代理和Gemini CLI背后的团队是同一个,这表明了长期融合的战略。