微软:AI智能体如何彻底变革大规模平台工程

Thenewstack

微软公司副总裁兼开发者事业部产品主管、第一方工程系统总经理Amanda Silver,正领导着可能是全球最大的平台工程业务,面临着一项艰巨的挑战。她的团队的任务是确保微软成千上万的工程师在数百种产品中构建的软件不仅安全、一致、易于维护,而且能保持微软竞争力所必需的快速创新步伐。历史上,这项庞大的工作严重依赖人力,包括制定详细标准、生成数千个行动项,并寄希望于开发人员能始终如一地实施。然而,在过去一年中,Silver的团队采取了一种变革性的方法,用AI驱动的智能体的力量取代了大量人工劳动,她相信这种转变将重新定义大规模平台工程。

为了真正理解微软平台工程挑战的巨大程度,可以考虑最近的一项安全举措。作为微软“有史以来最大规模的网络安全工程项目”——安全未来倡议(Secure Future Initiative)的关键组成部分,Silver的团队被要求更新微软所有代码库中的身份验证库。这是一项关键的安全任务,影响着数千个软件仓库和数百万行代码。过去,要在整个组织中实现这种一致性,需要创建数万张独立工单,每张工单都要求人工开发人员解释复杂的技术故障排除指南,然后手动将必要的更改整合到各自的代码库中。

然而,以人为中心的方法被证明存在问题。每张工单都需要单独解释,导致团队间的实施质量不一致,且进展缓慢、难以跟踪。Silver解释说,至关重要的是,这使开发人员从创新的功能开发工作中转移到通常“耗费心神”的基础设施合规任务上——这正是Silver认为AI应该消除的工作。身份验证库更新只是一个例子。类似挑战经常出现,例如更新已知漏洞的软件组件、现代化构建流程、标准化日志记录实践,或集成新的安全扫描工具。每项新举措都意味着数千张新工单、更多的人工解释以及实施中进一步的不一致。

Silver的团队通过部署“编码智能体”重新构想了这一过程——这些AI系统能够理解复杂的技???要求,并自主地在庞大的代码库中实施更改。平台工程团队不再为人工开发人员生成工单,而是直接将故障排除指南和实施规范输入到这些AI智能体中。智能体随后分析代码,理解现有实现的上下文,并自主提交建议的代码更改(拉取请求),或向开发人员提供几乎完整的解决方案,仅需要最少的人工审查。对于身份验证库更新,这意味着AI智能体可以分析现有的身份验证模式,识别所有需要更新的位置,生成上下文相关的代码更改,创建详细的拉取请求,甚至管理复杂的边缘情况或遗留实现。Silver指出,虽然有些更改是完全自主的,但其他更改则显著加速了开发人员的进度。

身份验证库项目仅仅是个开始。Silver的团队此后已将类似的AI驱动方法应用于其他关键领域。这包括自动化的依赖管理,其中AI智能体识别并更新数千个仓库中易受攻击的软件包,理解复杂的依赖结构和测试影响,而这些否则将需要大量手动研究。他们还在通过理解现有配置、识别优化机会并在保留功能的同时实施更改来现代化构建和部署管道。此外,AI智能体现在正在将新的安全扫描工具集成到代码库中,配置规则,处理旧代码的异常,并确保结果无缝流入开发工作流。甚至在不同代码库中强制执行新的编码标准、重构模式和最佳实践——这以前是一个劳动密集型过程,涉及大量的代码审查和手动重构——现在也由这些智能体管理。在这些智能体出现之前,这些举措中的每一项都会产生数千张工单,并需要数月??实施工作。借助AI智能体,Silver的团队可以在数周而非数季度内推动全公司范围的更改,从而实现更高的一致性并显著减少对开发人员的干扰。

微软的开创性方法依赖于几项关键技术能力,包括上下文感知代码分析、增量实施、与开发人员工作流的无缝集成、持续反馈循环以及强大的风险评估。这一经验表明,平台工程团队将发生几项深刻的转变:他们的重点将从单纯的强制执行转向战略赋能,有效扩展专家知识,加速关键更新的步伐,减少开发人员的摩擦,并确保整个工程系统的一致质量。

微软工作的意义远远超出了其公司范围。Silver认为,鉴于微软在提供开发工具和平台方面的关键作用,这些技术可能会成为行业标准。这种范式转变给初创公司带来了明显的优势,使小型公司无需大型专业团队即可实施企业级平台工程实践,从而可能加速其扩展能力。对于成熟企业而言,它预示着一个新时代的到来,平台工程师将从手动实施转向编排AI驱动系统。然而,这种演变也需要仔细考虑:平台团队必须通过透明度、严格测试和逐步推广流程来建立对AI生成更改的信心。现有的开发工具和流程也需要适应以支持这些新的AI驱动工作流。

展望未来,Silver设想平台工程团队将发生根本性转变:规模更小、更具战略性,专注于设计健壮的系统和制定标准,而不是手动实施它们。她认为,这场革命解决了工作中“最痛苦、最耗费心神的部分”,使开发人员能够专注于其角色中富有创造性和令人愉快的方面。对于平台工程而言,这标志着从被动维护到主动系统设计的关键转变。平台团队将不再手动响应安全漏洞,而是能够构建AI驱动系统,持续监控并自动解决其整个基础设施中的问题。