AI编程普及:Cursor如何重塑编程的未来?

Theverge

软件开发中AI的迅速普及正在改变代码的编写方式,Anysphere等公司正引领这一变革。Anysphere的旗舰产品Cursor是一个自动化编程平台,已迅速成为AI驱动编程领域的全球领导者,它集成了Anthropic和OpenAI等主要参与者的生成式AI模型。

Cursor作为一个集成开发环境(IDE)运行,这是一种复杂的软件应用程序,为计算机程序员提供全面的软件开发设施。其主要功能包括“Cursor Tab”,它能智能地自动完成代码行,以及一个委托系统,允许用户将小型任务委派给AI,就像与人类结对程序员协作一样。Anysphere首席执行官Michael Truell将Cursor描述为工程师的“加强版文字处理器”,使其能够借助AI辅助高效地编辑数百万行复杂逻辑。

Anysphere由麻省理工学院毕业生于三年前创立,其通往Cursor的道路并非一帆风顺。Truell和他的联合创始人都是资深程序员和AI研究人员,最初探索的是计算机辅助设计(CAD)软件。然而,他们对编程的热情以及2021年AI蓬勃发展的潜力——得益于有用AI产品的出现以及对更大模型和更多数据将推动进一步进步的理解——将他们拉回了编程工具领域。他们观察到现有AI编程解决方案缺乏必要的雄心,促使他们构建了他们设想中的终极AI编程平台。

Cursor的一个重要灵感来源是GitHub Copilot,Truell称赞其为第一个真正有用的AI核心产品。尽管最初存在“粗糙之处”和偶尔的不准确性,Copilot证明了AI在实验室环境或推荐系统之外的实际应用性。作为一种开发工具,它的实用性是前所未有的,即使对于拥有高度优化设置的经验丰富的程序员也是如此。

虽然一些早期的AI初创公司因仅仅是现有API的“包装器”而受到批评,但Anysphere已经超越了这一点。Truell认为“包装器”一词现在有些过时,因为即使基于API构建,也能产生“非常、非常深入的产品”。Cursor的策略是迅速扩大用户群,利用AI如何帮助和阻碍程序员的洞察力来完善其模型。仅其“Tab模型”每天就处理超过十亿次调用,使其成为活跃生成生产代码的最大语言模型之一。这个模型现已发展到第四或第五代,在海量产品数据上进行训练,利用了专业人才和基础设施,包括一位曾开发早期编程自动完成产品TabNine的开发人员的专业知识。

像Cursor这样的AI编码工具在专业工程师中迅速普及,这一点令人瞩目。Truell讲述了工程师们变得如此依赖Cursor,以至于一想到失去访问权限就感到恐慌的故事。这种广泛的接受源于几个因素:

  1. 文本性质: 编程本质上是基于文本的,这是AI擅长的领域。

  2. 丰富的数据: 互联网提供了大量的开源代码供AI训练。

  3. 可验证性: 代码可以执行和测试,为AI模型提供清晰的反馈,使其通过强化学习进行学习和改进,就像AI掌握游戏一样。

虽然AI工具无疑能提高生产力,但Truell指出,这不一定意味着程序员工作时间的缩短。相反,这些收益往往被专业规模软件开发固有的“弹性”和低效率所吸收。在大型组织中,管理数百万行现有代码是一个劳动密集型过程。AI有助于简化这一点,让工程师能够处理更复杂的任务或加速开发周期,而不是简单地减少他们的工作量。

除了专业用途,AI编码也催生了“氛围编码”(vibe coding),即业余爱好者甚至新手尝试构建软件。虽然Cursor主要关注专业工程师,但Truell承认,为专家提供更强大的工具会无意中使其他人更容易使用它们。他设想未来构建软件将变得更加容易,甚至可能不需要深入了解编程语言。然而,他警告说,要实现“任何人”都能进行专业级软件开发仍有一定距离。Truell区分了用于娱乐或爱好的“氛围编码”与其专业应用,例如设计师进行原型设计或非技术人员为公司代码库贡献小型修复。他认为,虽然对个性化、一次性应用程序的兴趣正在增长,但专业软件开发的核心可能仍将由少数专注的构建者掌握。

展望未来,Truell预计AI的作用将持续演变。虽然预测确切的百分比具有挑战性,但他认为在“牛市情景”下,一年左右的时间内,当今超过一半的编程任务可以从高级文本指令中委托给AI。然而,实现完全自动化仍存在重大的技术障碍。这包括使模型能够持续学习和理解整个代码库和组织上下文,提高它们处理大量信息的能力(更长的“上下文窗口”),以及开发多模态能力,使AI能够通过图形用户界面(GUI)与软件交互。实现AI代理在相当于人类数周工作量的任务上保持长期连贯性也提出了架构挑战。Truell将其与自动驾驶汽车行业进行了类比,该行业取得了巨大进步但也面临意想不到的障碍,这表明通往高级AI的道路将同样复杂且迭代。

Anysphere目前拥有一支约150人的团队,旨在保持灵活性,同时显著增长以实现其雄心勃勃的目标。Truell投入大量时间进行招聘,强调一种“怀疑流程”和“怀疑层级”的文化,培养智力诚实、好奇心以及对自动化编程使命的深度承诺。他将Anysphere视为一个独特的“实验”,介于基础模型实验室和传统软件公司之间,在产品开发和底层模型创新方面都表现出色。

该公司最近因其定价模式从基于请求量转向基于计算量而面临用户反弹。Truell承认沟通“本可以好得多”,并承认消费者习惯于Spotify或Netflix等固定费率订阅,觉得基于使用量的定价具有挑战性。他解释说,随着AI代理工作时间更长并提供更多价值,底层的计算成本变得更具可变性。Anysphere旨在为用户提供选择:为重度用户提供高级的、基于使用量的体验,或提供一个可预测的订阅计划,以满足绝大多数未达到限制的用户。

AI编程普及:Cursor如何重塑编程的未来? - OmegaNext AI 新闻