Anthropic与OpenAI:AI编程霸主之争,新模型激战正酣

Departmentofproduct

人工智能驱动的软件开发领域正经历快速转型,Anthropic与OpenAI之间的激烈竞争如火如荼。两家公司近期均发布了其大型语言模型的重大进展,不断突破自动化编码能力的边界,并为效率设定了新基准。

Anthropic在其Claude Code产品中引入了“Subagents”功能,这是一项创新特性,允许AI将特定任务委派给预配置的AI“人格”。每个子代理都专为特定目的设计,如质量保证、测试自动化、文档生成或合规性检查,并可配备专用工具。这项创新旨在通过职责划分来简化复杂的编码工作流程。同时,Anthropic还推出了增量升级版Claude Opus 4.1,该版本在严苛的软件工程效率(SWE)基准测试中取得了74.5%的得分,较Opus 4的72%有了显著提升。

然而,OpenAI迅速做出回应,发布了其最新的GPT-5模型,以74.9%的SWE测试得分微弱超越了Claude Opus 4.1,而其前代模型的得分为69.1%。GPT-5还展示了令人印象深刻的“氛围编码”(vibe coding)能力,预示着为开发者带来更直观流畅的交互体验。尽管基准测试得分差异微乎其微,但这种竞争优势可能产生重大影响。分析表明,Anthropic面临着不稳定的局面,其近50%的API收入仅来源于两大主要客户:GitHub Copilot和Cursor。GPT-5的微弱领先引发了开发者转向OpenAI产品的可能性,随着开发者对GPT-5的经验增加,这一转变可能大幅影响Anthropic的财务状况。

除了在编码基准测试中的直接竞争,AI的影响力正渗透到各个领域。在搜索领域,Perplexity宣布与OpenTable建立合作关系,使用户可以直接在Perplexity应用内预订餐厅。这种将AI产品作为小众服务默认合作伙伴的模式,具有可观的收入分享潜力,但也引发了电子商务公司对AI可能扰乱品牌与消费者直接关系的担忧。例如,谷歌搜索负责人指出,搜索中的AI正在推动查询量的增加,这些查询通常更长、更复杂,并通过“AI概览”在页面上显示更多链接。

电子商务巨头Shopify也在其平台中整合AI代理,包括新的结账工具包和采用多对话协议(MCP)UI。MCP协议的这一扩展允许公司将产品图片直接嵌入到AI对话工具中,从而丰富AI界面内的购物体验。类似地,Figma也更新了其MCP服务器,使AI代理能够读取设计文件中的注释,从而让交互或可访问性说明等设计考量能够指导代码生成。

行业领袖们越来越积极地倡导拥抱AI。GitHub首席执行官发出了严厉警告,声称工程师必须在其工作流程中采用AI,否则就有被淘汰的风险。虽然承认GitHub在推广其AI编码产品方面存在既得利益,但这种观点强调了一个关键转变:克服最初怀疑的工程师往往会变得更有抱负和更满意。Cursor首席执行官进一步估计,专业软件工程师20-25%的工作可以完全委派给AI,随着技术成熟,这一数字可能超过50%。

使用数据显示了AI工具的爆炸式增长。ChatGPT的每周活跃用户已达到惊人的7亿,高于5亿,这表明OpenAI现在每月产生约10亿美元的收入。微软对20万匿名Copilot对话的研究显示,信息摘要和写作是最常见的用例,数据也正在被分析以衡量AI在各种职业中的适用性。Reddit的每周活跃用户也攀升至4.16亿,同比增长22%,其AI工具Reddit Answers的每周活跃用户激增五倍,达到600万。尽管采用速度如此之快,但据报道,“氛围编码”产品(允许用户通过更直观的AI交互构建软件)正面临高流失率。

随着AI越来越成为产品开发不可或缺的一部分,伦理考量日益突出。高达77%的产品经理在开发新的生成式AI功能时,对“责任”的含义表示不确定。然而,研究强调,产品领导力深刻影响着这种认知:在领导层明确承诺AI责任的公司中,产品经理测试偏见的可能性是其他公司的2.3倍。AI在软件开发中的快速演变,从激烈的竞争到伦理挑战,预示着科技行业一个变革时代的到来。