Anthropic发布Claude Opus 4.1：编程与推理AI大幅增强

由谷歌支持的AI初创公司Anthropic发布了其最新、最先进的模型Claude Opus 4.1，该模型专为软件开发而设计。作为其旗舰模型Claude Opus 4的重大升级，Opus 4.1承诺增强推理能力、更强大的实际编码性能，并在关键行业基准测试中取得显著改进。该公司表示，预计未来几周其模型将有进一步的进展，这预示着创新步伐的加快。

目前，Claude Opus 4.1已向Claude Code的付费订阅用户开放，也可通过Anthropic的API、Amazon Bedrock和Google Cloud的Vertex AI访问。尽管功能增强，新模型仍保留了与前身Claude Opus 4相同的定价结构。除了在实际编码方面的核心优势外，Opus 4.1还旨在擅长需要自主、多步骤执行的复杂任务（通常称为智能体任务）、深入研究和详细数据分析。其熟练度延伸到识别代码库中复杂的关联并促进多文件代码重构，这些任务都需要对细节一丝不苟的关注。

Claude Opus 4.1的性能提升在多项基准测试中显而易见。其在SWE-bench验证测试（衡量编码能力的关键指标）中的得分已从72.5%上升到74.5%。此外，该模型在包括数学推理、智能体终端编码（TerminalBench）、通用问答与推理（GPQA）和视觉推理（MMMU）在内的一系列其他严苛评估中也表现出改进。早期用户的反馈证实了这些改进，突显了其在实际开发场景中的有效性。

今年早些时候，Anthropic推出了Claude Opus 4，当时被定位为复杂、长期运行编码任务和智能体工作流的领先模型。Opus 4.1的迅速推出，凸显了Anthropic在激烈竞争的人工智能领域中保持竞争优势的加倍努力。

为扩大其在开发者社区的影响力，Claude Opus 4.1还集成到GitHub Copilot Enterprise和Pro+计划中。开发者可以通过github.com、Visual Studio Code和GitHub Mobile上的聊天模型选择器，在GitHub Copilot Chat中访问该模型。虽然Claude Opus 4将在短时间内保持可用，但GitHub已宣布将在15天内弃用它，敦促用户过渡到新版本。这一战略性发布恰逢OpenAI预计将发布GPT-5的前几天，GPT-5是一个备受期待的模型，无疑将重新定义主要AI参与者在编码和软件开发领域的竞争格局。Anthropic通过Opus 4.1进行的主动升级，使其在开发者工具领域的AI霸主地位竞争中占据了有利位置。

Anthropic发布Claude Opus 4.1：编程与推理AI大幅增强

相关文章

萨姆·奥特曼暗示GPT-5将至，ChatGPT周活跃用户逼近7亿

OpenAI或推更实惠ChatGPT Go套餐，GPT-5发布在即？

微软Copilot“智能模式”曝光：为OpenAI GPT-5发布做准备