Anthropic发布Claude Opus 4.1:编程与推理AI大幅增强
由谷歌支持的AI初创公司Anthropic发布了其最新、最先进的模型Claude Opus 4.1,该模型专为软件开发而设计。作为其旗舰模型Claude Opus 4的重大升级,Opus 4.1承诺增强推理能力、更强大的实际编码性能,并在关键行业基准测试中取得显著改进。该公司表示,预计未来几周其模型将有进一步的进展,这预示着创新步伐的加快。
目前,Claude Opus 4.1已向Claude Code的付费订阅用户开放,也可通过Anthropic的API、Amazon Bedrock和Google Cloud的Vertex AI访问。尽管功能增强,新模型仍保留了与前身Claude Opus 4相同的定价结构。除了在实际编码方面的核心优势外,Opus 4.1还旨在擅长需要自主、多步骤执行的复杂任务(通常称为智能体任务)、深入研究和详细数据分析。其熟练度延伸到识别代码库中复杂的关联并促进多文件代码重构,这些任务都需要对细节一丝不苟的关注。
Claude Opus 4.1的性能提升在多项基准测试中显而易见。其在SWE-bench验证测试(衡量编码能力的关键指标)中的得分已从72.5%上升到74.5%。此外,该模型在包括数学推理、智能体终端编码(TerminalBench)、通用问答与推理(GPQA)和视觉推理(MMMU)在内的一系列其他严苛评估中也表现出改进。早期用户的反馈证实了这些改进,突显了其在实际开发场景中的有效性。
今年早些时候,Anthropic推出了Claude Opus 4,当时被定位为复杂、长期运行编码任务和智能体工作流的领先模型。Opus 4.1的迅速推出,凸显了Anthropic在激烈竞争的人工智能领域中保持竞争优势的加倍努力。
为扩大其在开发者社区的影响力,Claude Opus 4.1还集成到GitHub Copilot Enterprise和Pro+计划中。开发者可以通过github.com、Visual Studio Code和GitHub Mobile上的聊天模型选择器,在GitHub Copilot Chat中访问该模型。虽然Claude Opus 4将在短时间内保持可用,但GitHub已宣布将在15天内弃用它,敦促用户过渡到新版本。这一战略性发布恰逢OpenAI预计将发布GPT-5的前几天,GPT-5是一个备受期待的模型,无疑将重新定义主要AI参与者在编码和软件开发领域的竞争格局。Anthropic通过Opus 4.1进行的主动升级,使其在开发者工具领域的AI霸主地位竞争中占据了有利位置。