Claude Sonnet 4 升级支持百万级Token，AI能力再飞跃

人工智能领域正持续快速发展，Anthropic 通过大幅升级其 Claude Sonnet 4 模型，使其支持前所未有的 100 万个 Token 上下文，迈出了重要一步。这一里程碑式的扩展，相较于此前 20 万 Token 的限制提升了五倍，有望在各行各业解锁新一代复杂的 AI 应用。

为了理解这一提升的规模，想象一个能够处理大约 75 万字内容的上下文窗口。这意味着 Claude Sonnet 4 现在可以在单个请求中摄取并推理整部文学作品，例如《哈利·波特》系列、数十篇长篇研究论文、全面的软件产品文档或多份法律合同。这种扩展的“记忆”从根本上改变了开发者和企业利用 AI 的方式，不再需要将大型任务分割成更小、更易管理的片段。该模型现在可以对海量数据集保持整体理解，从而产生更连贯、更准确的输出，并显著减少对复杂外部检索机制的依赖。

这对实际 AI 应用的影响是深远的。对于软件工程师而言，此次更新带来了颠覆性改变。Claude Sonnet 4 现在可以加载并分析整个代码库，包括源文件、技术文档和测试文件。这使得模型能够理解复杂的项目架构，识别跨文件依赖关系，并提出考虑整个系统设计的改进建议。Bolt.new 和 iGent AI 等公司已经在大规模编码工作流程中利用了这一能力，并报告了准确性和自主性的提升。

除了代码，增强的上下文窗口还彻底改变了文档处理和合成。企业现在可以将大量的法律合同、科学研究或技术规范输入到 Claude Sonnet 4 中，使 AI 能够在保持完整上下文的同时分析数百份文档之间的关系。这一能力简化了全面法律审查、深入研究分析和大规模内容生成等任务。此外，在数百次工具调用和多步骤工作流程中保持上下文的能力，使得创建更复杂、更具上下文感知能力的 AI 代理成为可能，这些代理能够进行更复杂的推理和规划。

目前，Claude Sonnet 4 的长上下文支持已通过 Anthropic API 和 Amazon Bedrock 提供公开测试版，并预计很快集成到 Google Cloud 的 Vertex AI 中。它主要面向使用级别 4 的组织和具有自定义速率限制的组织，这表明其最初的重点是企业级应用，而非通过 Claude 的网页或移动界面供普通消费者使用。

值得注意的是，尽管这项进步意义重大，但由于计算需求增加，超出 20 万 Token 的提示词将实行调整后的定价。然而，Anthropic 强调，提示词缓存和批量处理等技术可以帮助降低这些成本，从而可能带来可观的节省。

Anthropic 的此举使 Claude Sonnet 4 在快速发展的领域中保持了竞争力。其他行业参与者，如 Google 的 Gemini 2.5 Pro，已提供 100 万 Token 的上下文窗口，并计划到 2025 年第三季度扩展到 200 万 Token。OpenAI 的 GPT-4.1 Turbo 也支持 100 万 Token，尽管其后续的 GPT-5 模型具有 40 万 Token 的限制。与此同时，Meta 的 Llama 4 Scout 拥有令人印象深刻的 1000 万 Token 上下文窗口，而 Anthropic 和微软据报道都计划到 2025 年第四季度推出 1 亿 Token 模型。这场持续的“上下文窗口竞赛”强调了行业普遍认为 AI 模型“记忆更多”的能力对于释放其全部潜力至关重要。

Claude Sonnet 4 能力的这一飞跃不仅仅是技术升级；它标志着 AI 系统朝着以更像人类、更整体的方式与复杂信息互动和理解的根本性转变。随着上下文窗口的持续扩展，AI 自动化复杂流程、提供更深层见解以及促进更自然、更持续的人机协作的潜力将呈指数级增长。

Claude Sonnet 4 升级支持百万级Token，AI能力再飞跃

相关文章

甲骨文将OpenAI GPT-5深度集成至全线企业软件

DeepMind 推出 Genie 3：文本生成 3D 互动世界模型

微软Copilot生态全面集成GPT-5，AI能力跃升