AnthropicのClaude Opus 4.1、プログラミング強化でGPT-5に挑む

Decoder

Anthropicは、主力ハイブリッド言語モデルの強化版であるClaude Opus 4.1を発表し、OpenAIがGPT-5のローンチを準備する中で、競争力を維持する同社の意図を示しています。2025年8月5日にリリースされたこのアップデートは、主要なパフォーマンス領域にわたる的を絞った改善を導入しています。

新モデルはプログラミングにおいて顕著な進歩を遂げ、コードのリファクタリング、データ集約型分析、およびエージェント機能(複雑な多段階タスクを独立して管理する能力)において優れた能力を示しています。Claude Opus 4.1は現在、Claudeプラットフォーム、Claude Code、およびそのAPIを通じて、またAmazon BedrockとGoogle Cloud Vertex AI上で有料ユーザーにアクセス可能です。更新されたモデルの価格は以前のOpus 4バージョンと一貫しており、開発者はclaude-opus-4-1-20250805というAPIタグを使用してアクセスできます。

Claude Opus 4.1はSWE-bench Verifiedテストで新たなベンチマークを設定し、74.5パーセントのスコアを達成しました。これは、その前身であるOpus 4から約2ポイント、OpenAIのo-seriesモデルから約5ポイントの改善を示しています。SWE-bench Verifiedベンチマークは、オープンソースのコードベース内で現実世界のバグを特定し解決するAIモデルの熟練度を評価します。プログラミング以外にも、このモデルは分析および研究タスクでも進歩を示しており、Anthropicは詳細追跡とエージェントスタイルの検索能力の向上を指摘しています。同社は、Claude Opus 4.1がエージェント型コーディング、視覚的推論、数学競技会などの分野で他の主要なAIモデルを上回ることを強調しています。さらに、現在は消滅したコーディングスタートアップWindsurfは、Claude Opus 4.1がジュニア開発者向けの内部ベンチマークで1標準偏差の改善を達成したと報告しており、これはSonnet 3.7からSonnet 4への移行に匹敵する飛躍です。

Claude Opus 4.1のリリース時期は特に戦略的であり、OpenAIのGPT-5に対する広範な期待と一致しています。報告によると、GPT-5はプログラミング、数学、およびエージェントベースのタスクにおける性能基準を引き上げると予想されていますが、GPT-3とGPT-4の間で見られたような画期的な飛躍は期待されていません。

GPT-5が段階的な進歩を提供すると予測される中、Anthropicの最新アップデートは、同社が競争力を維持するための位置付けを強化します。AnthropicはすべてのユーザーにOpus 4からOpus 4.1への移行を推奨しており、同時に今後数週間で「大幅に大きな」改善を約束しており、急速に進化するAIランドスケープにおける継続的なイノベーションへのコミットメントを強調しています。