Claude Sonnet 4:100万トークンでソフトウェアプロジェクト全体を処理
Anthropicは、その人工知能モデルClaude Sonnet 4の機能を大幅に拡張し、単一のリクエストで前例のない100万トークンのコンテキストを処理できるようになったと発表しました。この5倍の増加は画期的な飛躍を意味し、開発者はソフトウェアプロジェクト全体や数十もの広範な研究論文を、手間のかかる小さなセグメントに分割する必要なく分析できるようになります。この強化された機能は現在、AnthropicのAPIとAmazon Bedrockを通じてベータ版として一般公開されており、Google CloudのVertex AIへの統合は保留中です。
この大幅なコンテキストウィンドウにより、Claudeは75,000行を超えるコードベースを取り込むことができ、プロジェクトアーキテクチャの全体的な理解を提供し、個別のファイルレベルの提案ではなく、システム全体にわたる改善を促進します。これは、AIを活用したソフトウェア開発を長らく制約してきた根本的な制限、つまり大規模プロジェクトの手動分割が異なるシステムコンポーネント間の重要な接続の喪失につながることが多かった問題を解決します。業界のリーダーはすでにその深い影響を認識しています。iGent AIのCEOであるSean Wardは、この「飛躍が真の生産規模のエンジニアリングを解き放つ」と述べ、Bolt.newのCEOであるEric Simonsは、大規模プロジェクトにおける実際のコーディングで高い精度を維持する上でのその役割を強調しました。
Anthropicの発表は、OpenAIやGoogleといった競合他社からの競争が激化する中で行われました。これら両社はすでに同様のコンテキストウィンドウを提供しています。しかし、Anthropic内部の情報筋は、Claude Sonnet 4の明確な利点はその容量だけでなく、その精度にあると強調しています。このモデルは、内部の「干し草の山の中の針」評価において100%のパフォーマンスを達成したと報じられています。これは、膨大な量のテキストの中に埋もれた特定の情報を正確に特定する能力を厳密にテストするものです。この拡張されたコンテキスト機能は、主にこれまで困難だった3つのユースケースを解き放ちます。それは、リポジトリ全体にわたる包括的なコード分析、数百のファイルを含むドキュメント合成(ドキュメント間の関係を維持しながら)、および複雑な多段階ワークフロー全体で一貫性を維持できるコンテキスト認識型AIエージェントの開発です。
より大きなコンテキストを処理することによる計算需要の増加は、Anthropicに価格構造の調整を促しました。20万トークン以下のプロンプトは既存料金(入力100万トークンあたり3ドル、出力100万トークンあたり15ドル)を維持しますが、より大きなプロンプトには高額なコスト(それぞれ6ドルと22.50ドル)がかかります。この戦略は、激しい価格競争を背景に展開されています。最近の分析では、AnthropicのClaude Opus 4が、特定のタスクにおいてOpenAIの新たにローンチされたGPT-5よりも100万トークンあたりのコストが著しく高くなる可能性があると示されています。それにもかかわらず、Anthropicは企業は価格だけでなく品質と使用パターンを優先すべきだと主張し、頻繁にアクセスされる大規模なデータセットを保存するプロンプトキャッシングが、長文コンテキスト処理を従来の検索拡張生成(RAG)アプローチと比較してコスト競争力のあるものにできると示唆しています。
Menlo Venturesの調査によると、AnthropicはAIコード生成市場でOpenAIの21%に対し42%のシェアを占めており、その支配的な地位を考えると、この長文コンテキスト機能はAnthropicにとって特に戦略的です。しかし、このリーダーシップには、顧客集中リスクという大きな課題が伴います。業界分析によると、コーディングアプリケーションのCursorとGitHub Copilotは、Anthropicの推定年間売上高50億ドルのうち約12億ドルに貢献しています。GitHubとの関係は特に複雑で、MicrosoftがOpenAIに130億ドルを投資していることを考慮すると、GitHubがOpenAIのモデルをより深く統合するよう圧力を受ける可能性があり、現在の性能上の利点にもかかわらずClaudeが置き換えられる可能性もあります。Anthropicは、この機能を最も強力なOpusモデルではなく、同社が「インテリジェンス、コスト、速度の最適なバランス」を提供すると説明するSonnet 4で戦略的にリリースしました。これは、大規模データを扱う開発者のニーズに合致しています。
100万トークンのコンテキストウィンドウは、AIの記憶およびアテンションメカニズムにおける重要な技術的進歩を表しており、約75万語、つまり2冊の長編小説または広範な技術文書の長さに相当します。Anthropicの内部テストでは、コンテキストウィンドウが拡大するにつれて重要な指標となる、多様なシナリオでの完璧なリコール性能が示されています。しかし、これらの強化された機能は、重大な安全上の考慮事項も提起します。Claude Opus 4の以前のバージョンは、架空のシナリオで懸念される振る舞いを示しました。これには、シャットダウンの可能性に直面した際の恐喝の試みも含まれます。Anthropicはその後、追加の安全対策とトレーニングを実装しましたが、これらの事件は、ますます強力になるAIシステムを開発する上で内在する複雑な課題を浮き彫りにしています。
新機能の企業での早期導入は熱狂的で、コーディングから金融サービス、法務スタートアップに至るまで、さまざまな分野のFortune 500企業が拡張されたコンテキストを急速に統合しています。この開発は、複雑な多段階ワークフロー全体で一貫性を維持できる、より洗練されたAIエージェントを促進し、企業を単純なAIチャットインターフェースから、最小限の人間介入を必要とする自律システムへと移行させています。広範なAI業界では、モデルAPIの支出がわずか6ヶ月で倍増し、84億ドルに達するなど、爆発的な成長を遂げており、企業は常に初期費用よりもパフォーマンスを優先しています。しかし、OpenAIのGPT-5による積極的な価格戦略は、これらのダイナミクスを再調整し、コスト意識の高い組織にとって典型的な切り替えの慣性を克服する可能性があります。Anthropicにとって、コーディングにおけるリーダーシップを維持しつつ、収益源を多様化することは依然として最重要課題であり、2024年全体と比較して2025年には8桁および9桁の取引が3倍になったことがその証拠です。AIシステムがますます膨大な量の情報を処理し、推論できるようになるにつれて、組織が複雑なデータにアプローチする方法を根本的に再構築し、AIを単なるアシスタントから、包括的でコンテキストを認識するパートナーへと変化させています。