AnthropicとOpenAI、新モデルでAIコーディングの覇権を争う

Departmentofproduct

AI主導のソフトウェア開発の状況は急速な変革期にあり、AnthropicとOpenAIの間で激しい、互角の競争が繰り広げられています。両社は最近、大規模言語モデルにおける significant な進歩を発表し、自動コーディング能力の限界を押し広げ、効率性の新たなベンチマークを設定しました。

Anthropicは、Claude Code製品内に「Subagents」を導入しました。これは、AIが特定のタスクを事前に設定されたAIパーソナリティに委任できる画期的な機能です。各サブエージェントは、品質保証、テスト自動化、ドキュメント生成、コンプライアンスチェックなど、特定の目的のために設計されており、指定されたツールを装備できます。このイノベーションは、AIの責任を細分化することで、複雑なコーディングワークフローを合理化することを目指しています。同時に、Anthropicは段階的なアップグレードであるClaude Opus 4.1をリリースし、要求の厳しいソフトウェアエンジニアリング効率(SWE)ベンチマークで74.5%のスコアを達成しました。これはOpus 4の72%からの顕著な改善です。

しかし、OpenAIは最新のGPT-5モデルを発表し、迅速に対応しました。GPT-5はSWEテストスコアで74.9%を記録し、Claude Opus 4.1をわずかに上回りました(前モデルは69.1%)。GPT-5は印象的な「vibe coding」能力も示し、開発者にとってより直感的で流動的なインタラクションを暗示しています。ベンチマークスコアの差はごくわずかですが、この競争上の優位性は重大な影響を及ぼす可能性があります。分析によると、Anthropicは不安定な立場にあり、API収益のほぼ50%がGitHub CopilotとCursorという2つの主要顧客に由来しています。GPT-5のわずかなリードは、開発者がOpenAIの提供するサービスに移行する可能性について疑問を投げかけており、開発者がGPT-5の経験を積むにつれて、この変化はAnthropicの財務状況に実質的な影響を与える可能性があります。

コーディングベンチマークにおける直接的な競争を超えて、AIの影響はさまざまな分野に浸透しています。検索の分野では、PerplexityがOpenTableとの提携を発表し、ユーザーがPerplexityアプリ内で直接レストランを予約できるようになりました。AI製品がニッチなサービスのデフォルトパートナーとなるこのモデルは、有利な収益分配の可能性を秘めていますが、同時にEコマース企業の間では、AIがブランドと消費者間の直接的な関係を破壊する可能性について懸念を抱かせています。例えば、Googleの検索責任者は、検索におけるAIがクエリの増加を促進しており、それらはしばしばより長く、より複雑で、「AI Overviews」を通じてページ上のリンクを増やすと指摘しました。

Eコマース大手のShopifyも、新しいチェックアウトキットやMulti-Conversational Protocol(MCP)UIの採用など、AIエージェントをプラットフォームに統合しています。MCPプロトコルのこの拡張により、企業は製品画像をAI会話ツールに直接埋め込むことができ、AIインターフェース内でのショッピング体験を豊かにします。同様に、FigmaはMCPサーバーを更新し、AIエージェントがデザインファイルからアノテーションを読み取れるようにしました。これにより、インタラクションやアクセシビリティノートなどのデザイン上の考慮事項がコード生成に反映されるようになりました。

業界のリーダーたちは、AIを受け入れる必要性についてますます声を上げています。GitHubのCEOは厳しい警告を発し、エンジニアはワークフローにAIを導入しなければ、時代遅れになるリスクがあると主張しました。GitHubがAIコーディング製品の推進に既得権益があることを認めつつも、この感情は重要な変化を強調しています。つまり、初期の懐疑心を克服したエンジニアは、より意欲的で満足するようになることが多いということです。CursorのCEOはさらに、プロのソフトウェアエンジニアの仕事の20〜25%がAIに完全に委任できる可能性があり、技術が成熟するにつれてこの数値が50%を超える可能性があると見積もりました。

利用データは、AIツールの爆発的な成長を示しています。ChatGPTの週間アクティブユーザー数は5億人から驚異的な7億人に達し、OpenAIが現在月間約10億ドルを生成していることを示唆しています。Microsoftが20万件の匿名化されたCopilot会話を調査した結果、情報の要約と文章作成が最も一般的なユースケースであり、AIの様々な職業への適用性を測るためにデータも分析されています。Redditも週間アクティブユーザー数が4億1600万人に増加し、前年比22%増を記録しました。また、AIツールであるReddit Answersは、週間アクティブユーザー数が5倍の600万人に急増しました。この急速な普及にもかかわらず、ユーザーがより直感的なAIインタラクションを通じてソフトウェアを構築できる「vibe coding」製品は、高い解約率を経験していると報じられています。

AIが製品開発に不可欠になるにつれて、倫理的考慮事項が重要性を増しています。製品マネージャーの77%が、新しい生成AI機能を開発する際の「責任」の意味について不確実性を表明しています。しかし、この研究は、製品リーダーシップがこの認識に深く影響を与えていることを強調しました。つまり、リーダーシップがAI責任への明確なコミットメントを示した企業では、製品マネージャーがバイアスをテストする可能性が2.3倍高かったのです。ソフトウェア開発におけるAIの急速な進化は、激しい競争から倫理的課題に至るまで、テクノロジー業界にとって変革の時代を際立たせています。