OpenAI GPT-5 ガイド:エージェントワークフローとコーディング能力
OpenAIは、最新の大規模言語モデルGPT-5向けの包括的なプロンプトガイドを発表しました。このガイドは、エージェントワークフローと高度なコーディングアプリケーションにおけるGPT-5の能力を最大限に活用するための詳細な洞察を提供します。Cursorコードエディターとの統合から得られた教訓が盛り込まれたこのガイドは、GPT-5が洗練されたツール使用、正確な指示の遵守、そして非常に長いコンテキストの理解のために基礎的な訓練を受けていることを強調しており、自律的なAIエージェントを構築する上で理想的な候補となります。
AIモデルが自らイニシアチブを取り、多段階のタスクを実行するエージェントアプリケーションのために、OpenAIは新しいResponses APIを推奨しています。このAPIは、連続するツール呼び出しの間でモデルの内部推論プロセスを保持するように設計されており、効率と出力品質の両方を大幅に向上させます。OpenAIのデータによると、従来のChat CompletionsからResponses APIに切り替え、「previous_response_id」パラメーターを使用して以前の推論を渡すだけで、トレーディングにおけるTauベンチマークスコアが73.9%から78.2%に向上しました。この推論コンテキストを維持することは、処理トークンを節約するだけでなく、複数のツールインタラクションにわたって計画が一貫して実行されることを保証し、パフォーマンスの向上とレイテンシの削減につながります。
GPT-5の「エージェントの積極性」—つまり、自らイニシアチブを取る傾向—は、プロンプトエンジニアリングと新しい「reasoning_effort」パラメーターを通じて細かく調整できます。このパラメーターを下げるとモデルの自律性が低下し、コンテキスト検索の明確な基準を設定し、ツール呼び出しの回数を制限する(例えば2回に)ことで、より大きな制御が可能になります。これには、ある程度の不確実性が残っていてもモデルが続行するオプションも含まれます。逆に、より多くのイニシアチブを促すには、ガイドは推論努力を増やし、不必要な確認の質問を最小限に抑えるための明確な永続化指示を追加することを推奨しています。また、明確な停止条件を設定し、安全なアクションと危険なアクションを区別し、タスクを人間ユーザーに引き渡すべきしきい値を定義することも助言しています。例えば、購入や支払いフローのような機密性の高いシナリオでは、単純な検索と比較してユーザー介入のしきい値を低く設定することが推奨され、プログラミングタスクでファイルを削除する場合は、基本的なテキスト検索よりもはるかに注意が必要です。より長く、多段階のタスクの場合、GPT-5は最初に計画を概説し、その後簡潔な進捗状況の更新を提供するように訓練されています。これらの更新の頻度、スタイル、内容は、簡単な目標の言い換えから構造化された計画、連続的なステータスメッセージ、包括的な最終レポートまで、プロンプトを介して完全にカスタマイズ可能です。OpenAIはさらに、非常に複雑なタスクを、複数のエージェントラウンドにわたるより小さく管理しやすいサブタスクに分解することを推奨しています。
OpenAIはGPT-5をソフトウェア開発の堅牢なアシスタントとして位置付けており、大規模なコードベースの処理、デバッグ、主要なコード変更の処理、複数ファイルのコードリファクタリング、重要な新機能の実装、さらにはゼロからのアプリケーション全体の生成が可能です。新しいWebアプリケーション開発には、Next.js (TypeScript)、React、HTML、Tailwind CSS、shadcn/ui、Radix Themes、人気のあるアイコンセット、Motionアニメーションライブラリ、およびさまざまなモダンフォントを含む特定の技術スタックをOpenAIは推奨しています。新しい「グリーンフィールド」プロジェクトの場合、ガイドは、モデルがまず内部的な品質基準(通常は5〜7のカテゴリ)を設定し、その後、すべての基準が完全に満たされるまで出力を反復的に洗練するプロンプトパターンを提案しています。既存のコードの増分変更やリファクタリングを行う際、GPT-5の変更はシームレスに統合されるように設計されています。このガイドは、コードベースの既存の技術設定(その指導原則、ディレクトリ構造、UI/UXルールを含む)を明示的に反映することの重要性を強調しています。OpenAIは、明瞭さ、再利用性、一貫性、シンプルさ、視覚的品質などの原則例を提供し、タイポグラフィ、色、間隔、状態インジケーター、アクセシビリティをカバーするスタック標準とUI/UXガイドラインも提供しています。
Cursorコードエディターでの初期テストは、GPT-5の挙動に関する貴重な実世界での洞察を提供しました。Cursorは、長時間のタスクにおけるモデルの自律性とステータスメッセージの簡潔さのバランスを取ることを目指しました。当初、GPT-5はツール呼び出し内で過度に詳細なステータス更新を生成する一方で、コードは過度に簡潔であり、時には一文字の変数名を使用していました。Cursorはこれを、グローバルな「verbosity」APIパラメーターを低く設定することで解決しました。同時に、コードツール内ではモデルにより詳細な情報を提供するようプロンプトし、「まず明確さのためにコードを記述する…コードとコードツールを記述する際には高い冗長性を使用する」と指示しました。このアプローチにより、コンパクトなステータスと要約メッセージが実現され、同時に非常に読みやすいコード変更が保証されました。Cursorチームはまた、GPT-5が不要なフォローアップの質問をすることがあることも観察しました。元に戻す/拒否機能とユーザー設定に関するより正確なコンテキストを提供することで、これらの中断を減らすのに役立ち、モデルは事前の承認を求めずに変更を積極的に適用し、レビューのために提出するようになりました。もう1つの重要な洞察は、以前のモデルで効果的だったプロンプトが、GPT-5では過剰なツール呼び出しをトリガーすることがあったということです。これらの「過度な徹底」指示を減らすことで、GPT-5は内部知識を活用すべき時と外部ツールを利用すべき時をより適切に判断できるようになりました。構造化されたXMLのような仕様を使用することで、指示の遵守がさらに向上し、ユーザーが設定可能なCursorルールは追加の制御レイヤーを提供しました。
「reasoning_effort」に加えて、GPT-5は新しい「verbosity」APIパラメーターを導入しており、これは最終的な回答の長さを独立して制御します。グローバルな冗長性値を設定できる一方で、必要に応じて上書きすることも可能であり、Cursor統合で示されたように、簡潔なステータスメッセージと詳細なコード出力を両立させることができます。GPT-5は「最小推論」モードもサポートしており、これは基盤となる推論パラダイムの利点を保持しつつ、最大の速度を実現するように設計されています。OpenAIは、このモードのプロンプトとして、短い根拠で始まり、ツール呼び出しの前に明確なステータス更新を含み、明示的で永続的なツール指示を提供し、タスクを完全に完了してからユーザーに引き渡すようにエージェントに促すことを推奨しています。GPT-4.1から移行するユーザーには、OpenAIは以前のガイドで概説されたパターンを指摘しています。しかし、OpenAIは、GPT-5が指示の遵守において非常に文字通りであるため、曖昧または矛盾したプロンプトは推論プロセスを妨害する可能性があると警告しています。ユーザーがこれらの落とし穴を避けるのを助けるために、OpenAIは不整合や不明確な指示を指摘するように設計されたツールであるPrompt Optimizerへのアクセスを提供しています。