OpenAI CEO:ChatGPTの高度な推論機能、ほとんどのユーザーが見過ごしている

Fastcompany

OpenAIのGPT-5が8月7日に待望のリリースを迎えましたが、その反応は大きく分かれました。同社は数週間にわたる熱狂的な宣伝と洗練されたライブ配信での発表を経て、最新のChatGPTバージョンを「世界を変える進歩」と称賛したものの、ソーシャルメディアユーザーは混乱と不満が入り混じった反応を示しました。これは主に、人気のあるいくつかのレガシーモデルが予期せず削除されたためです。

その後、OpenAIのサム・アルトマンCEOは、GPT-5の受け入れに対する同社の期待と現実との間に大きな隔たりがあることをうっかり明らかにしました。どうやら、大多数のユーザーは人工知能をその潜在能力を最大限に活用できていないようです。アルトマン氏は、有料のPlusユーザー(上位モデルへのアクセスに月額20ドルを支払う)のレート制限調整について説明する投稿の中で、驚くべき統計を明かしました。GPT-5のリリース前、非有料ユーザーのわずか1%、有料ユーザーのわずか7%だけが積極的に「推論モデル」をクエリしていました。

推論モデルは、回答を生成する前に問題を「深く考える」ように設計されており、より慎重な計算プロセスを行います。これには、特に論理的正確性が最も重要となるタスクにおいて、結果を洗練するための計画、チェック、反復が含まれます。しかし、「考える」という言葉にもかかわらず、AIモデルが人間の認知や意識で動作するわけではないことを覚えておくことが重要です。無料ユーザーも有料ユーザーも、圧倒的多数のユーザーがこれらのより高性能なモデルを避けているのは、高性能車を購入したのに常に1速か2速でしか運転せず、その効率の悪さに首をかしげているようなものです。それはクイズ番組の出場者が、正確さに関係なく、最初に思いついた答えを口走ってしまうようなものです。

多くのユーザーは、AIチャットボットとのインタラクションの品質や深さよりも、即座の速度と利便性を優先しているようです。この傾向は、GPT-4o(有料ChatGPTユーザー向けに、ユーザーの協調的なキャンペーン後に復活したレガシーモデル)が一時的に削除された際の広範な嘆きからも明らかでした。しかし、洗練されたAIから回答を求める場合、正確さと徹底性がしばしば最も重要です。わずかに遅く、より慎重な回答は、速いが潜在的に不正確な回答よりも優れていることがよくあります。

推論モデルに固有のトレードオフは、その強化された熟考がより多くの計算負荷を要求するため、動作が遅く、コストが高くなることです。したがって、AIプロバイダーは通常、より高速で計算負荷の低いバージョンをデフォルトで提供し、ユーザーがドロップダウンメニューなどを介して、より徹底的な代替案を積極的に選択するように求めています。OpenAIの過去の、しばしば不透明なモデル命名規則は、ユーザーがより高性能な「思考」バージョンにアクセスしているかどうかを判断することをさらに困難にしていました。同社はその後、ユーザーフィードバックに応えてこれを調整し始めています。

GPT-5のリリース後でさえ、フラッグシップモデルと「思考」モード(「より徹底的な回答」を提供する)との区別がより明確になったにもかかわらず、現在、有料ユーザーの4人に1人しか徹底性を優先していません。多くの人にとって、AIの応答を1秒ではなく1分待つのは明らかに長すぎると感じているようです。モデルが処理中にマルチタスクを行うことが可能であるにもかかわらずです。

このユーザー行動は、AI導入に関する重要な疑問に対する説得力のある答えを提供します。なぜチャットボットを使用したことのあるアメリカ人の約3分の1しか、それを「非常に」または「極めて」有用だと考えていないのか(AI専門家の半分)、一方で5人に1人は「全く役に立たない」と感じているのか(専門家の2倍)?根本的な問題は明らかです。一般の人々の大部分がAIを根本的に誤用しているのです。彼らは、AIに必要な計算的な「思考」プロセスを行うことを許さずに、複雑で多段階の質問に取り組もうとしており、洗練されたツールを単純な即答マシンとして扱っているにすぎません。

生成AIを真に活用するためには、ユーザーはプロバイダーがより高性能なモデルにアクセスしやすくするための努力を利用すべきです。AIを「思考」モードで利用しつつ、それが人間の思考ではないことを忘れないことで、はるかに価値があり、正確な結果を引き出すことができ、この進化するテクノロジーとのより生産的な関係を育むことができます。