GPT-5:誇張された誇大広告の中での漸進的なAIの進歩

Technologyreview

OpenAIが満を持して発表した新しい主力モデルGPT-5がついに登場しましたが、観察者たちの間でのコンセンサスは明確です。洗練されたユーザー体験を提供する一方で、革命的なブレイクスルーには至っていません。ある同僚が簡潔に述べたように、GPT-5は「何よりもまず、洗練された製品」です。この評価は、業界全体の最近のモデルリリースが、まったく新しいパラダイムを導入するのではなく、既存の機能を強化するために設計された漸進的なスマートフォンアップデートにますます似ているという広範な感情と一致しています。OpenAIのCEOサム・アルトマン自身も、AppleのRetinaディスプレイ導入との類似性を指摘しましたが、これは反復的な改善には妥当な比較であるものの、疑問を投げかけます。BlackBerryのキーボードからタッチスクリーンiPhoneへの変革的な飛躍はどこにあるのでしょうか?アシストGPSがリアルタイムナビゲーションを可能にし、Uberのような企業を生み出したように、まったく新しいアプリケーションや産業を解き放つ根本的な変化はどこにあるのでしょうか?

実際、GPT-5のローンチは予期せぬユーザーの反発に遭いました。GPT-4oの独特な「個性」に慣れていた顧客は、OpenAIに働きかけ、それをPlusサブスクライバー向けのオプションとして復活させることに成功しました。このエピソードは、GPT-5のリリースが、大幅なパフォーマンス向上よりもユーザーエクスペリエンスの微調整を優先したことをさらに裏付けています。

しかし、この現実にもかかわらず、GPT-5を取り巻く誇大広告は甚大でした。発表の数時間前、アルトマンは出現するデス・スターの画像でリリースを予告しました。ローンチ当日、彼はその「博士号レベルの知能」を喧伝し、後に朝のニュース番組で「多くの命を救うだろう」と主張しました。このような発言はしばしば懐疑的に受け止められますが、アルトマンだけがこのような大言壮語をしているわけではありません。先週、MetaのCEOマーク・ザッカーバーグは、AI超知能の差し迫った到来について長文のメモを書き、今年初めには、AnthropicのCEOダリオ・アモデイが、AIが1年以内にすべてのエントリーレベルの仕事の半分を奪う可能性があるという予測で広範な警鐘を鳴らしました。これらの業界リーダーは、彼らの創造物がもたらす実存的リスクについて頻繁に議論しますが、彼らの高度なモデルは、「blueberry」に含まれる「b」の数を数えるといった基本的なクエリにもまだ苦戦しています。

これは、OpenAI、Anthropic、その他の開発者による製品の印象的な能力を軽視するものではありません。それらは間違いなく強力で、かなりの有用性を持つツールです。しかし、これらのモデルリリースを取り巻く誇大広告のサイクルは過剰になっています。ChatGPTやGoogle Geminiの頻繁なユーザーとして、私は日に何度もそれらを使用し、その有用性を直接体験してきました。最近、私の妻は、海洋生物に関する豊富な経験があるにもかかわらず、これまで一度も目撃したことのない、クジラが繰り返し尾を水面に叩きつける行動に遭遇しました。好奇心から、私はChatGPTに「なぜクジラは繰り返し尾を水面に叩きつけるのですか?」と尋ねました。チャットボットは自信を持ってその行動を「ロブテイリング(lobtailing)」と特定し、考えられる理由のリストを提供しました。印象的ではありますが、通常のGoogle検索でも同様の情報が得られたでしょう。さらに重要なのは、ChatGPTの説明は簡潔であるものの、あまりにも断定的すぎたことです。実際には、多くの説があるものの、ロブテイリングの正確な理由は科学的な謎のままです。

私がこの謎を知ったのは、従来の検索結果を深く掘り下げた結果、エミリー・ボーリングによる洞察に満ちたエッセイに出会ったからです。彼女は、ザトウクジラのロブテイリングの観察を雄弁に描写し、このエネルギーを大量に消費する行動を取り巻く科学的な不確実性を探求しています。それは摂食のためなのか、コミュニケーションのためなのか、それとも誇示のためなのか?生物学者のハル・ホワイトヘッドが示唆するように、「ブリーチ(ジャンプ)とロブテールが優れた信号となるのは、まさにそれらがエネルギーを大量に消費するためであり、したがってメッセージの重要性と信号を送る側の身体的状態を示すものだからである。」この文脈において、尾を叩くことは力強い宣言となります。「注意を払え!私は重要だ!私に気づけ!」

多くの点で、現在のAIの誇大広告サイクルは、猛烈なレベルの投資の必然的な副産物です。数えきれないほどの数十億ドルの埋没費用、大規模なデータセンター建設とその重大な環境への影響、これらすべてが正当化を求めています。これほど多くの資本が危機に瀕しているため、業界は絶え間なく壮大な約束を生み出すことを強いられています。

これは、AIで本当に素晴らしいことが起こっていないと言っているわけではありません。ChatGPT 3.5、Dall-E、NotebookLM、Veo 3、Synthesiaなど、特定のAIリリースには心底驚かされました。そして今週も、Google DeepMindのGenie 3は、シンプルなテキストプロンプトを没入型でナビゲート可能な3D世界に変えることができ、本当に驚くべきものでした。しかし、Genie 3自体が、AIにおける最も興味深い進歩がしばしばチャットボットの領域外で起こっているという説得力のある事例を提示しています。

この段階では、新しい大規模言語モデルチャットボットのリリースに最も一貫して驚嘆している観察者は、そのプロモーションから最も直接的に利益を得る人々であることが多いとさえ主張できるかもしれません。おそらくこの視点は皮肉的ですが、デス・スターを約束しながら、主な新しい魅力が自動モデル選択であるチャットボットを提供するよりも、まだ皮肉的ではないと思います。超知能を約束しながら、過剰に宣伝され、しばしば断定的ではあるものの、最終的には限定的なツールに過ぎないものを提供するよりも、まだ皮肉的ではないでしょう。これらすべては、ただの多くのロブテイリングに過ぎません。「注意を払え!私は重要だ!私に気づけ!」