智譜AIのGLM-4.5:欧米モデルに匹敵するオープンソースLLM
中国のAI大手、智譜AI(Zhipu AI)は、複雑な論理的推論、高度なプログラミング、自律エージェントタスクのために設計されたオープンソース大規模言語モデル(LLM)における重要な進歩を示す最新モデルファミリー、GLM-4.5およびGLM-4.5Vを発表しました。これらの新モデルは、インタラクティブなミニゲームや複雑な物理シミュレーションの生成から、ウェブ検索機能統合済みのプレゼンテーションスライドの自律的作成、さらにはフロントエンドとバックエンドの両方の機能を網羅する完全なウェブアプリケーションの開発まで、幅広い実用的なアプリケーションに対応できるよう設計されています。
マルチモーダル版であるGLM-4.5Vは、高度な画像およびビデオ分析を組み込むことで、これらの機能を拡張しています。このバージョンは、単なるスクリーンショットからウェブサイト全体を再構築し、画面操作を実行できるため、高度に自律的なエージェントの振る舞いを可能にします。ユーザーは、簡単なログイン後、chat.z.aiで無料で利用できるChatGPTスタイルのインターフェースを通じてこれらの機能を体験できます。
智譜AIの新しいラインナップは、堅牢なGLM-4.5、よりリソース効率の高いGLM-4.5-Air、そしてAirバージョンを基盤とするマルチモーダルGLM-4.5Vの3つの異なるモデルで構成されています。各モデルはデュアルモードの運用アプローチを提供しており、深層かつ複雑な推論に最適化された「思考モード」と、迅速で簡潔な回答に特化した「クイックレスポンスモード」を備えています。
GLM-4.5シリーズの重要な特徴は、その卓越したパラメータ効率と強力な性能です。智譜AIは、GLM-4.5Vが同規模のオープンソースモデルの中で最も強力な機能を提供すると主張しています。12の異なるベンチマークにおける包括的な評価では、GLM-4.5は13のLLM全体で印象的な3位を獲得し、特に自律タスクでは注目すべき2位でした。その性能には、TAU-Benchエージェントタスクでの70.1%のスコア、AIME 24数学問題での91.0%の成功率、SWE-Bench Verifiedソフトウェアエンジニアリングタスクでの堅実な64.2%が含まれます。
これらのモデルは並外れた効率性を示しており、GLM-4.5はDeepseek-R1のわずか半分のパラメータ、Kimi K2のわずか3分の1のパラメータしか使用していませんが、それらの性能に匹敵するか、一貫して上回っています。ウェブナビゲーションでは、GLM-4.5はBrowseCompで26.4%を達成し、大幅に大きいClaude Opus 4(18.8%)さえも上回りました。さらにコンパクトなGLM-4.5-Airモデルでさえ、はるかに少ないパラメータ数にもかかわらず、コーディングタスクでDeepseek R1に匹敵します。
これらのモデルの基盤となっているのは、洗練されたエキスパート混合(MoE)アーキテクチャです。GLM-4.5は合計3550億のパラメータを持ち、そのうち320億が常にアクティブに動作しています。一方、GLM-4.5-Airは1060億のパラメータを持ち、120億がアクティブです。より広範なネットワークを好む一部の競合他社とは異なり、智譜AIはより多くの層を持つ深層アーキテクチャを選択しました。この設計選択は、深さの増加が推論能力を大幅に向上させることを示す彼らの研究に基づいています。これらのモデルは、約23兆トークンに及ぶ広範なトレーニングを受け、一般的なデータから専門的なコードや推論タスクまで、複数のフェーズを経て進化しました。
すべてのモデルはZ.aiプラットフォームを通じてアクセス可能で、OpenAI互換のAPIエンドポイントを提供しています。開発者コミュニティ向けには、コードはGitHubでオープンソースとして公開されており、モデルの重みはHugging FaceおよびアリババのModelscopeからダウンロード可能です。
智譜AIは、清華大学の教授陣によって2019年に設立され、北京に本社を置いています。2022年にそのGLM-130BモデルがGoogleやOpenAIといった業界大手の提供するモデルを上回る性能を示したことで、初めて国際的な注目を集めました。現在、同社は800人以上の従業員を雇用しており、そのほとんどが研究開発に従事しています。アリババ、テンセント、シャオミといった中国の大手テクノロジー企業に加え、複数の政府系ファンドやサウジアラムコ傘下のProsperity7 Venturesなどの国際的な出資者から多額の投資を誘致しており、IPO(新規株式公開)を控えて評価額は50億ドルを超えています。
しかし、智譜AIを含む中国のAIモデルの急速な台頭は、独自の地政学的枠組みの中で進行しています。これらのモデルはすべて政府の検閲の対象であり、中国政府の優先事項とイデオロギー的指令を反映しています。これは米国とは対照的で、米国政府も国内のAIモデルに対する規制を検討していますが、その動機は異なる政治的価値観に基づいています。いずれの場合も、これらの強力なAIシステムは、より広範な文化戦争の道具となるリスクを抱えており、異なるイデオロギーがその能力と許容される出力を形成し、最終的に同様の形態のコンテンツ管理につながっています。