Google、Gemma 3 270Mを発表:スマホ向け超小型オープンソースAI
GoogleのDeepMind AI研究チームは、卓越した効率性とデバイス上でのパフォーマンスを実現するために設計された新しいオープンソースAIモデル、Gemma 3 270Mを発表しました。このモデルは、その2億7000万のパラメータ(モデルの動作を司る内部設定)にちなんで名付けられており、通常AI分野を支配する数十億パラメータの大規模言語モデル(LLM)とは対照的です。パラメータ数が多いほど一般的に強力なモデルとなりますが、Gemma 3 270Mは異なる種類のパワーを優先しています。それは、Pixel 9 Proプロセッサでの内部テストで示されたように、インターネット接続なしでスマートフォンやその他の軽量ハードウェア上で直接実行できる能力です。
その小さなサイズにもかかわらず、Gemma 3 270Mは複雑なドメイン固有のタスクを処理できるように設計されており、企業や独立開発者の正確な要件に合わせて、しばしば数分で迅速にファインチューニングできます。Google DeepMindのスタッフAI開発者リレーションズエンジニアであるOmar Sanseviero氏は、ソーシャルネットワークXでこのモデルの多用途性をさらに強調し、ユーザーのウェブブラウザ内、Raspberry Pi上、さらにはユーモラスに「トースターの中」でも直接動作する能力があることを述べ、リソースが非常に制約された環境への適応性を強調しました。
モデルのアーキテクチャは、1億7000万の埋め込みパラメータと、稀な専門用語を処理できる25万6000トークンの豊富な語彙、さらに1億のトランスフォーマーブロックパラメータを組み合わせています。Googleは、この設計により、指示追従タスクにおいて強力な性能をすぐに発揮できると同時に、モバイルハードウェアを含む計算リソースが限られたデバイス上での迅速なファインチューニングと展開に十分な小型さを維持できると断言しています。Gemma 3 270Mは、より大規模なGemma 3モデルからその基本的なアーキテクチャと事前学習を受け継いでおり、より広範なGemmaエコシステム全体でのシームレスな互換性を保証します。開発者は、Hugging Face、UnSloth、JAXなどの人気ツール向けの包括的なドキュメント、ファインチューニングレシピ、展開ガイドを活用して、実験段階から実用的な展開への移行を加速できます。
性能面では、指示に特化したGemma 3 270Mは、モデルの指示追従能力を評価するIFEvalベンチマークで51.2%のスコアを達成しました。Googleの比較データによると、このスコアはSmolLM2 135M InstructやQwen 2.5 0.5B Instructといった他の同サイズのモデルを大きく上回り、一部の数十億パラメータモデルの性能レベルに迫っています。しかし、競合するAIスタートアップLiquid AIの研究者やリーダーたちは、Googleの比較が、7月にリリースされた彼らのLFM2-350Mモデル(わずかに多いパラメータで65.12%というより高いスコアを誇る)を省略しているとX上で即座に指摘しました。
Gemma 3 270Mの最も魅力的な属性の1つは、その卓越したエネルギー効率です。内部テストでは、INT4精度に最適化されたモデルのバージョンが、25回の会話でPixel 9 Proのバッテリー寿命のわずか0.75%しか消費しませんでした。これにより、特にユーザーのプライバシーとオフライン機能が最優先されるオンデバイスAIアプリケーションにとって、非常に実用的な選択肢となります。リリースパッケージには、一般的なタスク向けの事前学習済みモデルと、指示に特化したバリアントの両方が含まれており、開発者に即座の有用性を提供します。さらに、量子化認識学習(QAT)チェックポイントも利用可能で、最小限の性能劣化でINT4精度を可能にし、リソースが制約された環境での本番展開には不可欠です。
GoogleはGemma 3 270Mを、利用可能な最大のモデルにデフォルトで頼るのではなく、与えられたタスクに適したツールを選択するという同社の哲学の証として位置付けています。感情分析、エンティティ抽出、クエリルーティング、構造化テキスト生成、コンプライアンスチェック、さらにはクリエイティブライティングといった特定の機能において、同社は、きめ細かくチューニングされた小型モデルが、大規模な汎用モデルよりも迅速で費用対効果の高い結果を提供できると主張しています。この専門化は、Adaptive MLとSK Telecomの過去の協力関係で効果的であることが証明されており、多言語コンテンツモデレーションにおいて、きめ細かくチューニングされたGemma 3 4Bモデルが、はるかに大規模なプロプライエタリシステムを上回る性能を発揮しました。Gemma 3 270Mは、さらに小さな規模で同様の成功を促進するように設計されており、個々のタスクに合わせて調整された専門モデルの作成を可能にします。
企業アプリケーション以外にも、このモデルはクリエイティブなシナリオでも可能性を示しています。デモビデオでは、Gemma 3 270MとTransformers.jsで構築された「おやすみストーリージェネレーター」アプリが紹介されており、ウェブブラウザ内で完全にオフラインで動作します。このアプリケーションでは、ユーザーが主人公、設定、プロットツイスト、テーマ、希望の長さを選択し、これらの入力に基づいて一貫性のある想像力豊かなストーリーを生成できます。この強力な例は、Gemma 3 270Mがクラウドインフラストラクチャに依存することなく、魅力的でインタラクティブなアプリケーションを動かすことができる方法を示しており、オンデバイスAI体験の新たな道を切り開いています。
Gemma 3 270Mは、Gemma利用規約に基づいてリリースされており、特定の条件が満たされる限り、モデルとその派生物の使用、複製、変更、配布が許可されています。これらの条件には、Googleの禁止使用ポリシーの遵守、下流の受信者が規約を認識していることの確認、および変更点の明確な表示が含まれます。このライセンスモデルは、従来の意味での「オープンソース」ではありませんが、別途有料ライセンスを必要とせずに商業利用を広く可能にします。企業はモデルを製品に組み込んだり、クラウドサービスの一部として展開したり、専門的な派生物にファインチューニングしたりでき、モデルによって生成されたコンテンツに対する完全な権利を保持します。ただし、開発者は、適用される法律を遵守し、有害なコンテンツの生成やプライバシー規制の違反などの禁止された使用を避ける責任を負います。
「Gemmaverse」のダウンロード数が2億を超え、Gemmaラインナップがクラウド、デスクトップ、モバイル向けに最適化されたバリアントに拡大する中、Google AI開発者はGemma 3 270Mを、高速で費用対効果が高く、プライバシーを重視したAIソリューション開発の基盤要素として戦略的に位置付けています。