NASA、地球観測AIモデル「ガリレオ」を公開:オープンソースの新時代へ
NASAは、多様な地球観測(EO)データストリームを大規模に処理、分析、解釈するために設計された、オープンソースの高度なマルチモーダル基盤モデル「ガリレオ(Galileo)」を発表しました。マギル大学、NASA Harvest Ai2、カールトン大学、ブリティッシュコロンビア大学、ベクター・インスティテュート、アリゾナ州立大学の研究者からの支援を受けて開発されたガリレオは、農地マッピング、災害対応、環境モニタリングといった重要なアプリケーションに対し、統一された汎用ソリューションを提供することを目指しています。
単一のデータタイプやスケールに限定されることが多かったこれまでのリモートセンシングモデルとは異なり、ガリレオは複数のセンシングモダリティを柔軟に融合できるよう設計されています。これにより、わずか1〜2ピクセルの漁船のような微細な物体から、氷河のような広大でゆっくりと変化する地形まで、さまざまな現象を認識することが可能になります。
主な特徴とアーキテクチャ
ガリレオは、Vision Transformer(ViT)ベースのアーキテクチャ上に構築されています。これは、多種多様な地球観測データを処理するために特別に適合されたニューラルネットワーク設計の一種です。これには、マルチスペクトル光学画像(例:Sentinel-2)、合成開口レーダー(SAR)データ(例:Sentinel-1)、標高と傾斜データ(例:NASA SRTM)、気象および気候データ(例:ERA5からの降水量と気温)、ならびに土地被覆、人口密度、夜間光などのさまざまな補助マップが含まれます。
その柔軟な入力処理は、洗練されたトークン化パイプラインによって実現されています。このプロセスは、多様なリモートセンシング入力を標準化された空間パッチ、タイムステップ、論理チャネルグループに分解し、モデルが単一のアーキテクチャ構成内で画像、時系列、静的表形式データを処理できるようにします。
ガリレオの核となる革新は、デュアル目的学習アプローチを採用した自己教師あり事前学習アルゴリズムです。
グローバル目的: 広範な空間的または時間的コンテキストにわたって抽象的な表現を学習するようモデルを促し、氷河や森林減少のような大規模またはゆっくりと変化する特徴を識別するのに理想的です。
ローカル目的: モデルの微細な詳細への感度を高め、ボートや破片のような小さく、急速に変化する物体を検出するのに不可欠です。
予測ターゲットとマスキング戦略が異なるこれらの目的の組み合わせは、マルチスケール特徴表現を大幅に強化します。この設計により、ガリレオはさまざまなタスクに対して高い汎化性を持ち、限られたラベル付きデータでの作業でも堅牢性を発揮します。
事前学習データセットと戦略
包括的な意味的および地理的多様性を確保するため、ガリレオの事前学習データセットは地球全体をカバーしています。サンプルは、土地被覆の多様性と地理的広がりを最大化するためにクラスタリングアプローチを使用して選択されました。データセットは、4つのカテゴリと9つの異なるリモートセンシングデータタイプを含む127,000以上の時空間的にアラインされたサンプルで構成されています。事前学習は500エポックにわたって、十分な計算リソースを使用し、有効バッチサイズ512、さまざまなデータ拡張(反転、回転、可変パッチサイズ)を適用し、AdamWで最適化されて実施されました。
ベンチマーク結果
ガリレオは、画像分類、ピクセル時系列分類、セグメンテーションを含む11の多様なデータセットと15の下流タスクで厳密にベンチマークされました。このモデルは優れた汎化能力を示し、EuroSat、BigEarthNet、So2Sat、MADOS(海洋ゴミ)、Sen1Floods11(SAR洪水マッピング)、CropHarvest(マルチモーダル作物分類)などの公開データセットで既存の専門モデルを上回りました。
Galileo-Base(ViT-Base)の性能ハイライトは以下の通りです。
分類(ファインチューン): EuroSat(100%訓練データ使用)で97.7%のtop-1精度を達成し、CROMA(96.6%)やSatMAE(96.6%)などの専門モデルを上回りました。
ピクセル時系列: CropHarvest(ケニア)で84.2%の精度を達成し、PrestoやAnySatを上回りました。Breizhcropsでは73.0%でした。
セグメンテーション(mIoU): MADOSで67.6%、PASTISで79.4%でした。
すべてのベンチマークにおいて、ガリレオは一貫して最高の全体性能を示し、画像データまたは時系列データのいずれかに特化した競合他社よりも優れた柔軟性を実証しました。特に、より小さなモデルバリアント(ViT-Nano、ViT-Tiny)も競争力のある結果を達成しており、リソースが制約された環境でもガリレオが実用的であることを示しています。アブレーション研究は、マルチモダリティの価値をさらに強調しました。事前学習中に単一の入力タイプを削除すると、その入力を直接使用しないベンチマークであっても測定可能な性能低下が生じ、多様なデータを統合することの包括的な利点が証明されました。
オープンソースと実世界への影響
ガリレオのコード、モデルの重み、事前学習データはすべてGitHubで公開されており、透明性を促進し、世界の地球観測コミュニティによる採用を容易にしています。このモデルはすでに、NASA Harvestのミッションクリティカルな活動、例えば地球規模の作物タイプマッピング、迅速な災害マッピング(洪水、山火事)、海洋汚染検出などを支援しています。限られたラベル付きデータでも効果的に機能するその能力は、地上真実情報が乏しい地域で特に価値があり、世界の食料安全保障と気候変動適応の取り組みを直接支援しています。
ガリレオの методологи的なおよび工学的な進歩 — マルチモーダル入力、マルチスケールなローカル-グローバル特徴学習、大規模でグローバルに多様な事前学習 — は、汎用リモートセンシングAIの新たなベンチマークを確立します。その固有の柔軟性は、環境モニタリングから気候レジリエンスに至るまでの実用的な展開を支え、タスクや地理的領域に関わらず、信頼性の高い高品質なマップと予測を提供することが期待されます。オープンソースの性質と継続的な開発により、ガリレオは地球システム科学における重要な革新を促進し、世界中の実務家を力づけることでしょう。