MLE-STAR: GoogleのAIが最小入力でMLパイプラインを自動化
Google Researchは、最小限の人間介入で機械学習(ML)パイプライン構築の複雑なプロセスを自動化するために設計された新しいAIエージェント、MLE-STARを発表しました。このシステムは、タスクの説明と提供されたデータから実行可能なPythonスクリプトを生成する能力を持ち、様々なデータタイプにわたる複雑なMLタスクを効率化することを目指しています。
従来のML自動化エージェントは、限られた標準ツールのセットに依存することが多く、多様なモデルやパイプラインコンポーネントを探索する際の柔軟性に欠ける傾向があります。それらは通常、コードベース全体を一度に書き換えるため、特徴量エンジニアリングのような特定のステップの的を絞った改善を複雑にします。MLE-STARは、多段階の反復アプローチでこれらの制限に対処します。
エージェントはまず、ウェブ検索を活用して現代的なモデルのアイデアを発見し、この情報を使用して初期ソリューションを構築します。次に、コードベースを綿密に分析し、特徴量エンジニアリング、モデル選択、アンサンブル構築のいずれのセグメントが全体的なパフォーマンスに最も大きな影響を与えるかを特定します。この洞察に基づき、MLE-STARはその特定のコードブロックを段階的に改善することに焦点を当て、以前の実験からのフィードバックを継続的に取り入れ、改善されたスクリプトを次のイテレーションの出発点として使用します。
MLE-STARは、そのコアな改善プロセスに加えて、堅牢で信頼性の高い結果を保証するためのいくつかのモジュールを含んでいます。複数のソリューションバリアントを生成し、独自のアンサンブル戦略を開発し、予測能力を最大化するために繰り返し強化することができます。一般的な落とし穴を防ぐために、システムはランタイムエラーを修正するデバッグエージェント、トレーニング中にテストデータへの不正アクセスを防ぐデータ漏洩チェッカー、および基本的なCSVファイルだけでなく、利用可能なすべてのデータソースが活用されることを保証するデータ使用チェッカーを統合しています。
GoogleはMLE-STARを、実際のKaggleコンペティションから派生したベンチマークスイートであるMLE-Bench-Liteでテストしました。結果はパフォーマンスの大幅な向上を示し、エージェントは63.6%のケースでメダルを獲得し、以前の最高値である25.8%から大幅に増加しました。特筆すべきは、これらのうち36%が金メダルであったことです。Googleはこの成功を、MLE-STARがEfficientNetやViTのような現代のモデルアーキテクチャを組み込む能力に起因すると考えており、ResNetのような古い設計を好む競合システムとは対照的です。このシステムは手動調整もサポートしており、手動の説明が提供された後にRealMLPモデルが成功裏に統合されたことで実証されました。
開発チームは、Gemini 2.5 FlashやProのような大規模言語モデルが、正規化のためにテストデータを使用するなど、欠陥のあるコードを生成する事例を観察しました。MLE-STARの統合データ漏洩チェッカーは、これらの状況で効果的に介入しました。同様に、データ使用チェッカーは、テスト中に最初に見落とされていたデータセットを特定し、含めました。
MLE-STARは現在、GoogleのAgent Development Kitに基づいて構築されたオープンソースとして利用可能です。ユーザーは、使用するモデルやウェブ検索コンテンツの適切なライセンスを確保する責任があります。現在、MLE-STARは研究目的のみを意図しています。