MLE-STAR : L'IA de Google automatise les pipelines ML sans effort
Google Research a introduit MLE-STAR, un nouvel agent IA conçu pour automatiser le processus complexe de construction de pipelines d'apprentissage automatique (ML) avec une intervention humaine minimale. Ce système vise à rationaliser les tâches ML complexes sur divers types de données, capable de générer des scripts Python exécutables à partir d'une simple description de tâche et des données fournies.
Les agents d'automatisation ML traditionnels s'appuient souvent sur un ensemble limité d'outils standards et ont tendance à manquer de flexibilité lors de l'exploration de divers modèles ou composants de pipeline. Ils réécrivent généralement l'ensemble d'une base de code en une seule fois, ce qui complique l'amélioration ciblée d'étapes spécifiques comme l'ingénierie des caractéristiques. MLE-STAR aborde ces limitations avec une approche itérative en plusieurs étapes.
L'agent commence par tirer parti de la recherche web pour découvrir des idées de modèles contemporains, utilisant cette information pour construire une solution initiale. Il analyse ensuite méticuleusement la base de code pour identifier quel segment — qu'il s'agisse de l'ingénierie des caractéristiques, de la sélection de modèles ou de la construction d'ensembles — a l'impact le plus significatif sur la performance globale. Fort de cette perspicacité, MLE-STAR concentre ses efforts sur l'affinage de ce bloc de code spécifique étape par étape, en incorporant continuellement les retours d'expériences précédentes et en utilisant le script amélioré comme point de départ pour la prochaine itération.
Au-delà de son processus d'affinage principal, MLE-STAR comprend plusieurs modules pour garantir des résultats robustes et fiables. Il peut générer plusieurs variantes de solution et développer ses propres stratégies d'ensemble, les améliorant itérativement pour une puissance prédictive maximale. Pour éviter les pièges courants, le système intègre un agent de débogage pour corriger les erreurs d'exécution, un vérificateur de fuites de données pour empêcher l'accès non autorisé aux données de test pendant l'entraînement, et un vérificateur d'utilisation des données qui garantit que toutes les sources de données disponibles, et pas seulement les fichiers CSV de base, sont utilisées.
Google a testé MLE-STAR sur MLE-Bench-Lite, une suite de benchmarks dérivée de compétitions Kaggle réelles. Les résultats ont démontré un bond significatif en performance, l'agent obtenant une médaille dans 63,6 % des cas, une augmentation substantielle par rapport au précédent record de 25,8 %. Notamment, 36 % d'entre elles étaient des médailles d'or. Google attribue ce succès à la capacité de MLE-STAR à incorporer des architectures de modèles modernes comme EfficientNet et ViT, contrastant avec les systèmes concurrents qui préfèrent souvent des conceptions plus anciennes comme ResNet. Le système prend également en charge les ajustements manuels, démontré par l'intégration réussie du modèle RealMLP après qu'une description manuelle a été fournie.
L'équipe de développement a observé des instances où de grands modèles linguistiques comme Gemini 2.5 Flash et Pro ont généré du code défectueux, tel que l'utilisation de données de test pour la normalisation. Le vérificateur de fuites de données intégré de MLE-STAR est intervenu efficacement dans ces situations. De même, le vérificateur d'utilisation des données a identifié et inclus des ensembles de données qui étaient initialement ignorés lors des tests.
MLE-STAR est désormais disponible en open-source, construit sur le Kit de développement d'agents de Google. Les utilisateurs sont responsables de garantir la licence appropriée pour tout modèle ou contenu de recherche web qu'ils utilisent. Actuellement, MLE-STAR est destiné à des fins de recherche uniquement.