MLE-STAR: La IA de Google que automatiza ML con mínima entrada

Google Research ha presentado MLE-STAR, un nuevo agente de IA diseñado para automatizar el intrincado proceso de construcción de pipelines de aprendizaje automático (ML) con mínima intervención humana. Este sistema tiene como objetivo optimizar tareas complejas de ML en varios tipos de datos, capaz de generar scripts de Python ejecutables a partir de una simple descripción de la tarea y los datos proporcionados.

Los agentes de automatización de ML tradicionales a menudo se basan en un conjunto limitado de herramientas estándar y tienden a carecer de flexibilidad al explorar diversos modelos o componentes de pipeline. Típicamente, reescriben un codebase completo de una vez, lo que complica la mejora dirigida de pasos específicos como la ingeniería de características. MLE-STAR aborda estas limitaciones con un enfoque iterativo de múltiples pasos.

El agente comienza aprovechando la búsqueda web para descubrir ideas de modelos contemporáneos, utilizando esta información para construir una solución inicial. Luego, analiza meticulosamente el codebase para identificar qué segmento —ya sea ingeniería de características, selección de modelos o construcción de conjuntos— tiene el impacto más significativo en el rendimiento general. Con esta información, MLE-STAR centra sus esfuerzos en refinar ese bloque de código específico paso a paso, incorporando continuamente la retroalimentación de experimentos anteriores y utilizando el script mejorado como punto de partida para la siguiente iteración.

Más allá de su proceso de refinamiento central, MLE-STAR incluye varios módulos para garantizar resultados robustos y fiables. Puede generar múltiples variantes de solución y desarrollar sus propias estrategias de conjunto, mejorándolas iterativamente para una máxima capacidad predictiva. Para prevenir errores comunes, el sistema integra un agente de depuración para corregir errores de tiempo de ejecución, un verificador de fuga de datos para evitar el acceso no autorizado a datos de prueba durante el entrenamiento, y un verificador de uso de datos que asegura que todas las fuentes de datos disponibles, no solo archivos CSV básicos, sean utilizadas.

Google probó MLE-STAR en MLE-Bench-Lite, una suite de benchmarks derivada de competiciones reales de Kaggle. Los resultados demostraron un salto significativo en el rendimiento, con el agente logrando una medalla en el 63.6 por ciento de los casos, un aumento sustancial del 25.8 por ciento anterior. Notablemente, el 36 por ciento de estas fueron medallas de oro. Google atribuye este éxito a la capacidad de MLE-STAR para incorporar arquitecturas de modelos modernas como EfficientNet y ViT, contrastando con los sistemas competidores que a menudo prefieren diseños más antiguos como ResNet. El sistema también admite ajustes manuales, demostrado por la integración exitosa del modelo RealMLP después de que se proporcionó una descripción manual.

El equipo de desarrollo observó instancias en las que grandes modelos de lenguaje como Gemini 2.5 Flash y Pro generaron código defectuoso, como el uso de datos de prueba para la normalización. El verificador de fuga de datos integrado de MLE-STAR intervino eficazmente en estas situaciones. De manera similar, el verificador de uso de datos identificó e incluyó conjuntos de datos que inicialmente fueron pasados por alto durante las pruebas.

MLE-STAR ahora está disponible como código abierto, construido sobre el Kit de Desarrollo de Agentes de Google. Los usuarios son responsables de garantizar la licencia adecuada para cualquier modelo o contenido de búsqueda web que utilicen. Actualmente, MLE-STAR está destinado únicamente a fines de investigación.

MLE-STAR: La IA de Google que automatiza ML con mínima entrada

Artículos Relacionados

Genie 3: La IA de DeepMind crea mundos 3D interactivos y consistentes

DeepMind's Genie 3: Nuevo Modelo Mundial Apunta a la IGA

Google DeepMind lanza Genie 3: El 'Modelo Mundial' que entrena robots IA