DeepFleet: IA de Amazon predice tráfico de robots y aumenta la eficiencia

Marktechpost

Amazon ha logrado un hito significativo al desplegar su robot número un millón en centros de cumplimiento y clasificación globales, consolidando su posición como el operador más grande del mundo de robótica móvil industrial. Esta notable expansión coincide con el lanzamiento de DeepFleet, una suite pionera de modelos de fundación de IA diseñados para mejorar la coordinación entre estas vastas flotas de robots. Entrenados con miles de millones de horas de datos operativos del mundo real, estos modelos están preparados para optimizar los movimientos de los robots, reducir significativamente la congestión y aumentar la eficiencia general hasta en un 10%.

El concepto de modelos de fundación, que ganó prominencia en la IA de lenguaje y visión, implica entrenar conjuntos de datos masivos para aprender patrones generales que luego pueden adaptarse a una multitud de tareas específicas. Amazon ahora está aplicando este poderoso enfoque a la robótica, donde el desafío de coordinar miles de robots en entornos de almacén dinámicos exige un nivel de inteligencia predictiva mucho más allá de lo que las simulaciones tradicionales pueden ofrecer. En los centros de cumplimiento, los robots son esenciales para transportar estantes de inventario a los trabajadores humanos, mientras que en las instalaciones de clasificación, manejan eficientemente los paquetes destinados a la entrega. Con flotas que suman cientos de miles, los cuellos de botella operativos como los atascos de tráfico y los bloqueos son comunes, ralentizando todo el proceso. DeepFleet aborda directamente estos problemas pronosticando con precisión las trayectorias e interacciones de los robots, lo que permite una planificación e intervención proactivas.

Los modelos aprovechan un conjunto de datos increíblemente rico y diverso, que abarca millones de horas de robot e incluye varios diseños de almacén, generaciones de robots y ciclos operativos. Estos datos extensos permiten a DeepFleet capturar comportamientos emergentes complejos, como las ondas de congestión, y generalizar en diversos escenarios, de manera muy similar a cómo los grandes modelos de lenguaje se adaptan a nuevas consultas.

DeepFleet se basa en cuatro arquitecturas de modelo distintas, cada una diseñada con un enfoque único para comprender la dinámica de múltiples robots. El modelo Centrado en el Robot (RC), por ejemplo, funciona como un observador enfocado, prediciendo acciones individuales de los robots basándose en datos del vecindario local, como robots cercanos, objetos y marcadores. A pesar de su tamaño relativamente modesto con 97 millones de parámetros, este modelo demostró una precisión superior en las predicciones de posición y estado durante las evaluaciones. En contraste, el modelo Robot-Piso (RF) adopta una visión más amplia, integrando los estados individuales de los robots con características globales del piso como vértices y aristas, lo que permite predicciones sincrónicas que equilibran las interacciones locales con el contexto de todo el almacén. Este modelo más grande, con 840 millones de parámetros, tuvo un rendimiento sólido en las predicciones de tiempo. Un tercer enfoque, el modelo Imagen-Piso (IF), intentó visualizar el almacén como una imagen multicanal utilizando codificación convolucional para características espaciales, pero su rendimiento fue inferior, probablemente debido a dificultades para capturar interacciones precisas de robots a nivel de píxel a escala. Finalmente, el modelo Grafo-Piso (GF) ofrece una solución computacionalmente eficiente, representando el piso del almacén como un grafo espacio-temporal. Esto le permite manejar relaciones globales de manera eficiente, prediciendo acciones y estados con solo 13 millones de parámetros, lo que lo hace ligero pero altamente competitivo. Estos diseños variados, que difieren en sus enfoques temporales (sincrónicos versus basados en eventos) y espaciales (locales versus globales), permiten a Amazon probar qué métodos son los más adecuados para la previsión a gran escala.

Las evaluaciones de rendimiento en datos de almacén no vistos utilizaron métricas como la distorsión temporal dinámica (DTW) para la precisión de la trayectoria y el error de retraso por congestión (CDE) para el realismo operativo. El modelo RC lideró en general, logrando una puntuación DTW de 8.68 para la posición y un CDE del 0.11%, mientras que el modelo GF ofreció resultados sólidos con una complejidad computacional significativamente menor. Los experimentos de escalado confirmaron además que los modelos más grandes entrenados con conjuntos de datos más extensos reducen consistentemente las pérdidas de predicción, reflejando las tendencias observadas en otros modelos de fundación. Para el modelo GF, las extrapolaciones sugieren que una versión de mil millones de parámetros, entrenada en 6.6 millones de episodios, podría lograr una eficiencia computacional óptima. Esta escalabilidad es una ventaja crítica, ya que la vasta flota de robots de Amazon proporciona un volumen inigualable de datos operativos. Las primeras aplicaciones de DeepFleet incluyen la previsión de congestión y el enrutamiento adaptativo, con un potencial futuro que se extiende a la asignación automatizada de tareas y la prevención de bloqueos.

DeepFleet ya está teniendo un impacto tangible en la red global de Amazon, que abarca más de 300 instalaciones en todo el mundo, incluidas implementaciones recientes en Japón. Al mejorar la eficiencia del viaje de los robots, la tecnología contribuye directamente a un procesamiento de paquetes más rápido y a la reducción de los costos operativos, lo que en última instancia beneficia a los clientes. Más allá de la eficiencia, Amazon también destaca su compromiso con el desarrollo de la fuerza laboral, habiendo mejorado las habilidades de más de 700,000 empleados desde 2019 en roles relacionados con la robótica y la IA. Esta integración tiene como objetivo crear trabajos más seguros al descargar tareas físicamente exigentes a las máquinas.