La Estrategia de IA de la India: Fusionando Modelos Globales con Innovación Local

Livemint

La reciente retirada de los servicios en la nube de Microsoft a la refinería india Nayara Energy, respaldada por Rusia, subrayó una vulnerabilidad crítica: los riesgos asociados con la excesiva dependencia de la infraestructura tecnológica extranjera. Este incidente ha amplificado el impulso estratégico de la India para desarrollar sus propias capacidades fundamentales de inteligencia artificial, un esfuerzo que podría servir como modelo para otras naciones del Sur Global.

La India se enfrenta a un desafío único en el desarrollo de la IA debido a su profunda diversidad lingüística, que abarca 22 idiomas oficiales y cientos de dialectos hablados. Construir sistemas de IA capaces de navegar por este panorama multilingüe es una tarea monumental. Sin embargo, está emergiendo una estrategia dual pragmática, donde las startups indias están, simultáneamente, afinando modelos globales de código abierto para aplicaciones inmediatas, mientras construyen meticulosamente modelos fundacionales indígenas desde cero.

En el evento I/O Connect de Google en Bengaluru, este enfoque en capas fue evidente. Startups como Sarvam AI mostraron Sarvam-Translate, un modelo multilingüe refinado utilizando el modelo de lenguaje grande (LLM) de código abierto de Google, Gemma. De manera similar, CoRover demostró BharatGPT, un chatbot que proporciona servicios públicos, incluso para la Corporación India de Catering y Turismo Ferroviario (IRCTC), también construido sobre un modelo afinado. Estos esfuerzos, respaldados por Google, podrían parecer paradójicos dado que Sarvam, Soket AI y Gnani también se encuentran entre las cuatro startups encargadas de desarrollar los LLM soberanos de la India bajo la Misión IndiaAI de ₹10,300 crore.

La razón de este doble enfoque radica en la necesidad. Desarrollar modelos de IA competitivos desde cero es intensivo en recursos, exigiendo vastos conjuntos de datos, infraestructura de cómputo avanzada e investigación exhaustiva. La India, con su ecosistema tecnológico en evolución y sus urgentes demandas de mercado, no puede permitirse construir de forma aislada. En cambio, afinar los grandes modelos de lenguaje existentes —especializándolos con datos locales enfocados— ofrece un camino pragmático para abordar problemas del mundo real hoy. Esto permite a las startups iniciar despliegues iniciales, recopilar comentarios de los usuarios y desarrollar experiencia específica del dominio, mientras construyen simultáneamente las tuberías de datos y la infraestructura necesarias para modelos verdaderamente independientes.

El Proyecto EKA, una iniciativa de código abierto liderada por Soket AI en asociación con institutos indios líderes como IIT Gandhinagar e IISc Bangalore, ejemplifica la ambición soberana. Diseñado desde cero con código, infraestructura y tuberías de datos de origen totalmente indio, EKA tiene como objetivo entregar un modelo de 7 mil millones de parámetros en cuestión de meses, con un modelo más grande de 120 mil millones de parámetros planificado. Esta iniciativa se centra en dominios críticos como la agricultura, el derecho, la educación y la defensa, asegurando que el entrenamiento se realice en la nube de GPU de la India y que los modelos resultantes sean de código abierto. Sin embargo, el cofundador de Soket AI, Abhishek Upperwal, aclara que el uso de Gemma para despliegues iniciales es una medida temporal, una forma de “arrancar y cambiar a pilas soberanas cuando estén listas”, en lugar de una dependencia a largo plazo. BharatGPT de CoRover sigue una trayectoria similar, aprovechando modelos afinados para las aplicaciones gubernamentales actuales mientras desarrolla también su propio LLM fundacional con conjuntos de datos indios, tratando los despliegues actuales como vías tanto para la prestación de servicios como para la creación de conjuntos de datos.

Para la India, desarrollar sus propias capacidades de IA trasciende el orgullo nacional; se trata de resolver problemas que los modelos extranjeros a menudo no pueden abordar adecuadamente. Imagine a un trabajador migrante en la Maharashtra rural, que solo entiende hindi, tratando de comprender la explicación asistida por IA de un médico sobre una radiografía en inglés, basada en suposiciones médicas occidentales. Tales escenarios resaltan una falta de coincidencia fundamental en el anclaje cultural, fisiológico y contextual. La India requiere herramientas de IA que comprendan términos médicos locales en Maithili, proporcionen asesoramiento sobre cultivos alineado con los horarios de riego específicos del estado y procesen consultas ciudadanas en 15 idiomas con variaciones regionales. Estos son casos de uso cotidianos de alto impacto donde los errores pueden afectar directamente los medios de vida, los servicios públicos y los resultados de salud. El ajuste fino de modelos abiertos proporciona una solución inmediata a estas necesidades urgentes, sentando simultáneamente las bases para una pila de IA verdaderamente soberana.

La Misión IndiaAI es una respuesta estratégica a una creciente preocupación geopolítica. A medida que los sistemas de IA se vuelven integrales para la gobernanza, la educación, la agricultura y la defensa, la dependencia de plataformas extranjeras plantea riesgos de exposición de datos y pérdida de control, como lo demostró el incidente de Nayara Energy. Además, la mayoría de los modelos de IA globales se entrenan en conjuntos de datos occidentales, predominantemente en inglés, lo que los hace mal equipados para manejar la diversidad lingüística de la India o las complejidades de sus sentencias legales y prácticas agrícolas.

Si bien la autosuficiencia completa en IA es inviable para cualquier nación, incluidas las potencias globales, el enfoque de la India se trata de maximizar la elección y reducir las dependencias. Amlan Mohanty, un experto en políticas tecnológicas, enfatiza que la soberanía radica en controlar la infraestructura y establecer los términos. Señala que la postura pragmática y tecnológicamente agnóstica del gobierno indio está moldeada por limitaciones como la escasez de conjuntos de datos índicos de alta calidad, la capacidad de cómputo y las alternativas de código abierto fácilmente disponibles y adaptadas para la India.

De hecho, la falta de datos de entrenamiento de alta calidad, particularmente en idiomas indios, sigue siendo un obstáculo significativo. Manish Gupta, de Google DeepMind India, señala que 72 idiomas indios con más de 100,000 hablantes prácticamente no tienen presencia digital. Iniciativas como Project Vaani de Google, en colaboración con el Instituto Indio de Ciencias (IISc), tienen como objetivo cerrar esta brecha recolectando grandes cantidades de muestras de voz en cientos de distritos indios, incluso para idiomas que anteriormente carecían de conjuntos de datos digitales. Estos datos, junto con las capacidades de transferencia interlingüísticas de Google, ayudan a mejorar el rendimiento en idiomas con menos recursos y se incorporan en modelos como Gemma, que utilizan las startups indias.

La estrategia en capas de la India ofrece una hoja de ruta convincente para otras naciones del Sur Global que luchan con limitaciones similares. Proporciona un modelo para construir sistemas de IA que reflejen idiomas, contextos y valores locales sin requerir inmensos presupuestos de cómputo o ecosistemas de datos maduros desde el principio. Para 2026, a medida que se espera que los LLM soberanos de la India como EKA estén listos para la producción, se proyecta que esta doble vía converja, con los sistemas de cosecha propia reemplazando gradualmente a los modelos iniciados.

Sin embargo, incluso mientras las startups indias se basan en herramientas abiertas de gigantes tecnológicos globales, persiste la cuestión de la dependencia a largo plazo. El control sobre la arquitectura, las técnicas de entrenamiento y el soporte de infraestructura aún recae en gran medida en las Grandes Tecnológicas. Si bien Google ha abierto conjuntos de datos y se ha asociado con startups de la Misión IndiaAI, los términos de dicha apertura pueden no ser siempre simétricos. Las ambiciones soberanas de la India dependen en última instancia de su capacidad para superar estos modelos abiertos. La pregunta crítica para la India y otras naciones del Sur Global es si pueden convertir este apoyo prestado en una infraestructura de IA completa y soberana antes de que cambien los términos de acceso o se cierre la ventana de oportunidad.