DeepSeek: El modelo de IA falla con chips Huawei, retrasa lanzamiento
La firma china de inteligencia artificial DeepSeek ha pospuesto, según informes, el lanzamiento de su nuevo modelo R2, un revés atribuido a las persistentes dificultades técnicas encontradas al intentar entrenarlo utilizando los procesadores Ascend de Huawei. Este retraso subraya los importantes obstáculos que Pekín enfrenta en su ambiciosa iniciativa para reemplazar la tecnología extranjera, particularmente la estadounidense, con alternativas nacionales.
Fuentes familiarizadas con la situación indican que las autoridades chinas habían alentado a DeepSeek a adoptar los chips Ascend de Huawei para su modelo R2, tras el lanzamiento de su modelo R1 en enero, alejándola de los sistemas predominantes de Nvidia. Sin embargo, DeepSeek rápidamente encontró problemas durante la fase de entrenamiento intensivo de su modelo R2 con los chips Ascend. En consecuencia, la compañía recurrió al uso de chips Nvidia para el proceso de entrenamiento crucial, reservando los chips de Huawei para la etapa de inferencia, menos exigente, donde un modelo entrenado aplica su conocimiento para generar predicciones o respuestas, como una consulta de chatbot.
Los problemas técnicos con el hardware de Huawei fueron la causa principal del aplazamiento del lanzamiento del modelo R2 desde mayo, un retraso que ha permitido a los rivales ganar terreno. Expertos de la industria señalan una serie de disparidades de rendimiento, destacando que los chips chinos, incluidos los de Huawei, aún están rezagados con respecto a sus contrapartes estadounidenses en áreas críticas. Estas deficiencias, según se informa, incluyen problemas de estabilidad, una conectividad inter-chip más lenta y un software de acompañamiento menos robusto en comparación con las ofertas de Nvidia.
Aunque Huawei envió un equipo de ingenieros a las oficinas de DeepSeek para ayudar con el desarrollo del modelo R2 en los chips Ascend, los esfuerzos colaborativos no lograron un entrenamiento exitoso. DeepSeek, según se informa, sigue trabajando con Huawei para asegurar la compatibilidad del modelo con Ascend para la inferencia, lo que indica un compromiso continuo con el hardware nacional cuando sea factible.
Los desafíos no han pasado desapercibidos internamente. El fundador de DeepSeek, Liang Wenfeng, ha expresado insatisfacción con el progreso del R2, supuestamente presionando por más tiempo y recursos para desarrollar un modelo avanzado capaz de mantener la ventaja competitiva de la compañía en el rápidamente cambiante panorama de la IA. Además de los retrasos relacionados con los chips, el lanzamiento del R2 también se vio afectado por requisitos de etiquetado de datos más largos de lo esperado para su modelo actualizado. A pesar de estos contratiempos, los informes de los medios chinos sugieren que el modelo aún podría ser lanzado en las próximas semanas.
El contexto más amplio de las dificultades de DeepSeek es el impulso intensificado de Pekín hacia la autosuficiencia tecnológica. El Financial Times informó recientemente que las empresas tecnológicas chinas ahora deben justificar sus pedidos de chips H20 de Nvidia, una medida explícitamente dirigida a promover alternativas nacionales de compañías como Huawei y Cambricon. Esta presión destaca la importancia estratégica que se le da a la tecnología de fabricación propia en la actual competencia geopolítica.
Ritwik Gupta, investigador de IA en la Universidad de California, Berkeley, comentó sobre la naturaleza dinámica del mercado de la IA, señalando que “los modelos son commodities que pueden ser fácilmente intercambiados”. Citó a Qwen3 de Alibaba como una alternativa potente y flexible que ha integrado con éxito los conceptos centrales de DeepSeek, como su algoritmo de entrenamiento capaz de razonamiento, haciéndolos más eficientes. Gupta, quien monitorea de cerca el ecosistema de IA de Huawei, reconoció que la compañía está experimentando “problemas de crecimiento” con los chips Ascend para fines de entrenamiento. Sin embargo, se mantiene optimista sobre las perspectivas a largo plazo de Huawei, afirmando: “Que hoy no veamos modelos líderes entrenados con Huawei no significa que no sucederá en el futuro. Es cuestión de tiempo.”
Mientras tanto, Nvidia, un actor central en la rivalidad tecnológica entre Estados Unidos y China, acordó recientemente un acuerdo de reparto de ingresos con el gobierno de EE. UU. para reanudar las ventas de sus chips H20 a China. El fabricante de chips ha enfatizado la importancia de los desarrolladores en la construcción de un ecosistema de IA ganador, argumentando que “rendir mercados enteros y desarrolladores solo dañaría la seguridad económica y nacional de Estados Unidos”. Ni DeepSeek ni Huawei respondieron a las solicitudes de comentarios sobre el asunto.