DeepSeek: Su modelo de IA se retrasa por problemas con chips de Huawei

Ft

El ambicioso impulso de la startup china de inteligencia artificial DeepSeek para entrenar su modelo de IA de próxima generación, R2, utilizando semiconductores domésticos de Huawei ha encontrado un obstáculo significativo, retrasando su lanzamiento y subrayando claramente la profunda dependencia de la industria global de la IA de la avanzada tecnología de chips de Nvidia. Originalmente programado para un lanzamiento en mayo de 2025, el modelo R2 de DeepSeek encontró desafíos técnicos “persistentes” durante su fase de entrenamiento con los chips Ascend de Huawei, lo que obligó a la compañía a volver al hardware de Nvidia para este proceso crucial.

Este revés destaca los formidables obstáculos que enfrentan las empresas chinas en su búsqueda de autosuficiencia tecnológica en medio de los crecientes controles de exportación de EE. UU. sobre la tecnología de chips avanzada. Pekín ha alentado activamente a las empresas locales de IA a reducir su dependencia de proveedores extranjeros, particularmente los estadounidenses, fomentando un ecosistema doméstico. DeepSeek, tras el exitoso lanzamiento en enero de 2025 de su modelo R1, que dependía en gran medida de los chips H20 de Nvidia, fue una de las empresas instadas a adoptar los procesadores Ascend de Huawei para sus proyectos posteriores.

A pesar de que Huawei envió un equipo de ingenieros para ayudar a DeepSeek, un entrenamiento exitoso con el chip Ascend resultó esquivo. Si bien DeepSeek continúa trabajando con Huawei para asegurar que el modelo R2 sea compatible con Ascend para tareas de inferencia, el entrenamiento central, que exige una inmensa potencia computacional y un entorno de software robusto, sigue ligado a Nvidia. Esta situación no es exclusiva de DeepSeek; los expertos de la industria reconocen ampliamente que los chips de fabricación china, incluida la serie Ascend de Huawei, todavía están por detrás de las ofertas de Nvidia en áreas críticas como la estabilidad, la conectividad entre chips y, fundamentalmente, la madurez del ecosistema de software. La plataforma CANN de Huawei, concebida como un rival de la omnipresente CUDA de Nvidia, ha presentado, según se informa, dificultades e inestabilidad para los desarrolladores.

El dominio duradero de Nvidia en el mercado de chips de IA se debe principalmente a su plataforma CUDA integral. Este marco de computación paralela propietario proporciona un ecosistema de software sin igual, ofreciendo un rendimiento inigualable, amplias herramientas para desarrolladores y un amplio soporte de la industria que se ha convertido en el estándar de facto para el desarrollo de IA. Incluso si los chips de la competencia pueden ofrecer una potencia de procesamiento bruta comparable, los kernels CUDA optimizados de Nvidia para el aprendizaje profundo garantizan tasas de utilización superiores, lo que convierte a sus GPU en la opción preferida para el entrenamiento de modelos de IA a gran escala. La sinergia integrada de hardware y software, ejemplificada por tecnologías como NVLink, consolida aún más el bastión de Nvidia, haciendo increíblemente difícil para el hardware alternativo competir eficazmente sin una pila de software igualmente madura y ampliamente adoptada.

Los desafíos que enfrenta DeepSeek subrayan las implicaciones más amplias de la actual “guerra de chips” entre EE. UU. y China. Si bien los controles de exportación de EE. UU. tienen como objetivo frenar el acceso de China a la tecnología de IA de vanguardia, también han impulsado inadvertidamente el impulso de China hacia la innovación indígena y la autosuficiencia en su sector de semiconductores. Sin embargo, la brecha de rendimiento persiste, con empresas chinas, incluidos gigantes tecnológicos como ByteDance, Tencent y Alibaba, que todavía dependen en gran medida de los chips H20 de Nvidia para su entrenamiento avanzado de modelos de IA. El escenario actual ilustra vívidamente que, a pesar de una inversión gubernamental significativa y presión política, cerrar esta brecha tecnológica, particularmente en el complejo ámbito del entrenamiento de chips de IA y su ecosistema de software acompañante, es un esfuerzo de varios años. El retraso en el lanzamiento de R2 de DeepSeek sirve como un crudo recordatorio del intrincado equilibrio entre las aspiraciones geopolíticas y las realidades prácticas del desarrollo tecnológico avanzado en el mundo en rápida evolución de la inteligencia artificial.