DeepSeek abandona chips Huawei por Nvidia para entrenar IA R2 tras fallos técnicos

Artificialintelligence

El ambicioso plan de DeepSeek de entrenar su nuevo modelo de inteligencia artificial, R2, en los chips Ascend de Huawei ha fracasado, obligando a la firma china de IA a volver a la tecnología de Nvidia y retrasando el lanzamiento del modelo. Este revés subraya las inquebrantables realidades técnicas que pueden desafiar el impulso de Beijing hacia la autosuficiencia tecnológica.

Tras el exitoso lanzamiento de su modelo R1 en enero, DeepSeek se encontró bajo una considerable presión para defender la causa nacional adoptando hardware doméstico. Según tres personas con conocimiento directo de la situación, que hablaron con el Financial Times, la directriz era inequívoca: priorizar los chips de Huawei sobre los de Nvidia.

Sin embargo, cuando DeepSeek comenzó el entrenamiento real de su nuevo modelo R2, la compañía supuestamente encontró “problemas técnicos persistentes” con los chips de IA de Huawei. Estos problemas resultaron ser tan fundamentales que el proyecto se detuvo. Una fuente familiarizada con la situación indicó que estos desafíos insuperables fueron la razón principal para desechar el lanzamiento del modelo planeado para mayo, dejando a DeepSeek en desventaja en un mercado en rápida evolución.

Para comprender la importancia de este obstáculo, es crucial distinguir entre el entrenamiento y la inferencia de IA. El entrenamiento es la fase profundamente exigente, similar a años de aprendizaje intensivo a nivel universitario, que requiere una inmensa potencia computacional y una estabilidad inquebrantable. La inferencia, por el contrario, es la tarea comparativamente menos extenuante, como hacer una pregunta a un graduado: implica aplicar un modelo entrenado a nuevos datos. DeepSeek descubrió que, si bien los chips de Huawei podrían ser adecuados para el examen final (inferencia), aún no eran capaces de manejar las rigurosas demandas del curso universitario (entrenamiento). En consecuencia, la compañía no tuvo más remedio que volver a los sistemas más robustos de Nvidia para la etapa crítica de entrenamiento. Las fuentes indican que el equipo de DeepSeek todavía está intentando optimizar el modelo R2 para la etapa de inferencia menos exigente utilizando chips de Huawei.

La gravedad del problema fue subrayada por la intervención directa de Huawei. Dos fuentes confirmaron que Huawei envió a su propio equipo de ingenieros a las oficinas de DeepSeek para ayudar a que el modelo R2 funcionara con sus chips. Sin embargo, incluso con estos recursos expertos in situ, una ejecución de entrenamiento exitosa siguió siendo esquiva.

Los observadores de la industria reconocen ampliamente que este resultado no es del todo sorprendente. A principios de este año, el propio CEO de Huawei, Ren Zhengfei, admitió que EE. UU. había “exagerado los logros de Huawei” y que la compañía “aún no es tan grande”, admitiendo que sus mejores chips todavía están una generación por detrás de las alternativas de vanguardia.

A pesar de estas limitaciones técnicas, Beijing sigue animando activamente a sus gigantes tecnológicos a favorecer el hardware local. El Financial Times ha informado que las empresas chinas ahora están obligadas a justificar los pedidos del chip H20 de Nvidia, que cumple con las exportaciones y es una variante menos potente aprobada para la venta en China. Esta estrategia tiene como objetivo cultivar campeones nacionales, pero puede forzar inadvertidamente a las empresas a tomar decisiones técnicamente subóptimas, lo que podría obstaculizar su competitividad global.

Más allá de los desafíos planteados por los chips de Huawei, el fundador de DeepSeek, Liang Wenfeng, ha expresado supuestamente su insatisfacción con el progreso general del modelo R2, instando a su equipo a apuntar más alto y desarrollar un producto que pueda asegurar la posición de la compañía entre los líderes de la industria de la IA.

En última instancia, la experiencia de DeepSeek sirve como un potente recordatorio de que, en la carrera global por la supremacía de la IA, los principios de ingeniería y las realidades del rendimiento a menudo superan las directivas de arriba hacia abajo y el orgullo nacional. Si bien China juega a largo plazo en su búsqueda de la independencia tecnológica, en el futuro previsible, la corona del rendimiento en hardware de IA sigue firmemente en manos de Nvidia.