DeepSeek V3.1: La potente IA de código abierto que desafía a OpenAI

Venturebeat

El panorama de la inteligencia artificial está experimentando una significativa conmoción con el reciente lanzamiento de DeepSeek V3.1, un colosal modelo de IA de código abierto de 685 mil millones de parámetros de DeepSeek, una empresa china. Lanzado el 19 de agosto de 2025, esta nueva iteración está lista para intensificar la competencia global en IA generativa, desafiando directamente a actores establecidos como OpenAI y Anthropic al ofrecer un rendimiento innovador y tecnología accesible.

DeepSeek V3.1 llega con una serie de mejoras diseñadas para superar los límites de los grandes modelos de lenguaje. Una característica destacada es su ventana de contexto expandida, capaz de procesar hasta 128,000 tokens, lo que se traduce en aproximadamente 96,000 palabras, el equivalente a dos novelas en inglés de 200 páginas. Esta capacidad sustancial permite al modelo manejar mayores volúmenes de información, mantener conversaciones más extensas y coherentes, y ofrecer respuestas más matizadas al retener una mayor comprensión contextual. Además, DeepSeek afirma avances significativos en las capacidades de razonamiento, con pruebas que muestran hasta un 43% de mejora en el razonamiento de múltiples pasos en comparación con su predecesor, aunque algunas evaluaciones sugieren desafíos continuos con dilemas altamente abstractos o éticos. El modelo también cuenta con un soporte multilingüe superior, dominando más de 100 idiomas con una precisión casi nativa, y una reducción reportada del 38% en las alucinaciones, mejorando su fiabilidad fáctica.

El lanzamiento de DeepSeek V3.1 bajo la permisiva licencia MIT en Hugging Face subraya su compromiso con la filosofía de código abierto, haciéndolo de libre acceso para descarga y uso. Este enfoque se alinea con la estrategia más amplia de China para fomentar la adopción global de sus tecnologías de IA, priorizando la accesibilidad generalizada sobre los beneficios propietarios inmediatos. La compañía ha demostrado previamente su capacidad para desarrollar IA avanzada a una fracción del costo de sus contrapartes occidentales; por ejemplo, se informó que su modelo V3 fue entrenado por solo US$6 millones, un marcado contraste con los US$100 millones estimados gastados en GPT-4 de OpenAI en 2023. Esta eficiencia de costos, lograda con significativamente menos poder computacional, posiciona a DeepSeek como un formidable disruptor en la industria de la IA.

En cuanto a los puntos de referencia de rendimiento, DeepSeek V3.1 exhibe una ventaja competitiva en varias áreas cruciales. Ha mostrado resultados sólidos en la comprensión general del lenguaje (MMLU), donde su iteración V3 obtuvo un 88.5%, superando ligeramente a GPT-4o de OpenAI. En tareas de codificación, particularmente en el punto de referencia HumanEval, DeepSeek V3 superó tanto a Claude 3.5 Sonnet como a GPT-4o. Sin embargo, en tareas de ingeniería de software más complejas (SWE-bench Verified) y ciertos desafíos matemáticos, DeepSeek V3.1 aún se queda atrás de los principales modelos propietarios, lo que indica áreas para futuras mejoras.

DeepSeek, fundada en julio de 2023 por Liang Wenfeng y financiada por el fondo de cobertura chino High-Flyer, ha ascendido rápidamente como un actor clave en el dominio de la IA. La compañía ganó atención internacional a principios de este año cuando su chatbot DeepSeek-R1 se convirtió brevemente en la aplicación gratuita más descargada en la tienda de iPhone de Apple en EE. UU., incluso superando a ChatGPT. Este rápido ascenso no ha estado exento de escrutinio; senadores estadounidenses han expresado preocupaciones con respecto a posibles vulnerabilidades de seguridad de datos y el riesgo de que los modelos de IA de código abierto chinos sean explotados por el ejército de China. DeepSeek y sus socios en la nube, incluidos AWS, Microsoft Azure y Google Cloud, han abordado algunas de estas preocupaciones asegurando que los modelos como R1 alojados en sus plataformas estén localizados, evitando que los datos se envíen a China. Mientras la comunidad de IA espera ansiosamente el lanzamiento de la próxima iteración principal de DeepSeek, R2, la última oferta de la compañía consolida su posición como una fuerza poderosa y rentable en el panorama en evolución de la inteligencia artificial abierta.