Deep Cogito v2: IA de Código Abierto Perfecciona el Razonamiento y Aumenta la Eficiencia

Artificialintelligence

Deep Cogito ha anunciado el lanzamiento de Cogito v2, una nueva colección de modelos de IA de código abierto diseñados para mejorar sus propias capacidades de razonamiento. La línea de modelos, disponible bajo una licencia de código abierto, presenta cuatro modelos de IA de razonamiento híbrido: dos versiones de tamaño mediano con 70 mil millones y 109 mil millones de parámetros, y dos modelos más grandes con 405 mil millones y 671 mil millones de parámetros.

El más grande de ellos, un modelo de Mezcla de Expertos (MoE) de 671 mil millones de parámetros, ya está siendo reconocido como una de las IA de código abierto más potentes disponibles actualmente. Deep Cogito afirma que este modelo insignia compite eficazmente con las últimas ofertas de DeepSeek y está reduciendo la brecha de rendimiento con sistemas propietarios avanzados como O3 y Claude 4 Opus.

Sin embargo, el avance significativo en Cogito v2 no radica meramente en su tamaño o potencia bruta, sino en un cambio fundamental en cómo aprende la IA. En lugar de simplemente extender su tiempo de “pensamiento” durante la inferencia para encontrar una respuesta, Cogito v2 está diseñado para internalizar sus propios procesos de razonamiento.

Este razonamiento internalizado se logra a través de una técnica llamada Destilación y Amplificación Iteradas (IDA). IDA funciona destilando los descubrimientos realizados durante un proceso de búsqueda de vuelta a los parámetros centrales del modelo. El objetivo es cultivar una “intuición” más fuerte, permitiendo que el modelo anticipe el resultado de su propio razonamiento sin necesidad de ejecutar toda la secuencia de búsqueda.

Este “sentido intuitivo” refinado para el enfoque correcto permite a los modelos de IA de código abierto generar cadenas de razonamiento que, según se informa, son un 60% más cortas que las de competidores como DeepSeek R1, mejorando significativamente la eficiencia.

Esta eficiencia también se extiende a los costos de desarrollo. Deep Cogito afirma que el gasto total combinado para desarrollar todos sus modelos, desde los experimentos iniciales hasta el entrenamiento final, fue de menos de 3.5 millones de dólares. Si bien es una suma considerable, esta cifra es notablemente modesta en comparación con las vastas inversiones que suelen realizar muchos laboratorios de investigación de IA líderes.

El modelo insignia de 671 mil millones de parámetros recibió una atención particular durante su entrenamiento. Su desarrollo se centró no solo en mejorar la precisión de sus respuestas finales, sino también en refinar el proceso de pensamiento en sí. Este enfoque alienta al modelo a seguir un camino más directo hacia una solución, desalentando el razonamiento “errático” o ineficiente. Los datos de rendimiento indican la efectividad de este método, con la IA de código abierto de Deep Cogito igualando o superando las últimas versiones de DeepSeek en los puntos de referencia clave, al tiempo que se desempeña de manera similar a las alternativas propietarias.

Uno de los resultados más sorprendentes de este desarrollo es la capacidad emergente de los modelos para razonar sobre imágenes, una habilidad para la que nunca fueron entrenados explícitamente. El equipo de Deep Cogito proporcionó un ejemplo donde su modelo de IA de código abierto comparó dos imágenes, una de un pato y otra de un león. Demostró un profundo proceso de razonamiento con respecto a sus hábitats, colores y composición, puramente a través del aprendizaje por transferencia. Deep Cogito cree que esta propiedad inesperada podría ofrecer un método poderoso para iniciar la capacitación de datos para futuros sistemas de razonamiento multimodal.

De cara al futuro, el equipo de Deep Cogito planea seguir construyendo sobre los avances logrados con la auto-mejora iterativa en su búsqueda continua de la superinteligencia. Han reiterado su compromiso de que todos los modelos de IA que creen seguirán siendo de código abierto.