Google lanza Gemini 2.5 Deep Think AI: ¿Una versión 'bronce' con capacidades de oro?

Venturebeat

Google ha lanzado oficialmente Gemini 2.5 Deep Think, una nueva iteración de su modelo de IA diseñado para mejorar el razonamiento y la resolución de problemas complejos. Este lanzamiento público se produce después de que una versión avanzada del modelo acaparara titulares el mes pasado por lograr una medalla de oro en la Olimpiada Internacional de Matemáticas (IMO), un hito para una IA. Sin embargo, la versión ahora accesible al público no es el modelo idéntico ganador de la medalla de oro.

Según la publicación del blog de Google y Logan Kilpatrick, Líder de Producto de Google AI Studio, el modelo lanzado públicamente es una “versión ‘bronce’ menos potente”. Kilpatrick aclaró en redes sociales que esta variante es “más rápida y optimizada para el uso diario”, mientras que el modelo completo de oro de la IMO se está proporcionando a un grupo selecto de matemáticos para probar sus capacidades más a fondo.

Comprendiendo las Capacidades de Gemini 2.5 Deep Think

Construido sobre la familia de modelos de lenguaje grandes (LLMs) Gemini, Deep Think introduce nuevas capacidades para abordar problemas sofisticados. Emplea técnicas de “pensamiento paralelo” para explorar múltiples ideas simultáneamente y utiliza el aprendizaje por refuerzo para fortalecer su capacidad de resolución de problemas paso a paso con el tiempo.

El modelo está diseñado para casos de uso que se benefician de una deliberación extendida, como probar conjeturas matemáticas, realizar investigación científica, diseñar algoritmos y refinar tareas creativas como código y diseño. Los primeros probadores, incluido el matemático Michel van Garrel, lo han utilizado para investigar problemas no resueltos y generar posibles pruebas. Ethan Mollick, profesor de la Wharton School of Business y experto en IA, señaló en redes sociales que Deep Think fue el primer modelo en generar con éxito un gráfico 3D en respuesta a una compleja instrucción que él utiliza para probar las capacidades de la IA, demostrando sus avanzadas habilidades interpretativas y creativas.

Rendimiento y Puntos de Referencia

Deep Think exhibe un sólido rendimiento en varias áreas clave de aplicación:

  • Matemáticas y Ciencia: Puede simular el razonamiento para pruebas complejas, explorar conjeturas e interpretar literatura científica densa.

  • Codificación y Diseño de Algoritmos: El modelo funciona bien en tareas que implican compensaciones de rendimiento, complejidad temporal y lógica de varios pasos.

  • Desarrollo Creativo: En escenarios de diseño como el arte de vóxeles o la construcción de interfaces de usuario, Deep Think demuestra una mejora iterativa y una mejora de detalles mejoradas.

El modelo lidera en las evaluaciones de referencia, incluyendo LiveCodeBench V6 (para la capacidad de codificación) y Humanity’s Last Exam (que cubre matemáticas, ciencia y razonamiento). Superó significativamente a Gemini 2.5 Pro y a modelos competidores como GPT-4 de OpenAI y Grok 4 de xAI por márgenes de dos dígitos en categorías como Razonamiento y Conocimiento, Generación de Código y Matemáticas IMO 2025.

Deep Think vs. Gemini 2.5 Pro: Una Comparación

Si bien tanto Deep Think como Gemini 2.5 Pro forman parte de la familia de modelos Gemini 2.5, Google posiciona a Deep Think como una variante más capaz y analíticamente hábil, particularmente para el razonamiento complejo y la resolución de problemas de varios pasos. Esta mejora se debe al uso de técnicas de pensamiento paralelo y aprendizaje por refuerzo, que permiten al modelo simular una deliberación cognitiva más profunda.

Google afirma que Deep Think es mejor para manejar instrucciones matizadas, explorar múltiples hipótesis y producir resultados más refinados. Esto se respalda con comparaciones lado a lado en tareas como la generación de arte de vóxeles, donde Deep Think añade más textura, fidelidad estructural y diversidad compositiva que 2.5 Pro.

Aunque Deep Think supera a Gemini 2.5 Pro en múltiples puntos de referencia técnicos relacionados con el razonamiento y la generación de código, estas ganancias conllevan compensaciones. Deep Think es más lento, requiere un “tiempo de pensamiento” extendido, y exhibe una tasa de rechazo más alta para instrucciones benignas, un área que Google está investigando activamente. En contraste, 2.5 Pro sigue siendo más adecuado para usuarios que priorizan la velocidad y la capacidad de respuesta, especialmente para tareas más ligeras y de propósito general. Esta diferenciación permite a los usuarios elegir según sus prioridades: 2.5 Pro para velocidad y fluidez, o Deep Think para rigor y reflexión.

El Logro de la Medalla de Oro en la IMO

En julio, una versión más avanzada del modelo Gemini Deep Think logró el estatus oficial de medalla de oro en la IMO 2025, la competición de matemáticas más prestigiosa del mundo para estudiantes de secundaria. Este sistema resolvió cinco de los seis problemas desafiantes, convirtiéndose en la primera IA en recibir una puntuación de nivel oro de la IMO. Demis Hassabis, CEO de Google DeepMind, anunció el logro, afirmando que el modelo había resuelto problemas de principio a fin en lenguaje natural, sin necesidad de traducción a una sintaxis de programación formal. La junta de la IMO confirmó que el modelo obtuvo 35 de un total posible de 42 puntos, muy por encima del umbral de oro. El presidente de la competición, Gregor Dolinar, describió las soluciones de Deep Think como claras, precisas y, en muchos casos, más fáciles de seguir que las de los competidores humanos. Es importante reiterar que Gemini 2.5 Deep Think lanzado al público es una versión más rápida y de menor rendimiento, no el modelo exacto de la competición.

Acceso a Gemini 2.5 Deep Think

Actualmente, Gemini 2.5 Deep Think está disponible exclusivamente en la aplicación móvil Google Gemini para iOS y Android para los usuarios suscritos al plan Google AI Ultra. Este plan, parte de la línea de suscripciones de Google One, cuesta 249,99 $ al mes, con una oferta promocional de 124,99 $ al mes durante los primeros tres meses para nuevos suscriptores. El plan AI Ultra incluye 30 TB de almacenamiento, acceso a la aplicación Gemini con Deep Think y Veo 3, así como herramientas como Flow y Whisk, y 12.500 créditos de IA mensuales. Los suscriptores pueden activar Deep Think dentro de la aplicación Gemini seleccionando el modelo 2.5 Pro y activando la opción “Deep Think”. Soporta un número fijo de instrucciones por día y está integrado con capacidades como la ejecución de código y la Búsqueda de Google, generando resultados más largos y detallados en comparación con las versiones estándar. El plan Google AI Pro de nivel inferior, con un precio de 19,99 $/mes, y el servicio gratuito Gemini AI no incluyen acceso a Deep Think. Deep Think también estará disponible para “probadores de confianza” a través de la interfaz de programación de aplicaciones (API) de Gemini en las próximas semanas.

Importancia para los Tomadores de Decisiones Técnicas Empresariales

El lanzamiento de Gemini 2.5 Deep Think representa la aplicación práctica de un hito de investigación importante. Aunque actualmente es accesible a través de cuentas de usuario individuales, ofrece a las empresas y organizaciones un vistazo a las capacidades de un modelo de IA que ha logrado una medalla en la Olimpiada de Matemáticas. Para los investigadores que reciben el modelo completo de grado IMO, ofrece una visión del futuro de la IA colaborativa en matemáticas. Para los suscriptores de AI Ultra, Deep Think proporciona un paso poderoso hacia una asistencia de IA más capaz y consciente del contexto, ahora ejecutándose en dispositivos móviles.

Google lanza Gemini 2.5 Deep Think AI: ¿Una versión 'bronce' con capacidades de oro? - OmegaNext Noticias IA