Gemini de Google se Potencia con "Deep Think", Crece la Preocupación por la Seguridad
Google ha presentado “Deep Think”, una mejora significativa de su modelo de IA Gemini, diseñada para abordar problemas complejos al permitir a la inteligencia artificial un mayor “tiempo de pensamiento”. La nueva función ya está disponible para los suscriptores de Google AI Ultra dentro de la aplicación Gemini. Google afirma que este lanzamiento, que incorpora tanto los comentarios de los evaluadores como la investigación reciente, representa un claro avance con respecto a la versión mostrada en el I/O a principios de este año.
“Deep Think” se puede activar dentro de la aplicación, aunque su uso está sujeto a un límite diario de solicitudes. Está diseñado para aprovechar automáticamente herramientas como la ejecución de código y la Búsqueda de Google, lo que le permite producir respuestas considerablemente más largas y detalladas que las iteraciones anteriores.
El núcleo de la capacidad mejorada de “Deep Think” reside en lo que Google describe como técnicas de “pensamiento paralelo”. Este enfoque busca emular cómo los humanos abordan problemas difíciles: generando, evaluando y combinando simultáneamente múltiples ideas para llegar a la solución óptima. Para facilitar esto, al modelo se le asigna un “tiempo de inferencia” adicional, esencialmente más tiempo de procesamiento, antes de que entregue su respuesta. Si bien han existido métodos experimentales similares como “Self Consistency” y “Tree-of-Thought”, “Deep Think” integra nuevas técnicas de aprendizaje por refuerzo para asegurar que estas rutas de razonamiento expandidas se utilicen productivamente, con el objetivo de mejorar su destreza en la resolución de problemas con el tiempo. El modelo subyacente Gemini 2.5 utiliza una arquitectura de Mezcla Escasa de Expertos (Sparse Mixture-of-Experts, MoE) y soporta una ventana de contexto sustancial de hasta un millón de tokens para la entrada y 192,000 tokens para la salida.
Google destaca la fuerza particular de “Deep Think” en tareas que exigen creatividad y planificación estratégica. Esto incluye la mejora iterativa del diseño web, el apoyo a la investigación científica y matemática avanzada, y la resolución de complejos desafíos de programación. En las pruebas de referencia, Gemini 2.5 “Deep Think” ha demostrado un rendimiento robusto, obteniendo un 87.6% en LiveCodeBench V6 para la generación de código y un 34.8% en “Humanity’s Last Exam” para el conocimiento y el razonamiento lógico. Según se informa, estos resultados superan a rivales como OpenAI o3 y Grok 4 en escenarios donde no se utilizan herramientas externas.
En particular, esta versión pública es una modificación del modelo de IA que logró una medalla de oro en la Olimpiada Internacional de Matemáticas (IMO). Mientras que la variante ganadora de la IMO requirió horas para resolver sus problemas, la versión pública está optimizada para la velocidad y el uso diario, logrando aún así un rendimiento de medalla de bronce en el benchmark de la IMO de 2025. El modelo completo, de nivel oro, sigue estando exclusivamente disponible para un grupo selecto de matemáticos e investigadores.
Sin embargo, este salto en capacidad también trae nuevas consideraciones de seguridad, como reconoce Google. Una revisión de seguridad exhaustiva, realizada bajo el “Marco de Seguridad Fronterizo” (Frontier Safety Framework, FSF) debido a “diferencias excepcionales” con modelos anteriores, reveló que “Deep Think” ha cruzado un umbral crítico en ciertas áreas de riesgo. Específicamente, dentro de los dominios Químico, Biológico, Radiológico y Nuclear (CBRN), el modelo ha alcanzado el “umbral de alerta temprana” para el “Nivel de Elevación 1” (Uplift Level 1). Esto indica que la IA podría potencialmente proporcionar suficiente conocimiento técnico para ayudar significativamente a individuos o grupos con pocos recursos a desarrollar armas de destrucción masiva. Google continúa evaluando estos riesgos y ya ha implementado medidas de precaución.
“Deep Think” también cumple con el mismo umbral de alerta temprana para ciberseguridad que se identificó previamente con Gemini 2.5 Pro. Si bien su rendimiento en tareas de ciberseguridad ha mejorado, sigue enfrentando desafíos en los escenarios del mundo real más exigentes.
En respuesta a estos hallazgos, Google afirma haber implementado múltiples capas de salvaguardias. Estas medidas incluyen el filtrado de salidas peligrosas, la monitorización multinivel, el bloqueo de cuentas abusivas y los ejercicios continuos de “red-teaming” para probar rigurosamente sus sistemas de protección.