Google Lanza Gemini Deep Think: La IA Multiactiva para Razonamiento Avanzado

Techcrunch

Google DeepMind ha comenzado el despliegue de Gemini 2.5 Deep Think, un modelo de razonamiento de IA avanzado diseñado para mejorar la resolución de problemas explorando y evaluando múltiples ideas simultáneamente. Esta nueva capacidad, que luego selecciona la respuesta óptima de estas exploraciones, ahora es accesible para los suscriptores de la suscripción Ultra de Google de $250 al mes dentro de la aplicación Gemini, a partir de este viernes.

Presentado por primera vez en Google I/O 2025 en mayo, Gemini 2.5 Deep Think marca el primer modelo multiagente disponible públicamente de Google. Estos sistemas operan desplegando múltiples agentes de IA que abordan una única pregunta en paralelo. Si bien este método demanda significativamente más recursos computacionales que un enfoque de agente único, generalmente produce respuestas más precisas y completas.

Una variante de Gemini 2.5 Deep Think obtuvo notablemente una medalla de oro en la Olimpiada Internacional de Matemáticas (OMI) de este año. Junto con el lanzamiento público de Gemini 2.5 Deep Think, Google está poniendo el modelo específico ganador de la OMI a disposición de un grupo selecto de matemáticos y académicos. La compañía señala que este modelo de IA especializado requiere horas, en lugar de segundos o minutos, para completar sus procesos de razonamiento, a diferencia de la mayoría de las IA orientadas al consumidor. Google espera que esto fomente la investigación y proporcione retroalimentación para refinar los sistemas multiagente para aplicaciones académicas.

Google afirma que Gemini 2.5 Deep Think representa una mejora sustancial con respecto a la versión previsualizada en I/O. La compañía también destaca el desarrollo de “nuevas técnicas de aprendizaje por refuerzo” para optimizar la utilización de las rutas de razonamiento del modelo. En una publicación de blog, Google declaró que “Deep Think puede ayudar a las personas a abordar problemas que requieren creatividad, planificación estratégica y mejoras paso a paso”.

En el Examen Final de la Humanidad (HLE), una prueba rigurosa que evalúa la competencia de la IA en miles de preguntas colaborativas en matemáticas, humanidades y ciencia, Gemini 2.5 Deep Think logró una puntuación del 34.8% sin la ayuda de herramientas externas. Este rendimiento supera a Grok 4 de xAI, que obtuvo un 25.4%, y a o3 de OpenAI, con un 20.3%. Además, el modelo de Google superó a sus competidores en LiveCodeBench 6, un desafiante punto de referencia para tareas de codificación competitiva, con una puntuación del 87.6% en comparación con el 79% de Grok 4 y el 72% de o3 de OpenAI.

Gemini 2.5 Deep Think se integra perfectamente con herramientas como la ejecución de código y la Búsqueda de Google, y es capaz de generar “respuestas mucho más largas” que los modelos de IA convencionales. Las pruebas internas de Google indican que el modelo produce resultados más detallados y estéticamente refinados para tareas de desarrollo web en comparación con otros sistemas de IA, lo que podría ayudar a los investigadores y acelerar los procesos de descubrimiento.

La adopción de sistemas multiagente parece ser una tendencia creciente entre los principales laboratorios de IA. Grok 4 Heavy de Elon Musk, su propio sistema multiagente, fue lanzado recientemente por xAI y afirma un rendimiento líder en la industria en varios puntos de referencia. De manera similar, el modelo de IA no lanzado de OpenAI, que también obtuvo una medalla de oro en la Olimpiada Internacional de Matemáticas de este año, es, según se informa, un sistema multiagente. El agente de investigación de Anthropic, conocido por generar informes de investigación completos, también está impulsado por una arquitectura multiagente.

A pesar de sus sólidas capacidades de rendimiento, los sistemas multiagente son considerablemente más intensivos en computación y, en consecuencia, más caros de operar que los modelos de IA tradicionales. Esta realidad económica sugiere que las empresas tecnológicas pueden seguir reservando estos sistemas avanzados para sus niveles de suscripción premium, una estrategia ahora empleada tanto por xAI como por Google.

En las próximas semanas, Google planea extender el acceso a Gemini 2.5 Deep Think a un grupo selecto de probadores a través de la API de Gemini, con el objetivo de obtener información sobre cómo los desarrolladores y las empresas podrían aprovechar su sistema multiagente.

Google Lanza Gemini Deep Think: La IA Multiactiva para Razonamiento Avanzado - OmegaNext Noticias IA