Gigantes de la IA lanzan nuevos modelos: OpenAI, Anthropic y Google actualizan

Lastweekin

El panorama de la inteligencia artificial fue testigo de una ráfaga de importantes avances la semana pasada, ya que los titanes de la industria OpenAI, Anthropic y Google revelaron mejoras significativas en sus modelos fundamentales, expandiendo los límites de las capacidades de razonamiento, codificación y resolución de problemas de la IA. Estos lanzamientos subrayan el ritmo acelerado de la innovación y la intensa competencia al frente de la carrera de la IA.

OpenAI regresó notablemente a sus “principios de código abierto” con el lanzamiento de dos nuevos modelos de razonamiento de “peso abierto”, gpt-oss-120b y gpt-oss-20b, el 5 de agosto de 2025. Aunque no son completamente de código abierto, ya que los datos de entrenamiento siguen siendo propietarios, estos modelos ofrecen parámetros de acceso público, lo que permite a los desarrolladores personalizarlos y desplegarlos en su propia infraestructura. El gpt-oss-120b más grande, con 117 mil millones de parámetros, está diseñado para tareas de alto rendimiento y puede ejecutarse eficientemente en una sola GPU de 80 GB, logrando casi la paridad con el o4-mini propietario de OpenAI en los puntos de referencia de razonamiento principales. El gpt-oss-20b más compacto, con 21 mil millones de parámetros, está optimizado para dispositivos de borde y computadoras personales con solo 16 GB de memoria, ofreciendo un rendimiento comparable al o3-mini. Ambos modelos, lanzados bajo la licencia Apache 2.0, sobresalen en razonamiento avanzado, codificación, matemáticas competitivas y consultas relacionadas con la salud, apoyando aún más el uso de herramientas y el esfuerzo de razonamiento ajustable. Su arquitectura de Mezcla de Expertos (MoE) contribuye a una inferencia rápida y rentable, convirtiéndolos en herramientas versátiles para investigación, desarrollo y aplicaciones empresariales.

Mientras tanto, Anthropic presentó Claude Opus 4.1 el 5 de agosto de 2025, una actualización incremental pero impactante de su modelo insignia Claude Opus 4. Esta nueva iteración mejora significativamente el rendimiento de codificación, logrando un impresionante 74.5% en el punto de referencia SWE-bench Verified, un aumento del 72.5% de Opus 4. Opus 4.1 también cuenta con capacidades avanzadas de razonamiento y agente, demostrando ser experto en investigación en profundidad, análisis de datos y en abordar problemas complejos de múltiples pasos con mayor precisión. Su capacidad para manejar tareas de largo alcance y sintetizar información de vastos conjuntos de datos lo posiciona como un poderoso colaborador virtual para la toma de decisiones estratégicas en diversos campos. El modelo está disponible para usuarios de pago de Claude y a través de la API de Anthropic, Amazon Bedrock y Google Cloud Vertex AI, manteniendo el mismo precio que su predecesor.

Para no quedarse atrás, Google lanzó Gemini 2.5 Deep Think AI, un modo de razonamiento avanzado para su modelo Gemini 2.5 Ultra, a partir del 1 de agosto de 2025. Deep Think introduce una innovadora arquitectura de “pensamiento paralelo”, que permite a Gemini generar y evaluar simultáneamente múltiples ideas, de manera muy similar a una lluvia de ideas humana. Este enfoque innovador proporciona a Gemini un “tiempo de pensamiento” extendido, lo que impulsa significativamente su capacidad para resolver problemas complejos que requieren creatividad, planificación estratégica, desarrollo iterativo y codificación avanzada. El modelo, una variación del cual logró un estándar de medalla de oro en la Olimpiada Matemática Internacional de 2025, ha demostrado un rendimiento superior frente a rivales como o3 de OpenAI y Grok 4 de xAI en puntos de referencia clave como Humanity’s Last Exam y LiveCodeBench V6. Actualmente, Gemini 2.5 Deep Think está disponible exclusivamente para suscriptores de Google AI Ultra, con planes de acceso más amplio a la API para probadores de confianza en un futuro próximo.

Estos lanzamientos simultáneos destacan un momento crucial en el desarrollo de la IA, con empresas líderes empujando los límites en razonamiento, eficiencia y accesibilidad. A medida que los modelos se vuelven más capaces y especializados, el enfoque se desplaza hacia el despliegue práctico y el delicado equilibrio entre la accesibilidad abierta y la ventaja propietaria. La evolución continua de estas potencias de la IA promete remodelar industrias y redefinir la interacción humano-computadora en los años venideros.