GPT-5 de OpenAI: Menos alucinaciones, avances incrementales
OpenAI ha presentado su modelo de inteligencia artificial más reciente y avanzado, GPT-5, marcando un paso significativo en la ambiciosa visión de la compañía para la IA. Sam Altman, CEO, lo ha descrito como una conversación con un experto personal capaz de generar aplicaciones bajo demanda, y GPT-5 aspira a inaugurar una era definida por el “software bajo demanda”. El anuncio, realizado durante una extensa presentación llena de demostraciones de código, destacó las supuestas mejoras del modelo en dominios críticos como la codificación, la escritura, las matemáticas y la percepción visual, junto con una notable reducción de imprecisiones fácticas y resultados engañosos.
A diferencia de sus predecesores, GPT-5 no es un modelo monolítico único, sino un conjunto sofisticado. El sistema de OpenAI enruta inteligentemente las solicitudes de los usuarios a varios modelos subyacentes basándose en factores como la intención del usuario y la complejidad de la solicitud. Por ejemplo, las consultas directas podrían dirigirse a un modelo más pequeño y eficiente diseñado para respuestas rápidas y menos “reflexivas”, mientras que las tareas intrincadas o matizadas podrían activar un modelo más grande y de razonamiento más profundo. Este enrutamiento dinámico suele ser automático, aunque los usuarios de pago tendrán la opción de habilitar permanentemente la funcionalidad de razonamiento profundo. OpenAI afirma que este mecanismo de enrutamiento se perfecciona continuamente mediante nuevas señales de entrada, mejorando su capacidad para discernir el modelo óptimo para cada solicitud y cuándo activar un razonamiento más profundo. A pesar de esta arquitectura actual, la compañía planea finalmente consolidar estos componentes dispares en un modelo unificado.
Más allá de su estructura adaptativa, OpenAI asegura que este diseño aumenta significativamente la eficiencia. La compañía afirma que GPT-5 extrae mayor valor con menos esfuerzo computacional. En evaluaciones internas, GPT-5, al activar sus capacidades de razonamiento, supuestamente logra un rendimiento comparable al de su predecesor, OpenAI o3, mientras genera entre un 50 y un 80 por ciento menos de tokens de salida en diversas tareas, incluyendo razonamiento visual, codificación automatizada y resolución de problemas científicos de nivel de posgrado.
El acceso a GPT-5 varía según los niveles de usuario. Los suscriptores de ChatGPT Free y Plus obtendrán acceso al GPT-5 estándar y a una versión compacta “mini”. Los usuarios Pro y Enterprise se beneficiarán de una variante “Pro”, diseñada para un razonamiento extendido, mientras que aquellos que interactúen a través de la API tendrán acceso a una versión “Nano” rentable junto con los modelos estándar y mini.
A pesar de las grandes afirmaciones y las impresionantes demostraciones mostradas durante el lanzamiento, los resultados de los benchmarks publicados pintan un panorama más matizado, sugiriendo a menudo avances incrementales en lugar de revolucionarios. En el benchmark de matemáticas AIME 2025, por ejemplo, GPT-5 Pro superó al anterior modelo insignia o3 por solo 1.6 puntos al utilizar herramientas externas, y por 7.8 puntos sin ellas. Sin embargo, para los usuarios del nivel gratuito, la actualización de GPT-4o al GPT-5 estándar es sustancial, mostrando una ventaja de 57.5 puntos. Se observaron ganancias modestas similares en otros benchmarks de matemáticas. El rendimiento en desafíos académicos de alto nivel, como un cuestionario de ciencias de nivel de doctorado y el “Último Examen de la Humanidad”, también reveló mejoras de un solo dígito sobre los modelos de generación anterior. Donde GPT-5 realmente se distinguió fue en un benchmark para agentes conversacionales, demostrando un progreso significativo en su capacidad para usar herramientas y seguir instrucciones complejas. El presidente de OpenAI, Greg Brockman, reconoció el desafío de medir el progreso solo a través de benchmarks, señalando que “cuando te mueves entre el 98% y el 99% en algún benchmark, significa que necesitas algo más para realmente capturar lo grandioso que es el modelo.”
Quizás las mejoras más convincentes en GPT-5 residen en su fiabilidad mejorada, particularmente en la contención de la tendencia de los grandes modelos de lenguaje a “alucinar” o fabricar información. OpenAI informa que las respuestas de GPT-5 son aproximadamente un 45 por ciento menos propensas a errores fácticos que GPT-4o. Al activar sus capacidades de razonamiento, esta cifra salta a una impresionante reducción del 80 por ciento en imprecisiones fácticas en comparación con OpenAI o3. La compañía también ha implementado evaluaciones rigurosas para detectar y mitigar el comportamiento engañoso, donde los modelos podrían afirmar falsamente la finalización de tareas o expresar una confianza indebida en respuestas inciertas. En pruebas con datos de chat del mundo real, la tasa de respuestas engañosas disminuyó del 4.8 por ciento en o3 al 2.1 por ciento en las salidas de razonamiento de GPT-5.
En el frente crítico de la seguridad, OpenAI ha introducido nuevos protocolos para manejar consultas sensibles. En lugar de simplemente negarse a responder a solicitudes potencialmente dudosas —una limitación común que a menudo se elude con una ingeniosa ingeniería de prompts—, GPT-5 está diseñado para proporcionar la respuesta más completa posible mientras se adhiere a estrictos parámetros de seguridad. Por ejemplo, en lugar de rechazar directamente una pregunta sobre cómo encender un compuesto volátil, el modelo podría ofrecer orientación sobre dónde encontrar la información, acompañada de claras advertencias sobre los riesgos asociados.
Añadiendo un toque de personalización, OpenAI también está lanzando cuatro nuevas personalidades opcionales para su interfaz ChatGPT: Cínico, Robot, Oyente y Nerd. Estas personalidades, inicialmente limitadas al chat de texto con capacidades de voz planificadas para más adelante, permiten a los usuarios adaptar el estilo de comunicación de la IA a sus preferencias. Mark Chen, Director de Investigación de OpenAI, enfatizó que estas personalidades han sido cuidadosamente calibradas para evitar interacciones excesivamente halagadoras o serviles con los usuarios.
La familia de modelos GPT-5 ya es accesible a través de ChatGPT para usuarios gratuitos, Plus y Pro, con disponibilidad que se extenderá a usuarios empresariales y educativos en la próxima semana. El precio de las suscripciones a ChatGPT se mantiene constante, en $20 al mes para el nivel Plus y $200 al mes para el nivel Pro ilimitado. Los profesionales también conservan la opción de acceder a los modelos a través de la API de OpenAI.