OpenAI admite fallos en GPT-5 y devuelve GPT-4o a usuarios

Venturebeat

Sam Altman, cofundador y CEO de OpenAI, ha reconocido públicamente desafíos significativos tras el reciente lanzamiento de GPT-5, el nuevo modelo de lenguaje grande (LLM) insignia de la compañía. Anunciado como el modelo más potente y capaz de OpenAI hasta la fecha, su lanzamiento se ha visto empañado por una serie de problemas, incluyendo cambios de modelo defectuosos, rendimiento inconsistente y una confusión generalizada entre los usuarios. Estos problemas han llevado a OpenAI a revertir parcialmente algunos cambios en la plataforma, destacando la reinstauración del acceso de los usuarios a modelos anteriores como GPT-4o.

En un intercambio franco con usuarios en Reddit y X (anteriormente Twitter), Altman admitió que el lanzamiento fue “un poco más accidentado de lo que esperábamos”. Atribuyó los errores en los gráficos de rendimiento mostrados durante la transmisión en vivo de GPT-5 de OpenAI a errores humanos, señalando que “la gente trabajaba hasta tarde y estaba muy cansada”. Aunque la publicación del blog y la tarjeta del sistema que la acompañaban eran precisas, estos errores complicaron aún más un lanzamiento que ya estaba bajo escrutinio por parte de los primeros adoptantes y desarrolladores. Desde entonces, OpenAI ha duplicado los límites de tasa de GPT-5 para los usuarios de ChatGPT Plus y seguirá permitiendo a los usuarios Plus optar por GPT-4o, monitoreando el uso mientras considera cuánto tiempo apoyar los modelos heredados.

Según Altman, una causa principal de la interrupción fue un mal funcionamiento en el nuevo “router” automático de OpenAI. Este sistema está diseñado para asignar las solicitudes de los usuarios a una de las cuatro variantes de GPT-5 —regular, mini, nano y pro— con un modo opcional de “pensamiento” para tareas de razonamiento más complejas. Altman reveló que un componente crucial de este sistema, el “autoswitcher”, estuvo “fuera de servicio durante una parte del día”, lo que hizo que GPT-5 pareciera “mucho más tonto” de lo previsto. En respuesta, OpenAI planea ajustar el límite de decisión del modelo para un mejor rendimiento y mejorará la transparencia indicando qué modelo está respondiendo a una consulta determinada. Una actualización de la interfaz de usuario también está en camino para facilitar la activación manual del modo de pensamiento.

A pesar de que los puntos de referencia internos de OpenAI sugieren que GPT-5 lidera el paquete de modelos de lenguaje grandes, las experiencias de los usuarios en el mundo real han pintado un panorama diferente. Desde el lanzamiento, numerosos usuarios han compartido ejemplos de GPT-5 cometiendo errores fundamentales en matemáticas, lógica y tareas de codificación. Por ejemplo, el científico de datos Colin Fraser publicó capturas de pantalla que ilustran que GPT-5 determinó incorrectamente que 8.888 periódico es igual a 9, mientras que otro usuario destacó su fracaso en un problema de álgebra simple. Los desarrolladores también han expresado su decepción, con algunos informando que GPT-5 tuvo un rendimiento peor que el nuevo Claude Opus 4.1 del laboratorio de IA rival Anthropic en tareas de programación “one-shot”, que requieren completar una tarea con precisión a partir de una sola solicitud. Además, la firma de seguridad SPLX identificó que GPT-5 sigue siendo vulnerable a la inyección de prompts y a los ataques de lógica ofuscada a menos que su capa de seguridad se refuerce significativamente.

Con ChatGPT sirviendo a 700 millones de usuarios semanales, OpenAI mantiene su posición como el actor más grande en IA generativa por audiencia. Sin embargo, esta inmensa escala ha traído considerables problemas de crecimiento. Altman señaló que el tráfico de la API se duplicó en las 24 horas posteriores al lanzamiento de GPT-5, lo que contribuyó a la inestabilidad de la plataforma. Si bien OpenAI busca mitigar esto duplicando los límites de tasa para los usuarios de ChatGPT Plus y ajustando continuamente su infraestructura en función de los comentarios, estos errores iniciales —agravados por cambios confusos en la experiencia del usuario y errores de lanzamiento de alto perfil— han creado una oportunidad para que los competidores ganen terreno. La presión está aumentando para que OpenAI demuestre que GPT-5 representa un salto sustancial hacia adelante, no solo una actualización incremental. Basado en el lanzamiento inicial, muchos usuarios siguen sin estar convencidos.