GPT-5 de OpenAI: Lanzamiento empañado por 'error garrafal' en gráficos
Durante su esperado livestream de GPT-5 el jueves, OpenAI buscó impresionar a la audiencia con una serie de gráficos que ilustraban las capacidades avanzadas del nuevo modelo. Sin embargo, una inspección más cercana reveló discrepancias significativas en la presentación visual de algunos datos clave, lo que provocó admisiones rápidas y sinceras por parte de la dirección de la empresa.
Un ejemplo particularmente llamativo surgió de un gráfico que, irónicamente, pretendía demostrar el rendimiento de GPT-5 en “evaluaciones de engaño entre modelos”. Para una métrica etiquetada como “engaño en la codificación”, GPT-5 mostró una tasa de engaño del 50.0 por ciento. Sin embargo, un modelo más pequeño de OpenAI, o3, que registró una tasa de engaño inferior del 47.4 por ciento, fue inexplicablemente representado por una barra más grande en el gráfico. Esta distorsión visual sugería un mejor rendimiento para o3 a pesar de su puntuación numéricamente inferior.
Los problemas con los gráficos no fueron aislados. Otro gráfico problemático mostraba una de las puntuaciones de GPT-5 numéricamente más baja que la de o3, pero se representaba con una barra visiblemente más grande. Además, en este mismo gráfico, las puntuaciones de o3 y GPT-4o, a pesar de ser numéricamente diferentes, se representaron con barras de idéntico tamaño, lo que socavaba aún más la integridad visual de los datos.
Estas flagrantes inconsistencias no pasaron desapercibidas, ni siquiera para la alta dirección de OpenAI. El CEO Sam Altman reconoció públicamente el error, calificándolo de “error garrafal en los gráficos”. Sumándose a la autocrítica, un miembro del personal de marketing de OpenAI también emitió una disculpa por lo que se denominó un “crimen de gráfico involuntario”. La empresa no proporcionó comentarios adicionales de inmediato cuando se le preguntó sobre los errores.
El momento de estas representaciones visuales engañosas es particularmente incómodo para OpenAI. La empresa ha estado promocionando fuertemente los “avances significativos en la reducción de alucinaciones” de GPT-5, un desafío central en los grandes modelos de lenguaje donde la IA genera información plausible pero incorrecta. Presentar gráficos que son en sí mismos visualmente engañosos, independientemente de los puntos de datos subyacentes, crea una percepción desafortunada para una empresa que defiende la precisión y confiabilidad en sus resultados de IA. Si bien aún no está claro si GPT-5 se utilizó en la generación de estos gráficos defectuosos, el incidente arroja una sombra sobre un evento de lanzamiento destinado a destacar la precisión y fidelidad del nuevo modelo. Este episodio subraya la importancia crítica de una visualización de datos meticulosa, especialmente al introducir avances tecnológicos innovadores a una audiencia global.