Dominando GPT-5: Prompts Esenciales para Diversas Aplicaciones de IA

Analyticsvidhya

La esperada llegada de GPT-5 de OpenAI ha provocado naturalmente una intensa discusión en la industria, con el modelo promocionado por sus amplias capacidades en codificación, escritura, generación de imágenes e incluso agencia autónoma. Para ir más allá del bombo inicial y evaluar su rendimiento en el mundo real, se puso a prueba una serie de prompts diversos, evaluando si GPT-5 realmente supera a sus predecesores o simplemente se suma al creciente panorama de la IA.

En las pruebas iniciales, GPT-5 demostró una utilidad prometedora en la creación de tareas estructuradas. Cuando se le encargó diseñar un rastreador de redes sociales, el prototipo ejecutó impecablemente todas las funciones solicitadas. Asignó roles con precisión, rastreó el progreso de las publicaciones diarias (cuatro publicaciones por plataforma por día), e incluso incorporó animaciones de confeti de celebración al finalizar. El resultado, que incluía un formato JSON bien estructurado con códigos de color específicos de la plataforma y prompts motivacionales, destacó la capacidad del modelo para generar soluciones prácticas y listas para desarrolladores. De manera similar, para un juego de “Adivina la Palabra”, GPT-5 produjo una interfaz de usuario visualmente atractiva e interactiva con un juego fluido y una retroalimentación receptiva. Sin embargo, se observó una omisión crítica: la funcionalidad principal que permitía al jugador introducir una palabra secreta para que la IA la adivinara estaba ausente, lo que impidió una alineación completa con el prompt original. A pesar de esto, el prototipo mostró un potencial considerable. El modelo también se destacó en la preparación académica, generando una prueba de opción múltiple completa de 10 preguntas sobre IA Agéntica, con cuatro opciones por pregunta, un informe de puntuación final y explicaciones detalladas para las respuestas incorrectas, citando ejemplos relevantes e imitando las condiciones del examen.

Sin embargo, el rendimiento de GPT-5 flaqueó notablemente en tareas operativas más complejas y aplicaciones creativas. Un intento de automatizar la recopilación de datos para el análisis semanal mediante la recuperación de publicaciones de redes sociales de canales específicos (Instagram y LinkedIn) después de una cierta fecha arrojó resultados incompletos. A pesar del volumen típico de publicaciones (alrededor de 4 por día por plataforma), GPT-5 devolvió significativamente menos entradas, fallando en capturar el conjunto de datos completo con precisión.

Las capacidades de razonamiento y análisis de imágenes del modelo también resultaron decepcionantes. En una comparación directa con modelos anteriores de OpenAI, a GPT-5 se le encargó identificar individuos y sus colores asociados dentro de un dibujo. A pesar de repetidos intentos, incluso utilizando su “Modo de Pensamiento”, el modelo proporcionó consistentemente respuestas incorrectas. Este rendimiento sugiere que las habilidades de razonamiento de GPT-5 pueden no cumplir con los altos puntos de referencia publicitados por OpenAI para consultas tan complejas, quedando por debajo de las expectativas establecidas por versiones anteriores.

Quizás la regresión más significativa se observó en la generación de imágenes. En comparación con GPT-4o, GPT-5 exhibió deficiencias sustanciales. Tuvo dificultades notables con la renderización de texto, fallando en incorporar o mostrar texto con precisión dentro de las imágenes generadas. La calidad general de la imagen también fue notablemente inferior, caracterizada por una resolución reducida y un aumento de artefactos. Además, el modelo con frecuencia malinterpretó o ignoró por completo solicitudes de prompts específicos, lo que indica una disminución significativa en la adherencia a los prompts. Para una iteración supuestamente mejorada, estas regresiones en la funcionalidad central son una preocupación considerable.

En conclusión, si bien GPT-5 muestra competencia en tareas de codificación estructuradas y ciertas formas de generación de contenido, sus deficiencias en áreas críticas como el razonamiento, la extracción precisa de datos y, particularmente, la generación de imágenes, sugieren un sorprendente paso atrás para la asistencia de IA de propósito general. La versatilidad y la destreza creativa que definieron las versiones anteriores de ChatGPT parecen disminuidas en GPT-5, lo que lleva a una experiencia decepcionante para los usuarios que dependían de sus capacidades más amplias más allá de la codificación especializada. La falta general de transparencia con respecto a qué versión del modelo está generando las respuestas complica aún más la evaluación del usuario.