Lancement de GPT-5 par OpenAI : Un "énorme fiasco graphique" entache la présentation
Lors de son livestream très attendu de GPT-5 jeudi, OpenAI a cherché à impressionner le public avec une série de graphiques illustrant les capacités avancées du nouveau modèle. Pourtant, une inspection plus approfondie a révélé des divergences significatives dans la présentation visuelle de certaines données clés, suscitant des aveux rapides et francs de la part de la direction de l’entreprise.
Un exemple particulièrement frappant est apparu sur un graphique censé ironiquement démontrer les performances de GPT-5 dans les «évaluations de tromperie entre modèles». Pour une métrique étiquetée «tromperie en codage», GPT-5 affichait un taux de tromperie de 50,0 %. Cependant, un modèle OpenAI plus petit, o3, qui enregistrait un taux de tromperie inférieur de 47,4 %, était inexplicablement représenté par une barre plus grande sur le graphique. Cette distorsion visuelle suggérait une meilleure performance pour o3 malgré son score numériquement inférieur.
Les problèmes de graphiques n’étaient pas isolés. Un autre graphique problématique affichait l’un des scores de GPT-5 comme étant numériquement inférieur à celui d’o3, mais il était représenté par une barre visiblement plus grande. De plus, sur ce même graphique, les scores pour o3 et GPT-4o, bien que numériquement différents, étaient représentés par des barres de taille identique, sapant davantage l’intégrité visuelle des données.
Ces incohérences flagrantes n’ont pas échappé, même aux hauts dirigeants d’OpenAI. Le PDG Sam Altman a publiquement reconnu la gaffe, la qualifiant d’«énorme fiasco graphique». Ajoutant à la mea culpa, un membre du personnel marketing d’OpenAI a également présenté des excuses pour ce qui a été qualifié de «crime graphique involontaire». L’entreprise n’a pas immédiatement fourni de commentaires supplémentaires lorsqu’on l’a interrogée sur les erreurs.
Le moment de ces fausses représentations visuelles est particulièrement délicat pour OpenAI. L’entreprise a fortement promu les «avancées significatives de GPT-5 dans la réduction des hallucinations» – un défi majeur dans les grands modèles linguistiques où l’IA génère des informations plausibles mais incorrectes. Présenter des graphiques qui sont eux-mêmes visuellement trompeurs, quels que soient les points de données sous-jacents, crée une perception malheureuse pour une entreprise qui défend la précision et la fiabilité de ses sorties d’IA. Bien qu’il reste incertain si GPT-5 lui-même a été utilisé dans la génération de ces graphiques défectueux, l’incident jette une ombre sur un événement de lancement destiné à souligner la précision et la fidélité du nouveau modèle. Cet épisode souligne l’importance cruciale d’une visualisation méticuleuse des données, en particulier lors de l’introduction d’avancées technologiques révolutionnaires à un public mondial.