OpenAI reconnaît des problèmes avec GPT-5 et rétablit GPT-4o

Venturebeat

Sam Altman, cofondateur et PDG d’OpenAI, a publiquement reconnu des défis significatifs suite au déploiement récent de GPT-5, le nouveau modèle de langage étendu (LLM) phare de l’entreprise. Annoncé comme le modèle le plus puissant et le plus performant d’OpenAI à ce jour, son lancement a été entaché par une série de problèmes, notamment des commutations de modèle défectueuses, des performances incohérentes et une confusion généralisée chez les utilisateurs. Ces problèmes ont incité OpenAI à revenir partiellement sur certaines modifications de la plateforme, notamment en rétablissant l’accès des utilisateurs aux modèles précédents comme GPT-4o.

Lors d’un échange franc avec des utilisateurs sur Reddit et X (anciennement Twitter), Altman a admis que le lancement avait été “un peu plus chaotique que prévu”. Il a attribué les erreurs dans les graphiques de performance affichés lors du livestream de GPT-5 d’OpenAI à une erreur humaine, notant que “les gens travaillaient tard et étaient très fatigués”. Bien que le billet de blog et la carte système qui l’accompagnaient aient été précis, ces faux pas ont encore compliqué un lancement déjà soumis à l’examen minutieux des premiers adoptants et des développeurs. OpenAI a depuis doublé les limites de débit de GPT-5 pour les utilisateurs de ChatGPT Plus et continuera de permettre aux utilisateurs Plus d’opter pour GPT-4o, en surveillant l’utilisation pendant qu’elle examine la durée de support des modèles hérités.

Selon Altman, une cause principale de la perturbation était un dysfonctionnement du nouveau “routeur” automatique d’OpenAI. Ce système est conçu pour attribuer les requêtes des utilisateurs à l’une des quatre variantes de GPT-5 – régulière, mini, nano et pro – avec un mode “réflexion” optionnel pour des tâches de raisonnement plus complexes. Altman a révélé qu’un composant crucial de ce système, l’“autoswitcher”, était “hors service pendant une partie de la journée”, ce qui a fait que GPT-5 a semblé “beaucoup plus bête” que prévu. En réponse, OpenAI prévoit d’ajuster la limite de décision du modèle pour de meilleures performances et améliorera la transparence en indiquant quel modèle répond à une requête donnée. Une mise à jour de l’interface utilisateur est également en préparation pour faciliter le déclenchement manuel du mode de réflexion.

Bien que les benchmarks internes d’OpenAI suggèrent que GPT-5 est en tête des modèles de langage étendus, les expériences réelles des utilisateurs ont brossé un tableau différent. Depuis le lancement, de nombreux utilisateurs ont partagé des exemples de GPT-5 commettant des erreurs fondamentales en mathématiques, en logique et dans les tâches de codage. Par exemple, le data scientist Colin Fraser a publié des captures d’écran illustrant que GPT-5 déterminait incorrectement que 8.888 répétés est égal à 9, tandis qu’un autre utilisateur a souligné son échec sur un simple problème d’algèbre. Les développeurs ont également exprimé leur déception, certains rapportant que GPT-5 a obtenu de moins bons résultats que le nouveau Claude Opus 4.1 du laboratoire d’IA rival Anthropic dans les tâches de programmation “one-shot”, qui nécessitent l’achèvement précis d’une tâche à partir d’une seule instruction. De plus, la société de sécurité SPLX a identifié que GPT-5 reste vulnérable aux attaques par injection de prompt et par logique obscurcie, à moins que sa couche de sécurité ne soit considérablement renforcée.

Avec ChatGPT servant 700 millions d’utilisateurs par semaine, OpenAI maintient sa position de plus grand acteur de l’IA générative en termes d’audience. Cependant, cette immense échelle a entraîné des difficultés de croissance considérables. Altman a noté que le trafic API a doublé dans les 24 heures suivant le lancement de GPT-5, contribuant à l’instabilité de la plateforme. Bien qu’OpenAI vise à atténuer cela en doublant les limites de débit pour les utilisateurs de ChatGPT Plus et en ajustant continuellement son infrastructure en fonction des retours, ces faux pas initiaux – aggravés par des changements d’expérience utilisateur déroutants et des erreurs de lancement très médiatisées – ont créé une ouverture pour que les concurrents gagnent du terrain. La pression monte pour qu’OpenAI démontre que GPT-5 représente un bond en avant substantiel, et pas seulement une mise à jour incrémentielle. D’après le déploiement initial, de nombreux utilisateurs restent peu convaincus.