Les piètres performances de GPT-5 : une stratégie d'économie d'OpenAI ?
Le lancement du modèle GPT-5 tant attendu d’OpenAI la semaine dernière a marqué une période inattendue et tumultueuse pour le géant de l’intelligence artificielle. Alors que les métriques internes auraient montré de modestes gains de performance, l’expérience utilisateur s’est avérée largement décevante, entraînant une réaction significative de sa communauté dévouée. Les plaintes courantes portaient sur sa brièveté, un déclin notable de la qualité d’écriture et un manque distinct de la personnalité à laquelle les utilisateurs s’étaient habitués. Plus frappant encore, malgré son intelligence vantée de « niveau doctorat », le modèle a été observé commettant des erreurs élémentaires, comme affirmer incorrectement que le mot « blueberry » contient trois occurrences de la lettre ‘B’.
L’insatisfaction des utilisateurs était si profonde que beaucoup ont exigé le rétablissement du modèle précédent, GPT-4o, qu’OpenAI avait audacieusement supprimé lors du lancement de GPT-5. Dans un tournant révélateur, l’entreprise a rapidement capitulé face à ces demandes, restaurant l’accès à l’itération plus ancienne et plus populaire. Ce revirement immédiat a jeté une ombre sur les déclarations antérieures du PDG Sam Altman selon lesquelles GPT-5 représentait un « pas significatif sur la voie de l’AGI », ou intelligence artificielle générale.
Une théorie intrigante a émergé pour expliquer l’accueil décevant de GPT-5 : il pourrait s’agir moins d’un bond révolutionnaire en matière de capacités d’IA et davantage d’une démarche stratégique visant à optimiser les coûts opérationnels. Cette perspective, explorée par des publications comme The Register, met en lumière les immenses pressions financières au sein de l’industrie florissante de l’IA, où des entreprises comme OpenAI dépensent des milliards en ressources informatiques tout en générant des revenus comparativement modérés. Ce changement pourrait être un effort d’OpenAI pour freiner les dépenses et améliorer ses perspectives d’atteindre la rentabilité avant la fin de la décennie, un défi de taille compte tenu de sa valorisation anticipée d’environ 500 milliards de dollars.
Le poids de cette théorie est renforcé par la révélation concernant l’architecture sous-jacente de GPT-5. Plutôt qu’un modèle singulier et monolithique, GPT-5 est, selon les rapports, un duo dynamique : un modèle léger conçu pour les requêtes de base et un modèle plus robuste et gourmand en ressources pour les tâches de raisonnement complexes. Un modèle “routeur” distinct est chargé de diriger intelligemment chaque invite utilisateur vers le plus approprié des deux. Selon Altman, ce modèle routeur a mal fonctionné le jour du lancement, contribuant à la perception que GPT-5 était « beaucoup plus bête » que prévu. Bien que le routeur ait depuis été remis en ligne avec des améliorations supposées, la perturbation initiale n’a fait qu’alimenter la frustration des utilisateurs, en particulier compte tenu de la limitation perçue de leurs choix.
Ce déploiement d’un “autoswitcher” marque un changement notable par rapport à l’approche précédente d’OpenAI, où les abonnés payants pouvaient sélectionner manuellement leur modèle préféré. Maintenir plusieurs grands modèles de langage en ligne simultanément est une entreprise coûteuse, ce qui renforce l’idée qu’OpenAI traverse une période de réduction des dépenses. D’autres preuves de mesures de réduction des coûts incluent une limite stricte de seulement dix messages par heure pour les utilisateurs gratuits. De plus, la “fenêtre contextuelle” du modèle, essentiellement sa mémoire à court terme pour les conversations en cours, reste inchangée à 32 000 jetons pour les utilisateurs Plus et 128 000 pour les utilisateurs Pro. De nombreux abonnés, en particulier ceux du niveau Plus plus abordable à 20 $/mois (Pro coûte 200 $/mois), ont constamment plaidé pour une mise à niveau dans ce domaine crucial.
Le sentiment que GPT-5 est principalement un exercice de réduction des coûts résonne largement au sein de la communauté des utilisateurs. Un message en tête sur le subreddit r/ChatGPT, par exemple, a explicitement déclaré que GPT-5 est “clairement un exercice de réduction des coûts”, expliquant que “Ils ont supprimé tous leurs modèles coûteux et performants et les ont remplacés par un auto-routeur qui par défaut optimise les coûts… Ça ressemble à une économie de coûts, pas à une amélioration.”
Bien que peu glamour, de telles mesures de réduction des coûts sont stratégiquement judicieuses pour OpenAI. L’entreprise fait face à une concurrence sans précédent et à une pression intense pour valider sa colossale valorisation en démontrant une voie viable vers la rentabilité. Cependant, dans sa quête de stabilité financière, OpenAI a apparemment sous-estimé l’attachement profond que les utilisateurs avaient développé pour les nuances et les particularités de ses modèles plus anciens, peut-être moins “efficaces”. Cette loyauté inattendue des utilisateurs présente un nouveau défi complexe que le pionnier de l’IA devra relever tout en équilibrant l’innovation et les résultats financiers.