GPT-5 : Progrès incrémentaux en IA, battage médiatique démesuré
Le très attendu GPT-5 d’OpenAI, leur nouveau modèle phare, est enfin arrivé, et le consensus parmi les observateurs est clair : bien qu’il offre une expérience utilisateur raffinée, il est loin d’être une percée révolutionnaire. Comme l’a succinctement dit un collègue, GPT-5 est « avant tout, un produit raffiné ». Cette évaluation s’aligne sur un sentiment plus large selon lequel les récentes versions de modèles à travers l’industrie ressemblent de plus en plus à des mises à jour incrémentales de smartphones, conçues pour améliorer les fonctionnalités existantes plutôt que d’introduire de nouveaux paradigmes. Le PDG d’OpenAI, Sam Altman lui-même, a établi un parallèle avec l’introduction de l’écran Retina par Apple, une comparaison qui, bien que valide pour l’amélioration itérative, soulève la question : où est le saut transformateur d’un clavier BlackBerry à un iPhone à écran tactile ? Où est le changement fondamental qui débloque des applications et des industries entièrement nouvelles, à l’image du GPS assisté permettant la navigation en temps réel et donnant naissance à des entreprises comme Uber ?
En effet, le lancement de GPT-5 a été accueilli par un retour de bâton inattendu de la part des utilisateurs. Les clients, habitués à la « personnalité » distincte de GPT-4o, ont réussi à faire pression sur OpenAI pour qu’il le réintègre comme option pour les abonnés Plus. Cet épisode souligne davantage que la sortie de GPT-5 a privilégié le réglage fin de l’expérience utilisateur plutôt que des améliorations significatives de performance.
Pourtant, malgré cette réalité, le battage médiatique autour de GPT-5 a été immense. Quelques heures avant l’annonce, Altman a taquiné la sortie avec une image d’une Étoile de la Mort émergente. Le jour du lancement, il a vanté son « intelligence de niveau doctorat », affirmant plus tard lors d’une émission d’information matinale qu’il « sauverait de nombreuses vies ». Bien que de telles déclarations soient souvent accueillies avec scepticisme, Altman est loin d’être le seul à faire de l’esbroufe. Pas plus tard que la semaine dernière, le PDG de Meta, Mark Zuckerberg, a rédigé une longue note sur l’arrivée imminente de la superintelligence artificielle, et plus tôt cette année, le PDG d’Anthropic, Dario Amodei, a semé une alarme généralisée avec sa prédiction selon laquelle l’IA pourrait récolter la moitié de tous les emplois de premier échelon d’ici un an. Ces leaders de l’industrie discutent fréquemment des risques existentiels posés par leurs créations, même si leurs modèles avancés ont encore du mal avec des requêtes de base, comme compter le nombre de ‘b’ dans “blueberry”.
Il ne s’agit pas de minimiser les capacités impressionnantes des produits d’OpenAI, Anthropic et d’autres développeurs. Ce sont sans aucun doute des outils puissants d’une utilité considérable. Cependant, le cycle de battage médiatique entourant ces versions de modèles est devenu excessif. En tant qu’utilisateur fréquent de ChatGPT et Google Gemini, souvent plusieurs fois par jour, j’ai expérimenté leur utilité de première main. Récemment, ma femme a rencontré une baleine frappant à plusieurs reprises sa queue sur l’eau, un comportement qu’elle n’avait jamais observé malgré une vaste expérience de la vie marine. Curieux, je me suis tourné vers ChatGPT, demandant : « Pourquoi les baleines frappent-elles leur queue à plusieurs reprises sur l’eau ? » Le chatbot a identifié avec confiance le comportement comme du « lobtailing » et a fourni une liste de raisons potentielles. Bien qu’impressionnant, une recherche Google standard aurait donné des informations similaires. Plus important encore, l’explication de ChatGPT, bien que concise, était excessivement définitive. En réalité, bien que les théories abondent, les raisons précises du lobtailing restent un mystère scientifique.
Ma connaissance de ce mystère découle d’une exploration plus approfondie des résultats de recherche traditionnels, ce qui m’a conduit à un essai perspicace d’Emily Boring. Elle décrit avec éloquence ses observations d’une baleine à bosse faisant du lobtailing et explore l’incertitude scientifique entourant ce comportement énergivore. Est-ce pour se nourrir, communiquer ou pour se positionner ? Comme le suggère le biologiste Hal Whitehead : « Les sauts et les coups de queue sont de bons signaux précisément parce qu’ils sont énergétiquement coûteux et indiquent ainsi l’importance du message et l’état physique du signaleur. » Un coup de queue, dans ce contexte, devient une puissante déclaration : « Attention ! Je suis important ! Remarquez-moi ! »
À bien des égards, le cycle de battage médiatique actuel de l’IA est un sous-produit nécessaire du niveau féroce d’investissement. Les milliards incalculables de dollars de coûts irrécupérables, les constructions massives de centres de données avec leurs conséquences environnementales significatives, tout cela exige une justification. Tant de capitaux sont en jeu que l’industrie est contrainte de générer un flux constant de grandes promesses.
Cela ne veut pas dire qu’il ne se passe pas de choses vraiment cool en IA. J’ai été vraiment époustouflé par certaines versions d’IA, telles que ChatGPT 3.5, Dall-E, NotebookLM, Veo 3 et Synthesia. Et juste cette semaine, Genie 3 de Google DeepMind, qui peut transformer une simple invite textuelle en un monde 3D immersif et navigable, était vraiment hallucinant. Pourtant, Genie 3 lui-même démontre de manière convaincante que les avancées les plus intéressantes en IA se produisent souvent en dehors du domaine des chatbots.
On pourrait même soutenir qu’à ce stade, les observateurs les plus constamment émerveillés par les nouvelles versions de chatbots de grands modèles linguistiques sont souvent ceux qui profitent le plus directement de leur promotion. Peut-être cette perspective est-elle cynique, mais je crois qu’elle l’est moins que de promettre une Étoile de la Mort et de livrer un chatbot dont le principal nouvel attrait est la sélection automatique de modèles. C’est moins cynique que de promettre la superintelligence et de livrer ce qui s’apparente à un outil surestimé, souvent définitif, mais finalement limité. Ce n’est qu’un tas de lobtailing : « Attention ! Je suis important ! Remarquez-moi ! »