Gartner: GPT-5 avance, mais l'IA agentique exige une meilleure infrastructure

Venturebeat

Imaginez posséder les voitures de sport les plus puissantes du monde, mais sans autoroutes pour les conduire. Selon Gartner, c’est précisément là où se situe l’intelligence artificielle aujourd’hui. Alors que les modèles d’IA deviennent de plus en plus sophistiqués et performants, l’infrastructure fondamentale nécessaire pour libérer tout leur potentiel dans le monde réel reste largement non construite. Arun Chandrasekaran, vice-président analyste distingué chez Gartner, compare l’état actuel à celui de posséder d’excellents moteurs de voiture sans un système autoroutier fonctionnel, ce qui entraîne un ralentissement notable des progrès des capacités des modèles, même pour des avancées comme le GPT-5 d’OpenAI. Bien qu’il s’agisse d’un pas significatif, le GPT-5 n’offre que de faibles lueurs d’une IA véritablement autonome et agéntique.

Gartner reconnaît qu’OpenAI a réalisé des progrès considérables avec GPT-5 dans plusieurs domaines clés. Le modèle démontre une meilleure maîtrise des tâches de codage, un pivot stratégique d’OpenAI pour capitaliser sur les vastes opportunités en ingénierie logicielle d’entreprise et défier des concurrents comme Anthropic. De plus, GPT-5 montre des progrès dans les capacités multimodales au-delà du texte, notamment dans le traitement de la parole et des images, ouvrant de nouvelles voies d’intégration pour les entreprises.

Une avancée notable dans GPT-5 est son utilisation améliorée des outils, faisant subtilement progresser la conception des agents IA et l’orchestration. Le modèle peut désormais appeler des API et des outils tiers, et même effectuer des appels d’outils parallèles, gérant plusieurs tâches simultanément. Cela nécessite cependant que les systèmes d’entreprise soient équipés pour gérer des requêtes API concurrentes au sein d’une même session. La planification multi-étapes de GPT-5 permet également à une logique métier plus complexe de résider au sein même du modèle, réduisant potentiellement la dépendance vis-à-vis des moteurs de workflow externes. Ses fenêtres de contexte étendues — 8K pour les utilisateurs gratuits, 32K pour les abonnés Plus et un substantiel 128K pour les utilisateurs Pro — sont prêtes à remodeler les modèles d’architecture d’IA d’entreprise. Cela signifie que les applications qui nécessitaient auparavant des pipelines complexes de génération augmentée par récupération (RAG) pour naviguer les limites de contexte peuvent désormais alimenter des ensembles de données beaucoup plus volumineux directement aux modèles, simplifiant certains workflows. Pourtant, le RAG est loin d’être obsolète ; récupérer uniquement les données les plus pertinentes reste plus rapide et plus rentable que d’envoyer toujours des entrées massives. Gartner anticipe un virage vers une approche hybride, où les développeurs tireront parti de GPT-5 pour des contextes plus larges et moins structurés tout en optimisant l’efficacité.

Sur le plan financier, GPT-5 réduit considérablement les frais d’utilisation de l’API, avec des coûts de niveau supérieur de 1,25 $ par million de jetons d’entrée et 10 $ par million de jetons de sortie, ce qui le rend compétitif avec des modèles comme Gemini 2.5 et nettement moins cher que Claude Opus. Cependant, son ratio de prix entrée/sortie est plus élevé que celui des modèles précédents, un facteur que les leaders de l’IA devraient prendre en compte pour les scénarios à forte utilisation de jetons.

OpenAI s’efforce stratégiquement de consolider son offre de modèles, GPT-5 étant à terme destiné à remplacer GPT-4o et sa série o. Cette stratégie, partiellement influencée par la dissidence des utilisateurs après les tentatives initiales de suppression, vise à abstraire la complexité pour les utilisateurs. L’introduction de trois tailles de modèle — Pro, Mini et Nano — permettra aux architectes de hiérarchiser les services en fonction des coûts et de la latence, permettant aux modèles plus petits de gérer des requêtes simples et au modèle complet de s’attaquer à des tâches complexes. Les entreprises adoptant GPT-5 devraient se préparer à d’éventuels examens et ajustements de code en raison des différences dans les formats de sortie, la mémoire et les comportements d’appel de fonctions, et auditer les modèles de prompt existants car certaines solutions de contournement pourraient devenir obsolètes. Cette consolidation répond également aux défis de capacité de calcul d’OpenAI, nécessitant des partenariats avec de grands fournisseurs de cloud comme Microsoft, Oracle et Google, car l’exécution de plusieurs générations de modèles exige une infrastructure proportionnelle.

GPT-5 introduit également de nouvelles considérations concernant les risques et l’adoption. OpenAI affirme une réduction des taux d’hallucination allant jusqu’à 65 % par rapport aux modèles précédents, ce qui pourrait réduire les risques de conformité et améliorer l’adéquation aux cas d’utilisation en entreprise. Ses explications de chaîne de pensée (CoT) soutiennent également l’auditabilité et l’alignement réglementaire. Inversement, ces taux d’hallucination plus faibles combinés aux capacités de raisonnement et de traitement multimodal avancées de GPT-5 pourraient amplifier les abus, tels que la génération d’escroqueries sophistiquées et de tentatives de phishing. Les analystes conseillent que les flux de travail critiques continuent de faire l’objet d’une révision humaine, bien qu’avec un échantillonnage potentiellement réduit. Gartner recommande aux dirigeants d’entreprise de piloter et d’évaluer GPT-5 dans des scénarios critiques, en effectuant des évaluations côte à côte avec d’autres modèles pour évaluer la précision, la vitesse et l’expérience utilisateur. Ils conseillent également de réviser les politiques de gouvernance, d’expérimenter les intégrations d’outils et les paramètres de raisonnement, et d’auditer les plans d’infrastructure pour prendre en charge les capacités étendues de GPT-5.

Bien que l’IA agéntique soit un « sujet brûlant » et un domaine d’investissement majeur dans le Hype Cycle 2025 de Gartner pour l’IA Générative, elle a atteint le « Sommet des attentes exagérées ». Cette phase, marquée par une publicité généralisée et des attentes irréalistes issues des premiers succès, précède généralement le « Creux de la désillusion », où l’intérêt et l’investissement diminuent à mesure que les implémentations ne tiennent pas leurs promesses exagérées. De nombreux fournisseurs survendent actuellement des produits comme étant prêts pour la production pour des déploiements agéntiques, mais en réalité, l’adoption à l’échelle de l’entreprise reste rare. Les déploiements actuels sont confinés à des poches étroites, telles que l’ingénierie logicielle ou les achats, et même ceux-ci sont souvent dirigés par l’homme ou semi-autonomes.

Un obstacle majeur à la véritable IA agéntique est le manque d’une infrastructure robuste. Les agents nécessitent un accès transparent à un large éventail d’outils d’entreprise, la capacité de communiquer avec diverses banques de données et applications SaaS, ainsi que des systèmes robustes de gestion d’identité et d’accès pour contrôler leur comportement et l’accès aux données. Surtout, les entreprises doivent être confiantes dans la fiabilité des informations produites par les agents, en s’assurant qu’elles sont exemptes de biais, d’hallucinations ou de fausses données. Pour combler ce fossé, les fournisseurs doivent collaborer et adopter des normes plus ouvertes pour la communication d’outils d’agent à entreprise et d’agent à agent. Bien que les technologies d’IA sous-jacentes progressent, les couches essentielles d’orchestration, de gouvernance et de données nécessaires pour que les agents prospèrent réellement sont encore en développement, créant des frictions significatives dans le paysage actuel. De plus, bien que l’IA fasse des progrès en matière de raisonnement, elle opère en grande partie dans un domaine numérique, ayant toujours du mal à comprendre le monde physique, malgré les améliorations continues en robotique spatiale.

En fin de compte, malgré les avancées significatives observées dans GPT-5, l’industrie reste très loin d’atteindre l’Intelligence Artificielle Générale (AGI) — l’objectif ultime qu’OpenAI s’est fixé. Les experts estiment que de véritables progrès vers l’AGI nécessiteront probablement une révolution fondamentale dans l’architecture ou le raisonnement des modèles, allant au-delà de la simple mise à l’échelle des données et de la puissance de calcul.