OpenAI dévoile GPT-5: IA Unifiée avec Raisonnement Adaptatif pour Tâches Complexes
OpenAI a officiellement lancé GPT-5, introduisant ce qu’il décrit comme un système d’IA unifié conçu pour le raisonnement adaptatif à travers des tâches complexes. S’appuyant sur les avancées fondamentales de ses prédécesseurs, cette nouvelle architecture consolide les lignes de modèles précédentes, permettant au système d’ajuster dynamiquement son « effort de pensée » computationnel en fonction de la complexité de toute requête donnée, un choix de conception visant à fournir des réponses plus fiables et précises.
L’accès à GPT-5 sera échelonné, marquant un changement significatif pour les utilisateurs gratuits qui, pour la première fois, pourront expérimenter un modèle spécifiquement conçu pour le raisonnement logique. Les abonnés payants, à l’inverse, bénéficieront de limites d’utilisation plus élevées et d’une suite de fonctionnalités exclusives. Le cœur de GPT-5 n’est pas un modèle monolithique singulier, mais plutôt un système intégré. Il exploite gpt-5-main
, un modèle rapide et efficace pour la majorité des requêtes routinières, tandis qu’un modèle de raisonnement plus profond, gpt-5-thinking
, est invoqué pour les problèmes complexes. Un routeur sophistiqué en temps réel, continuellement affiné grâce aux retours d’utilisateurs, sélectionne intelligemment le modèle approprié en fonction de facteurs tels que la difficulté de la question, le contexte conversationnel ou même des directives explicites de l’utilisateur comme « réfléchissez attentivement à cela ». Pour les abonnés « Pro », OpenAI propose GPT-5 Pro, une variante qui consacre encore plus de temps de traitement au raisonnement des questions difficiles, les évaluateurs externes la préférant apparemment à gpt-5-thinking
dans près de 68 % des scénarios difficiles.
OpenAI affirme que GPT-5 établit de nouvelles références dans divers domaines, y compris la programmation, les soins de santé et l’écriture. En codage, le modèle est vanté pour sa capacité exceptionnelle à construire des interfaces front-end complexes et à déboguer de vastes bases de code, atteignant un score de 74.9 % sur SWE-bench Verified et 88 % sur Aider Polyglot, réduisant significativement les taux d’erreur des deux tiers par rapport aux itérations précédentes. Pour les requêtes liées à la santé, GPT-5 vise à fournir des réponses plus précises, fonctionnant comme un « partenaire de pensée actif » capable de poser des questions de suivi. Il a obtenu un score de 46.2 % au test exigeant HealthBench Hard, une augmentation par rapport aux 31.6 % de son prédécesseur, bien qu’OpenAI souligne qu’il ne remplace pas les professionnels de la santé. Des gains de performance supplémentaires sont évidents dans d’autres benchmarks, avec GPT-5 obtenant un score de 94.6 % sur AIME 2025 (mathématiques, sans outils) et 84.2 % sur MMMU (compréhension multimodale). Le GPT-5 Pro premium aurait atteint un score de 88.4 % sur le benchmark GPQA pour les questions scientifiques très difficiles.
Une promesse clé de GPT-5 réside dans sa réduction substantielle des « hallucinations » — la génération d’informations factuellement incorrectes ou insensées. Avec les capacités de recherche web activées, OpenAI déclare que le modèle est environ 45 % moins sujet aux erreurs factuelles que GPT-4o. Dans son mode de « pensée » pur, le taux d’erreur chute de 80 % par rapport à son prédécesseur. Sur des benchmarks ouverts basés sur des faits tels que LongFact et FActScore, GPT-5 a produit environ six fois moins d’hallucinations. Même sans données web à jour, le mode « pensée » de GPT-5 affiche des taux d’hallucination moyens entre 0.8 et 1.4 % sur LongFact-Concepts, LongFact-Objects et FActScore, une amélioration spectaculaire par rapport aux 24 à 38 % observés dans les modèles antérieurs, se traduisant par plus de cinq fois moins d’erreurs factuelles. Le modèle est également conçu pour une plus grande transparence concernant ses propres limitations. Lors d’un test impliquant des questions sur des images inexistantes sur le benchmark CharXiv, GPT-5 n’a fourni des réponses confiantes et inventées que 9 % du temps, un contraste frappant avec les 86.7 % de son prédécesseur. Globalement, le taux de tromperie dans les conversations représentatives aurait diminué de 4.8 % à 2.1 % avec GPT-5.
GPT-5 introduit les « Complétions Sûres » (Safe Completions), un nouveau paradigme de sécurité détaillé dans un document de recherche accompagnant. Ce système remplace la méthode précédente de « refus catégorique » (hard refusal), qu’OpenAI jugeait trop inflexible, notamment pour les sujets ambigus ou à double usage où l’information pourrait être appliquée à des fins bénéfiques et nuisibles. Au lieu de bloquer purement et simplement les requêtes, GPT-5 priorise la sécurité de la sortie, plutôt que de juger uniquement l’intention de l’utilisateur. Le modèle s’efforce de fournir la réponse la plus utile possible dans les directives de sécurité prédéfinies, ce qui pourrait impliquer d’offrir un aperçu de haut niveau, une réponse partielle ou une perspective alternative. Les évaluateurs humains auraient trouvé cette approche plus sûre, plus utile et mieux équilibrée. Conformément à cela, GPT-5-thinking a été évalué comme ayant une « haute capacité » pour la biologie et la chimie dans le cadre du Cadre de Préparation d’OpenAI, après plus de 5 000 heures de « red teaming » rigoureux mené par des partenaires comme CAISI (États-Unis) et UK AISI.
Au-delà de ses capacités fondamentales, GPT-5 apporte plusieurs nouvelles fonctionnalités à son API, offrant aux développeurs un contrôle amélioré sur l’effort de raisonnement et la verbosité du modèle. Les « Outils Personnalisés » (Custom Tools) peuvent désormais être invoqués en utilisant du texte brut plutôt que du JSON strict, ce qui devrait minimiser les erreurs pour les entrées complexes. La fenêtre de contexte a été considérablement étendue pour accueillir 272 000 jetons d’entrée et 128 000 jetons de sortie. L’API propose désormais trois tailles de modèle distinctes : gpt-5
, gpt-5-mini
et gpt-5-nano
, gpt-5
étant désigné comme la variante de « pensée » la plus puissante, au prix de 1.25 $ par million de jetons d’entrée et 10 $ par million de jetons de sortie.
L’interface utilisateur de ChatGPT reçoit également des mises à jour. Le nouveau modèle est conçu pour être considérablement moins « sycophante », ce comportement ayant apparemment chuté de 14.5 % à moins de 6 % lors des tests. Les utilisateurs auront la possibilité de personnaliser l’apparence visuelle de leurs chats et, en tant que prévisualisation de recherche, de choisir parmi quatre personnalités prédéfinies telles que « Cynique » ou « Intello ». Le déploiement de GPT-5 commence immédiatement, devenant le nouveau modèle par défaut pour les clients Équipe, Entreprise et Éducation, tandis que les abonnés Plus reçoivent des limites d’utilisation plus élevées et les utilisateurs Pro bénéficient d’un accès illimité à GPT-5 et d’un accès exclusif à GPT-5 Pro.