OpenAI développe une IA "à pensée longue" pour problèmes complexes

Decoder

Les modèles d’intelligence artificielle capables de résoudre des problèmes de manière soutenue sur plusieurs jours représentent la prochaine frontière pour OpenAI, alors que l’entreprise expose publiquement sa nouvelle direction ambitieuse. Ce virage stratégique vise à développer des systèmes d’IA capables de planifier, de raisonner et de mener des expériences méticuleusement sur des périodes prolongées, allant au-delà du paradigme actuel des interactions rapides et de courte durée.

Des aperçus de cet effort ont été récemment partagés par le scientifique en chef d’OpenAI, Jakub Pachocki, et le chercheur Szymon Sidor lors du podcast officiel de l’entreprise. Ils ont détaillé les efforts internes derrière la construction de ces modèles de “pensée à long terme”, conçus pour relever des défis complexes qui exigent un effort de calcul persistant. Cette vision marque un écart significatif par rapport aux réponses instantanées typiquement associées à l’IA générative actuelle, poussant vers un avenir où l’IA peut s’engager dans un travail intellectuel profond et prolongé.

Les premiers indicateurs de cette capacité peuvent être observés dans les performances des modèles spécialisés en mathématiques et en code d’OpenAI. Ces systèmes ont déjà démontré une aptitude impressionnante à résoudre des problèmes complexes, atteignant même ce que l’entreprise compare à un “or olympique” dans leurs domaines respectifs. Leur succès laisse entrevoir les avancées architecturales sous-jacentes nécessaires pour que les IA ne se contentent pas de générer des réponses, mais qu’elles résolvent méthodiquement des problèmes en plusieurs étapes qui exigent une progression logique et un affinage itératif dans le temps.

L’objectif ultime de cette initiative est d’automatiser des portions substantielles du processus de recherche lui-même. En permettant à l’IA d’explorer et de découvrir de manière autonome, OpenAI envisage d’accélérer les percées dans des domaines critiques tels que la médecine, où l’IA pourrait découvrir de nouveaux composés thérapeutiques ou méthodes de diagnostic, et dans la sécurité de l’IA, où des modèles avancés pourraient aider à identifier et à atténuer les risques potentiels au sein d’autres systèmes d’IA. Cette démarche suggère un avenir où l’IA agit moins comme un outil sous direction humaine et davantage comme un chercheur indépendant et persistant.

La réalisation de cette vision ambitieuse s’accompagne cependant d’une demande colossale en ressources de calcul. Les chercheurs ont souligné que l’échelle de la puissance de traitement requise pour que les IA fonctionnent en continu pendant des heures, voire des jours, dépasse de loin ce qui est actuellement disponible pour la plupart des utilisateurs. Ce besoin pressant d’une vaste infrastructure de calcul est directement corrélé aux récentes déclarations du PDG d’OpenAI, Sam Altman, qui a indiqué une volonté d’investir des “milliers de milliards de dollars” dans la construction de nouveaux centres de données au cours des prochaines années. Un tel investissement sans précédent souligne l’engagement de l’entreprise à créer le matériel fondamental nécessaire pour alimenter ces systèmes d’IA de nouvelle génération, profondément analytiques.

Le développement d’IA capables de raisonnement et de résolution de problèmes soutenus représente un moment charnière dans l’évolution de l’intelligence artificielle. Il promet de transformer la manière dont la recherche et la découverte sont menées, débloquant potentiellement des solutions à certains des défis les plus complexes de l’humanité, à condition que la puissance de calcul nécessaire puisse être mise en ligne.