OpenAI : GPT-5 arrive, des LLM open source pour un contrôle inédit
OpenAI, fer de lance du mouvement d’intelligence artificielle générative depuis le lancement révolutionnaire de ChatGPT en novembre 2022, s’apprête à dévoiler GPT-5, son nouveau grand modèle linguistique très attendu. Les observateurs de l’industrie s’attendent largement à ce que GPT-5 fasse progresser de manière significative l’état actuel de l’art en matière de capacités d’IA.
L’attente a atteint son paroxysme suite à une annonce d’OpenAI sur les réseaux sociaux, détaillant un briefing spécial en ligne prévu pour 10h00 heure du Pacifique (18h00 heure du Royaume-Uni). Les commentateurs de tout le spectre technologique se sont rapidement ralliés à l’idée que cet événement servirait de plateforme pour l’introduction de GPT-5, le successeur direct du modèle GPT-4 largement adopté. Bien que l’histoire d’OpenAI suggère un certain degré d’imprévisibilité, le sentiment prédominant au sein de la communauté technologique est que la révélation est imminente. Les attentes concernant GPT-5 incluent des améliorations substantielles en matière d’analyse textuelle et des avancées significatives dans la gestion des tâches de codage complexes.
Parallèlement, OpenAI a fait un autre pas notable plus tôt cette semaine avec l’introduction de deux offres GPT-OSS. Décrites comme des “modèles de raisonnement à poids ouverts avancés”, ces systèmes sont conçus pour une personnalisation étendue et un déploiement local dans divers cas d’utilisation. Ce développement présente un intérêt particulier pour un large éventail d’utilisateurs, y compris les entreprises de technologie juridique et les cabinets d’avocats désireux d’adapter les résultats de l’IA à leurs besoins spécifiques. Les modèles sont disponibles en deux tailles : une version de 120 milliards de paramètres capable de fonctionner sur des ordinateurs portables haut de gamme, et une version plus compacte de 20 milliards de paramètres qui peut fonctionner sur la plupart des ordinateurs portables standard. La capacité d’exécuter ces modèles sur site, plutôt que de dépendre uniquement de l’infrastructure cloud, devrait séduire les organisations soucieuses de la sécurité et de la confidentialité des données.
OpenAI a détaillé les fonctionnalités principales de ces modèles open source, soulignant leur conception pour les “tâches agentiques”. Cela signifie que les modèles sont aptes à suivre des instructions complexes et à exploiter des outils externes, y compris les capacités de recherche web et l’exécution de code Python, au sein de leurs processus de raisonnement. Leur profonde personnalisation permet aux utilisateurs d’ajuster l’effort de calcul pour le raisonnement (faible, moyen ou élevé) et de peaufiner tous les paramètres pour adapter précisément les modèles à des applications uniques. De plus, la fourniture d’une “chaîne de pensée complète” offre une transparence accrue, facilitant le débogage et favorisant une plus grande confiance dans les sorties du modèle. Fondamentalement, ces modèles sont publiés sous la licence permissive Apache 2.0, permettant aux développeurs de construire librement sans se soucier des restrictions de copyleft ou des risques de brevet, que ce soit pour des déploiements expérimentaux, personnalisés ou commerciaux.
Collectivement, ces annonces marquent une semaine charnière pour OpenAI et pour toutes les parties prenantes intéressées par les capacités évolutives et l’orientation stratégique des grands modèles linguistiques. L’approche duale consistant à repousser les limites avec un modèle phare propriétaire tout en contribuant simultanément à l’écosystème open source reflète une stratégie dynamique et potentiellement influente pour l’avenir de l’IA.