Le modèle GPT-OSS-20B avec accélération GPU arrive sur Windows
5 août 2025 – Windows a annoncé la disponibilité immédiate de variantes optimisées pour GPU du modèle gpt-oss-20B d'OpenAI pour les appareils Windows. Cette version significative permet aux développeurs Windows d'intégrer des modèles de raisonnement open source puissants directement dans leurs applications, avec un support complet pour l'inférence locale.
L'introduction du modèle gpt-oss-20B marque un moment charnière pour le développement de l'IA sur la plateforme Windows. En tirant parti de l'accélération GPU, le modèle assure une exécution efficace et haute performance des tâches d'IA directement sur l'appareil de l'utilisateur, contournant le besoin d'une connectivité cloud constante. Cette capacité d'inférence locale offre plusieurs avantages, notamment une confidentialité des données améliorée, une latence réduite et la possibilité d'utiliser des applications hors ligne.
Les développeurs peuvent commencer à expérimenter et à implémenter le modèle gpt-oss-20B dès aujourd'hui via deux canaux principaux : Foundry Local et l'AI Toolkit pour VS Code (AITK). Ces outils fournissent l'environnement et les ressources nécessaires aux développeurs pour intégrer de manière transparente ces capacités d'IA avancées dans leurs projets, favorisant l'innovation dans un large éventail d'applications.
Cette initiative vise à donner aux développeurs Windows un contrôle et une flexibilité accrus sur leurs déploiements d'IA, ouvrant de nouvelles voies pour la création d'applications intelligentes, réactives et sécurisées. De plus amples détails concernant les capacités et les applications potentielles des modèles gpt-oss d'OpenAI sont disponibles sur le blog Azure.