AWS Hebdo : Modèles OpenAI, Nouveaux Services et Garde-fous IA
Le paysage du cloud computing poursuit son évolution rapide, avec Amazon Web Services (AWS) dévoilant une série de mises à jour significatives conçues pour améliorer tout, des capacités d’intelligence artificielle à l’infrastructure fondamentale et aux flux de travail des développeurs. Ces annonces arrivent alors que les Sommets AWS continuent d’engager les communautés du monde entier, attirant récemment des foules à Mexico et Jakarta, soulignant l’élan mondial de l’adoption et de l’innovation du cloud.
Parmi les développements les plus notables figure l’élargissement de la disponibilité des modèles open-weight d’OpenAI, spécifiquement gpt-oss-120b et gpt-oss-20b, sur AWS. Ces modèles offrent des performances robustes dans des domaines critiques comme le codage, l’analyse scientifique et le raisonnement mathématique, fournissant aux développeurs des outils puissants et personnalisables qui rivalisent avec les principales alternatives propriétaires. Cette démarche signale un engagement croissant à offrir diverses options d’IA au sein de l’écosystème AWS. En complément, AWS a rendu ses contrôles de raisonnement automatisé généralement disponibles en tant que nouvelle politique au sein des Garde-fous Amazon Bedrock. Cette fonctionnalité cruciale, prévisualisée pour la première fois à AWS re:Invent, permet aux organisations de valider la précision du contenu généré par de grands modèles de fondation par rapport à des connaissances spécifiques du domaine, aidant à atténuer les “hallucinations de l’IA” – instances où les systèmes d’IA produisent des sorties factuellement incorrectes ou insensées.
Renforçant davantage ses offres d’infrastructure, AWS a annoncé la disponibilité générale d’Amazon Elastic VMware Service (Amazon EVS). Ce nouveau service permet aux entreprises d’exécuter leurs environnements VMware Cloud Foundation (VCF) directement au sein de leur Amazon Virtual Private Cloud (VPC), rationalisant les opérations de cloud hybride et offrant une plus grande flexibilité pour la gestion des charges de travail virtualisées existantes. Pour les organisations priorisant la résilience, le basculement de région du contrôleur de récupération d’applications Amazon (ARC) a été dévoilé. Cette capacité entièrement gérée et hautement disponible fournit un cadre robuste pour planifier, pratiquer et orchestrer en toute confiance les opérations de basculement inter-régions, éliminant une grande partie de l’incertitude traditionnellement associée à la reprise après sinistre.
Au-delà de ces lancements majeurs, plusieurs améliorations visent à améliorer l’efficacité et l’expérience des développeurs. Amazon Simple Queue Service (SQS) a considérablement augmenté sa taille maximale de charge utile de message de 256 KiB à 1 MiB, permettant aux clients d’envoyer et de recevoir des messages plus volumineux via leurs files d’attente standard et FIFO. Les développeurs utilisant AWS Lambda bénéficieront désormais d’un support natif pour les actions GitHub, permettant le déploiement automatique des fonctions Lambda chaque fois que des modifications de code ou de configuration sont poussées vers un dépôt GitHub, rationalisant ainsi les pipelines d’intégration continue et de déploiement continu (CI/CD) pour les applications sans serveur. De plus, Amazon DynamoDB a introduit Console-to-Code, alimenté par Amazon Q Developer, simplifiant et accélérant la création de ressources DynamoDB à grande échelle en générant du code d’automatisation directement à partir des actions de la console.
La communauté AWS continue de prospérer, contribuant à des ressources précieuses et favorisant l’apprentissage. Les faits saillants récents incluent un cours complet sur l’IA conversationnelle avec Amazon Lex, développé par AWS Hero Faye Ellis, et le très attendu planificateur de sessions non officiel AWS re:Invent 2025, publié par AWS Community Builder Raphael Manke. Des histoires d’impact émergent également d’initiatives comme Educloud Academy, fondée par AWS Hero Rosius Ndimofor, qui fournit des plateformes éducatives pour les futurs professionnels du cloud.
Pour l’avenir, le calendrier est rempli d’opportunités d’engagement et d’apprentissage. AWS re:Invent 2025, la conférence annuelle phare, est prévue du 1er au 5 décembre à Las Vegas, promettant une semaine d’innovation collaborative et de discussions menées par des experts. Avant cela, les Sommets AWS se réuniront à São Paulo le 13 août et à Johannesburg le 20 août, offrant aux communautés locales une chance de se connecter et d’apprendre. De plus, des conférences dirigées par la communauté, connues sous le nom d’AWS Community Days, sont prévues dans diverses régions, notamment l’Australie (15 août), Adria (5 septembre), la Baltique (10 septembre), l’Aotearoa (18 septembre) et l’Afrique du Sud (20 septembre), offrant des informations techniques plus approfondies et des expériences pratiques.