Anthropic lance Claude Opus 4.1 : IA améliorée pour le Code et la Raison
Anthropic, la startup d’IA soutenue par Google, a dévoilé Claude Opus 4.1, son modèle le plus récent et le plus avancé, spécifiquement conçu pour le développement logiciel. Cette mise à niveau significative de son modèle phare Claude Opus 4 promet des capacités de raisonnement améliorées, une performance de codage réelle plus robuste et des améliorations notables sur les principaux benchmarks de l’industrie. La société a indiqué que de nouvelles avancées de ses modèles sont anticipées dans les semaines à venir, signalant un rythme d’innovation accéléré.
Actuellement, Claude Opus 4.1 est accessible aux abonnés payants de Claude Code et est également disponible via l’API d’Anthropic, Amazon Bedrock et Vertex AI de Google Cloud. Malgré ses capacités améliorées, le nouveau modèle conserve la même structure tarifaire que son prédécesseur, Claude Opus 4. Au-delà de sa force principale dans le codage pratique, Opus 4.1 est conçu pour exceller dans des tâches complexes nécessitant une exécution autonome et multi-étapes (souvent appelées tâches agéntiques), une recherche approfondie et une analyse de données détaillée. Sa compétence s’étend à l’identification de corrélations complexes au sein des bases de code et à la facilitation du refactoring de code multi-fichiers, des tâches qui exigent une attention méticuleuse aux détails.
Les gains de performance de Claude Opus 4.1 sont évidents à travers plusieurs benchmarks. Son score au test vérifié SWE-bench, une mesure critique pour la compétence en codage, est passé de 72,5 % à 74,5 %. De plus, le modèle a démontré des performances améliorées dans une série d’autres évaluations exigeantes, y compris celles pour le raisonnement mathématique, le codage de terminal agéntique (TerminalBench), la réponse aux questions et le raisonnement à usage général (GPQA), et le raisonnement visuel (MMMU). Les retours des premiers utilisateurs corroborent ces améliorations, soulignant son efficacité dans des scénarios de développement réels.
Plus tôt cette année, Anthropic a introduit Claude Opus 4, qui était alors positionné comme un modèle de pointe pour les tâches de codage complexes et de longue durée, ainsi que les workflows d’agent. La succession rapide d’Opus 4.1 souligne les efforts intensifiés d’Anthropic pour maintenir son avantage concurrentiel dans le paysage farouchement disputé de l’intelligence artificielle.
Dans un mouvement qui élargit sa portée au sein de la communauté des développeurs, Claude Opus 4.1 est également intégré aux plans GitHub Copilot Enterprise et Pro+. Les développeurs peuvent accéder au modèle dans GitHub Copilot Chat sur github.com, Visual Studio Code et GitHub Mobile via le sélecteur de modèle de chat. Bien que Claude Opus 4 restera disponible pour une brève période, GitHub a annoncé sa dépréciation dans les 15 jours, exhortant les utilisateurs à passer à la nouvelle version. Cette sortie stratégique intervient quelques jours seulement avant qu’OpenAI ne devrait annoncer GPT-5, un modèle très attendu qui redéfinira sans aucun doute la dynamique concurrentielle entre les principaux acteurs de l’IA dans les domaines du codage et du développement logiciel. La mise à niveau proactive d’Anthropic avec Opus 4.1 la positionne directement dans la course à la suprématie de l’IA dans l’espace des outils pour développeurs.