DeepSeek V3.1 : L'IA open-source puissante qui défie OpenAI

Venturebeat

Le paysage de l’intelligence artificielle est en pleine mutation avec la récente sortie de DeepSeek V3.1, un modèle d’IA open-source colossal de 685 milliards de paramètres, développé par la société chinoise DeepSeek. Lancée le 19 août 2025, cette nouvelle itération est prête à intensifier la concurrence mondiale dans l’IA générative, défiant directement les acteurs établis comme OpenAI et Anthropic en offrant des performances révolutionnaires et une technologie accessible.

DeepSeek V3.1 arrive avec une série d’améliorations conçues pour repousser les limites des grands modèles linguistiques. Une caractéristique remarquable est sa fenêtre de contexte étendue, capable de traiter jusqu’à 128 000 tokens, ce qui correspond à environ 96 000 mots – l’équivalent de deux romans anglais de 200 pages. Cette capacité substantielle permet au modèle de gérer de plus grands volumes d’informations, de maintenir des conversations plus étendues et cohérentes, et de fournir des réponses plus nuancées en conservant une meilleure compréhension contextuelle. De plus, DeepSeek revendique des avancées significatives en matière de capacités de raisonnement, les tests montrant une amélioration allant jusqu’à 43 % dans le raisonnement en plusieurs étapes par rapport à son prédécesseur, bien que certaines évaluations suggèrent des défis persistants avec des dilemmes très abstraits ou éthiques. Le modèle bénéficie également d’un support multilingue supérieur, maîtrisant plus de 100 langues avec une précision quasi native, et une réduction signalée de 38 % des hallucinations, améliorant ainsi sa fiabilité factuelle.

La sortie de DeepSeek V3.1 sous la licence MIT permissive sur Hugging Face souligne son engagement envers la philosophie open-source, le rendant librement disponible au téléchargement et à l’utilisation. Cette approche s’aligne sur la stratégie plus large de la Chine visant à favoriser l’adoption mondiale de ses technologies d’IA, en priorisant l’accessibilité généralisée sur les profits propriétaires immédiats. La société a précédemment démontré sa capacité à développer une IA avancée à une fraction du coût de ses homologues occidentaux ; par exemple, son modèle V3 aurait été entraîné pour seulement 6 millions de dollars américains, un contraste frappant avec les 100 millions de dollars américains estimés dépensés pour GPT-4 d’OpenAI en 2023. Cette efficacité-coût, obtenue avec beaucoup moins de puissance de calcul, positionne DeepSeek comme un formidable perturbateur dans l’industrie de l’IA.

Sur les bancs d’essai de performance, DeepSeek V3.1 présente un avantage concurrentiel dans plusieurs domaines cruciaux. Il a montré des résultats solides en compréhension générale du langage (MMLU), où son itération V3 a obtenu 88,5 %, surpassant légèrement le GPT-4o d’OpenAI. Dans les tâches de codage, en particulier sur le banc d’essai HumanEval, DeepSeek V3 a surpassé à la fois Claude 3.5 Sonnet et GPT-4o. Cependant, dans des tâches d’ingénierie logicielle plus complexes (SWE-bench Verified) et certains défis mathématiques, DeepSeek V3.1 est toujours en retrait par rapport aux meilleurs modèles propriétaires, ce qui indique des domaines pour un raffinement futur.

DeepSeek, fondée en juillet 2023 par Liang Wenfeng et financée par le fonds spéculatif chinois High-Flyer, est rapidement devenue un acteur clé dans le domaine de l’IA. La société a attiré l’attention internationale plus tôt cette année lorsque son chatbot DeepSeek-R1 est brièvement devenu l’application gratuite la plus téléchargée sur l’App Store d’Apple aux États-Unis, dépassant même ChatGPT. Cette ascension rapide n’a pas été sans examen minutieux ; des sénateurs américains ont soulevé des préoccupations concernant les vulnérabilités potentielles en matière de sécurité des données et le risque que les modèles d’IA open-source chinois soient exploités par l’armée chinoise. DeepSeek et ses partenaires cloud, y compris AWS, Microsoft Azure et Google Cloud, ont abordé certaines de ces préoccupations en s’assurant que les modèles comme R1 hébergés sur leurs plateformes sont localisés, empêchant l’envoi de données vers la Chine. Alors que la communauté de l’IA attend avec impatience la sortie de la prochaine itération majeure de DeepSeek, R2, la dernière offre de l’entreprise consolide sa position en tant que force puissante et rentable dans le paysage évolutif de l’intelligence artificielle ouverte.