Deep Cogito v2 : L'IA Open Source Affûte le Raisonnement, Boost l'Efficacité
Deep Cogito a annoncé la sortie de Cogito v2, une nouvelle collection de modèles d’IA open source conçus pour améliorer leurs propres capacités de raisonnement. La gamme, disponible sous licence open source, comprend quatre modèles d’IA de raisonnement hybride : deux versions de taille moyenne avec 70 milliards et 109 milliards de paramètres, et deux modèles plus grands de 405 milliards et 671 milliards de paramètres.
Le plus grand d’entre eux, un modèle de Mixture d’Experts (MoE) de 671 milliards de paramètres, est déjà reconnu comme l’une des IA open source les plus puissantes actuellement disponibles. Deep Cogito affirme que ce modèle phare rivalise efficacement avec les dernières offres de DeepSeek et réduit l’écart de performance avec des systèmes propriétaires avancés tels que O3 et Claude 4 Opus.
Cependant, l’avancée significative de Cogito v2 ne réside pas seulement dans sa taille ou sa puissance brute, mais dans un changement fondamental de la manière dont l’IA apprend. Plutôt que de simplement prolonger son temps de “réflexion” pendant l’inférence pour trouver une réponse, Cogito v2 est conçu pour internaliser ses propres processus de raisonnement.
Ce raisonnement internalisé est réalisé grâce à une technique appelée Distillation et Amplification Itérées (IDA). L’IDA fonctionne en distillant les découvertes faites lors d’un processus de recherche dans les paramètres centraux du modèle. L’objectif est de cultiver une “intuition” plus forte, permettant au modèle d’anticiper le résultat de son propre raisonnement sans avoir besoin d’exécuter toute la séquence de recherche.
Ce “pressentiment” raffiné de la bonne approche permet aux modèles d’IA open source de générer des chaînes de raisonnement qui seraient 60 % plus courtes que celles de concurrents comme DeepSeek R1, améliorant considérablement l’efficacité.
Cette efficacité s’étend également aux coûts de développement. Deep Cogito déclare que le total des dépenses combinées pour le développement de tous ses modèles, des expériences initiales à la formation finale, était inférieur à 3,5 millions de dollars. Bien qu’il s’agisse d’une somme substantielle, ce chiffre est notablement modeste par rapport aux vastes investissements généralement réalisés par de nombreux laboratoires de recherche en IA de premier plan.
Le modèle phare de 671 milliards de paramètres a fait l’objet d’une attention particulière lors de sa formation. Son développement s’est concentré non seulement sur l’amélioration de la précision de ses réponses finales, mais aussi sur le raffinement du processus de pensée lui-même. Cette approche encourage le modèle à suivre un chemin plus direct vers une solution, décourageant le raisonnement “errant” ou inefficace. Les données de performance indiquent l’efficacité de cette méthode, l’IA open source de Deep Cogito égalant ou surpassant les dernières versions de DeepSeek sur les benchmarks clés, tout en étant très proche des alternatives propriétaires.
L’un des résultats les plus surprenants de ce développement est la capacité émergente des modèles à raisonner sur des images, une compétence pour laquelle ils n’ont jamais été explicitement entraînés. L’équipe Deep Cogito a fourni un exemple où leur modèle d’IA open source a comparé deux images, l’une d’un canard et l’autre d’un lion. Il a démontré un processus de raisonnement approfondi concernant leurs habitats, couleurs et composition, purement par le biais de l’apprentissage par transfert. Deep Cogito pense que cette propriété inattendue pourrait offrir une méthode puissante pour amorcer les données d’entraînement pour les futurs systèmes de raisonnement multimodal.
Pour l’avenir, l’équipe Deep Cogito prévoit de continuer à tirer parti des progrès réalisés grâce à l’auto-amélioration itérative dans sa quête continue de la superintelligence. Ils ont réitéré leur engagement à ce que tous les modèles d’IA qu’ils créeront restent open source.