Google lance Gemma 3 270M : une IA open-source minuscule pour smartphones

Venturebeat

L’équipe de recherche en IA de Google DeepMind a introduit Gemma 3 270M, un nouveau modèle d’IA open-source conçu pour une efficacité exceptionnelle et des performances sur l’appareil. Ce modèle, nommé d’après ses 270 millions de paramètres — les réglages internes qui régissent le comportement d’un modèle — contraste fortement avec les grands modèles de langage (LLM) de plusieurs milliards de paramètres qui dominent généralement le paysage de l’IA. Tandis qu’un nombre plus élevé de paramètres équivaut généralement à des modèles plus puissants, Gemma 3 270M privilégie un autre type de puissance : la capacité de fonctionner directement sur les smartphones et autres matériels légers sans connexion internet, comme démontré lors de tests internes sur un processeur Pixel 9 Pro.

Malgré sa taille minuscule, Gemma 3 270M est conçu pour gérer des tâches complexes et spécifiques à un domaine et peut être rapidement affiné, souvent en quelques minutes, pour répondre aux exigences précises d’une entreprise ou d’un développeur indépendant. Omar Sanseviero, ingénieur en relations avec les développeurs IA chez Google DeepMind, a en outre souligné la polyvalence du modèle sur le réseau social X, notant sa capacité à fonctionner directement dans le navigateur web d’un utilisateur, sur un Raspberry Pi, et même, avec humour, “dans votre grille-pain”, soulignant son adaptabilité aux environnements très contraints en ressources.

L’architecture du modèle combine 170 millions de paramètres d’intégration, soutenus par un vocabulaire substantiel de 256 000 tokens capable de traiter des termes rares et spécifiques, avec 100 millions de paramètres de blocs de transformateurs supplémentaires. Google affirme que cette conception facilite de solides performances sur les tâches de suivi d’instructions dès la sortie de la boîte, tout en restant suffisamment petit pour un réglage fin et un déploiement rapides sur des appareils dotés de ressources computationnelles limitées, y compris le matériel mobile. Gemma 3 270M hérite de son architecture fondamentale et de son pré-entraînement des modèles Gemma 3 plus grands, assurant une compatibilité transparente à travers l’écosystème Gemma plus large. Les développeurs peuvent tirer parti d’une documentation complète, de recettes de réglage fin et de guides de déploiement pour des outils populaires comme Hugging Face, UnSloth et JAX, accélérant la transition des étapes expérimentales au déploiement pratique.

En termes de performances, le modèle Gemma 3 270M, réglé pour les instructions, a obtenu un score de 51,2 % sur le benchmark IFEval, qui évalue la maîtrise d’un modèle à suivre des instructions. Ce score le positionne significativement devant d’autres modèles de taille similaire, tels que SmolLM2 135M Instruct et Qwen 2.5 0.5B Instruct, et approche les niveaux de performance de certains modèles à milliards de paramètres, selon les données comparatives de Google. Cependant, des chercheurs et des dirigeants de la startup d’IA rivale Liquid AI ont rapidement souligné sur X que la comparaison de Google omettait leur propre modèle LFM2-350M, lancé en juillet, qui affiche un score plus élevé de 65,12 % avec seulement légèrement plus de paramètres.

L’un des attributs les plus convaincants de Gemma 3 270M est son efficacité énergétique exceptionnelle. Lors de tests internes, une version du modèle optimisée pour la précision INT4 a consommé seulement 0,75 % de l’autonomie de la batterie d’un Pixel 9 Pro sur 25 conversations. Cela en fait un choix éminemment pratique pour les applications d’IA sur l’appareil, en particulier lorsque la confidentialité de l’utilisateur et la fonctionnalité hors ligne sont primordiales. Le package de publication comprend à la fois un modèle pré-entraîné pour les tâches générales et une variante réglée pour les instructions, offrant une utilité immédiate aux développeurs. De plus, des points de contrôle QAT (Quantization-Aware Trained) sont disponibles, permettant une précision INT4 avec une dégradation minimale des performances, ce qui est crucial pour les déploiements de production dans des environnements aux ressources limitées.

Google positionne Gemma 3 270M comme un témoignage de sa philosophie de sélection de l’outil approprié pour une tâche donnée, plutôt que de se rabattre sur le plus grand modèle disponible. Pour des fonctions spécifiques comme l’analyse de sentiments, l’extraction d’entités, le routage de requêtes, la génération de texte structuré, les contrôles de conformité et même l’écriture créative, l’entreprise soutient qu’un petit modèle finement réglé peut fournir des résultats plus rapides et plus rentables qu’un grand modèle à usage général. Cette spécialisation s’est avérée efficace lors de collaborations passées, telles que le travail d’Adaptive ML avec SK Telecom, où un modèle Gemma 3 4B finement réglé a surpassé des systèmes propriétaires beaucoup plus grands pour la modération de contenu multilingue. Gemma 3 270M est conçu pour faciliter des succès similaires à une échelle encore plus petite, permettant la création de modèles spécialisés adaptés à des tâches individuelles.

Au-delà des applications d’entreprise, le modèle démontre également un potentiel dans des scénarios créatifs. Une vidéo de démonstration présente une application de Générateur d’Histoires pour Enfants construite avec Gemma 3 270M et Transformers.js, fonctionnant entièrement hors ligne dans un navigateur web. L’application permet aux utilisateurs de sélectionner un personnage principal, un cadre, un rebondissement, un thème et la longueur souhaitée, puis génère une histoire cohérente et imaginative basée sur ces entrées. Cet exemple puissant illustre comment Gemma 3 270M peut alimenter des applications engageantes et interactives sans dépendre de l’infrastructure cloud, ouvrant de nouvelles voies pour les expériences d’IA sur l’appareil.

Gemma 3 270M est publié sous les Conditions d’utilisation de Gemma, qui autorisent l’utilisation, la reproduction, la modification et la distribution du modèle et de ses dérivés, à condition que certaines conditions soient remplies. Ces conditions incluent l’adhésion à la Politique d’utilisation interdite de Google, la garantie que les destinataires en aval sont informés des conditions, et l’indication claire de toute modification. Bien que ce modèle de licence ne soit pas “open source” au sens traditionnel, il permet largement l’utilisation commerciale sans nécessiter de licence payante distincte. Les entreprises peuvent intégrer le modèle dans des produits, le déployer dans le cadre de services cloud, ou le régler finement en dérivés spécialisés, conservant tous les droits sur le contenu généré par le modèle. Cependant, les développeurs portent la responsabilité de garantir la conformité avec les lois applicables et d’éviter les utilisations interdites, telles que la génération de contenu nuisible ou la violation des réglementations de confidentialité.

Avec le “Gemmaverse” dépassant les 200 millions de téléchargements et la gamme Gemma s’étendant à travers des variantes optimisées pour le cloud, le bureau et le mobile, les développeurs de Google AI positionnent stratégiquement Gemma 3 270M comme un élément fondamental pour le développement de solutions d’IA rapides, rentables et axées sur la confidentialité.