La Stratégie IA de l'Inde : Allier Modèles Mondiaux et Innovation Locale
Le récent retrait des services cloud de Microsoft au raffineur indien Nayara Energy, soutenu par la Russie, a souligné une vulnérabilité critique : les risques associés à une dépendance excessive vis-à-vis des infrastructures technologiques étrangères. Cet incident a amplifié la poussée stratégique de l’Inde pour développer ses propres capacités fondamentales en intelligence artificielle, une entreprise qui pourrait servir de modèle pour d’autres nations du Sud Global.
L’Inde fait face à un défi unique en matière de développement de l’IA en raison de sa profonde diversité linguistique, englobant 22 langues officielles et des centaines de dialectes parlés. Construire des systèmes d’IA capables de naviguer dans ce paysage multilingue est une tâche monumentale. Pourtant, une stratégie duale pragmatique émerge, où les startups indiennes affinent simultanément les modèles open source mondiaux pour des applications immédiates tout en construisant minutieusement des modèles fondamentaux indigènes à partir de zéro.
Lors de l’événement I/O Connect de Google à Bengaluru, cette approche stratifiée était évidente. Des startups comme Sarvam AI ont présenté Sarvam-Translate, un modèle multilingue affiné à l’aide de Gemma, le grand modèle linguistique (LLM) open source de Google. De même, CoRover a démontré BharatGPT, un chatbot fournissant des services publics, y compris pour l’Indian Railway Catering and Tourism Corporation (IRCTC), également construit sur un modèle affiné. Ces efforts, soutenus par Google, peuvent sembler paradoxaux étant donné que Sarvam, Soket AI et Gnani font également partie des quatre startups chargées de développer les LLM souverains de l’Inde dans le cadre de la Mission IndiaAI de 10 300 crores de roupies.
La raison de cette double approche est enracinée dans la nécessité. Développer des modèles d’IA compétitifs à partir de zéro est gourmand en ressources, exigeant de vastes ensembles de données, une infrastructure de calcul avancée et une recherche approfondie. L’Inde, avec son écosystème technologique en évolution et ses demandes de marché urgentes, ne peut se permettre de construire isolément. Au lieu de cela, l’affinage des grands modèles linguistiques existants – en les spécialisant avec des données locales ciblées – offre une voie pragmatique pour résoudre les problèmes du monde réel aujourd’hui. Cela permet aux startups de démarrer les déploiements initiaux, de recueillir les commentaires des utilisateurs et de développer une expertise spécifique au domaine tout en construisant simultanément les pipelines de données et l’infrastructure nécessaires pour des modèles véritablement indépendants.
Le projet EKA, une initiative open source menée par Soket AI en partenariat avec des instituts indiens de premier plan comme l’IIT Gandhinagar et l’IISc Bangalore, illustre l’ambition souveraine. Conçu de toutes pièces avec du code, une infrastructure et des pipelines de données entièrement d’origine indienne, EKA vise à livrer un modèle de 7 milliards de paramètres en quelques mois, avec un modèle plus grand de 120 milliards de paramètres prévu. Cette initiative se concentre sur des domaines critiques tels que l’agriculture, le droit, l’éducation et la défense, garantissant que la formation se déroule sur le cloud GPU de l’Inde et que les modèles résultants sont open source. Pourtant, le co-fondateur de Soket AI, Abhishek Upperwal, clarifie que l’utilisation de Gemma pour les déploiements initiaux est une mesure temporaire, une façon de “démarrer et de passer à des piles souveraines lorsque cela est prêt”, plutôt qu’une dépendance à long terme. BharatGPT de CoRover suit une trajectoire similaire, tirant parti de modèles affinés pour les applications gouvernementales actuelles tout en développant également son propre LLM fondamental avec des ensembles de données indiens, traitant les déploiements actuels comme des voies à la fois pour la prestation de services et la création d’ensembles de données.
Pour l’Inde, le développement de ses propres capacités d’IA transcende la fierté nationale ; il s’agit de résoudre des problèmes que les modèles étrangers ne peuvent souvent pas aborder adéquatement. Imaginez un travailleur migrant dans la campagne du Maharashtra, ne comprenant que l’hindi, essayant de comprendre l’explication assistée par IA d’un médecin sur une radiographie en anglais, basée sur des hypothèses médicales occidentales. De tels scénarios mettent en évidence une inadéquation fondamentale dans l’ancrage culturel, physiologique et contextuel. L’Inde a besoin d’outils d’IA qui comprennent les termes médicaux locaux en Maithili, fournissent des conseils sur les cultures alignés sur les calendriers d’irrigation spécifiques à l’État et traitent les requêtes des citoyens dans 15 langues avec des variations régionales. Ce sont des cas d’utilisation quotidiens à fort impact où les erreurs peuvent directement affecter les moyens de subsistance, les services publics et les résultats en matière de santé. L’affinage des modèles ouverts fournit une solution immédiate à ces besoins urgents, jetant simultanément les bases d’une pile d’IA véritablement souveraine.
La Mission IndiaAI est une réponse stratégique à une préoccupation géopolitique grandissante. Alors que les systèmes d’IA deviennent partie intégrante de la gouvernance, de l’éducation, de l’agriculture et de la défense, la dépendance vis-à-vis des plateformes étrangères pose des risques d’exposition des données et de perte de contrôle, comme l’a démontré l’incident de Nayara Energy. De plus, la plupart des modèles d’IA mondiaux sont entraînés sur des ensembles de données occidentaux, principalement en anglais, ce qui les rend mal équipés pour gérer la diversité linguistique de l’Inde ou les subtilités de ses jugements juridiques et de ses pratiques agricoles.
Bien qu’une autosuffisance complète en IA soit irréalisable pour toute nation, y compris les puissances mondiales, l’approche de l’Inde consiste à maximiser le choix et à réduire les dépendances. Amlan Mohanty, expert en politique technologique, souligne que la souveraineté réside dans le contrôle de l’infrastructure et la définition des conditions. Il note que la position pragmatique et technologiquement agnostique du gouvernement indien est façonnée par des contraintes telles que la rareté des ensembles de données indiens de haute qualité, la capacité de calcul et les alternatives open source facilement disponibles et adaptées à l’Inde.
En effet, le manque de données d’entraînement de haute qualité, en particulier dans les langues indiennes, reste un obstacle important. Manish Gupta de Google DeepMind India souligne que 72 langues indiennes avec plus de 100 000 locuteurs n’ont pratiquement aucune présence numérique. Des initiatives comme le Project Vaani de Google, en collaboration avec l’Indian Institute of Science (IISc), visent à combler cette lacune en collectant de grandes quantités d’échantillons vocaux dans des centaines de districts indiens, même pour des langues qui manquaient auparavant de jeux de données numériques. Ces données, associées aux capacités de transfert interlinguistique de Google, aident à améliorer les performances dans les langues à faibles ressources et sont incorporées dans des modèles comme Gemma, que les startups indiennes utilisent.
La stratégie stratifiée de l’Inde offre une feuille de route convaincante pour d’autres nations du Sud Global confrontées à des contraintes similaires. Elle fournit un modèle pour la construction de systèmes d’IA qui reflètent les langues, les contextes et les valeurs locales sans nécessiter d’immenses budgets de calcul ou d’écosystèmes de données matures dès le départ. D’ici 2026, alors que les LLM souverains de l’Inde comme EKA devraient être prêts pour la production, cette double voie devrait converger, les systèmes nationaux remplaçant progressivement les modèles de démarrage.
Cependant, même si les startups indiennes s’appuient sur des outils ouverts de géants technologiques mondiaux, la question de la dépendance à long terme persiste. Le contrôle de l’architecture, des techniques d’entraînement et du support d’infrastructure reste en grande partie entre les mains des GAFAM. Bien que Google ait ouvert des ensembles de données et se soit associé à des startups de la Mission IndiaAI, les conditions de cette ouverture peuvent ne pas toujours être symétriques. Les ambitions souveraines de l’Inde dépendent finalement de sa capacité à dépasser ces modèles ouverts. La question critique pour l’Inde et les autres nations du Sud Global est de savoir si elles peuvent convertir ce soutien emprunté en une infrastructure d’IA complète et souveraine avant que les conditions d’accès ne changent ou que la fenêtre d’opportunité ne se ferme.