Peter Wang (Anaconda) : L'Open Source, Clé de l'Innovation en IA

Thenewstack

Le distributeur commercial de Python, Anaconda, s’est de plus en plus positionné comme une entreprise d’outils d’IA, consolidant son rôle dans l’écosystème en évolution rapide de l’intelligence artificielle. Alors que la poursuite de modèles d’IA de pointe est gourmande en ressources et offre des retours incertains, Anaconda propose une approche alternative avec sa nouvelle plateforme d’IA, conçue pour rationaliser le travail fondamental impliqué dans le développement de l’IA.

Lors de la récente conférence PyCon, Peter Wang, cofondateur et directeur de l’IA et de l’innovation chez Anaconda, a discuté du virage stratégique de l’entreprise, de sa nouvelle plateforme d’IA et du rôle essentiel que joue l’open source dans le paysage de l’IA.

Leçons de l’Incubateur d’IA

Quelques années auparavant, Anaconda a lancé un Incubateur d’IA, qui a depuis été déclassé. Malgré sa brève existence, Wang a noté son utilité durant une période de croissance explosive de l’IA. Il a décrit 2023 comme “il y a une éternité” en raison du rythme rapide de l’innovation. En tant qu’entreprise établie avec des produits et des clients existants, Anaconda devait expérimenter pour discerner des stratégies efficaces au milieu du battage médiatique de l’IA.

L’incubateur a exploré plusieurs domaines clés jugés cruciaux pour l’avenir de l’IA. Ceux-ci incluaient l’IA décentralisée et les modèles plus petits, l’interprétabilité (comprendre comment les modèles prennent des décisions) et les implications légales de l’entraînement des modèles sur divers ensembles de données. Un accent significatif a également été mis sur l’évolution de la définition de l’open source dans un contexte d’IA, en particulier lorsque l’actif principal passe du code source aux données, qui manquent souvent de transparence. Wang a souligné le problème des modèles à “poids ouverts” commercialisés comme open source, malgré le fait que les données d’entraînement sous-jacentes restent propriétaires. Malgré un certain “désordre chaotique” interne, l’incubateur a réussi à accélérer l’innovation en IA et à intégrer les apprentissages dans les produits d’Anaconda.

Présentation de la Plateforme d’IA d’Anaconda

Anaconda a récemment lancé sa Plateforme d’IA, qui a été décrite comme “le GitHub du développement open source d’entreprise”. Wang a précisé que la vision de la plateforme s’étend au-delà de cette comparaison. Il a souligné que l’avenir des systèmes d’information en IA sera une “fusion, une combinaison de code et de données”. Contrairement au développement logiciel traditionnel, la gestion des systèmes d’IA implique non seulement le code et le déploiement, mais aussi une évaluation continue des performances à une échelle beaucoup plus grande, souvent par des utilisateurs non traditionnels comme les utilisateurs finaux plutôt que seulement les ingénieurs en apprentissage automatique ou les scientifiques des données.

Alors que des plateformes comme GitHub excellent dans la collaboration de code source et que Hugging Face sert de référentiel pour les modèles, une solution holistique est nécessaire pour rassembler tous ces composants pour une application pratique. La Plateforme d’IA d’Anaconda vise à être cet environnement unifié, répondant aux défis de la gestion de l’ensemble du cycle de vie des systèmes et agents d’IA — de la combinaison du code, des dépendances open source et des modèles, au déploiement, au retour en arrière et à la reproductibilité. Wang a souligné que si les problèmes techniques individuels (comme le versionnement ou le déploiement de modèles) ont de multiples solutions, le grand nombre d’approches crée une complexité pour les entreprises cherchant à fournir une plateforme cohérente pour divers utilisateurs. L’objectif global de la Plateforme d’IA est de fournir un espace unique et intégré aux entreprises pour garantir l’intégrité et la surveillance de leurs systèmes d’IA, en s’appuyant sur la vaste expérience d’Anaconda dans les plateformes et les flux de travail de science des données.

Cette plateforme résonne avec la motivation initiale d’Anaconda en 2012 : simplifier la distribution Python et la gestion des packages, en particulier pour les entreprises confrontées aux contraintes informatiques centrales. Tout comme les entreprises avaient besoin d’un moyen simplifié de gérer les logiciels open source, elles ont maintenant besoin d’une solution similaire pour les composants d’IA.

Le Rôle Essentiel de l’Open Source dans l’IA

Wang a fortement plaidé en faveur de l’importance de l’open source en IA, abordant deux aspects distincts mais liés : la transparence et les avantages plus larges de l’ouverture.

Premièrement, il a souligné la nécessité de la transparence et de la gouvernabilité en IA. Cela signifie savoir quelles données ont servi à entraîner un modèle et comment le code calcule les résultats. Bien que l’open source complet y parvienne, la transparence peut également être assurée par des “étiquettes d’ingrédients” – fournissant suffisamment d’informations pour la reddition de comptes sans nécessairement révéler chaque détail propriétaire. Wang a soutenu que pour les systèmes d’IA prenant des décisions importantes, la transparence est une “exigence évidente, nécessaire et non négociable”. Il a suggéré que la résistance à la transparence provient principalement des entreprises fortement capitalisées cherchant à dominer la conversation.

Deuxièmement, au-delà de la transparence, Wang a plaidé pour la demande continue de véritables modèles open source en raison de l’immense puissance, de l’impact et du stade précoce de développement de l’IA. Il considère l’open source comme profondément “pro-marché” et “pro-humanité”. Contrairement à l’idée fausse historique selon laquelle l’open source est anticapitaliste, Wang le voit comme un “marché d’idées” qui favorise l’innovation. En permettant à une communauté mondiale d’individus intelligents d’adopter, d’utiliser et de construire sur les technologies d’IA, l’open source génère un “effet N au carré de l’innovation”. Cela conduit à des avancées moins chères, plus rapides et plus rentables par rapport à l’innovation confinée à quelques grandes entreprises.

Leçons pour les Entreprises d’IA Open Source

Wang a noté que les entreprises d’IA open source diffèrent considérablement des entreprises de logiciels open source traditionnelles, qui sont déjà rares et difficiles à développer. La principale différence réside dans la “pré-commodification” de l’innovation en open source. Alors que l’innovation commande généralement un prix, l’open source permet une innovation collaborative et gratuite. Par conséquent, les entreprises d’IA open source prospères doivent monétiser le “complément” – les services, plateformes et support environnants qui rendent l’innovation gratuite utilisable et précieuse.

Commencer avec l’IA

Pour les organisations, entreprises et startups cherchant à adopter l’IA, Anaconda propose diverses portes d’entrée. Les utilisateurs peuvent télécharger Anaconda pour exécuter des modèles d’IA localement, garantissant la confidentialité des données en évitant les téléchargements sur le cloud. Pour ceux qui sont à l’aise avec les services cloud, Anaconda fournit une assistance au codage IA dans les notebooks Jupyter et permet le développement Python sans serveur via PyScript.

Pour les entreprises nécessitant un déploiement d’IA sur site ou privé, Anaconda propose sa plateforme d’entreprise IA, offrant la flexibilité d’exécuter l’IA en toute sécurité selon leurs propres termes ou de tirer parti de modèles cloud propriétaires. Reconnaissant que de nombreuses organisations opèrent des configurations hybrides (locales, sur site, cloud), la plateforme d’Anaconda permet un développement d’IA portable dans ces environnements.

Wang a réitéré la stratégie du “complément” : alors que l’entraînement de modèles frontières massifs est “sexy” et poursuivi par des entités bien financées qui souvent distribuent gratuitement des modèles, Anaconda se concentre sur la résolution des défis pratiques. Cela inclut la fourniture de solutions pour l’exécution d’inférences et le réglage fin des modèles sur du matériel moins puissant, l’offre de réglage fin en un clic et le guidage des utilisateurs avec les meilleures pratiques pour des implémentations telles que la Génération Augmentée par Récupération (RAG). Ces services complémentaires, unifiés via la plateforme d’IA d’entreprise d’Anaconda, permettent aux entreprises d’exploiter efficacement la puissance de l’innovation en IA.