Un laboratoire d'IA avec des agents LLM découvre des molécules antivirales
Dans une avancée significative pour l'intelligence artificielle en recherche scientifique, une équipe d'agents IA autonomes, propulsés par GPT-4o, a réussi à développer et à valider expérimentalement des nanocorps capables de bloquer le SARS-CoV-2. Cette percée, détaillée dans un article récent publié dans Nature par des chercheurs de l'Université de Stanford et du Chan Zuckerberg Biohub, marque une nouvelle ère où l'IA va au-delà de l'analyse de données et de la simulation pour diriger et exécuter activement des projets scientifiques complexes, produisant des résultats tangibles et cliniquement pertinents.
Le nouveau système, baptisé "Laboratoire Virtuel", démontre qu'un chercheur humain, collaborant avec une équipe d'agents de modèles de langage étendus (LLM), peut concevoir de nouveaux nanocorps — de petites protéines semblables à des anticorps conçues pour se lier et inhiber la fonction d'autres protéines. Le défi spécifique abordé était de cibler les variants du SARS-CoV-2 en mutation rapide, tels que KP.3 et JN.1, qui ont développé une résistance aux traitements existants. Il ne s'agissait pas d'une simple interaction de chatbot, mais d'un processus de recherche complexe et multifase piloté par des agents IA, chacun possédant une expertise spécialisée et un rôle défini. Le résultat : des molécules biologiques validées dans le monde réel avec un potentiel pour des études en aval dans le traitement des maladies.
Des assistants aux chercheurs autonomes
Contrairement aux applications précédentes où les LLM servaient principalement d'outils de résumé, de support à l'écriture ou d'analyse de données de base, le Laboratoire Virtuel les élève au rang de chercheurs autonomes. Le concept central implique la simulation d'un laboratoire scientifique interdisciplinaire entièrement composé d'agents IA. Chaque agent est instancié à partir de GPT-4o et se voit attribuer une persona scientifique spécifique, telle qu'un immunologiste, un biologiste computationnel ou un spécialiste en apprentissage automatique, grâce à une ingénierie d'invites minutieuse.
L'équipe est supervisée par un Agent Chercheur Principal (PI) virtuel et un Agent Critique Scientifique. L'agent PI dirige l'orientation de la recherche, tandis que l'Agent Critique joue un rôle crucial en remettant en question les hypothèses et en identifiant les erreurs potentielles, agissant comme un relecteur sceptique interne – une fonction que le document souligne comme essentielle au succès du projet. Le rôle du chercheur humain est de définir des questions de recherche de haut niveau, d'introduire des contraintes spécifiques au domaine et, finalement, de mener les expériences de laboratoire humide nécessaires pour valider les résultats computationnels de l'IA.
Le processus de conception des nanocorps
Face à la tâche de concevoir des nanocorps pour les variants évolués du SARS-CoV-2, les agents IA ont décidé de manière autonome de muter des nanocorps existants qui étaient efficaces contre les souches ancestrales mais avaient perdu leur efficacité. Leur décision a été motivée par le potentiel de délais plus rapides et la disponibilité de données structurelles existantes.
Le chercheur humain a initié le projet en définissant uniquement les agents PI et Critique. L'agent PI a ensuite assemblé l'équipe scientifique spécialisée, générant un Immunologiste, un Spécialiste en Apprentissage Automatique et un Biologiste Computationnel. Lors d'une réunion d'équipe collaborative, les agents ont débattu de l'approche optimale, choisissant finalement la mutation de nanocorps plutôt que la conception de novo. Ils ont ensuite sélectionné des outils computationnels, notamment le modèle de langage de protéines ESM pour évaluer les mutations ponctuelles, AlphaFold-Multimer pour prédire les structures protéiques et Rosetta pour calculer les énergies de liaison. Les agents ont décidé de mettre en œuvre leur stratégie en utilisant du code Python, qui a subi plusieurs cycles de révision et de raffinement par l'agent Critique lors de réunions asynchrones.
Le pipeline computationnel conçu par l'agent PI était itératif : ESM a évalué les mutations ponctuelles sur les séquences de nanocorps, les structures des meilleurs mutants ont été prédites par AlphaFold-Multimer, les interfaces ont été évaluées à l'aide d'ipLDDT, et Rosetta a estimé l'énergie de liaison. Ces scores ont ensuite été combinés pour classer les mutations proposées, le cycle se répétant pour introduire d'autres mutations si nécessaire.
Résultats et efficacité
Ce pipeline computationnel sophistiqué a généré 92 séquences de nanocorps. Celles-ci ont ensuite été synthétisées et testées expérimentalement dans un laboratoire physique. Les résultats ont été prometteurs : la plupart des séquences générées se sont avérées être des protéines productibles et gérables. De manière cruciale, deux de ces protéines ont réussi à acquérir une affinité pour les protéines du SARS-CoV-2 auxquelles elles étaient conçues pour se lier, démontrant leur efficacité contre les formes mutantes modernes et ancestrales du virus.
Les taux de succès obtenus par le Laboratoire Virtuel étaient comparables à ceux des projets analogues menés par des équipes humaines. Cependant, l'approche pilotée par l'IA a considérablement réduit le temps nécessaire à la réalisation et potentiellement les coûts globaux en raison d'une implication humaine réduite.
Imiter la collaboration humaine
Le modèle opérationnel du Laboratoire Virtuel reflète étroitement la collaboration scientifique humaine. Il utilise des réunions interdisciplinaires structurées : des "Réunions d'Équipe" pour des discussions larges, où le PI dirige, d'autres contribuent et le Critique révise ; et des "Réunions Individuelles" où un seul agent, parfois avec le Critique, se concentre sur des tâches spécifiques comme le codage ou l'évaluation des résultats. Pour atténuer les problèmes tels que les "hallucinations" ou les incohérences de l'IA, le système utilise également des réunions parallèles où la même tâche est exécutée plusieurs fois avec des paramètres variés. Les résultats sont ensuite consolidés dans une unique "réunion de fusion" plus déterministe pour tirer les conclusions les plus cohérentes.
En termes d'effort humain, la phase computationnelle du projet a nécessité remarquablement peu d'intervention humaine directe. Les agents LLM ont rédigé 98,7 % du total des mots (plus de 120 000 tokens), tandis que le chercheur humain n'a contribué qu'à 1 596 mots sur l'ensemble du projet. Les agents ont écrit tous les scripts pour les outils computationnels, l'humain facilitant principalement l'exécution du code et les expériences en conditions réelles. L'ensemble du pipeline du Laboratoire Virtuel a été mis en place en 1 à 2 jours de prompts et de réunions, et le calcul de la conception des nanocorps a été achevé en environ une semaine.
L'avenir de la science autonome
Le Laboratoire Virtuel représente un prototype pour un paradigme de recherche fondamentalement nouveau, où les tâches computationnelles sont automatisées, laissant les humains se concentrer sur les décisions critiques et l'orientation de haut niveau. Cela signale un changement pour les LLM, passant d'outils passifs à des collaborateurs actifs et autonomes capables de piloter des projets complexes et interdisciplinaires de la conception à la mise en œuvre.
La prochaine frontière ambitieuse pour ce modèle est l'automatisation des expériences en laboratoire humide par le biais de techniciens de laboratoire robotiques. Imaginez un pipeline de recherche entièrement autonome : un PI humain définit un objectif biologique de haut niveau ; une équipe d'agents IA recherche les informations existantes, brainstorme des idées, sélectionne des outils computationnels, écrit et exécute du code, et propose des expériences ; des techniciens de laboratoire robotiques réalisent ensuite les protocoles physiques — pipetage, centrifugation, imagerie et collecte de données ; enfin, les résultats retournent au Laboratoire Virtuel, où les agents IA analysent, adaptent et itèrent, bouclant ainsi la boucle de découverte.
Les laboratoires de biologie robotiques sont déjà en développement, avec des entreprises comme Emerald Cloud Lab, Strateos et Colabra (anciennement Transcriptic) qui proposent un "laboratoire humide en tant que service". Des organisations à but non lucratif comme Future House construisent des agents IA pour la recherche automatisée, tandis que certaines institutions universitaires possèdent des laboratoires de chimie autonomes. Cette intégration de l'IA intelligente avec l'automatisation robotique pourrait transformer radicalement le progrès scientifique et technologique. Un tel système pourrait fonctionner 24h/24 et 7j/7 sans fatigue, mener des milliers de micro-expériences parallèles et explorer rapidement de vastes espaces d'hypothèses actuellement irréalisables pour les laboratoires humains.
Bien que des défis subsistent — la science du monde réel est intrinsèquement complexe, les protocoles robotiques doivent être très robustes et les erreurs inattendues nécessitent toujours un jugement humain — l'évolution continue de l'IA et de la robotique devrait réduire ces écarts. Ce développement souligne un profond changement dans les capacités de l'intelligence artificielle, démontrant sa capacité non seulement à aider aux tâches physiques répétitives, mais aussi à exceller dans certaines des entreprises intellectuellement les plus exigeantes de l'humanité, inaugurant une ère où l'IA posera de plus en plus de questions, argumentera, débattra, décidera et, finalement, découvrira.