Les angles morts biologiques de l'IA: La prédiction génique échoue
L’intelligence artificielle et l’apprentissage automatique ont remporté des succès véritablement spectaculaires dans le domaine de la biologie, de la conception d’enzymes capables de digérer les plastiques à l’ingénierie de protéines pouvant bloquer le venin de serpent. À une époque de battage médiatique apparemment illimité autour de l’IA, il pourrait être tentant de supposer que le simple fait de déchaîner de puissants algorithmes sur les immenses ensembles de données que nous avons déjà accumulés conduirait à une compréhension complète de la plupart des processus biologiques, nous permettant potentiellement de contourner les expériences laborieuses et les complexités éthiques de la recherche animale.
Cependant, la biologie englobe bien plus que de simples structures protéiques. Il est excessivement prématuré de suggérer que l’IA peut être également efficace pour aborder toutes les facettes de cette science complexe. Ce contexte rend une étude récente particulièrement intrigante. Des chercheurs ont évalué une suite de progiciels d’IA conçus pour prédire l’activité des gènes dans les cellules exposées à diverses conditions. Il s’est avéré que ces systèmes d’IA sophistiqués n’ont pas fait mieux qu’une méthode de prédiction délibérément simplifiée. Ces découvertes servent de rappel crucial que la biologie est incroyablement complexe, et que le succès dans le développement de systèmes d’IA pour un aspect biologique spécifique ne garantit pas leur applicabilité générale dans l’ensemble du domaine.
L’étude a été menée par un trio de chercheurs basés à Heidelberg : Constantin Ahlmann-Eltze, Wolfgang Huber et Simon Anders. Ils ont noté que plusieurs autres études, publiées alors que leurs travaux étaient en prépublication, sont parvenues à des conclusions globalement similaires. L’approche de l’équipe de Heidelberg est particulièrement directe, ce qui en fait une excellente illustration des limites actuelles.
Le logiciel d’IA examiné dans leurs recherches visait à prédire les changements dans l’activité génique. Bien que chaque cellule contienne des copies des quelque 20 000 gènes du génome humain, tous ne sont pas actifs à un moment donné. « Actif » dans ce contexte fait référence aux gènes produisant des ARN messagers (ARNm), qui sont cruciaux pour les fonctions cellulaires. Certains gènes sont constamment actifs à des niveaux élevés, fournissant des fonctions essentielles, tandis que d’autres ne sont actifs que dans des types de cellules spécifiques, tels que les cellules nerveuses ou cutanées, ou sont déclenchés par des conditions particulières comme un faible taux d’oxygène ou des températures élevées.
Au fil de nombreuses années, les scientifiques ont mené de nombreuses études pour cartographier l’activité de chaque gène dans divers types de cellules et sous différentes conditions. Ces investigations vont de l’utilisation de puces génétiques pour identifier les ARNm présents dans les populations cellulaires à la séquençage des ARNs de cellules individuelles pour localiser les gènes actifs. Collectivement, cette recherche a bâti une image large, bien qu’incomplète, reliant l’activité génique à diverses circonstances biologiques. Ce vaste référentiel de données pourrait, en théorie, être utilisé pour entraîner une IA à prédire l’activité génique dans des conditions non testées.
Ahlmann-Eltze, Huber et Anders ont spécifiquement testé ce que l’on appelle des modèles de fondation unicellulaires, qui ont été entraînés sur ce type de données d’activité génique. La désignation « unicellulaire » indique que les modèles ont appris de l’activité génique observée dans des cellules individuelles, plutôt que de la moyenne des populations cellulaires. Les « modèles de fondation » impliquent qu’ils ont été entraînés sur un large éventail de données, mais nécessitent un réglage fin supplémentaire pour des tâches spécifiques.
La tâche spécifique de ces modèles était de prédire comment l’activité génique pourrait changer lorsque les gènes sont intentionnellement altérés. Lorsqu’un seul gène est perdu ou activé, parfois seul l’ARNm de ce gène est affecté. Cependant, certains gènes codent des protéines qui régulent des collections entières d’autres gènes, entraînant des changements dans l’activité de dizaines de gènes. Dans d’autres cas, l’altération d’un gène peut impacter le métabolisme global d’une cellule, entraînant des changements généralisés dans l’activité génique. La complexité s’intensifie encore lorsque deux gènes sont impliqués. Souvent, leurs effets sont simplement additifs – la somme des changements causés par chaque altération individuelle. Mais si leurs fonctions se chevauchent, le résultat peut être une amélioration synergique de certains changements, la suppression d’autres, ou des modifications entièrement inattendues.
Pour explorer ces effets complexes, les chercheurs ont historiquement utilisé la technologie d’édition génique CRISPR pour altérer intentionnellement l’activité d’un ou plusieurs gènes. Ils séquencent ensuite tous les ARN cellulaires pour observer les changements résultants. Cette approche, appelée Perturb-seq, fournit des informations précieuses sur la fonction d’un gène au sein d’une cellule. Pour Ahlmann-Eltze, Huber et Anders, elle a fourni les données cruciales nécessaires pour déterminer si les modèles de fondation choisis pouvaient être entraînés pour prédire ces changements en aval dans d’autres activités géniques.
En partant des modèles de fondation pré-entraînés, les chercheurs ont effectué un entraînement supplémentaire en utilisant des données d’expériences où un ou deux gènes ont été activés avec CRISPR. Cet ensemble de données d’entraînement comprenait des informations provenant de 100 activations géniques individuelles et de 62 cas où deux gènes ont été activés simultanément. Les progiciels d’IA ont ensuite été chargés de prédire les résultats pour 62 autres paires de gènes activés. À titre de comparaison, les chercheurs ont également généré des prédictions en utilisant deux modèles remarquablement simples : l’un qui prédisait toujours l’absence de changement dans l’activité génique, et l’autre qui prédisait toujours un simple effet additif (ce qui signifie que l’activation des gènes A et B produirait les changements combinés de l’activation de A plus l’activation de B).
Les résultats furent décevants. « Tous les modèles présentaient une erreur de prédiction substantiellement plus élevée que la ligne de base additive », ont conclu les chercheurs. Cette observation est restée vraie même lorsque d’autres mesures de la précision de la prédiction par l’IA ont été utilisées. Le cœur du problème semblait être l’incapacité des modèles de fondation entraînés à prédire avec précision des schémas de changement complexes, en particulier lorsque les altérations de paires de gènes produisaient des interactions synergiques. « Les modèles d’apprentissage profond ont rarement prédit des interactions synergiques, et il était encore plus rare que ces prédictions soient correctes », ont déclaré les chercheurs. Lors d’un test distinct axé spécifiquement sur ces synergies géniques, aucun des modèles d’IA n’a fonctionné mieux que le système simplifié qui prédisait simplement l’absence de tout changement.
Les conclusions globales de ce travail sont sans équivoque. Comme les chercheurs l’ont eux-mêmes écrit : « Étant donné que nos lignes de base délibérément simples sont incapables de représenter la complexité biologique réaliste et n’ont pourtant pas été surpassées par les modèles de fondation, nous concluons que l’objectif de ces derniers de fournir une représentation généralisable des états cellulaires et de prédire le résultat d’expériences non encore réalisées reste insaisissable. » Il est vital de souligner que « reste insaisissable » n’implique pas une incapacité à développer un jour une IA capable d’aider à résoudre ce problème. Cela ne signifie pas non plus que ces découvertes s’appliquent à tous les états cellulaires ou, encore moins, à l’ensemble de la biologie. Cependant, l’étude fournit une mise en garde précieuse à un moment où il existe un immense enthousiasme pour l’idée que le succès de l’IA dans quelques domaines spécifiques annonce un monde où elle peut être appliquée universellement.