Los puntos ciegos biológicos de la IA: La predicción genética falla
La inteligencia artificial y el aprendizaje automático han logrado éxitos verdaderamente espectaculares en el campo de la biología, desde el diseño de enzimas capaces de digerir plásticos hasta la ingeniería de proteínas que pueden bloquear el veneno de serpiente. En una era de aparente bombo ilimitado de la IA, podría ser tentador asumir que simplemente desatar algoritmos poderosos sobre los inmensos conjuntos de datos que ya hemos acumulado conduciría a una comprensión integral de la mayoría de los procesos biológicos, permitiéndonos potencialmente eludir experimentos laboriosos y las complejidades éticas de la investigación con animales.
Sin embargo, la biología abarca mucho más que solo estructuras proteicas. Es excesivamente prematuro sugerir que la IA puede ser igualmente efectiva para abordar todas las facetas de esta intrincada ciencia. Este contexto hace que un estudio reciente sea particularmente intrigante. Los investigadores evaluaron un conjunto de paquetes de software de IA diseñados para predecir cuán activos serían los genes en células expuestas a diversas condiciones. Resulta que estos sofisticados sistemas de IA no rindieron mejor que un método de predicción deliberadamente simplificado. Los hallazgos sirven como un recordatorio crucial de que la biología es increíblemente compleja, y el éxito en el desarrollo de sistemas de IA para un aspecto biológico específico no garantiza su aplicabilidad general en todo el campo.
El estudio fue dirigido por un trío de investigadores con sede en Heidelberg: Constantin Ahlmann-Eltze, Wolfgang Huber y Simon Anders. Señalaron que varios otros estudios, publicados mientras su trabajo estaba en preimpresión, llegaron a conclusiones ampliamente similares. El enfoque del equipo de Heidelberg es particularmente sencillo, lo que lo convierte en una excelente ilustración de las limitaciones actuales.
El software de IA examinado en su investigación tenía como objetivo predecir cambios en la actividad genética. Si bien cada célula contiene copias de aproximadamente 20.000 genes en el genoma humano, no todos están activos en un momento dado. “Activo” en este contexto se refiere a genes que producen ARN mensajeros (ARNm), que son cruciales para las funciones celulares. Algunos genes están constantemente activos a niveles altos, proporcionando funciones esenciales, mientras que otros solo están activos en tipos de células específicos, como las células nerviosas o de la piel, o son activados por condiciones particulares como bajo oxígeno o altas temperaturas.
Durante muchos años, los científicos han realizado numerosos estudios para mapear la actividad de cada gen en varios tipos de células bajo diferentes condiciones. Estas investigaciones van desde el uso de chips genéticos para identificar qué ARNm están presentes en las poblaciones celulares hasta la secuenciación de ARNs de células individuales para identificar genes activos. Colectivamente, esta investigación ha construido una imagen amplia, aunque incompleta, que vincula la actividad genética con diversas circunstancias biológicas. Este vasto repositorio de datos podría, en teoría, utilizarse para entrenar una IA para predecir la actividad genética en condiciones no probadas.
Ahlmann-Eltze, Huber y Anders probaron específicamente lo que se conoce como modelos de base unicelulares, que han sido entrenados con este tipo de datos de actividad genética. La designación de “unicelular” indica que los modelos aprendieron de la actividad genética observada en células individuales, en lugar de promediada en poblaciones celulares. Los “modelos de base” implican que fueron entrenados en una amplia gama de datos, pero requieren un ajuste fino adicional para tareas específicas.
La tarea específica para estos modelos era predecir cómo podría cambiar la actividad genética cuando los genes se alteran intencionalmente. Cuando un solo gen se pierde o se activa, a veces solo se ve afectado el ARNm de ese gen. Sin embargo, algunos genes codifican proteínas que regulan colecciones enteras de otros genes, lo que lleva a cambios en la actividad de docenas de genes. En otros casos, alterar un gen puede afectar el metabolismo general de una célula, lo que resulta en cambios generalizados en la actividad genética. La complejidad aumenta aún más cuando intervienen dos genes. A menudo, sus efectos son simplemente aditivos: la suma de los cambios causados por cada alteración individual. Pero si sus funciones se superponen, el resultado puede ser una mejora sinérgica de algunos cambios, la supresión de otros o modificaciones completamente inesperadas.
Para explorar estos intrincados efectos, los investigadores han utilizado históricamente la tecnología de edición genética CRISPR para alterar intencionalmente la actividad de uno o más genes. Luego, secuencian todos los ARNs celulares para observar los cambios resultantes. Este enfoque, denominado Perturb-seq, proporciona una valiosa información sobre la función de un gen dentro de una célula. Para Ahlmann-Eltze, Huber y Anders, proporcionó los datos cruciales necesarios para determinar si los modelos de base elegidos podrían ser entrenados para predecir estos cambios posteriores en otras actividades genéticas.
Comenzando con los modelos de base preentrenados, los investigadores realizaron un entrenamiento adicional utilizando datos de experimentos donde uno o dos genes fueron activados con CRISPR. Este conjunto de datos de entrenamiento incluyó información de 100 activaciones genéticas individuales y 62 instancias donde dos genes fueron activados simultáneamente. Los paquetes de IA fueron entonces encargados de predecir los resultados para otras 62 parejas de genes activados. Para comparar, los investigadores también generaron predicciones utilizando dos modelos notablemente simples: uno que siempre predecía ningún cambio en la actividad genética, y otro que siempre predecía un efecto aditivo simple (lo que significa que la activación de los genes A y B produciría los cambios combinados de la activación de A más la activación de B).
Los resultados fueron decepcionantes. “Todos los modelos tuvieron un error de predicción sustancialmente mayor que la línea base aditiva”, concluyeron los investigadores. Este hallazgo se mantuvo incluso cuando se utilizaron mediciones alternativas de la precisión de la predicción de la IA. El núcleo del problema parecía ser la incapacidad de los modelos de base entrenados para predecir con precisión patrones complejos de cambio, particularmente cuando las alteraciones de pares de genes producían interacciones sinérgicas. “Los modelos de aprendizaje profundo rara vez predijeron interacciones sinérgicas, y fue aún más raro que esas predicciones fueran correctas”, afirmaron los investigadores. En una prueba separada centrada específicamente en estas sinergias genéticas, ninguno de los modelos de IA funcionó mejor que el sistema simplificado que simplemente no predecía ningún cambio.
Las conclusiones generales de este trabajo son inequívocamente claras. Como los propios investigadores escribieron: “Dado que nuestras líneas base deliberadamente simples son incapaces de representar la complejidad biológica realista y, sin embargo, no fueron superadas por los modelos de base, concluimos que el objetivo de estos últimos de proporcionar una representación generalizable de los estados celulares y predecir el resultado de experimentos aún no realizados sigue siendo esquivo.” Es vital subrayar que “sigue siendo esquivo” no implica la incapacidad de desarrollar alguna vez una IA capaz de ayudar con este problema. Tampoco significa que estos hallazgos se apliquen a todos los estados celulares o, menos aún, a toda la biología. Sin embargo, el estudio proporciona una valiosa advertencia en un momento en que existe un inmenso entusiasmo por la idea de que el éxito de la IA en unas pocas áreas específicas anuncia un mundo donde puede aplicarse universalmente.