KI-Labor mit LLM-Agenten entdeckt antivirale Moleküle
In einem bedeutenden Fortschritt für die künstliche Intelligenz in der wissenschaftlichen Forschung hat ein Team autonomer KI-Agenten, angetrieben von GPT-4o, erfolgreich Nanokörper entwickelt und experimentell validiert, die SARS-CoV-2 blockieren können. Dieser Durchbruch, detailliert in einer kürzlich in Nature veröffentlichten Arbeit von Forschern der Stanford University und des Chan Zuckerberg Biohub, markiert eine neue Ära, in der KI über Datenanalyse und Simulation hinausgeht, um komplexe wissenschaftliche Projekte aktiv zu leiten und auszuführen und greifbare, klinisch relevante Ergebnisse zu liefern.
Das neuartige System, genannt „Virtuelles Labor“, demonstriert, dass ein menschlicher Forscher in Zusammenarbeit mit einem Team von großen Sprachmodell (LLM)-Agenten neue Nanokörper entwerfen kann – kleine, antikörperähnliche Proteine, die darauf ausgelegt sind, an andere Proteine zu binden und deren Funktion zu hemmen. Die spezifische Herausforderung bestand darin, sich schnell mutierende SARS-CoV-2-Varianten wie KP.3 und JN.1 zu konzentrieren, die Resistenzen gegen bestehende Behandlungen entwickelt haben. Dies war keine einfache Chatbot-Interaktion, sondern ein komplizierter, mehrphasiger Forschungsprozess, der von KI-Agenten vorangetrieben wurde, von denen jeder über spezialisiertes Fachwissen und eine definierte Rolle verfügte. Das Ergebnis: realweltlich validierte biologische Moleküle mit Potenzial für nachgelagerte Studien in der Krankheitsbehandlung.
Von Assistenten zu autonomen Forschern
Im Gegensatz zu früheren Anwendungen, bei denen LLMs hauptsächlich als Werkzeuge zum Zusammenfassen, zur Schreibunterstützung oder zur grundlegenden Datenanalyse dienten, erhebt das Virtuelle Labor sie zu autonomen Forschern. Das Kernkonzept besteht darin, ein interdisziplinäres wissenschaftliches Labor zu simulieren, das vollständig mit KI-Agenten besetzt ist. Jeder Agent wird aus GPT-4o instanziiert und erhält durch sorgfältige Prompt-Entwicklung eine spezifische wissenschaftliche Persona, wie z.B. einen Immunologen, einen Computerbiologen oder einen Spezialisten für maschinelles Lernen.
Das Team wird von einem virtuellen Principal Investigator (PI)-Agenten und einem Scientific Critic-Agenten überwacht. Der PI-Agent leitet die Forschungsrichtung, während der Critic-Agent eine entscheidende Rolle spielt, indem er Annahmen hinterfragt und potenzielle Fehler identifiziert, und als interner skeptischer Gutachter fungiert – eine Funktion, die das Papier als wesentlich für den Erfolg des Projekts hervorhebt. Die Rolle des menschlichen Forschers besteht darin, übergeordnete Forschungsfragen zu definieren, domänenspezifische Einschränkungen einzuführen und letztendlich die notwendigen Nasslabor-Experimente durchzuführen, um die computergestützten Ergebnisse der KI zu validieren.
Der Nanokörper-Designprozess
Angesichts der Aufgabe, Nanokörper für die entwickelten SARS-CoV-2-Varianten zu entwerfen, entschieden sich die KI-Agenten autonom, bestehende Nanokörper zu mutieren, die gegen ursprüngliche Stämme wirksam waren, aber ihre Wirksamkeit verloren hatten. Ihre Entscheidung wurde durch das Potenzial für schnellere Zeitlinien und die Verfügbarkeit bestehender Strukturdaten vorangetrieben.
Der menschliche Forscher initiierte das Projekt, indem er nur die PI- und Critic-Agenten definierte. Der PI-Agent stellte dann das spezialisierte wissenschaftliche Team zusammen, indem er einen Immunologen, einen Spezialisten für maschinelles Lernen und einen Computerbiologen hervorbrachte. In einer kollaborativen Teambesprechung diskutierten die Agenten den optimalen Ansatz und wählten schließlich die Nanokörpermutation anstelle des De-novo-Designs. Anschließend wählten sie computergestützte Werkzeuge aus, darunter das ESM-Protein-Sprachmodell zur Bewertung von Punktmutationen, AlphaFold-Multimer zur Vorhersage von Proteinstrukturen und Rosetta zur Berechnung von Bindungsenergien. Die Agenten beschlossen, ihre Strategie mithilfe von Python-Code umzusetzen, der während asynchroner Besprechungen mehrere Überprüfungs- und Verfeinerungsrunden durch den Critic-Agenten durchlief.
Die vom PI-Agenten entwickelte computergestützte Pipeline war iterativ: ESM bewertete Punktmutationen auf Nanokörpersequenzen, die Strukturen der Top-Mutanten wurden von AlphaFold-Multimer vorhergesagt, Schnittstellen wurden mit ipLDDT bewertet und Rosetta schätzte die Bindungsenergie. Diese Bewertungen wurden dann kombiniert, um vorgeschlagene Mutationen zu rangieren, wobei der Zyklus bei Bedarf wiederholt wurde, um weitere Mutationen einzuführen.
Ergebnisse und Effizienz
Diese ausgeklügelte computergestützte Pipeline generierte 92 Nanokörpersequenzen. Diese wurden dann in einem physischen Labor synthetisiert und experimentell getestet. Die Ergebnisse waren vielversprechend: Die meisten der generierten Sequenzen erwiesen sich als produzierbare und handhabbare Proteine. Entscheidend ist, dass zwei dieser Proteine erfolgreich Affinität zu den SARS-CoV-2-Proteinen erlangten, an die sie binden sollten, und Wirksamkeit sowohl gegen moderne mutierte als auch gegen ursprüngliche Formen des Virus zeigten.
Die vom Virtuellen Labor erzielten Erfolgsraten waren vergleichbar mit denen analoger Projekte, die von menschlichen Teams durchgeführt wurden. Der KI-gesteuerte Ansatz reduzierte jedoch die benötigte Zeit für die Fertigstellung erheblich und senkte potenziell die Gesamtkosten aufgrund des geringeren menschlichen Aufwands.
Nachahmung menschlicher Zusammenarbeit
Das Betriebsmodell des Virtuellen Labors spiegelt die menschliche wissenschaftliche Zusammenarbeit wider. Es nutzt strukturierte interdisziplinäre Besprechungen: „Team-Besprechungen“ für breite Diskussionen, bei denen der PI die Führung übernimmt, andere Beiträge leisten und der Critic überprüft; und „Einzel-Besprechungen“, bei denen ein einzelner Agent, manchmal mit dem Critic, sich auf spezifische Aufgaben wie Codierung oder Ergebnisbewertung konzentriert. Um Probleme wie KI-"Halluzinationen" oder Inkonsistenzen zu mindern, verwendet das System auch parallele Besprechungen, bei denen dieselbe Aufgabe mehrmals mit unterschiedlichen Parametern ausgeführt wird. Die Ergebnisse werden dann in einer einzigen, deterministischeren „Merge-Besprechung“ konsolidiert, um die kohärentesten Schlussfolgerungen abzuleiten.
Was den menschlichen Aufwand betrifft, so war die computergestützte Phase des Projekts bemerkenswert wenig direkte menschliche Intervention erforderlich. LLM-Agenten verfassten 98,7 % der gesamten Wörter (über 120.000 Tokens), während der menschliche Forscher im gesamten Projekt nur 1.596 Wörter beitrug. Die Agenten schrieben alle Skripte für die computergestützten Werkzeuge, wobei der Mensch hauptsächlich die Codeausführung und die realen Experimente unterstützte. Die gesamte Pipeline des Virtuellen Labors wurde innerhalb von 1-2 Tagen nach den Prompts und Besprechungen etabliert, und die Berechnung des Nanokörper-Designs wurde in etwa einer Woche abgeschlossen.
Die Zukunft der autonomen Wissenschaft
Das Virtuelle Labor stellt einen Prototyp für ein grundlegend neues Forschungsparadigma dar, bei dem computergestützte Aufgaben automatisiert werden, sodass sich der Mensch auf kritische Entscheidungen und übergeordnete Führung konzentrieren kann. Dies signalisiert einen Wandel für LLMs von passiven Werkzeugen zu aktiven, autonomen Kollaborateuren, die komplexe, interdisziplinäre Projekte von der Konzeption bis zur Umsetzung vorantreiben können.
Die nächste ehrgeizige Grenze für dieses Modell ist die Automatisierung von Nasslabor-Experimenten durch Roboter-Labortechniker. Stellen Sie sich eine vollständig autonome Forschungspipeline vor: Ein menschlicher PI definiert ein übergeordnetes biologisches Ziel; ein Team von KI-Agenten recherchiert bestehende Informationen, brainstormt Ideen, wählt computergestützte Werkzeuge aus, schreibt und führt Code aus und schlägt Experimente vor; Roboter-Labortechniker führen dann die physischen Protokolle aus – Pipettieren, Zentrifugieren, Bildgebung und Datenerfassung; schließlich fließen die Ergebnisse zurück in das Virtuelle Labor, wo KI-Agenten analysieren, anpassen und iterieren, wodurch der Entdeckungszyklus geschlossen wird.
Roboter-Biologielabore sind bereits in Entwicklung, mit Unternehmen wie Emerald Cloud Lab, Strateos und Colabra (ehemals Transcriptic), die „Nasslabor-as-a-Service“ anbieten. Non-Profit-Organisationen wie Future House bauen KI-Agenten für die automatisierte Forschung, während einige akademische Einrichtungen autonome Chemielabore besitzen. Diese Integration von intelligenter KI mit Roboterautomatisierung könnte den wissenschaftlichen und technologischen Fortschritt radikal verändern. Ein solches System könnte 24/7 ermüdungsfrei arbeiten, Tausende paralleler Mikroexperimente durchführen und riesige Hypothesenräume schnell erkunden, die für menschliche Labore derzeit undurchführbar sind.
Obwohl Herausforderungen bestehen bleiben – reale Wissenschaft ist von Natur aus komplex, Roboterprotokolle müssen hochrobust sein und unerwartete Fehler erfordern immer noch menschliches Urteilsvermögen – wird erwartet, dass die kontinuierliche Entwicklung von KI und Robotik diese Lücken schließen wird. Diese Entwicklung unterstreicht eine tiefgreifende Verschiebung der Fähigkeiten der künstlichen Intelligenz und demonstriert ihre Fähigkeit, nicht nur bei sich wiederholenden physischen Aufgaben zu helfen, sondern auch in einigen der intellektuell anspruchsvollsten menschlichen Bestrebungen hervorragende Leistungen zu erbringen, was eine Ära einläutet, in der KI zunehmend fragen, argumentieren, debattieren, entscheiden und letztendlich entdecken wird.