Die Revolution, die die künstliche Intelligenz in Biologie und Medizin mit sich bringt, schlägt ein neues, entscheidendes Kapitel auf. In den letzten Jahren haben wir einen Aufschwung leistungsstarker Werkzeuge, sogenannter Protein-Sprachmodelle, erlebt, die die Art und Weise, wie Wissenschaftler an die Erforschung von Medikamenten, die Entwicklung von Impfstoffen und das Verständnis der Grundlagen des Lebens herangehen, von Grund auf verändert haben. Diese hochentwickelten Systeme, die auf der Architektur großer Sprachmodelle (LLMs) basieren, wie sie auch beliebte Chatbots antreiben, haben eine erstaunliche Fähigkeit gezeigt, die Struktur und Funktion von Proteinen mit unglaublicher Präzision vorherzusagen. Trotz ihres Erfolgs blieb ein grundlegendes Problem ungelöst und stellte ein erhebliches Hindernis dar – ihre vollständige Undurchsichtigkeit. Die Wissenschaftler erhielten äußerst genaue Antworten, hatten aber keinen Einblick, wie das Modell zu diesen Schlussfolgerungen gelangte. Sie arbeiteten mit einer Art „Black Box“, was das Vertrauen und die Möglichkeit zur weiteren Verbesserung einschränkte.
Eine aktuelle Studie aus einem Labor des renommierten Massachusetts Institute of Technology (MIT) markiert einen Wendepunkt bei der Lösung dieses Problems. Das Forschungsteam hat erfolgreich eine innovative Technik angewendet, die es Wissenschaftlern erstmals ermöglicht, in diese „Black Box“ hineinzuschauen und genau zu bestimmen, welche Merkmale eines Proteins die künstliche Intelligenz bei ihren Vorhersagen berücksichtigt. Dieser Durchbruch erhöht nicht nur die Transparenz und Erklärbarkeit von KI-Modellen, sondern öffnet auch die Tür für eine beschleunigte Entwicklung neuer Therapien und ein besseres Verständnis komplexer biologischer Prozesse.
Die „Black Box“ entschlüsseln: Wie KI Entscheidungen trifft
Das Verständnis des Entscheidungsprozesses innerhalb dieser Modelle ist für ihre weitere Anwendung von entscheidender Bedeutung. Das Team vom MIT, unter der Leitung von Onkar Gujral als Hauptautor und unter der Mentorschaft von Bonnie Berger, einer angesehenen Professorin für Mathematik und Leiterin der Gruppe für Informatik und Biologie, hat eine Methode entwickelt, die die innere Funktionsweise von Protein-Sprachmodellen entmystifiziert. Ihre Arbeit, veröffentlicht in der renommierten Fachzeitschrift Proceedings of the National Academy of Sciences, hat das Potenzial, die Art und Weise, wie diese leistungsstarken Werkzeuge in der biomedizinischen Forschung eingesetzt werden, zu transformieren.
Protein-Sprachmodelle, deren Grundlagen bereits 2018 von Professorin Berger und ihrem damaligen Studenten Tristan Bepler gelegt wurden, funktionieren durch die Analyse riesiger Datenbanken von Aminosäuresequenzen, ähnlich wie Sprachmodelle Texte analysieren. Indem sie Muster und Beziehungen zwischen Aminosäuren lernen, können sie die dreidimensionale Struktur eines Proteins und seine biologische Funktion vorhersagen. Genau solche Modelle waren der Schlüssel zur schnellen Entwicklung revolutionärer Werkzeuge wie AlphaFold, ESM2 und OmegaFold. Das Problem lag jedoch darin, dass die Informationen innerhalb des Modells auf eine sehr dichte und unverständliche Weise kodiert waren. Wissenschaftler konnten das Endergebnis sehen, aber nicht den Weg, der dorthin führte. Es war, als hätte man einen genialen Studenten, der immer das komplexeste mathematische Problem richtig löst, aber einem nie seinen Lösungsweg zeigen kann.
Eine innovative Technik, die Licht ins Dunkel bringt
Um dieses Problem zu lösen, wandten sich die Forscher am MIT einem Algorithmus zu, der als „Sparse Autoencoder“ bekannt ist. Dies ist das erste Mal, dass ein solcher Ansatz erfolgreich auf Protein-Sprachmodelle angewendet wurde. Das Funktionsprinzip ist elegant und leistungsstark. In Standardmodellen werden Informationen über ein bestimmtes Protein durch die Aktivierung einer relativ kleinen Anzahl von „Knoten“ innerhalb des neuronalen Netzes kodiert, beispielsweise 480. In einer solch verdichteten Darstellung muss jeder einzelne Knoten mehrere verschiedene Merkmale des Proteins gleichzeitig kodieren, was die Interpretation praktisch unmöglich macht.
Der Sparse Autoencoder funktioniert entgegengesetzt: Er erweitert den Darstellungsraum drastisch. Statt 480 Knoten verwendet das Modell nun beispielsweise 20.000 Knoten. Gleichzeitig führt der Algorithmus eine „Sparsity-Beschränkung“ ein, die sicherstellt, dass zur Beschreibung des Proteins nur eine kleine Anzahl dieser Knoten aktiviert wird. Dadurch können Informationen, die zuvor komprimiert waren, nun „verteilt“ werden. Die Folge ist, dass ein einziges spezifisches Merkmal eines Proteins, das zuvor über mehrere verschiedene Knoten kodiert war, nun seinen eigenen, einzigartigen Knoten besetzen kann. „In einer dünnbesetzten Darstellung feuern die Neuronen, die aktiviert werden, auf eine bedeutungsvollere Weise“, erklärt Gujral. Vor dieser Methode packten die Netzwerke Informationen so dicht, dass es unmöglich war, die Rolle einzelner Neuronen zu entschlüsseln.
Die Rolle der künstlichen Intelligenz bei der Interpretation ihrer selbst
Nachdem sie diese „gereinigten“ und dünnbesetzten Darstellungen für Tausende von verschiedenen Proteinen erhalten hatten, standen die Wissenschaftler vor einer neuen Herausforderung: wie zu verstehen, was jeder dieser aktivierten Knoten bedeutet. Zu diesem Zweck nutzten sie die Hilfe einer anderen künstlichen Intelligenz, eines Assistenten namens Claude. Claudes Aufgabe war es, die dünnbesetzten Darstellungen mit den bereits bekannten Eigenschaften jedes Proteins zu vergleichen, wie seiner molekularen Funktion, der Familie, zu der es gehört, oder seinem Standort innerhalb der Zelle.
Durch die Analyse einer riesigen Anzahl von Beispielen gelang es Claude, die Aktivierung spezifischer Knoten mit konkreten biologischen Eigenschaften zu verknüpfen und sie dann in einfacher, für den Menschen verständlicher Sprache zu beschreiben. Beispielsweise könnte der Algorithmus eine Beschreibung wie diese generieren: „Dieses Neuron scheint Proteine zu erkennen, die am Transmembrantransport von Ionen oder Aminosäuren beteiligt sind, insbesondere solche, die sich in der Plasmamembran befinden.“ Durch diesen Prozess wurden die Knoten „interpretierbar“, und die Wissenschaftler erhielten zum ersten Mal einen klaren Einblick in das, was das Modell „denkt“. Es zeigte sich, dass die Merkmale, die die Modelle am häufigsten kodieren, die Proteinfamilie und spezifische Funktionen sind, einschließlich verschiedener Stoffwechsel- und Biosyntheseprozesse.
Praktische Auswirkungen: Von der schnelleren Medikamentenentdeckung zu neuen biologischen Erkenntnissen
Dieser Fortschritt hat weitreichende Konsequenzen. Das Verständnis der Merkmale, die ein bestimmtes Proteinmodell kodiert, ermöglicht es Forschern, das am besten geeignete Modell für eine bestimmte Aufgabe auszuwählen. Ob es um die Identifizierung neuer Zielmoleküle für Medikamente oder die Entwicklung wirksamerer Impfstoffe geht, es ist nun möglich, ein Werkzeug zu verwenden, das am besten zur Lösung eines konkreten Problems „abgestimmt“ ist. Dies beschleunigt und verbilligt den gesamten Forschungs- und Entwicklungsprozess direkt.
Beispielsweise nutzte das Team von Professorin Berger in einer Studie aus dem Jahr 2021 ein Protein-Sprachmodell, um vorherzusagen, welche Teile von viralen Oberflächenproteinen am wenigsten wahrscheinlich mutieren. Dadurch identifizierten sie vielversprechende Ziele für die Entwicklung universeller Impfstoffe gegen Grippe, HIV und SARS-CoV-2. Mit der neuen Methode zur Interpretation ist es nun nicht nur möglich, eine solche Vorhersage zu erhalten, sondern auch zu verstehen, auf der Grundlage welcher biochemischen und strukturellen Eigenschaften das Modell diese Entscheidung getroffen hat, was ein zusätzliches Maß an Bestätigung bietet und die weitere Laborforschung lenkt.
Darüber hinaus könnte die Analyse der Merkmale, die das Modell selbstständig als wichtig erkennt, eines Tages zu völlig neuen biologischen Entdeckungen führen. Es ist möglich, dass künstliche Intelligenz durch die Analyse von Mustern in Daten, die das menschliche Auge nicht wahrnehmen kann, bisher unbekannte Proteinfunktionen identifiziert oder neue Verbindungen zwischen verschiedenen biologischen Pfaden aufdeckt. „Eines Tages, wenn die Modelle noch leistungsfähiger werden, könnten wir mehr über Biologie lernen, als wir derzeit wissen, und zwar genau dadurch, dass wir die Modelle selbst öffnen“, schließt Gujral optimistisch. Diese Technologie verspricht nicht nur, uns bei der Beantwortung bekannter Fragen zu helfen, sondern auch völlig neue zu stellen, die die Zukunft der Wissenschaft gestalten werden.
Erstellungszeitpunkt: 3 Stunden zuvor