Eine Revolution in der Zellbiologie: Das PUPS-KI-Modell von mit und Harvard sagt die Standorte von krankheitsbekämpfenden Proteinen genau voraus

Forscher des mit, Harvard und des Broad Institute haben Pups entwickelt, ein fortschrittliches KI-Modell, das mit äußerster Präzision vorhersagt, wo sich fast jedes Protein in menschlichen Zellen befindet. Diese Technologie, die die Analyse von Proteinsequenzen und Zellbildern kombiniert, verspricht eine Revolution in der Diagnose von Krankheiten wie Alzheimer und Krebs und beschleunigt die Entwicklung neuer, zielgerichteter Medikamente erheblich.

Eine Revolution in der Zellbiologie: Das PUPS-KI-Modell von mit und Harvard sagt die Standorte von krankheitsbekämpfenden Proteinen genau voraus
Photo by: Domagoj Skledar/ arhiva (vlastita)

Revolutionäre Fortschritte im Verständnis zellulärer Mechanismen und potenziell neue Richtungen in der Diagnostik und Behandlung von Krankheiten zeichnen sich dank eines innovativen Ansatzes ab, der die Kraft der künstlichen Intelligenz nutzt. Wissenschaftler haben eine hochentwickelte Berechnungsmethode entwickelt, die mit außergewöhnlicher Präzision den Standort nahezu jedes Proteins innerhalb einer menschlichen Zelle vorhersagen kann. Dieses Modell, trainiert auf der Grundlage eines gemeinsamen Verständnisses des Verhaltens von Proteinen und Zellen, öffnet die Tür zu einer schnelleren und effizienteren Identifizierung pathologischer Zustände sowie zur Entwicklung neuer Therapiestrategien.


Die Frage, wo sich ein Protein innerhalb einer Zelle befindet, ist nicht nur akademisch; sie hat tiefgreifende Auswirkungen auf die Zellfunktion und folglich auf die Gesundheit. Eine falsche Lokalisation von Proteinen, d.h. ihre Platzierung in einem ungeeigneten Zellkompartiment, kann ein Auslöser oder ein wesentlicher Faktor bei der Entwicklung einer Reihe schwerer Erkrankungen sein. Beispielsweise führt bei der Alzheimer-Krankheit die Ansammlung bestimmter Proteine an falschen Stellen in Gehirnzellen zur Neurodegeneration. In ähnlicher Weise gelangt bei Mukoviszidose ein defektes Protein nicht an seinen korrekten Ort auf der Zellmembran, was zu einer Störung des Ionentransports führt. Im Kontext von Krebs kann eine abnormale Verteilung von Proteinen unkontrolliertes Zellwachstum und -teilung fördern oder es Krebszellen ermöglichen, der Immunantwort zu entgehen.


Angesichts der Tatsache, dass eine einzelne menschliche Zelle etwa 70.000 verschiedene Proteine und deren Varianten enthält, stellt die manuelle Identifizierung des Standorts jedes einzelnen eine enorme Herausforderung dar. Herkömmliche experimentelle Methoden ermöglichen typischerweise die Untersuchung nur einer kleinen Anzahl von Proteinen gleichzeitig, was den Prozess extrem teuer, zeitaufwendig und arbeitsintensiv macht. Jedes Experiment erfordert eine sorgfältige Vorbereitung, spezifische Reagenzien und hochentwickelte Geräte, und die Ergebnisse liefern oft nur einen Bruchteil des Bildes der komplexen intrazellulären Organisation.


Neue Generation von Computertechniken und der Atlas menschlicher Proteine


Um diese komplexe Aufgabe zu beschleunigen und zu vereinfachen, werden neue Generationen von Computertechniken entwickelt. Sie stützen sich auf Modelle des maschinellen Lernens, die umfangreiche Datensätze mit Informationen über Tausende von Proteinen und deren Standorte verwenden, die in verschiedenen Zelllinien gemessen wurden. Eine der größten und bedeutendsten solcher Ressourcen ist der Atlas menschlicher Proteine (Human Protein Atlas). Dieser umfassende Katalog enthält Daten zum subzellulären Verhalten von mehr als 13.000 Proteinen in über 40 verschiedenen Typen von Zelllinien. Trotz seiner beeindruckenden Größe ist es dem Atlas menschlicher Proteine bisher gelungen, nur etwa 0,25 Prozent aller möglichen Kombinationen von Proteinen und Zelllinien innerhalb seiner Datenbank zu untersuchen. Dies zeigt deutlich die Unermesslichkeit des unerforschten Raums und die Notwendigkeit fortschrittlicherer Werkzeuge, die den verbleibenden Teil des Proteinuniversums effizient kartieren können.


Angesichts dieser Herausforderung haben Forscher von renommierten Institutionen wie dem MIT, der Harvard University und dem Broad Institute (ein gemeinsames Institut von MIT und Harvard) einen neuen computergestützten Ansatz entwickelt. Ihre Methode ermöglicht die effiziente Erforschung des verbleibenden, noch nicht kartierten Raums der intrazellulären Proteinlokalisation. Der entscheidende Vorteil dieses neuen Ansatzes ist seine Fähigkeit, den Standort jedes Proteins in jeder menschlichen Zelllinie vorherzusagen, selbst in Fällen, in denen weder das spezifische Protein noch die konkrete Zelllinie zuvor experimentell getestet wurden. Dies stellt einen bedeutenden Fortschritt gegenüber bestehenden Methoden dar.


Präzision auf Einzelzellebene


Die von ihnen entwickelte Technik geht einen Schritt weiter als viele bestehende, auf künstlicher Intelligenz basierende Methoden, da sie das Protein auf Einzelzellebene lokalisiert, anstatt eine durchschnittliche Schätzung für alle Zellen eines bestimmten Typs zu liefern. Diese Möglichkeit der Lokalisation auf Einzelzellebene ist von außerordentlicher Bedeutung. Sie ermöglicht beispielsweise die präzise Bestimmung der Position eines Proteins in einer spezifischen Krebszelle nach Anwendung einer Therapie, was entscheidende Einblicke in die Wirksamkeit der Behandlung und Resistenzmechanismen liefern kann. Das Verständnis der Heterogenität innerhalb einer Zellpopulation, selbst innerhalb derselben Zelllinie oder desselben Gewebes, ist entscheidend für die Entwicklung personalisierter medizinischer Ansätze.


Das Forschungsteam kombinierte ein Protein-Sprachmodell mit einer speziellen Art von Computer-Vision-Modell, um reichhaltige und detaillierte Informationen über das Protein und die Zelle zu erfassen. Das Protein-Sprachmodell analysiert die Aminosäuresequenz, aus der das Protein besteht, und extrahiert Informationen über seine Struktur und Eigenschaften, die seine Neigung zu bestimmten Zellkompartimenten bestimmen. Andererseits analysiert das Computer-Vision-Modell, bekannt als Bildergänzungsmuster (Image Inpainting Model), Bilder der Zelle, die mit spezifischen Markern gefärbt sind, um Informationen über den Zustand dieser Zelle zu sammeln – ihren Typ, individuelle Merkmale und das eventuelle Vorhandensein von Stress oder pathologischen Veränderungen. Das Endergebnis, das der Benutzer erhält, ist ein Bild der Zelle mit einem hervorgehobenen Bereich, der den vorhergesagten Standort des Proteins anzeigt. Da die Lokalisation von Proteinen oft ein Indikator für ihren funktionellen Status ist, kann diese Technik Forschern und Klinikern bei einer effizienteren Diagnose von Krankheiten, der Identifizierung von Zielmolekülen für neue Medikamente helfen und Biologen ein besseres Verständnis der Zusammenhänge zwischen komplexen biologischen Prozessen und der Proteinverteilung innerhalb der Zelle ermöglichen.


Yitong Tseo, Doktorand im Programm für Computergestützte und Systembiologie am MIT und einer der Hauptautoren der zu diesem Thema in der Zeitschrift Nature Methods am 15. Mai 2025 veröffentlichten Arbeit, betont: "Man könnte diese Proteinlokalisierungsexperimente am Computer durchführen, ohne überhaupt ins Labor gehen zu müssen, und hoffentlich Monate an Aufwand sparen. Obwohl man die Vorhersage immer noch verifizieren müsste, könnte diese Technik als eine erste Überprüfung dessen dienen, was experimentell getestet werden muss."


Neben Tseo ist Xinyi Zhang, Doktorandin am Fachbereich Elektrotechnik und Informatik (EECS) und am Eric and Wendy Schmidt Center am Broad Institute, Hauptautorin der Arbeit. Zu den Autoren gehören auch Yunhao Bai vom Broad Institute sowie die leitenden Autoren Fei Chen, Assistenzprofessor an der Harvard University und Mitglied des Broad Institute, und Caroline Uhler, Professorin für Ingenieurwissenschaften am Andrew and Erna Viterbi Department in EECS und am Institut für Daten, Systeme und Gesellschaft (IDSS) am MIT, die auch Direktorin des Eric and Wendy Schmidt Center und Forscherin am Labor für Informations- und Entscheidungssysteme (LIDS) des MIT ist.


Zusammenarbeit fortgeschrittener Modelle: Vorstellung von PUPS


Viele bestehende Modelle zur Vorhersage des Proteinverhaltens sind dadurch eingeschränkt, dass sie Vorhersagen nur auf der Grundlage von Daten über Proteine und Zellen treffen können, auf denen sie trainiert wurden, oder dass sie nicht in der Lage sind, den Standort von Proteinen innerhalb einer einzelnen Zelle präzise zu bestimmen. Um diese Einschränkungen zu überwinden, haben Forscher eine zweiteilige Methode zur Vorhersage des subzellulären Standorts bisher ungesehener Proteine entwickelt, genannt PUPS (Prediction of Unseen Proteins' Subcellular localization).


Der erste Teil von PUPS verwendet ein Proteinsequenzmodell. Dieses Modell wurde entwickelt, um die Eigenschaften des Proteins zu erfassen, die seine Lokalisation bestimmen, sowie seine dreidimensionale Struktur, basierend auf der Kette von Aminosäuren, die es bildet. Die Aminosäuresequenz ist die primäre Information, die diktiert, wie sich ein Protein falten wird und welche Funktionen es ausführen wird, einschließlich der Signale für seine Weiterleitung innerhalb der Zelle.


Der zweite Teil des Systems umfasst ein Bildergänzungsmuster (Image Inpainting Model). Es handelt sich um ein hochentwickeltes Computer-Vision-Modell, das ursprünglich zum Auffüllen fehlender Bildteile entwickelt wurde. In diesem Kontext analysiert das Modell drei unterschiedlich gefärbte Bilder der Zelle, um wichtige Informationen über ihren Zustand zu sammeln. Diese Bilder zeigen typischerweise den Zellkern (mit einem Marker wie DAPI), Mikrotubuli (wichtige Komponenten des Zytoskeletts) und das endoplasmatische Retikulum (ein Schlüsselorganell für die Proteinsynthese und den Proteintransport). Durch die Analyse dieser Marker gewinnt das Modell Einblicke in den Zelltyp, seine individuellen morphologischen Merkmale und erkennt, ob die Zelle unter irgendeiner Form von Stress steht, was die Proteinverteilung beeinflussen kann.


PUPS führt dann die Repräsentationen, d.h. digitalen Beschreibungen, zusammen, die von jedem dieser beiden Modelle – dem Proteinsequenzmodell und dem Zellbildmodell – erstellt wurden. Durch die Kombination dieser Informationen sagt das System voraus, wo sich das Protein innerhalb einer spezifischen, einzelnen Zelle befindet. Zur Visualisierung dieser Vorhersage wird ein Bilddecoder verwendet, der ein Ausgabebild erzeugt. Auf diesem Bild ist der Bereich deutlich markiert, in dem PUPS den Standort des untersuchten Proteins vorhersagt.


"Verschiedene Zellen innerhalb einer einzelnen Zelllinie weisen unterschiedliche Merkmale auf, und unser Modell ist in der Lage, diese Nuance zu verstehen", erklärt Tseo. Diese Fähigkeit, individuelle zelluläre Variationen zu unterscheiden, ist entscheidend für eine präzise Analyse.


Der Benutzer des PUPS-Systems muss die Aminosäuresequenz, die das interessierende Protein bildet, sowie drei Bilder von Zellmarkern eingeben – eines für den Zellkern, eines für Mikrotubuli und eines für das endoplasmatische Retikulum. Nach Eingabe dieser Daten führt PUPS den Rest der Analyse durch und generiert eine Lokalisationsvorhersage.


Tieferes Verständnis durch einen innovativen Lernprozess


Während des Trainingsprozesses des PUPS-Modells wandten die Forscher mehrere innovative Techniken an, um ihm beizubringen, Informationen aus beiden konstituierenden Modellen effektiv zu kombinieren. Ziel war es, PUPS in die Lage zu versetzen, eine fundierte Annahme über den Standort des Proteins zu treffen, auch wenn es dieses spezifische Protein oder diese Zelllinie noch nie zuvor "gesehen" hatte.


Eine dieser Techniken beinhaltet die Zuweisung einer sekundären Aufgabe an das Modell während des Trainings: die explizite Benennung des Lokalisationskompartiments, wie z.B. Zellkern, Mitochondrien oder Golgi-Apparat. Diese Aufgabe wird parallel zur primären Aufgabe der Bildergänzung (Vorhersage, wo sich das Protein im Bild befindet) ausgeführt. Es hat sich gezeigt, dass dieser zusätzliche Schritt dem Modell hilft, effektiver zu lernen und ein besseres allgemeines Verständnis möglicher Zellkompartimente und der Signale, die Proteine zu ihnen führen, zu entwickeln. Eine Analogie könnte ein Lehrer sein, der von den Schülern nicht nur verlangt, alle Teile einer Blume zu zeichnen, sondern auch deren Namen zu schreiben. Diese zusätzliche Anforderung zur Benennung verstärkt das Lernen und Verstehen.


Darüber hinaus hilft die Tatsache, dass PUPS gleichzeitig mit Daten über Proteine und Zelllinien trainiert wird, ihm, ein tieferes Verständnis dafür zu entwickeln, wo Proteine typischerweise in einem Zellbild lokalisiert sind. Das System lernt, subtile Muster und Korrelationen zwischen Proteineigenschaften (abgeleitet aus seiner Sequenz) und visuellen Merkmalen der Zelle (abgeleitet aus Markerbildern) zu erkennen.


Beeindruckend ist, dass PUPS sogar selbstständig verstehen kann, wie verschiedene Teile einer Proteinsequenz separat zu seiner Gesamtlocalisation beitragen. Das bedeutet, dass das Modell spezifische Aminosäuremotive oder Domänen innerhalb des Proteins identifizieren kann, die als "Postleitzahlen" fungieren und das Protein an seinen Bestimmungsort in der Zelle leiten.


"Die meisten anderen Methoden erfordern normalerweise, dass man zuerst einen Marker für das Protein hat, sodass man es bereits in seinen Trainingsdaten gesehen hat. Unser Ansatz ist einzigartig, da er gleichzeitig über Proteine und Zelllinien generalisieren kann", betont Zhang. Diese Fähigkeit zur Generalisierung auf ungesehene Fälle ist ein entscheidender Vorteil von PUPS.


Da PUPS auf Proteine generalisieren kann, denen es während des Trainings nicht begegnet ist, ist es in der Lage, Veränderungen in der Lokalisation zu erfassen, die durch einzigartige Proteinmutationen verursacht werden, die nicht im Atlas menschlicher Proteine enthalten sind. Dies ist besonders wichtig für die Untersuchung genetischer Krankheiten, bei denen Mutationen das Verhalten von Proteinen verändern können, einschließlich ihrer intrazellulären Verteilung.


Forscher bestätigten die Fähigkeit von PUPS, den subzellulären Standort neuer Proteine in bisher ungesehenen Zelllinien vorherzusagen, indem sie Laborexperimente durchführten und die Ergebnisse verglichen. Ein Vergleich mit einer bestehenden, grundlegenden Methode der künstlichen Intelligenz zeigte, dass PUPS im Durchschnitt einen geringeren Vorhersagefehler für die getesteten Proteine aufwies. Diese Validierungsergebnisse bestätigen die Robustheit und Genauigkeit des neuen Modells.


Zukünftige Richtungen und potenzielle Anwendungen


Mit Blick auf die Zukunft plant das Forschungsteam eine weitere Verbesserung von PUPS. Eines der Ziele ist es, dem Modell zu ermöglichen, Protein-Protein-Interaktionen zu verstehen, d.h. wie Proteine miteinander interagieren und wie diese Interaktionen ihre gemeinsame Lokalisation beeinflussen können. Sie arbeiten auch daran, dass PUPS die Lokalisation mehrerer Proteine gleichzeitig innerhalb einer einzelnen Zelle vorhersagen kann, um so ein komplexeres Bild der zellulären Organisation zu liefern.


Die längerfristige Vision beinhaltet die Schulung von PUPS, um Vorhersagen nicht nur an kultivierten Zellen unter Laborbedingungen, sondern auch an Proben von lebendem menschlichem Gewebe zu treffen. Ein solcher Fortschritt hätte eine enorme Bedeutung für die klinische Diagnostik und Therapieentwicklung und würde die Analyse der Proteinlokalisation im realen biologischen Kontext eines Patienten ermöglichen. Das Verständnis, wie sich Proteine in der komplexen Umgebung von Geweben mit verschiedenen Zelltypen und interzellulären Interaktionen verhalten, würde neue Perspektiven für die personalisierte Medizin eröffnen. Diese bahnbrechende Arbeit an der Schnittstelle von künstlicher Intelligenz, Zellbiologie und Medizin verspricht, unseren Ansatz zur Erforschung, Diagnose und Behandlung von Krankheiten zu transformieren und die Kraft der prädiktiven Analyse in den Dienst der menschlichen Gesundheit zu stellen.


Die Forschung wurde finanziert vom Eric and Wendy Schmidt Center am Broad Institute, den National Institutes of Health (NIH), der National Science Foundation (NSF), dem Burroughs Wellcome Fund, dem Searle Scholars Program, dem Harvard Stem Cell Institute, dem Merkin Institute, dem Office of Naval Research und dem US-Energieministerium.

Quelle: Massachusetts Institute of Technology

Greška: Koordinate nisu pronađene za mjesto:
Erstellungszeitpunkt: 16 Mai, 2025

AI Lara Teč

AI Lara Teč ist eine innovative KI-Journalistin unseres globalen Portals, spezialisiert auf die Berichterstattung über die neuesten Trends und Errungenschaften in der Welt der Wissenschaft und Technologie. Mit ihrem Fachwissen und analytischen Ansatz bietet Lara tiefgehende Einblicke und Erklärungen zu den komplexesten Themen, wodurch sie für Leser weltweit zugänglich und verständlich werden.

Fachkundige Analyse und Klare Erklärungen Lara nutzt ihre Expertise, um komplexe wissenschaftliche und technologische Themen zu analysieren und zu erklären, wobei sie sich auf deren Bedeutung und Einfluss auf das tägliche Leben konzentriert. Ob es sich um die neuesten technologischen Innovationen, Durchbrüche in der Forschung oder Trends in der digitalen Welt handelt, Lara bietet gründliche Analysen und Erklärungen, die die wichtigsten Aspekte und potenziellen Auswirkungen für die Leser hervorheben.

Ihr Führer durch die Welt der Wissenschaft und Technologie Larastiche Artikel sind darauf ausgelegt, Sie durch die komplexe Welt der Wissenschaft und Technologie zu führen und dabei klare und präzise Erklärungen zu bieten. Ihre Fähigkeit, komplexe Konzepte in verständliche Teile zu zerlegen, macht ihre Artikel zu einer unverzichtbaren Ressource für alle, die über die neuesten wissenschaftlichen und technologischen Fortschritte informiert bleiben möchten.

Mehr als KI - Ihr Fenster in die Zukunft AI Lara Teč ist nicht nur eine Journalistin; sie ist ein Fenster in die Zukunft und bietet Einblicke in neue Horizonte der Wissenschaft und Technologie. Ihre fachkundige Führung und tiefgehende Analyse helfen den Lesern, die Komplexität und Schönheit der Innovationen, die unsere Welt gestalten, zu verstehen und zu schätzen. Mit Lara bleiben Sie über die neuesten Errungenschaften informiert und inspiriert, die die Welt der Wissenschaft und Technologie zu bieten hat.

HINWEIS FÜR UNSERE LESER
Karlobag.eu bietet Nachrichten, Analysen und Informationen zu globalen Ereignissen und Themen, die für Leser weltweit von Interesse sind. Alle veröffentlichten Informationen dienen ausschließlich zu Informationszwecken.
Wir betonen, dass wir keine Experten in den Bereichen Wissenschaft, Medizin, Finanzen oder Recht sind. Daher empfehlen wir, vor der Entscheidungsfindung auf Basis der Informationen unseres Portals, sich mit qualifizierten Experten zu beraten.
Karlobag.eu kann Links zu externen Drittanbieterseiten enthalten, einschließlich Affiliate-Links und gesponserten Inhalten. Wenn Sie über diese Links ein Produkt oder eine Dienstleistung kaufen, können wir eine Provision erhalten. Wir haben keine Kontrolle über die Inhalte oder Richtlinien dieser Seiten und übernehmen keine Verantwortung für deren Genauigkeit, Verfügbarkeit oder für Transaktionen, die Sie über diese Seiten tätigen.
Wenn wir Informationen über Veranstaltungen oder Ticketverkäufe veröffentlichen, beachten Sie bitte, dass wir weder direkt noch über Vermittler Tickets verkaufen. Unser Portal informiert ausschließlich über Veranstaltungen und Kaufmöglichkeiten über externe Verkaufsplattformen. Wir verbinden Leser mit Partnern, die Ticketverkaufsdienste anbieten, garantieren jedoch nicht deren Verfügbarkeit, Preise oder Kaufbedingungen. Alle Ticketinformationen werden von Dritten bezogen und können ohne vorherige Ankündigung Änderungen unterliegen. Wir empfehlen, die Verkaufsbedingungen beim gewählten Partner vor einem Kauf sorgfältig zu überprüfen, da das Portal Karlobag.eu keine Verantwortung für Transaktionen oder Verkaufsbedingungen von Tickets übernimmt.
Alle Informationen auf unserem Portal können ohne vorherige Ankündigung geändert werden. Durch die Nutzung dieses Portals stimmen Sie zu, dass Sie die Inhalte auf eigenes Risiko lesen.