
Ein Forschungsteam der Freien Universität Berlin in Zusammenarbeit mit Microsoft Research AI for Science hat einen signifikanten Durchbruch in der Modellierung biologischer Proteine erzielt. Dieser Test ist der Kern der am 10. Juli in der Fachzeitschrift Science veröffentlichten Studie mit dem Titel „Scalable emulation of protein equilibrium ensembles with generative deep learning“. Die neuen Erkenntnisse könnten zukünftige Fortschritte im Bereich des Arzneimittel-Designs und der biomedizinischen Forschung erleichtern.
Das Hauptaugenmerk der Studie liegt auf der Einführung von BioEmu, einem innovativen generativen Deep-Learning-System zur Emulation des Gleichgewichtsverhaltens von Proteinen. BioEmu zeichnet sich durch seine hohe Präzision und Genauigkeit aus und soll die Funktion vieler Proteine besser abbilden, deren Aktivität stark von ihrer dynamischen Struktur abhängt. Ein wesentliches Ziel der Entwicklung ist es, die Erfolgsquote neuer Wirkstoffe in klinischen Studien zu erhöhen.
Technologische Innovation und Effizienzsteigerung
Hervorzuheben ist die Fähigkeit von BioEmu, tausende statistisch unabhängige Proteinstrukturen pro Stunde auf einer einzelnen Grafikkarte (GPU) zu generieren. Dies führt zu einer erheblichen Senkung der Kosten und des Zeitaufwands für die Untersuchung funktionell relevanter Strukturveränderungen. Durch die Kombination von über 200 Millisekunden molekulardynamischer Simulationen mit experimentellen Daten erreicht BioEmu die Vorhersage von Struktur-Ensembles und thermodynamischen Eigenschaften mit nahezu experimenteller Genauigkeit.
Die Forschungsteams um Prof. Dr. Frank Noé und Prof. Dr. Cecilia Clementi haben wichtige Beiträge zur Entwicklung geleistet. Prof. Noé, Partner Research Manager bei Microsoft Research und Honorarprofessor an der FU Berlin, hebt hervor, dass BioEmu auch komplexe Strukturveränderungen wie verborgene Bindungstaschen und die Bewegungen ganzer Protein-Domänen vorhersagen kann. Dies ermöglicht die präzise Vorhersage von Stabilitätsveränderungen von Proteinen mit Genauigkeit, die mit Laboranalysen vergleichbar ist.
Traditionelle Ansätze vs. Deep Learning
Die gegenwärtigen molekularen Dynamik-Simulationstechniken sind bekannt dafür, dass sie langsam, teuer und ressourcenintensiv sind. BioEmu bietet hier eine schnellere und kostengünstigere Alternative. Entwickelt von Sarah Lewis und ihrem Team, kombiniert das Modell Trainingsdaten aus AlphaFold-Strukturvorhersagen, großangelegten molekularen Dynamik-Simulationen sowie umfangreichen experimentellen Messungen zur Stabilität von Proteinen.
Allerdings gibt es auch Einschränkungen: BioEmu modelliert nicht nativ molekulare Dynamiken oder Wechselwirkungen mit Membranen und Liganden, noch berücksichtigt es variable Umweltbedingungen wie Temperatur oder pH. Dennoch erwarten die Autoren, dass das Modell zeigt, wie tiefes Lernen die hohen Kosten von Simulationen und Experimenten amortisieren kann, um eine großangelegte, datengestützte Vorhersage der Protein-Funktion zu ermöglichen.
Praktische Implikationen und zukünftige Forschung
Ein bedeutender Aspekt der Studie ist die Veröffentlichung eines umfangreichen Datensatzes durch Microsoft Research, der zur Entwicklung von BioEmu diente. Dieser Datensatz ist die größte öffentlich zugängliche Sammlung sequenzdiverser Proteinsimulationen. Die breite Verfügbarkeit des BioEmu-Quellcodes unter der MIT-Lizenz eröffnet neuen Wegen in der bioinformatischen Forschung und im Arzneimittel-Design.
Forschungen wie diese sind entscheidend für das Verständnis der Biologie und der Funktionsweise von Proteinen, die zwischen verschiedenen Formen wechseln. Dies bleibt eine zentrale Herausforderung für die Wissenschaft, vor allem in der Biotechnologie und der medizinischen Forschung.