Przełom w symulacji białek: berlińscy badacze rewolucjonizują metodę!
Wolny Uniwersytet w Berlinie wraz z prof. dr Cecilią Clementi dokonuje przełomu w komputerowej symulacji białek.

Przełom w symulacji białek: berlińscy badacze rewolucjonizują metodę!
18 lipca 2025 r. międzynarodowy zespół badawczy pod przewodnictwem prof. dr Cecilii Clementi z Uniwersytetu im. Wolny Uniwersytet w Berlinie przełomowy artykuł w czasopiśmieChemia Przyrody, co wywołuje zamieszanie w świecie naukowym. W artykule przedstawiono nowy model umożliwiający precyzyjną i wydajną symulację białek - znacznie szybszą niż konwencjonalne symulacje dynamiki molekularnej.
Wyzwanie polegające na realistycznym zobrazowaniu fałdowania i dynamiki białek istnieje od ponad 50 lat. Naukowcy wykorzystali głębokie uczenie się do opracowania systemu, który jest zbliżony do symulacji białek wszystkich atomów. Nowo opracowany model CGSchNet wykorzystuje grafową sieć neuronową do uczenia się efektywnych interakcji między cząstkami. Te innowacyjne podejścia otwierają obiecujące zastosowania w opracowywaniu leków i terapii przeciwciałami w leczeniu raka i innych chorób.
Postępy w symulacji białek
Model koncentruje się na dynamicznym procesie zwijania białek, w tym na stanach pośrednich, które odgrywają rolę w nieprawidłowym fałdowaniu, takim jak amyloidy. Symuluje przejścia pomiędzy stanami złożonymi, które są kluczowe dla funkcjonowania białek. Znaczącym postępem tego modelu jest możliwość dokładnego przewidywania długotrwałych stanów białek złożonych, rozwiniętych i nieuporządkowanych.
Jedną z najbardziej godnych uwagi cech modelu CGSchNet jest zdolność do przewidywania względnej stabilności zwiniętych mutantów białkowych, czego nie udało się osiągnąć poprzednimi metodami. Prof. dr Cecilia Clementi, która wcześniej była profesorem chemii i fizyki na Uniwersytecie Rice w Houston w Teksasie, wzmacnia badania z zakresu biofizyki teoretycznej i obliczeniowej na Wolnym Uniwersytecie w Berlinie. Ich pracę wspierają Einstein Professorships, które wspierają berlińskie uniwersytety i Charité w negocjacjach dotyczących nominacji lub rezydencji.
Dane i modele szczegółowo
W badaniu wykorzystano kompleksowe zbiory danych. Zestaw danych porównawczych zawiera 1262 cele i obejmuje szeroki zakres struktur białkowych, w tym 717 białek jednodomenowych, 257 nowo opublikowanych celów i 288 celów z CASP 8–14. Te zbiory danych przygotowano w celu usunięcia nadmiarowości i dostosowania identyczności sekwencji do wartości odcięcia <30%.
Zbiór danych Human Protome obejmuje 20 595 białek i umożliwia zróżnicowaną analizę białek jedno- i wielodomenowych. Spośród nich przewidziano 19 512 białek, co ma potencjalnie ogromne znaczenie w przewidywaniu struktury. Ponadto do badań włączono rurociąg D-I-TASSER, który wykorzystuje podejście hybrydowe do przewidywania struktury proteonów.
Ten potok wykonuje wszystkie etapy, od głębokiego generowania MSA, przez identyfikację szablonu gwintowania, po udoskonalenie strukturalne i ocenę modelu. Zastosowanie najnowocześniejszych algorytmów i technologii takich jak DeepPotential i AttentionPotential ilustruje innowacyjny charakter dzieła.
Wyniki badania można przenieść na różne białka poza konkretnym zbiorem danych treningowych, co podkreśla znaczenie modelu dla badań biochemicznych. Zastosowanie metod opracowanych w ramach badania może mieć daleko idące konsekwencje dla przyszłości badań nad białkami i opracowywania leków. Więcej informacji można znaleźć w szczegółowej publikacji Natura znaleźć.