Průlom v simulaci proteinů: Berlínští vědci způsobili revoluci v metodě!
Free University of Berlin dosáhla s Prof. Dr. Cecilií Clementi průlomu v počítačové simulaci proteinů.

Průlom v simulaci proteinů: Berlínští vědci způsobili revoluci v metodě!
Dne 18. července 2025 mezinárodní výzkumný tým pod vedením Prof. Dr. Cecilie Clementi z Svobodná univerzita v Berlíně přelomový článek v časopisePřírodní chemie, která ve vědeckém světě vyvolává rozruch. Článek představuje nový model, který umožňuje přesnou a účinnou simulaci proteinů – výrazně rychlejší než konvenční simulace molekulární dynamiky.
Výzva realistického zobrazení skládání a dynamiky proteinů existuje již více než 50 let. Výzkumníci použili hluboké učení k vývoji systému, který se přibližuje simulacím proteinů všech atomů. Nově vyvinutý model CGSchNet využívá grafovou neuronovou síť k učení efektivních interakcí mezi částicemi. Tyto inovativní přístupy otevírají slibné aplikace ve vývoji léků a protilátkových terapií rakoviny a dalších nemocí.
Pokroky v simulaci proteinů
Model se zaměřuje na dynamický proces skládání proteinů, včetně přechodných stavů, které hrají roli při chybném skládání, jako jsou amyloidy. Simuluje přechody mezi složenými stavy, které jsou klíčové pro funkci proteinů. Významným pokrokem tohoto modelu je schopnost přesně předpovídat dlouhotrvající stavy složených, nesložených a neuspořádaných proteinů.
Jedním z nejpozoruhodnějších rysů modelu CGSchNet je schopnost předpovídat relativní stabilitu složených proteinových mutantů, které předchozí metody nebyly schopny dosáhnout. Prof. Dr. Cecilia Clementi, která byla dříve profesorkou chemie a fyziky na Rice University v Houstonu v Texasu, posiluje výzkum v oblasti teoretické a výpočetní biofyziky na Svobodné univerzitě v Berlíně. Jejich práci podporují profesury Einsteina, které podporují berlínské univerzity a Charité při jednáních o jmenování nebo pobytu.
Data a modely v detailu
Studie používala komplexní soubory dat. Srovnávací datový soubor obsahuje 1 262 cílů a pokrývá širokou škálu proteinových struktur, včetně 717 proteinů s jednou doménou, 257 nově publikovaných cílů a 288 cílů z CASP 8–14. Tyto datové soubory byly připraveny k odstranění redundance a upravení sekvenční identity na hranici <30 %.
Dataset Human Protome obsahuje 20 595 proteinů a umožňuje diferencovanou analýzu jednodoménových a vícedoménových proteinů. Z nich bylo predikováno 19 512 proteinů, což má potenciálně velký význam pro predikci struktury. Do výzkumu byl navíc integrován ropovod D-I-TASSER, který využívá hybridní přístup k predikci struktury proteonu.
Tento kanál provádí všechny kroky od hloubkového generování MSA přes identifikaci šablony závitů až po strukturální upřesnění a vyhodnocení modelu. Použití nejmodernějších algoritmů a technologií, jako jsou DeepPotential a AttentionPotential, ilustruje inovativní charakter práce.
Výsledky studie jsou přenositelné na různé proteiny mimo specifický soubor tréninkových dat, což podtrhuje relevanci modelu pro biochemický výzkum. Aplikace metod vyvinutých ve studii by mohla mít dalekosáhlé důsledky pro budoucnost výzkumu proteinů a vývoj léků. Další informace jsou k dispozici v podrobné publikaci Příroda najít.