Avance en la investigación de proteínas: ¡el nuevo modelo de IA revoluciona el diseño de fármacos!
Investigadores de FU Berlin y Microsoft presentan BioEmu, un modelo de IA para la predicción precisa de proteínas.

Avance en la investigación de proteínas: ¡el nuevo modelo de IA revoluciona el diseño de fármacos!
Un equipo de investigación de Universidad Libre de Berlín en colaboración con Microsoft investiga la IA para la ciencia ha logrado un avance significativo en el modelado de proteínas biológicas. Esta prueba es el tema central del 10 de julio en la revista. Ciencia Estudio publicado titulado “Emulación escalable de conjuntos de equilibrio de proteínas con aprendizaje profundo generativo”. Los nuevos hallazgos podrían facilitar futuros avances en el diseño de fármacos y la investigación biomédica.
El objetivo principal del estudio es la introducción de BioEmu, un innovador sistema generativo de aprendizaje profundo para emular el comportamiento de equilibrio de las proteínas. BioEmu se caracteriza por su alta precisión y exactitud y pretende reflejar mejor la función de muchas proteínas cuya actividad depende en gran medida de su estructura dinámica. Un objetivo clave del desarrollo es aumentar la tasa de éxito de nuevos ingredientes activos en estudios clínicos.
Innovación tecnológica y aumento de la eficiencia
Es de destacar la capacidad de BioEmu para generar miles de estructuras proteicas estadísticamente independientes por hora en una sola tarjeta gráfica (GPU). Esto conduce a una reducción significativa en el costo y el tiempo necesarios para investigar cambios estructurales funcionalmente relevantes. Al combinar más de 200 milisegundos de simulaciones de dinámica molecular con datos experimentales, BioEmu logra la predicción de conjuntos estructurales y propiedades termodinámicas con una precisión casi experimental.
Los equipos de investigación dirigidos por el Prof. Dr. Frank Noé y la Prof. Dra. Cecilia Clementi han realizado importantes contribuciones al desarrollo. El profesor Noé, socio director de investigación de Microsoft Research y profesor honorario de la FU de Berlín, destaca que BioEmu también puede predecir cambios estructurales complejos, como bolsas de unión ocultas y movimientos de dominios proteicos completos. Esto permite una predicción precisa de los cambios en la estabilidad de las proteínas con una precisión comparable a la de los análisis de laboratorio.
Enfoques tradicionales versus aprendizaje profundo
Se sabe que las técnicas actuales de simulación de dinámica molecular son lentas, costosas y requieren muchos recursos. BioEmu ofrece una alternativa más rápida y económica. Desarrollado por Sarah Lewis y su equipo, el modelo combina datos de entrenamiento de predicciones de estructuras AlphaFold, simulaciones de dinámica molecular a gran escala y extensas mediciones experimentales de la estabilidad de proteínas.
Sin embargo, también existen limitaciones: BioEmu no modela de forma nativa la dinámica molecular ni las interacciones con membranas y ligandos, ni tiene en cuenta condiciones ambientales variables como la temperatura o el pH. Aún así, los autores esperan que el modelo demuestre cómo el aprendizaje profundo puede amortizar los altos costos de las simulaciones y experimentos para permitir la predicción a gran escala de la función de las proteínas basada en datos.
Implicaciones prácticas e investigaciones futuras.
Un aspecto importante del estudio es la publicación por parte de Microsoft Research de un gran conjunto de datos utilizado para desarrollar BioEmu. Este conjunto de datos es la colección más grande disponible públicamente de simulaciones de proteínas de secuencia diversa. La amplia disponibilidad del código fuente de BioEmu bajo la licencia del MIT abre nuevas vías en la investigación bioinformática y el diseño de fármacos.
Investigaciones como esta son cruciales para comprender la biología y el funcionamiento de las proteínas que cambian entre diferentes formas. Este sigue siendo un desafío clave para la ciencia, especialmente en la biotecnología y la investigación médica.