Las proteínas, los pilares fundamentales de la vida, orquestan una asombrosa variedad de procesos biológicos esenciales para la existencia. Desde catalizar reacciones metabólicas hasta transportar oxígeno, formar estructuras celulares y defender el organismo contra patógenos, su función es tan diversa como crucial 1. Comprender la intrincada estructura tridimensional de estas moléculas es clave para desvelar los mecanismos subyacentes a la salud y la enfermedad. Sin embargo, durante mucho tiempo, determinar estas estructuras a través de métodos experimentales tradicionales como la cristalografía de rayos X, la espectroscopia de resonancia magnética nuclear (RMN) y la criomicroscopía electrónica (crio-EM) ha sido un proceso laborioso, costoso y a menudo limitado por la naturaleza de la proteína en sí 1. Esta brecha entre la vasta cantidad de secuencias de proteínas conocidas y el número comparativamente pequeño de estructuras resueltas experimentalmente planteó un desafío significativo para la investigación biológica 5.
En este contexto, el advenimiento del modelado computacional de proteínas, impulsado recientemente por los espectaculares avances en la inteligencia artificial (IA), ha marcado un cambio de paradigma en la biología 1. Esta revolución tecnológica no solo ha acelerado drásticamente la predicción de estructuras de proteínas existentes, sino que también ha abierto nuevas fronteras en el diseño y la invención de proteínas con funciones novedosas, impensables hasta hace poco 1.
Avances Impulsados por la Inteligencia Artificial en la Predicción de Estructuras
El campo de la predicción de la estructura de proteínas experimentó un salto cuántico con la aparición de AlphaFold2, desarrollado por DeepMind 1. En la 14ª edición de la Critical Assessment of Protein Structure Prediction (CASP14), AlphaFold2 demostró una capacidad sin precedentes para predecir estructuras tridimensionales con una precisión comparable a la de los métodos experimentales para una gran cantidad de proteínas previamente desconocidas 1. Este logro se considera un hito en la biología estructural, ya que abordó un problema fundamental que había persistido durante décadas 2.
Tras este avance, DeepMind, en colaboración con el Instituto Europeo de Bioinformática (EMBL-EBI), creó la Base de Datos de Estructuras de Proteínas AlphaFold (AlphaFold DB) 2. Esta base de datos de acceso libre contiene modelos tridimensionales predichos para más de 200 millones de proteínas, que abarcan casi todas las proteínas catalogadas conocidas por la ciencia 2. La disponibilidad de esta vasta cantidad de información estructural ha democratizado el acceso a datos cruciales para la investigación, lo que potencialmente ahorra millones de dólares y cientos de millones de años en tiempo de investigación a la comunidad científica mundial 14.
Si bien AlphaFold2 marcó un antes y un después, la investigación en este campo continúa avanzando rápidamente. Han surgido otros modelos de IA potentes, como ESMFold de Meta AI y OpenFold, una implementación de código abierto inspirada en AlphaFold2 5. ESMFold, basado en modelos de lenguaje de proteínas, ofrece una alternativa que puede ser más rápida y computacionalmente eficiente en ciertos casos 8. Los modelos de lenguaje de proteínas tratan las secuencias de aminoácidos como si fueran oraciones en un lenguaje natural, aprendiendo patrones evolutivos, estructurales y funcionales directamente de las bases de datos de proteínas 1. Esta analogía con el procesamiento del lenguaje natural ha demostrado ser una vía prometedora para la predicción de estructuras 1. Por su parte, OpenFold proporciona una plataforma accesible y modificable para la comunidad científica, fomentando la innovación y la adaptación de estas potentes herramientas 13.
Método | Tipo de Método | Desarrollador | Características Clave | Fortalezas | Limitaciones |
AlphaFold2 | Basado en AlphaFold2 | DeepMind | Red neuronal profunda, red Transformer | Alta precisión para muchas proteínas | Principalmente estructuras estáticas, limitaciones con complejos e interacciones |
ESMFold | Modelo de lenguaje de proteínas | Meta AI | Basado en patrones evolutivos de secuencias | Rápido, eficiente computacionalmente, predice estructuras novedosas | Precisión generalmente menor que AlphaFold2 |
OpenFold | Basado en AlphaFold2 | Comunidad OpenFold | Implementación de código abierto de AlphaFold2 | Accesible, entrenable, fomenta la colaboración | Puede requerir más recursos computacionales para el entrenamiento |
Desvelando la Dinámica Proteica: Más Allá de las Imágenes Estáticas
Aunque los primeros modelos de IA, como AlphaFold2, revolucionaron la predicción de estructuras, inicialmente se centraron en generar una única conformación estática de una proteína 2. Sin embargo, en la realidad biológica, las proteínas son entidades dinámicas que cambian de forma constantemente durante la mayoría de los procesos celulares 10. Comprender estas fluctuaciones estructurales es fundamental para dilucidar completamente la función de una proteína y cómo interactúa con otras moléculas, incluidos los fármacos 2.
Para abordar esta limitación, se han desarrollado nuevos métodos impulsados por IA que pueden predecir rápidamente múltiples configuraciones de una proteína, ofreciendo información sobre su dinámica 10. Un equipo de investigadores de la Universidad de Brown, por ejemplo, creó una técnica que utiliza el aprendizaje automático para modelar múltiples conformaciones proteicas, añadiendo esencialmente la dimensión del tiempo a los modelos 10. Esta capacidad de pasar de modelos 3D estáticos a modelos 4D dinámicos es crucial para el descubrimiento de fármacos, ya que permite a los científicos identificar diferentes formas de atacar las proteínas con medicamentos para tratar enfermedades 10. La analogía de un caballo al galope ilustra este concepto: así como una serie de instantáneas de un caballo corriendo revelan cómo cambian sus músculos, múltiples instantáneas de una proteína en movimiento pueden mejorar la comprensión científica de su función 10.
Además, DeepMind lanzó AlphaFold3, un modelo avanzado que va más allá de la predicción de estructuras individuales para modelar las interacciones entre proteínas y otras biomoléculas, como ligandos y ácidos nucleicos 2. Esta capacidad representa un avance significativo hacia una comprensión más completa de las complejas interacciones moleculares que sustentan la vida 14.
Los métodos computacionales como las simulaciones de dinámica molecular también se benefician enormemente de la precisión de las estructuras iniciales proporcionadas por los modelos de IA 12. Estas simulaciones permiten a los investigadores estudiar el comportamiento de las biomoléculas a nivel atómico a lo largo del tiempo, proporcionando información valiosa sobre los mecanismos de plegamiento, las interacciones proteína-proteína y la unión de ligandos 12. La combinación de la predicción de estructuras impulsada por IA con la dinámica molecular ofrece una potente herramienta para investigar tanto los aspectos estáticos como los dinámicos de la función proteica.
Diseño de Proteínas a Medida: Una Nueva Frontera en Biotecnología
Más allá de la predicción de estructuras de proteínas naturales, el campo del diseño de novo de proteínas se ha convertido en una frontera apasionante de la biotecnología 1. El objetivo de este campo es crear proteínas novedosas con estructuras y funciones deseadas que no se encuentran en la naturaleza 1. Esta capacidad tiene el potencial de revolucionar la medicina, la ciencia de los materiales y la biotecnología al generar proteínas con propiedades personalizadas para aplicaciones específicas 4.
Las aplicaciones de las proteínas diseñadas de novo son cada vez más amplias e incluyen la creación de fármacos diagnósticos y terapéuticos innovadores (por ejemplo, terapias contra el cáncer, inhibidores virales, tratamientos para la enfermedad de Alzheimer), nuevas técnicas de vacunas y materiales biológicos novedosos 15. Por ejemplo, se han diseñado moléculas que muestran una mejor capacidad que los inhibidores de la tirosina quinasa actualmente disponibles en la terapia de la leucemia mieloide crónica, y una proteína diseñada de novo llamada neoleukin-2/15 mejora la actividad de las células T con receptor de antígeno quimérico (CAR) 22.
Los avances en los métodos computacionales para el diseño de novo son fundamentales para este progreso. Algoritmos como FoldDesign y TR-Rosetta, junto con el uso de modelos de aprendizaje automático para la optimización de secuencias y estructuras, están facilitando la creación de proteínas cada vez más complejas y funcionales 16. La IA desempeña un papel crucial al guiar y acelerar el proceso de diseño, permitiendo a los investigadores explorar un espacio de diseño mucho más amplio que el que la evolución ha muestreado 26. Se han diseñado proteínas de novo con funciones fascinantes, como moduladores del sistema inmunitario, biomateriales autoensamblables y puertas lógicas de proteínas, lo que demuestra la versatilidad de este enfoque 24.
Aplicaciones de Vanguardia: Del Descubrimiento de Fármacos a la Medicina de Precisión
El modelado de proteínas se ha convertido en una herramienta indispensable en el descubrimiento de fármacos 1. En el diseño de fármacos basado en la estructura, los modelos de proteínas se utilizan para identificar dianas terapéuticas, comprender las interacciones fármaco-diana y diseñar nuevas moléculas terapéuticas más eficaces y selectivas 1. La capacidad de visualizar y analizar las estructuras proteicas permite a los investigadores diseñar racionalmente fármacos que se unen a sitios específicos de las proteínas y modulan su función 7.
El modelado de proteínas también está proporcionando información crucial sobre los mecanismos de las enfermedades. Al modelar proteínas mutadas, los investigadores pueden comprender cómo las variaciones genéticas afectan la estructura y la función de las proteínas, lo que a su vez puede conducir a enfermedades como el Alzheimer y el Parkinson, donde el plegamiento incorrecto de las proteínas desempeña un papel fundamental 1.
La aplicación de la IA en la predicción de la localización de proteínas dentro de las células, como lo demuestra ProtGPS, desarrollado por investigadores del Instituto Whitehead y CSAIL, también tiene importantes implicaciones para la comprensión de las enfermedades 38. La localización de una proteína es crítica para su función, y la deslocalización puede ser un mecanismo subestimado de la enfermedad 38. ProtGPS puede predecir a cuál de los 12 tipos conocidos de compartimentos se localizará una proteína y si una mutación asociada a la enfermedad cambiará esa localización 38. Esta capacidad permite a los investigadores desarrollar terapias que se dirigen a compartimentos celulares específicos.
En el ámbito de la biotecnología industrial, el modelado de proteínas se utiliza para diseñar enzimas con actividad catalítica o estabilidad mejoradas 25. Por ejemplo, se ha utilizado el diseño de novo para crear una hidrolasa CalB con una actividad catalítica aumentada 25. Estas enzimas diseñadas pueden tener un impacto significativo en diversos procesos industriales, desde la producción de biocombustibles hasta la biorremediación 4.
El modelado de proteínas también está encontrando aplicaciones en la ciencia de los materiales. Los materiales basados en proteínas que se encuentran en la naturaleza, como la seda de araña, el colágeno y los adhesivos de mejillón, poseen propiedades estructurales y mecánicas únicas 28. Comprender la relación estructura-función en estos materiales naturales, utilizando técnicas de modelado, puede inspirar el diseño de nuevos biomateriales con propiedades personalizadas 28.
Retos y Perspectivas Futuras en el Modelado de Proteínas
A pesar de los notables avances, todavía existen retos importantes en el campo del modelado de proteínas 9. La predicción precisa de estructuras de proteínas multidominio, complejos proteicos, múltiples estados conformacionales y las vías de plegamiento de proteínas sigue siendo un desafío 9. Si bien los modelos de IA han logrado una precisión impresionante, aún no explican completamente la física subyacente al plegamiento de proteínas ni predicen con precisión los efectos de las mutaciones o las interacciones en todos los casos 2. Existe una necesidad continua de métodos mejorados para evaluar la calidad y la fiabilidad de los modelos de proteínas predichos 5.
Las perspectivas futuras en la investigación del modelado de proteínas son muy prometedoras. Se espera que los esfuerzos se centren en mejorar la predicción de la dinámica de las proteínas, sus interacciones con otras biomoléculas y el desarrollo de algoritmos de diseño de novo más sofisticados 8. El continuo desarrollo de nuevos modelos de IA, como AlphaFold3, alternativas de código abierto como OpenFold y métodos para el modelado dinámico indican un campo vibrante y en rápida evolución 2.
El Impacto Trascendental del Modelado de Proteínas en la Ciencia y la Sociedad
La revolución del modelado de proteínas, impulsada por los avances en la inteligencia artificial, ha transformado fundamentalmente la biología estructural y ha tenido un impacto profundo en numerosas disciplinas científicas. La capacidad de predecir con precisión las estructuras de proteínas y de diseñar proteínas novedosas de novo está abriendo nuevas vías para el descubrimiento de fármacos, la comprensión de los mecanismos de las enfermedades, el avance de la biotecnología y la creación de nuevos materiales. A medida que las herramientas y los métodos de modelado de proteínas continúan mejorando, podemos esperar avances aún más significativos en nuestra comprensión de la vida a nivel molecular y en nuestra capacidad para abordar los desafíos globales en salud, alimentación y sostenibilidad.
Referencias
9 Recent Advances and Challenges in Protein Structure Prediction. J Chem Inf Model, 64(1), 76-95. (2024).
10 Monteiro da Silva, G., & Rubenstein, B. (2024, March 27). Novel AI method offers fast, cost-effective way to understand protein structures in multiple dimensions. Brown University News. Retrieved from https://www.brown.edu/news/2024-03-27/protein-models
8 dos Santos, C. O., & Giraldo, R. (2023). Protein language models in structural biology: an overview. Frontiers in Bioinformatics, 3, 1120370.
5 Authors not listed. (n.d.). https://pubs.acs.org/doi/10.1021/acs.jcim.3c01324. Retrieved from https://pubs.acs.org/doi/10.1021/acs.jcim.3c01324
11 Authors not listed. (2023). Recent advances in predicting and modeling protein-protein interactions. Trends in Biochemical Sciences, 48(6), 527-538.
1 Authors not listed. (n.d.). The Protein Science Revolution – Implications for Human Health and Mortality Assumptions. RGA. Retrieved from https://www.rgare.com/knowledge-center/article/the-protein-science-revolution–implications-for-human-health-and-mortality-assumptions
6 Schwede, T. (2009). What if the protein structure prediction problem has been solved? Nature Methods, 6(1), 15-18.
2 McDonough, M. (2024, October). Did AI Solve the Protein-Folding Problem? Harvard Medical School. Retrieved from https://magazine.hms.harvard.edu/articles/did-ai-solve-protein-folding-problem
3 Zhang, Y. (2018). Protein Structure Prediction and Modeling. In Bioinformatics for Plant Systems Biology (pp. 273-296). Springer, Singapore.
4 Authors not listed. (n.d.). AlphaFold: Protein Structure Prediction Importance. PIIP. Retrieved from https://piip.co.kr/en/blog/alphafold-protein-structure-prediction-importance-1
15 Authors not listed. (2023). What Can De Novo Protein Design Bring to the Treatment of. BioMed Research International, 2023, 1-2.
22 Authors not listed. (2023). De Novo Protein Design and Its Application in Hematological Disorders. BioMed Research International, 2023, 1-10.
23 Wang, S., Zhang, Y., & Zhang, K. (2023). De Novo Protein Design and Its Application in the Biomedical Field. International Journal of Molecular Sciences, 24(2), 166.
24 Correia, B. E., & Baker, D. (2021). Computational de novo design of protein structures and functions. Nature Reviews Molecular Cell Biology, 22(1), 17-36.
16 Zhang, H., Skomski, D., Moretti, R., Hosseinzadeh, P., Fellouse, F. A., & Cortés, J. (2023). De novo design of protein folds using sequence-independent replica-exchange Monte Carlo simulations. Proceedings of the National Academy of Sciences, 120(1), e2208275120.
25 Li, Y., Zhou, J., Liu, Z., & Li, M. (2024). Graphormer-plus-plus for de novo protein sequence design. Briefings in Bioinformatics, 25(3), bbae135.
38 Friar, G. (2025, February 13). AI model deciphers the code in proteins that tells them where to go. MIT News. Retrieved from https://news.mit.edu/2025/ai-model-deciphers-code-proteins-tells-them-where-to-go-0213
12 Pereira, P. C., Sousa da Silva, A. W., & Teixeira, V. H. (2022). Unveiling the mechanical function of proteins with AI-based structure prediction. Frontiers in Molecular Biosciences, 9, 9580946.
13 Smith, T. (2024, May 23). AI models for protein structure prediction. Front Line Genomics. Retrieved from https://frontlinegenomics.com/ai-models-for-protein-structure-prediction/
14 DeepMind. (n.d.). AlphaFold. Retrieved from https://deepmind.google/technologies/alphafold/
43 Greene, C. S. (2023). Predicting protein function in the era of big data. Frontiers in Bioinformatics, 3, 1222182.
44 Zhang, Y. (2008). Progress and challenges in protein structure prediction. Current Opinion in Structural Biology, 18(3), 342-348.
17 Authors not listed. (n.d.). cdi_proquest_miscellaneous_2903859468. Retrieved from https://fau-flvc.primo.exlibrisgroup.com/discovery/fulldisplay?docid=cdi_proquest_miscellaneous_2903859468&context=PC&vid=01FALSC_FAU:FAU&lang=en&adaptor=Primo%20Central&tab=Everything&query=null%2C%2CJapanese&facet=citedby%2Cexact%2Ccdi_FETCH-LOGICAL-c565t-6488ec0fbd3e4a087623a736a4677d4e47890f4c2e8e303f870a5a3f156b1323&offset=10
45 Huang, B., Kong, L., & Wang, C. (2023). Protein Structure Prediction: Challenges, Advances, and the Shift. Genomics, Proteomics & Bioinformatics, 21(5), 913-923.
46 Prediction Center. (n.d.). CASP. Retrieved from https://predictioncenter.org/
21 O’Mara, M. L., & Deplazes, E. (n.d.). Protein and Peptide Modelling for Drug Design. The University of Queensland. Retrieved from https://espace.library.uq.edu.au/view/UQ:321005/OMara_Deplazes_FinalAuthorVersion.pdf?dsi_version=8b692bf427fa69b404c47aaa9ab58f07
7 Authors not listed. (n.d.). Structure-Based Drug Design. Drug Discovery News. Retrieved from https://www.drugdiscoverynews.com/structure-based-drug-design-15997
30 Hochreiter, S. (2023, February 23). AI Learns the Language of Proteins for Drug Discovery [Video]. YouTube. Retrieved from https://www.youtube.com/watch?v=8z_iIHXkAJk
31 Michielin, O., Bromberg, Y., & Gilson, M. K. (2011). Structure-based drug design in the age of genomics. F1000 Biology Reports, 3, 5.
32 Dobson, C. M. (n.d.). Protein Structure Analysis. Grand Valley State University. Retrieved from https://www.gvsu.edu/cms4/asset/BAC84988-C634-25FC-409B57A56DB3C9C8/dobson_protein_structure_analysis.pdf
33 Astrolamb, & Guillaume, & John. (2018, March 7). What are the applications of predicting the structure of proteins [Answer]. Biology Stack Exchange. Retrieved from https://biology.stackexchange.com/questions/71141/what-are-the-applications-of-predicting-the-structure-of-proteins
29 Abcam. (n.d.). Protein sequencing: Methods and their role in biotechnology. Retrieved from https://www.abcam.com/en-us/knowledge-center/proteins-and-protein-analysis/protein-sequencing
36 Elofsson, A. (2024). Deep learning for protein structure prediction and design. EMBO Molecular Medicine, 16(1), e18350.
26 Authors not listed. (2024, May 15). Insights into protein engineering methods and applications. The Scientist. Retrieved from https://www.the-scientist.com/insights-into-protein-engineering-methods-and-applications-72286
27 Institute for Protein Design. (n.d.). What is Protein Design? University of Washington. Retrieved from https://www.ipd.uw.edu/what-is-protein-design/
39 Holland, G. P., & Kaplan, D. L. (2018). Protein-based materials in biomedical engineering. Progress in Biomedical Engineering, 1(1), 012001.
40 Awaja, N., & Hollister, S. J. (2019). Spider silk as a biomaterial. In Advances in Polymer Science (Vol. 286, pp. 1-61). Springer, Cham.
41 Scioly.org. (n.d.). Protein Modeling. Retrieved from https://scioly.org/wiki/index.php/Protein_Modeling
42 Papadakis, V. M. (n.d.). Engineering Proteins: DNA Modeling & Testing. TeachEngineering. Retrieved from https://www.teachengineering.org/activities/view/nds-2224-bio-engineering-proteins-dna-modeling-testing
28 ByFounders. (2023, November 16). Protein Engineering: A New Paradigm Emerging at the Intersection of AI and Biotechnology. Retrieved from https://www.byfounders.vc/insights/protein-engineering-a-new-paradigm-emerging-at-the-intersection-of-ai-and-biotechnology
3 Zhang, Y. (2018). Protein Structure Prediction and Modeling. In Bioinformatics for Plant Systems Biology (pp. 273-296). Springer, Singapore.
34 Zhang, Y. (2016). Exploring Human Diseases and Biological Mechanisms by Protein Structure Prediction and Modeling. In Computational Biology and Toxicology in the Post-Genomic Era (pp. 301-319). Springer, Cham.
37 Soto, C., & Pritzkow, S. (2018). Protein misfolding, aggregation, and conformational strains in neurodegenerative diseases. Frontiers in Neurology, 9, 37.
38 Friar, G. (2025, February 13). AI model deciphers the code in proteins that tells them where to go. MIT News. Retrieved from https://news.mit.edu/2025/ai-model-deciphers-code-proteins-tells-them-where-to-go-0213
35 Godzik, A. (2024). The impact of AI-based protein structure predictions on cancer drug discovery. International Journal of Molecular Sciences, 25(3), 1665.
36 Elofsson, A. (2024). Deep learning for protein structure prediction and design. EMBO Molecular Medicine, 16(1), e18350.
18 Wang, J., Li, J., Zhao, Y., & Li, M. (2024). A Comprehensive Overview of Protein Structure Prediction Based on Artificial Intelligence. International Journal of Molecular Sciences, 25(5), 2671.
2 McDonough, M. (2024, October). Did AI Solve the Protein-Folding Problem? Harvard Medical School. Retrieved from https://magazine.hms.harvard.edu/articles/did-ai-solve-protein-folding-problem
38 Friar, G. (2025, February 13). AI model deciphers the code in proteins that tells them where to go. MIT News. Retrieved from https://news.mit.edu/2025/ai-model-deciphers-code-proteins-tells-them-where-to-go-0213
14 DeepMind. (n.d.). AlphaFold. Retrieved from https://deepmind.google/technologies/alphafold/
20 Authors not listed. (2024, October 30). Deep learning techniques transform protein structure prediction. News-Medical.Net. Retrieved from https://www.news-medical.net/news/20241030/Deep-learning-techniques-transform-protein-structure-prediction.aspx
19 Authors not listed. (2024). Advancements in Protein Structure Prediction: Novel Bioinformatics Algorithms and Applications.
35 Godzik, A. (2024). The impact of AI-based protein structure predictions on cancer drug discovery. International Journal of Molecular Sciences, 25(3), 1665.
44 Zhang, Y. (2008). Progress and challenges in protein structure prediction. Current Opinion in Structural Biology, 18(3), 342-348.
47 Barabási, A. L., & Oltvai, Z. N. (2004). Network biology: understanding the cell’s functional organization. Nature Reviews Genetics, 5(2), 101-113.