Ferruz explica los avances que representa Alphafold: “Es una herramienta brutal: ha cambiado nuestra forma de trabajar”
“Todo va muy rápido. En los próximos años, en biología o química, podría pasar lo que vemos ahora en tecnología”
“En unos años podríamos diseñar, por ejemplo, una proteína que pudiera capturar CO2”
Hablar sobre diseño de proteínas por Inteligencia Artificial (IA) Puede sonar a ciencia ficción, pero desde hace unos años es solo Ciencias. Secar. Y hablar de esto es hablar de Alphafold, un programa de IA desarrollado por Google en 2018 para hacer predicciones de estructuras de proteínas a través del sistema de “aprendizaje profundo”. A la fecha, sus nuevas versiones ya han logrado determinar las estructuras de todas las proteínas conocidas en el planetaa través de predicciones con una precisión muy alta.
Pero es que, además, utilizando como base esta revolucionaria herramienta de IA, se pueden diseñar nuevas proteínas, y hacer en cuestión de minutos algo que solía llevar meses a los científicos. Ya se está haciendo, y eso significa un antes y un después en campos como la biología o la química, con sus consiguientes repercusiones a nivel sanitario o medioambientalpor ejemplo.
Sus creadores la definen como “una nueva era”y Noelia Ferruz, bióloga computacional de la Universidad de Girona, suscríbete. Ferruz lleva años investigando el diseño de proteínas por IA, los últimos seis en Alemania. en Enero, Comenzará como líder de grupo del Instituto de Biología Molecular de Barcelona. Hablamos con ella de todo esto, y de un estudio que acaba de ser presentadode lo que se ha hecho eco la revista Naturaleza.
Pregunta: ¿Cómo explicarías qué es Alphafold?
Respuesta: Para explicarlo, deberíamos empezar explicando qué son las proteínas. Es muy importante tener una buena comprensión de la estructura tridimensional de las proteínas, porque realizan casi todas las funciones de nuestras células. Y todavía no los conocemos al cien por cien.
P: La forma o estructura de una proteína es lo que determina su función en las células. Y muchos medicamentos se diseñan utilizando esta información sobre su estructura. ¿Por qué es clave conocerlos mejor?
R: Si consiguiéramos entender bien su comportamiento, su forma 3D, cómo actúan, cómo se mueven… podríamos tener la clave para resolver muchos problemas. Y hablo tanto de enfermedades, casi cualquier enfermedad, como de problemas ambientales, para tener alternativas verdes para los procesos industriales. Las proteínas son buenas para todo. Y de lo que se trata es de entender mejor su funcionamiento.
P: ¿Y qué significa hacerlo con Alphafold?
R: Lo primero que nos gustaría saber sobre las proteínas es qué forma tienen en el espacio. Porque lo que solemos saber de ellos es su código interno. Están formados por letras, y tenemos acceso a ellas, pero no sabemos cómo están dispuestas en el espacio ni qué forma final tiene la proteína. Y es difícil obtener la forma de las proteínas. Para conseguirlo hay muchas formas experimentales de hacerlo: ir al Sincrotrón en Suiza… o estudios de rayos X, por ejemplo… Pero casi todo es caro, y lleva mucho tiempo. Aun así, con mucho esfuerzo por parte de todos, ha sido posible conocer la forma de decenas de miles de proteínas en las últimas décadas.
Pero hubiera sido genial tener esta secuencia de letras en una computadora y que una máquina te dijera qué forma tiene. Deja que un algoritmo te lo diga, sin que sea tan costoso y laborioso. Es algo que se ha intentado durante años. Y hace 20 años se realizó una especie de concurso, en el que los científicos competían por lograrlo, cada uno con su propio algoritmo. Y funcionó muy bien, pero llegó un momento, allá por el 2015-2016, que no hubo más avances. Y luego llegó Google y lo arruinó todo. Fue a finales de 2018, cuando llegó la primera versión de Alphafold.
P: Luego viene el famoso algoritmo de Google…
R: Exacto. Pones las letras y ese algoritmo te da la forma 3D. Había gente muy escéptica, al principio… ya que era una máquina. Pero luego ya no. Todo el mundo se ha dado cuenta de que es una herramienta súper útil.
P: Pero eso fue solo el comienzo, ¿qué pasó hace un año?
R: Que sacaron una versión 2 de Alphafold, que ya era espectacular. A finales de 2020, principios de 2021. Y, además, lo estrenaron todo público y gratis. Tomó alrededor de 6 meses. Cualquiera puede acceder a este código, puede usarlo. Incluso han puesto servidores en línea para que pueda poner su proteína y obtener su estructura en poco tiempo. Lo que ha hecho Google es brutal. Pensamos que lo monetizarían, en realidad.
P: Es extraño que no se haya monetizado. Todo el volcado de datos está disponible gratuitamente en una base de datos creada por DeepMind, una empresa de IA propiedad de Google pero con sede en Londres…
R: Sí, es muy extraño. Deep Mind está anexado a Google pero está en Londres. Si hubiera sido Google, en EEUU, quizás lo hubieran monetizado. Tal vez por eso, es una empresa británica. Quizás pensaron más en el beneficio de la comunidad, y que esto también los beneficiaría a ellos de alguna manera.
P: Lo que está claro es que Alphafold se ha convertido en una herramienta básica para todos los que trabajáis en las llamadas “ciencias de la vida”.
R: Está siendo y será una herramienta brutal. Nos cambia muchas cosas, la forma de trabajar y los propios proyectos.
P: Te defines como “un apasionado de la intersección entre tecnología y proteínas”, en tu perfil de Twitter. Y recientemente, dijiste en Naturaleza que “desde AlphaFold, ha habido un cambio en la forma en que trabajamos con el diseño de proteínas. Estamos presenciando tiempos muy emocionantes”.
R: Sí, mi campo no es predecir estructuras de proteínas, sino diseñar nuevas letras que tengan nuevas estructuras. Es decir, diseñar nuevas proteínas. Y desde que apareció Alphafold, puedo diseñar nuevas proteínas y, en solo un momento, puedo ver qué forma tienen… algo que antes no podía.
P: Los tiempos son mucho más cortos, ahora, en su trabajo…
R: Sí. Para la predicción de la forma de las proteínas, por ejemplo, se ha pasado de años a minutos. Pero no es solo eso, ha tenido un impacto enorme en todo. Muchos biólogos no conocían las técnicas de IA, pero viendo que hay problemas de pura biología que se resuelven con esto, han dicho: “Vaya, todavía puedo implementarlo para cualquier otra cosa…”. Ha habido una pequeña revolución, en los últimos dos años, en las ciencias de la biología y la química, debido a este auge de Alphafold. Hay avances muy rápidos en todo, no solo en la predicción de la forma de las proteínas sino también en el diseño de otras nuevas.
P: Acabas de publicar un estudio sobre todo esto. Hablamos de ciencia básica, de avances en el laboratorio, pero es importante. ¿Puedes explicar lo que has hecho de una manera sencilla, para que todos podamos entenderlo?
R: Siempre uso un ejemplo para que se entienda. Todos conocemos el ‘Traductor de Google’, que funciona con otro algoritmo de inteligencia artificial. Bueno, hace diez años funcionaba fatal, pero ahora es mejor que nadie. ¿Por qué? Porque ha habido muchas mejoras en los modelos de traducción. En 2017 Google sacó otro, el ‘Transformer’, que también tuvo mucho éxito, y no solo se ha utilizado para traducir… Este tipo de arquitectura también se ha utilizado para muchas otras cosas que tienen que ver con el procesamiento del lenguaje, no solo para traducir.
Entonces pensé: hay muchas similitudes entre el lenguaje humano y las proteínas, porque se comportan de manera similar. Las proteínas se expresan con letras, como el lenguaje. Si ese ‘Transformer’ sirve para todo -incluso hace textos que hablan mejor que yo, a veces…- podría entrenarlo en secuencias de proteínas para que aprenda su idioma, el que tienen codificado, y sea capaz de hablar eso. Y eso fue lo que hicimos.
Ahora tenemos una máquina que habla mucho y genera nuevas proteínas, millones por segundo. Hasta ahora las diseñábamos más bien “a mano”, pero ahora, con esta máquina, hablamos el lenguaje de las proteínas, tenemos un modelo que emite textos en su idioma.
P: Entonces, los conoces mucho mejor…
R: Tenemos un modelo que parece que les habla y vemos que se comportan bien. Conseguimos diseñar proteínas completamente nuevas, pero se comportan como si fueran naturales. Y esto, a mano, antes era imposible. Diseñarlos a mano y hacerlos funcionar como los naturales era imposible antes. Ahora es posible. Y esto sirve para muchas cosas más, para todo…
P: Más allá del laboratorio, ¿qué beneficios nos puede traer todo esto, en general, a medio plazo?
R: Bueno, por ejemplo, podríamos diseñar una proteína que pudiera capturar CO2, o casi cualquier gas que sea un peligro para el cambio climático. Le doy un par de años. O, por ejemplo, hay muchos cánceres que se tratan con anticuerpos, que son un tipo de proteína. Podríamos intentar obtener anticuerpos más útiles, aunque esto llevaría un poco más de tiempo.
R: Sí, yo lo veo así. Para imaginar lo que puede pasar en biología o química en los próximos años, solo hay que mirar lo que está pasando ahora con la tecnología. Los avances que estamos viendo hoy en día en la generación de imágenes, vídeo, texto… dentro de unos años los podremos ver en biología o química. Es algo que ya se está haciendo. Antes llegaban un poco tarde, pero ya no, después de Alphafold todo va muy rápido.
Quizá la aplicabilidad en nuestras vidas no sea tan inmediata, no sé cuánto tardaremos en verlo, porque primero tenemos que hacer todos los controles necesarios, pruebas, autorizaciones… Serán unos años. Pero a nivel de avances en ciencia básica, se nota un cambio muy grande. De hecho, se está publicando tanto que ya no puedo leer todo lo que sale.
Leave a Reply