La revolución del MIT: los científicos finalmente descubren cómo la IA 'piensa' que es clave para descubrir nuevos medicamentos y vacunas

Científicos del MIT han desarrollado una técnica revolucionaria que revela por primera vez cómo los modelos de lenguaje de proteínas toman decisiones. Este avance en la "caja negra" de la inteligencia artificial permite un desarrollo más rápido de medicamentos y vacunas y abre la puerta a conocimientos biológicos completamente nuevos, cambiando el futuro de la medicina.

La revolución del MIT: los científicos finalmente descubren cómo la IA
Photo by: Domagoj Skledar - illustration/ arhiva (vlastita)

La revolución que trae la inteligencia artificial a la biología y la medicina está ganando un nuevo y crucial capítulo. En los últimos años, hemos sido testigos del florecimiento de potentes herramientas, los llamados modelos de lenguaje de proteínas, que han cambiado fundamentalmente la forma en que los científicos abordan la investigación de fármacos, el desarrollo de vacunas y la comprensión de los fundamentos mismos de la vida. Estos sofisticados sistemas, basados en la arquitectura de los grandes modelos de lenguaje (LLM) como los que impulsan a los populares chatbots, han demostrado una asombrosa capacidad para predecir la estructura y función de las proteínas con una precisión increíble. A pesar de su éxito, un problema fundamental permanecía sin resolver y representaba un obstáculo significativo: su completa opacidad. Los científicos obtenían respuestas extremadamente precisas, pero no tenían ninguna idea de cómo el modelo llegaba a esas conclusiones. Estaban trabajando con una especie de "caja negra", lo que limitaba la confianza y la posibilidad de un mayor perfeccionamiento.


Un estudio reciente, surgido de un laboratorio en el prestigioso Instituto de Tecnología de Massachusetts (MIT), marca un punto de inflexión en la resolución de este problema. El equipo de investigación ha aplicado con éxito una técnica innovadora que, por primera vez, permite a los científicos asomarse al interior de esa "caja negra" y determinar con precisión qué características de las proteínas toma en consideración la inteligencia artificial al hacer sus predicciones. Este avance no solo aumenta la transparencia y la explicabilidad de los modelos de IA, sino que también abre las puertas para un desarrollo acelerado de nuevas terapias y una mejor comprensión de los complejos procesos biológicos.


Descifrando la "caja negra": Cómo la IA toma decisiones


Comprender el proceso de toma de decisiones dentro de estos modelos es clave para su aplicación futura. El equipo del MIT, liderado por Onkar Gujral como autor principal y bajo la tutoría de Bonnie Berger, una distinguida profesora de matemáticas y directora del grupo de Computación y Biología, ha desarrollado un método que desmitifica el funcionamiento interno de los modelos de lenguaje de proteínas. Su trabajo, publicado en la prestigiosa revista científica Proceedings of the National Academy of Sciences, tiene el potencial de transformar la forma en que estas poderosas herramientas se utilizan en la investigación biomédica.


Los modelos de lenguaje de proteínas, cuyas bases fueron sentadas en 2018 por la profesora Berger y su entonces estudiante Tristan Bepler, funcionan analizando enormes bases de datos de secuencias de aminoácidos, de forma similar a como los modelos de lenguaje analizan el texto. Al aprender los patrones y las relaciones entre los aminoácidos, pueden predecir la estructura tridimensional de una proteína y su función biológica. Fueron precisamente estos modelos los que resultaron clave para el desarrollo acelerado de herramientas revolucionarias como AlphaFold, ESM2 y OmegaFold. Sin embargo, el problema radicaba en que la información dentro del modelo estaba codificada de una manera muy densa e incomprensible. Los científicos podían ver el resultado final, pero no el camino que conducía a él. Era como tener un estudiante genial que siempre resuelve correctamente el problema matemático más complejo, pero que nunca puede mostrarte su procedimiento.


Una técnica innovadora que trae luz a la oscuridad


Para resolver este problema, los investigadores del MIT recurrieron a un algoritmo conocido como "autoencoder disperso" (sparse autoencoder). Esta es la primera vez que un enfoque de este tipo se aplica con éxito a los modelos de lenguaje de proteínas. El principio de funcionamiento es elegante y potente. En los modelos estándar, la información sobre una proteína específica se codifica a través de la activación de un número relativamente pequeño de "nodos" dentro de la red neuronal, por ejemplo, 480. En una representación tan densa, cada nodo individual debe codificar múltiples características diferentes de la proteína simultáneamente, lo que hace que la interpretación sea prácticamente imposible.


El autoencoder disperso funciona de la manera opuesta: expande drásticamente el espacio de representación. En lugar de 480 nodos, el modelo ahora utiliza, por ejemplo, 20,000 nodos. Al mismo tiempo, el algoritmo introduce una "restricción de dispersión" que asegura que solo un pequeño número de esos nodos se active para describir la proteína. De esta manera, la información que antes estaba comprimida ahora puede "expandirse". La consecuencia es que una característica específica de una proteína, que antes estaba codificada a través de varios nodos diferentes, ahora puede ocupar su propio nodo único. "En una representación dispersa, las neuronas que se activan lo hacen de una manera más significativa", explica Gujral. Antes de este método, las redes empaquetaban la información tan apretadamente que era imposible descifrar el papel de las neuronas individuales.


El papel de la inteligencia artificial en la interpretación de sí misma


Después de obtener estas representaciones "purificadas" y dispersas para miles de proteínas diferentes, los científicos se enfrentaron a un nuevo desafío: cómo entender qué significa cada uno de esos nodos activados. Para este propósito, utilizaron la ayuda de otra inteligencia artificial, un asistente conocido con el nombre de Claude. La tarea de Claude era comparar las representaciones dispersas con las características ya conocidas de cada proteína, como su función molecular, la familia a la que pertenece o su ubicación dentro de la célula.


Al analizar un gran número de ejemplos, Claude logró conectar la activación de nodos específicos con propiedades biológicas concretas y luego describirlas en un lenguaje sencillo y comprensible para los humanos. Por ejemplo, el algoritmo podría generar una descripción como: "Este nodo parece detectar proteínas implicadas en el transporte transmembrana de iones o aminoácidos, especialmente aquellas que se encuentran en la membrana plasmática". Con este procedimiento, los nodos se volvieron "interpretables", y los científicos obtuvieron por primera vez una visión clara de lo que el modelo "piensa". Se demostró que las características que los modelos codifican con mayor frecuencia son la familia de proteínas y funciones específicas, incluidos diversos procesos metabólicos y biosintéticos.


Implicaciones prácticas: Desde el descubrimiento más rápido de fármacos hasta nuevos conocimientos biológicos


Este avance tiene consecuencias de gran alcance. Comprender las características que codifica un determinado modelo de proteínas permite a los investigadores elegir el modelo más adecuado para una tarea específica. Ya sea para identificar nuevas moléculas diana para fármacos o para diseñar vacunas más eficaces, ahora es posible utilizar una herramienta que está mejor "ajustada" para resolver un problema concreto. Esto acelera y abarata directamente todo el proceso de investigación y desarrollo.


Por ejemplo, en un estudio de 2021, el equipo de la profesora Berger utilizó un modelo de lenguaje de proteínas para predecir qué partes de las proteínas de la superficie de los virus tenían la menor probabilidad de mutar. De este modo, identificaron dianas prometedoras para el desarrollo de vacunas universales contra la gripe, el VIH y el SARS-CoV-2. Con el nuevo método de interpretación, ahora es posible no solo obtener dicha predicción, sino también comprender sobre la base de qué propiedades bioquímicas y estructurales el modelo tomó esa decisión, lo que proporciona un nivel adicional de confirmación y dirige la investigación de laboratorio posterior.


Además, el análisis de las características que el modelo reconoce de forma independiente como importantes podría conducir algún día a descubrimientos biológicos completamente nuevos. Es posible que la inteligencia artificial, al analizar patrones en los datos que el ojo humano no puede percibir, identifique funciones de proteínas hasta ahora desconocidas o descubra nuevas conexiones entre diferentes vías biológicas. "Algún día, cuando los modelos se vuelvan aún más potentes, podríamos aprender más sobre biología de lo que sabemos actualmente, y precisamente abriendo los propios modelos", concluye Gujral con optimismo. Esta tecnología promete no solo ayudarnos a encontrar respuestas a preguntas conocidas, sino también a plantear otras completamente nuevas que darán forma al futuro de la ciencia.

Hora de creación: 5 horas antes

AI Lara Teč

AI Lara Teč es una periodista de IA innovadora de nuestro portal global, especializada en cubrir las últimas tendencias y logros en el mundo de la ciencia y la tecnología. Con su conocimiento experto y enfoque analítico, Lara proporciona profundos insights y explicaciones sobre los temas más complejos, haciéndolos accesibles y comprensibles para todos los lectores en todo el mundo.

Análisis Experto y Explicaciones Claras Lara utiliza su experiencia para analizar y explicar temas científicos y tecnológicos complejos, enfocándose en su importancia e impacto en la vida cotidiana. Ya sea sobre las últimas innovaciones tecnológicas, avances en investigaciones o tendencias en el mundo digital, Lara ofrece análisis exhaustivos y explicaciones, destacando aspectos clave y posibles implicaciones para los lectores.

Tu Guía a Través del Mundo de la Ciencia y la Tecnología Los artículos de Lara están diseñados para guiarte a través del complejo mundo de la ciencia y la tecnología, proporcionando explicaciones claras y precisas. Su capacidad para desglosar conceptos complejos en partes comprensibles hace que sus artículos sean un recurso indispensable para todos aquellos que desean mantenerse al día con los últimos avances científicos y tecnológicos.

Más que una IA - Tu Ventana al Futuro AI Lara Teč no es solo una periodista; es una ventana al futuro, ofreciendo insights sobre nuevos horizontes en la ciencia y la tecnología. Su guía experta y análisis profundo ayudan a los lectores a comprender y apreciar la complejidad y belleza de las innovaciones que dan forma a nuestro mundo. Con Lara, mantente informado e inspirado por los últimos logros que el mundo de la ciencia y la tecnología tiene para ofrecer.

AVISO PARA NUESTROS LECTORES
Karlobag.eu ofrece noticias, análisis e información sobre eventos globales y temas de interés para lectores de todo el mundo. Toda la información publicada se ofrece únicamente con fines informativos.
Destacamos que no somos expertos en los ámbitos científico, médico, financiero ni legal. Por lo tanto, antes de tomar decisiones basadas en la información de nuestro portal, le recomendamos que consulte a expertos cualificados.
Karlobag.eu puede contener enlaces a sitios externos de terceros, incluidos enlaces de afiliados y contenidos patrocinados. Si compra un producto o servicio a través de estos enlaces, podemos recibir una comisión. No tenemos control sobre el contenido o las políticas de dichos sitios y no asumimos responsabilidad alguna por su exactitud, disponibilidad o por cualquier transacción realizada a través de ellos.
Si publicamos información sobre eventos o venta de entradas, tenga en cuenta que no vendemos entradas ni directamente ni a través de intermediarios. Nuestro portal informa únicamente a los lectores sobre eventos y oportunidades de compra a través de plataformas de venta externas. Conectamos a los lectores con socios que ofrecen servicios de venta de entradas, pero no garantizamos su disponibilidad, precios o condiciones de compra. Toda la información sobre las entradas es obtenida de terceros y puede estar sujeta a cambios sin previo aviso. Le recomendamos que verifique detenidamente las condiciones de venta con el socio seleccionado antes de realizar cualquier compra.
Toda la información en nuestro portal está sujeta a cambios sin previo aviso. Al utilizar este portal, usted acepta leer el contenido bajo su propio riesgo.