Postavke privatnosti

La revolución del MIT: los científicos finalmente descubren cómo la IA 'piensa' que es clave para descubrir nuevos medicamentos y vacunas

Científicos del MIT han desarrollado una técnica revolucionaria que revela por primera vez cómo los modelos de lenguaje de proteínas toman decisiones. Este avance en la "caja negra" de la inteligencia artificial permite un desarrollo más rápido de medicamentos y vacunas y abre la puerta a conocimientos biológicos completamente nuevos, cambiando el futuro de la medicina.

La revolución del MIT: los científicos finalmente descubren cómo la IA
Photo by: Domagoj Skledar - illustration/ arhiva (vlastita)

La revolución que trae la inteligencia artificial a la biología y la medicina está ganando un nuevo y crucial capítulo. En los últimos años, hemos sido testigos del florecimiento de potentes herramientas, los llamados modelos de lenguaje de proteínas, que han cambiado fundamentalmente la forma en que los científicos abordan la investigación de fármacos, el desarrollo de vacunas y la comprensión de los fundamentos mismos de la vida. Estos sofisticados sistemas, basados en la arquitectura de los grandes modelos de lenguaje (LLM) como los que impulsan a los populares chatbots, han demostrado una asombrosa capacidad para predecir la estructura y función de las proteínas con una precisión increíble. A pesar de su éxito, un problema fundamental permanecía sin resolver y representaba un obstáculo significativo: su completa opacidad. Los científicos obtenían respuestas extremadamente precisas, pero no tenían ninguna idea de cómo el modelo llegaba a esas conclusiones. Estaban trabajando con una especie de "caja negra", lo que limitaba la confianza y la posibilidad de un mayor perfeccionamiento.


Un estudio reciente, surgido de un laboratorio en el prestigioso Instituto de Tecnología de Massachusetts (MIT), marca un punto de inflexión en la resolución de este problema. El equipo de investigación ha aplicado con éxito una técnica innovadora que, por primera vez, permite a los científicos asomarse al interior de esa "caja negra" y determinar con precisión qué características de las proteínas toma en consideración la inteligencia artificial al hacer sus predicciones. Este avance no solo aumenta la transparencia y la explicabilidad de los modelos de IA, sino que también abre las puertas para un desarrollo acelerado de nuevas terapias y una mejor comprensión de los complejos procesos biológicos.


Descifrando la "caja negra": Cómo la IA toma decisiones


Comprender el proceso de toma de decisiones dentro de estos modelos es clave para su aplicación futura. El equipo del MIT, liderado por Onkar Gujral como autor principal y bajo la tutoría de Bonnie Berger, una distinguida profesora de matemáticas y directora del grupo de Computación y Biología, ha desarrollado un método que desmitifica el funcionamiento interno de los modelos de lenguaje de proteínas. Su trabajo, publicado en la prestigiosa revista científica Proceedings of the National Academy of Sciences, tiene el potencial de transformar la forma en que estas poderosas herramientas se utilizan en la investigación biomédica.


Los modelos de lenguaje de proteínas, cuyas bases fueron sentadas en 2018 por la profesora Berger y su entonces estudiante Tristan Bepler, funcionan analizando enormes bases de datos de secuencias de aminoácidos, de forma similar a como los modelos de lenguaje analizan el texto. Al aprender los patrones y las relaciones entre los aminoácidos, pueden predecir la estructura tridimensional de una proteína y su función biológica. Fueron precisamente estos modelos los que resultaron clave para el desarrollo acelerado de herramientas revolucionarias como AlphaFold, ESM2 y OmegaFold. Sin embargo, el problema radicaba en que la información dentro del modelo estaba codificada de una manera muy densa e incomprensible. Los científicos podían ver el resultado final, pero no el camino que conducía a él. Era como tener un estudiante genial que siempre resuelve correctamente el problema matemático más complejo, pero que nunca puede mostrarte su procedimiento.


Una técnica innovadora que trae luz a la oscuridad


Para resolver este problema, los investigadores del MIT recurrieron a un algoritmo conocido como "autoencoder disperso" (sparse autoencoder). Esta es la primera vez que un enfoque de este tipo se aplica con éxito a los modelos de lenguaje de proteínas. El principio de funcionamiento es elegante y potente. En los modelos estándar, la información sobre una proteína específica se codifica a través de la activación de un número relativamente pequeño de "nodos" dentro de la red neuronal, por ejemplo, 480. En una representación tan densa, cada nodo individual debe codificar múltiples características diferentes de la proteína simultáneamente, lo que hace que la interpretación sea prácticamente imposible.


El autoencoder disperso funciona de la manera opuesta: expande drásticamente el espacio de representación. En lugar de 480 nodos, el modelo ahora utiliza, por ejemplo, 20,000 nodos. Al mismo tiempo, el algoritmo introduce una "restricción de dispersión" que asegura que solo un pequeño número de esos nodos se active para describir la proteína. De esta manera, la información que antes estaba comprimida ahora puede "expandirse". La consecuencia es que una característica específica de una proteína, que antes estaba codificada a través de varios nodos diferentes, ahora puede ocupar su propio nodo único. "En una representación dispersa, las neuronas que se activan lo hacen de una manera más significativa", explica Gujral. Antes de este método, las redes empaquetaban la información tan apretadamente que era imposible descifrar el papel de las neuronas individuales.


El papel de la inteligencia artificial en la interpretación de sí misma


Después de obtener estas representaciones "purificadas" y dispersas para miles de proteínas diferentes, los científicos se enfrentaron a un nuevo desafío: cómo entender qué significa cada uno de esos nodos activados. Para este propósito, utilizaron la ayuda de otra inteligencia artificial, un asistente conocido con el nombre de Claude. La tarea de Claude era comparar las representaciones dispersas con las características ya conocidas de cada proteína, como su función molecular, la familia a la que pertenece o su ubicación dentro de la célula.


Al analizar un gran número de ejemplos, Claude logró conectar la activación de nodos específicos con propiedades biológicas concretas y luego describirlas en un lenguaje sencillo y comprensible para los humanos. Por ejemplo, el algoritmo podría generar una descripción como: "Este nodo parece detectar proteínas implicadas en el transporte transmembrana de iones o aminoácidos, especialmente aquellas que se encuentran en la membrana plasmática". Con este procedimiento, los nodos se volvieron "interpretables", y los científicos obtuvieron por primera vez una visión clara de lo que el modelo "piensa". Se demostró que las características que los modelos codifican con mayor frecuencia son la familia de proteínas y funciones específicas, incluidos diversos procesos metabólicos y biosintéticos.


Implicaciones prácticas: Desde el descubrimiento más rápido de fármacos hasta nuevos conocimientos biológicos


Este avance tiene consecuencias de gran alcance. Comprender las características que codifica un determinado modelo de proteínas permite a los investigadores elegir el modelo más adecuado para una tarea específica. Ya sea para identificar nuevas moléculas diana para fármacos o para diseñar vacunas más eficaces, ahora es posible utilizar una herramienta que está mejor "ajustada" para resolver un problema concreto. Esto acelera y abarata directamente todo el proceso de investigación y desarrollo.


Por ejemplo, en un estudio de 2021, el equipo de la profesora Berger utilizó un modelo de lenguaje de proteínas para predecir qué partes de las proteínas de la superficie de los virus tenían la menor probabilidad de mutar. De este modo, identificaron dianas prometedoras para el desarrollo de vacunas universales contra la gripe, el VIH y el SARS-CoV-2. Con el nuevo método de interpretación, ahora es posible no solo obtener dicha predicción, sino también comprender sobre la base de qué propiedades bioquímicas y estructurales el modelo tomó esa decisión, lo que proporciona un nivel adicional de confirmación y dirige la investigación de laboratorio posterior.


Además, el análisis de las características que el modelo reconoce de forma independiente como importantes podría conducir algún día a descubrimientos biológicos completamente nuevos. Es posible que la inteligencia artificial, al analizar patrones en los datos que el ojo humano no puede percibir, identifique funciones de proteínas hasta ahora desconocidas o descubra nuevas conexiones entre diferentes vías biológicas. "Algún día, cuando los modelos se vuelvan aún más potentes, podríamos aprender más sobre biología de lo que sabemos actualmente, y precisamente abriendo los propios modelos", concluye Gujral con optimismo. Esta tecnología promete no solo ayudarnos a encontrar respuestas a preguntas conocidas, sino también a plantear otras completamente nuevas que darán forma al futuro de la ciencia.

Encuentra alojamiento cerca

Hora de creación: 21 agosto, 2025

Redacción de ciencia y tecnología

Nuestra Redacción de Ciencia y Tecnología nació de una pasión de muchos años por investigar, interpretar y acercar temas complejos a los lectores comunes. En ella escriben empleados y voluntarios que llevan décadas siguiendo el desarrollo de la ciencia y la innovación tecnológica, desde descubrimientos de laboratorio hasta soluciones que transforman la vida cotidiana. Aunque escribimos en plural, detrás de cada texto hay una persona real con amplia experiencia editorial y periodística, y un profundo respeto por los hechos y la información verificable.

Nuestra redacción fundamenta su trabajo en la convicción de que la ciencia es más fuerte cuando es accesible para todos. Por eso buscamos claridad, precisión y comprensión, sin simplificaciones que puedan perjudicar la calidad del contenido. A menudo pasamos horas estudiando investigaciones, documentos técnicos y fuentes especializadas para presentar cada tema de una forma que interese al lector sin sobrecargarlo. En cada artículo intentamos conectar el conocimiento científico con la vida real, mostrando cómo las ideas surgidas de centros de investigación, universidades y laboratorios tecnológicos moldean el mundo que nos rodea.

Nuestra larga experiencia periodística nos permite reconocer lo que realmente importa al lector, ya se trate de avances en inteligencia artificial, descubrimientos médicos, soluciones energéticas, misiones espaciales o dispositivos que entran en nuestra vida cotidiana antes de que podamos imaginar sus posibilidades. Nuestra mirada sobre la tecnología no es solo técnica; también nos interesan las historias humanas detrás de los grandes avances: investigadores que trabajan durante años para completar proyectos, ingenieros que convierten ideas en sistemas funcionales y visionarios que amplían los límites de lo posible.

En nuestro trabajo también nos guía un fuerte sentido de responsabilidad. Queremos que el lector pueda confiar en la información que ofrecemos, por lo que verificamos fuentes, comparamos datos y no publicamos con prisa cuando algo no está completamente claro. La confianza se construye más lentamente de lo que se escribe una noticia, pero creemos que solo este tipo de periodismo tiene un valor duradero.

Para nosotros, la tecnología es más que dispositivos y la ciencia más que teoría. Son campos que impulsan el progreso, moldean la sociedad y ofrecen nuevas oportunidades a quienes desean comprender cómo funciona el mundo hoy y hacia dónde se dirige mañana. Por eso abordamos cada tema con seriedad, pero también con curiosidad, porque la curiosidad abre la puerta a los mejores textos.

Nuestra misión es acercar a los lectores a un mundo que cambia más rápido que nunca, con la convicción de que el periodismo de calidad puede ser un puente entre expertos, innovadores y todos aquellos que desean entender lo que ocurre detrás de los titulares. En esto vemos nuestra verdadera tarea: convertir lo complejo en comprensible, lo lejano en cercano y lo desconocido en inspirador.

AVISO PARA NUESTROS LECTORES
Karlobag.eu ofrece noticias, análisis e información sobre eventos globales y temas de interés para lectores de todo el mundo. Toda la información publicada se ofrece únicamente con fines informativos.
Destacamos que no somos expertos en los ámbitos científico, médico, financiero ni legal. Por lo tanto, antes de tomar decisiones basadas en la información de nuestro portal, le recomendamos que consulte a expertos cualificados.
Karlobag.eu puede contener enlaces a sitios externos de terceros, incluidos enlaces de afiliados y contenidos patrocinados. Si compra un producto o servicio a través de estos enlaces, podemos recibir una comisión. No tenemos control sobre el contenido o las políticas de dichos sitios y no asumimos responsabilidad alguna por su exactitud, disponibilidad o por cualquier transacción realizada a través de ellos.
Si publicamos información sobre eventos o venta de entradas, tenga en cuenta que no vendemos entradas ni directamente ni a través de intermediarios. Nuestro portal informa únicamente a los lectores sobre eventos y oportunidades de compra a través de plataformas de venta externas. Conectamos a los lectores con socios que ofrecen servicios de venta de entradas, pero no garantizamos su disponibilidad, precios o condiciones de compra. Toda la información sobre las entradas es obtenida de terceros y puede estar sujeta a cambios sin previo aviso. Le recomendamos que verifique detenidamente las condiciones de venta con el socio seleccionado antes de realizar cualquier compra.
Toda la información en nuestro portal está sujeta a cambios sin previo aviso. Al utilizar este portal, usted acepta leer el contenido bajo su propio riesgo.