En un mundo donde la investigación científica y el desarrollo de nuevos materiales a menudo se enfrentan a estancamientos debido a limitaciones de tiempo, costo y experimentales, investigadores del MIT han lanzado un sistema revolucionario que promete cambiar la forma en que se prueban y confirman las hipótesis científicas. Lo llamaron CRESt — “Copilot for Real-world Experimental Scientists”. Este innovador sistema combina inteligencia artificial, robótica, aprendizaje automático e intuición humana en un ecosistema experimental único que planifica, ejecuta, monitorea y ajusta de forma autónoma los experimentos con materiales.
Detrás de la idea: desafíos de los métodos tradicionales en la ciencia de los materiales
Los métodos actuales para descubrir y optimizar nuevos materiales a menudo dependen del diseño manual de experimentos, modificaciones iterativas y una gran cantidad de ensayos y errores. Los investigadores deben diseñar protocolos, sintetizar muestras, realizar mediciones, analizar resultados y luego decidir qué dirección considerar a continuación. En tal enfoque, se pierden tiempo y recursos, especialmente cuando el número de variables aumenta rápidamente.
Hasta ahora, muchos intentos de aplicar el aprendizaje automático en este campo se han basado en modelos simples con un único flujo de datos, como la comparación de composiciones y propiedades derivadas, o el uso del aprendizaje activo (*active learning*) en el marco de la optimización bayesiana. Sin embargo, estos enfoques basados en modelos suelen ser limitados: abordan solo una pequeña parte de la complejidad en las relaciones entre composiciones químicas, parámetros de proceso, microestructuras y condiciones experimentales.
Además, la reproducibilidad de los experimentos a menudo se ve afectada por diferencias sutiles en la preparación de muestras, la deriva del equipo, desviaciones imprevistas e inconsistencias. Para alcanzar una verdadera autonomía en el laboratorio, un sistema debe ser capaz no solo de realizar experimentos, sino también de supervisarlos, detectar errores y adaptarse en tiempo real.
Cómo funciona CRESt: integración de datos multimodales y ejecución robótica
La principal ventaja del sistema CRESt es su capacidad para combinar diversas fuentes de conocimiento —trabajos escritos y literatura, composiciones químicas, imágenes microestructurales (p. ej., SEM, XRD), parámetros de proceso y resultados de mediciones— y unirlas en una única estrategia impulsada por la IA. El sistema utiliza un gran modelo multimodal (LMM) que aprende de todas estas modalidades y toma decisiones sobre experimentos futuros.
Cuando un investigador da instrucciones en la interfaz de usuario (textual o por voz), CRESt analiza el problema, incorpora la literatura y los datos históricos, formula propuestas de experimentos e inicia a los robots para que los ejecuten. Durante el experimento, el sistema utiliza cámaras incorporadas y modelos de procesamiento de imágenes para supervisar la ejecución: puede detectar un desplazamiento de la pipeta, una forma de muestra irregular o un cambio inesperado en el sistema y sugerir ajustes automáticamente.
La infraestructura robótica del sistema incluye equipos de manipulación de líquidos (liquid-handling), dispositivos para la síntesis rápida de materiales (p. ej., sistemas de “choque carbotérmico”), estaciones electroquímicas automáticas para pruebas de rendimiento e instrumentos microscópicos para la caracterización de muestras. El sistema también controla bombas, sistemas de ventilación y componentes de válvulas, a menudo de forma remota o automática.
¿Cómo selecciona CRESt los siguientes experimentos? Primero, el sistema utiliza incrustaciones (embeddings) basadas en la literatura y una base de datos para representar posibles recetas químicas en un espacio de alta dimensión. Luego, métodos analíticos como el análisis de componentes principales (ACP) reducen la dimensionalidad a este espacio de representación, conservando las variables más importantes. En este espacio reducido, se realiza una optimización bayesiana para seleccionar el siguiente estado prometedor de los experimentos. Los resultados obtenidos (química + parámetros + rendimiento) se devuelven al modelo, lo que permite que el sistema aprenda y actualice sus decisiones.
En caso de que el sistema observe una irregularidad en el experimento, utiliza modelos visuales e información del dominio para proponer medidas correctivas. De esta manera, no solo aprende de los resultados, sino que también reacciona a los eventos reales en el laboratorio.
Resultados demostrativos: un catalizador de nueva generación para pilas de combustible de formato directo
El equipo de investigadores del MIT llevó a cabo un ciclo experimental mediante el uso sistemático de CRESt, en el que se probaron más de 900 formulaciones químicas y se realizaron alrededor de 3.500 mediciones electroquímicas en un período de varios meses. Este experimento condujo al descubrimiento de un catalizador compuesto por ocho elementos, que logró una densidad de potencia récord en una pila de combustible de formato directo (utilizando formato como combustible). El sistema logró alcanzar una relación de potencia por dólar 9,3 veces mejor en comparación con los catalizadores de paladio puro, utilizando solo una cuarta parte de los metales preciosos en relación con los estándares anteriores.
Es importante destacar que no se fijó de antemano que el sistema utilizara los elementos de partida: CRESt exploró por sí mismo las combinaciones, incluyó diferentes elementos y optimizó iterativamente los resultados. Así se logró una reducción de costos y un aumento de la eficiencia, acercándose al objetivo de tecnologías de pilas de combustible sostenibles y económicamente viables.
Ventajas y desafíos: dónde brilla CRESt y dónde necesita mejoras
Las ventajas de este enfoque son obvias:
- iteraciones más rápidas en la experimentación;
- menor necesidad de intervenciones manuales;
- uso de datos diversos en una única estrategia coherente;
- mejor reproducibilidad gracias a la supervisión en tiempo real;
- democratización: los investigadores sin conocimientos avanzados de programación también pueden utilizar el sistema a través del lenguaje natural.
No obstante, también existen obstáculos que deben superarse. Sistemas como CRESt requieren integraciones de hardware muy precisas y un marco de software robusto para soportar los riesgos de las variaciones experimentales. La gestión del ruido, las incertidumbres y los errores aleatorios en el laboratorio sigue siendo un desafío. En una revisión de la literatura sobre laboratorios autónomos, se destaca que es crucial incorporar un diseño que permita la reproducibilidad, la interoperabilidad y los protocolos repetibles en los sistemas que experimentan de forma autónoma.
Además, depender de un gran número de experimentos automatizados puede crear un problema de “sobrecarga de datos”: el sistema debe ser capaz de filtrar y seleccionar la información más relevante. En este sentido, los trabajos metodológicos del campo del aprendizaje activo demuestran que la elección de las estrategias de adquisición (acquisition functions), el equilibrio entre la explotación y la exploración, y la incorporación de leyes físicas en los modelos (el llamado scientific machine learning) pueden influir significativamente en la eficiencia del sistema.
Una mirada al futuro e implicaciones para la práctica científica
El sistema CRESt demuestra que es posible construir laboratorios autónomos que no solo trabajen según guiones rígidos, sino que aprendan, se adapten y se comuniquen en lenguaje humano. Este enfoque abre la puerta a la “producción masiva científica”: experimentos paralelos, intercambio de datos en la nube y colaboración entre laboratorios de todo el mundo.
Las mejoras que ya están en desarrollo incluyen la integración de múltiples agentes de inteligencia artificial dentro de CRESt, que “conversan” entre sí para mejorar el procesamiento de imágenes y la toma de decisiones en el análisis de materiales. Estos enfoques multiagente contribuyen a una mayor precisión en el reconocimiento de fases y estructuras en los materiales.
La expansión de tales sistemas desde la escala de laboratorio hacia los procesos industriales, las plantas piloto automatizadas y la producción en masa requerirá pasos adicionales: estandarización de protocolos, modularidad de los componentes de laboratorio, un formato abierto de intercambio de datos e interoperabilidad entre diferentes laboratorios autónomos.
En última instancia, CRESt no pretende reemplazar al científico humano, sino potenciarlo. El sistema explica sus hipótesis y procesos en lenguaje natural y permite la colaboración entre el hombre y la máquina para resolver los problemas más complejos. Mientras las máquinas optimizan y automatizan, los humanos siguen siendo los creadores, que piensan críticamente y dirigen el flujo científico hacia un horizonte desconocido.
Hora de creación: 4 horas antes