Dans un monde où la recherche scientifique et le développement de nouveaux matériaux sont souvent confrontés à des blocages en raison de contraintes de temps, de coût et d'expérimentation, des chercheurs du MIT ont lancé un système révolutionnaire qui promet de changer la manière dont les hypothèses scientifiques sont testées et confirmées. Ils l'ont baptisé CRESt — « Copilot for Real-world Experimental Scientists ». Ce système innovant combine l'intelligence artificielle, la robotique, l'apprentissage automatique et l'intuition humaine dans un écosystème expérimental unique qui planifie, mène, surveille et adapte de manière autonome les expériences sur les matériaux.
Derrière l'idée : les défis des méthodes traditionnelles en science des matériaux
Les méthodes actuelles de découverte et d'optimisation de nouveaux matériaux dépendent souvent de la conception manuelle d'expériences, de modifications itératives et d'un grand nombre d'essais et d'erreurs. Les chercheurs doivent concevoir des protocoles, synthétiser des échantillons, effectuer des mesures, analyser les résultats, puis décider de la direction à suivre. Cette approche entraîne une perte de temps et de ressources, surtout lorsque le nombre de variables augmente rapidement.
Jusqu'à présent, de nombreuses tentatives d'application de l'apprentissage automatique dans ce domaine reposaient sur des modèles simples avec un seul flux de données, comme la comparaison de compositions et de propriétés dérivées, ou l'utilisation de l'apprentissage actif (*active learning*) dans le cadre de l'optimisation bayésienne. Cependant, ces approches basées sur des modèles sont souvent limitées — elles ne traitent qu'une petite partie de la complexité des relations entre les compositions chimiques, les paramètres de traitement, les microstructures et les conditions expérimentales.
De plus, la reproductibilité des expériences souffre souvent de différences nuancées dans la préparation des échantillons, de la dérive des équipements, de déviations imprévues et d'incohérences. Pour atteindre une véritable autonomie en laboratoire, un système doit être capable non seulement de réaliser des expériences, mais aussi de les superviser, de détecter les erreurs et de s'adapter en temps réel.
Comment fonctionne CRESt : intégration de données multimodales et exécution robotique
Le principal avantage du système CRESt est sa capacité à combiner diverses sources de connaissances — articles et littérature, compositions chimiques, images microstructurales (par ex. SEM, XRD), paramètres de processus et résultats de mesure — et à les fusionner en une stratégie unique pilotée par l'IA. Le système utilise un grand modèle multimodal (LMM) qui apprend de toutes ces modalités et prend des décisions sur les expériences futures.
Lorsqu'un chercheur donne des instructions dans l'interface utilisateur (par texte ou par voix), CRESt analyse le problème, intègre la littérature et les données historiques, formule des propositions d'expériences et lance des robots pour les exécuter. Pendant l'expérience, le système utilise des caméras intégrées et des modèles de traitement d'image pour surveiller la performance : il peut détecter un déplacement de pipette, une forme d'échantillon irrégulière ou un changement inattendu dans le système et suggérer automatiquement des ajustements.
L'infrastructure robotique du système comprend des équipements de manipulation de liquides (liquid-handling), des dispositifs pour la synthèse rapide de matériaux (par ex. systèmes de « choc carbothermique »), des stations électrochimiques automatisées pour les tests de performance et des instruments microscopiques pour la caractérisation des échantillons. Le système contrôle également les pompes, les systèmes de ventilation et les composants de vannes, souvent à distance ou automatiquement.
Comment CRESt choisit-il les prochaines expériences ? D'abord, le système utilise des plongements (embeddings) basés sur la littérature et une base de données pour représenter les recettes chimiques potentielles dans un espace de grande dimension. Ensuite, des méthodes analytiques telles que l'analyse en composantes principales (ACP) réduisent la dimensionnalité dans cet espace de représentation, en conservant les variables les plus importantes. Sur cet espace réduit, une optimisation bayésienne est effectuée pour sélectionner le prochain état prometteur d'expériences. Les résultats obtenus (chimie + paramètres + performance) sont réinjectés dans le modèle, permettant au système d'apprendre et de mettre à jour ses décisions.
Si le système détecte une irrégularité dans l'expérience, il utilise des modèles visuels et des informations du domaine pour proposer des mesures correctives. De cette manière, il n'apprend pas seulement des résultats, mais réagit également aux événements réels en laboratoire.
Résultats de démonstration : un catalyseur de nouvelle génération pour les piles à combustible à formate direct
L'équipe de chercheurs du MIT a mené un cycle expérimental en utilisant CRESt de manière systématique, testant plus de 900 formulations chimiques et effectuant environ 3 500 mesures électrochimiques sur une période de plusieurs mois. Cette expérience a conduit à la découverte d'un catalyseur composé de huit éléments, qui a atteint une densité de puissance record dans une pile à combustible à formate direct (utilisant le formate comme combustible). Le système a réussi à atteindre un rapport puissance/dollar 9,3 fois meilleur par rapport aux catalyseurs en palladium pur, en utilisant seulement un quart des métaux précieux par rapport aux normes précédentes.
Il est important de souligner qu'il n'était pas fixé à l'avance que le système utiliserait les éléments de départ — CRESt a lui-même exploré des combinaisons, inclus différents éléments et optimisé les résultats de manière itérative. Cela a permis de réduire les coûts et d'augmenter l'efficacité, se rapprochant ainsi de l'objectif de technologies de piles à combustible durables et économiquement viables.
Avantages et défis : où CRESt excelle et où il doit être amélioré
Les avantages de cette approche sont évidents :
- itérations plus rapides dans l'expérimentation ;
- moins de besoin d'interventions manuelles ;
- utilisation de données diverses dans une seule stratégie cohérente ;
- meilleure reproductibilité grâce à la surveillance en temps réel ;
- démocratisation — les chercheurs sans connaissances avancées en programmation peuvent également utiliser le système via le langage naturel.
Cependant, il y a aussi des obstacles à surmonter. Des systèmes comme CRESt nécessitent des intégrations matérielles très précises et un cadre logiciel robuste pour résister aux risques de variations expérimentales. La gestion du bruit, des incertitudes et des erreurs aléatoires en laboratoire reste un défi. Une revue de la littérature sur les laboratoires autonomes souligne qu'il est crucial d'intégrer une conception qui permet la reproductibilité, l'interopérabilité et des protocoles reproductibles dans les systèmes qui expérimentent de manière autonome.
De plus, le recours à un grand nombre d'expériences automatisées peut créer un problème de « surcharge de données » — le système doit être capable de filtrer et de sélectionner les informations les plus pertinentes. En ce sens, des travaux méthodologiques dans le domaine de l'apprentissage actif montrent que le choix des stratégies d'acquisition (acquisition functions), l'équilibre entre l'exploitation et l'exploration, et l'intégration des lois physiques dans les modèles (ce que l'on appelle le scientific machine learning) peuvent affecter de manière significative l'efficacité du système.
Regard vers l'avenir et implications pour la pratique scientifique
Le système CRESt montre qu'il est possible de construire des laboratoires autonomes qui ne fonctionnent pas seulement selon des scripts rigides, mais qui apprennent, s'adaptent et communiquent en langage humain. Une telle approche ouvre la voie à une « production de masse scientifique » — expériences parallèles, partage de données dans le cloud et collaboration entre laboratoires du monde entier.
Les améliorations déjà en cours de développement incluent l'intégration de plusieurs agents d'intelligence artificielle au sein de CRESt, qui « se parlent » les uns aux autres pour améliorer le traitement des images et la prise de décision en analyse des matériaux. De telles approches multi-agents contribuent à une meilleure précision dans la reconnaissance des phases et des structures dans les matériaux.
L'extension de tels systèmes de l'échelle du laboratoire aux processus industriels, aux usines pilotes automatisées et à la production de masse nécessitera des étapes supplémentaires : la normalisation des protocoles, la modularité des composants de laboratoire, un format ouvert d'échange de données et l'interopérabilité entre différents laboratoires autonomes.
En fin de compte, CRESt ne vise pas à remplacer le scientifique humain, mais à le renforcer. Le système explique ses hypothèses et ses processus en langage naturel et permet la collaboration entre l'homme et la machine pour résoudre les problèmes les plus complexes. Tandis que les machines optimisent et automatisent, les humains restent les créateurs, réfléchissant de manière critique et orientant le flux scientifique vers un horizon inconnu.
Heure de création: 4 heures avant