Des outils d’IA ont accéléré l’analyse des données de grossesse et la création de modèles pour évaluer la naissance prématurée
Des chercheurs de l’University of California à San Francisco (UCSF) et de la Wayne State University à Detroit ont publié les résultats d’une expérience dans laquelle des chatbots d’IA générative ont été utilisés pour construire des « pipelines » informatiques et des modèles prédictifs sur de grands ensembles de données de grossesse. La comparaison a été menée de sorte que des équipes humaines et des outils d’IA aient reçu la même tâche : à partir des données de plus d’un millier de femmes enceintes, construire des algorithmes capables de prédire le risque de naissance prématurée et, dans des tâches séparées, d’estimer l’âge gestationnel à partir d’échantillons biologiques.
Le résultat qui a attiré le plus l’attention n’est pas seulement que certains modèles étaient comparables à ceux développés auparavant par des équipes expertes en data science, mais aussi le fait qu’une partie du travail qui, en pratique, ralentit souvent la recherche biomédicale – écrire et corriger du code, fusionner des tableaux, valider et répéter des analyses – a, dans ce cas, été réduite de semaines et de mois à des heures, voire des minutes. Les auteurs soulignent qu’il ne s’agit pas de remplacer l’expertise humaine, mais de modifier la dynamique du travail : l’IA peut prendre en charge les étapes routinières, et les chercheurs disposent de plus de temps pour vérifier les résultats, les interpréter et poser de meilleures questions.
Pourquoi la naissance prématurée reste un grand problème de santé publique
La naissance prématurée, définie comme une naissance avant 37 semaines de grossesse révolues, est associée à un risque accru de mortalité néonatale et à de nombreuses conséquences à long terme, notamment des difficultés motrices et cognitives. Selon l’Organisation mondiale de la Santé, on estime qu’en 2020 environ 13,4 millions de bébés sont nés prématurément dans le monde, et les complications liées à la prématurité sont citées comme la principale cause de décès chez les enfants de moins de cinq ans. Aux États-Unis, le problème est particulièrement visible dans des statistiques qui, depuis des années, tournent autour de « un sur dix » naissances : les CDC indiquent qu’en 2022 la prématurité a concerné environ 10,4% des naissances, avec des différences persistantes entre groupes de population, ce qui renvoie aussi à un contexte plus large d’accès aux soins et d’inégalités sociales.
C’est précisément pourquoi l’intérêt pour des indicateurs précoces fiables du risque continue de croître. Dans un scénario idéal, les grossesses à risque seraient reconnues plus tôt, la surveillance serait renforcée et les interventions seraient ciblées plus précisément. Toutefois, la science ne comprend toujours pas pleinement les causes de la prématurité ; il s’agit d’un résultat complexe où peuvent s’entrecroiser infections, réactions inflammatoires, changements hormonaux, comorbidités, facteurs environnementaux et stress, et la contribution de chaque facteur dépend souvent de la population et du stade de la grossesse.
Données issues de plusieurs études et expérience des compétitions internationales
L’équipe de l’UCSF construit depuis des années un répertoire de données sur la prématurité, incluant des informations sur le microbiome vaginal – la communauté de micro-organismes pouvant influencer les processus inflammatoires et les fonctions barrières des muqueuses. Selon des descriptions publiquement disponibles de travaux antérieurs dans le cadre international DREAM (Dialogue for Reverse Engineering Assessments and Methods), des données de microbiome ont été recueillies dans plusieurs recherches, et les issues de grossesse ont été suivies à travers neuf études, ce qui a permis des analyses à l’échelle de plus d’un millier de femmes enceintes.
Les défis DREAM fonctionnent comme des compétitions où les organisateurs publient des ensembles de données standardisés, et des équipes du monde entier tentent de construire les meilleurs modèles prédictifs dans un délai donné. Dans des défis antérieurs liés à la grossesse, plus d’une centaine de groupes ont participé, avec pour objectif d’identifier des motifs dans les données pouvant indiquer une naissance prématurée ou déterminer plus précisément l’âge gestationnel. Même si, dans ce type de défis, les modèles sont souvent développés relativement vite, le cycle de recherche s’allonge ensuite : il faut harmoniser les approches, revalider les résultats et préparer une publication scientifique, ce qui peut prendre des années.
Ce que les chatbots d’IA générative ont fait dans la nouvelle expérience
Dans le projet actuel, les chercheurs ont décidé de vérifier si des outils populaires d’IA générative – essentiellement des systèmes utilisés via le langage naturel et capables de générer du texte et du code – pouvaient prendre en charge une partie du travail qui nécessitait auparavant de nombreuses heures de programmation et de coordination. Huit chatbots différents ont reçu des consignes expertes, détaillées et soigneusement formulées en langage naturel. L’objectif n’était pas seulement « fais un modèle », mais aussi : charger les données, les nettoyer, préparer les caractéristiques, sélectionner et entraîner des algorithmes, évaluer les résultats et produire du code exécutable sur une infrastructure de recherche standard.
Pour rendre le test comparable, les mêmes ensembles de données et les mêmes tâches que dans les défis DREAM ont été utilisés : analyse du microbiome vaginal pour évaluer le risque de prématurité et analyse d’échantillons de sang ou de placenta pour estimer l’âge gestationnel. En pratique, l’âge gestationnel reste souvent une estimation, et une erreur d’estimation peut influencer la planification des soins, le calendrier d’examens supplémentaires et la préparation à l’accouchement.
Le résultat n’a pas été « une IA qui résout tout ». Seule la moitié des outils testés a produit du code et des modèles jugés suffisamment exploitables pour une analyse plus approfondie, ce que les auteurs interprètent comme un rappel que l’IA générative n’est pas fiable sans vérification humaine. Mais pour les outils les plus performants, l’avantage clé était la vitesse : du code qu’un programmeur expérimenté écrirait en heures ou en jours, l’IA l’a généré en quelques minutes. Ainsi, des chercheurs plus jeunes, dont un étudiant de niveau master et un lycéen, ont pu obtenir des modèles fonctionnels sous contrôle, mentorat et vérification.
Comparaison avec des équipes humaines et où l’IA a réellement « gagné » du temps
Dans les compétitions scientifiques et les projets de laboratoire, les équipes humaines consacrent généralement une grande partie de leur temps à des étapes techniques nécessaires mais souvent invisibles en dehors du métier : vérifier les formats de fichiers, harmoniser les variables entre études, choisir des métriques, assurer la reproductibilité, documenter les versions de paquets et relancer les expériences après chaque correction. Dans ce test, l’IA générative a montré le plus de « force » précisément là : elle a généré l’ossature de l’analyse et des morceaux de code quasi prêts, que les chercheurs ont ensuite exécutés, vérifiés, corrigés et adaptés.
Les auteurs soulignent aussi un autre aspect : le prototypage plus rapide des modèles peut accélérer les résultats négatifs. Si, à un stade précoce, il apparaît qu’un certain type de caractéristiques ou d’algorithmes ne fournit pas des prévisions stables, les chercheurs peuvent se réorienter plus tôt vers d’autres hypothèses et approches de mesure, au lieu de « s’acharner » pendant des mois dans la même direction.
Il est important de comprendre que la « vitesse » ne se traduit pas automatiquement par une « préparation clinique ». Un modèle prédictif peut avoir une bonne précision statistique sur des données historiques, mais être impraticable en milieu hospitalier s’il exige des échantillons difficiles à standardiser, s’il s’appuie sur des paramètres de laboratoire rares ou si le résultat ne peut pas être expliqué aux médecins et aux patientes. En ce sens, le projet doit surtout être lu comme une démonstration d’une méthode de travail, et non comme un test diagnostique prêt à l’emploi.
La science ouverte comme prérequis et la question de la confiance dans les résultats
Le fil conducteur des défis DREAM comme de cette expérience d’IA est un partage plus ouvert des données et des méthodes. Lorsque des données issues de plusieurs études peuvent être comparées et réanalysées, il est plus facile de tester la robustesse des modèles, de détecter des biais cachés et d’éviter de fausses « victoires » dues aux spécificités d’une seule cohorte. Les descriptions publiées de travaux DREAM antérieurs soulignent aussi des techniques d’harmonisation des données de microbiome et une séparation stricte des ensembles d’entraînement et de validation afin de réduire le risque de « fuite » d’informations.
Dans ce contexte, l’IA générative ouvre deux possibilités opposées. D’un côté, elle permet de répéter plus vite les analyses et de comparer davantage d’approches, ce qui constitue souvent, en science, une voie vers des conclusions plus stables. De l’autre, elle accroît le risque que quelqu’un s’appuie sur un code qui « paraît convaincant » mais cache une erreur ou interprète mal la structure des données. Les auteurs insistent donc sur la nécessité d’une surveillance permanente : l’IA peut se tromper, peut « halluciner » des fonctions qui n’existent pas ou sauter des étapes cruciales pour la validation.
En pratique, cela signifie que les standards de reproductibilité et de transparence doivent être renforcés, et non assouplis. Le code doit être examinable, versionné et testé ; les métriques de succès doivent être clairement définies ; et les modèles, surtout pour des issues de santé sensibles, doivent être vérifiés sur différentes populations. Sans cela, l’accélération du développement peut ne se traduire que par une diffusion plus rapide de conclusions peu fiables.
Ce que cette approche pourrait changer dans la recherche sur la grossesse
Si les outils d’IA générative se montrent stables dans ce type de tâches, le changement pourrait être visible à plusieurs niveaux. D’abord, de plus petits laboratoires et de jeunes chercheurs pourraient tester des idées plus vite sans gros budgets pour des équipes d’ingénierie, ce qui démocratise potentiellement l’accès à l’analytique. Ensuite, des cadres compétitifs comme DREAM pourraient obtenir une « seconde phase », où les équipes humaines se concentrent davantage sur l’interprétation et le sens biologique, tandis que la partie technique du pipeline est standardisée et automatisée. Enfin, cela pourrait accélérer la voie vers des biomarqueurs cliniquement pertinents – à condition que les résultats soient confirmés dans des études prospectives et que des protocoles d’usage sûr soient développés.
Mais des experts rappellent que la prédiction de la prématurité n’est pas qu’une question mathématique. Même un très bon modèle ne sera d’aucune utilité s’il n’existe pas de plan clair sur la conduite à tenir lorsque l’algorithme signale une femme enceinte comme « à haut risque », ou si le système de santé est surchargé et n’a pas la capacité d’assurer une surveillance supplémentaire. C’est pourquoi la littérature sur la prématurité souligne de plus en plus la nécessité de combiner des signaux biologiques avec les déterminants sociaux de la santé, un domaine dans lequel même le code le plus rapide nécessitera toujours un travail interdisciplinaire.
Limites et prochaines étapes : de la démonstration à la pratique
Le travail actuel montre que l’IA générative peut accélérer la création et le test de modèles sur des ensembles de données existants, mais aussi que la qualité dépend de l’outil, des consignes et de la vérification humaine. L’étape suivante, qui déterminera l’impact réel sur les patientes et les cliniciens, est le passage d’analyses rétrospectives à des études suivant des femmes enceintes en temps réel, avec des standards éthiques stricts, une protection de la vie privée et une responsabilité clairement définie pour les décisions.
Entre-temps, les résultats servent de signal que l’analytique biomédicale change : la compétence d’écrire du code reste importante, mais devient tout aussi importante la capacité de formuler des questions précises, de mettre en place des contrôles, de comprendre les limites des données et d’identifier le moment où la technologie fait « le mauvais travail ». En ce sens, l’IA générative peut être un outil puissant, mais seulement si elle reste dans le cadre de la discipline scientifique – où la vitesse, la transparence et la vérifiabilité sont tout aussi obligatoires.
Sources :- UCSF News – compte rendu de l’expérience UCSF et Wayne State University avec des chatbots d’IA générative et des données DREAM (link)- Cell Reports Medicine – article sur le défi DREAM du microbiome et la prédiction de la prématurité à partir du microbiome vaginal (link)- CDC – aperçu des indicateurs de preterm birth et définition de la prématurité aux États-Unis (mis à jour le 8 novembre 2024) (link)- CDC/NCHS – données provisoires sur les naissances et le taux de prématurité aux États-Unis pour 2024 (Vital Statistics Rapid Release, n° 038) (link)- WHO – fiche d’information sur la prématurité et les estimations mondiales (fact sheet, 10 mai 2023) (link)- March of Dimes – Report Card 2025 pour les États-Unis présentant le taux et les différences régionales de naissances prématurées (link)- Center for Data to Health (CD2H) – explication du cadre et de la méthodologie des défis DREAM (link)
Trouvez un hébergement à proximité
Heure de création: 2 heures avant