Las herramientas de IA aceleraron el análisis de datos de embarazo y la creación de modelos para evaluar el parto prematuro
Investigadores de la University of California en San Francisco (UCSF) y de la Wayne State University de Detroit publicaron los resultados de un experimento en el que se utilizaron chatbots de IA generativa para crear “pipelines” computacionales y modelos predictivos sobre grandes conjuntos de datos de embarazo. La comparación se realizó de modo que tanto equipos humanos como herramientas de IA recibieran la misma tarea: a partir de datos de más de mil mujeres embarazadas, construir algoritmos capaces de predecir el riesgo de parto prematuro y, en tareas separadas, estimar la edad gestacional basándose en muestras biológicas.
El hallazgo que atrajo más atención no fue solo que algunos modelos fueran comparables a los que anteriormente habían desarrollado equipos expertos de data science, sino también el hecho de que parte del trabajo que en la práctica a menudo ralentiza la investigación biomédica – escribir y depurar código, unir tablas, validar y repetir análisis – se redujo en este caso de semanas y meses a horas, e incluso minutos. Los autores subrayan que no se trata de sustituir la experiencia humana, sino de cambiar la dinámica del trabajo: la IA puede encargarse de pasos rutinarios, y los investigadores disponen de más tiempo para verificar resultados, interpretarlos y plantear mejores preguntas.
Por qué el parto prematuro sigue siendo un gran problema de salud pública
El parto prematuro, definido como el nacimiento antes de completar 37 semanas de embarazo, se asocia con un mayor riesgo de mortalidad neonatal y con una serie de consecuencias a largo plazo, incluidas dificultades motoras y cognitivas. Según la Organización Mundial de la Salud, se estima que en 2020 nacieron de forma prematura en el mundo alrededor de 13,4 millones de bebés, y las complicaciones relacionadas con el nacimiento prematuro se citan como la principal causa de muerte en niños menores de cinco años. En Estados Unidos, el problema es especialmente visible en estadísticas que durante años se han mantenido en torno a “uno de cada diez” partos: los CDC indican que en 2022 el parto prematuro afectó aproximadamente al 10,4% de los nacimientos, con diferencias persistentes entre grupos de población, lo que apunta también a un contexto más amplio de acceso a la atención y desigualdades sociales.
Precisamente por eso el interés por indicadores tempranos fiables del riesgo sigue creciendo. En un escenario ideal, los embarazos de riesgo se identificarían antes, se intensificaría la vigilancia y las intervenciones se orientarían con mayor precisión. Sin embargo, la ciencia todavía no comprende por completo las causas del parto prematuro; se trata de un desenlace complejo en el que pueden entrelazarse infecciones, respuestas inflamatorias, cambios hormonales, comorbilidades, factores ambientales y estrés, y la contribución de cada factor a menudo depende de la población y de la fase del embarazo.
Datos de múltiples estudios y experiencia de competiciones internacionales
El equipo de la UCSF lleva años construyendo un repositorio de datos sobre el parto prematuro, incluida información sobre el microbioma vaginal, la comunidad de microorganismos que puede influir en procesos inflamatorios y en funciones de barrera de la mucosa. Según descripciones públicas de trabajos previos en el marco internacional DREAM (Dialogue for Reverse Engineering Assessments and Methods), los datos del microbioma se recopilaron en varios estudios y los desenlaces del parto se siguieron a través de nueve estudios, lo que permitió análisis a nivel de más de mil mujeres embarazadas.
Los desafíos DREAM funcionan como competiciones en las que los organizadores publican conjuntos de datos estandarizados y equipos de todo el mundo intentan construir los mejores modelos predictivos dentro de un plazo determinado. En desafíos anteriores relacionados con el embarazo participaron más de un centenar de grupos, y el objetivo era identificar patrones en los datos que pudieran indicar parto prematuro o determinar con mayor precisión la edad gestacional. Aunque los modelos en estos desafíos suelen desarrollarse con relativa rapidez, el ciclo de investigación luego se alarga: es necesario armonizar enfoques, revalidar resultados y preparar una publicación científica, lo que puede tardar años.
Qué hicieron los chatbots de IA generativa en el nuevo experimento
En el proyecto actual, los investigadores decidieron comprobar si herramientas populares de IA generativa —en esencia sistemas que se usan mediante lenguaje natural y pueden generar texto y código— podían asumir parte del trabajo que antes requería muchas horas de programación y coordinación. Ocho chatbots diferentes recibieron instrucciones expertas, detalladas y cuidadosamente formuladas en lenguaje natural. El objetivo no era solo “haz un modelo”, sino también: cargar los datos, limpiarlos, preparar características, seleccionar y entrenar algoritmos, evaluar resultados y producir código que pueda ejecutarse en una infraestructura de investigación estándar.
Para que la prueba fuera comparable, se usaron los mismos conjuntos de datos y las mismas tareas que en los desafíos DREAM: análisis del microbioma vaginal para estimar el riesgo de parto prematuro y análisis de muestras de sangre o placenta para estimar la edad gestacional. En la práctica, la edad gestacional a menudo sigue siendo una estimación, y un error en la estimación puede afectar la planificación de la atención, el momento de controles adicionales y la preparación para el parto.
El resultado no fue “una IA que lo resuelve todo”. Solo la mitad de las herramientas probadas produjo código y modelos que resultaron lo suficientemente utilizables para un análisis posterior, lo que los autores interpretan como un recordatorio de que la IA generativa no es fiable sin verificación humana. Pero en esas herramientas más exitosas, la ventaja clave fue la velocidad: código que un programador experimentado escribiría en horas o días, la IA lo generó en minutos. Así, investigadores más jóvenes, incluido un estudiante de posgrado y un estudiante de secundaria, pudieron llegar a modelos funcionales bajo mentoría, supervisión y verificación.
Comparación con equipos humanos y dónde la IA realmente “ganó” tiempo
En competiciones científicas y proyectos de laboratorio, los equipos humanos suelen dedicar gran parte del tiempo a pasos técnicos necesarios, pero a menudo invisibles fuera del ámbito: comprobar formatos de archivos, armonizar variables entre estudios, elegir métricas, asegurar la reproducibilidad, documentar versiones de paquetes y volver a ejecutar experimentos tras cada corrección. En esta prueba, la IA generativa mostró su mayor “fortaleza” precisamente ahí: generó el esqueleto del análisis y partes de código casi terminado, que luego los investigadores ejecutaron, comprobaron, corrigieron y adaptaron.
Los autores también destacan otro aspecto: la creación más rápida de prototipos de modelos puede acelerar resultados negativos. Si en una fase temprana queda claro que cierto tipo de características o algoritmos no ofrece pronósticos estables, los investigadores pueden cambiar antes a otras hipótesis y enfoques de medición, en lugar de “desgastarse” durante meses en la misma dirección.
Es importante entender que la “velocidad” no se traduce automáticamente en “preparación clínica”. Un modelo predictivo puede tener buena precisión estadística en datos históricos, pero ser poco práctico en un entorno hospitalario si requiere muestras difíciles de estandarizar, si se apoya en parámetros de laboratorio poco comunes o si el resultado no puede explicarse a médicos y pacientes. En ese sentido, el proyecto se lee sobre todo como una demostración de un modo de trabajo, no como una prueba diagnóstica lista.
La ciencia abierta como requisito y la cuestión de la confianza en los resultados
El hilo común tanto de los desafíos DREAM como de este experimento de IA es un intercambio más abierto de datos y métodos. Cuando los datos de varios estudios pueden compararse y reanalizarse, es más fácil probar la robustez de los modelos, detectar sesgos ocultos y evitar falsas “victorias” que surgen por las particularidades de una sola cohorte. En las descripciones publicadas de trabajos DREAM anteriores también se destacan técnicas de armonización de datos del microbioma y una separación estricta de conjuntos de entrenamiento y validación para reducir el riesgo de “fuga” de información.
La IA generativa en ese contexto abre dos posibilidades opuestas. Por un lado, permite repetir análisis más rápido y comparar más enfoques, lo que en ciencia suele ser un camino hacia conclusiones más estables. Por otro, aumenta el riesgo de que alguien se apoye en un código que “parece convincente” pero oculta un error o interpreta mal la estructura de los datos. Por eso los autores del proyecto subrayan la necesidad de supervisión constante: la IA puede equivocarse, puede “alucinar” funciones que no existen o saltarse pasos clave para la validación.
En la práctica, eso significa que los estándares de reproducibilidad y transparencia deben endurecerse, no relajarse. El código debe ser revisable, versionado y probado; la métrica de éxito debe definirse con claridad; y los modelos, especialmente cuando se trata de resultados sanitarios sensibles, deben validarse en distintas poblaciones. Sin eso, la aceleración del desarrollo puede traducirse solo en una difusión más rápida de conclusiones poco fiables.
Qué podría cambiar este enfoque en la investigación del embarazo
Si las herramientas de IA generativa se muestran estables en tareas como estas, el cambio podría ser visible en varios niveles. Primero, laboratorios más pequeños e investigadores más jóvenes podrían probar ideas más rápido sin grandes presupuestos para equipos de ingeniería, lo que potencialmente democratiza el acceso a la analítica. Segundo, marcos competitivos como DREAM podrían obtener una “segunda fase”, en la que los equipos humanos se centren más en la interpretación y el sentido biológico, mientras la parte técnica del pipeline se estandariza y automatiza. Tercero, podría acelerar el camino hacia biomarcadores clínicamente relevantes, siempre que los resultados se confirmen en estudios prospectivos y se desarrollen protocolos de uso seguro.
Sin embargo, especialistas del área recuerdan que predecir el parto prematuro no es solo una cuestión matemática. Incluso un modelo muy bueno no será útil si no existe un plan claro sobre cómo actuar cuando el algoritmo marca a una embarazada como “de alto riesgo”, o si el sistema sanitario está sobrecargado y no tiene capacidad para una vigilancia adicional. Por eso, en la literatura sobre parto prematuro se destaca cada vez más la necesidad de combinar señales biológicas con determinantes sociales de la salud, un ámbito en el que incluso el código más rápido seguirá necesitando trabajo interdisciplinar.
Límites y próximos pasos: de la demostración a la práctica
El trabajo actual muestra que la IA generativa puede acelerar la creación y prueba de modelos en conjuntos de datos existentes, pero también que la calidad depende de la herramienta, las instrucciones y la verificación humana. El siguiente paso, que determinará el impacto real en pacientes y clínicos, es pasar de análisis retrospectivos a estudios que sigan a embarazadas en tiempo real, con estrictos estándares éticos, protección de la privacidad y una responsabilidad claramente definida por las decisiones.
Mientras tanto, los resultados sirven como señal de que la analítica biomédica está cambiando: la habilidad de escribir código sigue siendo importante, pero igual de importante pasa a ser la capacidad de formular preguntas precisas, establecer controles, comprender las limitaciones de los datos y reconocer el momento en que la tecnología hace el trabajo equivocado. En ese sentido, la IA generativa puede ser una herramienta poderosa, pero solo si se mantiene dentro del marco de la disciplina científica, donde la velocidad, la transparencia y la verificabilidad son igualmente obligatorias.
Fuentes:- UCSF News – informe sobre el experimento de UCSF y Wayne State University con chatbots de IA generativa y datos DREAM (link)- Cell Reports Medicine – artículo sobre el desafío DREAM del microbioma y la predicción del parto prematuro a partir del microbioma vaginal (link)- CDC – resumen de indicadores de preterm birth y definición de parto prematuro en EE. UU. (actualizado el 8 de noviembre de 2024) (link)- CDC/NCHS – datos provisionales sobre nacimientos y la tasa de partos prematuros en EE. UU. para 2024 (Vital Statistics Rapid Release, n.º 038) (link)- WHO – ficha informativa sobre el parto prematuro y estimaciones globales (fact sheet, 10 de mayo de 2023) (link)- March of Dimes – 2025 Report Card para Estados Unidos con la tasa y diferencias regionales de partos prematuros (link)- Center for Data to Health (CD2H) – explicación del marco y la metodología de los desafíos DREAM (link)
Encuentra alojamiento cerca
Hora de creación: 4 horas antes