AI alati ubrzali analizu podataka o trudnoći i izradu modela za procjenu prijevremenog poroda
Istraživači sa Sveučilišta Kalifornije u San Franciscu (UCSF) i Wayne State Universityja iz Detroita objavili su rezultate eksperimenta u kojem su generativni AI chatbotovi korišteni za izradu računalnih „pipelinea” i prediktivnih modela na velikim skupovima podataka o trudnoći. Usporedba je provedena tako da su i ljudski timovi i AI-alati dobili isti zadatak: iz podataka više od tisuću trudnica izgraditi algoritme koji mogu predvidjeti rizik prijevremenog poroda te, u zasebnim zadacima, procijeniti gestacijsku dob na temelju bioloških uzoraka.
Nalaz koji je privukao najviše pozornosti nije samo to što su neki modeli bili usporedivi s onima koje su ranije razvijali stručni data science timovi, nego i činjenica da je dio posla koji u praksi često usporava biomedicinska istraživanja – pisanje i ispravljanje koda, spajanje tablica, provjera valjanosti i ponavljanje analiza – u ovom slučaju bio skraćen s tjedana i mjeseci na sate, pa čak i minute. Autori pritom naglašavaju da se ne radi o zamjeni ljudske ekspertize, nego o promjeni dinamike posla: AI može preuzeti rutinske korake, a istraživači dobivaju više vremena za provjeru rezultata, interpretaciju i postavljanje boljih pitanja.
Zašto je prijevremeni porod i dalje velik javnozdravstveni problem
Prijevremeni porod, definiran kao rođenje prije navršenih 37 tjedana trudnoće, povezan je s većim rizikom smrtnosti novorođenčadi i s nizom dugoročnih posljedica, uključujući motoričke i kognitivne teškoće. Prema Svjetskoj zdravstvenoj organizaciji, procjenjuje se da je 2020. godine u svijetu prijevremeno rođeno oko 13,4 milijuna djece, a komplikacije povezane s prijevremenim rođenjem navode se kao vodeći uzrok smrti djece mlađe od pet godina. U Sjedinjenim Američkim Državama problem je osobito vidljiv u statistikama koje se godinama kreću oko „jedan od deset” poroda: CDC navodi da je 2022. godine prijevremeni porod zahvatio oko 10,4% rođenih, uz trajne razlike među skupinama stanovništva, što upućuje i na širi kontekst dostupnosti skrbi i društvenih nejednakosti.
Upravo zato interes za pouzdane rane pokazatelje rizika i dalje raste. U idealnom scenariju, rizične trudnoće prepoznale bi se ranije, nadzor bi se pojačao, a intervencije bi se ciljale preciznije. No, uzroke prijevremenog poroda znanost još uvijek ne razumije u potpunosti; riječ je o kompleksnom ishodu u kojem se mogu prepletati infekcije, upalne reakcije, hormonske promjene, komorbiditeti, okolišni čimbenici i stres, a doprinos pojedinih faktora često ovisi o populaciji i fazi trudnoće.
Podaci iz više studija i iskustvo iz međunarodnih natjecanja
Tim iz UCSF-a godinama gradi repozitorij podataka o prijevremenom porodu, uključujući informacije o vaginalnom mikrobiomu – zajednici mikroorganizama koja može utjecati na upalne procese i barijerne funkcije sluznice. Prema javno dostupnim opisima prethodnog rada u okviru međunarodnog okvira DREAM (Dialogue for Reverse Engineering Assessments and Methods), mikrobiomski podaci prikupljani su u više istraživanja, a ishodi poroda praćeni su kroz devet studija, što je omogućilo analize na razini više od tisuću trudnica.
DREAM izazovi funkcioniraju kao natjecanja u kojima organizatori objave standardizirane skupove podataka, a timovi iz cijelog svijeta pokušavaju izgraditi najbolje prediktivne modele unutar zadanog roka. U ranijim izazovima vezanim uz trudnoću sudjelovalo je više od stotinu skupina, a cilj je bio prepoznati obrasce u podatcima koji bi mogli upućivati na prijevremeni porod ili preciznije odrediti gestacijsku dob. Iako se modeli u takvim izazovima često razviju relativno brzo, istraživački ciklus se potom produžuje: potrebno je uskladiti pristupe, ponovno validirati rezultate i pripremiti znanstvenu publikaciju, što može potrajati godinama.
Što su u novom eksperimentu radili generativni AI chatbotovi
U aktualnom projektu istraživači su odlučili provjeriti mogu li popularni generativni AI alati – u osnovi sustavi koji se koriste putem prirodnog jezika i mogu generirati tekst i kod – preuzeti dio posla koji je ranije zahtijevao velik broj sati programiranja i koordinacije. Osam različitih chatbotova dobilo je detaljno oblikovane, stručne upute na prirodnom jeziku. Cilj nije bio samo „napravi model”, nego i: učitaj podatke, očisti ih, pripremi značajke, odaberi i treniraj algoritme, evaluiraj rezultate te izradi kod koji se može pokrenuti na standardnoj istraživačkoj infrastrukturi.
Kako bi se test učinio usporedivim, korišteni su isti skupovi podataka i isti zadaci kao u DREAM izazovima: analiza vaginalnog mikrobioma radi procjene rizika prijevremenog poroda te analiza uzoraka krvi ili posteljice radi procjene gestacijske dobi. Gestacijska dob u praksi često ostaje procjena, a pogreška u procjeni može utjecati na planiranje skrbi, vrijeme dodatnih pregleda i pripremu za porod.
Rezultat nije bio „jedan AI koji sve rješava”. Samo polovica testiranih alata proizvela je kod i modele koji su se pokazali dovoljno upotrebljivima za daljnju analizu, što autori tumače kao podsjetnik da generativna AI nije pouzdana bez ljudske provjere. No kod tih uspješnijih alata ključna prednost bila je brzina: kod koji bi iskusni programer pisao satima ili danima, AI je generirao u minutama. Time su i mlađi istraživači, uključujući studenta na diplomskoj razini i srednjoškolca, mogli doći do radnih modela uz mentorsku kontrolu i provjeru.
Usporedba s ljudskim timovima i gdje je AI stvarno „dobila” vrijeme
U znanstvenim natjecanjima i laboratorijskim projektima ljudski timovi obično provode velik dio vremena na tehničkim koracima koji su nužni, ali često nevidljivi izvan struke: provjera formata datoteka, usklađivanje varijabli među studijama, odabir metrika, reproduktivnost analize, dokumentiranje verzija paketa i ponovno pokretanje eksperimenata nakon svake korekcije. U ovom testu, generativni AI je upravo tu pokazao najviše „snage”: generirala je kostur analize i dijelove gotovog koda, koje su istraživači zatim pokretali, provjeravali, ispravljali i prilagođavali.
Autori naglašavaju i drugi aspekt: brža izrada prototipa modela može ubrzati negativne rezultate. Ako se u ranoj fazi pokaže da određeni tip značajki ili algoritama ne daje stabilne prognoze, istraživači se mogu ranije preusmjeriti na druge hipoteze i mjerne pristupe, umjesto da mjesecima „gule” po istom smjeru.
Važno je pritom razumjeti da se „brzina” ne prevodi automatski u „kliničku spremnost”. Prediktivni model može imati dobru statističku točnost na povijesnim podatcima, ali biti nepraktičan u bolničkom okruženju ako zahtijeva uzorke koje je teško standardizirati, ako se oslanja na rijetke laboratorijske parametre ili ako se rezultat ne može objasniti liječnicima i pacijenticama. U tom smislu, projekt se najviše može čitati kao demonstracija načina rada, a ne kao gotov dijagnostički test.
Otvorena znanost kao preduvjet i pitanje povjerenja u rezultate
Zajednička nit i DREAM izazova i ovog AI eksperimenta je otvorenija razmjena podataka i metoda. Kada se podaci iz više studija mogu uspoređivati i ponovno analizirati, lakše je testirati robusnost modela, otkriti skrivene pristranosti i izbjeći lažne „pobjede” koje nastanu zbog specifičnosti jedne kohorte. U objavljenim opisima ranijih DREAM radova naglašava se i tehnika harmonizacije mikrobiomskih podataka te strogo odvajanje trening i validacijskih skupova kako bi se smanjio rizik „curenja” informacija.
Generativna AI u tom kontekstu otvara dvije suprotne mogućnosti. S jedne strane, omogućuje brže ponavljanje analiza i usporedbu više pristupa, što je u znanosti često put do stabilnijih zaključaka. S druge strane, povećava rizik od toga da se netko osloni na kod koji „izgleda uvjerljivo”, ali skriva pogrešku ili pogrešno tumači strukturu podataka. Autori projekta zato ističu potrebu za stalnim nadzorom: AI može pogriješiti, može „halucinirati” funkcije koje ne postoje ili preskočiti korake koje su ključni za validaciju.
U praksi, to znači da se standardi reproducibilnosti i transparentnosti moraju pooštriti, a ne popustiti. Kod mora biti pregledan, verzioniran i testiran; metrika uspjeha mora biti jasno definirana; a modeli, osobito kad je riječ o osjetljivim zdravstvenim ishodima, moraju biti provjereni na različitim populacijama. Bez toga, ubrzanje u razvoju može rezultirati samo bržim širenjem nepouzdanih zaključaka.
Što bi ovakav pristup mogao promijeniti u istraživanjima trudnoće
Ako se generativni AI alati pokažu stabilnima u ovakvim zadacima, promjena bi mogla biti vidljiva na nekoliko razina. Prvo, manji laboratoriji i mlađi istraživači mogli bi brže testirati ideje bez velikih budžeta za inženjerske timove, što potencijalno demokratizira pristup analitici. Drugo, natjecateljski okviri poput DREAM-a mogli bi dobiti „drugu fazu”, u kojoj se ljudski timovi više fokusiraju na interpretaciju i biološki smisao, dok se tehnički dio pipelinea standardizira i automatizira. Treće, to bi moglo ubrzati put do klinički relevantnih biomarkera – pod uvjetom da se rezultati potvrde u prospektivnim studijama i da se razviju protokoli za sigurnu uporabu.
No, stručnjaci u području podsjećaju da predikcija prijevremenog poroda nije samo matematičko pitanje. Čak i vrlo dobar model neće biti od koristi ako ne postoji jasan plan kako postupati kada algoritam označi trudnicu kao „visokorizičnu”, ili ako je zdravstveni sustav preopterećen i nema kapacitet za dodatni nadzor. Zbog toga se u literaturi o prijevremenom porodu sve češće ističe potreba za spajanjem bioloških signala s društvenim determinantama zdravlja, a to je područje u kojem će i najbrži kod i dalje trebati interdisciplinarni rad.
Granice i sljedeći koraci: od demonstracije do prakse
Aktualni rad pokazuje da generativni AI može ubrzati izradu i testiranje modela na postojećim skupovima podataka, ali i da kvaliteta ovisi o alatu, uputama i ljudskoj provjeri. Budući korak, koji će odrediti stvarni utjecaj na pacijentice i kliničare, jest prelazak s retrospektivnih analiza na studije koje prate trudnice u realnom vremenu, uz stroge etičke standarde, zaštitu privatnosti i jasno definiranu odgovornost za odluke.
U međuvremenu, rezultati služe kao signal da se biomedicinska analitika mijenja: vještina pisanja koda i dalje je važna, ali jednako važna postaje sposobnost formuliranja preciznih pitanja, postavljanja kontrola, razumijevanja ograničenja podataka i prepoznavanja trenutka kada tehnologija „odradi” pogrešan posao. U tom smislu, generativni AI može biti moćan alat, ali samo ako ostaje u okvirima znanstvene discipline – gdje su brzina, transparentnost i provjerljivost jednako obavezni.
Izvori:- UCSF News – izvješće o eksperimentu UCSF-a i Wayne State Universityja s generativnim AI chatbotovima i DREAM podatcima (link)- Cell Reports Medicine – članak o mikrobiomskom DREAM izazovu i predikciji prijevremenog poroda iz vaginalnog mikrobioma (link)- CDC – pregled preterm birth pokazatelja i definicija prijevremenog poroda u SAD-u (ažurirano 8. studenoga 2024.) (link)- CDC/NCHS – privremeni podaci o rođenjima i stopi prijevremenih poroda u SAD-u za 2024. godinu (Vital Statistics Rapid Release, br. 038) (link)- WHO – informativni pregled o prijevremenom porodu i globalnim procjenama (fact sheet, 10. svibnja 2023.) (link)- March of Dimes – 2025 Report Card za Sjedinjene Američke Države s prikazom stope i regionalnih razlika u prijevremenim porodima (link)- Center for Data to Health (CD2H) – objašnjenje okvira i metodologije DREAM izazova (link)
Kreirano: četvrtak, 19. veljače, 2026.
Pronađite smještaj u blizini