AI pretražio arhivu Hubblea i u dva do tri dana izdvojio gotovo 1400 rijetkih kozmičkih anomalija
Astronomske arhive rastu brže nego što ih ljudi mogu pregledavati, a to je postalo jedno od ključnih pitanja moderne astronomije: kako u oceanima podataka pronaći rijetke pojave koje mijenjaju razumijevanje svemira. NASA/ESA svemirski teleskop Hubble u orbiti djeluje od 1990. godine i iza sebe ima desetljeća opažanja. Velik dio te ostavštine objedinjavan je u Hubble Legacy Archive (HLA), repozitorij obrađenih snimki i kataloga namijenjen pretraživanju i ponovnoj analizi.
U istraživanju koje su potpisali David O’Ryan i Pablo Gómez, znanstvenici povezani s Europskom svemirskom agencijom (ESA), demonstrirana je metoda koja kombinira umjetnu inteligenciju i stručnu provjeru kako bi se u golemim skupovima slika brzo izdvojili neuobičajeni i znanstveno zanimljivi objekti. Njihov sustav nazvan
AnomalyMatch sustavno je rangirao oko 99,6 milijuna izrezaka snimki iz HLA-a, a zatim su autori pregledali najviše rangirane kandidate. Nakon provjere, potvrđeno je više od 1300 anomalija, a više od 800 slučajeva označeno je kao ranije nedokumentirano u literaturi koju su koristili u provjerama.
Što se u astronomiji smatra anomalijom i zašto je to važno
U ovom kontekstu “anomalija” ne znači nužno nešto neobjašnjivo, nego sve što statistički odskače od uobičajenog izgleda na astronomskim snimkama. To su objekti i konfiguracije koje se pojavljuju rijetko, ali nose veliku informaciju o ekstremnim procesima: galaksije u sudaru i interakciji, prstenaste galaksije, “meduza” galaksije s repovima plina i mladih zvijezda, gravitacijske leće koje stvaraju lukove i prstenove, neuobičajeni mlazovi, projekcijska preklapanja izvora i drugi morfološki ekstremi.
Takvi primjeri često služe kao prirodni laboratoriji. Sudari galaksija otkrivaju kako gravitacija i plin zajedno oblikuju galaktičku evoluciju; gravitacijske leće omogućuju proučavanje vrlo udaljenih galaksija i procjenu raspodjele mase, uključujući udio tamne tvari; a “meduze” pokazuju kako okruženje u skupovima galaksija može “ogoliti” plin i ubrzati gašenje stvaranja zvijezda. Problem je što su rijetki: ako se među milijunima snimki pojave tek u promilima, ručno prelistavanje postaje presporo, skupo i sklono tome da se zanimljivi slučajevi jednostavno izgube u šumu.
U klasičnom načinu rada anomalije se pronalaze ciljanim pretragama manjih uzoraka ili slučajno – istraživač “naleti” na neobičan objekt dok radi nešto sasvim drugo. S obzirom na eksploziju podataka, to postaje sve rjeđe održivo. U eri širokopoljnih pregleda neba i masovnih kataloga, ključno pitanje više nije samo “što znamo”, nego i “što još nismo ni stigli pogledati”.
Zašto je Hubble Legacy Archive idealan poligon
Hubble Legacy Archive je posebno zanimljiv za ovakve eksperimente jer obuhvaća dug vremenski raspon i veliku raznolikost ciljeva, od obližnjih maglica do dubokih polja s tisućama galaksija. Prema službenim informacijama arhive, HLA je fokusiran na opažanja do 1. listopada 2017., dok se za novije podatke oslanja na povezane sustave i dodatne “high-level” proizvode. Ta vremenska granica ne umanjuje važnost HLA-a: upravo arhivski podaci često dobivaju novu vrijednost kada se pojave novi algoritmi i nova znanstvena pitanja, jer omogućuju ponovno “pročešljavanje” s drugačijim kriterijima nego u trenutku kada su snimke nastale.
Dosad se Hubbleov arhiv uglavnom koristio ciljano, primjerice za traženje snimki poznatog objekta ili za tematske uzorke. Potpuno sustavan pregled cijele arhive, jednim postupkom i istim kriterijima, bio je logistički gotovo nemoguć. AnomalyMatch je zato važan i kao demonstracija koncepta: umjesto da arhiva bude samo skladište, ona postaje aktivno polje za otkrivanje onoga što je u podacima “skriveno na vidiku”.
Kako radi AnomalyMatch
Manje oznaka, više podataka
Uobičajeni pristupi strojnog učenja najbolje rade kada imaju mnogo označenih primjera. No rijetke klase u astronomiji često nemaju tisuće potvrđenih slučajeva, a ponekad se radi o desecima. Zato AnomalyMatch kombinira polunadzirano učenje (malo označenih + puno neoznačenih podataka) i aktivno učenje (stručnjak iterativno provjerava prijedloge modela i time ga poboljšava). Ideja je praktična: model prvo napravi grubu selekciju, a zatim uči iz ljudske povratne informacije kako bi smanjio broj “lažnih uzbuna” i povećao preciznost za ono što je doista zanimljivo.
Od rang-liste do kataloga
U praksi proces izgleda ovako:
- Model se inicijalno trenira na ograničenom broju potvrđenih primjera rijetkih morfologija te na velikoj količini tipičnih izvora.
- Neuronska mreža prolazi kroz veliki skup slika i svakom izrezku dodjeljuje rang – koliko je vjerojatno da je izvan uobičajenih obrazaca.
- Stručnjak pregleda vrh liste, potvrdi ili odbaci prijedloge i time stvara kvalitetnije oznake za sljedeći ciklus.
- Nakon nekoliko iteracija model postaje precizniji u odvajanju stvarnih anomalija od artefakata obrade, šuma, rubnih slučajeva i projekcijskih preklapanja.
Važna poruka je da brzina nije isto što i potvrda. AI ovdje ne “objašnjava” fiziku, nego štedi vrijeme na selekciji. Konačna znanstvena interpretacija i dalje traži stručni pregled, a često i dodatne podatke poput spektroskopije, usporedbe s drugim instrumentima ili detaljnije fotometrije.
Što je pronađeno: više od 1300 potvrđenih anomalija
U pretrazi HLA-a sustav je obradio približno 99,6 milijuna izrezaka snimki. Nakon rangiranja i stručne provjere, autori su potvrdili više od 1300 anomalija, a više od 800 označili su kao ranije nedokumentirane u literaturi koju su koristili u provjerama. U samom radu navode se i primjeri po kategorijama, uključujući velik broj galaksija u interakciji, kandidate za gravitacijske leće te druge rijetke morfologije.
Među izdvojenim kategorijama posebno se ističu:
- kandidati za gravitacijske leće i lećne lukove, koji služe kao prirodni teleskopi i kao alat za mjerenje mase leće
- “meduza” galaksije, koje ukazuju na stripping plina i promjene u stvaranju zvijezda u gustim okruženjima
- galaksije u sudaru i interakciji, koje omogućuju statističko proučavanje spajanja i njegovih posljedica
- prstenaste galaksije i druge neuobičajene morfologije povezane s dinamičkim poremećajima
Takva raznolikost nije slučajna: cilj nije bio pronaći jednu specifičnu klasu, nego sustavno istaknuti sve što odskače od tipičnog izgleda izvora u arhivi.
Gravitacijske leće: rijetki sustavi s velikim znanstvenim dobitkom
Gravitacijsko lećenje spada među ključne pojave moderne kozmologije. Masivna galaksija ili skup galaksija može saviti svjetlost udaljenijeg objekta i stvoriti deformirane slike u obliku lukova, višestrukih slika ili gotovo potpunih prstenova. U povoljnim slučajevima leća pojačava sjaj dalekih galaksija i omogućuje proučavanje struktura koje bi inače bile preslabe. Istodobno, geometrija lećenja daje informacije o raspodjeli mase leće, uključujući doprinos tamne tvari.
Zato su novi kandidati vrijedni već i prije konačne potvrde: oni postaju početna točka za daljnje provjere i promatranja. No leće je teško pronaći, osobito u heterogenim arhivskim snimkama gdje objekt nije nužno sniman s tom namjerom. Lukovi mogu biti slabi, “zgužvani” pozadinskim šumom ili zamiješani s drugim izvorima. Algoritamsko rangiranje pomaže upravo tu: prepoznati ponavljajuće vizualne obrasce i izvući ih iz mase podataka, a potom prepustiti stručnjaku završnu odluku.
“Meduze”, sudari i prstenovi: što nam govore o evoluciji galaksija
Meduza-galaksije i stripping plina
“Meduza” galaksije prepoznatljive su po repovima plina i mladih zvijezda koji se vuku iza galaksije dok ona prolazi kroz gušći medij, primjerice unutar skupova galaksija. Takvi repovi upućuju na proces u kojem se plin “otkida”, što može dramatično promijeniti budućnost galaksije jer plin predstavlja gorivo za stvaranje novih zvijezda. Svaki novi kandidat vrijedan je za usporedbe: u kakvim okruženjima repovi nastaju, koliko dugo traju, kako se mijenja brzina stvaranja zvijezda i koliko je proces ovisan o masi galaksije i brzini prolaska kroz medij.
Sudari i interakcije kao temelj rasta
Galaksije rastu kroz interakcije i spajanja, no svaki sudar ima svoju geometriju, omjer masa, količinu plina i gravitacijsko okruženje. Zbog toga pojedinačni “lijepi” primjer nije dovoljan: potrebni su uzorci. Velike kolekcije kandidata pomažu preći s anegdota na statistiku, testirati koliko često sudari stvaraju plimne repove, kada se pale epizode intenzivnog stvaranja zvijezda, kako se mijenja morfologija kroz faze spajanja i kako takvi procesi utječu na rast središnjih crnih rupa i raspodjelu zvjezdane mase.
Prstenaste galaksije i udarni valovi
Prstenaste galaksije često se povezuju s prolaskom drugog objekta kroz disk, koji može izazvati val kompresije plina i formiranje prstena pojačanog stvaranja zvijezda. No prstenasti izgled može nastati i zbog projekcije ili preklapanja izvora, pa je provjera nužna. Kombinacija AI rangiranja i ljudske interpretacije ovdje se pokazuje praktičnom: algoritam sužava potragu, a astronom zatim procjenjuje je li riječ o stvarnoj strukturi ili vizualnoj varci, te određuje koje su dodatne analize potrebne za potvrdu.
Gdje je tu čovjek: AI ubrzava potragu, ali ne “zaključuje”
Znanstvenici upozoravaju da neobični oblici na astronomskim slikama mogu biti posljedica instrumenta, obrade ili šuma, osobito u rubnim dijelovima detektora ili kod vrlo slabih signala. Zbog toga je ljudska provjera i dalje ključna, baš kao i dodatna opažanja prije nego što objekt uđe u kategoriju “potvrđeno rijetko” s jasnim fizičkim tumačenjem. AnomalyMatch je stoga najbolje opisati kao multiplikator vremena: umjesto da se danima pregledavaju nasumične snimke, sustav daje rang-listu i usmjerava pažnju na najizglednije slučajeve, dok čovjek zadržava kontrolu nad procjenom i zaključcima.
Građanska znanost i nova uloga algoritama
Projekti građanske znanosti, u kojima volonteri pomažu klasificirati galaksije, već su pokazali da ljudska percepcija može biti iznimno učinkovita, posebno kod morfologija koje algoritmi teže hvataju kada su signali slabi ili složeni. No obujam modernih arhiva raste brže nego što se može nadoknaditi ljudskim radom, čak i uz velik broj sudionika. U tom smislu AI alati ne moraju biti zamjena, nego filter i partner: mogu predselekcijom izdvojiti potencijalno zanimljive slučajeve, a građanska znanost i stručnjaci potom mogu potvrditi, odbaciti i dopuniti klasifikacije. Takav “hibridni” pristup otvara mogućnost da se rijetke pojave otkrivaju brže, a da se pritom zadrži provjerljivost i kvaliteta.
Širi kontekst: Euclid i nadolazeći valovi podataka
Ovakav pristup razvija se u trenutku kada astronomija ulazi u eru masovnih pregleda. ESA-ina misija Euclid već generira velike količine podataka za kozmologiju i strukturu svemira, a slične izazove nose i drugi projekti širokog polja. U tom okruženju sposobnost da se brzo prepoznaju rijetki objekti postaje strateška prednost: omogućuje brže praćenje kandidata, bolje planiranje dodatnih opažanja i učinkovitije korištenje ograničenog vremena instrumenata.
Istodobno, rad na Hubbleovoj arhivi pokazuje i drugu dimenziju: arhive iz prošlih desetljeća nisu iscrpljene. Naprotiv, kako se alati razvijaju, rastu i šanse da će u već postojećim podacima izaći na vidjelo objekti koji su godinama bili neprimijećeni. Za znanost to znači da se vrijednost jedne misije može produžiti daleko izvan njezina “aktivnog” razdoblja, a za javnost da se otkrića ne događaju samo na novim teleskopima, nego i u starim snimkama – kada ih netko pogleda na novi način.
Otvoreni kod i katalog kao poziv zajednici
Uz rad o anomalijama povezan je javno dostupan kod i repozitoriji podataka, što omogućuje neovisnu provjeru i daljnju nadogradnju. Takva otvorenost mijenja dinamiku: umjesto da se rezultati zadrže unutar jednog tima, katalog može postati polazište za dodatna istraživanja – od detaljnog potvrđivanja gravitacijskih leća, preko ciljane potrage za rijetkim oblicima galaksija, do treniranja modela za specifične podklase. Time se ubrzava i sam istraživački ciklus: rijetki objekti brže dolaze “na red”, a pitanja koja su nekad tražila mjesece ručnog rada mogu se pretvoriti u problem selekcije i prioriteta, uz jasnu ljudsku provjeru kao završni korak.
Izvori:- arXiv – sažetak i puni tekst rada “Identifying Astrophysical Anomalies in 99.6 Million Cutouts from the Hubble Legacy Archive Using AnomalyMatch” (link)- arXiv – metodološki rad o AnomalyMatchu i opisu polunadziranog i aktivnog učenja (link)- ESA (GitHub) – službeni repozitorij projekta AnomalyMatch (link)- STScI – službeni opis Hubble Legacy Archive i informacije o opsegu arhive (link)- ESA Datalabs – platforma za rad s velikim skupovima znanstvenih podataka (link)
Kreirano: srijeda, 28. siječnja, 2026.
Pronađite smještaj u blizini