MIT-ovi roboti vide kroz prepreke uz pomoć AI-ja

MIT i generativna umjetna inteligencija: kako roboti uz pomoć bežičnih signala vide skrivene predmete i prostorije

Photo by: Domagoj Skledar - illustration/ arhiva (vlastita)

Generativna umjetna inteligencija pomaže robotima da "vide" kroz prepreke: MIT predstavio sustav koji iz bežičnih odraza rekonstruira skrivene predmete i cijele prostorije

Istraživači s Massachusetts Institute of Technologyja predstavili su novu generaciju bežičnog "vida" koja bi mogla bitno promijeniti način na koji roboti pronalaze predmete, snalaze se u zatvorenim prostorima i rade uz ljude. U središtu njihova rada je spajanje milimetarskih valova, vrste bežičnog signala kakav se koristi i u suvremenim komunikacijskim sustavima, s generativnom umjetnom inteligencijom koja nadopunjuje ono što senzor ne može izravno registrirati. Rezultat su dvije tehnike koje iz reflektiranih signala mogu preciznije rekonstruirati oblik skrivenog predmeta, ali i raspored čitave prostorije s namještajem, i to bez klasičnih kamera i bez potrebe da senzor bude postavljen na pokretnog robota. MIT je objavio da će oba rada biti predstavljena na konferenciji IEEE/CVF Conference on Computer Vision and Pattern Recognition, CVPR 2026, koja se održava od 3. do 7. lipnja 2026. u Denveru.

Iako ideja "gledanja kroz prepreke" zvuči kao znanstvena fantastika, riječ je o području na kojem laboratorij profesora Fadela Adiba radi više od desetljeća. Njegova istraživačka skupina Signal Kinetics pri MIT Media Labu i Odjelu za elektrotehniku i računalne znanosti razvija sustave koji koriste bežične signale za opažanje svijeta u situacijama u kojima su ljudski vid i klasične kamere ograničeni. Prema MIT-u, nova faza tog rada nije samo tehničko poboljšanje ranijih metoda, nego svojevrsni kvalitativni skok: od djelomičnih rekonstrukcija prema razumijevanju složenih odraza i stvaranju potpunije slike objekata i prostora koji su zaklonjeni od izravnog pogleda.

Kako sustav radi kada je predmet izvan pogleda

Dosadašnji MIT-ovi sustavi oslanjali su se na milimetarske valove, odnosno mmWave signale, koji mogu proći kroz uobičajene prepreke poput suhozida, plastike, kartona ili tkanine te se odbiti od skrivenog predmeta. Na temelju tih odraza moguće je procijeniti gdje se predmet nalazi i djelomično odrediti njegov oblik. Problem nastaje zato što se takvi valovi često odbijaju zrcalno, u jednom dominantnom smjeru. Zbog toga senzor tipično "vidi" samo dio površine, primjerice gornju stranu predmeta, dok bočne i donje strane ostaju izvan dosega mjerenja. Upravo je ta manjkava geometrija godinama bila jedno od glavnih ograničenja bežičnog 3D opažanja.

MIT-ov novi sustav Wave-Former pokušava riješiti upravo taj problem. Umjesto da se zaustavi na gruboj i nepotpunoj rekonstrukciji, sustav iz dostupnih odraza prvo predlaže moguće površine predmeta, zatim generativnom modelu prepušta dovršavanje njegova oblika, a potom dodatno pročišćava rezultat. U prijevodu, senzor daje parcijalne informacije, a model uči kako iz tih fragmenata izvesti najvjerojatniji puni 3D oblik. Istraživači pritom naglašavaju da model ne radi proizvoljno i ne "izmišlja" geometriju bez osnove, nego je treniran tako da u obzir uzima fizikalna svojstva mmWave refleksija i obrasce šuma karakteristične za takva mjerenja.

To je važno jer se u ovakvim sustavima vrlo lako može prijeći granica između korisne procjene i spekulacije. Upravo zato MIT-ov tim nije generativnu umjetnu inteligenciju tretirao kao univerzalni čarobni alat, nego ju je vezao uz fizikalni model propagacije signala. Budući da ne postoje golemi skupovi podataka s mmWave snimanjima skrivenih predmeta, istraživači su prilagodili postojeće računalnovidne skupove podataka tako da oponašaju specularnost i šum karakterističan za bežične odraze. Tako su, umjesto višegodišnjeg skupljanja nove baze, stvorili sintetski skup podataka na kojem je model mogao naučiti kako izgleda "nedostajući" dio oblika kada je ulazna informacija nepotpuna i degradirana.

Prema sažetku rada dostupnom na arXivu, Wave-Former je u izravnoj usporedbi s najboljim postojećim pristupima povećao odziv, odnosno recall, s 54 na 72 posto uz zadržavanje visoke preciznosti od 85 posto. MIT News taj pomak opisuje i kroz praktičnu razinu: sustav je vjerno rekonstruirao oko 70 svakodnevnih predmeta, među njima limenke, kutije, pribor za jelo i voće, dok su oni bili skriveni iza kartona, drva, suhozida, plastike i tkanine. U kontekstu robotike to znači da stroj više ne bi morao nagađati što se točno nalazi iza prepreke ili u kutiji, nego bi dobio uvjerljiviju prostornu procjenu predmeta prije nego što pokuša hvatanje, sortiranje ili provjeru sadržaja.

Od skrivenog predmeta do karte cijele prostorije

Drugi sustav, nazvan RISE, ide korak dalje i ne bavi se samo jednim predmetom, nego pokušava rekonstruirati čitav unutarnji prostor. I u tom slučaju osnova su mmWave signali, ali ovaj put istraživači koriste činjenicu da se ljudi kreću kroz prostoriju. Kada se osoba pomiče, dio signala odbija se od nje, zatim ponovno od zidova ili namještaja, pa se tek onda vraća senzoru. Takvi sekundarni odrazi tradicionalno su se smatrali smetnjom ili "duhovima" u signalu, jer stvaraju lažne ili pomaknute kopije izvornog odraza. MIT-ov pristup polazi od suprotne pretpostavke: ti "duhovi" zapravo nose informaciju o rasporedu prostora.

Drugim riječima, ono što je prije bilo odbačeno kao šum postaje izvor podataka. RISE promatra kako se sekundarne refleksije mijenjaju dok se osoba kreće prostorijom i iz tih promjena gradi grubu prostornu sliku. Zatim generativni model dopunjuje praznine i poboljšava rezoluciju početne rekonstrukcije. Prema arXiv sažetku, riječ je o prvom sustavu i prvom benchmarku za razumijevanje unutarnjih prostora pomoću jednog statičnog radara, pri čemu sustav istodobno cilja na rekonstrukciju prostornog rasporeda i na detekciju objekata. Istraživači navode da njihov skup podataka sadrži 50.000 sličica prikupljenih kroz više od 100 stvarnih trajektorija kretanja u interijerima.

U rezultatima koje su objavili, RISE je smanjio Chamferovu udaljenost, mjeru pogreške u rekonstrukciji geometrije, za 60 posto, na 16 centimetara, u usporedbi s dotadašnjim metodama. Uz to, rad navodi i 58 posto IoU-a za detekciju objekata, što autori opisuju kao prvi rezultat takve vrste u mmWave razumijevanju prostorije temeljenom na jednom statičnom radaru. MIT News sažima taj napredak jednostavnije: rekonstruirane scene bile su otprilike dvostruko preciznije od postojećih tehnika. To nije razina detalja kakvu daju kamere ili LiDAR, ali je vrlo važan pomak za situacije u kojima optički senzori imaju ograničenja zbog zaklona, loše vidljivosti ili pitanja privatnosti.

Zašto MIT govori o privatnosti, a ne samo o robotici

U oba rada snažno se naglašava i jedna društveno osjetljiva dimenzija: privatnost. Klasični sustavi za razumijevanje unutarnjeg prostora često se oslanjaju na kamere, dubinske senzore ili LiDAR, koji mogu dati vrlo detaljnu sliku osobe, njezina izgleda, lica i ponašanja. Bežični pristup kakav razvija MIT ne radi s vizualnim identitetom osobe, nego s reflektiranim signalima iz kojih se zaključuje geometrija prostora i položaj tijela u odnosu na okolinu. To ne znači da je svaka privatnosna dvojba automatski riješena, ali znači da je osnovni dizajn sustava manje intruzivan od stalnog videosnimanja interijera.

U praksi bi takva razlika mogla biti važna u domovima za starije osobe, u pametnim kućama, bolnicama, skladištima i industrijskim pogonima. Robot koji treba znati nalazi li se osoba iza ugla, je li prolaz slobodan ili gdje je odložen predmet ne mora nužno imati kameru koja stalno snima sve što se događa. Upravo zbog toga MIT-ovi autori u prvi plan stavljaju scenarije suradnje čovjeka i stroja, sigurnijeg kretanja robota u zatvorenim prostorima i boljeg razumijevanja prostorije bez klasičnog vizualnog nadzora.

Moguće primjene: od logistike do pametnog doma

Najizravnije poslovne primjene vide se u logistici i skladištima. Ako robot može pouzdanije procijeniti sadržaj paketa ili oblik predmeta zaklonjenog unutar kartonske ambalaže, lakše je provjeriti je li narudžba ispravno zapakirana prije slanja. MIT u svojoj objavi kao jedan od primjera navodi smanjenje otpada povezanog s povratima robe, što je posebno osjetljiva tema u e-trgovini, gdje pogrešno isporučeni proizvodi stvaraju trošak, dodatni transport i nepotrebno gomilanje ambalaže. U skladištu to također otvara mogućnost da robot prije samog zahvata dobije realističniju procjenu oblika predmeta skrivenog iza drugih kutija ili ispod materijala za pakiranje.

Druga skupina primjena odnosi se na kućne i uslužne robote. Sustav koji bez kamere može procijeniti gdje se osoba nalazi u prostoriji, kamo se kreće i kako izgleda raspored namještaja mogao bi biti koristan za navigaciju pomoćnih robota, osobito u dinamičnim kućnim uvjetima. U takvom okruženju prepreke nisu statične: vrata se otvaraju, stolice mijenjaju položaj, predmeti ostaju na podu, a ljudi se stalno kreću. Za robota koji treba surađivati s čovjekom nije dovoljno samo da "vidi" ono što je točno ispred njega; mora razumjeti i ono što je djelomično zaklonjeno, kao i širi raspored scene.

Treba ipak naglasiti da MIT ne tvrdi kako je riječ o gotovom komercijalnom proizvodu spremnom za masovno tržište. Riječ je o istraživačkim sustavima predstavljenima na znanstvenoj konferenciji, s rezultatima koji pokazuju smjer razvoja, ali i dalje ostavljaju otvorena pitanja o cijeni opreme, robusnosti u različitim realnim uvjetima, brzini rada i mogućoj integraciji s drugim vrstama senzora. Sama istraživačka skupina navodi da želi povećati granularnost i detalj rekonstrukcija te u budućnosti graditi veće temeljne modele za bežične signale, analogne onome što su GPT, Claude ili Gemini postali za jezik i viziju.

Tko stoji iza rada i zašto je CVPR važan

Viši autor oba rada je Fadel Adib, izvanredni profesor MIT Media Laba i EECS-a te voditelj skupine Signal Kinetics. Prema MIT-u, na radu o Wave-Formeru sudjelovali su Laura Dodds kao glavna autorica te Maisy Lam, Waleed Akbar i Yibo Cheng, dok su na radu o RISE-u autori Kaichen Zhou, Laura Dodds, Sayed Saad Afzal i Fadel Adib. Na Adibovoj službenoj stranici i popisu publikacija oba rada navedena su kao nadolazeći radovi za CVPR 2026. Sama konferencija CVPR ubraja se među najvažnija svjetska okupljanja u području računalnog vida i prepoznavanja uzoraka, a službena stranica navodi da će se ovogodišnje izdanje održati u Colorado Convention Centeru u Denveru od 3. do 7. lipnja 2026.

To je relevantno i zato što MIT-ovi radovi ne dolaze iz izoliranog laboratorijskog okruženja, nego ulaze u međunarodnu znanstvenu arenu u kojoj se uspoređuju s najnovijim trendovima u računalnom vidu, multimodalnim modelima, robotici i sustavima za razumijevanje scene. U posljednjih nekoliko godina generativna umjetna inteligencija snažno je utjecala na obradu slike, 3D rekonstrukciju i modeliranje prostora, no MIT-ov doprinos je u tome što taj val primjenjuje na podatke koji nisu klasične fotografije, nego bežični odrazi opterećeni specifičnim fizikalnim ograničenjima. Time se istraživanje ne pozicionira samo kao još jedan AI demonstrator, nego kao pokušaj povezivanja modela koji uče s realnim zakonitostima propagacije signala.

Što se doista mijenja za buduće robote

Najveća promjena nije u tome što će roboti odjednom "gledati kroz zidove" na način na koji to popularna kultura ponekad zamišlja. Puno je važnije to što bi mogli donositi manje pogrešne odluke u situacijama u kojima danas rade s manjkavim informacijama. U skladištu to može značiti manje promašenih zahvata i manje oštećenja robe. U domu to može značiti sigurnije kretanje kraj ljudi, djece ili kućnih ljubimaca. U industrijskom okruženju to može značiti bolje razumijevanje zone iza prepreke bez postavljanja dodatnih kamera na svaku točku prostora.

MIT-ova objava sugerira da generativna umjetna inteligencija u ovom slučaju ne služi samo uljepšavanju slike, nego ispravljanju dubinskog ograničenja bežičnog opažanja: senzor vidi samo fragmente, a model pomaže zaključiti što nedostaje. Uspije li se taj pristup dodatno skalirati i potvrditi u različitim okruženjima, mogao bi otvoriti novu klasu sustava koji kombiniraju privatnosno manje invazivno opažanje s praktičnom uporabom u robotici, logistici i pametnim prostorima. Za sada je riječ o istraživanju koje tek treba prijeći put od laboratorija do široke primjene, ali objavljeni rezultati pokazuju da se granica između onoga što je skriveno i onoga što je stroj sposoban razumjeti polako, ali vidljivo, pomiče.

Izvori:
- MIT News – objava o novim sustavima Wave-Former i RISE, autorima, primjenama i datumu predstavljanja na CVPR-u (link)
- CVPR 2026 – službena stranica konferencije s datumima i lokacijom održavanja (link)
- MIT / Fadel Adib – službena stranica istraživača i skupine Signal Kinetics s pregledom rada na bežičnom opažanju i popisom nadolazećih radova (link)
- arXiv – sažetak rada "Wave-Former: Through-Occlusion 3D Reconstruction via Wireless Shape Completion" s metodom i rezultatima (link)
- arXiv – sažetak rada "RISE: Single Static Radar-based Indoor Scene Understanding" s opisom benchmarka i mjera uspješnosti (link)

Kreirano: petak, 20. ožujka, 2026.

MIT i generativna umjetna inteligencija: kako roboti uz pomoć bežičnih signala vide skrivene predmete i prostorije

Generativna umjetna inteligencija pomaže robotima da "vide" kroz prepreke: MIT predstavio sustav koji iz bežičnih odraza rekonstruira skrivene predmete i cijele prostorije

Kako sustav radi kada je predmet izvan pogleda

Od skrivenog predmeta do karte cijele prostorije

Zašto MIT govori o privatnosti, a ne samo o robotici

Moguće primjene: od logistike do pametnog doma

Tko stoji iza rada i zašto je CVPR važan

Što se doista mijenja za buduće robote

Pronađite smještaj u blizini

Redakcija za znanost i tehnologiju

Događanja Hrvatska

Vukovar otvorio 8. festival „SVI zaJEDNO HRVATSKO NAJ” uz baštinu, koncerte i program sjećanja

Koncert “Senza basso” u Rijeci donosi rijedak barokni dijalog violine i traversa u Palači šećera na festivalu

Međunarodni festival malih scena u Rijeci i Opatiji donosi šest predstava iz četiri zemlje

Turizam Hrvatska

Sv. Ivan Zelina potvrdila status vinske destinacije velikim uspjehom sauvignona na svjetskom natjecanju

Rijeka pokrenula Valove okusa: proljetni gastronomski projekt spaja sezonska jela, baštinu i turističku ponudu

Dani dvoraca Sjevera Zagorja 2026. donose pet vikenda šetnji, vina, baštine i programa u varaždinskom kraju

MIT i generativna umjetna inteligencija: kako roboti uz pomoć bežičnih signala vide skrivene predmete i prostorije

Generativna umjetna inteligencija pomaže robotima da "vide" kroz prepreke: MIT predstavio sustav koji iz bežičnih odraza rekonstruira skrivene predmete i cijele prostorije

Kako sustav radi kada je predmet izvan pogleda

Od skrivenog predmeta do karte cijele prostorije

Zašto MIT govori o privatnosti, a ne samo o robotici

Moguće primjene: od logistike do pametnog doma

Tko stoji iza rada i zašto je CVPR važan

Što se doista mijenja za buduće robote

Pronađite smještaj u blizini

Povezano