Postavke privatnosti

MIT i generativna umjetna inteligencija: kako roboti uz pomoć bežičnih signala vide skrivene predmete i prostorije

Saznaj kako su MIT-ovi istraživači spojili generativnu umjetnu inteligenciju i bežične mmWave signale kako bi roboti preciznije otkrivali skrivene predmete i rekonstruirali prostorije bez kamera. Donosimo pregled tehnologije, mogućih primjena i razloga zbog kojih bi mogla promijeniti robotiku.

MIT i generativna umjetna inteligencija: kako roboti uz pomoć bežičnih signala vide skrivene predmete i prostorije
Photo by: Domagoj Skledar - illustration/ arhiva (vlastita)

Generativna umjetna inteligencija pomaže robotima da "vide" kroz prepreke: MIT predstavio sustav koji iz bežičnih odraza rekonstruira skrivene predmete i cijele prostorije

Istraživači s Massachusetts Institute of Technologyja predstavili su novu generaciju bežičnog "vida" koja bi mogla bitno promijeniti način na koji roboti pronalaze predmete, snalaze se u zatvorenim prostorima i rade uz ljude. U središtu njihova rada je spajanje milimetarskih valova, vrste bežičnog signala kakav se koristi i u suvremenim komunikacijskim sustavima, s generativnom umjetnom inteligencijom koja nadopunjuje ono što senzor ne može izravno registrirati. Rezultat su dvije tehnike koje iz reflektiranih signala mogu preciznije rekonstruirati oblik skrivenog predmeta, ali i raspored čitave prostorije s namještajem, i to bez klasičnih kamera i bez potrebe da senzor bude postavljen na pokretnog robota. MIT je objavio da će oba rada biti predstavljena na konferenciji IEEE/CVF Conference on Computer Vision and Pattern Recognition, CVPR 2026, koja se održava od 3. do 7. lipnja 2026. u Denveru.

Iako ideja "gledanja kroz prepreke" zvuči kao znanstvena fantastika, riječ je o području na kojem laboratorij profesora Fadela Adiba radi više od desetljeća. Njegova istraživačka skupina Signal Kinetics pri MIT Media Labu i Odjelu za elektrotehniku i računalne znanosti razvija sustave koji koriste bežične signale za opažanje svijeta u situacijama u kojima su ljudski vid i klasične kamere ograničeni. Prema MIT-u, nova faza tog rada nije samo tehničko poboljšanje ranijih metoda, nego svojevrsni kvalitativni skok: od djelomičnih rekonstrukcija prema razumijevanju složenih odraza i stvaranju potpunije slike objekata i prostora koji su zaklonjeni od izravnog pogleda.

Kako sustav radi kada je predmet izvan pogleda

Dosadašnji MIT-ovi sustavi oslanjali su se na milimetarske valove, odnosno mmWave signale, koji mogu proći kroz uobičajene prepreke poput suhozida, plastike, kartona ili tkanine te se odbiti od skrivenog predmeta. Na temelju tih odraza moguće je procijeniti gdje se predmet nalazi i djelomično odrediti njegov oblik. Problem nastaje zato što se takvi valovi često odbijaju zrcalno, u jednom dominantnom smjeru. Zbog toga senzor tipično "vidi" samo dio površine, primjerice gornju stranu predmeta, dok bočne i donje strane ostaju izvan dosega mjerenja. Upravo je ta manjkava geometrija godinama bila jedno od glavnih ograničenja bežičnog 3D opažanja.

MIT-ov novi sustav Wave-Former pokušava riješiti upravo taj problem. Umjesto da se zaustavi na gruboj i nepotpunoj rekonstrukciji, sustav iz dostupnih odraza prvo predlaže moguće površine predmeta, zatim generativnom modelu prepušta dovršavanje njegova oblika, a potom dodatno pročišćava rezultat. U prijevodu, senzor daje parcijalne informacije, a model uči kako iz tih fragmenata izvesti najvjerojatniji puni 3D oblik. Istraživači pritom naglašavaju da model ne radi proizvoljno i ne "izmišlja" geometriju bez osnove, nego je treniran tako da u obzir uzima fizikalna svojstva mmWave refleksija i obrasce šuma karakteristične za takva mjerenja.

To je važno jer se u ovakvim sustavima vrlo lako može prijeći granica između korisne procjene i spekulacije. Upravo zato MIT-ov tim nije generativnu umjetnu inteligenciju tretirao kao univerzalni čarobni alat, nego ju je vezao uz fizikalni model propagacije signala. Budući da ne postoje golemi skupovi podataka s mmWave snimanjima skrivenih predmeta, istraživači su prilagodili postojeće računalnovidne skupove podataka tako da oponašaju specularnost i šum karakterističan za bežične odraze. Tako su, umjesto višegodišnjeg skupljanja nove baze, stvorili sintetski skup podataka na kojem je model mogao naučiti kako izgleda "nedostajući" dio oblika kada je ulazna informacija nepotpuna i degradirana.

Prema sažetku rada dostupnom na arXivu, Wave-Former je u izravnoj usporedbi s najboljim postojećim pristupima povećao odziv, odnosno recall, s 54 na 72 posto uz zadržavanje visoke preciznosti od 85 posto. MIT News taj pomak opisuje i kroz praktičnu razinu: sustav je vjerno rekonstruirao oko 70 svakodnevnih predmeta, među njima limenke, kutije, pribor za jelo i voće, dok su oni bili skriveni iza kartona, drva, suhozida, plastike i tkanine. U kontekstu robotike to znači da stroj više ne bi morao nagađati što se točno nalazi iza prepreke ili u kutiji, nego bi dobio uvjerljiviju prostornu procjenu predmeta prije nego što pokuša hvatanje, sortiranje ili provjeru sadržaja.

Od skrivenog predmeta do karte cijele prostorije

Drugi sustav, nazvan RISE, ide korak dalje i ne bavi se samo jednim predmetom, nego pokušava rekonstruirati čitav unutarnji prostor. I u tom slučaju osnova su mmWave signali, ali ovaj put istraživači koriste činjenicu da se ljudi kreću kroz prostoriju. Kada se osoba pomiče, dio signala odbija se od nje, zatim ponovno od zidova ili namještaja, pa se tek onda vraća senzoru. Takvi sekundarni odrazi tradicionalno su se smatrali smetnjom ili "duhovima" u signalu, jer stvaraju lažne ili pomaknute kopije izvornog odraza. MIT-ov pristup polazi od suprotne pretpostavke: ti "duhovi" zapravo nose informaciju o rasporedu prostora.

Drugim riječima, ono što je prije bilo odbačeno kao šum postaje izvor podataka. RISE promatra kako se sekundarne refleksije mijenjaju dok se osoba kreće prostorijom i iz tih promjena gradi grubu prostornu sliku. Zatim generativni model dopunjuje praznine i poboljšava rezoluciju početne rekonstrukcije. Prema arXiv sažetku, riječ je o prvom sustavu i prvom benchmarku za razumijevanje unutarnjih prostora pomoću jednog statičnog radara, pri čemu sustav istodobno cilja na rekonstrukciju prostornog rasporeda i na detekciju objekata. Istraživači navode da njihov skup podataka sadrži 50.000 sličica prikupljenih kroz više od 100 stvarnih trajektorija kretanja u interijerima.

U rezultatima koje su objavili, RISE je smanjio Chamferovu udaljenost, mjeru pogreške u rekonstrukciji geometrije, za 60 posto, na 16 centimetara, u usporedbi s dotadašnjim metodama. Uz to, rad navodi i 58 posto IoU-a za detekciju objekata, što autori opisuju kao prvi rezultat takve vrste u mmWave razumijevanju prostorije temeljenom na jednom statičnom radaru. MIT News sažima taj napredak jednostavnije: rekonstruirane scene bile su otprilike dvostruko preciznije od postojećih tehnika. To nije razina detalja kakvu daju kamere ili LiDAR, ali je vrlo važan pomak za situacije u kojima optički senzori imaju ograničenja zbog zaklona, loše vidljivosti ili pitanja privatnosti.

Zašto MIT govori o privatnosti, a ne samo o robotici

U oba rada snažno se naglašava i jedna društveno osjetljiva dimenzija: privatnost. Klasični sustavi za razumijevanje unutarnjeg prostora često se oslanjaju na kamere, dubinske senzore ili LiDAR, koji mogu dati vrlo detaljnu sliku osobe, njezina izgleda, lica i ponašanja. Bežični pristup kakav razvija MIT ne radi s vizualnim identitetom osobe, nego s reflektiranim signalima iz kojih se zaključuje geometrija prostora i položaj tijela u odnosu na okolinu. To ne znači da je svaka privatnosna dvojba automatski riješena, ali znači da je osnovni dizajn sustava manje intruzivan od stalnog videosnimanja interijera.

U praksi bi takva razlika mogla biti važna u domovima za starije osobe, u pametnim kućama, bolnicama, skladištima i industrijskim pogonima. Robot koji treba znati nalazi li se osoba iza ugla, je li prolaz slobodan ili gdje je odložen predmet ne mora nužno imati kameru koja stalno snima sve što se događa. Upravo zbog toga MIT-ovi autori u prvi plan stavljaju scenarije suradnje čovjeka i stroja, sigurnijeg kretanja robota u zatvorenim prostorima i boljeg razumijevanja prostorije bez klasičnog vizualnog nadzora.

Moguće primjene: od logistike do pametnog doma

Najizravnije poslovne primjene vide se u logistici i skladištima. Ako robot može pouzdanije procijeniti sadržaj paketa ili oblik predmeta zaklonjenog unutar kartonske ambalaže, lakše je provjeriti je li narudžba ispravno zapakirana prije slanja. MIT u svojoj objavi kao jedan od primjera navodi smanjenje otpada povezanog s povratima robe, što je posebno osjetljiva tema u e-trgovini, gdje pogrešno isporučeni proizvodi stvaraju trošak, dodatni transport i nepotrebno gomilanje ambalaže. U skladištu to također otvara mogućnost da robot prije samog zahvata dobije realističniju procjenu oblika predmeta skrivenog iza drugih kutija ili ispod materijala za pakiranje.

Druga skupina primjena odnosi se na kućne i uslužne robote. Sustav koji bez kamere može procijeniti gdje se osoba nalazi u prostoriji, kamo se kreće i kako izgleda raspored namještaja mogao bi biti koristan za navigaciju pomoćnih robota, osobito u dinamičnim kućnim uvjetima. U takvom okruženju prepreke nisu statične: vrata se otvaraju, stolice mijenjaju položaj, predmeti ostaju na podu, a ljudi se stalno kreću. Za robota koji treba surađivati s čovjekom nije dovoljno samo da "vidi" ono što je točno ispred njega; mora razumjeti i ono što je djelomično zaklonjeno, kao i širi raspored scene.

Treba ipak naglasiti da MIT ne tvrdi kako je riječ o gotovom komercijalnom proizvodu spremnom za masovno tržište. Riječ je o istraživačkim sustavima predstavljenima na znanstvenoj konferenciji, s rezultatima koji pokazuju smjer razvoja, ali i dalje ostavljaju otvorena pitanja o cijeni opreme, robusnosti u različitim realnim uvjetima, brzini rada i mogućoj integraciji s drugim vrstama senzora. Sama istraživačka skupina navodi da želi povećati granularnost i detalj rekonstrukcija te u budućnosti graditi veće temeljne modele za bežične signale, analogne onome što su GPT, Claude ili Gemini postali za jezik i viziju.

Tko stoji iza rada i zašto je CVPR važan

Viši autor oba rada je Fadel Adib, izvanredni profesor MIT Media Laba i EECS-a te voditelj skupine Signal Kinetics. Prema MIT-u, na radu o Wave-Formeru sudjelovali su Laura Dodds kao glavna autorica te Maisy Lam, Waleed Akbar i Yibo Cheng, dok su na radu o RISE-u autori Kaichen Zhou, Laura Dodds, Sayed Saad Afzal i Fadel Adib. Na Adibovoj službenoj stranici i popisu publikacija oba rada navedena su kao nadolazeći radovi za CVPR 2026. Sama konferencija CVPR ubraja se među najvažnija svjetska okupljanja u području računalnog vida i prepoznavanja uzoraka, a službena stranica navodi da će se ovogodišnje izdanje održati u Colorado Convention Centeru u Denveru od 3. do 7. lipnja 2026.

To je relevantno i zato što MIT-ovi radovi ne dolaze iz izoliranog laboratorijskog okruženja, nego ulaze u međunarodnu znanstvenu arenu u kojoj se uspoređuju s najnovijim trendovima u računalnom vidu, multimodalnim modelima, robotici i sustavima za razumijevanje scene. U posljednjih nekoliko godina generativna umjetna inteligencija snažno je utjecala na obradu slike, 3D rekonstrukciju i modeliranje prostora, no MIT-ov doprinos je u tome što taj val primjenjuje na podatke koji nisu klasične fotografije, nego bežični odrazi opterećeni specifičnim fizikalnim ograničenjima. Time se istraživanje ne pozicionira samo kao još jedan AI demonstrator, nego kao pokušaj povezivanja modela koji uče s realnim zakonitostima propagacije signala.

Što se doista mijenja za buduće robote

Najveća promjena nije u tome što će roboti odjednom "gledati kroz zidove" na način na koji to popularna kultura ponekad zamišlja. Puno je važnije to što bi mogli donositi manje pogrešne odluke u situacijama u kojima danas rade s manjkavim informacijama. U skladištu to može značiti manje promašenih zahvata i manje oštećenja robe. U domu to može značiti sigurnije kretanje kraj ljudi, djece ili kućnih ljubimaca. U industrijskom okruženju to može značiti bolje razumijevanje zone iza prepreke bez postavljanja dodatnih kamera na svaku točku prostora.

MIT-ova objava sugerira da generativna umjetna inteligencija u ovom slučaju ne služi samo uljepšavanju slike, nego ispravljanju dubinskog ograničenja bežičnog opažanja: senzor vidi samo fragmente, a model pomaže zaključiti što nedostaje. Uspije li se taj pristup dodatno skalirati i potvrditi u različitim okruženjima, mogao bi otvoriti novu klasu sustava koji kombiniraju privatnosno manje invazivno opažanje s praktičnom uporabom u robotici, logistici i pametnim prostorima. Za sada je riječ o istraživanju koje tek treba prijeći put od laboratorija do široke primjene, ali objavljeni rezultati pokazuju da se granica između onoga što je skriveno i onoga što je stroj sposoban razumjeti polako, ali vidljivo, pomiče.

Izvori:
- MIT News – objava o novim sustavima Wave-Former i RISE, autorima, primjenama i datumu predstavljanja na CVPR-u (link)
- CVPR 2026 – službena stranica konferencije s datumima i lokacijom održavanja (link)
- MIT / Fadel Adib – službena stranica istraživača i skupine Signal Kinetics s pregledom rada na bežičnom opažanju i popisom nadolazećih radova (link)
- arXiv – sažetak rada "Wave-Former: Through-Occlusion 3D Reconstruction via Wireless Shape Completion" s metodom i rezultatima (link)
- arXiv – sažetak rada "RISE: Single Static Radar-based Indoor Scene Understanding" s opisom benchmarka i mjera uspješnosti (link)
Kreirano: petak, 20. ožujka, 2026.

Pronađite smještaj u blizini

Redakcija za znanost i tehnologiju

Naša Redakcija za znanost i tehnologiju nastala je iz dugogodišnje strasti prema istraživanju, tumačenju i približavanju složenih tema običnim čitateljima. U njoj pišu zaposlenici i volonteri koji već desetljećima prate razvoj znanosti i tehnoloških inovacija, od laboratorijskih otkrića do rješenja koja mijenjaju svakodnevni život. Iako pišemo u množini, iza svakog teksta stoji stvarna osoba s dugim uredničkim i novinarskim iskustvom te dubokim poštovanjem prema činjenicama i provjerljivim informacijama.

Naša redakcija temelji svoj rad na uvjerenju da je znanost najjača kada je dostupna svima. Zato težimo jasnoći, preciznosti i razumljivosti, ali bez pojednostavljivanja koje bi narušilo kvalitetu sadržaja. Često provodimo sate proučavajući istraživanja, tehničke dokumente i stručne izvore kako bismo svaku temu predstavili čitatelju na način koji ga neće opteretiti, nego zainteresirati. U svakom tekstu nastojimo povezati znanstvene spoznaje s realnim životom, pokazujući kako ideje iz istraživačkih centara, sveučilišta i tehnoloških laboratorija oblikuju svijet oko nas.

Dugogodišnje iskustvo u novinarstvu omogućuje nam da prepoznamo što je za čitatelja zaista važno, bilo da se radi o napretku u umjetnoj inteligenciji, medicinskim otkrićima, energetskim rješenjima, svemirskim misijama ili uređajima koji ulaze u našu svakodnevicu prije nego što stignemo uopće zamisliti njihove mogućnosti. Naš pogled na tehnologiju nije isključivo tehnički; zanimaju nas i ljudske priče koje stoje iza velikih pomaka – istraživači koji godinama privode kraju projekte, inženjeri koji pretvaraju ideje u funkcionalne sustave, te vizionari koji guraju granice mogućega.

U radu nas vodi i osjećaj odgovornosti. Želimo da čitatelj može imati povjerenje u informacije koje donosimo, pa provjeravamo izvore, uspoređujemo podatke i ne žurimo s objavom ako nešto nije sasvim jasno. Povjerenje gradimo sporije nego što se piše vijest, ali vjerujemo da je jedino takvo novinarstvo dugoročno vrijedno.

Za nas je tehnologija više od uređaja, a znanost više od teorije. To su područja koja pokreću napredak, oblikuju društvo i pružaju nove mogućnosti svima koji žele razumjeti kako svijet funkcionira danas i kamo ide sutra. Upravo zato u našoj redakciji pristupamo svakoj temi s ozbiljnošću, ali i s dozom znatiželje, jer upravo znatiželja otvara vrata najboljim tekstovima.

Naša je misija približiti čitateljima svijet koji se mijenja brže nego ikada prije, uz uvjerenje da kvalitetno novinarstvo može biti most između stručnjaka, inovatora i svih onih koji žele razumjeti što se događa iza naslova. U tome vidimo svoj pravi zadatak: pretvoriti kompleksno u razumljivo, udaljeno u blisko, a nepoznato u inspirativno.

NAPOMENA ZA NAŠE ČITATELJE
Karlobag.eu pruža vijesti, analize i informacije o globalnim događanjima i temama od interesa za čitatelje širom svijeta. Sve objavljene informacije služe isključivo u informativne svrhe.
Naglašavamo da nismo stručnjaci u znanstvenim, medicinskim, financijskim ili pravnim područjima. Stoga, prije donošenja bilo kakvih odluka temeljenih na informacijama s našeg portala, preporučujemo da se konzultirate s kvalificiranim stručnjacima.
Karlobag.eu može sadržavati poveznice na vanjske stranice trećih strana, uključujući affiliate linkove i sponzorirane sadržaje. Ako kupite proizvod ili uslugu putem ovih poveznica, možemo ostvariti proviziju. Nemamo kontrolu nad sadržajem ili politikama tih stranica te ne snosimo odgovornost za njihovu točnost, dostupnost ili bilo kakve transakcije koje obavite putem njih.
Ako objavljujemo informacije o događajima ili prodaji ulaznica, napominjemo da mi ne prodajemo ulaznice niti izravno niti preko posrednika. Naš portal isključivo informira čitatelje o događajima i mogućnostima kupnje putem vanjskih prodajnih platformi. Povezujemo čitatelje s partnerima koji nude usluge prodaje ulaznica, ali ne jamčimo njihovu dostupnost, cijene ili uvjete kupnje. Sve informacije o ulaznicama preuzete su od trećih strana i mogu biti podložne promjenama bez prethodne najave. Preporučujemo da prije bilo kakve kupnje temeljito provjerite uvjete prodaje kod odabranog partnera, budući da portal Karlobag.eu ne preuzima odgovornost za transakcije ili uvjete prodaje ulaznica.
Sve informacije na našem portalu podložne su promjenama bez prethodne najave. Korištenjem ovog portala prihvaćate da čitate sadržaj na vlastitu odgovornost.