Postavke privatnosti

Razvijanje tehnike za procjenu pouzdanosti foundation modela prije primjene na specifične zadatke s MIT-a i MIT-IBM Watson AI Laboratorija

Istraživači sa MIT-a i MIT-IBM Watson AI Laboratorija razvili su novu tehniku za procjenu pouzdanosti foundation modela prije njihove primjene na specifične zadatke, koristeći algoritam za procjenu dosljednosti modela. Ovo rješenje može pomoći u smanjenju grešaka u sigurnosno kritičnim situacijama i omogućiti bolji odabir modela bez potrebe za testiranjem na stvarnim podacima.

Razvijanje tehnike za procjenu pouzdanosti foundation modela prije primjene na specifične zadatke s MIT-a i MIT-IBM Watson AI Laboratorija
Photo by: Domagoj Skledar/ arhiva (vlastita)

Istraživači sa MIT-a i MIT-IBM Watson AI Laboratorija razvili su tehniku za procjenu pouzdanosti foundation modela prije nego se primijene na određeni zadatak. Oni to postižu analizirajući skup foundation modela koji se međusobno malo razlikuju. Algoritam procjenjuje dosljednost reprezentacija koje svaki model nauči o istom testnom podatku. Ako su reprezentacije dosljedne, model se smatra pouzdanim.

Uspoređujući svoju tehniku sa najsuvremenijim metodama, istraživači su otkrili da je njihova metoda bolja u hvatanju pouzdanosti foundation modela na raznim zadacima klasifikacije.

Ova tehnika omogućava korisnicima da odluče treba li model primijeniti u određenom okruženju, bez potrebe za testiranjem na stvarnim podacima. To je posebno korisno u situacijama gdje podaci možda nisu dostupni zbog problema privatnosti, poput zdravstvenih podataka. Uz to, tehnika može rangirati modele prema rezultatima pouzdanosti, omogućujući korisnicima odabir najboljeg modela za njihov zadatak.

„Svi modeli mogu pogriješiti, ali modeli koji znaju kada su u krivu su korisniji. Problem kvantificiranja nesigurnosti ili pouzdanosti je izazovniji za ove foundation modele jer su njihove apstraktne reprezentacije teško usporedive. Naša metoda omogućava kvantificiranje koliko je pouzdana reprezentacija modela za bilo koji ulazni podatak,” kaže glavni autor Navid Azizan, profesor na MIT-u i član Laboratorija za informacije i sustave odlučivanja (LIDS).

Uz njega na radu su radili i glavni autor Young-Jin Park, doktorand na LIDS-u; Hao Wang, znanstveni istraživač u MIT-IBM Watson AI Laboratoriju; i Shervin Ardeshir, viši znanstveni istraživač u Netflixu. Rad će biti predstavljen na Konferenciji o nesigurnosti u umjetnoj inteligenciji.

Mjerenje konsenzusa
Tradicionalni modeli strojnog učenja trenirani su za obavljanje specifičnog zadatka. Ovi modeli obično daju konkretnu predikciju na temelju ulaza. Na primjer, model može reći sadrži li određena slika mačku ili psa. U ovom slučaju, procjena pouzdanosti može biti jednostavna kao provjera konačne predikcije.

Ali foundation modeli su drugačiji. Model se prethodno trenira koristeći opće podatke, u okruženju gdje njegovi tvorci ne znaju sve zadatke na koje će se primijeniti. Korisnici ga prilagođavaju svojim specifičnim zadacima nakon što je već treniran.

Za procjenu pouzdanosti foundation modela, istraživači su koristili pristup ansambla treniranjem nekoliko modela koji dijele mnoge osobine, ali se malo razlikuju.

„Naša ideja je poput mjerenja konsenzusa. Ako svi ti foundation modeli daju dosljedne reprezentacije za bilo koje podatke u našem skupu podataka, onda možemo reći da je taj model pouzdan,” kaže Park.

Ali suočili su se s problemom: kako usporediti apstraktne reprezentacije?
„Ovi modeli samo daju vektor, sastavljen od nekih brojeva, pa ih ne možemo lako usporediti,” dodaje.

Problem su riješili korištenjem ideje zvane dosljednost susjedstva.

Za svoj pristup, istraživači pripremaju skup pouzdanih referentnih točaka za testiranje na ansamblu modela. Zatim, za svaki model, istražuju referentne točke koje se nalaze blizu reprezentacije modela za testnu točku.

Gledajući dosljednost susjednih točaka, mogu procijeniti pouzdanost modela.

Poravnavanje reprezentacija
Foundation modeli mapiraju podatkovne točke u ono što je poznato kao prostor reprezentacije. Jedan način razmišljanja o ovom prostoru je kao o sferi. Svaki model mapira slične podatkovne točke na isto mjesto u svojoj sferi, tako da slike mačaka idu na jedno mjesto, a slike pasa na drugo.

Ali svaki model bi različito mapirao životinje u svojoj sferi, pa dok bi mačke mogle biti grupirane blizu Južnog pola jedne sfere, drugi model bi mogao mapirati mačke negdje u Sjevernoj hemisferi.

Istraživači koriste susjedne točke kao sidra za poravnanje tih sfera kako bi mogli usporediti reprezentacije. Ako su susjedi podatkovne točke dosljedni u više reprezentacija, onda možemo biti sigurni u pouzdanost modela za tu točku.

Kada su testirali ovaj pristup na širokom rasponu zadataka klasifikacije, otkrili su da je bio puno dosljedniji od osnovnih metoda. Osim toga, nije bio zbunjen izazovnim testnim točkama koje su druge metode zbunjivale.

Štoviše, njihov pristup se može koristiti za procjenu pouzdanosti za bilo koje ulazne podatke, tako da se može procijeniti koliko dobro model funkcionira za određenu vrstu pojedinca, kao što je pacijent s određenim karakteristikama.

„Čak i ako svi modeli imaju prosječne performanse, iz individualne perspektive, preferirat ćete onaj koji najbolje funkcionira za tog pojedinca,” kaže Wang.

Jedno ograničenje dolazi iz činjenice da moraju trenirati ansambl foundation modela, što je računalno skupo. U budućnosti planiraju pronaći učinkovitije načine za izgradnju više modela, možda korištenjem malih perturbacija jednog modela.

„S trenutnim trendom korištenja foundation modela za njihove reprezentacije kako bi podržali razne zadatke — od finog podešavanja do generiranja s obogaćenjem iz pretraživanja — tema kvantificiranja nesigurnosti na razini reprezentacije postaje sve važnija, ali izazovna, jer same reprezentacije nemaju utemeljenje. Umjesto toga, važno je kako su reprezentacije različitih ulaza međusobno povezane, ideja koju ovaj rad uredno obuhvaća kroz predloženi skor dosljednosti susjedstva,” kaže Marco Pavone, izvanredni profesor na Odjelu za aeronautiku i astronautiku na Sveučilištu Stanford, koji nije bio uključen u ovaj rad. „Ovo je obećavajući korak prema visokokvalitetnom kvantificiranju nesigurnosti za modele reprezentacije, i uzbuđen sam vidjeti buduće proširenja koja mogu funkcionirati bez potrebe za ansambliranjem modela kako bi se ovaj pristup stvarno omogućio u modelima veličine foundation.”

Ovaj rad je djelomično financiran od strane MIT-IBM Watson AI Laboratorija, MathWorks-a i Amazona.

Kreirano: srijeda, 17. srpnja, 2024.

Pronađite smještaj u blizini

Redakcija za znanost i tehnologiju

Naša Redakcija za znanost i tehnologiju nastala je iz dugogodišnje strasti prema istraživanju, tumačenju i približavanju složenih tema običnim čitateljima. U njoj pišu zaposlenici i volonteri koji već desetljećima prate razvoj znanosti i tehnoloških inovacija, od laboratorijskih otkrića do rješenja koja mijenjaju svakodnevni život. Iako pišemo u množini, iza svakog teksta stoji stvarna osoba s dugim uredničkim i novinarskim iskustvom te dubokim poštovanjem prema činjenicama i provjerljivim informacijama.

Naša redakcija temelji svoj rad na uvjerenju da je znanost najjača kada je dostupna svima. Zato težimo jasnoći, preciznosti i razumljivosti, ali bez pojednostavljivanja koje bi narušilo kvalitetu sadržaja. Često provodimo sate proučavajući istraživanja, tehničke dokumente i stručne izvore kako bismo svaku temu predstavili čitatelju na način koji ga neće opteretiti, nego zainteresirati. U svakom tekstu nastojimo povezati znanstvene spoznaje s realnim životom, pokazujući kako ideje iz istraživačkih centara, sveučilišta i tehnoloških laboratorija oblikuju svijet oko nas.

Dugogodišnje iskustvo u novinarstvu omogućuje nam da prepoznamo što je za čitatelja zaista važno, bilo da se radi o napretku u umjetnoj inteligenciji, medicinskim otkrićima, energetskim rješenjima, svemirskim misijama ili uređajima koji ulaze u našu svakodnevicu prije nego što stignemo uopće zamisliti njihove mogućnosti. Naš pogled na tehnologiju nije isključivo tehnički; zanimaju nas i ljudske priče koje stoje iza velikih pomaka – istraživači koji godinama privode kraju projekte, inženjeri koji pretvaraju ideje u funkcionalne sustave, te vizionari koji guraju granice mogućega.

U radu nas vodi i osjećaj odgovornosti. Želimo da čitatelj može imati povjerenje u informacije koje donosimo, pa provjeravamo izvore, uspoređujemo podatke i ne žurimo s objavom ako nešto nije sasvim jasno. Povjerenje gradimo sporije nego što se piše vijest, ali vjerujemo da je jedino takvo novinarstvo dugoročno vrijedno.

Za nas je tehnologija više od uređaja, a znanost više od teorije. To su područja koja pokreću napredak, oblikuju društvo i pružaju nove mogućnosti svima koji žele razumjeti kako svijet funkcionira danas i kamo ide sutra. Upravo zato u našoj redakciji pristupamo svakoj temi s ozbiljnošću, ali i s dozom znatiželje, jer upravo znatiželja otvara vrata najboljim tekstovima.

Naša je misija približiti čitateljima svijet koji se mijenja brže nego ikada prije, uz uvjerenje da kvalitetno novinarstvo može biti most između stručnjaka, inovatora i svih onih koji žele razumjeti što se događa iza naslova. U tome vidimo svoj pravi zadatak: pretvoriti kompleksno u razumljivo, udaljeno u blisko, a nepoznato u inspirativno.

NAPOMENA ZA NAŠE ČITATELJE
Karlobag.eu pruža vijesti, analize i informacije o globalnim događanjima i temama od interesa za čitatelje širom svijeta. Sve objavljene informacije služe isključivo u informativne svrhe.
Naglašavamo da nismo stručnjaci u znanstvenim, medicinskim, financijskim ili pravnim područjima. Stoga, prije donošenja bilo kakvih odluka temeljenih na informacijama s našeg portala, preporučujemo da se konzultirate s kvalificiranim stručnjacima.
Karlobag.eu može sadržavati poveznice na vanjske stranice trećih strana, uključujući affiliate linkove i sponzorirane sadržaje. Ako kupite proizvod ili uslugu putem ovih poveznica, možemo ostvariti proviziju. Nemamo kontrolu nad sadržajem ili politikama tih stranica te ne snosimo odgovornost za njihovu točnost, dostupnost ili bilo kakve transakcije koje obavite putem njih.
Ako objavljujemo informacije o događajima ili prodaji ulaznica, napominjemo da mi ne prodajemo ulaznice niti izravno niti preko posrednika. Naš portal isključivo informira čitatelje o događajima i mogućnostima kupnje putem vanjskih prodajnih platformi. Povezujemo čitatelje s partnerima koji nude usluge prodaje ulaznica, ali ne jamčimo njihovu dostupnost, cijene ili uvjete kupnje. Sve informacije o ulaznicama preuzete su od trećih strana i mogu biti podložne promjenama bez prethodne najave. Preporučujemo da prije bilo kakve kupnje temeljito provjerite uvjete prodaje kod odabranog partnera, budući da portal Karlobag.eu ne preuzima odgovornost za transakcije ili uvjete prodaje ulaznica.
Sve informacije na našem portalu podložne su promjenama bez prethodne najave. Korištenjem ovog portala prihvaćate da čitate sadržaj na vlastitu odgovornost.