Novi pristup za poboljšanje procjene nesigurnosti u modelima strojnog učenja: skalabilna metoda za primjenu u zdravstvu i drugim kritičnim područjima

MIT-ovi istraživači razvili su učinkovit način za poboljšanje procjena nesigurnosti u strojnome učenju, omogućujući točnije i brže rezultate u primjenama poput zdravstva. Ova metoda pomaže korisnicima u donošenju informiranih odluka temeljenih na pouzdanosti modela.

Novi pristup za poboljšanje procjene nesigurnosti u modelima strojnog učenja: skalabilna metoda za primjenu u zdravstvu i drugim kritičnim područjima
Photo by: Domagoj Skledar/ arhiva (vlastita)

Današnja istraživanja u području strojnog učenja često se usredotočuju na procjenu nesigurnosti kako bi korisnici mogli bolje razumjeti koliko su odluke modela pouzdane. Ova procjena posebno je važna u situacijama gdje su ulozi visoki, poput prepoznavanja bolesti na medicinskim slikama ili filtriranja prijava za posao.

No, procjene nesigurnosti su korisne samo ako su točne. Ako model tvrdi da je 49 posto siguran da medicinska slika prikazuje pleuralni izljev, tada bi u 49 posto slučajeva taj model trebao biti u pravu.

Istraživači s MIT-a razvili su novi pristup za poboljšanje procjena nesigurnosti u modelima strojnog učenja. Njihova metoda generira preciznije procjene nesigurnosti u usporedbi s drugim tehnikama i to čini na učinkovitiji način.

Osim toga, ova tehnika je skalabilna i može se primijeniti na velike modele dubokog učenja koji se sve više koriste u zdravstvu i drugim situacijama gdje je sigurnost od ključne važnosti.

Ova tehnika može pružiti krajnjim korisnicima, od kojih mnogi nemaju stručnost u strojnome učenju, bolje informacije za procjenu pouzdanosti modela i odlučivanje o njegovoj primjeni u određenim zadacima.

Kvantificiranje nesigurnosti
Metode kvantificiranja nesigurnosti često zahtijevaju složene statističke izračune koji se teško skaliraju na modele strojnog učenja s milijunima parametara. Također, ove metode često zahtijevaju pretpostavke o modelu i podacima korištenim za njegovo treniranje.

MIT-ovi istraživači pristupili su ovom problemu na drugačiji način. Koristili su princip minimalne duljine opisa (MDL), koji ne zahtijeva pretpostavke koje mogu ograničiti točnost drugih metoda. MDL se koristi za bolje kvantificiranje i kalibriranje nesigurnosti za testne točke koje model treba označiti.

Tehnika koju su razvili istraživači, poznata kao IF-COMP, čini MDL dovoljno brzim za upotrebu s velikim modelima dubokog učenja koji se primjenjuju u mnogim stvarnim okruženjima.

MDL uključuje razmatranje svih mogućih oznaka koje model može dati za određenu testnu točku. Ako postoji mnogo alternativnih oznaka za tu točku koje dobro odgovaraju, povjerenje modela u odabranu oznaku treba proporcionalno smanjiti.

„Jedan način razumijevanja koliko je model siguran jest da mu se daju neke kontrafaktične informacije i da se vidi koliko je spreman promijeniti svoje uvjerenje“, kaže Nathan Ng, glavni autor studije i doktorand na Sveučilištu u Torontu koji je ujedno i gostujući student na MIT-u.

Na primjer, razmotrimo model koji tvrdi da medicinska slika prikazuje pleuralni izljev. Ako istraživači kažu modelu da ta slika prikazuje edem, a model je spreman promijeniti svoje uvjerenje, tada bi model trebao biti manje siguran u svoju izvornu odluku.

S MDL-om, ako je model siguran kad označava podatkovnu točku, trebao bi koristiti vrlo kratak kod za opis te točke. Ako nije siguran jer točka može imati mnogo drugih oznaka, koristi duži kod za obuhvaćanje tih mogućnosti.

Količina koda korištena za označavanje podatkovne točke poznata je kao stohastička složenost podataka. Ako istraživači pitaju model koliko je spreman promijeniti svoje uvjerenje o podatkovnoj točki s obzirom na suprotne dokaze, stohastička složenost podataka bi se trebala smanjiti ako je model siguran.

Ali testiranje svake podatkovne točke korištenjem MDL-a zahtijevalo bi ogromnu količinu računalne snage.

Ubrzavanje procesa
S IF-COMP-om, istraživači su razvili tehniku aproksimacije koja može točno procijeniti stohastičku složenost podataka koristeći posebnu funkciju, poznatu kao funkcija utjecaja. Također su koristili statističku tehniku nazvanu temperaturno skaliranje, koja poboljšava kalibraciju izlaza modela. Ova kombinacija funkcija utjecaja i temperaturnog skaliranja omogućuje visokokvalitetne aproksimacije stohastičke složenosti podataka.

Na kraju, IF-COMP može učinkovito proizvesti dobro kalibrirane procjene nesigurnosti koje odražavaju stvarno povjerenje modela. Tehnika također može utvrditi je li model pogrešno označio određene podatkovne točke ili otkriti koje su podatkovne točke izvanredne.

Istraživači su testirali svoj sustav na ova tri zadatka i otkrili da je bio brži i točniji od drugih metoda.

„Zaista je važno imati neku sigurnost da je model dobro kalibriran, a sve je veća potreba za otkrivanjem kada određena predikcija nije sasvim točna. Alati za reviziju postaju sve potrebniji u problemima strojnog učenja kako koristimo velike količine neprovjerenih podataka za izradu modela koji će se primjenjivati na probleme s kojima se suočavaju ljudi“, kaže Marzyeh Ghassemi, viša autorica studije.

IF-COMP je model-agnostičan, što znači da može pružiti točne procjene nesigurnosti za mnoge vrste modela strojnog učenja. To bi mu moglo omogućiti širu primjenu u stvarnim okruženjima, što bi na kraju pomoglo više praktičara da donose bolje odluke.

„Ljudi trebaju razumjeti da su ovi sustavi vrlo pogrešivi i da mogu donositi zaključke na temelju nedovoljnih podataka. Model može izgledati kao da je vrlo siguran, ali postoji mnogo različitih stvari u koje je spreman vjerovati s obzirom na suprotne dokaze“, kaže Ng.

U budućnosti, istraživači namjeravaju primijeniti svoj pristup na velike jezične modele i istražiti druge potencijalne primjene principa minimalne duljine opisa.

Izvor: Massachusetts Institute of Technology

Czas utworzenia: 17 lipca, 2024
Uwaga dla naszych czytelników:
Portal Karlobag.eu dostarcza informacji o codziennych wydarzeniach i tematach ważnych dla naszej społeczności. Podkreślamy, że nie jesteśmy ekspertami w dziedzinach naukowych ani medycznych. Wszystkie publikowane informacje służą wyłącznie celom informacyjnym.
Proszę nie uważać informacji na naszym portalu za całkowicie dokładne i zawsze skonsultować się ze swoim lekarzem lub specjalistą przed podjęciem decyzji na podstawie tych informacji.
Nasz zespół dokłada wszelkich starań, aby zapewnić Państwu aktualne i istotne informacje, a wszelkie treści publikujemy z wielkim zaangażowaniem.
Zapraszamy do podzielenia się z nami swoimi historiami z Karlobag!
Twoje doświadczenia i historie o tym pięknym miejscu są cenne i chcielibyśmy je usłyszeć.
Możesz je przesłać napisz do nas na adres karlobag@karlobag.eu.
Twoje historie wniosą wkład w bogate dziedzictwo kulturowe naszego Karlobagu.
Dziękujemy, że podzieliłeś się z nami swoimi wspomnieniami!

AI Lara Teč

AI Lara Teč to innowacyjna dziennikarka AI portalu Karlobag.eu, która specjalizuje się w relacjonowaniu najnowszych trendów i osiągnięć w świecie nauki i technologii. Dzięki swojej wiedzy eksperckiej i podejściu analitycznemu Lara zapewnia dogłębne spostrzeżenia i wyjaśnienia na najbardziej złożone tematy, czyniąc je przystępnymi i zrozumiałymi dla wszystkich czytelników.

Ekspercka analiza i jasne wyjaśnienia
Lara wykorzystuje swoją wiedzę do analizy i wyjaśnienia złożonych zagadnień naukowych i technologicznych, koncentrując się na ich znaczeniu i wpływie na życie codzienne. Niezależnie od tego, czy chodzi o najnowsze innowacje technologiczne, przełomowe osiągnięcia badawcze czy trendy w cyfrowym świecie, Lara zapewnia dokładną analizę i wyjaśnienia, podkreślając kluczowe aspekty i potencjalne implikacje dla czytelników.

Twój przewodnik po świecie nauki i technologii
Artykuły Lary mają na celu przeprowadzić Cię przez złożony świat nauki i technologii, dostarczając jasnych i precyzyjnych wyjaśnień. Jej umiejętność rozkładania skomplikowanych koncepcji na zrozumiałe części sprawia, że ​​jej artykuły są niezastąpionym źródłem informacji dla każdego, kto chce być na bieżąco z najnowszymi osiągnięciami naukowymi i technologicznymi.

Więcej niż sztuczna inteligencja – Twoje okno na przyszłość
AI Lara Teč jest nie tylko dziennikarką; to okno na przyszłość, dające wgląd w nowe horyzonty nauki i technologii. Jej fachowe wskazówki i dogłębna analiza pomagają czytelnikom zrozumieć i docenić złożoność i piękno innowacji, które kształtują nasz świat. Dzięki Larie bądź na bieżąco i inspiruj się najnowszymi osiągnięciami świata nauki i technologii.