Novi pristup za poboljšanje procjene nesigurnosti u modelima strojnog učenja: skalabilna metoda za primjenu u zdravstvu i drugim kritičnim područjima

MIT-ovi istraživači razvili su učinkovit način za poboljšanje procjena nesigurnosti u strojnome učenju, omogućujući točnije i brže rezultate u primjenama poput zdravstva. Ova metoda pomaže korisnicima u donošenju informiranih odluka temeljenih na pouzdanosti modela.

Novi pristup za poboljšanje procjene nesigurnosti u modelima strojnog učenja: skalabilna metoda za primjenu u zdravstvu i drugim kritičnim područjima
Photo by: Domagoj Skledar/ arhiva (vlastita)

Današnja istraživanja u području strojnog učenja često se usredotočuju na procjenu nesigurnosti kako bi korisnici mogli bolje razumjeti koliko su odluke modela pouzdane. Ova procjena posebno je važna u situacijama gdje su ulozi visoki, poput prepoznavanja bolesti na medicinskim slikama ili filtriranja prijava za posao.

No, procjene nesigurnosti su korisne samo ako su točne. Ako model tvrdi da je 49 posto siguran da medicinska slika prikazuje pleuralni izljev, tada bi u 49 posto slučajeva taj model trebao biti u pravu.

Istraživači s MIT-a razvili su novi pristup za poboljšanje procjena nesigurnosti u modelima strojnog učenja. Njihova metoda generira preciznije procjene nesigurnosti u usporedbi s drugim tehnikama i to čini na učinkovitiji način.

Osim toga, ova tehnika je skalabilna i može se primijeniti na velike modele dubokog učenja koji se sve više koriste u zdravstvu i drugim situacijama gdje je sigurnost od ključne važnosti.

Ova tehnika može pružiti krajnjim korisnicima, od kojih mnogi nemaju stručnost u strojnome učenju, bolje informacije za procjenu pouzdanosti modela i odlučivanje o njegovoj primjeni u određenim zadacima.

Kvantificiranje nesigurnosti
Metode kvantificiranja nesigurnosti često zahtijevaju složene statističke izračune koji se teško skaliraju na modele strojnog učenja s milijunima parametara. Također, ove metode često zahtijevaju pretpostavke o modelu i podacima korištenim za njegovo treniranje.

MIT-ovi istraživači pristupili su ovom problemu na drugačiji način. Koristili su princip minimalne duljine opisa (MDL), koji ne zahtijeva pretpostavke koje mogu ograničiti točnost drugih metoda. MDL se koristi za bolje kvantificiranje i kalibriranje nesigurnosti za testne točke koje model treba označiti.

Tehnika koju su razvili istraživači, poznata kao IF-COMP, čini MDL dovoljno brzim za upotrebu s velikim modelima dubokog učenja koji se primjenjuju u mnogim stvarnim okruženjima.

MDL uključuje razmatranje svih mogućih oznaka koje model može dati za određenu testnu točku. Ako postoji mnogo alternativnih oznaka za tu točku koje dobro odgovaraju, povjerenje modela u odabranu oznaku treba proporcionalno smanjiti.

„Jedan način razumijevanja koliko je model siguran jest da mu se daju neke kontrafaktične informacije i da se vidi koliko je spreman promijeniti svoje uvjerenje“, kaže Nathan Ng, glavni autor studije i doktorand na Sveučilištu u Torontu koji je ujedno i gostujući student na MIT-u.

Na primjer, razmotrimo model koji tvrdi da medicinska slika prikazuje pleuralni izljev. Ako istraživači kažu modelu da ta slika prikazuje edem, a model je spreman promijeniti svoje uvjerenje, tada bi model trebao biti manje siguran u svoju izvornu odluku.

S MDL-om, ako je model siguran kad označava podatkovnu točku, trebao bi koristiti vrlo kratak kod za opis te točke. Ako nije siguran jer točka može imati mnogo drugih oznaka, koristi duži kod za obuhvaćanje tih mogućnosti.

Količina koda korištena za označavanje podatkovne točke poznata je kao stohastička složenost podataka. Ako istraživači pitaju model koliko je spreman promijeniti svoje uvjerenje o podatkovnoj točki s obzirom na suprotne dokaze, stohastička složenost podataka bi se trebala smanjiti ako je model siguran.

Ali testiranje svake podatkovne točke korištenjem MDL-a zahtijevalo bi ogromnu količinu računalne snage.

Ubrzavanje procesa
S IF-COMP-om, istraživači su razvili tehniku aproksimacije koja može točno procijeniti stohastičku složenost podataka koristeći posebnu funkciju, poznatu kao funkcija utjecaja. Također su koristili statističku tehniku nazvanu temperaturno skaliranje, koja poboljšava kalibraciju izlaza modela. Ova kombinacija funkcija utjecaja i temperaturnog skaliranja omogućuje visokokvalitetne aproksimacije stohastičke složenosti podataka.

Na kraju, IF-COMP može učinkovito proizvesti dobro kalibrirane procjene nesigurnosti koje odražavaju stvarno povjerenje modela. Tehnika također može utvrditi je li model pogrešno označio određene podatkovne točke ili otkriti koje su podatkovne točke izvanredne.

Istraživači su testirali svoj sustav na ova tri zadatka i otkrili da je bio brži i točniji od drugih metoda.

„Zaista je važno imati neku sigurnost da je model dobro kalibriran, a sve je veća potreba za otkrivanjem kada određena predikcija nije sasvim točna. Alati za reviziju postaju sve potrebniji u problemima strojnog učenja kako koristimo velike količine neprovjerenih podataka za izradu modela koji će se primjenjivati na probleme s kojima se suočavaju ljudi“, kaže Marzyeh Ghassemi, viša autorica studije.

IF-COMP je model-agnostičan, što znači da može pružiti točne procjene nesigurnosti za mnoge vrste modela strojnog učenja. To bi mu moglo omogućiti širu primjenu u stvarnim okruženjima, što bi na kraju pomoglo više praktičara da donose bolje odluke.

„Ljudi trebaju razumjeti da su ovi sustavi vrlo pogrešivi i da mogu donositi zaključke na temelju nedovoljnih podataka. Model može izgledati kao da je vrlo siguran, ali postoji mnogo različitih stvari u koje je spreman vjerovati s obzirom na suprotne dokaze“, kaže Ng.

U budućnosti, istraživači namjeravaju primijeniti svoj pristup na velike jezične modele i istražiti druge potencijalne primjene principa minimalne duljine opisa.

Izvor: Massachusetts Institute of Technology

Erstellungszeitpunkt: 17 Juli, 2024
Hinweis für unsere Leser:
Das Portal Karlobag.eu bietet Informationen zu täglichen Ereignissen und Themen, die für unsere Community wichtig sind. Wir betonen, dass wir keine Experten auf wissenschaftlichen oder medizinischen Gebieten sind. Alle veröffentlichten Informationen dienen ausschließlich Informationszwecken.
Bitte betrachten Sie die Informationen auf unserem Portal nicht als völlig korrekt und konsultieren Sie immer Ihren eigenen Arzt oder Fachmann, bevor Sie Entscheidungen auf der Grundlage dieser Informationen treffen.
Unser Team ist bestrebt, Sie mit aktuellen und relevanten Informationen zu versorgen und wir veröffentlichen alle Inhalte mit großem Engagement.
Wir laden Sie ein, Ihre Geschichten aus Karlobag mit uns zu teilen!
Ihre Erfahrungen und Geschichten über diesen wunderschönen Ort sind wertvoll und wir würden sie gerne hören.
Sie können sie gerne senden an uns unter karlobag@karlobag.eu.
Ihre Geschichten werden zum reichen kulturellen Erbe unseres Karlobag beitragen.
Vielen Dank, dass Sie Ihre Erinnerungen mit uns teilen!

AI Lara Teč

AI Lara Teč ist eine innovative KI-Journalistin des Portals Karlobag.eu, die sich auf die Berichterstattung über die neuesten Trends und Errungenschaften in der Welt der Wissenschaft und Technologie spezialisiert hat. Mit ihrem Fachwissen und ihrem analytischen Ansatz liefert Lara tiefgreifende Einblicke und Erklärungen zu den komplexesten Themen und macht diese für alle Leser zugänglich und verständlich.

Expertenanalyse und klare Erklärungen
Lara nutzt ihr Fachwissen, um komplexe wissenschaftliche und technologische Themen zu analysieren und zu erklären und konzentriert sich dabei auf deren Bedeutung und Auswirkungen auf das tägliche Leben. Ob es um die neuesten technologischen Innovationen, Forschungsdurchbrüche oder Trends in der digitalen Welt geht, Lara bietet gründliche Analysen und Erklärungen und beleuchtet wichtige Aspekte und mögliche Auswirkungen für die Leser.

Ihr Führer durch die Welt der Wissenschaft und Technik
Laras Artikel sollen Sie durch die komplexe Welt der Wissenschaft und Technologie führen und klare und präzise Erklärungen liefern. Ihre Fähigkeit, komplexe Konzepte in verständliche Teile zu zerlegen, macht ihre Artikel zu einer unverzichtbaren Ressource für jeden, der über die neuesten wissenschaftlichen und technologischen Entwicklungen auf dem Laufenden bleiben möchte.

Mehr als KI – Ihr Fenster in die Zukunft
AI Lara Teč ist nicht nur Journalistin; Es ist ein Fenster in die Zukunft und bietet Einblicke in neue Horizonte von Wissenschaft und Technologie. Ihre fachkundige Anleitung und tiefgreifende Analyse helfen den Lesern, die Komplexität und Schönheit der Innovationen, die unsere Welt prägen, zu verstehen und zu schätzen. Bleiben Sie mit Lara auf dem Laufenden und lassen Sie sich von den neuesten Entwicklungen inspirieren, die die Welt der Wissenschaft und Technologie zu bieten hat.