MIT-ov Sandook pokazuje kako podatkovni centri mogu dobiti više performansi bez nove opreme
MIT-ovi istraživači predstavili su sustav Sandook, softversko rješenje koje bi podatkovnim centrima moglo pomoći da iz postojećih SSD uređaja izvuku osjetno više performansi bez kupnje dodatnog hardvera. Riječ je o pristupu koji cilja jedan od najskupljih i najmanje vidljivih problema moderne digitalne infrastrukture: činjenicu da veliki sustavi za pohranu podataka, i kada su tehnički ispravni i umreženi radi zajedničkog korištenja, često rade ispod svog stvarnog potencijala. Prema MIT Newsu, sustav je osmišljen tako da u stvarnom vremenu raspoređuje radna opterećenja između više uređaja za pohranu i pritom smanjuje posljedice usporavanja koja nastaju zbog razlika među samim SSD-ovima, zbog sukoba između čitanja i zapisivanja te zbog procesa takozvanog „garbage collectiona”. Istraživači tvrde da takav pristup na realnim zadacima može donijeti vrlo opipljiv rast brzine, a u nekim scenarijima gotovo udvostručiti učinak u odnosu na uobičajene statične metode raspodjele posla.
Zašto je problem važan za podatkovne centre
Rad podatkovnih centara danas se više ne oslanja samo na procesore i mrežu. Brzina pristupa podacima postala je jednako važna, osobito u treniranju modela umjetne inteligencije, radu baza podataka, obradi velikih količina korisničkih sadržaja i pohrani datoteka koje se stalno čitaju i nadopunjuju. U praksi se zato više SSD uređaja često povezuje u zajednički spremnik kojem pristupa više aplikacija. Takvo „poolanje” uređaja ima jasnu ekonomsku logiku: ne mora svaka aplikacija imati vlastiti disk punog kapaciteta ako se resurs može dijeliti preko mreže. Problem je, međutim, u tome što svi SSD-ovi ne reagiraju jednako pod jednakim opterećenjem, pa jedan sporiji ili trenutačno zagušeni uređaj može spuštati ukupne performanse cijelog skupa. Upravo taj jaz između nominalnog kapaciteta i stvarno ostvarene brzine predstavlja prostor u kojem Sandook pokušava napraviti razliku.
MIT u svojoj objavi naglašava da se u postojećim okruženjima značajan dio kapaciteta uređaja i dalje ne koristi učinkovito, i to čak i kada su uređaji formalno objedinjeni radi veće iskoristivosti. Drugim riječima, sama činjenica da su SSD-ovi povezani u zajednički sustav ne znači da će podatkovni centar automatski dobiti optimalan rezultat. Ako su diskovi kupljeni u različitim razdobljima, od različitih proizvođača, s različitim stupnjem istrošenosti i različitim kapacitetima, njihovo ponašanje pod opterećenjem nužno se razlikuje. Kada se tome pridodaju unutarnji procesi samih SSD-ova, postaje jasno zašto klasična, ravnomjerna raspodjela zadataka često nije dovoljna.
Tri izvora usporavanja koje sustav pokušava obuzdati
Prema opisu istraživanja, Sandook je razvijen tako da istodobno rješava tri glavna izvora varijabilnosti performansi. Prvi su razlike među samim SSD uređajima. U stvarnim podatkovnim centrima oprema se ne kupuje uvijek odjednom niti je nužno iz iste serije ili od istog proizvođača. Tijekom vremena neki diskovi postaju istrošeniji, neki rade pod većim opterećenjem, a neki imaju drukčije tehničke karakteristike. To znači da čak i kada administrator svakom uređaju dodijeli formalno isti posao, rezultat na kraju neće biti isti.
Drugi problem dolazi iz istodobnog čitanja i zapisivanja na istom SSD-u. Kada uređaj mora upisati nove podatke, često prethodno mora obrisati dio postojećih blokova. Taj proces može usporiti operacije čitanja koje se u istom trenutku odvijaju na istom uređaju. U okruženjima u kojima aplikacije traže predvidivu latenciju, takve smetnje mogu biti itekako skupe. Treći izvor usporavanja je „garbage collection”, interni proces prikupljanja i uklanjanja zastarjelih podataka kako bi se oslobodio prostor. Taj se proces, kako ističu autori, aktivira u intervalima koje operater podatkovnog centra ne može izravno kontrolirati, a kada se pokrene, može naglo usporiti rad diska.
Upravo ta kombinacija kratkoročnih i dugoročnih uzroka pada performansi čini problem posebno neugodnim. Neka usporavanja pojavljuju se iznenada i traju kratko, dok se druga razvijaju mjesecima kroz trošenje uređaja. Ako sustav upravljanja promatra samo jedan uzrok, lako može previdjeti drugi. Zato istraživači tvrde da je prednost Sandooka u tome što ne pokušava liječiti samo jedan simptom, nego promatra cjelinu ponašanja sklopa za pohranu.
Dvoslojna arhitektura: globalna slika i lokalna reakcija
Središnja tehnička ideja sustava jest dvoslojna arhitektura upravljanja. Na vrhu je globalni raspoređivač koji vidi širu sliku cijelog skupa uređaja i odlučuje koji će SSD dobiti koje zadatke. Na nižoj razini nalaze se lokalni raspoređivači na pojedinim strojevima koji mogu vrlo brzo reagirati kada neki uređaj počne zaostajati ili se iznenada zaguši. Time se pokušava spojiti ono što je u velikim sustavima često teško pomiriti: strateško planiranje na razini cijelog podatkovnog centra i trenutna operativna reakcija na problem koji se pojavi unutar djelića sekunde.
MIT navodi da Sandook smanjuje smetnje između čitanja i zapisivanja tako što rotira SSD-ove koje pojedina aplikacija koristi za te dvije vrste operacija. Time se smanjuje vjerojatnost da će se čitanje i zapisivanje sudarati na istom uređaju u istom trenutku. Osim toga, sustav profilira uobičajeno ponašanje svakog SSD-a kako bi mogao prepoznati kada određeni uređaj vjerojatno usporava zbog garbage collectiona. Kada otkrije takvu situaciju, dio opterećenja preusmjerava na druge uređaje dok se pogođeni SSD ne stabilizira. Bit pristupa nije potpuno „isključiti” problematični disk, nego mu privremeno smanjiti teret i zatim ga postupno vratiti u puni rad kada se pokaže da ponovno može podnijeti više posla.
Takav model posebno je važan zato što se različite vrste varijabilnosti odvijaju na različitim vremenskim skalama. Garbage collection može izazvati iznenadan pad performansi, dok istrošenost uređaja stvara sporije, kumulativno usporavanje. Globalni kontroler može uzeti u obzir dugoročniji profil uređaja, a lokalni raspoređivač može reagirati na trenutni zastoj. U teoriji, upravo ta kombinacija daje sustavu fleksibilnost koju jednostavniji modeli raspodjele nemaju.
Rezultati testiranja: od baze podataka do treninga AI modela
Istraživači su Sandook testirali na skupu od 10 SSD-ova i promatrali ponašanje sustava u četiri različite vrste zadataka: radu baze podataka, treniranju modela strojnog učenja, kompresiji slika i pohrani korisničkih podataka. Prema MIT-ovoj objavi, povećanje propusnosti po aplikaciji kretalo se od 12 do 94 posto u usporedbi sa statičkim metodama, dok je ukupna iskorištenost kapaciteta SSD-ova porasla za 23 posto. Autori također navode da je sustav omogućio SSD-ovima da dosegnu 95 posto svojeg teorijskog maksimuma performansi, i to bez specijaliziranog hardvera ili prilagodbi koje bi morale biti izrađene posebno za pojedinu aplikaciju.
Ti brojevi zaslužuju pažljivo čitanje. Oni ne znače da će svaki podatkovni centar automatski dobiti dvostruko veće performanse u svim scenarijima, nego da je u testnim uvjetima, na zadacima koji nalikuju stvarnim opterećenjima, softverski pristup pametnijoj raspodjeli rada dao vrlo mjerljive rezultate. To je važno zato što se u praksi ulaganja u infrastrukturu često promatraju kroz nabavu nove opreme. Sandook sugerira da se barem dio dobitka može ostvariti i na razini upravljanja postojećim resursima, što je za operatere posebno važno u razdoblju rasta energetskih troškova i pritiska na održivost.
Manje otpada, više iskorištenja
Jedan od najupečatljivijih naglasaka u MIT-ovoj objavi nije samo tehnički, nego i ekonomski i okolišni. Vodeća autorica rada Gohar Irfan Chaudhry upozorila je da se problemi u računalnoj infrastrukturi prečesto rješavaju tako da se jednostavno doda još resursa, premda to dugoročno nije održivo. Takav pristup znači veću potrošnju novca, više potrošenih materijala i kraći efektivni životni vijek skupe opreme koja je već proizvedena. U tom smislu Sandook se uklapa u širi trend tehnoloških rješenja koja ne traže nužno novu generaciju uređaja, nego pokušavaju iz postojećih sustava izvući maksimum prije nego što se posegne za zamjenom.
Za industriju podatkovnih centara to nije marginalna tema. SSD-ovi jesu brzi, ali su i skupi, a na velikim skalama i relativno mala poboljšanja iskorištenosti mogu značiti uštede koje se mjere u znatnim iznosima. Kada se tome doda činjenica da moderni podatkovni centri već nose velik dio tereta digitalne ekonomije, od internetskih usluga do generativne umjetne inteligencije, postaje jasno zašto je svako povećanje efikasnosti zanimljivo i s poslovne i s regulatorne strane. Manje kupnje nove opreme ne znači samo niže kapitalne troškove, nego može značiti i manji ugljični otisak tijekom životnog ciklusa infrastrukture.
Bez specijaliziranog hardvera, ali ne bez ozbiljnog konteksta
Važan element rada jest i tvrdnja da za primjenu pristupa nije potreban specijalizirani hardver. To povećava praktičnu privlačnost rješenja jer mnoga istraživanja ostanu ograničena na laboratorij upravo zato što traže poseban tip opreme ili skupe preinake postojeće infrastrukture. Istodobno, dostupni podaci pokazuju da je Sandook razvijan i evaluiran u ozbiljnom tehničkom okruženju. Na javno dostupnoj GitHub stranici projekta navodi se da su u eksperimentima korišteni NVMe SSD-ovi Samsung PM1725a i Western Digital DC SN200, mrežna kartica Mellanox ConnectX-6 od 100 GbE, procesori Intel Xeon E5-2680 v4 te Ubuntu 23.04 s jezgrom Linuxa 6.5. Takvi detalji ne znače da je rješenje rezervirano samo za identičnu konfiguraciju, ali pokazuju da se ne radi o apstraktnoj simulaciji bez dodira sa stvarnim infrastrukturnim zahtjevima.
Javno objavljeni repozitorij projekta također upućuje na to da istraživači rješenje žele približiti zajednici sustavnih i mrežnih stručnjaka, a ne zadržati ga samo na razini konferencijskog rada. To je relevantno i zato što podatkovni centri često traže tehnologije koje se mogu postupno uvoditi i testirati, a ne samo ideje koje dobro izgledaju na grafikonu. Otvorenost implementacije ne jamči komercijalnu primjenu, ali olakšava tehničku provjeru i usporedbu s drugim pristupima.
Konferencijska potvrda i širi stručni kontekst
Rad pod naslovom
Unleashing the Potential of Datacenter SSDs by Taming Performance Variability prihvaćen je za predstavljanje na USENIX-ovu simpoziju NSDI 2026, jednom od važnijih međunarodnih skupova posvećenih dizajnu i implementaciji umreženih i distribuiranih sustava. Prema službenoj stranici konferencije, NSDI 2026 održava se od 4. do 6. svibnja 2026. u Rentonu u saveznoj državi Washington. Sama činjenica prihvaćanja rada ne znači da je tehnologija već industrijski standard, ali znači da je prošla relevantan stručni postupak odabira unutar zajednice koja se bavi infrastrukturom interneta, oblaka i velikih računalnih sustava.
Dodatnu težinu priči daje i reakcija izvan autorskog tima. MIT prenosi izjavu Josha Frieda, softverskog inženjera u Googleu i budućeg profesora na Sveučilištu Pennsylvania, koji nije sudjelovao u istraživanju. On ocjenjuje da je flash pohrana ključna tehnologija modernih podatkovnih centara, ali da zajedničko dijeljenje tog resursa između radnih opterećenja s vrlo različitim zahtjevima i dalje ostaje otvoren problem. Prema njegovoj procjeni, ovaj rad osjetno pomiče granicu naprijed praktičnim rješenjem spremnim za uvođenje, približavajući flash pohranu njezinu punom potencijalu u proizvodnim oblacima. Takve izjave same po sebi nisu dokaz uspjeha, ali pokazuju da tema ima širi odjek unutar struke.
Što slijedi dalje
Istraživači su najavili da u budućem radu žele iskoristiti nove protokole dostupne na novijim SSD-ovima koji operaterima daju veću kontrolu nad smještajem podataka. Osim toga, žele iskoristiti i predvidljivost opterećenja u sustavima umjetne inteligencije kako bi dodatno povećali učinkovitost rada SSD-ova. To je logičan smjer razvoja jer upravo AI radna opterećenja, s velikim skupovima podataka i intenzivnim izmjenama između pohrane i računalnih resursa, sve snažnije oblikuju infrastrukturu podatkovnih centara. Ako se pokaže da se takva predvidljivost može pretvoriti u još pametnije upravljanje pohranom, Sandook ili slični sustavi mogli bi dobiti još širi prostor primjene.
Istraživanje je, prema MIT-u, financirano djelomično sredstvima američke Nacionalne zaklade za znanost, agencije DARPA i organizacije Semiconductor Research Corporation. U trenutku kada industrija umjetne inteligencije i cloud infrastrukture traži načine kako izdržati rast potražnje bez beskonačnog širenja hardverske baze, ovakvi radovi privlače pozornost upravo zato što nude drukčiji odgovor: ne nužno više strojeva, nego pametnije korištenje onih koji već rade.
Izvori:- MIT News – izvorni članak o sustavu Sandook, autorima istraživanja, rezultatima testiranja i planiranom predstavljanju rada (link)- USENIX NSDI 2026 – službena stranica rada Unleashing the Potential of Datacenter SSDs by Taming Performance Variability s popisom autora i konferencijskim kontekstom (link)- USENIX NSDI 2026 – službena stranica konferencije s datumima i lokacijom održavanja simpozija (link)- GitHub projekt Sandook – javno dostupan repozitorij s tehničkim podacima o testnom okruženju i implementaciji sustava (link)
Kreirano: srijeda, 08. travnja, 2026.
Pronađite smještaj u blizini