Revolucionarni iskorak u kemijskom inženjerstvu i farmaceutskoj industriji dogodio se zahvaljujući timu znanstvenika s uglednog Massachusetts Institute of Technology (MIT). Razvili su napredni računalni model temeljen na strojnom učenju koji s dosad neviđenom preciznošću može predvidjeti topljivost gotovo bilo koje molekule u različitim organskim otapalima. Ovo postignuće obećava korjenite promjene u procesima dizajniranja i sinteze novih lijekova, istovremeno otvarajući vrata primjeni ekološki prihvatljivijih i manje opasnih kemikalija u industriji.
Sposobnost predviđanja kako će se i u kojoj mjeri neka tvar otopiti u određenom otapalu ključan je, a često i ograničavajući, korak u gotovo svakoj kemijskoj sintezi. Odabir pravog otapala može značiti razliku između uspješnog i neuspješnog eksperimenta, učinkovite i neučinkovite proizvodnje, a u konačnici i između brzog razvoja novog lijeka i dugotrajnog procesa punog slijepih ulica. Novi model s MIT-a izravno se bavi ovim izazovom, pružajući kemičarima moćan alat za donošenje informiranih odluka.
Problem topljivosti kao ključna prepreka
Topljivost, definirana kao maksimalna količina tvari (otopljenika) koja se može otopiti u određenoj količini otapala na zadanoj temperaturi, desetljećima predstavlja jedan od središnjih problema u kemiji. Tradicionalno, određivanje topljivosti bio je mukotrpan proces koji se oslanjao na metodu pokušaja i pogrešaka, zahtijevajući brojne laboratorijske eksperimente. Takav pristup ne samo da usporava istraživanje i razvoj, već i troši značajne resurse i generira kemijski otpad.
Stariji modeli za predviđanje topljivosti, poput poznatog Abrahamovog modela solvatacije, temeljili su se na zbrajanju doprinosa pojedinih kemijskih struktura unutar molekule kako bi se procijenila njezina ukupna topljivost. Iako su takvi alati bili korisni, njihova je točnost bila ograničena i često nedovoljna za složene molekule kakve se koriste u modernoj farmaciji. Predviđanje topljivosti stoga je ostalo usko grlo u planiranju sinteze i proizvodnji kemikalija, posebice lijekova.
Lucas Attia, jedan od vodećih autora studije i diplomski student na MIT-u, naglašava važnost ovog problema: "Predviđanje topljivosti doista je korak koji ograničava brzinu u sintetskom planiranju i proizvodnji kemikalija. Zbog toga već dugo postoji ogroman interes za razvojem boljih modela za njezino predviđanje."
Utjecaj strojnog učenja i naprednih algoritama
Novi model, nazvan FastSolv, izrastao je iz projekta na kojem su Attia i njegov kolega Jackson Burns radili u sklopu kolegija o primjeni strojnog učenja na probleme kemijskog inženjerstva. Za razliku od prethodnih metoda, FastSolv koristi snagu umjetne inteligencije za analizu golemih količina podataka i učenje suptilnih obrazaca koji upravljaju interakcijama između molekula otopljenika i otapala.
Tim je za treniranje svojih modela iskoristio nedavno objavljenu bazu podataka BigSolDB, sveobuhvatnu kompilaciju podataka iz gotovo 800 znanstvenih radova. Ova baza sadrži informacije o topljivosti za otprilike 800 različitih molekula u više od 100 organskih otapala koja se najčešće koriste u sintetskoj kemiji, s preko 40.000 pojedinačnih podatkovnih točaka.
Znanstvenici su testirali dva različita pristupa. Prvi, nazvan FastProp, koristi takozvane "statičke ugradnje" (static embeddings), gdje model unaprijed poznaje numerički prikaz svake molekule. Drugi, ChemProp, uči te numeričke prikaze tijekom samog procesa treniranja, istovremeno povezujući značajke molekule s topljivošću. Oba modela predstavljaju molekularne strukture kao složene numeričke vektore, svojevrsne "digitalne otiske" koji obuhvaćaju informacije o broju i vrsti atoma te vezama među njima. To omogućuje algoritmu da "razumije" kemiju na način koji nadilazi ljudsku intuiciju.
Iznenađujući rezultati i neviđena točnost
Nakon treniranja na opsežnoj bazi podataka, modeli su testirani na setu od oko 1.000 molekula koje nisu bile uključene u proces učenja. Rezultati su bili impresivni. Novi modeli pokazali su se dva do tri puta točnijima od prethodnog najnaprednijeg modela, nazvanog SolProp, koji je također razvijen u laboratoriju profesora Williama Greena 2022. godine.
Posebno je značajna sposobnost novih modela da precizno predvide kako promjene temperature utječu na topljivost, što je ključan parametar u realnim industrijskim uvjetima. "Sposobnost točne reprodukcije malih varijacija u topljivosti uzrokovanih temperaturom, čak i kada je sveukupni eksperimentalni šum vrlo velik, bio je iznimno pozitivan znak da je mreža ispravno naučila temeljnu funkciju predviđanja topljivosti," objašnjava Burns.
Jedno od najvećih iznenađenja bilo je otkriće da su oba modela, FastProp i ChemProp, postigla gotovo identične performanse. Istraživači su očekivali da će ChemProp, koji uči reprezentacije molekula "u hodu", biti superioran. Njihov podjednak uspjeh snažno sugerira da glavno ograničenje u daljnjem poboljšanju točnosti nije arhitektura modela, već kvaliteta i konzistentnost dostupnih podataka za treniranje. Razlike u eksperimentalnim metodama i uvjetima u različitim laboratorijima unose varijabilnost koja predstavlja najveći izazov.
Revolucija u farmaciji i potraga za zelenijim otapalima
Praktične primjene ovog modela su dalekosežne. Farmaceutska industrija, koja se neprestano suočava s izazovom formulacije novih lijekova, jedan je od najočitijih korisnika. Mnoge potencijalno ljekovite molekule nikada ne dođu na tržište jer ih je izuzetno teško otopiti na način prikladan za primjenu u ljudskom tijelu. FastSolv omogućuje znanstvenicima da već u ranoj fazi razvoja predvide probleme s topljivošću i odaberu najperspektivnije kandidate.
Jednako važan je i ekološki aspekt. Mnogi od najučinkovitijih i najčešće korištenih organskih otapala, poput dimetilformamida (DMF) ili diklormetana (DCM), predstavljaju značajnu opasnost za ljudsko zdravlje i okoliš. Poznati su kao toksični, kancerogeni ili štetni za reproduktivni sustav. Zbog toga regulatorne agencije i same kompanije sve više ograničavaju njihovu upotrebu.
"Postoje otapala za koja se zna da otapaju gotovo sve. Iznimno su korisna, ali su štetna za okoliš i ljude, pa mnoge tvrtke zahtijevaju da se njihova upotreba svede na minimum", ističe Jackson Burns. "Naš je model izuzetno koristan u identificiranju sljedećeg najboljeg otapala, onog koje je, nadamo se, puno manje štetno."
Istraživački tim, koji uz spomenute uključuje i profesora Patricka Doylea te Williama Greena, direktora Energetske inicijative MIT-a, odlučio je svoj model učiniti javno dostupnim. Zbog veće brzine i jednostavnijeg koda za prilagodbu, verzija temeljena na FastProp algoritmu, nazvana FastSolv, već je dostupna znanstvenoj zajednici i industriji. Nekoliko vodećih farmaceutskih kompanija već ga je počelo implementirati u svoje procese istraživanja i razvoja, što potvrđuje njegovu neposrednu relevantnost i potencijal da transformira način na koji se kemija primjenjuje u praksi.
Kreirano: četvrtak, 21. kolovoza, 2025.