Može li mozak učiti brže iz rijetkih događaja nego iz ponavljanja? UCSF-ova studija mijenja pogled na asocijativno učenje
Više od stoljeća, slika Pavlovljeva psa koji nakon zvuka zvonca očekuje hranu služila je kao gotovo školski dokaz da se veza između podražaja i nagrade gradi ponavljanjem. Što je više puta zvuk prethodio hrani, pretpostavljalo se, to je učenje jače i brže. No, novo istraživanje znanstvenika sa Sveučilišta Kalifornije u San Franciscu (UCSF) predlaže drugačiji, za mnoge i provokativan zaključak: broj ponavljanja sam po sebi nije presudan, nego je ključno koliko vremena prođe između nagrada.
Riječ je o radu objavljenom 12. veljače 2026. u časopisu
Nature Neuroscience, u kojem autori tvrde da je asocijativno učenje snažno određeno razmakom između ishoda, odnosno između nagrada. Kada se nagrade nižu preblizu jedna drugoj, mozak iz svake pojedinačne epizode “izvuče” manje. Kada je razmak veći, učenje po pokušaju postaje učinkovitije, čak i ako ukupno ima manje pokušaja.
Od “vježbom do savršenstva” do “tajming je sve”
U klasičnom objašnjenju asocijativnog učenja, životinja (ili čovjek) kroz ponavljanje prepoznaje da određeni znak u okolini najavljuje ishod. U suvremenoj neuroznanosti to se često opisuje i kroz ulogu dopamina: u početku se dopamin pojačano oslobađa kada nagrada stigne, a s vremenom se taj signal “seli” na podražaj koji nagradu najavljuje. Takav pomak dopaminske reakcije tumači se kao mehanizam kojim mozak gradi predviđanja, učvršćuje korisne veze i slabi one koje se ne potvrđuju.
UCSF-ov tim, predvođen neurologom Vijayem Mohanom K. Namboodirijem, želio je provjeriti koliko je taj proces doista vezan uz broj pokušaja. U eksperimentima na miševima koristili su jednostavan zadatak: zvuk (podražaj) najavljuje šećerom zaslađenu vodu (nagradu). Umjesto da mijenjaju “težinu” zadatka ili vrstu nagrade, mijenjali su ono što se često uzima zdravo za gotovo: razmak između pokušaja.
Eksperiment s miševima: manje nagrada, a jednako učenje
U prvoj seriji pokusa istraživači su rasporedili pokušaje tako da je kod jedne skupine razmak bio kratak, približno 30 do 60 sekundi, a kod druge znatno dulji, od pet do deset minuta ili više. Time je nastala situacija koja je, po staroj logici, trebala jasno favorizirati “gusti” raspored: miševi s kratkim razmacima dobivali su mnogo više nagrada u istom vremenskom okviru, jer su mogli proći kroz više pokušaja.
Rezultat je, međutim, išao u suprotnom smjeru. Skupine koje su imale znatno manje pokušaja, ali su nagrade bile razmaknute, učile su jednako brzo u smislu ukupnog vremena potrebnog da pokažu naučeno ponašanje. Drugim riječima, više pokušaja nije značilo proporcionalno brže učenje. Ono što se mijenjalo bio je broj pokušaja potreban da se “uhvati” asocijacija: s duljim razmacima, miševi su trebali daleko manje ponavljanja da bi počeli reagirati na zvuk očekivanjem nagrade.
U objavljenim podacima autori navode da su, primjerice, miševi s razmakom od 600 sekundi između pokušaja naučili u prosjeku u jednocifrenom broju pokušaja, dok je skupini s razmakom od 60 sekundi trebalo višestruko više pokušaja da dođe do istog ishoda. Iako su “rjeđi” pokušaji izgledali kao sporiji put, ukupno vrijeme do pojave naučenog ponašanja bilo je usporedivo.
Dopamin kao “mjerač” vremena između nagrada
Da bi razumjeli što se događa u mozgu, istraživači su pratili dopaminsku aktivnost tijekom učenja. Dopamin se u ovom kontekstu često opisuje kao signal koji pomaže mozgu da ažurira očekivanja: kada se dogodi nešto bolje ili lošije od očekivanog, dopaminski odgovor može “podebljati” ili “stanjiti” vezu između podražaja i ishoda.
U UCSF-ovu modelu, međutim, dopamin ne djeluje samo kao reakcija na iznenađenje, nego i kao dio mehanizma koji uzima u obzir vremenski razmak između nagrada. Kada su nagrade bile rjeđe, dopaminski odgovor na podražaj pojavio se ranije, nakon manje ponavljanja, kao da mozak brže “zaključuje” da znak uistinu nosi informaciju. Kada su nagrade bile česte i nagomilane, mozak je iz svake epizode učio manje, pa je trebalo više ponavljanja da se dopaminski signal stabilno prebaci na podražaj.
Autori to sažimaju tezom da je asocijativno učenje manje “praksa čini savršenim”, a više “tajming je sve”: učinkovitost učenja po pokušaju raste kada je razmak između nagrada veći.
Ne samo razmak, nego i rijetkost nagrade
Zanimljiv dio studije odnosio se na scenarij u kojem je podražaj prisutan redovito, ali se nagrada pojavljuje rijetko. Istraživači su u jednoj varijanti puštali zvuk u razmacima od oko 60 sekundi, ali su šećerom zaslađenu vodu davali samo u približno 10% pokušaja. Taj dizajn oponaša situacije iz stvarnog života u kojima je određeni signal prisutan često, ali se “isplata” događa povremeno i nepredvidivo.
U tom slučaju miševi su počeli oslobađati dopamin nakon zvuka s relativno malim brojem dobivenih nagrada, čak i kada zvuk nije bio praćen nagradom. To je važno jer sugerira da mozak može graditi snažna očekivanja i poticaje na temelju rijetkih, ali “informativnih” ishoda. Takav mehanizam mogao bi objasniti zašto pojedini oblici ponašanja postaju uporni i teško ih je ugasiti, osobito kada su nagrade povremene.
Zašto “štrebanje” često podbaci: moguća veza sa školskim učenjem
Iako se studija bavi osnovnim mehanizmima učenja u mozgu miševa, autori i komentatori ističu potencijalno šire implikacije. Jedna je intuitivna: kada se informacije “naguraju” u kratko vrijeme, poput intenzivnog učenja noć prije ispita, svaka pojedinačna epizoda ponavljanja može imati manji učinak. Suprotno tome, raspoređeno učenje kroz dulje razdoblje daje mozgu vremenski razmak koji, prema ovoj teoriji, povećava količinu “učenja po događaju”.
U praksi, to je blisko onome što obrazovna psihologija već dugo prepoznaje kao učinak raspoređenog učenja. No, UCSF-ov rad pokušava ponuditi precizniji neurobiološki i matematički opis: nije riječ samo o tome da je raspoređivanje “bolje”, nego da se stopa učenja može skalirati s vremenom između nagrada ili ishoda, pri čemu ukupno vrijeme potrebno da se nešto nauči ostaje približno stabilno, a broj ponavljanja varira.
Implikacije za ovisnosti: povremeni “okidači” i trajne navike
Još osjetljivije posljedice tiču se ovisničkih ponašanja. Pušenje je često primjer navike koja uključuje brojne znakove u okolini: miris dima, prizor pakiranja, određeno mjesto ili društvo. Nagrada (nikotin i prateći dopaminski odgovor) ne mora dolaziti u savršeno pravilnim intervalima, nego u stvarnosti može biti povremena, ovisna o situaciji i dostupnosti. Ako mozak doista uči snažnije iz rijetkih, razmaknutih ili nepredvidivih nagrada, to bi moglo pojačavati vezu između takvih znakova i žudnje.
U UCSF-ovu objašnjenju spominje se i zašto bi terapije koje daju kontinuiranu, stabilnu dozu (poput nikotinskih flastera) mogle pomoći nekim ljudima. Ako je dopaminski “potpis” nagrade stalno prisutan i manje vezan uz specifične podražaje, tada se prekida ili slabi asocijacija između znakova i nagrade. Time bi se, barem u teoriji, mogla smanjiti snaga okidača koji inače potiču želju za cigaretom.
Takva interpretacija ne znači da je rješenje univerzalno niti da se ovisnost može svesti na jedan mehanizam. No, daje dodatni okvir za razumijevanje zašto povremeno nagrađivanje i okidači iz okoline mogu biti toliko snažni, te zašto strategije liječenja često pokušavaju promijeniti odnos između znakova, očekivanja i ishoda.
Što to znači za umjetnu inteligenciju: brže učenje iz manje primjera?
Autori rada otvaraju i pitanje može li se ovakav princip prenijeti u sustave umjetne inteligencije. Mnogi suvremeni algoritmi učenja, osobito oni koji se oslanjaju na varijante učenja potkrepljenjem, ažuriraju svoje procjene nakon golemog broja interakcija. Taj “trial-by-trial” pristup podsjeća na stariju pretpostavku o asocijativnom učenju: svaka nova epizoda donosi malu korekciju, a napredak se gradi kroz milijarde ponavljanja.
Ako mozak može povećati stopu učenja po epizodi kada su ishodi rjeđi ili razmaknuti, to sugerira da bi modeli mogli biti učinkovitiji kada bi u samu logiku učenja ugradili vremensku strukturu iskustva. U tom scenariju, sustav bi iz pojedinačnih, “skupljih” događaja izvlačio više informacije, umjesto da se oslanja na beskrajno ponavljanje s minimalnim pomacima. Istraživači pritom naglašavaju da je to smjer za budući rad, a ne gotova receptura: prenošenje bioloških principa u računalne modele traži oprez, testiranje i jasne granice primjenjivosti.
Šire pitanje: koliko je stara teorija doista bila potpuna?
Važno je naglasiti da UCSF-ova studija ne tvrdi da ponavljanje nije važno. U mnogim vještinama ponavljanje gradi automatizam, preciznost i izdržljivost. Ono što se dovodi u pitanje jest jednostavna jednadžba “više pokušaja = brže učenje” u području osnovnog asocijativnog učenja, osobito kada je riječ o povezivanju podražaja i ishoda u relativno kratkim laboratorijskim zadacima.
Rad u
Nature Neuroscience uvodi ideju da mozak prati vremensku “ekonomiju” nagrada: kada se nagrade gomilaju, svaka nosi manju informacijsku vrijednost o uzroku; kada su nagrade razmaknute, mozak svaku epizodu tretira kao važniju za zaključivanje o tome što u okolini doista predviđa ishod. Autori su taj odnos testirali kroz različite intervale i prikazali da se broj pokušaja do učenja može mijenjati približno razmjerno promjeni razmaka, dok ukupno vrijeme do učenja ostaje slično.
Dodatno, rezultati su u radu prošireni i na učenje povezano s neugodnim ishodima, gdje se također vidi da se stopa učenja može skalirati s vremenom između ishoda. To sugerira da princip nije ograničen samo na “slatku” nagradu, nego može imati širu primjenjivost u načinu na koji mozak postavlja očekivanja, bilo da se radi o približavanju nagradi ili izbjegavanju prijetnje.
Što je trenutačno jasno, a što ostaje otvoreno
Prema dostupnim podacima, studija čvrsto pokazuje da u uvjetima kontroliranog zadatka na miševima razmak između nagrada snažno mijenja učinkovitost učenja po pokušaju, uz jasne promjene u dopaminskom signaliziranju. Ono što tek treba razjasniti jest kako se ta pravila preslikavaju na složene ljudske situacije, gdje “nagrada” može biti apstraktna, odgođena ili društveno posredovana, a podražaji višestruki i često nejasni.
Ipak, poruka koja se već sada nameće čitatelju jest praktična i lako razumljiva: nije svako ponavljanje jednako vrijedno. Ako mozak doista uči više kada između “isplata” postoji razmak, tada i učenje, navike i terapije možda treba promatrati kroz prizmu ritma i rasporeda, a ne samo kroz zbroj pokušaja.
Izvori:- UC San Francisco – pregled studije i ključne izjave autora ( UCSF )- Nature Neuroscience – znanstveni rad “Duration between rewards controls the rate of behavioral and dopaminergic learning”, DOI: 10.1038/s41593-026-02206-2 ( Nature Neuroscience (PDF) )- Crossref Crossmark – službeni metapodaci o datumu online objave (12. veljače 2026.) ( Crossmark )
Kreirano: četvrtak, 19. veljače, 2026.
Pronađite smještaj u blizini