Jak mózg wyłuskuje słowa: STG uczy się wzorców i resetu

Jak mózg tnie mowę na słowa: STG uczy się wzorców dźwięku, a szybki „reset” ułatwia rozumienie języka

Photo by: Domagoj Skledar - illustration/ arhiva (vlastita)

Dlaczego w języku ojczystym bez wysiłku rozróżniamy każde słowo, podczas gdy w języku obcym wszystko zlewa się nam w monotonny szum? Pytanie, które dręczy uczących się języków i intryguje naukowców, otrzymało w tych dniach przekonującą odpowiedź neuronaukową. Dwa komplementarne badania z Uniwersytetu Kalifornijskiego w San Francisco (UCSF) odnotowują, po raz pierwszy na tym poziomie szczegółowości, jak zakręt skroniowy górny (STG) w ludzkim mózgu z czasem „uczy się” statystyki i wzorców dźwiękowych języka, na który jesteśmy wystawieni – a następnie, w ułamku sekundy, oznacza, gdzie słowo się zaczyna, a gdzie kończy. Zespół badawczy kierowany przez neurochirurga Edwarda Changa wykazał, że STG reaguje nie tylko na podstawowe głoski (samogłoski i spółgłoski), ale także na kompletne formy wyrazowe oraz na granice między słowami. Kiedy słuchamy języków, które dobrze znamy, w STG zapalają się wyspecjalizowane obwody neuronalne; przy słuchaniu nieznanego języka – te same obwody pozostają „ciemne”.

Autorzy pracy wyjaśniają, że kiedy mówimy w naturalnym tempie, nie zostawiamy przerw między słowami. Mimo to rozmówcy bez wysiłku słyszą wyraźne granice. Do niedawna przypuszczano, że granice rozpoznają części mózgu służące rozumieniu znaczenia, a nie pierwotnemu przetwarzaniu dźwięku. Nowsze odkrycia kierują uwagę na STG – słuchowo–językowe jądro umiejscowione nad płatem skroniowym – które tradycyjnie wiązano z rozpoznawaniem głosek (samogłoski i spółgłoski) oraz cech fonetycznych. Teraz jednak wykazano, że w STG, wraz z latami ekspozycji na język, „odciskają się” jego prawidła fonotaktyczne (co w rzeczywistej mowie jest dozwolone, a co nie), typowe rytmy i częstotliwości słów. Kiedy takie prawidła istnieją w pamięci STG, granice między słowami wyłaniają się niemal „automatycznie”.

Co dokładnie mierzyli badacze i na kim się skupili

W większym z dwóch badań rejestrowano aktywność mózgu 34 ochotników, którzy ze względu na kliniczne monitorowanie padaczki mieli już założone elektrody. Większość jako językiem ojczystym posługiwała się angielskim, hiszpańskim lub mandaryńskim chińskim, a ośmiu uczestników było dwujęzycznych. Wszyscy słuchali zdań w trzech językach – niektórych znanych, niektórych całkowicie nieznanych – podczas gdy badacze analizowali wzorce aktywności w STG za pomocą uczenia maszynowego. Kiedy język był znany, w STG pojawiały się wzmocnione odpowiedzi zgodne z cechami związanymi ze słowami: granice słów, częstotliwość i specyficzne językowo sekwencje dźwięków. Odpowiedzi te nie pojawiały się, gdy badani słuchali języka, którym nie władają. Innymi słowy, STG przetwarza uniwersalne cechy akustyczno–fonetyczne we wszystkich językach, ale dopiero doświadczenie z konkretnym językiem „wzmacnia” sygnały, które towarzyszą słowom tego języka.

Drugie badanie idzie krok głębiej: jak dokładnie STG oznacza początek i koniec słowa? Nagrania o wysokiej rozdzielczości czasowej pokazują charakterystyczny „reset” – krótki, ostry spadek aktywności w momencie, gdy słowo się kończy – po czym populacje neuronalne natychmiast przechodzą w stan gotowości na kolejne słowo. Ten „reboot” musi zachodzić z prędkością kilku razy na sekundę, ponieważ płynna mowa typowo zawiera wiele słów w jednej sekundzie. Właśnie ta dynamika wyjaśnia, jak słuchacz może śledzić mowę bez zwalniania lub utraty wątku, nawet gdy słowa są krótkie lub sklejone przejściami koartykulacyjnymi.

Dlaczego jest to ważne: STG jako most między dźwiękiem a leksyką

W klasycznych modelach słuchania języka zakładano, że STG przetwarza „niższe” poziomy – akustykę i fonetykę – a rozpoznawanie słów i znaczenia należy do „wyższych” obszarów językowych. Nowe odkrycia silnie wspierają inny, rozproszony pogląd: w STG, już w bardzo wczesnej skali czasowej, przelewają się informacje o kompletnych formach wyrazowych (ang. word forms). Innymi słowy, mózg nie czeka na semantykę, aby zdecydować, co jest słowem; już w STG istnieją populacje neuronów, których aktywność pokrywa się z granicami i całymi słowami, a to rozpoznawanie wynika z doświadczenia z dźwiękiem języka. Dlatego segmentacja nie jest tylko skutkiem „rozumienia treści”, ale także rezultatem wieloletniego uczenia się wzorców dźwiękowych.

Ten wgląd precyzyjnie wyjaśnia wrażliwą różnicę między językiem ojczystym a obcym. W języku ojczystym mózg jest „wytrenowany” milionami ekspozycji: rozpoznaje typowe kombinacje spółgłosek i samogłosek, rozkłady długości sylab, a nawet częstotliwość poszczególnych słów. To czyni go szybkim i skutecznym w segmentacji. W języku obcym wszystkie te parametry nie są stabilnie wyuczone, więc STG nie wzmacnia sygnałów w miejscach, gdzie powinny być granice. Rezultatem jest doświadczenie nieprzerwanej taśmy dźwiękowej.

Dwujęzyczność i doświadczenie językowe: czy mózg może mieć dwa „zestawy reguł”?

Uczestnicy, którzy płynnie mówili w dwóch językach, wykazali wzmocnione sygnały granic w obu językach – ale nie w trzecim, nieznanym. Wskazuje to na to, że STG uczy się statystyk specyficznych językowo równolegle dla wielu języków, bez koniecznego mieszania, pod warunkiem, że ekspozycja jest wystarczająca i długotrwała. W praktyce wyjaśnia to, dlaczego zaawansowani dwujęzyczni rozmówcy równie dobrze „słyszą” słowa w obu językach, chociaż ich wzorce fonotaktyczne (reguły dotyczące dozwolonych sekwencji głosek) mogą być bardzo różne. Dla badaczy dwujęzyczności dane te są cenne, ponieważ oferują neurofizjologiczny miernik postępu – zamiast polegania wyłącznie na testach rozumienia, teraz można śledzić także „wzmocnienie granic” w STG jako obiektywny biomarker przyswajania języka.

Metodologia: od ECoG do modeli uczenia maszynowego

Precyzja tych odkryć opiera się na dwóch innowacjach technologicznych. Po pierwsze, wykorzystano wewnątrzczaszkowe nagrania aktywności mózgu (ECoG i pokrewne techniki) u pacjentów, którzy i tak byli pod nadzorem klinicznym. Nagrania te umożliwiają rozdzielczość czasową na poziomie milisekund i rozdzielczość przestrzenną na poziomie milimetrów korowych – co jest nieporównywalnie bardziej szczegółowe niż metody nieinwazyjne. Po drugie, analiza oparła się na modelach uczenia maszynowego, które z nagrań wyodrębniały wzorce związane z segmentacją słów i ze specyficznymi sekwencjami dźwiękowymi znanych języków. W połączeniu, te dwa filary metodologii umożliwiły zarejestrowanie subtelnej dynamiki: momentu spadku aktywności na końcu słowa, prędkości „resetowania” oraz siły odpowiedzi na częste słowa i typowe kombinacje głosowe.

Szczególnie znamienne jest to, że właśnie STG – region, który często opisujemy jako „słuchowy odpowiednik” dla języka – wykazał podwójną rolę: uniwersalne przetwarzanie fonetyczne i specyficzne ślady segmentacji leksykalnej. Fakt, że te ślady wzmacniają się tylko wtedy, gdy słuchamy znanego języka, jest silnym argumentem, że segmentacja jest skutkiem uczenia się, a nie sztywną, wrodzoną cechą.

„Reset” między słowami: dynamika, która umożliwia płynne słuchanie

W drugim badaniu autorzy dokumentują rytm, w jakim STG „resetuje” aktywność na końcu słowa. Na nagraniach widoczny jest ostry spadek, swoisty znacznik granicy, po czym następuje szybkie podniesienie aktywności na początku kolejnego słowa. Tę dynamikę najlepiej można sobie wyobrazić jako wyzwalacz, który dba o to, by przetwarzanie nie przelało się z jednego słowa w kolejne. Bez takiego resetowania granice byłyby „zamglone”, a słuchacz szybko straciłby wątek. Ponieważ przeciętne zdanie zawiera dwa do trzech słów na sekundę, neuronalny system segmentacji musi być wyjątkowo chyży i stabilny jednocześnie.

Poprzez użycie naturalnych narracji, a nie tylko izolowanych słów czy sylab, badacze potwierdzili, że te same wzorce pojawiają się także w rzeczywistych warunkach słuchania. Na poziomie populacji neuronów, STG wykazywał wrażliwość na właściwości kompletnych słów – ich długość, częstotliwość i pozycję w zdaniu – co jest sprzeczne z uproszczonymi modelami, które zakładają wyłącznie przetwarzanie „od litery do słowa”.

Z laboratorium do życia: implikacje dla nauki języków, kliniki i technologii

Nauka języków: Jeśli STG uczy się statystyki dźwięków i granic słów z ekspozycji, rozsądnie jest oczekiwać, że ciągłe słuchanie języka docelowego – zwłaszcza w formie naturalnej mowy – przyspieszy segmentację. Praktycznie oznacza to, że audiobooki, podcasty czy rozmowy z rodzimymi użytkownikami języka to kroki, które „karmią” STG danymi potrzebnymi do rozróżniania słów. Nie chodzi tylko o słownictwo; chodzi o rytm, prozodię i typowe sekwencje głosek.

Klinika: Odkrycia rzucają światło na to, dlaczego uszkodzenia w regionach skroniowych – i to nawet przy zachowanym słuchu – mogą skutkować poważnymi trudnościami w rozumieniu mowy. Jeśli STG nie udaje się segmentować sygnału, osoba może „słyszeć”, ale nie „pojmować” mowy. Może to wyjaśnić objawy niektórych afazji oraz pomóc w planowaniu zabiegów neurochirurgicznych i rehabilitacji.

Technologia rozpoznawania mowy: Porównanie z dzisiejszymi modelami automatycznego rozpoznawania mowy (ASR) nasuwa się samo. Współczesne sieci neuronowe coraz częściej wykorzystują kompozycję – od dźwięku ku fonemom, od fonemów ku słowom – ale najlepsze systemy uczą się też bezpośrednich reprezentacji słów. Odkrycia z STG sugerują, że systemy ASR mogłyby zyskać na jawnych mechanizmach „resetowania” na granicach słów i na uczeniu się specyficznych językowo reguł fonotaktycznych, tak jak ludzki mózg.

Jak mózg „wie”, gdzie jest granica słowa? Mała szkoła fonotaktyki

Granice słów nie są tylko funkcją pauz – często pauz w ogóle nie ma. Zamiast tego segmentacja opiera się na szeregu reguł i regularności. Na przykład w wielu językach pewne kombinacje spółgłosek prawie nigdy nie zaczynają słowa, ale często pojawiają się wewnątrz słowa; STG, pod wpływem doświadczenia, zaczyna wzmacniać sygnały właśnie w miejscach, gdzie statystycznie granica jest najbardziej pewna. Podobną rolę odgrywają też częstotliwość słów (częste słowa szybciej „wyskakują”) oraz prozodia – akcent i rytm – które na poziomie fizjologicznym pomagają w predykcji granic.

Taki „alfabetyzm statystyczny” STG nie oznacza, że segmentacja jest wyłącznie bottom-up. Przeciwnie, autorzy podkreślają, że wczesne przetwarzania akustyczne i wyższe procesy językowe odbywają się w pętli. Lecz kluczową nowością jest to, że już na poziomie STG obecna jest informacja o kompletnych słowach, która nie zależy od znaczenia, lecz od wzorca dźwięku, którego mózg nauczył się przez lata ekspozycji.

Dlaczego język obcy „brzmi jak jedna długa litera” – i jak to przezwyciężyć

Kiedy po raz pierwszy słuchamy języka obcego, nie mamy niezawodnej mapy dozwolonych sekwencji i typowych granic. Skutkiem jest to, że STG nie wzmacnia sygnałów w „właściwych” miejscach, więc słuchamy ciągłego potoku, którego nie jest łatwo „pociąć” na słowa. Dobra wiadomość: w miarę jak ekspozycja rośnie, STG dostosowuje swoje wagi neuronalne – przejmuje nowe statystyki fonotaktyczne i zaczyna wbudowywać granice. Z tego wynika też praktyczna rekomendacja dla nauki języka: obfite, różnorodne i regularne słuchanie autentycznego materiału, nawet bez pełnego rozumienia znaczenia, może przyspieszyć segmentację i w konsekwencji ułatwić naukę słownictwa.

Granice słów poprzez języki: co jest wspólne, a co odmienne

W badaniu wybrano angielski, hiszpański i mandaryński, ponieważ oferują ciekawe spektrum właściwości fonologicznych i prozodycznych. Angielski jest znany z łączenia złożonych grup spółgłosek i zmiennego akcentu; hiszpański jest bardziej rytmiczny, z wyraźniejszymi granicami sylabicznymi; mandaryński to język tonalny, w którym wysokość tonu niesie informacje różnicujące. Mimo tych różnic, STG wykazał wspólną wrażliwość na podstawowe, „fonetyczne” cechy we wszystkich językach – lecz wzmocnienie na granicach i na słowach pojawiło się wyłącznie, gdy znamy język. U uczestników dwujęzycznych wzmocnienie było widoczne w obu językach, co potwierdza, że mózg może utrzymywać wiele „zestawów reguł” bez wzajemnego konfliktu.

Wywnioskowane nauki dla nauczania i programów nauczania

Pedagogicznie rzecz biorąc, odkrycia sugerują, że nauka słuchania powinna uwypuklić kroki, które wspomagają segmentację. Obejmuje to pracę z krótkimi, naturalnymi wycinkami, przy progresywnym zmniejszaniu wsparcia (transkryptów, śladów wizualnych), oraz ćwiczenia ukierunkowane na typowe sekwencje głosek i wzorce prozodyczne języka docelowego. Przydatne są też aktywności dwufazowe: najpierw „słuchaj bez rozumienia” w celu kalibracji STG, a następnie obróbka znaczenia. Tak wspiera się oba komponenty – statystyczne uczenie się dźwięku i rozumienie semantyczne.

Od 7 do 19 listopada 2025: oś czasu publikacji

Mowa o dwóch publikacjach opublikowanych w połowie listopada 2025: artykule w czasopiśmie Neuron (7 listopada 2025), który dokumentuje dynamikę kodowania kompletnych form wyrazowych i resetowania na granicach, oraz artykule w Nature (19 listopada 2025), który rozdziela wspólne i specyficzne językowo komponenty przetwarzania w STG, włączając w to wzmocnione sygnały na granicach słów w języku ojczystym (lub dobrze znanym). Obie prace są wiodące w ambitnej linii badawczej koordynowanej przez neurochirurga Edwarda Changa, a publikacjom towarzyszą też streszczenia na stronach uniwersyteckich oraz w serwisach naukowych.

Komu te odkrycia mogą pomóc już teraz

Klinicystom, którzy planują i przeprowadzają operacje w pobliżu STG, ponieważ precyzyjniejsza mapa funkcji zmniejsza ryzyko pooperacyjnych trudności z rozumieniem mowy. Logopedom i zespołom rehabilitacyjnym, które kształtują interwencje dla pacjentów z uszkodzeniami regionów skroniowych. Metodykom i nauczycielom języków, którzy strukturyzują ćwiczenia słuchowe z naciskiem na segmentację. Inżynierom, którzy obmyślają systemy rozpoznawania mowy i narzędzia translatorskie, ponieważ STG oferuje biologiczną inspirację dla lepszych algorytmów.

Czego jeszcze nie wiemy – i dokąd idą kolejne kroki

Chociaż wyniki są silne, otwarte pozostają pytania: na ile „reset” jest uniwersalny poprzez różne typy rozmówców i warunki nagrywania? Jak STG dziecka nabywa te reguły we wczesnych latach – czy droga jest taka sama jak u dorosłego ucznia języka obcego, czy istnieje okres krytyczny? Jak szybko STG może „przetrenować się” na nową fonotaktykę przy intensywnym zanurzeniu w języku? I wreszcie, czy można celowanym usprawnianiem (np. stymulacją nerwów obwodowych, o czym istnieją eksperymenty) przyspieszyć przyswajanie segmentacji?

Praktyczne porady w świetle nowych spostrzeżeń

Przyspiesz ekspozycję na dźwięk języka. Codzienne słuchanie naturalnej mowy (podcasty, radio, rozmowy) „karmi” STG wzorcami potrzebnymi do segmentacji.
Ćwicz z transkryptami, ale stopniowo je wycofuj. Najpierw słuchaj z tekstem w celu stabilizacji wzorca, następnie usuwaj oparcie i testuj „tylko słuch”.
Skup się na rytmie i typowych sekwencjach głosek. Krótkie ćwiczenia rozpoznawania typowych początków/końców słów wzmacniają wrażliwość na granice.
Używaj wielu rozmówców i rejestrów. Różnorodność „trenuje” STG, by odróżniał niezmienne reguły od idiosynkratycznych stylów.

Krótko mówiąc: nowe prace przynoszą neurologiczne podłoże dla doświadczenia, które wszyscy mamy – język ojczysty słyszymy jako ciąg wyraźnych słów, dlatego że nasz STG przez lata nauczył się statystyki jego dźwięku. Język obcy nie różni się dlatego, że jest nielogiczny lub „trudny”, ale dlatego, że nasz mózg jeszcze nie nauczył się jego reguł segmentacji. Na szczęście STG jest plastyczny: przy wystarczającej ekspozycji, także ten język zaczyna „rozplątywać się” w rozpoznawalne słowa – i to o wiele szybciej niż myślimy.

Znajdź nocleg w pobliżu

Czas utworzenia: 26 listopada, 2025

Jak mózg tnie mowę na słowa: STG uczy się wzorców dźwięku, a szybki „reset” ułatwia rozumienie języka

Co dokładnie mierzyli badacze i na kim się skupili

Dlaczego jest to ważne: STG jako most między dźwiękiem a leksyką

Dwujęzyczność i doświadczenie językowe: czy mózg może mieć dwa „zestawy reguł”?

Metodologia: od ECoG do modeli uczenia maszynowego

„Reset” między słowami: dynamika, która umożliwia płynne słuchanie

Z laboratorium do życia: implikacje dla nauki języków, kliniki i technologii

Jak mózg „wie”, gdzie jest granica słowa? Mała szkoła fonotaktyki

Dlaczego język obcy „brzmi jak jedna długa litera” – i jak to przezwyciężyć

Granice słów poprzez języki: co jest wspólne, a co odmienne

Wywnioskowane nauki dla nauczania i programów nauczania

Od 7 do 19 listopada 2025: oś czasu publikacji

Komu te odkrycia mogą pomóc już teraz

Czego jeszcze nie wiemy – i dokąd idą kolejne kroki

Praktyczne porady w świetle nowych spostrzeżeń

Znajdź nocleg w pobliżu

Redakcja nauki i technologii

Wydarzenia Chorwacja

Rekordowy Nowy Rok na Lošinj: 4 648 gości i 17 128 noclegów pokazują wzrost zimowej turystyki na wyspie

Toast na Nowy Rok 2026 w Novi Vinodolski: powitanie w południe zgromadziło tysiące w centrum miasta i domknęło Novi Advent

Dziecięce powitanie Nowego Roku w południe 31 grudnia 2025 r. na Zamku Trsat w Rijece z Klaunem Markiem i fajerwerkami balonów

Rijeka szykuje powitanie Nowego Roku 2026: Korzo, Gat Advent, Trsat i Export Ice Box z całodziennym programem

Sylwester dla dzieci na Zamku Trsat: balony, maskotki i południowe odliczanie dla najmłodszych i ich rodzin

Toast za Nowy Rok w Novi Vinodolski: muzyka, łyżwy i specjały myśliwskie na południowe powitanie w sercu miasta

Zima na Gradini: Family Day zamienił Zamek Trsat w czarodziejską scenę adwentową dla całej rodziny

Gat Advent w Rijece: muzyka, program rodzinny i świąteczne przeżycia na Nabrzeżu Wrażeń przy morzu dla wszystkich pokoleń

Jak mózg tnie mowę na słowa: STG uczy się wzorców dźwięku, a szybki „reset” ułatwia rozumienie języka

Co dokładnie mierzyli badacze i na kim się skupili

Dlaczego jest to ważne: STG jako most między dźwiękiem a leksyką

Dwujęzyczność i doświadczenie językowe: czy mózg może mieć dwa „zestawy reguł”?

Metodologia: od ECoG do modeli uczenia maszynowego

„Reset” między słowami: dynamika, która umożliwia płynne słuchanie

Z laboratorium do życia: implikacje dla nauki języków, kliniki i technologii

Jak mózg „wie”, gdzie jest granica słowa? Mała szkoła fonotaktyki

Dlaczego język obcy „brzmi jak jedna długa litera” – i jak to przezwyciężyć

Granice słów poprzez języki: co jest wspólne, a co odmienne

Wywnioskowane nauki dla nauczania i programów nauczania

Od 7 do 19 listopada 2025: oś czasu publikacji

Komu te odkrycia mogą pomóc już teraz

Czego jeszcze nie wiemy – i dokąd idą kolejne kroki

Praktyczne porady w świetle nowych spostrzeżeń

Znajdź nocleg w pobliżu

Powiązane