Beszédpercepció Mády Katalin 2015. február 24.
Mi jellemzi a beszédet? hangképző szervek mozgása artikuláció (biológia, fiziológia, logopédia, orvostudomány), beszédjel fizikai összetétele akusztika (fizika), a beszédjel nyelvi elemekre való fordítása percepció (pszichológia). Percepció fő kérdése: hogyan alakítja át az agy az akusztikai hullámokat nyelvi információvá? Azaz: mi van a fonológiai dekódoló dobozban? És milyen absztrakt egység a doboz kimenete?
Pszichoakusztika A hallás torz, azaz az észlelés nem lineáris. Miért?
A hallószerv anatómiája Frekvenciaérzékelés: a belső fülben levő csigán. Tonotópiás felépítés, azaz szomszédos terület szomszédos frekvenciasávokra érzékeny. Azonos frekvenciasávokhoz eltérő méretű terület van hozzárendelve.
Az észlelés non-linearitása A hallószerv bizonyos frekvenciasávokat felerősítve továbbít a belső fül felé. Legjobb hangerőészlelés 3400 Hz-nél. Észleletalapú mértékegységek: hangerő: phon. Különböző frekvenciájú hangok, amelyeket ugyanolyan hangosnak hallunk. Referencia: 1 khz. hangosságarány: son. Kétszer olyan hangosnak észlelt hang kétszer akkora érték. hangmagasság: mel. 500 Hz fölött az azonos hangközűnek érzékelt frekvenciapárok közötti Hz-ben mért különbség egyre kisebb: egy oktáv: 200/100 Hz = 283/150 mel, 2000/1000 Hz = 1521/1000 mel, 20000/10000 Hz = 3817/3079 mel. kritikus sávok: Bark. Egy bizonyos frekvenciájú szinuszhangot elfed egy széles sávú fehér zaj. Formánsok észlelésénél, pl. egymáshoz közel eső F1 és F2 esetén fontos. További frekvenciafüggő észlelés: tartam. 2 6 khz között már 2 4 ms-nyi szünetet tudunk észlelni, máshol a küszöb akár 22 ms-t is elérhet.
A percepciókutatás nagy kérdései 1. Az emberi agy egyes részei, így például a bal félteke, a nyelvi jelek észlelésére specializálódott. Érvényes-e ez a beszédre is? Elmondható, hogy a beszédészlelés kognitív folyamatai érzékenyebbek az emberi beszéd akusztikumára, mint más hangingerekre? Azaz: létezik-e külön beszédészlelő modul?
A percepciókutatás nagy kérdései 1. Az emberi agy egyes részei, így például a bal félteke, a nyelvi jelek észlelésére specializálódott. Érvényes-e ez a beszédre is? Elmondható, hogy a beszédészlelés kognitív folyamatai érzékenyebbek az emberi beszéd akusztikumára, mint más hangingerekre? Azaz: létezik-e külön beszédészlelő modul? 2. Hogyan lesznek az észlelés során a folytonos akusztikai jelből kategóriák? Szükséges-e egyáltalán a percepcióban kategorizálást feltételezni? Más szóval: a beszédészlelés folytonos vagy kategorikus egységeken alapul?
A percepciókutatás nagy kérdései 1. Az emberi agy egyes részei, így például a bal félteke, a nyelvi jelek észlelésére specializálódott. Érvényes-e ez a beszédre is? Elmondható, hogy a beszédészlelés kognitív folyamatai érzékenyebbek az emberi beszéd akusztikumára, mint más hangingerekre? Azaz: létezik-e külön beszédészlelő modul? 2. Hogyan lesznek az észlelés során a folytonos akusztikai jelből kategóriák? Szükséges-e egyáltalán a percepcióban kategorizálást feltételezni? Más szóval: a beszédészlelés folytonos vagy kategorikus egységeken alapul? 3. Az emberi beszédet nagyfokú variabilitás jellemzi. Léteznek mindennek ellenére állandó, azaz invariáns egységek, amelyek a percepció alapjául szolgálnak, és ha igen, melyek ezek?
A percepciókutatás nagy kérdései 1. Az emberi agy egyes részei, így például a bal félteke, a nyelvi jelek észlelésére specializálódott. Érvényes-e ez a beszédre is? Elmondható, hogy a beszédészlelés kognitív folyamatai érzékenyebbek az emberi beszéd akusztikumára, mint más hangingerekre? Azaz: létezik-e külön beszédészlelő modul? 2. Hogyan lesznek az észlelés során a folytonos akusztikai jelből kategóriák? Szükséges-e egyáltalán a percepcióban kategorizálást feltételezni? Más szóval: a beszédészlelés folytonos vagy kategorikus egységeken alapul? 3. Az emberi beszédet nagyfokú variabilitás jellemzi. Léteznek mindennek ellenére állandó, azaz invariáns egységek, amelyek a percepció alapjául szolgálnak, és ha igen, melyek ezek? 4. Hogyan kapcsolódik a beszédpercepció a nyelvi feldolgozás magasabb kognitív egységeihez?
Speciális beszédmodul: motoros elmélet Beszédképző szervek által létrehozható frekvenciatartományok emberi hallószerv által jól érzékelhető tartományok. Véletlen? Liberman et al. 1967, Liberman & Mattingly 1985, Haskins lab: akusztikai jelből következtetünk a beszélő által megcélzott invariáns gesztusra, és ismeri a módosító okokat (koartikuláció, beszédstílus). Azaz: percepció csak a produkció ismeretében lehetséges speciális beszédmodul. Pl. zöngeképzési gesztus: VOT, zörejengergia, f0-ingadozás, felpattanási energia egyetlen egységben. Pro: ha egy oppozíciót L2-ben nem tudunk produkálni, perceptíven sem észleljük. Kontra: beszédfejlődésben a percepció előbb jár: Nem Tabi, hanem Tabi!, papagáj beszédének megértése. Produkció és percepció interakcióját a tükörneuronok is magyarázhatják.
Kvantális elmélet és LAFF Ellentábor: Stevens 1989, MIT speech lab: artikuláció akusztika percepció közötti összefüggés nem lineáris, hanem kvantális, azaz ugrásszerű. Akusztikai jel invariáns elemei percepciós kategóriák. Pl. /s/ /S/, /b-d-g/ lokuszátmenetei. Lexical Access from Features: absztrakt bináris jegyek, amelyek akusztikai kulcsokban manifesztálódnak invariancia az akusztikumban. Template: sablon, amihez illesztünk, landmark: hirtelen átmenetek, pl. felpattanás. Pro: kézzelfogható egységek. Kontra: eredmények főleg szintetizált anyaggal.
Közvetlen realista elmélet (direct realist theory) Fowler 1986, Browman & Goldstein 1992: artikulációs fonológia alapegysége az artikulációs gesztus percepció invariáns eleme. Azonos artikulációs gesztust nem tudunk megkülönböztetni eltérő fonetikai kontextusokban. Pro & Kontra: motoros elmélet.
H&H elmélet Lindblom 1990: Hyper & Hypo speech, azaz túlartikulált és alulartikulált beszéd. A beszélő a hallgató és a kommunikációs körülményekhez igazítja az artikulációját (zaj, külföldi, gyerek stb.). Releváns információ közvetítése és gazdaságosság egyensúlya.
Példányelmélet (exemplar theory) Nosofsky 1986, Johnson 1997: redundáns információ is szerepet játszik a percepcióban. Goldinger 1996: tíz beszélő, részben hasonló hangúak. Hallott szavak felismerése (hallottuk-e korábban) egy nap múlva jobb, ha hasonló hangú beszélőtől hallottuk. Szófelismerés fehér zajjal maszkolva: még egy hét múlva is jobb, ha hasonló hangú beszélőtől hallottuk. Percepció: hallott elem összevetése tárolt példányokkal. Pro: mindent megmagyaráz. Kontra: falszifikálhatatlan.
Nyommodell (trace model) Magasabb neurális pályák felé továbbított észlelés. McClelland & Elman 1986: háromszintű neurális háló kétirányú átmenetekkel. Bemeneti elem, pl. szókezdő hangok aktiválják az ennek megfelelő lexikális egységeket, nem egyezés esetén módosítják ezek aktivációját (excitáció, inhibíció). Pro: koartikuláció jól beépíthető a modellbe, korrekciós félrehallások magyarázata. Kontra: álszavakat is tudjuk észlelni, pedig nincs nekik megfelelő lexikális egység.