A szavak feldolgozása Ladányi Enikő eladanyi@cogsci.bme.hu
Mentális lexikon A szavak fejünkben tárolt reprezentációi A reprezentációk különböző információkat kódolnak a szavakról: Forma (hangzó, írott) Nyelvtani szerep (szófaj, tőtípus) Utalás a világra Képek és fogalmak Kapcsolat más szavakkal
A mentális szótár kutatásának területei Szavak felismerése és hozzáférés Szótár és nyelvtan viszonya Szótár szerveződése Szókincs elsajátítása
A mentális lexikon kísérleti vizsgálati módszerei Vizuális bemutatás Kiolvasás (különböző hosszúságú bemutatással; 50-250 ms) Önütemezett olvasás Szemmozgáskövetés Lexikális döntési feladat Akusztikus bemutatás Szófelismerés Gating Gyakoriság, kiejthetőség és egyéb nem vizsgált, de a lexikális folyamatokat befolyásoló tényezők kontrollálása fontos!!!
kommunikáció
konceptualitás
A mentális lexikon kísérleti vizsgálati módszerei Vizuális bemutatás Kiolvasás (különböző hosszúságú bemutatással; 50-250 ms) Önütemezett olvasás Szemmozgáskövetés Lexikális döntési feladat Akusztikus bemutatás Szófelismerés Gating Gyakoriság, kiejthetőség és egyéb nem vizsgált, de a lexikális folyamatokat befolyásoló tényezők kontrollálása fontos!!!
A mentális lexikon kísérleti vizsgálati Priming módszerei Előfeszítő inger célinger Ha kapcsolat van a kettő között, a RI lerövidül vagy megnő a semleges feltételhez képest Manipulált tényezők Az ingerek közti viszony Az előfeszítő inger bemutatási ideje Az előfeszítő és a célinger között eltelt idő Van-e maszkolás
Priming típusai Ismétléses priming(asztal asztal) Facilitáció, órákon keresztül fennmaradhat Nagyobb hatás a ritka szavakra Formai előfeszítés (kaland kalap) Nehéz kimutatni, gátlást és facilitációt is találtak már Idői manipulációkon, maszkoláson is erősen múlik Szemantikai Automatikusan tovaterjedő aktiváció a szavak közötti kapcsolatok alapján a szemantikai hálóban vs. integrációs folyamatok során megjelenő automatikus facilitáció, gátlás Szemantikai kapcsolat (kutya-emlős; jelentés kapcsolódása) vs. asszociatív kapcsolat (kutya-ugat; együtt előfordulás) Morfológiai (üvegben boltban) nehéz elválasztani a formai és jelentésalapú primingtól; kontrollfeltételek!
Mutatók: fixációk helyzete időtartama szekvenciája Olvasási vizsgálatok Feldolgozás: Foveális: fixációpontja körüli 2 fok (1 fok kb. 4 karakter) Parafoveális: fixációs pont mindkét oldalán 5-5 fok Periféria: minden ezen kívül
A szemmozgásvizsgálatok kérdései Milyen fajta információt szereztünk (vonás, ortográfiai, fonológiai, szemantikai) Mikor szerezzük ezt az információt (parafoveálisan, foveálisan, szakkádprogram elindítása előtt/után) Hogyan hozunk olyan döntéseket, hogy mikor és hova irányuljanak a szemmozgások
A szemmozgásvizsgálatok előnyei 1.Szemmozgások részei a normális olvasásnak, személyeknek nem kell olyan dolgot tenniük, ami megzavarná az olvasást 2. Egy szó szövegbeli feldolgozása tükröződik a fixációs idejében.
Szemmozgások az olvasásban http://www.youtube.com/watch?v=vfizdzwdf-0 A szemmozgások nem simák; rövid, kb. 200 msec fixációk, amelyeket szakkádok és regresszív fixációk szakítanak meg Minden fixációalatt balra kb. 4 karakter jobbra pedig kb. 14 karakterből emelünk ki információt The quick brown fox jumped over the lazy dog. Aztán szakkád kb. 8 karakterrel jobbra; a fixációk átfedésben vannak Fixációk 10-15%-a regresszív
Szemmozgások az olvasásban Nem minden szót olvasunk el Általában a tartalmas szavaknak kb. 80%-ára fixálunk Funkciószavaknál ez az arány még kisebb, rövid szavakat valószínűbben ugorjuk át, 8 karakter vagy annál hosszabb szót szinte soha nem ugorjuk át Gyorsolvasásnál is Carpenter és Just (1981) a fixációk hossza a szóhosszúsággal nő és a szógyakorisággal csökken
Módszertani megfontolások Perceptuális terjedelem: ha egy szónál többet fognánk be egyszerre, akkor nem lenne olyan hasznos menetközbeni technika, mert nem tudnánk, melyik szót pontosan mennyi ideig és mikor dolgozzuk fel Fixáció nem mondja meg, hogy ezen belül mikor történik meg a szófelismerés, ebben segíthet pl. EKP Nem tudjuk pontosan, hogy mi viszi előre a szemeket a szövegben
Szemmozgások az olvasásban Az eddigi bizonyítékok inkább a magasabbszintű, kognitív szemmozgáskontrollmellett szólnak: lexikális hozzáférés szükséges a szemmozgások elindításához DE már a szakkád előtt is elkezdődhet a következő DE már a szakkád előtt is elkezdődhet a következő szó feldolgozása
Szemmozgások az olvasásban Parafoveális-előzetes előny(parafoveal preview benefit): mielőtt egy szóra fixálunk, az előző szóra fixálva parafoveálisan látjuk, és ez kb. 20 ms feldolgozási előnyt jelent Túlcsordulási hatás (Overfloweffect): ritka szó után következő szóra is hosszabb a fixáció(mert annyi figyelem az első szóra, hogy nincs előzetes előny)
A szavak előhívása a szótárból Sok tízezer szó közül gyors előhívás Az előhívás gyorsaságát befolyásolja: Gyakoriság Korpuszok alapján Szóalak gyakorisága (felszíni gyakoriság) vs. tőgyakoriság/szuffixumgyakoriság Előfordulási gyakoriság (token) vs. típusgyakoriság (type) korpuszalapú vs. szubjektív gyakoriság jól korrelálnak szószablya szóalakokra, listákra, szófajokra, szótagszerkezetre, morfológiai elemzés szerinti keresés
Elsajátítási életkor hatása erősen együtt jár a gyakorisággal Szóhosszúság hatása interakció a gyakorisággal (minél gyakoribb, annál rövidebb a szó) Nyelvtani kategória Elvontság Szomszédság nagysága ellentétes eredmények
A lexikon pszicholingvisztikaimodelljei Logogén modell (John Morton, 1969) külön akusztikus és vizuális bemeneti utak + központi modalitásfüggetlen szóalakreprezentációk= logogének, amelyekhez a kognitív rendszerben rendelődik hozzá a jelentés
DE nincs modalitásközipriming(winnick& Daniel, 1970) 1979-es Morton: modalitásfüggőtárak, vizuális és auditív logogének megértés és produkció eltérő lexikális utakkal négyszeres tárolás szeriálismodellel nem magyarázható hatások (pl. szóelsőbbségi hatás (szóban előbb beazonosítunk betűket, mint álszavakban (Wheeler, 1970), mondatokban is szavakat (Marslen- Wilson, 1975)) a 79-es modellben top-down, a kognitív rendszerről a logogénekre visszaható kapcsolat
Szakaszmodell (Marslen-Wilson, 1975) Auditív szófelismerési modell Nagy bemeneti jelölthalmaz, majd fokozatos szelekció Elérési szakasz: jelöltlista aktiválódása Szelekciós szakasz: végső elem kiválasztódik Integrációs szakasz: jelentés és szintaktikai jegyek integrálódása Interaktív A szelekciós szakaszban szerepet játszanak kontextusból eredő top-down hatások Későbbi modell szt csak az integrációs szakaszban
Konnekcionista modellek Szavak: címkézetlenek, együtt előfordulásokon alapuló hálózat részei Teljes áthallás a szintek között, nincsenek hierarchikus szótári viszonyok elemzési szintek között állandó facilitációsill. gátló viszonyok
Interaktív aktivációs és versengési modell (IAC; Rumelhart& McClelland, 1982) http://www.youtube.com/watch?v=4odq9pdiz1k Három réteg -betűelemek, betűk és szavak egységei és köztük lévő gátló és serkentő kapcsolatok magyarázza a szóelsőbbségi hatást
TRACE (1986 McClelland&Elman, 1986) ugyanúgy háromrétegű a konnekcionistamodell akusztikus feldolgozási változata elsődleges perceptuális feldolgozásra hatnak a lexikális hatások, szófeldolgozást mondatszintű tényezők is befolyásolják
Morfológiai feldolgozás Egészleges tárolás (asztalaitokon) Komplex alakoknak is külön hozzáférési reprezentációja van Gyors hozzáférés, de nagy tárhelyigény(különösen a morfológiailag komplex nyelvekben, mint a magyar) új alakok felismerése és létrehozása analógiásan mehet végbe
Analitikus megközelítés (asztal, -a, -i, -tok, -on) külön elemző mechanizmus felelős a komplex alakok kezeléséért Tárolt tő + szabályrendszer tárkapacitás szempontjából gazdaságosabbak, de a nyelvtant megvalósító új kombinációs mechanizmus evolúciósan költséges
Vegyes modell Mindkét fajta működés lehetséges, különféle szempontokon múlik, hogy melyik alapján történik a feldolgozás
Morfológiai feldolgozás Kísérleti vizsgálat Lexikális döntés: ha hosszabb feldolgozási idő a többmorfémás szavaknál elemzés Priming: ha előfeszíx a toldalékolt alak a tövet elemzés udvaron udvar Gyakorisági hatások egészleges tárolás esetén az alak gyakorisága hat a feldolgozási időre, analitikus feldolgozás esetén a tő gyakorisága
Analitikus modellek Taft & Forster(1975, 1976, Taft 1981) tovább tart nem-et nyomni egy létező prefixumból és létező tőből összerakott nem létező kombinációra (kirémül), mint ahol az egyik nem létező tő (kilebbez) hozzáférési reprezentáció is morfémákra bontoy, így éri el a központi lexikont ha nem létezik olyan tő, akkor már a hozzáférési reprezentációnál kiderül, hogy nem szó
Egészleges modellek Butterworth(1983) Minden szóhoz egészben férünk hozzá és így is reprezentáljuk, vagyis még a központi szinten sincs morfológiai szerkezet Produktivitásimegszorítás:az új szavakat hogyan ismerjük fel? egy szabályalapú back-up mechanizmust feltételez, ami beugrik ha egy új szóval találkozik Gazdag morfológia: mi a helyzet a magyarral, finnel, törökkel, ahol a ragozott alakok száma lexémánként több ezer lehet?
Egészleges modellek Lukatela et al(1987): szatellita-modell strukturált egészleges tárolás minden alaknak van külön reprezentációja, de a toldalékolt alakok szatellitakéntkapcsolódnak a tőhöz a toldalékolt szavakhoz is a tövön keresztül férünk hozzá
Vegyes modellek Pinker(1991) Szabályosak: klasszikus szimbólummanipuláló szabály, amely hozzárak egy affixumot a tövet képviselő változóhoz Kivételesek memorizált szópárok (az asszociatív emlékezetben tárolt kapcsolatok, amelyeknek emlékezeti tulajdonságaik (gyakorisági és hasonlósági hatások) vannak II Procedurális/deklaratív modell (Ullman) Szabályalapú rendszer Mentális nyelvtan Procedurális memória Egyedi alapú rendszer Lexikon Deklaratív memória
Vegyes modellek AAM (AugmentedAddressedMorphology) (Caramazza et al., 1988) Egész szó és morfémákra bontott reprezentáció is Pl., walkedaktiválja: /walk/ /ed/ és /walked/ Minden ismerős szóhoz az egész szavas úton férünk hozzá a dekompozícióscsak új (ismeretlen) szavak esetén
Vegyes modellek MRM (Morphological Race Model) Schreuder & Baayen(1995) Egész szó és morfémákra bontott reprezentáció is Pl. walkedaktiválja: /walk/ /ed/ és /walked/ A két úton egyszerre próbálkozik a felismerés Párhuzamos kétutas modell A tő és affixum tulajdonságaitól függ, hogy melyik nyer, e.g., gyakoriság, szemantikai, fonológiai áttetszőség, affixhomonímia stb
A feldolgozást befolyásoló szószintű tényezők Szemantikai áttetszőség Marslen-Wilson et al. (1994): szemantikailag áttetsző szavaknál dekompozíció Baayen, Burani & Schreuder (1997): a szemantikailag transzparens komplex szavaknál is lehetséges holisztikus feldolgozás szemanxkai áttetszőség szükséges feltétele a morfémaalapú hozzáférésnek, de nem következik belőle az elemzés Forster & Azuma (2000): nem transzparens pároknál is történhet dekompozíció(szignifikáns maszkolt priming submit-remitjellegű párokra) -> nem biztos, hogy szemantikai transzparencia kell a dekompozícióhoz
A feldolgozást befolyásoló szószintű tényezők Gyakoriság legrobosztusabb,stabil és jól dokumentált hatás Taft (1979): kumulatív tőgyakoriság befolyásolja a ragozott igék feldolgozását:a szó+abból származó összes alak összegzett gyakoriságának van hatása Baayen et al. (1997): kumulatív tőgyakoriság befolyásolja az egymorfémás (egyes számú) főnevek feldolgozását a hollandban Sereno & Jongman (1997): felszíni gyakoriság (a szóalak gyakorisága) befolyásolja a ragozott főnevek feldolgozását (angolban) egész szavas hozzáférés ragozott alakokra is
A feldolgozást befolyásoló morféma szintű tényezők A toldalékolt szavak affixtulajdonságai Affixhossz és affixgyakoriság: hosszú és gyakori affixumok valószínűbben használatosak az elemzésben, mint a rövidebbek és ritkábbak (áttekintés Laudanna & Burani, 1995) Affix produktivitás: a produktív(abb) affixumokvalószínűbb feldolgozási egységek Affixhomonímia: Bertram et al. (2000c) holland er ~, ágentívjelölő 'werker' [dolgozó] and és középfok 'mooier' [szebb], holisztikus feldolgozáshoz vezet