A szavak feldolgozása. Ladányi Enikő eladanyi@cogsci.bme.hu



Hasonló dokumentumok
Vizuális nyelv. Olvasás és írás. Ellis, W. (2004) Olvasás, írás és diszlexia október

A morfoszintaxis és a prototípusok. Bevezetés a társas-kognitív nyelvészetbe Fehér Krisztina április 11.

A megértés folyamata

Lexikon és nyelvtechnológia Földesi András /

Gyakorisági hatások és nyelvi kétértelműségek vizsgálata a mentális szótárban magyar nyelven

Az elme szótára (Aitchinson, 1994)

Nyelvelemzés sajátkezűleg a magyar INTEX rendszer. Váradi Tamás varadi@nytud.hu

Nyelv. Kognitív Idegtudomány kurzus, Semmelweis Egyetem Budapest, Created by Neevia Personal Converter trial version

10. Morfológia és statisztikai grammatika Morfémák és variációszámok

ALAKTAN ELŐADÁS 1-2. Alaktan, morfológia tárgya. Morfológia és mondattan viszonya. Morfológia univerzalitása. A szó fogalma I. Alaktan belső ügyei

A Mazsola KORPUSZLEKÉRDEZŐ

Motiváció Eszközök és eljárások Eredmények Távlat. Sass Bálint

Legalábbis az ötvenes évek második felétõl, Chomsky fellépése óta feltételezzük,

Felhasználói interakciók elemzése szemmozgáskövetéssel. Az emberi szem felépítése Szemmozgás-követés működése Történelem Esettanulmányok Gyakorlat

Tartalom-visszamondások szerveződése felolvasás után

A megértés folyamata Lukács Ágnes

A LEXIKÁLIS HOZZÁFÉRÉS ÚTJAI AZ ELS! ÉS A MÁSODIK NYELV ESETÉBEN

13. A szótár pszicholingvisztikája*

VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY Szerkesztette: Tanács Attila. Vincze Veronika

1. ábra. modularista elképzelés. Forrás: Pléh (1998)

Nehogy a nyúl visz a puska! Mondat ez? Bizonyára te is látod,

ÉRZELEM ÉS MEGISMERÉS A KOGNITÍV MODELLEKBEN (ÉS A BETEGSÉGEKBEN)

Olvasás-szövegértés fejlesztése. Ötletek saját gyakorlatból, az OFI újgenerációs olvasókönyvéhez kapcsolódva (1.osztály)

Doktori téma A lényegesség mérése Kutatóeszköz Alkalmazás Befejezés. Sass Bálint

A megértés folyamata Lukács Ágnes


Egyirányban láncolt lista

Beszédfeldolgozási zavarok és a tanulási nehézségek összefüggései. Gósy Mária MTA Nyelvtudományi Intézete

Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György

WOHLMUTH KATA. 1. Bevezetés

és a két kvantoros mondatok: válaszidő és

2006. szeptember 28. A BESZÉDPERCEPCI DPERCEPCIÓ. Fonetikai Osztály

GONDOLKODÁS ÉS NYELV

A szóhasonlóság mértékének tesztelése CVCVC szerkezetű hangkivető főnevekkel. Rung András BME Fizikai Intézet

Az emberi emlékezet BME- 2008/2009; Tavaszi félév Albu Mónika malbu&cogsci.bme.hu

Morfológia. Cser András

KREPSZ VALÉRIA. A különböző előhívási formák szerepe a mentális lexikon vizsgálatában nyár I I I 161 I I I. Magyar nyelv és irodalom BA.

Mi a morfológia? Morfológia. Tudnivalók: Mi van a szavakban?

WISC-IV Intelligencia teszt bemutatása esetismertetéssel

THUMA ORSOLYA * A mentális lexikon szervezıdése

SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Fejlesztési terv I. Nagycsoportos óvodás gyermek általános, gyógypedagógiai, éves fejlesztési terve

Klasszikus héber nyelv 4.: Szintaxis

A Hunglish Korpusz és szótár

Sémi összehasonlító nyelvészet

Sass Bálint MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola

A munka empirikus része 8 vizsgálatot, s tucatnyi adatelemzést tartalmaz. Bizonyos vizsgálati anyagokat ugyanis több szempontból elemez.

A KIPRÓBÁLÁSTÓL AZ ÁTDOLGOZÁSIG

Zárójelentés. A vizuális figyelmi szelekció plaszticitása Azonosító: K 48949

Az emberi információfeldolgozás modellje. Az emberi információfeldolgozás modellje. Alakészlelés. Más emberek észlelése.

Látás Nyelv - Emlékezet

Nyelvtörténet: a szociolingvisztika és a pszicholingvisztika keresztmetszetében

Kognitív megközelítés

Szerkezetek és kategóriák. Szerkezetek és kategóriák. Szerkezetek és kategóriák. Szerkezetek és kategóriák

Az afázia elmélete és terápiás gyakorlatai

3./ szemantikai határozatlanság (nagybácsi, nagynéni, szomszéd, asztal)

Mazsola mindenkinek. Sass Bálint MTA Nyelvtudományi Intézet január 18. MSZNY 2018, Szeged

A szóképzés. A szóalkotásnak az a módja, amikor a szótőhöz egy képző hozzájárulásával új szó jön létre.

A HUNGLISH PÁRHUZAMOS KORPUSZ

Szemmozgáskövetés: Bepillantás a mondatok megértésének folyamataiba. Káldi Tamás MTA NYTI, BME Pszichológia Doktori Iskola

A tanulás s az ember legnagyobb. Gondolkodás nélkül tanulni: kárba veszett munka. De tanulás nélkül gondolkodni veszélyes ( Konfucius )

Pléh Csaba A lélek és a nyelv Budapest: Akadémiai Kiadó, p. Bodnár Ildikó

A vonzatosság alternatív felfogása

Önálló labor feladatkiírásaim tavasz

Bevezetés a nyelvtudományba Alaktan

A Z O LV A S Á S TA N U L Á S É S A F O N O L Ó G I A I T U D AT O S S Á G K A P C S O L ATA

LiLe projekt: Adatbázis mint dinamikus korpusz

Kapcsolatok kialakulása és fennmaradása klaszterek tudáshálózataiban

Látás Nyelv - Emlékezet

Zsemlyei János A MAI MAGYAR NYELV SZÓKÉSZLETE ÉS SZÓTÁRAI

Szintaxis: elemzések. Nyelvészet az informatikában informatika a nyelvészetben november 6.

MŰVELTSÉGTERÜLET OKTATÁSA TANTÁRGYI BONTÁS NÉLKÜL AZ ILLYÉS GYULA ÁLTALÁNOS ISKOLA 5. A OSZTÁLYÁBAN

A beszédstílus meghatározó tényezői és temporális jellemzői

HELYI TANTERV NÉMET NYELV. I. idegen nyelv. 4. évfolyam 6. évfolyam 8. évfolyam 10. évfolyam 12. évfolyam. nem A1 A2 B1 mínusz B1 megadható

SOFI EGYMI ÁRAMLIK A BESZÉD Konferencia november 14.

A TABUSZAVAK GÁTLÓ HATÁSÁNAK ÖSSZEHASONLÍTÁSA FIGYELMI-

A digitális korszak kihívásai és módszerei az egyetemi oktatásban

Óvodás és kisiskolás gyermekek interpretált beszédének vizsgálata

DSD. Szkennelt szövegek digitalizálása során keletkező hibák elemzése magyar szövegek esetében. Pataki Máté Tóth Zoltán MTA SZTAKI DSD

A KÉTNYELVŰ MENTÁLIS LEXIKON ÉS MŰKÖDÉSE (kísérletes nyelvészeti közelítés)

Eötvös Loránd Tudományegyetem Bölcsészettudományi Kar DOKTORI DISSZERTÁCIÓ CSISZÁR ORSOLYA

DID deutsch- institut, Hamburg

Fejlesztő tevékenység tapasztalatai. Október: Rövid terjedelmű figyelme behatárolja az észlelés pontosságát, terjedelmét.

Bevezetés. Problémák, hipotézisek, modellek

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

2

középső o Nyelv eleje magasabban magas hátulja magasabban mély o Ajak kerekítés (labiális) rés (illabiális) o Hossz rövid hosszú Mássalhangzók o Idő

A magyar írás és olvasás tanítása az alfabetizálás folyamata

Segédanyagok. Formális nyelvek a gyakorlatban. Szintaktikai helyesség. Fordítóprogramok. Formális nyelvek, 1. gyakorlat

Az adatbázisrendszerek világa

TARTALOM A KUTYA VISELKEDÉSKUTATÁSÁNAK TÖRTÉNETE ÉS ELMÉLETI ALAPVETÉSEI

Algoritmusok és adatszerkezetek 2.

MAGYAR NYELV ÉS IRODALOM

MAGYAR NYELV ÉS IRODALOM 5-8. MAGYAR NYELV. 5. évfolyam

Magyar nyelvtan tanmenet 4. osztály

A szótárról. 1. Mi ez?

Az angol progresszív aspektus elsajátítása

Általános Pszichológia. Érzékelés Észlelés

Számítógépes nyelvészet

Az emberi információfeldolgozás modellje. Az emberi információfeldolgozás modellje (továbbgondolás) Mintázatfelismerés kontextusfüggő észlelés

Átírás:

A szavak feldolgozása Ladányi Enikő eladanyi@cogsci.bme.hu

Mentális lexikon A szavak fejünkben tárolt reprezentációi A reprezentációk különböző információkat kódolnak a szavakról: Forma (hangzó, írott) Nyelvtani szerep (szófaj, tőtípus) Utalás a világra Képek és fogalmak Kapcsolat más szavakkal

A mentális szótár kutatásának területei Szavak felismerése és hozzáférés Szótár és nyelvtan viszonya Szótár szerveződése Szókincs elsajátítása

A mentális lexikon kísérleti vizsgálati módszerei Vizuális bemutatás Kiolvasás (különböző hosszúságú bemutatással; 50-250 ms) Önütemezett olvasás Szemmozgáskövetés Lexikális döntési feladat Akusztikus bemutatás Szófelismerés Gating Gyakoriság, kiejthetőség és egyéb nem vizsgált, de a lexikális folyamatokat befolyásoló tényezők kontrollálása fontos!!!

kommunikáció

konceptualitás

A mentális lexikon kísérleti vizsgálati módszerei Vizuális bemutatás Kiolvasás (különböző hosszúságú bemutatással; 50-250 ms) Önütemezett olvasás Szemmozgáskövetés Lexikális döntési feladat Akusztikus bemutatás Szófelismerés Gating Gyakoriság, kiejthetőség és egyéb nem vizsgált, de a lexikális folyamatokat befolyásoló tényezők kontrollálása fontos!!!

A mentális lexikon kísérleti vizsgálati Priming módszerei Előfeszítő inger célinger Ha kapcsolat van a kettő között, a RI lerövidül vagy megnő a semleges feltételhez képest Manipulált tényezők Az ingerek közti viszony Az előfeszítő inger bemutatási ideje Az előfeszítő és a célinger között eltelt idő Van-e maszkolás

Priming típusai Ismétléses priming(asztal asztal) Facilitáció, órákon keresztül fennmaradhat Nagyobb hatás a ritka szavakra Formai előfeszítés (kaland kalap) Nehéz kimutatni, gátlást és facilitációt is találtak már Idői manipulációkon, maszkoláson is erősen múlik Szemantikai Automatikusan tovaterjedő aktiváció a szavak közötti kapcsolatok alapján a szemantikai hálóban vs. integrációs folyamatok során megjelenő automatikus facilitáció, gátlás Szemantikai kapcsolat (kutya-emlős; jelentés kapcsolódása) vs. asszociatív kapcsolat (kutya-ugat; együtt előfordulás) Morfológiai (üvegben boltban) nehéz elválasztani a formai és jelentésalapú primingtól; kontrollfeltételek!

Mutatók: fixációk helyzete időtartama szekvenciája Olvasási vizsgálatok Feldolgozás: Foveális: fixációpontja körüli 2 fok (1 fok kb. 4 karakter) Parafoveális: fixációs pont mindkét oldalán 5-5 fok Periféria: minden ezen kívül

A szemmozgásvizsgálatok kérdései Milyen fajta információt szereztünk (vonás, ortográfiai, fonológiai, szemantikai) Mikor szerezzük ezt az információt (parafoveálisan, foveálisan, szakkádprogram elindítása előtt/után) Hogyan hozunk olyan döntéseket, hogy mikor és hova irányuljanak a szemmozgások

A szemmozgásvizsgálatok előnyei 1.Szemmozgások részei a normális olvasásnak, személyeknek nem kell olyan dolgot tenniük, ami megzavarná az olvasást 2. Egy szó szövegbeli feldolgozása tükröződik a fixációs idejében.

Szemmozgások az olvasásban http://www.youtube.com/watch?v=vfizdzwdf-0 A szemmozgások nem simák; rövid, kb. 200 msec fixációk, amelyeket szakkádok és regresszív fixációk szakítanak meg Minden fixációalatt balra kb. 4 karakter jobbra pedig kb. 14 karakterből emelünk ki információt The quick brown fox jumped over the lazy dog. Aztán szakkád kb. 8 karakterrel jobbra; a fixációk átfedésben vannak Fixációk 10-15%-a regresszív

Szemmozgások az olvasásban Nem minden szót olvasunk el Általában a tartalmas szavaknak kb. 80%-ára fixálunk Funkciószavaknál ez az arány még kisebb, rövid szavakat valószínűbben ugorjuk át, 8 karakter vagy annál hosszabb szót szinte soha nem ugorjuk át Gyorsolvasásnál is Carpenter és Just (1981) a fixációk hossza a szóhosszúsággal nő és a szógyakorisággal csökken

Módszertani megfontolások Perceptuális terjedelem: ha egy szónál többet fognánk be egyszerre, akkor nem lenne olyan hasznos menetközbeni technika, mert nem tudnánk, melyik szót pontosan mennyi ideig és mikor dolgozzuk fel Fixáció nem mondja meg, hogy ezen belül mikor történik meg a szófelismerés, ebben segíthet pl. EKP Nem tudjuk pontosan, hogy mi viszi előre a szemeket a szövegben

Szemmozgások az olvasásban Az eddigi bizonyítékok inkább a magasabbszintű, kognitív szemmozgáskontrollmellett szólnak: lexikális hozzáférés szükséges a szemmozgások elindításához DE már a szakkád előtt is elkezdődhet a következő DE már a szakkád előtt is elkezdődhet a következő szó feldolgozása

Szemmozgások az olvasásban Parafoveális-előzetes előny(parafoveal preview benefit): mielőtt egy szóra fixálunk, az előző szóra fixálva parafoveálisan látjuk, és ez kb. 20 ms feldolgozási előnyt jelent Túlcsordulási hatás (Overfloweffect): ritka szó után következő szóra is hosszabb a fixáció(mert annyi figyelem az első szóra, hogy nincs előzetes előny)

A szavak előhívása a szótárból Sok tízezer szó közül gyors előhívás Az előhívás gyorsaságát befolyásolja: Gyakoriság Korpuszok alapján Szóalak gyakorisága (felszíni gyakoriság) vs. tőgyakoriság/szuffixumgyakoriság Előfordulási gyakoriság (token) vs. típusgyakoriság (type) korpuszalapú vs. szubjektív gyakoriság jól korrelálnak szószablya szóalakokra, listákra, szófajokra, szótagszerkezetre, morfológiai elemzés szerinti keresés

Elsajátítási életkor hatása erősen együtt jár a gyakorisággal Szóhosszúság hatása interakció a gyakorisággal (minél gyakoribb, annál rövidebb a szó) Nyelvtani kategória Elvontság Szomszédság nagysága ellentétes eredmények

A lexikon pszicholingvisztikaimodelljei Logogén modell (John Morton, 1969) külön akusztikus és vizuális bemeneti utak + központi modalitásfüggetlen szóalakreprezentációk= logogének, amelyekhez a kognitív rendszerben rendelődik hozzá a jelentés

DE nincs modalitásközipriming(winnick& Daniel, 1970) 1979-es Morton: modalitásfüggőtárak, vizuális és auditív logogének megértés és produkció eltérő lexikális utakkal négyszeres tárolás szeriálismodellel nem magyarázható hatások (pl. szóelsőbbségi hatás (szóban előbb beazonosítunk betűket, mint álszavakban (Wheeler, 1970), mondatokban is szavakat (Marslen- Wilson, 1975)) a 79-es modellben top-down, a kognitív rendszerről a logogénekre visszaható kapcsolat

Szakaszmodell (Marslen-Wilson, 1975) Auditív szófelismerési modell Nagy bemeneti jelölthalmaz, majd fokozatos szelekció Elérési szakasz: jelöltlista aktiválódása Szelekciós szakasz: végső elem kiválasztódik Integrációs szakasz: jelentés és szintaktikai jegyek integrálódása Interaktív A szelekciós szakaszban szerepet játszanak kontextusból eredő top-down hatások Későbbi modell szt csak az integrációs szakaszban

Konnekcionista modellek Szavak: címkézetlenek, együtt előfordulásokon alapuló hálózat részei Teljes áthallás a szintek között, nincsenek hierarchikus szótári viszonyok elemzési szintek között állandó facilitációsill. gátló viszonyok

Interaktív aktivációs és versengési modell (IAC; Rumelhart& McClelland, 1982) http://www.youtube.com/watch?v=4odq9pdiz1k Három réteg -betűelemek, betűk és szavak egységei és köztük lévő gátló és serkentő kapcsolatok magyarázza a szóelsőbbségi hatást

TRACE (1986 McClelland&Elman, 1986) ugyanúgy háromrétegű a konnekcionistamodell akusztikus feldolgozási változata elsődleges perceptuális feldolgozásra hatnak a lexikális hatások, szófeldolgozást mondatszintű tényezők is befolyásolják

Morfológiai feldolgozás Egészleges tárolás (asztalaitokon) Komplex alakoknak is külön hozzáférési reprezentációja van Gyors hozzáférés, de nagy tárhelyigény(különösen a morfológiailag komplex nyelvekben, mint a magyar) új alakok felismerése és létrehozása analógiásan mehet végbe

Analitikus megközelítés (asztal, -a, -i, -tok, -on) külön elemző mechanizmus felelős a komplex alakok kezeléséért Tárolt tő + szabályrendszer tárkapacitás szempontjából gazdaságosabbak, de a nyelvtant megvalósító új kombinációs mechanizmus evolúciósan költséges

Vegyes modell Mindkét fajta működés lehetséges, különféle szempontokon múlik, hogy melyik alapján történik a feldolgozás

Morfológiai feldolgozás Kísérleti vizsgálat Lexikális döntés: ha hosszabb feldolgozási idő a többmorfémás szavaknál elemzés Priming: ha előfeszíx a toldalékolt alak a tövet elemzés udvaron udvar Gyakorisági hatások egészleges tárolás esetén az alak gyakorisága hat a feldolgozási időre, analitikus feldolgozás esetén a tő gyakorisága

Analitikus modellek Taft & Forster(1975, 1976, Taft 1981) tovább tart nem-et nyomni egy létező prefixumból és létező tőből összerakott nem létező kombinációra (kirémül), mint ahol az egyik nem létező tő (kilebbez) hozzáférési reprezentáció is morfémákra bontoy, így éri el a központi lexikont ha nem létezik olyan tő, akkor már a hozzáférési reprezentációnál kiderül, hogy nem szó

Egészleges modellek Butterworth(1983) Minden szóhoz egészben férünk hozzá és így is reprezentáljuk, vagyis még a központi szinten sincs morfológiai szerkezet Produktivitásimegszorítás:az új szavakat hogyan ismerjük fel? egy szabályalapú back-up mechanizmust feltételez, ami beugrik ha egy új szóval találkozik Gazdag morfológia: mi a helyzet a magyarral, finnel, törökkel, ahol a ragozott alakok száma lexémánként több ezer lehet?

Egészleges modellek Lukatela et al(1987): szatellita-modell strukturált egészleges tárolás minden alaknak van külön reprezentációja, de a toldalékolt alakok szatellitakéntkapcsolódnak a tőhöz a toldalékolt szavakhoz is a tövön keresztül férünk hozzá

Vegyes modellek Pinker(1991) Szabályosak: klasszikus szimbólummanipuláló szabály, amely hozzárak egy affixumot a tövet képviselő változóhoz Kivételesek memorizált szópárok (az asszociatív emlékezetben tárolt kapcsolatok, amelyeknek emlékezeti tulajdonságaik (gyakorisági és hasonlósági hatások) vannak II Procedurális/deklaratív modell (Ullman) Szabályalapú rendszer Mentális nyelvtan Procedurális memória Egyedi alapú rendszer Lexikon Deklaratív memória

Vegyes modellek AAM (AugmentedAddressedMorphology) (Caramazza et al., 1988) Egész szó és morfémákra bontott reprezentáció is Pl., walkedaktiválja: /walk/ /ed/ és /walked/ Minden ismerős szóhoz az egész szavas úton férünk hozzá a dekompozícióscsak új (ismeretlen) szavak esetén

Vegyes modellek MRM (Morphological Race Model) Schreuder & Baayen(1995) Egész szó és morfémákra bontott reprezentáció is Pl. walkedaktiválja: /walk/ /ed/ és /walked/ A két úton egyszerre próbálkozik a felismerés Párhuzamos kétutas modell A tő és affixum tulajdonságaitól függ, hogy melyik nyer, e.g., gyakoriság, szemantikai, fonológiai áttetszőség, affixhomonímia stb

A feldolgozást befolyásoló szószintű tényezők Szemantikai áttetszőség Marslen-Wilson et al. (1994): szemantikailag áttetsző szavaknál dekompozíció Baayen, Burani & Schreuder (1997): a szemantikailag transzparens komplex szavaknál is lehetséges holisztikus feldolgozás szemanxkai áttetszőség szükséges feltétele a morfémaalapú hozzáférésnek, de nem következik belőle az elemzés Forster & Azuma (2000): nem transzparens pároknál is történhet dekompozíció(szignifikáns maszkolt priming submit-remitjellegű párokra) -> nem biztos, hogy szemantikai transzparencia kell a dekompozícióhoz

A feldolgozást befolyásoló szószintű tényezők Gyakoriság legrobosztusabb,stabil és jól dokumentált hatás Taft (1979): kumulatív tőgyakoriság befolyásolja a ragozott igék feldolgozását:a szó+abból származó összes alak összegzett gyakoriságának van hatása Baayen et al. (1997): kumulatív tőgyakoriság befolyásolja az egymorfémás (egyes számú) főnevek feldolgozását a hollandban Sereno & Jongman (1997): felszíni gyakoriság (a szóalak gyakorisága) befolyásolja a ragozott főnevek feldolgozását (angolban) egész szavas hozzáférés ragozott alakokra is

A feldolgozást befolyásoló morféma szintű tényezők A toldalékolt szavak affixtulajdonságai Affixhossz és affixgyakoriság: hosszú és gyakori affixumok valószínűbben használatosak az elemzésben, mint a rövidebbek és ritkábbak (áttekintés Laudanna & Burani, 1995) Affix produktivitás: a produktív(abb) affixumokvalószínűbb feldolgozási egységek Affixhomonímia: Bertram et al. (2000c) holland er ~, ágentívjelölő 'werker' [dolgozó] and és középfok 'mooier' [szebb], holisztikus feldolgozáshoz vezet