A tárgyas egyeztetés ingadozásai a magyarban Peredy Márta 2009. december 8.
(1a) A nyelvészeket a nyelvi jelenségek érdeklik. (1b) Bizonyos nyelvészeket a nyelvi jelenségek érdekelnek. (1c) Bizonyos nyelvészeket a nyelvi jelenségek érdeklik. Piros határozott Zöld határozatlan aláhúzott tárgy
0. Célok 1. A jelenség létezik. 2. A megfigyelt ingadozási jelenség nehézséget jelent a generatív, a moduláris, a kompetencia/performancia megkülönböztetéssel élő modellek számára. 3. A jelenség modellezésére egy nem moduláris, sztochasztikus modellt javaslok, mely a mondatokat valószínűségekkel jellemzi.
0. Célok 1. A szintaktikai egyeztetési szabály 2. A teszt és az adatok 3. A jelenséget befolyásoló tényezők 4. Maximális Entrópia Modell 4.1. Szimulációk 4.2. Eredmények 5. Még meglepőbb tényezők
0. Célok 1. A szintaktikai egyeztetési szabály 2. A teszt és az adatok 3. A jelenséget befolyásoló tényezők 4. Maximális Entrópia Modell 4.1. Szimulációk 4.2. Eredmények 5. Még meglepőbb tényezők
1. A szintaktikai egyeztetési szabály Bartos (2000:746): (I) Az ige tárgyas ragozású, ha tárgya DP kategóriájú. Problémák: a. 1., 2. személyű személyes névmások, b. datívuszos birtokos: (2a) Falcsik Marinak tanultuk egy/néhány/minden/ø versét. - specifikus - van DP (2b) Falcsik Marinak tanultunk egy versét. - nem-specifikus - nincs DP Csakhogy: (2c) *Megtanultuk egy verset a kettő közül.
1. A szintaktikai egyeztetési szabály c. nominatívuszi birtokos (3) Láttuk Péter/öt férfi minden/néhány/három fiát. - hatóköri érv, de a D fejbe nem feltétlenül +def jegyű elem kerül! - A D-t az alatta lévő AgrP spec-jének a spec-jében lévő elem (pl. számnév) kimozgatásával töltjük ki. d. nem-referenciális az (4a) Azt mondasz, amit akarsz. (4b) Azt mondod, amit gondolsz. - azért nincs D, mert nincs +def jegy c. d.
1. A szintaktikai egyeztetési szabály e. A kérdőszó kimozgatása hogy-os tagmondatból (5a) Kit x szeretnél, hogy megverjek t x? Bartos (2000) (164a) (5b)?Kit x szeretnél, hogy megverjem pro x? (165a-c) (5c)?Kit x szeretnéd azt, hogy megverjek t x? (5d) *Kit x szeretnéd azt, hogy megverjem pro x? (6) Pétert x szeretnéd, hogy megverjem t x? +/-def kifejezés nyoma +/-def. f. Kálmán (2009): minden 'every'+sorszámneves tárgy. határozott/határozatlan egyeztetés aránya ~ 50-50% (7a) Minden tizedik műtétet hazánkban végeznek/végzik. (7b) Vigyük/Vigyünk ki minden tizedik széket!
1. A szintaktikai egyeztetési szabály Újabb problémák: Agrammatikus példák: Mindenkit, aki épp nem nyaral és van kedve egy nyáresti koncerthez, régi és új versekkel, szeretettel várjuk! - Göncölszekér együttes hírlevele Nem tudtam, másokat mennyire érintette mélyen az, hogy gyerekkorában milyen mesék, könyvek, képregények, filmek vették körül. - sokmindenmas.freeblog.hu A dokk.hu fenntartja magának a jogot, hogy az oldalra nem illő, célkitűzéseinek nem megfelelő profilt és anyagot önkényesen, előzetes bejelentés nélkül töröljön. - dokk.hu
1. A szintaktikai egyeztetési szabály Újabb problémák II.: É. Kiss K. sz. k.: (8a)?Mindegyik fiú minden lányt felkérte táncolni. (5a)-szerű elemzés: (8b)?Mindegyik fiú minden lányt x felkérte pro x táncolni. DE: (8c)??Minden fiú minden lányt felkérte táncolni. Az alany határozottságának is szerepe van!
1. A szintaktikai egyeztetési szabály Újabb problémák III.: p abs 15 A férfiakat bizonyos viselkedésformák taszítják. 95% 16 A férfiakat bizonyos viselkedésformák taszítanak. 58% 25 Az ás fiúkat egyes bés fiúk verik. 89% 26 Az ás fiúkat egyes bés fiúk vernek. 30%! 65 Egyes matematikusokat a számelméleti problémák foglalkoztatják. 89% 66 Egyes matematikusokat a számelméleti problémák foglalkoztatnak. 42% 73 Egyes nőket a sötét ruhák öregítik. 83% 74 Egyes nőket a sötét ruhák öregítenek. 53%
0. Célok 1. A szintaktikai egyeztetési szabály 2. A teszt és az adatok 3. A jelenséget befolyásoló tényezők 4. Maximális Entrópia Modell 4.1. Szimulációk 4.2. Eredmények 5. Még meglepőbb tényezők
50 mondatpár, a párok csak az ige határozottságában különböznek. 37 tesztalany olvasási teszt 2. A teszt és az adatok A mondatok sorrendje véletlenszerű (a párok tagjai el voltak szakítva egymástól, minden alany más sorrendet kapott) Lehetséges ítéletek: 0 rossz mondat, 1 fura mondat, vacillálok, 2 jó mondat A mondatokat az alanyok maguknak olvasták fel, és azonnal megítélték őket (a teszt utasítása szerint).
2. A teszt és az adatok Elfogadhatósági ráta abszolút/percepciós (p abs ): minden mondatra függetlenül számítható, az alanyok ítéleteinek átlaga %-ban kifejezve. relatív (p rel ): mondatpáronként számított érték: p rel (+def)+p rel (-def)=100%, p rel (-def)/p rel (+def)=p abs (-def)/p abs (+def) produkciós (p prod ): az alanyonként számított relatív értékek átlaga
2. A teszt és az adatok Az információs szerkezet: Általában az ige (vagy ha van, akkor az igemódosító) az információs (nem kontrasztív) fókusz. Kivétel: az univerzális kvantoros mondatok (V. csoport). A mondatok természetessége: nyilvánvalóan befolyásolja az ítéleteket. a relatív és a produkciós ráták (részben) kompenzálják az ebből fakadó hibát (pl. (79-80)).
2. A teszt és az adatok A csoportok I. csoport: O +def,pl S -def,pl V II. csoport: O +def,sg S barenp,sg V III. csoport: O +def,sg S -def,sg V IV. csoport: O -def,pl S +def,pl V V. csoport: O +/-def,sg S +/-def,sg V érdekel VI. csoport: A lányokat egyes fiúk dühítik - minden lehetséges szórend
2. A teszt és az adatok Bizonytalanság és ellentétes ítéletek 40 35 30 bizonytalanság "agrammatikus" ítélet mondatok száma 25 20 15 10 5 Az összes ítélet 9,1% a bizonytalan, 17,5%-a agrammatikus 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95100 adatközlők aránya (%)
0. Célok 1. A szintaktikai egyeztetési szabály 2. A teszt és az adatok 3. A jelenséget befolyásoló tényezők 4. Maximális Entrópia Modell 4.1. Szimulációk 4.2. Eredmények 5. Még meglepőbb tényezők
3. A jelenséget befolyásoló tényezők 1. az alany és a tárgy határozottsága p rel 41 A nőket bizonyos ruhák öregítik. 69% 42 A nőket bizonyos ruhák öregítenek. 31% 73 Egyes nőket a sötét ruhák öregítik. 61% 74 Egyes nőket a sötét ruhák öregítenek. 39% 2. szórend 33 A lányokat egyes fiúk dühítik. 65% 34 A lányokat egyes fiúk dühítenek. 35% 99 Dühítik egyes fiúk a lányokat. 93% 100 Dühítenek egyes fiúk a lányokat. 7%
3. A jelenséget befolyásoló tényezők Szemantikai tényezők (I. csoport) 3. thematikus keret {AG, PAT} vagy {THEME, EXP} korreláció p abs ( gramm ) p abs ( agramm ) p rel PAT/EXP 0,01-0,66 0,64 p abs ( agramm ) 8 A matematikusokat számítástechnikai cégek foglalkoztatnak. 12% 10 A matematikusokat számelméleti problémák foglalkoztatnak. 18%
3. A jelenséget befolyásoló tényezők 4. intranzitív pár (unakkuzatív vagy melléknév) öregít öregszik ; megnevettet nevet korreláció p abs ( gramm ) p abs ( agramm ) p rel intr -0,32 0,35-0,4 5. az alany és a tárgy szerepének felcserélhetősége korreláció p abs ( gramm ) p abs ( agramm ) 5A gyerekeiket egyes szülők verik. 86% 6A gyerekeiket egyes szülők vernek. 6% 25 Az ás fiúkat egyes bés fiúk verik. 89% 26 Az ás fiúkat egyes bés fiúk vernek. 30% p rel felcserélhe -0,03 0,35-0,37
3. A jelenséget befolyásoló tényezők 6. a determináns típusa 7. fonológiai realizáció Erősebb az ingadozás, ha két testes morféma váltakozik (bántanak / bántják, érdekel/érdekli), mint akkor, ha az egyik alak zéró (bántø / bántja). többesszám használata 29 Ezeket a kislányokat egyes idősebb fiúk bántják. 85% 57 Ezt a kislányt minden idősebb fiú bántja. 99% p rel 8. információs szerkezet 9. gyakoriságok, relatív gyakoriságok 10. generikusság
3. A jelenséget befolyásoló tényezők 11. default határozottsági érték? I. csoport vs. IV. csoport Egyes ás fiúkat a bés fiúk vernek. Az ás fiúkat egyes bés fiúk verik. Egyes matematikusokat a számelm. probl.-k foglalkoztatnak. A matematikusokat számelméleti problémák foglalkoztatják. Bizonyos gyerekeket a társasjátékok lekötnek. A gyerekeket bizonyos társasjátékok lekötik. Egyes szülőket a punk zenék idegesítenek. A szülőket egyes punk zenék idegesítik. Egyes diákokat a humán tantárgyak érdekelnek. agramm A diákokat egyes tantárgyak érdeklik. Egyes nőket a sötét ruhák öregítenek. gramm A nőket bizonyos ruhák öregítik. 62% 89% 42% 100% 82% 92% 56% 83% 55% 91% 53% 92% 77% 30% 89% 18% 82% 45% 77% 53% 91% 47% 83% 42% 12. etc.
0. Célok 1. A szintaktikai egyeztetési szabály 2. A teszt és az adatok 3. A jelenséget befolyásoló tényezők 4. Maximális Entrópia Modell 4.1. Szimulációk 4.2. Eredmények 5. Még meglepőbb tényezők
4. Maximális Entrópia Modell Olyan modellt keresünk, amely: egymással ellentétes hatású tényezők együttes hatását vizsgálja, számszerűen is jellemezni tudja a tényezőket (súlyok, rangok), tud mit kezdeni az ingadozással, előrejelzi az egyes alakok valószínűségét. sztochasztikus (de nem feltétlenül OT) modellek
4. Maximális Entrópia Modell Maximum Entropy Model (Goldwater and Johnson 2003) Produkciós interpretáció: Az egyes tényezőkhöz rangokat rendel: r j. Egy adott input-hoz, azaz mondanivalóhoz több lehetséges formai variáns, cand k, tertozhat. c j (cand k, input) jelöli, hogy a k-adik variáns megfelel-e a j-edik tényezőnek. A lehetséges variánsokat a valószínűségükkel jellemzi: p(cand k ). Minden variánsnak nullánál nagyobb a valószínűsége. p cand k = 1 Z exp j r j c j cand k,input Fizikai analógia: Boltzmann-faktor: E= j r j c j cand k,input
0. Célok 1. A szintaktikai egyeztetési szabály 2. A teszt és az adatok 3. A jelenséget befolyásoló tényezők 4. Maximális Entrópia Modell 4.1. Szimulációk 4.2. Eredmények 5. Még meglepőbb tényezők
4.1. Szimuláció A tanuló algoritmus SGA: Stochastic Gradient Ascent for MaxEnt (Jäger 2003) A tesztadatokból meghatározott relatív valószínűségek alapján meghatározza az algoritmus az egyes tényezők súlyát. r i n+ 1 =r i n+1 +η c i h n,input n c i datum n,input n
4.1. Szimuláció A tényezők megfogalmazása a modellben Harmonic Alignment method (Prince and Smolensky 2004): A tényezőket két paraméterhalmaz lehetséges kombinációival adjuk meg 1. halamz: +/-D az ige határozottsága 2. halmaz: a tényezők, melyek befolyásolják +/-do a tárgy határozottsága, +/-ds az alany határozottsága, +/- darg2 az alany és a tárgy közül sorrendben a második hatsága +/-intr az ige intranzitív párjának létezése, +/-pat van-e patiens-szerepű argumentum. Példák: +D/+do az ige határozottságát követeli meg határozott tárgy esetén, Távolság: a tényező megsértésének nagyságával fejezhető ki.
0. Célok 1. A szintaktikai egyeztetési szabály 2. A teszt és az adatok 3. A jelenséget befolyásoló tényezők 4. Maximális Entrópia Modell 4.1. Szimulációk 4.2. Eredmények 5. Még meglepőbb tényezők
4.2. Eredmények 1. kísérlet: V. csoport relatív valószínűségek Mindenkit János érdekli. Mindenkit János érdekel. Jánost mindenki érdekli. Jánost mindenki érdekel. Mindenki Jánost érdekli. Mindenki Jánost érdekel. János mindenkit érdekli. János mindenkit érdekel. Mindenkit mindenki érdekli. Mindenkit mindenki érdekel. Mindenki mindenkit érdekli. Mindenki mindenkit érdekel. Jánost Mari érdekli. Jánost Mari érdekel. János Marit érdekli. János Marit érdekel. 34% 45% adatok 66% 55% 76% 73% MaxEnt 24% 27% 82% 91% 18% 9% 15% 10% 5% 5% 1% 8% 4% 17% 16% 0% 20% 40% 60% 80% 100% 120% 85% 83% 84% 90% 95% 95% 99% 92% 100% 96%
4.2. Eredmények 1. kísérlet: Az egyes tényezők súlya 1 0,5 0-0,5 -D/-do +D/+do +D/+ds -D/-ds +D/-ds -D/+ds -D/+do +D/-do r(-d/-do)=0,72 r(+d/+do)=0,6 r(+d/+ds)=0,31 r(-d/-ds)=0,06-1
4.2. Eredmények Az 1. kísérlet alapján tehető előrejelzések: 1. adatokmaxent 75 Jánost mindenki érdekli. 76% 73% 79 Mindenki Jánost érdekli. 82% 91% 33 A lányokat egyes fiúk dühítik. 65% 91 Egyes fiúk a lányokat dühítik. 88% 2. 75 Jánost mindenki érdekli. 76% 73% 82 Mindenkit János érdekel. 66% 55% Group I +defo -defs +defv Group IV -defo +defs -defv 75% 43%
4.2. Eredmények 2. kísérlet: VI. csoport relatív valószínűségek Dühítenek egyes fiúk a lányokat. Dühítik egyes fiúk a lányokat. Dühítenek a lányokat egyes fiúk. Dühítik a lányokat egyes fiúk. Egyes fiúk dühítenek a lányokat. Egyes fiúk dühítik a lányokat. A lányokat dühítenek egyes fiúk. A lányokat dühítik egyes fiúk. Egyes fiúk a lányokat dühítenek. Egyes fiúk a lányokat dühítik. A lányokat egyes fiúk dühítenek. A lányokat egyes fiúk dühítik. 8% 7% 10% 10% 9% 12% 35% 33% 40% 42% 33% 35% 65% 67% 60% 58% 67% 65% 92% 93% 90% 90% adatok MaxEnt 91% 88% 0% 20% 40% 60% 80% 100%
4.2. Eredmények 2. kísérlet: Az egyes tényezők súlya 2 1,5 1 0,5 0-0,5-1 -1,5-2 +D/+do -D/-ds +D/+darg2 -D/-darg2 +D/-darg2 -D/+darg2 +D/-ds -D/+do r(+d/+darg2)=1,6 r(+d/-darg2)=0,79 r(-d/+do)=0,16 r(-d/-ds)=0,13
4.2. Eredmények 1. 1. kísérlet: Az alany határozottsága is komoly szerepet játszik. 2. 2. kísérlet: Az SO sorrend a természetesebb az ige pozíciójától függetlenül. 3. A specifikussági különbség helyett inkább a thematikus szerepek különbsége (2a) Falcsik Marinak tanultuk egy/néhány/minden/ø versét. - specifikus: kívülről megtanultuk a verset {AG, PAT} (2b) Falcsik Marinak tanultunk egy versét. - nem-specifikus: FM-ról tanultunk az iskolában {EXP, TH}
0. Célok 1. A szintaktikai egyeztetési szabály 2. A teszt és az adatok 3. A jelenséget befolyásoló tényezők 4. Maximális Entrópia Modell 4.1. Szimulációk 4.2. Eredmények 5. Még meglepőbb tényezők
7. Még meglepőbb tényezők Rím és ritmus: 87 Mindenkit mindenki érdekli. 20% 88 Mindenkit mindenki érdekel. 97% 89 Mindenki mindenkit érdekli. 5% 90 Mindenki mindenkit érdekel. 89% 75 Jánost mindenki érdekli. 95% 76 Jánost mindenki érdekel. 30% 45 Jánost minden érdekli. 91% 46 Jánost minden érdekel. 50%
References Bartos, H. 2000 Az inflexiós jelenségek szintaktikai háttere. In: Strukturális Magyar Nyelvtan 3. Morfológia. Akadémiai Kiadó Goldwater, S. and Johnson, M. 2003 Learning OT constraint rankings using a maximum entropy model. In: Jennifer Spenader, Anders Eriksson, and Östen Dahl (eds.) Proceedings of the Stockholm Workshop on Variation within Optimality Theory, 111-120. Stockholm University. Jäger, G. 2003 Maximum entropy models and Stochastic Optimality Theory. Manuscript, University of Potsdam. ROA 625-1003. Kálmán, L. 2009. április 7., Az analógiás nyelvelmélet (és számítógépes modellezésének első lépései), RIL HAS Prince, A. and P. Smolensky. 1993 Optimality Theory. Ms., Rutgers University., 136 o. Rebrus, P. 2009. március 10., Paradigmák és alakváltozatok a magyarban, RIL HAS