Variation in Hungarian definiteness agreement

Hasonló dokumentumok
A tárgyas egyeztetés ingadozásai a magyarban

Correlation & Linear Regression in SPSS

Cluster Analysis. Potyó László

Angol Középfokú Nyelvvizsgázók Bibliája: Nyelvtani összefoglalás, 30 kidolgozott szóbeli tétel, esszé és minta levelek + rendhagyó igék jelentéssel

PIACI HIRDETMÉNY / MARKET NOTICE

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Nonparametric Tests

Dependency preservation

Társasjáték az Instant Tanulókártya csomagokhoz

Phenotype. Genotype. It is like any other experiment! What is a bioinformatics experiment? Remember the Goal. Infectious Disease Paradigm

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Correlation & Linear. Petra Petrovics.

Sebastián Sáez Senior Trade Economist INTERNATIONAL TRADE DEPARTMENT WORLD BANK

Correlation & Linear Regression in SPSS

ANGOL NYELV KÖZÉPSZINT SZÓBELI VIZSGA I. VIZSGÁZTATÓI PÉLDÁNY

EN United in diversity EN A8-0206/419. Amendment

Supporting Information

On The Number Of Slim Semimodular Lattices

FÖLDRAJZ ANGOL NYELVEN

Klaszterezés, 2. rész

Relative Clauses Alárendelő mellékmondat

Professional competence, autonomy and their effects

VI. Az iskolában. Mit csinálsz az iskolában? Írok, olvasok, rajzolok, tornázom és énekelek. Mettől meddig vagy az iskolában? 7 óra 20 perctől egyig.

First experiences with Gd fuel assemblies in. Tamás Parkó, Botond Beliczai AER Symposium

Abigail Norfleet James, Ph.D.

Genome 373: Hidden Markov Models I. Doug Fowler

Unit 10: In Context 55. In Context. What's the Exam Task? Mediation Task B 2: Translation of an informal letter from Hungarian to English.

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Hypothesis Testing. Petra Petrovics.

FÖLDRAJZ ANGOL NYELVEN GEOGRAPHY

ANGOL NYELV KÖZÉPSZINT SZÓBELI VIZSGA I. VIZSGÁZTATÓI PÉLDÁNY

FAMILY STRUCTURES THROUGH THE LIFE CYCLE

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Factor Analysis

Csima Judit április 9.

Tudományos Ismeretterjesztő Társulat

BKI13ATEX0030/1 EK-Típus Vizsgálati Tanúsítvány/ EC-Type Examination Certificate 1. kiegészítés / Amendment 1 MSZ EN :2014

Statistical Inference

Bevezetés a kvantum-informatikába és kommunikációba 2015/2016 tavasz

Tudományos Ismeretterjesztő Társulat

Where are the parrots? (Hol vannak a papagájok?)

Magyar ügyek az Európai Unió Bírósága előtt Hungarian cases before the European Court of Justice

A jövedelem alakulásának vizsgálata az észak-alföldi régióban az évi adatok alapján

A rosszindulatú daganatos halálozás változása 1975 és 2001 között Magyarországon

Lopocsi Istvánné MINTA DOLGOZATOK FELTÉTELES MONDATOK. (1 st, 2 nd, 3 rd CONDITIONAL) + ANSWER KEY PRESENT PERFECT + ANSWER KEY

(NGB_TA024_1) MÉRÉSI JEGYZŐKÖNYV

2 kultúra. Zétényi Tamás.

Néhány folyóiratkereső rendszer felsorolása és példa segítségével vázlatos bemutatása Sasvári Péter

Construction of a cube given with its centre and a sideline

Madonna novellái. 1. szint Július. Madonna képekkel illusztrált novelláskötetet(1) jelentet meg

Választási modellek 3

Minta ANGOL NYELV KÖZÉPSZINT SZÓBELI VIZSGA II. Minta VIZSGÁZTATÓI PÉLDÁNY

Szundikáló macska Sleeping kitty

Munkahelykeresés. Önéletrajz és állásinterjú 12. ÉVFOLYAM. Felkészülés a felnőtt szerepekre. A modul szerzõje: Simon Gabriella SZKB_212_04

MATEMATIKA ANGOL NYELVEN

Cashback 2015 Deposit Promotion teljes szabályzat

TestLine - Angol teszt Minta feladatsor

Ensemble Kalman Filters Part 1: The basics

There is/are/were/was/will be

A évi fizikai Nobel-díj

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Nonparametric Tests. Petra Petrovics.

Mapping Sequencing Reads to a Reference Genome

Please stay here. Peter asked me to stay there. He asked me if I could do it then. Can you do it now?

Vakáció végi akció Ukrajnában

Performance Modeling of Intelligent Car Parking Systems

Adatbázisok 1. Rekurzió a Datalogban és SQL-99

Utasítások. Üzembe helyezés

már mindenben úgy kell eljárnunk, mint bármilyen viaszveszejtéses öntés esetén. A kapott öntvény kidolgozásánál még mindig van lehetőségünk

USER MANUAL Guest user

Using the CW-Net in a user defined IP network

Can/be able to. Using Can in Present, Past, and Future. A Can jelen, múlt és jövő idejű használata

A modern e-learning lehetőségei a tűzoltók oktatásának fejlesztésében. Dicse Jenő üzletfejlesztési igazgató

Statistical Dependence

Munka kontra magánélet

Computer Architecture

Descriptive Statistics

ENROLLMENT FORM / BEIRATKOZÁSI ADATLAP

7. osztály Angol nyelv

PETER PAZMANY CATHOLIC UNIVERSITY Consortium members SEMMELWEIS UNIVERSITY, DIALOG CAMPUS PUBLISHER

OROSZ MÁRTA DR., GÁLFFY GABRIELLA DR., KOVÁCS DOROTTYA ÁGH TAMÁS DR., MÉSZÁROS ÁGNES DR.

EPILEPSY TREATMENT: VAGUS NERVE STIMULATION. Sakoun Phommavongsa November 12, 2013

IES TM Evaluating Light Source Color Rendition

ANGOL NYELVI SZINTFELMÉRŐ 2013 A CSOPORT. on of for from in by with up to at

Szívkatéterek hajlékonysága, meghajlítása

2. Local communities involved in landscape architecture in Óbuda

KERÜLETI DIÁKHETEK VERSENYKIÍRÁS 2017.

Optimalitáselmélet formális megközelítésben

Új fenomén a magyar biztosítási jogban: a biztosítottak közvetlen perlési joga a viszontbiztosítóval szemben a direkt biztosító csődje esetén

STUDENT LOGBOOK. 1 week general practice course for the 6 th year medical students SEMMELWEIS EGYETEM. Name of the student:

FÖLDRAJZ ANGOL NYELVEN

ANGOL NYELV Helyi tanterv

COOPERATION AGREEMENT

Tudok köszönni tegezve és önözve, és el tudok búcsúzni. I can greet people in formal and informal ways. I can also say goodbye to them.

The Syntax and Semantics of Free-Choice Items in Hungarian. Tamás Halm Budapest

ANGOL NYELVI SZINTFELMÉRŐ 2012 A CSOPORT. to into after of about on for in at from

Szatírikus film készül Ceausescu életéről

3. MINTAFELADATSOR KÖZÉPSZINT. Az írásbeli vizsga időtartama: 30 perc. III. Hallott szöveg értése

Supplementary Table 1. Cystometric parameters in sham-operated wild type and Trpv4 -/- rats during saline infusion and

VIII. A cukrászdában. A. Kéred ezt a tortát? Igen, kérem. Mit kérsz? Egy teát kérek. Milyet kérsz? Zöldteát kérek.

MATEMATIKA ANGOL NYELVEN

Magyar - Angol Orvosi Szotar - Hungarian English Medical Dictionary (English And Hungarian Edition) READ ONLINE

- Bevándoroltak részére kiadott személyazonosító igazolvány

sorozat CD4 Katalógus füzetek

(Asking for permission) (-hatok/-hetek?; Szabad ni? Lehet ni?) Az engedélykérés kifejezésére a következő segédigéket használhatjuk: vagy vagy vagy

Átírás:

Variation in Hungarian definiteness agreement Peredy Márta ICSH9, 30 th August 2009

(1a) A nyelvészeket a nyelvi jelenségek érdeklik. the linguists-acc the linguistic phenomena are.interested.in- -DEF.3PL (1b) Bizonyos nyelvészeket a nyelvi jelenségek érdekelnek. certain linguists-acc the linguistic phenomena are.interested.in- -INDEF.3PL (1c) Bizonyos nyelvészeket a nyelvi jelenségek érdeklik. certain linguists-acc the linguistic phenomena are.interested.in- -DEF.3PL Red means definiteness, Green means indefiniteness, Italics mean objecthood.

0. Goals 1. There is this phenomenon. 2. This variation cannot be accounted for in the generative syntactic framework suggested by Bartos (2000). 3. This variation can be modelled by the Maximum Entropy model of stochastic OT. 4. The variation challenges the competence/performance duality. (Ok, this is performance, but what is the competence behind it?)

0. Goals 1. Syntactic Object Agreement Rule 2. Test, data 3. Syntactic and semantic factors which influence the phenomenon 4. Stochastic OT Maximum Entropy Model 5. Experiments 6. Results, ideas 7. More and even stranger factors

0. Goals 1. Syntactic Object Agreement Rule 2. Test, data 3. Syntactic and semantic factors which influence the phenomenon 4. Stochastic OT Maximum Entropy Model 5. Experiments 6. Results, ideas 7. More and even stranger factors

1. Syntactic Object Agreement Rule Bartos (2000): The verbal agreement is definite iff the object is a DP. Exceptions that can be accounted for: a. 1 st, 2 nd person personal pronouns b. dialectal: possessive construction object with a dative possessor (2a) Jónás Tamásnak tanultunk egy versét. - non-specific: in the school we learned about JT (2b) Jónás Tamásnak tanultuk egy versét. - specific: we learned that poem by heart

1. Syntactic Object Agreement Rule Exceptions that can be accounted for: c. wh-movement from embedded clause (3a) Kit szeretnél, hogy megverjek? Bartos (2000) (164) (3b)?Kit szeretnél, hogy megverjem? (165a-c) (3c)?Kit szeretnéd, hogy megverjek? (3d) *Kit szeretnéd, hogy megverjem? d. Kálmán (2009): minden 'every'+ordinal number objects. definite/indefinite verb forms ~ 50-50% (4a) Minden tizedik műtétet hazánkban végeznek/végzik. (4b) Vigyük/Vigyünk ki minden tizedik széket!

1. Syntactic Object Agreement Rule Exceptions that cannot be accounted for: Mindenkit, aki épp nem nyaral és van kedve egy nyáresti koncerthez, régi és új versekkel, szeretettel várjuk! Nem tudtam, másokat mennyire érintette mélyen az, hogy gyerekkorában milyen mesék, könyvek, képregények, filmek vették körül. A dokk.hu fenntartja magának a jogot, hogy az oldalra nem illő, célkitűzéseinek nem megfelelő profilt és anyagot önkényesen, előzetes bejelentés nélkül töröljön.

1. Syntactic Object Agreement Rule Exceptions that cannot be accounted for: p abs 15 A férfiakat bizonyos viselkedésformák taszítják. 97% 16 A férfiakat bizonyos viselkedésformák taszítanak. 53% 25 Az ás fiúkat egyes bés fiúk verik. 92% 26 Az ás fiúkat egyes bés fiúk vernek. 27%! 65 Egyes matematikusokat a számelméleti problémák foglalkoztatják. 88% 66 Egyes matematikusokat a számelméleti problémák foglalkoztatnak. 40% 73Egyes nőket a sötét ruhák öregítik. 85% 74Egyes nőket a sötét ruhák öregítenek. 48%

0. Goals 1. Syntactic Object Agreement Rule 2. Test, data 3. Syntactic and semantic factors which influence the phenomenon 4. Stochastic OT Maximum Entropy Model 5. Experiments 6. Results, ideas 7. More and even stranger factors

2. Test 50 sentence pairs, which differ only in the definiteness feature of the verb. 37 subjects reading test sentences in random order (not in pairs, every subject got a different order) judgements: 0 bad sentence, 1 strange sentence, 2 good sentence the subjects were asked to read out the sentences loudly and answer immediately.

2. Test Acceptibility rates Absolute acceptibility rates (p abs ) calculated for each sentence, the average of the judgements of that sentence. Relative acceptibility rates (p rel ) calculated for each sentence pair. p rel (+def)+p rel (-def)=100%, p rel (-def)/p rel (+def)=p abs (-def)/p abs (+def)

2. Test Information structure of the sentences: Usually the verb (or the verbal modifier, if any) is the information focus. Exception: sentences with the universal quantifier. The naturalness of the sentences obviously influences the judgements. relative acceptibility rates compensate this effect at least partly. Data

0. Goals 1. Syntactic Object Agreement Rule 2. Test, data 3. Syntactic and semantic factors which influence the phenomenon 4. Stochastic OT Maximum Entropy Model 5. Experiments 6. Results, ideas 7. More and even stranger factors

3. Syntactic and semantic factors which influence the phenomenon 1. definiteness of the grammatical object and subject p rel 41 A nőket bizonyos ruhák öregítik. 69% 42 A nőket bizonyos ruhák öregítenek. 31% 73Egyes nőket a sötét ruhák öregítik. 61% 74Egyes nőket a sötét ruhák öregítenek. 39% 2. the distance between the (non)agreeing NPs and the verb dist(o, V) 75Jánost mindenki érdekli. 76% 2 76Jánost mindenki érdekel. 24% 79 Mindenki Jánost érdekli. 82% 1 80 Mindenki Jánost érdekel. 18%

3. Syntactic and semantic factors which influence the phenomenon 3. word order 33 A lányokat egyes fiúk dühítik. 65% 34 A lányokat egyes fiúk dühítenek. 35% 99Dühítik egyes fiúk a lányokat. 93% 100Dühítenek egyes fiúk a lányokat. 7% Semantic factors (Group I) 4. thematic roles {AG, PAT} or {THEME, EXP} correlation p abs ( agree ) p abs ( non-agree ) p rel PAT/EXP 0,01-0,66 0,64

3. Syntactic and semantic factors which influence the phenomenon 5. intransitive equivalent (unaccusative verb or adjective) öregít make look older öregszik grow older ; megnevettet 'make laugh' nevet 'laugh' correlation p abs ( agree ) p abs ( non-agree ) p rel intr -0,32 0,35-0,4 6. the interchangeability of the subject and the object in the sense that the meaning of the sentence remains plausible. correlation p abs ( agree ) p abs ( non-agree ) p rel ich -0,03 0,35-0,37 5 A gyerekeiket egyes szülők verik. 93% 6 A gyerekeiket egyes szülők vernek. 7% 25 Az ás fiúkat egyes bés fiúk verik. 75% 26 Az ás fiúkat egyes bés fiúk vernek. 25%

3. Syntactic and semantic factors which influence the phenomenon 6. type of the determiners 7. phonological realization The uncertainty is higher if the two verb forms differ in an overt morpheme (bántanak / bántják) than if they only differ in the presence or absence of a morpheme (bántø / bántja). 29 Ezeket a kislányokat egyes idősebb fiúk bántják. 85% 57 Ezt a kislányt minden idősebb fiú bántja. 99% 8. information structure 9. relative frequencies 10. genericity 11. etc.

0. Goals 1. Syntactic Object Agreement Rule 2. Test, data 3. Syntactic and semantic factors which influence the phenomenon 4. Stochastic OT Maximum Entropy Model 5. Experiments 6. Results, ideas 7. More and even stranger factors

4. Stochastic OT Maximum Entropy Model A model with the following properties is needed: Violable constraints: Object agreement in Hungarian is not a strict, but rather a violable constraint. OT Weighted constraints: The relevance of the different factors has to be determined quantitatively. ranks Variation: There isn t one optimal candidate (winner), but the speakers choose, with some probability, the one candidate or the other. stochastic model OT model is good method to estimate the weights of the different factors.

4. Stochastic OT Maximum Entropy Model Maximum Entropy Model (Goldwater and Johnson 2003) characterizes the constraints with ranks and the candidates with their probabilities all candidates have a positive probability p cand k = 1 Z exp j r j c j cand k,input parallelism with the Boltzmann-factor E= j r j c j cand k,input

4. Stochastic OT Maximum Entropy Model Simulation The constraints represent the factors mentioned above. In every competition there are two candidates which differ in the definiteness morpheme of the verb. On the bases of probabilities (relative acceptibility rates) derived from the data, the model calculates the constraint ranks (the importance of the different factors). The learning algorithm SGA: Stochastic Gradient Ascent for MaxEnt (Jäger 2003) r i n+ 1 =r i n+1 +η c i h n,input n c i datum n,input n

4. Stochastic OT Maximum Entropy Model The set of constraints Harmonic Alignment method (Prince and Smolensky 2004): Constraints are defined by the possible combinations of two parameter sets. Set 1: +/-D the definiteness of the verbal morpheme Set 2: the factors which may influence it +/-do the definiteness of the object, +/-ds the definiteness of the theme subject, +/- darg2 the definiteness of the second NP in the sentence +/-intr the existence of an intransitive equivalent of the verb, +/-ich the interchangeability of the role of the subject and the object, +/-pat the thematic grid is {AG, PAT} or {THEME,EXP}. Constraints: e.g.: +D/+do requires a definite verb in the case of a definite object, -D/-intr requires a indefinite verb if the verb does not have an intransitive counterpart. Distance: is expressed by the number of violations.

0. Goals 1. Syntactic Object Agreement Rule 2. Test, data 3. Syntactic and semantic factors which influence the phenomenon 4. Stochastic OT Maximum Entropy Model 5. Experiments 6. Results, ideas 7. More and even stranger factors

5. Experiments Experiment 1: Group V. - acceptibility rates Mindenkit János érdekli. Mindenkit János érdekel. Jánost mindenki érdekli. Jánost mindenki érdekel. Mindenki Jánost érdekli. Mindenki Jánost érdekel. János mindenkit érdekli. János mindenkit érdekel. Mindenkit mindenki érdekli. Mindenkit mindenki érdekel. Mindenki mindenkit érdekli. Mindenki mindenkit érdekel. Jánost Mari érdekli. Jánost Mari érdekel. János Marit érdekli. János Marit érdekel. 34% 24% 27% 18% 9% 15% 10% 17% 16% 5% 5% 1% 8% 4% 45% 55% 66% data 76% 73% MaxEnt 82% 91% 85% 90% 83% 84% 95% 95% 99% 92% 100% 96% 0% 20% 40% 60% 80% 100% 120%

5. Experiments Experiment 1: Constraints and their ranks 1 0,5 0-0,5 -D/-do +D/+do +D/+ds -D/-ds +D/-ds -D/+ds -D/+do +D/-do r(-d/-do)=0,72 r(+d/+do)=0,6 r(+d/+ds)=0,31 r(-d/-ds)=0,06-1

5. Experiments Experiment 1 - Predictions 1. data MaxEnt 75Jánost mindenki érdekli. 76% 73% 79Mindenki Jánost érdekli. 82% 91% 33 A lányok at egyes fiúk dühítik. 65% 91Egyes fiúk a lányok at dühítik. 88% 2. 75 Jánost mindenki érdekli. 76% 73% 82Mindenkit János érdekel. 66% 55% Group I +defo -defs +defv 75% Group IV -defo +defs -defv 43%

5. Experiments Experiment 2: Group VI. - acceptibility rates Dühítenek egyes fiúk a lányokat. Dühítik egyes fiúk a lányokat. Dühítenek a lányokat egyes fiúk. Dühítik a lányokat egyes fiúk. Egyes fiúk dühítenek a lányokat. Egyes fiúk dühítik a lányokat. A lányokat dühítenek egyes fiúk. A lányokat dühítik egyes fiúk. Egyes fiúk a lányokat dühítenek. Egyes fiúk a lányokat dühítik. A lányokat egyes fiúk dühítenek. A lányokat egyes fiúk dühítik. 8% 7% 10% 10% 9% 12% 35% 33% 40% 42% 33% 35% 65% 67% 60% 58% 67% 65% 92% 93% 90% 90% data MaxEnt 91% 88% 0% 20% 40% 60% 80% 100%

5. Experiments Experiment 2: Constraints and their ranks 2 1,5 1 0,5 0-0,5-1 -1,5-2 +D/+do -D/-ds +D/+darg2 -D/-darg2 +D/-darg2 -D/+darg2 +D/-ds -D/+do r(+d/+darg2)=1,6 r(+d/-darg2)=0,79 r(-d/+do)=0,16 r(-d/-ds)=0,13

0. Goals 1. Syntactic Object Agreement Rule 2. Test, data 3. Syntactic and semantic factors which influence the phenomenon 4. Stochastic OT Maximum Entropy Model 5. Experiments 6. Results, ideas 7. More and even stranger factors

6. Results, ideas 1. Exp. 1.: The definiteness of the subject plays an important role. 2. Exp. 2.: The SO order is preferred even postverbally. 3. The definiteness marking of the verb can be accounted for without the notion of agreement. 4. Contradictory factors unsable points variation (Rebrus 2009) 5. Instead of specificity difference, difference in theta grid? (2a) Jónás Tamásnak tanultunk egy versét. - in the school we learned about JT {EXP, TH} (2b) Jónás Tamásnak tanultuk egy versét. - we learned that poem by heart {AG, PAT}

0. Goals 1. Syntactic Object Agreement Rule 2. Test, data 3. Syntactic and semantic factors which influence the phenomenon 4. Stochastic OT Maximum Entropy Model 5. Experiments 6. Results, ideas 7. More and even stranger factors

Rhythm and rhyme 7. More and even stranger factors 75 Jánost mindenki érdekli. 79% 76 Jánost mindenki érdekel. 21% 45 Jánost minden érdekli. 63% 46 Jánost minden érdekel. 38% 87 Mindenkit mindenki érdekli. 14% 88 Mindenkit mindenki érdekel. 86% 89 Mindenki mindenkit érdekli. 6% 90 Mindenki mindenkit érdekel. 94%

I thank Katalin É. Kiss, Tamás Bíró and Dániel Vásárhelyi for comments and discussion.

References Bartos, H. 2000 Az inflexiós jelenségek szintaktikai háttere. In: Strukturális Magyar Nyelvtan 3. Morfológia. Akadémiai Kiadó Goldwater, S. and Johnson, M. 2003 Learning OT constraint rankings using a maximum entropy model. In: Jennifer Spenader, Anders Eriksson, and Östen Dahl (eds.) Proceedings of the Stockholm Workshop on Variation within Optimality Theory, 111-120. Stockholm University. Jäger, G. 2003 Maximum entropy models and Stochastic Optimality Theory. Manuscript, University of Potsdam. ROA 625-1003. Kálmán, L. 2009. április 7., Az analógiás nyelvelmélet (és számítógépes modellezésének első lépései), RIL HAS Prince, A. and P. Smolensky. 1993 Optimality Theory. Ms., Rutgers University., 136 o. Rebrus, P. 2009. március 10., Paradigmák és alakváltozatok a magyarban, RIL HAS