Optimalitáselmélet formális megközelítésben 4. hét (2015. 03. 06.) Biró Tamás BBN-ENY-450SZ:F3, BMA-ENYD-321:F3, P/NY/ENY-10::F3, P/NY/ANY-8.02 biro.tamas@btk.elte.hu http://birot.web.elte.hu/courses/2015-formot/ Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 1
Feladott cikkek Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 2
Irodalom múlt hétre Bruce Tesar, Jane Grimshaw and Alan Prince (1999). Linguistic and cognitive explanation in Optimality Theory. In Ernest Lepore and Zenon Pylyshyn (eds.): What is Cognitive Science? 295326. Malden, MA: Blackwell. http://ruccs.rutgers.edu/~prince/hold/introot.pdf Ld. a honlapon is. A 3. és 4. alfejezetet ki-ki a maga háttere szerinti alapossággal. Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 3
Irodalom mára Prince, Alan, and Paul Smolensky (1997). Optimality: From neural networks to universal grammar. Science 275: 1604-1610. Újra kiadva: Paul Smolensky and Géraldine Legendre (eds.): The Harmonic Mind: From Neural Computation to Optimality-Theoretic Grammar (Vol. 1: Cognitive architecture). MIT Press, 2006, chapter 4. Ld. a honlapon is. Kérem a fejezetet átolvasni, és amennyit lehet, megérteni bel le. Következ órán én prezentálom a Harmonic Mind lényegét. Azt követ en: ki vállal prezentációt? Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 4
Az Optimalitáselmélet alapjai Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 5
Az Optimalitáselmélet alapjai Gen és Eval: a konsztréntek, mint sz r k: Gen és a megszorítások univerzálisak. A cél: nyelvtipológia modellezése/magyarázata. Különböz nyelvtípusok: különböz megszorítás-rendezések. Tanulás = a megfelel rendezés megkeresése. Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 6
Az Optimalitáselmélet alapjai variációk Gen és Eval: a konsztréntek, mint sz r k: Constraints ranked into strict domination hierarchy Mi van, ha nem ennyire szigorú a dominációs hierarchia? Egymáshoz képest nem rendezett konsztréntek (Anttila) Konsztréntek rendezése sztochasztikusan felcserélhet (Boersma) Ganging-up (v.ö. Jäger) Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 7
Az Optimalitáselmélet alapjai variációk Gen és a megszorítások univerzálisak. És ha nem? És ha (a Gen-t és/vagy) a megszorításokat is tanulni kell/lehet? Gyakran: univerzális megszorítás-típusok, amelyeknek a paramétere nyelvspecikus. Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 8
Az Optimalitáselmélet alapjai variációk Két perspektíva: Gen és Eval: a konsztréntek, mint sz r k: Okos sz r k: a rosszabbakat, és nem a rosszakat sz ri ki. C i : candidate set candidate subset. A konsztréntek, mint elemi függvények: C i : candidate violation level. Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 9
OT három tudományterület metszéspontjában Elméleti nyelvészet megszorítások Számítástudomány Kognitív tudomány optimalizáció OT: a nyelvészeti kutatás által motivált célfüggvényt akarjuk optimalizálni. Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 10
Komputációs kérdések Optimalizáció: adott célfüggvényhez az optimális elemet keressük egy (potenciálisan nagy vagy végtelen) halmazban. Tanulás: adott optimális elem(ek)hez keressük a célfüggvényt, amely ez(eke)t optimálissá teszi. Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 11
A nyelv, mint komputáció Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 12
Language as computation Data structures, a.k.a. representations Operations on these representations Overall architecture Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 13
Language as computation Example: SPE-style phonology Data structures, a.k.a. representations: segments: [a] or back round high + low words: [ t a m a: ] or [ ɛ p l ] Operations on these representations Overall architecture Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 14
Language as computation Example: SPE-style phonology Data structures, a.k.a. representations Operations on these representations: rewrite rules [a] [o] back round high + low [ + round low ] Overall architecture Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 15
Language as computation Example: SPE-style phonology Data structures, a.k.a. representations Operations on these representations Overall architecture: Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 16
Language as computation Data structures, a.k.a. representations PRED SUBJ OBJ dir `make' PRED NUMB ADJ PRED NUMB DET linguist' Plural `happy' diagram' Singular Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 17
Language as computation Overall architectures: Jackendo Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 18
Language as computation Overall architectures: Optimality Theory Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 19
Language technology as computation Data structures, a.k.a. representations: typically bytes, characters and strings. Operations on these representations: for example: regular expressions. Overall architecture Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 20
Az Optimalitáselmélet formális megalapozása Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 21
Az Optimalitáselmélet formális megalapozása Az OT épít kockái (building blocks): Form (alak) Candidate (jelölt) Gen az optimalizálás keresési tere (search space) Constraint (megszorítás, korlát) Hierachia, constraintek rendezése az optimalizálás célfüggvénye (target function) stb. Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 22
Form (alak) Primitives of OT: bármi lehet. Például egy sztring (karaktersorozat) egy véges vagy végtelen Σ ábécé fölött. Gen az optimalizálás keresési tere (search space). Constraint (megszorítás, korlát). Hierachia, constraintek rendezése az optimalizálás célfüggvénye (target function). stb. Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 23
Form (alak) (b) [ S [ NP Det N ] [ VP V NP ] ] (a) S (c) \Tree [.S [.NP Det N ] [.VP V NP ] ] NP VP Det N V NP 1. ábra. Non-linear and linearized representations of the syntactic tree. Graph (a) is often represented by linguists as the string (b), still slightly non-linear due to the important dierence between the baseline and the subscript. String (c) is a linear L A T E X code (making use of the qtree package), which is a string over the set of the ascii characters. Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 24
[s] laryngeal tier supralaryngeal tier [spread] + [constricted] [voiced] manner tier place tier [nasal] [continuant] + [strident] + [coronal] + [anterior] + [distributed] 2. ábra. Partial representation of segment [s], as suggested by Clements 1985. Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 25
Candidate (jelölt) Alakok által alkotott (u, s) U S pár. Vagy alakok által alkotott hosszabb sorozat: ld. OT variánsai. Stb. NB: A felszíni alak és a jelölt közt mi szisztematikusan különbséget fogunk tenni. Ez különbségtétel nem alapvet mindenki számára. Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 26
Gen Egy függvény, amely a bemeneti alakokat leképezi a jelöltek egy halmazára: Gen : U U S Bemeneti alak sok minden lehet: pl. mögöttes reprezentáció fonológiában, logikai forma szintaxisban, felszíni vagy fonetikai alak a szemantikában, stb. Candidate set: a Gen(u) halmaz, bármely u U-ra. Gen(u) jelöltek felszíni alakjai: néha azon alakok, amelyek véges számú elemi lépésben (S S elemi transzformációk, újraírások véges számú rekurzív alkalmazásával) elérhet ek u-ból. Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 27
Constraint (megszorítás, korlát) Két perspektíva: A konsztrént, mint sz r : A jelöltek egy halmazát leképezi ennek optimális részhalmazára. F i : P(Gen(u)) P(Gen(u)) úgy hogy Ha X jelöltek egy halmaza (X Gen(u)), akkor F i (X) X, és F i (F i (X)) = F i (X). F i (X) (soft/violable constraint) Milyen más feltételt kell még itt szabni? Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 28
Constraint (megszorítás, korlát) Két perspektíva: A konsztrént, mint elemi függvény: Az egyes jelölteket képezi le megszorítássértésekre. Legyen V a sértések egy jólrendezett halmaza. Legegyszer bb esetben V = N 0 (a természetes számok halmaza a 0-val). A sértések V i halmaza konsztréntenként változhat. Ekkor C i : Gen(u) V. Egy konsztrént minden jelölthöz hozzárendel egy sértésértéket. Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 29
Constraint (megszorítás, korlát) Két perspektíva: A konsztréntek, mint sz r k. A konsztréntek, mint elemi függvények. Állítás: Az elemi függvények-perspektívából levezethet a sz r -perspektíva. Bizonyítás: V jólrendezett halmaz. Ellenkez irányban nem igaz. De a gyakorlatban a konsztrénteket szinte mindig függvényként értelmezzük (és jó lenne explicit formában is így tenni). Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 30
Az Optimalitáselmélet (OT) alapaxiómája Nyelvtan = konsztréntek véges sorozata: (F 1, F 2,..., F n ), avagy (C 1, C 2,..., C n ). Ezen nyelvtan szerint az u bemenethez tartozó grammatikus alak: SF(u) = vagy F n (... F2 ( F1 ( Gen(u) ))). SF(u) = vagy arg opt x Gen(u) ( C1 (x), C 2 (x),..., C n (x) ) a lexikograkus rendezés szerint. Az optimalizálandó célfüggvény: H(x) = ( C 1 (x), C 2 (x),..., C n (x) ). Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 31
Az Harmónianyelvtan (HG) alapaxiómája Nyelvtan = valósérték konsztréntekhez rendelt súlyok rendszere: (C 1, C 2,..., C n )-hez tartozik (w 1, w 2,..., w n ). Az optimalizálandó célfüggvény: H(x) = n i=1 w i C i (x). Ezen nyelvtan szerint az u bemenethez tartozó grammatikus alak: SF(u) = vagy arg opt x Gen(u) n i=1 w i C i (x) a valós számok körében értelmezett kisebb mint reláció szerint. A sz r -perspektívának nincs értelme. Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 32
Összefoglalás: Optimalizáció a nyelvészetben SF(u) = arg opt c Gen(u) H(c) Harmony Grammar: Optimality Theory: H(c) = n i=1 w i C i (c) opt: min for < on R. H(c) = (C 1 (c), C 2 (c),..., C n (c)) opt: lexicographical order on R n. Principles and Parameters: opt: H(c) = n i=1 (w i C i (c)) false more optimal than true. Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 33
Jöv hétre: Tamás Biró: Elephants and Optimality Again: SA-OT accounts for pronoun resolution in child language. In: B. Plank, E. Tjong Kim Sang and T. Van de Cruys (eds.). Computational Linguistics in the Netherlands 2009. LOT, 2009, pp. 9-24. Egy kis szintaxis-szemantika (kis kitér vel a bidirekcionális OT felé), valamint az implementáció jelent sége. Következ órán én prezentálom a Harmonic Mind lényegét, majd azt összevetem a saját megközelítésemmel. Ezt követ en: ki vállal prezentációt? Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 34
Viszlát jöv pénteken! Biró Tamás, ELTE, Optimalitáselmélet formális megközelítésben p. 35