Ami megjelenik, és ami nem jelenik meg a beszédben Performanciahibák, fedett információ, nyelvi változás (toborzás)



Hasonló dokumentumok
Számítsuk ki a nyelvet! Matematika, fizika és algoritmusok a nyelvben

A sz.ot.ag. III. Magyar Számítógépes Nyelvészeti Konferencia december 8. Bíró Tamás, ELTE, Budapest / RUG, Groningen, NL 1/ 16

A nyelvi kompetencia és a nyelvi performancia határán

Optimalitáselmélet és analógia: tényleg kiengesztelhetetlen ellentét?

Nyelvtudományi irányzatok és módszerek a 20. században

Optimalitáselmélet formális megközelítésben

Optimalitáselmélet formális megközelítésben

Gépi tanulás a gyakorlatban. Lineáris regresszió

Közösség detektálás gráfokban

Az imperialista Optimalitáselmélet?

IX. Magyar Számítógépes Nyelvészeti Konferencia MSZNY Szerkesztette: Tanács Attila Vincze Veronika

Életkor, motiváció és attitűdök fiatal dán nyelvtanulók angolnyelv-elsajátításában. Fenyvesi Katalin

A héber nyelv története

Társasjáték az Instant Tanulókártya csomagokhoz

A sz.ot.ag Optimalitáselmélet szimulált hıkezeléssel

Modellkiválasztás és struktúrák tanulása

Meddig tart egy nyelv?

Számítógép és programozás 2

Nyelvtörténet: a szociolingvisztika és a pszicholingvisztika keresztmetszetében

Értelek, értelek... de miről beszélsz??

Igekötős szerkezetek a magyarban

Neurális hálózatok bemutató

Fordító részei. Fordító részei. Kód visszafejtés. Izsó Tamás szeptember 29. Izsó Tamás Fordító részei / 1

A hangok a fejemben, avagy: mi a fonológia?

Mapping Sequencing Reads to a Reference Genome

XVII. econ Konferencia és ANSYS Felhasználói Találkozó

Angol-Amerikai Intézet (SEAS): ANN/AKN/AMN/AFN BBN BMA TANM-ANG ekvivalenciák

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

Hiátustöltő stratégiák tipológiája és grammatikai szerepe angol dialektusokban

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

OSZTATLAN ANGOL NYELV ÉS KULTÚRA TANÁRA KÉPZÉS TANTERVE (5+1) ÉS (4+1)

Teljesen elosztott adatbányászat alprojekt

A nyelvi változás formális modellezése

Hidraulikus hálózatok robusztusságának növelése

Összefoglalás és gyakorlás

Társadalmi és gazdasági hálózatok modellezése

Success Elementary Kompetencia Alapú Tanmenet. Pearson Education Magyarország Megjegyzések:

A magyar létige problémái a számítógépes nyelvi elemzésben

Értékáram elemzés szoftveres támogatással. Gergely Judit Lean-klub

Teljesen elosztott adatbányászat pletyka algoritmusokkal. Jelasity Márk Ormándi Róbert, Hegedűs István

Számítógépes döntéstámogatás. Genetikus algoritmusok

Novák Attila (2003): Milyen a jó Humor? In: Magyar Számítógépes Nyelvészeti Konferencia (MSZNY 2003). Szegedi Tudományegyetem,

Osztatlan angol nyelv és kultúra tanára képzés tanterve (5+1) és (4+1) A képzési és kimeneti követelményeknek való megfelelés bemutatása

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Z Generáció - MeGeneráció

MAGYAR NYELVÉSZETI TÁRGYAK ISMERTETÉSE BA NYELVTECHNOLÓGIAI SZAKIRÁNY

IV.3. MODELL-ALAPÚ MÓDSZER KIDOLGOZÁSA IT INFRASTRUKTÚRÁK ROBOSZTUSSÁGÁNAK ELEMZÉSÉHEZ KOCSIS-MAGYAR MELINDA

Automaták. bemenet: pénz, kiválasztó gombok stb. állapot: standby, pénz van behelyezve stb. kimenet: cola, sprite, visszajáró

Kiválósági ösztöndíjjal támogatott kutatások az Építőmérnöki Karon c. előadóülés

TÁMOPͲ4.2.2.AͲ11/1/KONVͲ2012Ͳ0029

Multimédia annotáció a tanárképzésben

Dualitás Dualitási tételek Általános LP feladat Komplementáris lazaság 2017/ Szegedi Tudományegyetem Informatikai Intézet

Megerősítéses tanulás 7. előadás

Ötletek a magyar mint idegen nyelv tanításához feladattípusok szerint

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

SZOFTVEREK A SORBANÁLLÁSI ELMÉLET OKTATÁSÁBAN

Hazai fejlesztésű hibahely behatárolási eljárás tapasztalatai

Diszkrét Irányítások tervezése. Heurisztika Dr. Bécsi Tamás

Kommunikatív nyelvi tesztek kritériumai 1

Klaszterezés, 2. rész

Sémi összehasonlító nyelvészet

A KÜLÖNBÖZŐ GENERÁCIÓK MOTIVÁCIÓS ESZKÖZEINEK VIZSGÁLATA THE EXAMINATION OF DIFFERENT GENERATIONS MOTIVATIONAL TOOLS MELLÉKLETEK

Modellező eszközök, kódgenerálás

Mesterséges Intelligencia MI

Parametrikus tervezés

Objektumorientált paradigma és programfejlesztés Bevezető

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Informatikai Intézet Alkalmazott Informatikai Intézeti Tanszék

A tananyagfejlesztés céljai és a digitális tananyag szerkezete Angol nyelv

Miben különbözünk az egértől? Szabályozás a molekuláris biológiában

A nyelvtechnológia alapjai

Számítógépes nyelvészet

Angol Tanmenet. Horizons 3

Heckman modell. Szelekciós modellek alkalmazásai.

Probabilisztikus modellek V: Struktúra tanulás. Nagy Dávid

FELÜGYELT ÉS MEGERŐSÍTÉSES TANULÓ RENDSZEREK FEJLESZTÉSE

Kézikönyv ABAS-TOOLS használata

Kogníció, koncepciók, modellek

Fonetika és fonológia

10. Morfológia és statisztikai grammatika Morfémák és variációszámok

Társadalmi és gazdasági hálózatok modellezése

Tartalomjegyzék. Előszó... xi. 1. Bevezetés Mechanikai, elektromos és logikai jellemzők... 13

Programozási módszertan. Mohó algoritmusok

Oktatási környezetek vizsgálata a programozás tanításához

Adatbányászati módszerek alkalmazása virtuális kurzusok minőségvizsgálatára

9. előadás Környezetfüggetlen nyelvek

Előítéletesség a szabadúszóknak szóló online piactereken. Aniko Hannak Claudia Wagner

Doktori (Ph.D.) értekezés tézisei. A magyar nyelv automatikus szintaktikai elemzése szabályalapú gépi tanulási technikák alkalmazásával.

Searching in an Unsorted Database

Számítógépes Hálózatok

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Dodé Réka (ELTE BTK Nyelvtudomány Doktori IskolaAlkalmazott Alknyelvdok 2017 nyelvészet program) február 3. 1 / 17


Publikációk. Könyvek, könyvfejezetek:

Sztochasztikus kapcsolatok

Képrekonstrukció 9. előadás

Angol C nyelvi programkövetelmény. A javaslattevő alapadatai. A nyelvi képzésre vonatkozó adatok. 960 óra + 180/300 OP

A Barabási-Albert-féle gráfmodell

Thékes István. Publikációs lista. Thékes, István (2014): The development of an English as a foreign language vocabulary test.

Osztott algoritmusok

Átírás:

Ami megjelenik, és ami nem jelenik meg a beszédben Performanciahibák, fedett információ, nyelvi változás (toborzás) Biró Tamás Eötvös Loránd Tudományegyetem KAFA, 2015. október 8. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 1

Áttekintés 1 Ami megjelenik a beszédben, és ami nem 2 Tanulóalgoritmusok 3 Tanulás információhiány mellett 4 Magyar magánhangzó-harmónia 5 További kutatási kérdések Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 2

Áttekintés 1 Ami megjelenik a beszédben, és ami nem 2 Tanulóalgoritmusok 3 Tanulás információhiány mellett 4 Magyar magánhangzó-harmónia 5 További kutatási kérdések Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 3

Ami megjelenik a beszédben Grammatikus alakok: amit a mentális nyelvtan, ill. annak a modellje annak tart. Performanciahibák: amit a mentális komputáció, ill. annak a modellje legenerál. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 4

Ami a beszédben megjelenik Mentális nyelvtan, nyelvtan grammatikus a.k.a. tudás, kompetencia (pl. OT, HG, alakok (statikus) P&P, LFG) ( ) Mentális a nyelvtant megfigyelhető komputáció implementáló alakok ( ) (dinamikus) algoritmus (performancia) Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 5

Ami a beszédben megjelenik Mentális nyelvtan, mentális komputáció és annak modelljei: Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 6

Szimulált hőkezelés (SA-OT) dióhéjban Gen + topológia (szomszédsági struktúra) a jelöltek között. Lokális optimum ( ): harmonikusabb a szomszédainál. Globális optimum ( ): harmonikusabb az egész halmaznál. Véletlen bolyongás a jelöltek (topológiával ellátott) halmazán. Output: a bolyongó helye a bolyongás végén, egy lokális optimum. Performanciahiba: output csak lokálisan, de nem globálisan harmonikus. Hiba valószínűsége sebességgel nőhet. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 7

Szimulált hőkezelés (SA-OT) dióhéjban Gen + topológia (szomszédsági struktúra) a jelöltek között. Lokális optimum ( ): harmonikusabb a szomszédainál. Globális optimum ( ): harmonikusabb az egész halmaznál. Véletlen bolyongás a jelöltek (topológiával ellátott) halmazán. Output: a bolyongó helye a bolyongás végén, egy lokális optimum. Performanciahiba: output csak lokálisan, de nem globálisan harmonikus. Hiba valószínűsége sebességgel nőhet. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 7

Példa: holland gyorsbeszéd Kvíz: Q4 President Bush is een typische Bush elnök egy tipikus A1 intellectueel értelmiségi A2 amerikaan amerikai A3 taalkundige nyelvész Maartje Schreuder and Dicky Gilbers (2004). The Influence of Speech Rate on Rhythm Patterns. In: On the Boundaries of Phonology and Phonetics. Groningen. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 8

Példa: holland gyorsbeszéd A véletlen bolyongás tájképe : A szomszédokat összeköto elemi lépések: Lábhatár mozgatása: [s] [su]; [s] [us]. Fejcsere: [su] [us]. Egyszótagos láb törlése, beillesztése: [s] u Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 9

Példa: holland gyorsbeszéd Hierarchia: A LIGN -L EFT OOCz=2 F OOT R EPULSION PARSE S YLL T ROCHAIC Globális optimum: [s]u[su]. Lokális optimumok: [s]u[su] and [su]u[s]. Az [su]u[s] lokális optimum kevésbé harmonikus szomszédai: [su]uu, [su][s][s], [us]u[s], [s]uu[s], [su][us]. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 10

Példa: holland gyorsbeszéd Az [su]u[s] lokális optimum kevésbé harmonikus szomszédai: [su]uu, [su][s][s], [us]u[s], [s]uu[s], [su][us]. /fototoestel/ ALIGN-LEFT OOC z=2 FTREPULS PARSES TROCHAIC [su]u[s] 0 2 0 1 0 [su]uu 0 3 0 2 0 [su][s][s] 0 3 2 0 0 [us]u[s] 0 4 0 1 1 [s]uu[s] 0 2 0 2 0 [su][us] 0 2 1 0 1 Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 11

Példa: holland gyorsbeszéd http://www.birot.hu/sa-ot/ http://www.birot.hu/otkit/ Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 12

Példa: holland gyorsbeszéd fo.to.toe.stel uit.ge.ve.rij stu.die.toe.la.ge per.fec.tio.nist fényképező kiadó ösztöndíj perfekcionista susu ssus susuu usus fó.to.tòe.stel ùit.gè.ve.ríj stú.die.tòe.la.ge per.fèc.tio.níst fast: 0.82 fast: 0.65 / 0.67 fast: 0.55 / 0.38 fast: 0.49 / 0.13 slow: 1.00 slow: 0.97 / 0.96 slow: 0.96 / 0.81 slow: 0.91 / 0.20 fó.to.toe.stèl ùit.ge.ve.ríj stú.die.toe.là.ge pèr.fec.tio.níst fast: 0.18 fast: 0.35 / 0.33 fast: 0.45 / 0.62 fast: 0.39 / 0.87 slow: 0.00 slow: 0.03 / 0.04 slow: 0.04 / 0.19 slow: 0.07 / 0.80 Szimulált / megfigyelt (Schreuder) frekvenciák. A szimulációkban: T step = 3 érték a gyorsbeszéd modellezésére, és T step = 0.1 érték a normális beszéd modellezésére. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 13

És végül, ami a beszédben nem jelenik meg Fontos a mentális nyelvtan (vagy annak modellje) szempontjából: Szintaktikai frázisok, szótagok és metrikus lábak határai (pl.: [baná]na vagy ba[nána]?) Koindexálás (pl.: He i looks like him i/j?) Tematikus szerepek (pl.: John loves Mary: SVO vagy OVS?) De ezek nem jelennek meg a beszédben! underlying form surface form overt form a.k.a. parse a.k.a. phonetic form (Boersma) Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 14

És végül, ami a beszédben nem jelenik meg Fontos a mentális nyelvtan (vagy annak modellje) szempontjából: Szintaktikai frázisok, szótagok és metrikus lábak határai (pl.: [baná]na vagy ba[nána]?) Koindexálás (pl.: He i looks like him i/j?) Tematikus szerepek (pl.: John loves Mary: SVO vagy OVS?) De ezek nem jelennek meg a beszédben! underlying form surface form overt form a.k.a. parse a.k.a. phonetic form (Boersma) Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 14

Áttekintés 1 Ami megjelenik a beszédben, és ami nem 2 Tanulóalgoritmusok 3 Tanulás információhiány mellett 4 Magyar magánhangzó-harmónia 5 További kutatási kérdések Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 15

Nyelvelsajátítás: gyermek és algoritmus Hiba-vezérelt (error-driven) online algoritmusok: Tanító nyelvtana: G t, nyelvi adatokat produkál: w 1, w 2... w k... Tanuló nyelvtana: G l folyamatosan updatelődik: 1 A tanítótól (G t ) hallott nyelvi adat: w k (t.f.h. nincs átviteli zaj). 2 Tanuló (G k 1 l ) ugyanerre l k -t mondana. 3 A tanuló updateli a nyelvtanát: { G k G k 1 l, ha w k = l k l = U ( ) G k 1 l, w k, l k, egyébként Kiindulási állapot: G l 0 (születéskor adott vagy random?). Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 16

Nyelvelsajátítás Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 17

Nyelvelsajátítás kompetenciából? Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 18

Nyelvelsajátítás performanciából! Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 19

Nyelvelsajátítás online tanulóalgoritmussal Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 20

Példa: mondattagadás (Jespersen-ciklus) Figyeljük meg: pre-verbal discontinuous post-verbal Francia Jeo ne dis Je ne dis pas Je dis pas Angol Ic ne secge Ic ne seye not I say not 1. SN V 2. SN V SN 3. V SN Tipológia: pre-verbal, discontinuous, post-verbal,... valamint kevert típusok. Diakrón változás (a.k.a. nyelvevolúció). Hivatkozás A. Lopopolo and T. Biró. Language Evolution and SA-OT: The case of sentential negation. Computational Linguistics in the Netherlands Journal 1(2011):21 40. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 21

Példa: mondattagadás (Jespersen-ciklus) Figyeljük meg: pre-verbal discontinuous post-verbal Francia Jeo ne dis Je ne dis pas Je dis pas Angol Ic ne secge Ic ne seye not I say not 1. SN V 2. SN V SN 3. V SN Tipológia: pre-verbal, discontinuous, post-verbal,... valamint kevert típusok. Diakrón változás (a.k.a. nyelvevolúció). Hivatkozás A. Lopopolo and T. Biró. Language Evolution and SA-OT: The case of sentential negation. Computational Linguistics in the Netherlands Journal 1(2011):21 40. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 21

Példa: mondattagadás (Jespersen-ciklus) Figyeljük meg: pre-verbal discontinuous post-verbal Francia Jeo ne dis Je ne dis pas Je dis pas Angol Ic ne secge Ic ne seye not I say not 1. SN V 2. SN V SN 3. V SN Tipológia: pre-verbal, discontinuous, post-verbal,... valamint kevert típusok. Diakrón változás (a.k.a. nyelvevolúció). Hivatkozás A. Lopopolo and T. Biró. Language Evolution and SA-OT: The case of sentential negation. Computational Linguistics in the Netherlands Journal 1(2011):21 40. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 21

Példa: mondattagadás (Jespersen-ciklus) Figyeljük meg: pre-verbal discontinuous post-verbal Francia Jeo ne dis Je ne dis pas Je dis pas Angol Ic ne secge Ic ne seye not I say not 1. SN V 2. SN V SN 3. V SN Tipológia: pre-verbal, discontinuous, post-verbal,... valamint kevert típusok. Diakrón változás (a.k.a. nyelvevolúció). Hivatkozás A. Lopopolo and T. Biró. Language Evolution and SA-OT: The case of sentential negation. Computational Linguistics in the Netherlands Journal 1(2011):21 40. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 21

A nyelvi kompetencia modellezése FAITH[NEG] *NEGATION NEGATIONFIRST NEGATIONLAST /pol = neg/ Faith[Neg] *Neg NegFirst NegLast [V] * * * [SN V] * * [V SN] * * [SN V SN] ** [V SN SN] ** * [SN SN V] ** * [SN V SN SN] ***... Lopopolo and Biró (2011), Henriëtte de Swart (2010) alapján. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 22

A nyelvi kompetencia modellezése FAITH[NEG] NEGATIONFIRST *NEGATION NEGATIONLAST /pol = neg/ Faith[Neg] NegFirst *Neg NegLast [V] * * * [SN V] * * [V SN] * * [SN V SN] ** [V SN SN] * ** [SN SN V] ** * [SN V SN SN] ***... Lopopolo and Biró (2011), Henriëtte de Swart (2010) alapján. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 23

Hibák a mentális komputáció során Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 24

A nyelvi performancia modellezése Topológia (szomszédsági struktúra) a jelöltek halmazán: Lokálisan optimális alakok: ezeket várjuk a beszédben. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 25

A nyelvi performancia modellezése FAITH[NEG] *NEGATION NEGATIONFIRST NEGATIONLAST Lokálisan optimális alakok: [SN V]. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 26

A nyelvi performancia modellezése FAITH[NEG] NEGATIONFIRST *NEGATION NEGATIONLAST Lokálisan optimális alakok: [SN V] és [SN [V SN]]. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 27

Hierarchia kompetencia performancia 1. *Neg NegFirst NegLast pre-verbal pre-verbal 2. NegFirst *Neg NegLast pre-verbal pre-v and discont. 3. NegFirst NegLast *Neg discontinuous discontinuous 4. NegLast NegFirst *Neg discontinuous discontinuous 5. NegLast *Neg NegFirst post-verbal discont. and post-v 6. *Neg NegLast NegFirst post-verbal post-verbal Megfigyelt tipológia: 3 tiszta és 2 kevert típus. Jóslat a tipológiára: - Hagyományos OT (H. de Swart): 3 tiszta típus. - Sztochasztikus OT (H. de Swart): 3 tiszta és 3 kevert típus. - SA-OT (Lopopolo and Biró): 3 tiszta és 2 kevert típus. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 28

Hierarchia kompetencia performancia 1. *Neg NegFirst NegLast pre-verbal pre-verbal 2. NegFirst *Neg NegLast pre-verbal pre-v and discont. 3. NegFirst NegLast *Neg discontinuous discontinuous 4. NegLast NegFirst *Neg discontinuous discontinuous 5. NegLast *Neg NegFirst post-verbal discont. and post-v 6. *Neg NegLast NegFirst post-verbal post-verbal Megfigyelt tipológia: 3 tiszta és 2 kevert típus. Jóslat a tipológiára: - Hagyományos OT (H. de Swart): 3 tiszta típus. - Sztochasztikus OT (H. de Swart): 3 tiszta és 3 kevert típus. - SA-OT (Lopopolo and Biró): 3 tiszta és 2 kevert típus. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 28

Hierarchia kompetencia performancia 1. *Neg NegFirst NegLast pre-verbal pre-verbal 2. NegFirst *Neg NegLast pre-verbal pre-v and discont. 3. NegFirst NegLast *Neg discontinuous discontinuous 4. NegLast NegFirst *Neg discontinuous discontinuous 5. NegLast *Neg NegFirst post-verbal discont. and post-v 6. *Neg NegLast NegFirst post-verbal post-verbal Megfigyelt tipológia: 3 tiszta és 2 kevert típus. Jóslat a tipológiára: - Hagyományos OT (H. de Swart): 3 tiszta típus. - Sztochasztikus OT (H. de Swart): 3 tiszta és 3 kevert típus. - SA-OT (Lopopolo and Biró): 3 tiszta és 2 kevert típus. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 28

Iterált tanulás: a nyelvváltozás modellje (?) Öt ágens minden generációban, száz generáció. Egy-egy ágens az előző generáció minden ágensétől tanul. Tagadó mondat-típusok ebben a szimulált történeti korpuszban : A. Lopopolo and T. Biró. Language Evolution and SA-OT: The case of sentential negation. Computational Linguistics in the Netherlands Journal 1(2011):21 40. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 29

Áttekintés 1 Ami megjelenik a beszédben, és ami nem 2 Tanulóalgoritmusok 3 Tanulás információhiány mellett 4 Magyar magánhangzó-harmónia 5 További kutatási kérdések Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 30

Robust Interpretive Parsing (Tesar and Smolensky) /ab.ra.ka.dab.ra/ NONFINAL TROCHAIC FOOTREPULSION l 1. ab.ra.[ka.dáb].ra * w 2. [àb.ra].[ka.dáb].ra * * 3. [àb.ra].ka.[dáb.ra] * Teacher: FOOTREPULSION TROCHAIC NONFINAL, producing grammatical form : [àb.ra].ka.[dáb.ra]. Learner: NONFINAL TROCHAIC FOOTREPULSION, producing loser: ab.ra.[ka.dáb].ra. Learner hears àb.ra.ka.dáb.ra. Two possible candidates. The winner must have been, the best one, [àb.ra].[ka.dáb].ra. Compare w and l. Promote w-preferring constraints: none. Demote l-preferring constraints: FOOTREPULSION deadlock! Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 31

Robust Interpretive Parsing (Tesar and Smolensky) /ab.ra.ka.dab.ra/ NONFINAL TROCHAIC FOOTREPULSION l 1. ab.ra.[ka.dáb].ra * w 2. [àb.ra].[ka.dáb].ra * * 3. [àb.ra].ka.[dáb.ra] * Teacher: FOOTREPULSION TROCHAIC NONFINAL, producing grammatical form : [àb.ra].ka.[dáb.ra]. Learner: NONFINAL TROCHAIC FOOTREPULSION, producing loser: ab.ra.[ka.dáb].ra. Learner hears àb.ra.ka.dáb.ra. Two possible candidates. The winner must have been, the best one, [àb.ra].[ka.dáb].ra. Compare w and l. Promote w-preferring constraints: none. Demote l-preferring constraints: FOOTREPULSION deadlock! Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 31

Robust Interpretive Parsing (Tesar and Smolensky) /ab.ra.ka.dab.ra/ NONFINAL TROCHAIC FOOTREPULSION l 1. ab.ra.[ka.dáb].ra * w 2. [àb.ra].[ka.dáb].ra * * 3. [àb.ra].ka.[dáb.ra] * Teacher: FOOTREPULSION TROCHAIC NONFINAL, producing grammatical form : [àb.ra].ka.[dáb.ra]. Learner: NONFINAL TROCHAIC FOOTREPULSION, producing loser: ab.ra.[ka.dáb].ra. Learner hears àb.ra.ka.dáb.ra. Two possible candidates. The winner must have been, the best one, [àb.ra].[ka.dáb].ra. Compare w and l. Promote w-preferring constraints: none. Demote l-preferring constraints: FOOTREPULSION deadlock! Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 31

Robust Interpretive Parsing (Tesar and Smolensky) /ab.ra.ka.dab.ra/ NONFINAL TROCHAIC FOOTREPULSION l 1. ab.ra.[ka.dáb].ra * w 2. [àb.ra].[ka.dáb].ra * * 3. [àb.ra].ka.[dáb.ra] * Teacher: FOOTREPULSION TROCHAIC NONFINAL, producing grammatical form : [àb.ra].ka.[dáb.ra]. Learner: NONFINAL TROCHAIC FOOTREPULSION, producing loser: ab.ra.[ka.dáb].ra. Learner hears àb.ra.ka.dáb.ra. Two possible candidates. The winner must have been, the best one, [àb.ra].[ka.dáb].ra. Compare w and l. Promote w-preferring constraints: none. Demote l-preferring constraints: FOOTREPULSION deadlock! Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 31

Robust Interpretive Parsing (Tesar and Smolensky) /ab.ra.ka.dab.ra/ NONFINAL TROCHAIC FOOTREPULSION l 1. ab.ra.[ka.dáb].ra * w 2. [àb.ra].[ka.dáb].ra * * 3. [àb.ra].ka.[dáb.ra] * Teacher: FOOTREPULSION TROCHAIC NONFINAL, producing grammatical form : [àb.ra].ka.[dáb.ra]. Learner: NONFINAL TROCHAIC FOOTREPULSION, producing loser: ab.ra.[ka.dáb].ra. Learner hears àb.ra.ka.dáb.ra. Two possible candidates. The winner must have been, the best one, [àb.ra].[ka.dáb].ra. Compare w and l. Promote w-preferring constraints: none. Demote l-preferring constraints: FOOTREPULSION deadlock! Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 31

Revised Robust Interpretive Parsing (Biró 2013, JoLLI) /ab.ra.ka.dab.ra/ NONFINAL TROCHAIC FOOTREPULSION l 1. ab.ra.[ka.dáb].ra * 2. [àb.ra].[ka.dáb].ra * * 3. [àb.ra].ka.[dáb.ra] * w 0.5 0.5 0.5 Teacher: FOOTREPULSION TROCHAIC NONFINAL, [àb.ra].ka.[dáb.ra]. Learner: NONFINAL TROCHAIC FOOTREPULSION, l ab.ra.[ka.dáb].ra. Learner: w is either [àb.ra].[ka.dáb].ra or [àb.ra].ka.[dáb.ra]. Calculate (weighted) average, as winner violation profile. Compare it to loser. Promote w-preferring constraints: TROCHAIC. Demote l-preferring constraints: FOOTREPULSION and NONFINAL. solution: TROCHAIC NONFINAL FOOTREPULSION. Learner s new grammar different from, but equivalent to teacher s! Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 32

Revised Robust Interpretive Parsing (Biró 2013, JoLLI) /ab.ra.ka.dab.ra/ NONFINAL TROCHAIC FOOTREPULSION l 1. ab.ra.[ka.dáb].ra * 2. [àb.ra].[ka.dáb].ra * * 3. [àb.ra].ka.[dáb.ra] * w 0.5 0.5 0.5 Teacher: FOOTREPULSION TROCHAIC NONFINAL, [àb.ra].ka.[dáb.ra]. Learner: NONFINAL TROCHAIC FOOTREPULSION, l ab.ra.[ka.dáb].ra. Learner: w is either [àb.ra].[ka.dáb].ra or [àb.ra].ka.[dáb.ra]. Calculate (weighted) average, as winner violation profile. Compare it to loser. Promote w-preferring constraints: TROCHAIC. Demote l-preferring constraints: FOOTREPULSION and NONFINAL. solution: TROCHAIC NONFINAL FOOTREPULSION. Learner s new grammar different from, but equivalent to teacher s! Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 32

Revised Robust Interpretive Parsing (Biró 2013, JoLLI) /ab.ra.ka.dab.ra/ NONFINAL TROCHAIC FOOTREPULSION l 1. ab.ra.[ka.dáb].ra * 2. [àb.ra].[ka.dáb].ra * * 3. [àb.ra].ka.[dáb.ra] * w 0.5 0.5 0.5 Teacher: FOOTREPULSION TROCHAIC NONFINAL, [àb.ra].ka.[dáb.ra]. Learner: NONFINAL TROCHAIC FOOTREPULSION, l ab.ra.[ka.dáb].ra. Learner: w is either [àb.ra].[ka.dáb].ra or [àb.ra].ka.[dáb.ra]. Calculate (weighted) average, as winner violation profile. Compare it to loser. Promote w-preferring constraints: TROCHAIC. Demote l-preferring constraints: FOOTREPULSION and NONFINAL. solution: TROCHAIC NONFINAL FOOTREPULSION. Learner s new grammar different from, but equivalent to teacher s! Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 32

Revised Robust Interpretive Parsing (Biró 2013, JoLLI) /ab.ra.ka.dab.ra/ NONFINAL TROCHAIC FOOTREPULSION l 1. ab.ra.[ka.dáb].ra * 2. [àb.ra].[ka.dáb].ra * * 3. [àb.ra].ka.[dáb.ra] * w 0.5 0.5 0.5 Teacher: FOOTREPULSION TROCHAIC NONFINAL, [àb.ra].ka.[dáb.ra]. Learner: NONFINAL TROCHAIC FOOTREPULSION, l ab.ra.[ka.dáb].ra. Learner: w is either [àb.ra].[ka.dáb].ra or [àb.ra].ka.[dáb.ra]. Calculate (weighted) average, as winner violation profile. Compare it to loser. Promote w-preferring constraints: TROCHAIC. Demote l-preferring constraints: FOOTREPULSION and NONFINAL. solution: TROCHAIC NONFINAL FOOTREPULSION. Learner s new grammar different from, but equivalent to teacher s! Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 32

Revised Robust Interpretive Parsing (Biró 2013, JoLLI) /ab.ra.ka.dab.ra/ NONFINAL TROCHAIC FOOTREPULSION l 1. ab.ra.[ka.dáb].ra * 2. [àb.ra].[ka.dáb].ra * * 3. [àb.ra].ka.[dáb.ra] * w 0.5 0.5 0.5 Teacher: FOOTREPULSION TROCHAIC NONFINAL, [àb.ra].ka.[dáb.ra]. Learner: NONFINAL TROCHAIC FOOTREPULSION, l ab.ra.[ka.dáb].ra. Learner: w is either [àb.ra].[ka.dáb].ra or [àb.ra].ka.[dáb.ra]. Calculate (weighted) average, as winner violation profile. Compare it to loser. Promote w-preferring constraints: TROCHAIC. Demote l-preferring constraints: FOOTREPULSION and NONFINAL. solution: TROCHAIC NONFINAL FOOTREPULSION. Learner s new grammar different from, but equivalent to teacher s! Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 32

Revised Robust Interpretive Parsing (Biró 2013, JoLLI) /ab.ra.ka.dab.ra/ NONFINAL TROCHAIC FOOTREPULSION l 1. ab.ra.[ka.dáb].ra * 2. [àb.ra].[ka.dáb].ra * * 3. [àb.ra].ka.[dáb.ra] * w 0.5 0.5 0.5 Teacher: FOOTREPULSION TROCHAIC NONFINAL, [àb.ra].ka.[dáb.ra]. Learner: NONFINAL TROCHAIC FOOTREPULSION, l ab.ra.[ka.dáb].ra. Learner: w is either [àb.ra].[ka.dáb].ra or [àb.ra].ka.[dáb.ra]. Calculate (weighted) average, as winner violation profile. Compare it to loser. Promote w-preferring constraints: TROCHAIC. Demote l-preferring constraints: FOOTREPULSION and NONFINAL. solution: TROCHAIC NONFINAL FOOTREPULSION. Learner s new grammar different from, but equivalent to teacher s! Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 32

Revised Robust Interpretive Parsing (Biró 2013, JoLLI) Success rate of learning a random target grammar, as a function of parameter K max, for different update rules. Random initial grammar and random target grammar, with twelve constraints. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 33

Áttekintés 1 Ami megjelenik a beszédben, és ami nem 2 Tanulóalgoritmusok 3 Tanulás információhiány mellett 4 Magyar magánhangzó-harmónia 5 További kutatási kérdések Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 34

Mgh-harmónia: két kérdés, két kísérlet, két hallgatóval [Hetényi Eszterrel] vacilláló tövek gyorsbeszédben fotelnak fotelnek: változik-e a gyakoriság? Performanciahiba : aminek nő a gyakorisága a gyorsbeszédben, a normális beszédhez képest. [Füredi Misivel] vacilláló wug-tövek ragozása függ-e a frame-től? Hayes és Londe 2006: hádél és társai régi magyar szavakként beállítva. Intuíció: modern külföldi kütyüként beállítva nő a [+front] valószínűsége. (Lehet-e [-back, -front] allomorfja ezeknek a ragoknak?) Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 35

Vacilláló tövek gyorsbeszédben (Hetényi Eszterrel) Gyorsbeszédben kicsit nő a [+back] allofón gyakorisága Javaslat: [+front] (pl. fotelben) és [+back] (pl. fotelban). Grammatikus, ha érvényesül a lokális harmónia. Első interpretáció: gyorsbeszédben kevesebb idő telik el a hangsúlyos szótag és a szuffixum közt, ezért megnő a hatása. Második interpretáció: a gyorsbeszéd előnyben részesíti a kevésbé jelölt [+back] fonémát. Megjegyzés: a kísérletünkben összeadódott a beszédtempó és a kvízkérdés megoldásához szükséges mentális komputáció. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 36

Wug-tesztek (Füredi Misivel) Szignifikáns különbségek különböző frame-ek között. Különbség oka: a frame szemantikája vagy fonológiája, esetleg a szintaxisa? Még nyitott kérdés. Nincs szignifikáns különbség régi magyar és új külföldi között. Illetve: tárgyaknál inkább [+back], ha régi magyar; személyneveknél inkább [+back], ha új külföldi. Ontológiai kategóriák: ember, állat, növény, eszköz, term. tárgy. Hangszimbolika: inkább [+back], ha negatív konnotáció? Erős korreláció az előző item(ek)re adott válasszal! A kitöltő neme és a kitöltés napszakja: nem szignifikáns. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 37

Áttekintés 1 Ami megjelenik a beszédben, és ami nem 2 Tanulóalgoritmusok 3 Tanulás információhiány mellett 4 Magyar magánhangzó-harmónia 5 További kutatási kérdések Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 38

Összefoglalás helyett toborzás Ajánlott kutatási témák, a KAFA-csoporttal együttműködve: További gyorsbeszédes (vagy egyéb) (fonológiai vagy más) adatok gyűjtése, majd a kapott eredmények modellezése, pl. SA-OT-val/vel (vagy mással). Nyelvelsajátítás modelljei (pl. q-hg: adatgyűjtés, programozás). Az analógia kezelése Optimalitáselmélettel. Szociolingvisztikai jelenségek számítógépes OT-ban/ben. Dialektometria és egy dialektustérkép adatainak digitalizálása. Az OTKit programcsomag továbbfejlesztése. Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 39

Köszönöm a figyelmet! Biró Tamás: biro.tamas@btk.elte.hu Tools for Optimality Theory http://www.birot.hu/otkit/ Külön köszönet: Hetényi Eszter, Füredi Mihály, Mády Katalin Biró Tamás Ami megjelenik, és ami nem jelenik meg a beszédben 40