Reklám CL & LT Modell Mazsola Alkalmazás Példák Befejezés. Sass Bálint

Hasonló dokumentumok
A Mazsola KORPUSZLEKÉRDEZŐ

Doktori téma A lényegesség mérése Kutatóeszköz Alkalmazás Befejezés. Sass Bálint

Sass Bálint MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola

Motiváció Eszközök és eljárások Eredmények Távlat. Sass Bálint

Kérdésfelvetés Alapmódszer Finomítás További lehetőségek. Sass Bálint

KORPUSZNYELVÉSZETI ESZKÖZ A MAGYAR IGÉK B VÍTMÉNYSZERKEZETÉNEK VIZSGÁLATÁRA

A HUNGLISH PÁRHUZAMOS KORPUSZ

SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás

Mazsola eszköz a magyar igék bővítményszerkezetének vizsgálatára

A nyelvtechnológia alapjai

Mazsola mindenkinek. Sass Bálint MTA Nyelvtudományi Intézet január 18. MSZNY 2018, Szeged

Igekötős szerkezetek a magyarban

A magyar létige problémái a számítógépes nyelvi elemzésben

EGY ÁLTALÁNOS MODELLNEK MEGFELELŐ

Lexikon és nyelvtechnológia Földesi András /

KORPUSZOK, LEKÉRDEZŐK, NEMZETI KORPUSZPORTÁL

Mi az? Többértelműség Kutatás NYELVTECHNOLÓGIA. Sass Bálint Pázmány Nap október 17.

A szótárról. 1. Mi ez?

Az igekötők gépi annotálásának problémái Kalivoda Ágnes

Igei szerkezetek gyakorisági szótára

Korpuszlekérdezők evolúciója

PÁRHUZAMOS IGEI SZERKEZETEK

A Hunglish Korpusz és szótár

28 millió szintaktikailag elemzett mondat és igei szerkezet

A vonzatosság alternatív felfogása

2001-ben végze Eötvös-kollégistaként. angol nyelv és irodalom szakán, majd 2006 júliusában

Igei szerkezetek gyakorisági szótára

Korpusznyelvészet április 18., ELTE. Sass Bálint MTA Nyelvtudományi Intézet 1/29

IGEI SZERKEZETEK GYAKORISÁGI SZÓTÁRA

Bevezetés a nyelvtudományba Mondattan (szintaxis) Kiegészítés

A számítógépes nyelvészet elmélete és gyakorlata. Korpuszok

BEVEZETÉS A NYELVTUDOMÁNYBA

Igei szerkezetek gyakorisági szótára félautomatikus szótárkészítés nyelvtechnológiai eszközök segítségével

Bevezetés a nyelvtechnológiába 10. Korpuszok (és még néhány dolog, ami eddig kimaradt...)

I. Alkalmazott Nyelvészeti Doktorandusz Konferencia. Budapest,

A kibővített Magyar történeti szövegtár új keresőfelülete

VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY Szerkesztette: Tanács Attila. Vincze Veronika

Nyelvelemzés sajátkezűleg a magyar INTEX rendszer. Váradi Tamás varadi@nytud.hu

Félig kompozicionális fınév + ige szerkezetek a számítógépes nyelvészetben *

Sémi összehasonlító nyelvészet

Magyar nyelvű történeti korpuszok

Strukturált nyelvi adatbázis létrehozása gépi tanulási módszerekkel. Kutatási terv

Lexikológia, lexikográfia a MID oktatásában

Szemantika: modalitás, kompozicionalitás. Nyelvészet az informatikában informatika a nyelvészetben november 13.

. Argumentumszerkezet: Lexikai szabályok, vagy konstrukciók? Kálmán László március 6.

SZAKMAI ÖNÉLETRAJZ Farkas Judit

Ahhoz, hogy mondatok halmazát érthetô egésszé, szöveggé rakd

Üzleti szemlélet és a magyar nyelv támogatása a többnyelvű világban

Nyelvtechnológia a lexikográfia szolgálatában Pajzs Júlia

Különírás-egybeírás automatikusan

A terminológiai adatbázisok gyakorlati haszna a terminológia és a fordító- tolmácsképzésben. Networkshop Április , Pécs

TANMENET NYELVTAN ÉS FOGALMAZÁS

A számítógépes nyelvészet elmélete és gyakorlata. Formális nyelvek elmélete

A Szótári Osztály évi jelentése

Babeş-Bolyai Tudományegyetem, Kolozsvár Bölcsészkar es tanév III. év, II. félév. I. Általános információk

Szakmai önéletrajz. Főbb tevékenységek elméleti nyelvészeti kutatások alkalmával asszisztensi feladatok ellátása

Él vagy élettelen? 1. Bevezetés. Szeged, december Sass Bálint. Hogyan fordítanánk angolra az alábbi két magyar mondatot?

FŐNÉVI VONZATOK A MAGYAR NYELVBEN

Magyar nyelvű néprajzi keresőrendszer

Keresés korpuszban október 19., SZTE JGYPK Sass Bálint MTA Nyelvtudományi Intézet

2

Szövetségi (föderatív) jogosultságkezelés

SEGÉDKÖNYVEK A NYELVÉSZET TANULMÁNYOZÁSÁHOZ XXVIII. Szerkesztette KIEFER FERENC

JÓÍZŰ MAZSOLÁZÁS A KORPUSZBÓL

ELTE Bölcsészettudományi Kar Fordítástudományi Doktori Program

Egy nyelvészbarát szövegfeldolgozó eszköz: a NooJ

Explicitáció és implicitáció a fordítói kompetencia függvényében. Makkos Anikó Robin Edina ELTE Fordítástudományi Doktori program

Szabó Martina Katalin

Intelligens elektronikus szótár és lexikai adatbázis

KÁROLY KRISZTINA SZÖVEGKOHERENCIA A FORDÍTÁSBAN

MIKOVINY SÁMUEL TÉRINFORMATIKAI EMLÉKVERSENY

2 kultúra. Zétényi Tamás.

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

Európai Gazdasági és Monetáris Unió

Számítógépes nyelvészet

A nyelvtechnológia hatása napjaink lexikográfiájára

Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György

A Szótári Osztály évi jelentése

Páros összehasonlítás mátrixok empirikus vizsgálata. Bozóki Sándor

Matematika. 1. évfolyam. I. félév

Syllabus. Partiumi Keresztény Egyetem, Nagyvárad Bölcsészettudományi Kar Magyar nyelv és irodalom

A nem tipikus szövegek jelentésreprezentációjának egy kérdéséről

A félig kompozicionális szerkezetek gépi fordításainak lehetőségéről

Közgazdász hallgatók szaknyelvi készségeinek fejlesztése elektronikus tananyag segítségével

A szóhasonlóság mértékének tesztelése CVCVC szerkezetű hangkivető főnevekkel. Rung András BME Fizikai Intézet

LiLe projekt: Adatbázis mint dinamikus korpusz

E ö t v ö s Lo r án d T u d o mányeg y e t e m B ö l cs é s z et t u d o mányi Kar. Fodor Antónia. aux XIV e -XV e siècles

Szintaxis: elemzések. Nyelvészet az informatikában informatika a nyelvészetben november 6.

Blaho Sylvia, Sass Bálint & Simon Eszter. MTA Nyelvtudományi Intézet február 4.

A Duna részvízgyűjtő kiemelt víztestjeire vonatkozó intézkedések

A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága

10. Morfológia és statisztikai grammatika Morfémák és variációszámok

0. előadás Motiváció

Károlyi Mihály Magyar Spanyol Tannyelvű Gimnázium SZÓBELI ÉRETTSÉGI TÉTELEK MAGYAR NYELV ÉS IRODALOMBÓL C

Beszéd- és nyelvelemző szoftverek a versenyképességért és az esélyegyenlőségért

Igei bővítménykeretek fordítási ekvivalenseinek kinyerése mélyen elemzett párhuzamos korpuszból

Anexa 3. CLASA a V-a OBIECTIVE DE REFERINŢĂ ŞI EXEMPLE DE ACTIVITĂŢI DE ÎNVĂŢARE. 1. A szóbeli közlés megértése

Az anyanyelv hatásának tükrözõdése a spanyol névszórendszerben a magyar tanulóknál

Nyelvészet. I. Témakör: Leíró nyelvtan

Átírás:

ESZKÖZ A MAGYAR IGÉK BŐVÍTMÉNYSZERKEZETÉNEK VIZSGÁLATÁRA Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE ITK, MMT Doktori Iskola, Nyelvtechnológia Doktori Program Nyelvészdoktoranduszok 11. Országos Konferenciája Szeged, 2007. december 6 7.

1 REKLÁM 2 CL & LT 3 MODELL 4 MAZSOLA 5 ALKALMAZÁS 6 PÉLDÁK

SIMONYI ZSIGMOND "Simonyi új grammatikai módszert akar behozni, könyve inductive halad, azaz a példákból kiindulva tanítja a szabályt, nem pedig dogmatice. A grammaticát tehát valami olvasmány alapján akarja előadni, úgy hogy a szabályokat a tanár tanítványai közreműködésével vonhatja le ésszerű következtetések útján. Ilyenképp tehát ezen módszer véget vet a lelketlen magolásnak, és azt észfejlesztő inductióval pótolja. Eszerint a szabályok is mélyebben vésődnek be a gyermek emlékezetébe, mert amit magunk találunk, azt jobban tudjuk, mint amit más mond vagy más tanultat velünk." (Riedl Frigyes 1882)

KÉT VÉLEMÉNY 2006-BÓL K. Komlósy András: "A korpusznál jobban semmi nem vezetheti félre az embert." K. Kornai András: "Manapság már a full-introspektív nyelvészre nézünk furán."

NÉHÁNY SZEMPONT korpusznyelvészet: valódi, élő nyelvi adatok szisztematikus vizsgálata A korpusznyelvészeti kutatóeszköz: összegzi a korpuszból leszűrhető tényeket, elméleti nyelvészeti kérdések vizsgálatához szolgáltathat nyelvi adatokat. a korpusz a tipikus nyelvhasználatot bemutató példamondatok adekvát forrása serendipity principle: jelentős dolog véletlen felfedezése, mikor valami egész másra figyelünk

CORPUS LINGUISTICS AND LINGUISTIC THEORY Felvetés a folyóiratban: A nyelvtan feladata nem kizárólag az, hogy a grammatikus és a nem grammatikus mondatokat elkülönítse egymástól. Arra kell megmagyarázatot találnia, hogy bizonyos adott esetben nem grammatikus megnyilatkozások miért jelennek meg, és bizonyos adott esetben grammatikusak miért nem. a meg-(nem)-jelenés az elsődleges, és ennek csak ez egy szempontja a grammatikalitás. ld: Stefanowitsch (2006), Sampson (2007) Cél: erre a gyakorlati munka során már hasznosnak bizonyult eszközre felhívni az elméleti nyelvészek figyelmét

MONDATMODELL: POZÍCIÓK ÉS SZINTEK mondat = ige + a mellette álló bővítmények (fej + eset) halmaza PÉLDA A lány vállat vont. von lány váll-t (morfoszintaktikai) pozíciók vannak szabad és kötött pozíciók bővítménykeret bővítményszerkezet

MONDATMODELL: POZÍCIÓK ÉS SZINTEK PÉLDA: BŐVÍTMÉNYSZERKEZET von kétségbe vmit von vállat von vmit von felelősségre vkit összetett igék: önálló igék, önálló bővítményszerkezettel, önálló jelentéssel PÉLDA vesz vesz részt vesz górcső alá más keret sokszor más jelentés, más igével való fordítás

MONDATMODELL: POZÍCIÓK ÉS SZINTEK szabad és kötött pozíciók általánosabban: szintek kétszintű modell: eset + szótő egy lehetséges ötszintű modell: LOC + eset + élőség + szótő + jelző

LÉNYEGESSÉG Lényeges kollokációk megragadására van jó eszközünk: az ún. salience mérték Adott pozíción álló bővítménynek a keret többi részéhez viszonyított salience-ét tudjuk kiszámolni. Ez az érték akkor sok, ha a bővítmény és a keret a vártnál gyakrabban fordul elő együtt, és a bővítmény gyakori. Amit vizsgálni tudunk: Melyek a lényeges szótövek, melyek egy adott keret egy adott pozícióját betölthetik?... beleértve az összetett igéket is.

A MAZSOLA FELÜLET HASZNÁLATA A teljes Magyar Nemzeti Szövegtár elérhető Előfeldolgozás: tagmondatra bontás, részleges szintaktikai elemzés, igető és pozíciók azonosítása http://corpus.nytud.hu/mazsola Válaszidő: néhány másodperc

STÍLUSRÉTEGEK ÖSSZEHASONLÍTÁSA PÉLDA ad -t keret a Magyar Nemzetben és az Index fórumban közös elemekeltérések

PÉLDÁK hány -t fitty hány -ra szem kerül alá víz, kalapács, fennhatóság rejt alá véka hoz alá tető helyez alá vád vesz alá górcső, kalap, tűz Eredmény: összetett igék

HOL HASZNÁLTUK? készülő magyar-angol gépi fordítóprogram igei lexikai adatbázisának fejlesztésekor: speciálisan forduló lemmákat kerestünk a szabad keretekhez valós adatok, idiolektustól független, objektív munka; új jelentések, új használati módok felfedezése http://www.webforditas.hu magyar WordNet kialakításakor: jelentéselkülönítés összetett igék felvétele

TERVEK, LEHETŐSÉGEK magyar mint idegen nyelv oktatása magyar gyakorisági vonzatkeret-szótár alapjául szolgálhat lexikográfia: német-magyar valenciaszótár munkálatainak támogatására (OTKA) igék (és bővítmények) szemantikai osztályozása elméleti kutatás...

ELMÉLETI KUTATÁS elméleti eredmények tesztelése új nyelvi jelenségek felfedezése általánosíthatóság: az eszköz alkalmassá tehető bármilyen pozíciós szintes leírás kezelésére különféle nyelvek különféle kutatási kérdéseinek vizsgálatára alkalmas lehet, ha a kérdés megfogalmazható pozíciós szintes leírás formájában, és készül hozzá megfelelően kódolt korpusz. igekötő mint külön pozíció? vizsgálhatóvá válik: ki... vmiből, bele... vmibe

HOZZÁFÉRÉS http://corpus.nytud.hu/mazsola Tessék kipróbálni! felhasználói név: lingdok jelszó: 2007 Személyes jelszó igénylése: joker@nytud.hu Köszönöm a figyelmet!