SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Hasonló dokumentumok
SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Sass Bálint MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola

Motiváció Eszközök és eljárások Eredmények Távlat. Sass Bálint

A HUNGLISH PÁRHUZAMOS KORPUSZ

Az igekötők gépi annotálásának problémái Kalivoda Ágnes

Reklám CL & LT Modell Mazsola Alkalmazás Példák Befejezés. Sass Bálint

A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás

A Mazsola KORPUSZLEKÉRDEZŐ

Nyelvelemzés sajátkezűleg a magyar INTEX rendszer. Váradi Tamás varadi@nytud.hu

Osztályvizsga Évfolyam: 8. osztály Írásbeli Időtartam 90p Nyelvi feladatlap

KORPUSZOK, LEKÉRDEZŐK, NEMZETI KORPUSZPORTÁL

A Hunglish Korpusz és szótár

Doktori téma A lényegesség mérése Kutatóeszköz Alkalmazás Befejezés. Sass Bálint

Lexikon és nyelvtechnológia Földesi András /

Könczöl Tamás. igazgató

Magyar nyelvtan tanmenet 4. osztály

Tanmenet a 10. évfolyam számára

Különírás-egybeírás automatikusan

Korpuszlekérdezők evolúciója

Kérdésfelvetés Alapmódszer Finomítás További lehetőségek. Sass Bálint

Zsemlyei János A MAI MAGYAR NYELV SZÓKÉSZLETE ÉS SZÓTÁRAI

MAGYAR NYELV ÉS IRODALOM VIZSGA 8. ÉVFOLYAM

A szótárról. 1. Mi ez?

Adamikné Jászó Anna Hangay Zoltán Nyelvi elemzések kézikönyve. Mozaik Oktatási Stúdió. Szeged.

DIGITÁLIS KOMPETENCIA FEJLESZTÉSE TANÍTÁSI ÓRÁKON

MAGYAR NYELV Tömbösített tanmenet 8. D évfolyam Helyesejtés, helyesírás, Kommunikáció Olvasás-szövegértés és szövegalkotás Mtk. 26./4.

Bevezetés a nyelvtudományba

Spanyol kezdőtől középfokig gigapack csomag részletes tematikája

középső o Nyelv eleje magasabban magas hátulja magasabban mély o Ajak kerekítés (labiális) rés (illabiális) o Hossz rövid hosszú Mássalhangzók o Idő

Dr`avni izpitni center MAGYAR NYELV ÉS IRODALOM. 1. feladatlap. Nem művészi szöveg elemzése. Kedd, február 01. / 60 perc

Nehogy a nyúl visz a puska! Mondat ez? Bizonyára te is látod,

SZAKMAI ÖNÉLETRAJZ Farkas Judit

A jövő iskolája. Dr. Magyar Bálint. Oktatási miniszter április

Blaho Sylvia, Sass Bálint & Simon Eszter. MTA Nyelvtudományi Intézet február 4.

A magyar létige problémái a számítógépes nyelvi elemzésben

Mazsola mindenkinek. Sass Bálint MTA Nyelvtudományi Intézet január 18. MSZNY 2018, Szeged

HEFOP/2005/ Felkészítés a kompetencia alapú. HEFOP/2006/2.1.5B Halmozottan hátrányos helyzetű tanulók integrált nevelése

BA Magyar szak I. évfolyam

Dr`avni izpitni center MAGYAR NYELV ÉS IRODALOM. 1. feladatlap. Nem művészi szöveg elemzése május 29., hétfő / 60 perc

Nagy Erika. Nyelvtanból Ötös. A magyar nyelvtan érthetően kicsiknek és nagyoknak.

MORFOLÓGIAI FELÉPÍTÉS

Nyelv-ész-gép Új technológiák az információs társadalomban

NT MAGYAR NYELV ÉS KOMMUNIKÁCIÓ 6. TANMENETJAVASLAT. (heti 2 óra, azaz évi 74 óra)

Osztályozóvizsga 1/13. K ANGOL NYELV

Nyelvészet. I. Témakör: Leíró nyelvtan

Kerettantervi ajánlás a helyi tanterv készítéséhez az EMMI kerettanterv 51/2012. (XII. 21.) EMMI rendelet 2. sz. melléklet

VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY Szerkesztette: Tanács Attila. Vincze Veronika

TARTALOM. Tartalom. 1. (Bevezető) fejezet A MAGYAR NYELV oldal. A határozott névelő: a gitár, az autó

PÁRHUZAMOS IGEI SZERKEZETEK

5. osztályos tananyag

Dr`avni izpitni center MAGYAR NYELV ÉS IRODALOM. 1. feladatlap. Nem művészi szöveg elemzése. Szombat, május 29. / 60 perc

Morfológia, szófaji egyértelműsítés. Nyelvészet az informatikában informatika a nyelvészetben október 9.

Irodalom Szövegértés, szövegfeldolgozás 9. NY Órakeret:36 óra

Igekötős szerkezetek a magyarban

ALAKTAN ELŐADÁS 1-2. Alaktan, morfológia tárgya. Morfológia és mondattan viszonya. Morfológia univerzalitása. A szó fogalma I. Alaktan belső ügyei

Igazgató: Szabó Győzőné

MAGYAR NYELV 5 8. Javasolt óraszámbeosztás

Nyelvtan, helyesírás 4. évfolyam. Tollal dolgozz! Ügyelj a külalakra! Jó munkát kívánunk!

A 2017 szeptemberétől érvényes kurzuslisták BA major szakosok nyelvészeti tárgyai

11. A reneszánsz világirodalmából, Petrarca vagy Boccaccio

A szóképzés. A szóalkotásnak az a módja, amikor a szótőhöz egy képző hozzájárulásával új szó jön létre.

MAGYAR NYELV a 8. évfolyamosok számára. MNy2 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

Klasszikus héber nyelv 4.: Szintaxis

Klasszikus héber nyelv 4.: Szintaxis

-közlés, latin eredetű szó, információt adunk és kapunk. célja: tájékoztatás, figyelemfelkeltés, érzelemkifejezés.

TARTALOMJEGYZÉK A TÁJÉKOZTATÁS TARTALOMJEGYZÉKE ÉRETTSÉGI

MISKOLCI MAGISTER GIMNÁZIUM TANMENET MAGYAR NYELV ÉS KOMMUNIKÁCIÓ

Tájékoztató a Zrínyi Ilona Gimnázium RAJZ ELİKÉSZÍTİ tanfolyamáról

Magyar nyelvtan. 5. osztály. I. félév I. A kommunikáció

MAGYAR NYELV a 8. évfolyamosok számára. MNy1 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

MAGYAR NYELV ÉS IRODALOM 5-8. MAGYAR NYELV. 5. évfolyam

A NEMZETI KÖZNEVELÉSI PORTÁL ÉS A DIGITÁLIS TANANYAGELEMEK BEMUTATÁSA KERESÉS, LEJÁTSZÁS ÉS FELADATKÉSZÍTÉS AZ NKP-N

-3- -a zavartalan munka biztosítása. - felolvasással, egyéni javítással. 2. Házi feladat ellenőrzése: Tk. 100/12. FOM

Mi az? Többértelműség Kutatás NYELVTECHNOLÓGIA. Sass Bálint Pázmány Nap október 17.

HEFOP/2005/ Felkészülés a kompetenciaalapú

MAGYAR SZAKOS OSZTATLAN TANÁRKÉPZÉS, LEVELEZŐ

Keresztes László: Gyakorlati magyar nyelvtan

Európai Gazdasági és Monetáris Unió

A SZALÉZI SZENT FERENC GIMNÁZIUM PEDAGÓGIAI PROGRAMJÁNAK 1. SZ. MELLÉKLETE HELYI TANTERVEK

PTE BTK Magyar Nyelv- és Irodalomtudományi Intézet Nyelvtudományi Tanszék

EGY ÁLTALÁNOS MODELLNEK MEGFELELŐ

Mondatkiegészítés adott. Az írásmódtól eltérô. Mondatalkotás. pótlása. Hosszú mássalhangzós. Másolás. Mondatvégi írásjelek

A számítógépes nyelvészet elmélete és gyakorlata. Korpuszok

NYELVÉSZETI SZÖVEGKERESŐK, NEMZETI KORPUSZPORTÁL

MAGYAR NYELV a 8. évfolyamosok számára. MNy2 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

Nyelvtechnológia a lexikográfia szolgálatában Pajzs Júlia

PurePos: hatékony morfológiai egyértelműsítő modul

BA Magyar szak I. évfolyam

MAGYAR NYELV ÉS IRODALOM

ME BTK MAGYAR NYELV ÉS IRODALOM RÖVID CIKLUSÚ TANÁRKÉPZÉS. Mintatanterv

MAGYAR SZAKOS OSZTATLAN TANÁRKÉPZÉS, LEVELEZŐ

Osztatlan, közös képzés, nappali I. évfolyam

A KIPRÓBÁLÁSTÓL AZ ÁTDOLGOZÁSIG

SYLLABUS. Partiumi Keresztény Egyetem, Nagyvárad Bölcsészettudományi Kar magyar nyelv és irodalom

Osztatlan, közös képzés, nappali I. évfolyam

Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György

A kibővített Magyar történeti szövegtár új keresőfelülete

Sémi összehasonlító nyelvészet

ME BTK MAGYAR NYELV ÉS IRODALOM RÖVID CIKLUSÚ TANÁRKÉPZÉS Mintatanterv

Szíjártó Imre A MOZGÓKÉPKULTÚRA ÉS MÉDIAISMERET TANÍTÁSÁNAK MÓDSZERTANA

Átírás:

SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK A MAGYARÓRÁN Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály XVI. MANYE kongresszus Gödöllő, 2006. április 10-12.

1 AZ E-SZÓKINCS PROJEKT Célkitűzés Keretrendszer 2 NYELVI ADATBÁZIS Nyelvi erőforrások Bemutató 3 ELEKTRONIKUS TANANYAG A tananyag elkészítése A tananyag szerkezete Példák

1 AZ E-SZÓKINCS PROJEKT Célkitűzés Keretrendszer 2 NYELVI ADATBÁZIS Nyelvi erőforrások Bemutató 3 ELEKTRONIKUS TANANYAG A tananyag elkészítése A tananyag szerkezete Példák

CÉLKITŰZÉS Kortárs szépirodalmi nyelvi adatbázis és hozzá kapcsolódó elektronikus tananyag Jellemzők nyelvészetileg releváns kereshetőség kvantitatív vizsgálatok modern nyelvtechnológiai eszköztár bemutatása

KERETRENDSZER SDT (Sulinet Digitális Tudásbázis) kezdeményezés Cél: 12 évfolyamra kiterjedő, teljes tantervet lefedő elektronikus tananyag létrehozása Bárki által szerkeszthető, továbbfejleszthető Szaklektorálás ún. értékes közkincs Zárt egészet alkotó, szabadon kombinálható tananyagelemek Témák > foglalkozások > lapok http://sdt.sulinet.hu Sulinet Digitális Tudásbázis

AZ SDT NYITÓLAPJA

EGY SDT-S TANANYAGRÉSZ

1 AZ E-SZÓKINCS PROJEKT Célkitűzés Keretrendszer 2 NYELVI ADATBÁZIS Nyelvi erőforrások Bemutató 3 ELEKTRONIKUS TANANYAG A tananyag elkészítése A tananyag szerkezete Példák

NYELVI ERŐFORRÁSOK Szövegtár 20 millió szavas morfológiailag elemzett korpusz

NYELVI ERŐFORRÁSOK Szövegtár 20 millió szavas morfológiailag elemzett korpusz Alaktani táblázatok adott szó összes lehetséges ragozott alakja igei és névszói paradigmák megállapítása Elekfi László Magyar Ragozási Szótára alapján

NYELVI ERŐFORRÁSOK Szövegtár 20 millió szavas morfológiailag elemzett korpusz Alaktani táblázatok adott szó összes lehetséges ragozott alakja igei és névszói paradigmák megállapítása Elekfi László Magyar Ragozási Szótára alapján Gyakorisági listák szóalak / szótő / szófaj szerint adott kötet / szerzői életmű / teljes korpusz tekintetében

NYELVI ERŐFORRÁSOK Szövegtár 20 millió szavas morfológiailag elemzett korpusz http://corpus.nytud.hu/e-szokincs/szovegtar Alaktani táblázatok adott szó összes lehetséges ragozott alakja igei és névszói paradigmák megállapítása Elekfi László Magyar Ragozási Szótára alapján http://corpus.nytud.hu/e-szokincs/alaktan Gyakorisági listák szóalak / szótő / szófaj szerint adott kötet / szerzői életmű / teljes korpusz tekintetében http://corpus.nytud.hu/e-szokincs/gyakorisag

BEMUTATÓ - SZÖVEGTÁR

BEMUTATÓ - SZÖVEGTÁR

BEMUTATÓ - SZÖVEGTÁR

BEMUTATÓ - SZÖVEGTÁR

BEMUTATÓ - ALAKTANI TÁBLÁZATOK

BEMUTATÓ - ALAKTANI TÁBLÁZATOK

BEMUTATÓ - GYAKORISÁGI LISTÁK

A GYAKORISÁGI TÁBLÁZATOK HASZNÁLATA Tamási Áron és Kálnoky László szavai Tamási Áronnál: a kötőszavak (mint, ha, vagy stb.) sokkal ritkábbak leggyakoribb igék: van, mond van, tud Kálnoky Lászlónál: nagyobb szókincs Nemes Nagy Ágnes két művének leggyakoribb főnevei Szó és szótlanság: vers, szó, költő, kép, költészet Az aranyecset: kéz, szem, ecset, ember, nap

1 AZ E-SZÓKINCS PROJEKT Célkitűzés Keretrendszer 2 NYELVI ADATBÁZIS Nyelvi erőforrások Bemutató 3 ELEKTRONIKUS TANANYAG A tananyag elkészítése A tananyag szerkezete Példák

A TANANYAG ELKÉSZÍTÉSE Több mint 24 tanórányi anyag Gyakorló magyarszakos pedagógusok munkája Magyarázatok, feladatok, tesztsorok http://sdt.sulinet.hu Sulinet Digitális Tudásbázis (2006. tavaszától??)

A TANANYAG SZERKEZETE Az adatbázisok használatának leírása

A TANANYAG SZERKEZETE Az adatbázisok használatának leírása Fejezetek az alaktan és a mondattan köréből

A TANANYAG SZERKEZETE Az adatbázisok használatának leírása Fejezetek az alaktan és a mondattan köréből Hangalak és jelentés

A TANANYAG SZERKEZETE Az adatbázisok használatának leírása Fejezetek az alaktan és a mondattan köréből Hangalak és jelentés Nyelvváltozás

A TANANYAG SZERKEZETE Az adatbázisok használatának leírása Fejezetek az alaktan és a mondattan köréből Hangalak és jelentés Nyelvváltozás Nyelvhelyesség

A TANANYAG SZERKEZETE Az adatbázisok használatának leírása Fejezetek az alaktan és a mondattan köréből Hangalak és jelentés Nyelvváltozás Nyelvhelyesség Helyesírás

TIPIKUS FELADAT ÖSSZETETT MONDATOK SZÖVEGTÁRHASZNÁLAT 9. ÉVF 1 Keressen ki a szövegtárból összetett példamondatokat az alábbi módon! 2 Legyen az első keresett szó valamelyik kötőszó! pl.: hogy, és, is, vagy, akár, de, bár, ám, noha, mert, ezért, így, emiatt, mint, mintha stb. 3 A példamondatok közül válassza ki azokat, amelyekben valóban tagmondatokat köt össze a beírt kötőszó! Határozza meg az összetétel fajtáját! 4 Figyelje meg, hogy a példamondatokban gyakran csak szavakat vagy szószerkezeteket köt össze az illető kötőszó, tehát ha kötőszavakra keresünk rá, akkor nem találunk automatikusan összetett mondatokat.

TIPIKUS FELADAT BIRTOKVISZONY ALAKTANI TÁBLÁZATOK HASZNÁLATA 9. ÉVF 1 Az alaktani táblázatokból keresse ki különböző névszók birtokos alakjait. pl.: szó, fül, ház, olvasó, apa 2 Ezekből válassza külön a ragos és a jeles alakokat! 3 Jelölje meg közülük az egyalakú illetve a többalakú toldalékokat! 4 Van-e a birtokviszonyt kifejező toldalékok között többjelentésű?

KÖZREMŰKÖDTEK Pedagógusok Csábi Domonkos Hamza Ágnes Kulin Ágnes Szűcs Gábor Tilless Béláné Számítógépes nyelvészek Váradi Tamás (osztályvezető) Nagy Viktor Oravecz Csaba Sass Bálint

ÖSSZEGZÉS A bemutatott nyelvi erőforrások az interneten keresztül használhatók. http://corpus.nytud.hu/e-szokincs Az SDT-be integrált tananyag 2006. tavaszától (??) lesz elérhető. http://sdt.sulinet.hu A tapasztalatokról várjuk visszajelzéseiket. joker@nytud.hu

ÖSSZEGZÉS A bemutatott nyelvi erőforrások az interneten keresztül használhatók. http://corpus.nytud.hu/e-szokincs Az SDT-be integrált tananyag 2006. tavaszától (??) lesz elérhető. http://sdt.sulinet.hu A tapasztalatokról várjuk visszajelzéseiket. joker@nytud.hu Köszönöm a figyelmet!