EGY ÁLTALÁNOS MODELLNEK MEGFELELŐ

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "EGY ÁLTALÁNOS MODELLNEK MEGFELELŐ"

Átírás

1 EGY ÁLTALÁNOS MODELLNEK MEGFELELŐ SZERKEZETEK KINYERÉSE KORPUSZBÓL Sass Bálint MTA Nyelvtudományi Intézet Budapest, június / 33

2 1 MAGYAR IGEI SZERKEZETEK Alapmodell és reprezentáció Jellegzetes szerkezetek kinyerése 2 ÁLTALÁNOSÍTÁS Nyelvfüggetlenség Absztrakt modell, alkalmazások Párhuzamos szerkezetek 2 / 33

3 1 MAGYAR IGEI SZERKEZETEK Alapmodell és reprezentáció Jellegzetes szerkezetek kinyerése 2 ÁLTALÁNOSÍTÁS Nyelvfüggetlenség Absztrakt modell, alkalmazások Párhuzamos szerkezetek 3 / 33

4 1 MAGYAR IGEI SZERKEZETEK Alapmodell és reprezentáció Jellegzetes szerkezetek kinyerése 2 ÁLTALÁNOSÍTÁS Nyelvfüggetlenség Absztrakt modell, alkalmazások Párhuzamos szerkezetek 4 / 33

5 BEVEZETŐ JELENTŐSÉG PÉLDÁK részt vesz vmiben, beleüti az orrát vmibe, szó van vmiről, hasznot húz vmiből, kétségbe von vmit, kockán forog vmi, górcső alá vesz vmit... Mik ezek? Vonzatos komplex igék: kollokációk és vonzatkeretek egyszerre gyakoriak, sokszor idiomatikus jelentéssel lexikai adatbázisba kellenek: tanulói szótárba és nyelvtechnológiai alkalmazások (pl.: gépi fordító) háttér-adatbázisába egyaránt 5 / 33

6 A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE szerkezet LKB LSzB részt vesz vmiben, -t -ban beleüti az orrát vmibe, -t -ba szó van vmiről, -ról hasznot húz vmiből, -t -ból kétségbe von vmit, -ba -t kockán forog vmi, -n górcső alá vesz vmit alá -t lexikálisan kötött bővítmény (LKB) lexikálisan szabad bővítmény (LSzB) A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök esetrag, névutó jelölik. 6 / 33

7 A VONZATOS KOMPLEX IGÉK FELÉPÍTÉSE A kollokátumot és a vonzatot ugyanazok a nyelvi eszközök esetrag, névutó jelölik. Egy igén belül is előfordul a szerepek felcserélődése: szerkezet LKB LSzB pillantást vet vmire -t -ra szemére vet vmit -ra -t Feladat: ezek szétválasztása, az LKB-k, LSzB-k azonosítása. 7 / 33

8 KÖVETELMÉNYEK Egy olyan lexikai kinyerő eljárásra van szükség, mely... képes korpusz alapján az igei szerkezeteket azonosítani; képes felismerni, elkülöníteni, hogy mikor melyik esetrag melyik szerepnek felel meg: azaz melyik bővítmény LKB és melyik LSzB; egyszerre állapítja meg a kollokátumokat és a vonzatokat, így teljes szerkezeteket eredményez. Következmény: Az algoritmus LKB-ket és LSzB-ket tetszőleges kombinációban tartalmazó szerkezeteket szolgáltat: így kollokációkat (csak LKB) és vonzatkereteket (csak LSzB) is. 8 / 33

9 MODELL szerkezetmodell: szerkezet = ige + bővítmények bővítmény = viszonyjelölő + tartalmi elem ige tart viszony viszony t ra t. e. t. e. igény egyúttal tagmondatmodell is: 1 tagmondat 1 igei szerkezet tagmondat-reprezentáció: csak LKB! pl.: India egész Kasmírra igényt tart. 9 / 33

10 1 MAGYAR IGEI SZERKEZETEK Alapmodell és reprezentáció Jellegzetes szerkezetek kinyerése 2 ÁLTALÁNOSÍTÁS Nyelvfüggetlenség Absztrakt modell, alkalmazások Párhuzamos szerkezetek 10 / 33

11 A KORPUSZTÓL A SZERKEZETEKIG tevékenység anyag példa tagmondatra bontás szintaktikai elemzés jellegzetes igei szerkezetek kinyerése korpusz reprezentáció igei szerkezetek Vess egy pillantást a térképre. ige=vet -t=pillantás -ra=térkép pillantást vet vmire 11 / 33

12 AZ ALGORITMUS VÁZLATA 1 Vesszük a korpusz tagmondatait a reprezentáció szerint. Maximum két bővítmény esetén: váltakozó törlés Társasház jön létre. (ige=jön - =társasház -ra=lét) társasház jön létre, jön létre, társasház jön -ra, jön -ra. 2 Hossz szerint csökkenő sorba rendezés. Hossz (h) = LSzB + LKB 2 3 A leghosszabbtól kezdve sorra elhagyjuk a ritka (f < 5) szerkezeteket. Az elhagyott szerkezetek gyakoriságát az első olyan rövidebb keret gyakoriságához adjuk hozzá, mely illeszkedik az eredeti keretre. pl.: társasház jön létre (h = 4) vmi jön létre (h = 3) 4 Visszaellenőrzés (köv. dia) 5 A megmaradó szerkezetek gyakorisági érték szerint rendezett listája adja az összegyűjtött igei szerkezeteket. 12 / 33

13 AZ ALGORITMUS VÁZLATA 1 Vesszük a korpusz tagmondatait a reprezentáció szerint. Maximum két bővítmény esetén: váltakozó törlés Társasház jön létre. (ige=jön - =társasház -ra=lét) társasház jön létre, jön létre, társasház jön -ra, jön -ra. 2 Hossz szerint csökkenő sorba rendezés. Hossz (h) = LSzB + LKB 2 3 A leghosszabbtól kezdve sorra elhagyjuk a ritka (f < 5) szerkezeteket. Az elhagyott szerkezetek gyakoriságát az első olyan rövidebb keret gyakoriságához adjuk hozzá, mely illeszkedik az eredeti keretre. pl.: társasház jön létre (h = 4) vmi jön létre (h = 3) 4 Visszaellenőrzés (köv. dia) 5 A megmaradó szerkezetek gyakorisági érték szerint rendezett listája adja az összegyűjtött igei szerkezeteket. 12 / 33

14 hossz 1. vesz röpcédulázás ban rész t [f = 1] (a) 4 2. vesz röpcédulázás ban t (d) 3 [f < 5] 3. vesz ban rész t (c) (b) 3 4. vesz ban t 2 13 / 33

15 A KORPUSZTÓL A SZERKEZETEKIG tevékenység anyag példa tagmondatra bontás szintaktikai elemzés jellegzetes igei szerkezetek kinyerése korpusz reprezentáció igei szerkezetek Vess egy pillantást a térképre. ige=vet -t=pillantás -ra=térkép pillantást vet vmire Igei szerkezetek szótára 14 / 33

16 1 MAGYAR IGEI SZERKEZETEK Alapmodell és reprezentáció Jellegzetes szerkezetek kinyerése 2 ÁLTALÁNOSÍTÁS Nyelvfüggetlenség Absztrakt modell, alkalmazások Párhuzamos szerkezetek 15 / 33

17 1 MAGYAR IGEI SZERKEZETEK Alapmodell és reprezentáció Jellegzetes szerkezetek kinyerése 2 ÁLTALÁNOSÍTÁS Nyelvfüggetlenség Absztrakt modell, alkalmazások Párhuzamos szerkezetek 16 / 33

18 NYELVFÜGGETLENSÉG Állítás: a modell nyelvfüggetlen. A magyaron kívül számos nyelvre előállítható a modell szerinti reprezentáció, és kinyerhetők a fenti típusú igei szerkezetek. Reprezentáció előállítása: viszonyjelölők meghatározása dán és szerb: elöljárók, alany és tárgy esetén sorrendiség dán példa: have brug for = szüksége van vmire szerb példa: ići u prilog = támogat ( haszonba megy ) obj brug have for 17 / 33

19 1 MAGYAR IGEI SZERKEZETEK Alapmodell és reprezentáció Jellegzetes szerkezetek kinyerése 2 ÁLTALÁNOSÍTÁS Nyelvfüggetlenség Absztrakt modell, alkalmazások Párhuzamos szerkezetek 18 / 33

20 AZ ABSZTRAKT MODELL A kinyerő algoritmus működésének feltétele: pusztán a fenti gráfstuktúrának megfelelő formájú reprezentáció. Megtehetjük tehát, hogy elvonatkoztatunk az eddigi tartalomtól, és egyéb szerkezeteket próbálunk meg ebben a struktúrában reprezentálni. beleüt t ba orr bővítmény jegy viszonyjelölő él vagy címke tartalmi elem csomópont 19 / 33

21 AZ ABSZTRAKT MODELL ALKALMAZÁSA 1/3 Névszói csoporttól különböző bővítmények kezelése. Főnévi igenév bővítmény. Határozószó bővítmény. fni adv kell csinálni, kell leperkálni... mindig akad, együtt él... Helyhatározó, időhatározó hasonlóan kezelhető, ha van ilyen annotáció a korpuszban. 20 / 33

22 AZ ABSZTRAKT MODELL ALKALMAZÁSA 2/3 Nem ige-központú szerkezetek kezelése: jellegzetes főnévi csoportok kinyerése. Jegyek: jelző, főnév esete, főnév száma, főnév birtokos személyragja saját lábán, száraz lábbal, belső fül, szabad szemmel szem jelzo szabad eset val Eset megjelenése: él helyett csomópont! 21 / 33

23 AZ ABSZTRAKT MODELL ALKALMAZÁSA 3/3 Többszintű függőségi struktúra kezelése. Tipikus eset: ige + főnévi bővítmény + főnév jelzője k b a j i c l d m j a l c i a+b k c+d m Visszavezetés az egyszintű modellre: kisimítás 22 / 33

24 AZ ABSZTRAKT MODELL ALKALMAZÁSA 3/3 Többszintű függőségi struktúra kezelése. Holland példák részletesen elemzett korpuszból. holland: magyar: holland: magyar: holland: magyar: ige=speel obj=rol obj+adj=belangrijk jelentős szerepet játszik ige=bewaar in=verpakking in+adj=oorspronkelijk eredeti csomagolásban tárol ige=breng tot=einde tot+adj=goed obj sikerre ( jó befejezésig ) visz vmit 23 / 33

25 AZ ABSZTRAKT MODELL ALKALMAZÁSA 3/3 Többszintű függőségi struktúra kezelése. Holland példák részletesen elemzett korpuszból. holland: magyar: holland: magyar: holland: magyar: ige=speel obj=rol obj+adj=belangrijk jelentős szerepet játszik ige=bewaar in=verpakking in+adj=oorspronkelijk eredeti csomagolásban tárol ige=breng tot=einde tot+adj=goed obj sikerre ( jó befejezésig ) visz vmit 23 / 33

26 1 MAGYAR IGEI SZERKEZETEK Alapmodell és reprezentáció Jellegzetes szerkezetek kinyerése 2 ÁLTALÁNOSÍTÁS Nyelvfüggetlenség Absztrakt modell, alkalmazások Párhuzamos szerkezetek 24 / 33

27 ÖTLET Párhuzamos korpusz és párhuzamos igei szerkezetek (igei szerkezetek és fordításaik) szintén reprezentálhatók a fenti módon. Ebből a reprezentációból a változatlan kinyerő eljárás közvetlenül párhuzamos szerkezeteket gyűjt. Hogyan lehet a módszert párhuzamos korpuszra alkalmazni? 25 / 33

28 ÖTLET Párhuzamos korpusz és párhuzamos igei szerkezetek (igei szerkezetek és fordításaik) szintén reprezentálhatók a fenti módon. Ebből a reprezentációból a változatlan kinyerő eljárás közvetlenül párhuzamos szerkezeteket gyűjt. Hogyan lehet a módszert párhuzamos korpuszra alkalmazni? Speciális reprezentáció: metakorpusz.... a kétnyelvű korpuszt egynyelvűnek álcázzuk 25 / 33

29 A METAKORPUSZ KIALAKÍTÁSA korpusz: Dutch Parallel Corpus, holland francia (3,5 mió token) elemzés: nyelvenként külön, tagmondatra bontás és részleges szintaktikai elemzés egyszerű szabályokkal 1 Tagmondat-szintű illesztés: a tagmondatokat fordítási egységenként sorra egymáshoz rendeltük. 2 Az egymáshoz rendelt tagmondatok holland ill. francia igéjéből: igepár. (pl.: gaan aller megy ) 3 A tagmondatpárban található bővítményeket (mindkét nyelvűeket) egy halmazként soroltuk fel az igepár mellett. holland tagmondat: francia tagmondat: magyar fordítás: reprezentáció: Ze geloofde in de grote liefde. Elle croyait au grand amour. Hitt a nagy szerelemben. ige=geloven croire in nl =liefde à fr =amour 26 / 33

30 A METAKORPUSZ KIALAKÍTÁSA Visszavezetés az eredeti modellre: összefésülés geloven subj in subj croire a ze liefde elle amour subjnl geloven croire in nl subj fr ze liefde elle amour a fr 27 / 33

31 A MÓDSZER ALKALMAZÁSA KÉT NYELVRE tevékenység holland francia korpusz korpusz Ze geloofde in de grote liefde. Elle croyait au grand amour. elemzés reprezentáció reprezentáció metakorpusz kialakítása ige=geloven in=liefde metakorpusz ige=croire à=amour ige=geloven croire in nl =liefde à fr =amour 28 / 33

32 A MÓDSZER ALKALMAZÁSA KÉT NYELVRE tevékenység holland francia korpusz korpusz Ze geloofde in de grote liefde. Elle croyait au grand amour. elemzés reprezentáció reprezentáció metakorpusz kialakítása kinyerés ige=geloven in=liefde metakorpusz ige=croire à=amour ige=geloven croire in nl =liefde à fr =amour párhuzamos igei szerkezetek ige=geloven croire in nl à fr 28 / 33

33 A MÓDSZER ALKALMAZÁSA KÉT NYELVRE tevékenység holland francia korpusz korpusz Ze geloofde in de grote liefde. Elle croyait au grand amour. elemzés reprezentáció reprezentáció metakorpusz kialakítása kinyerés ige=geloven in=liefde metakorpusz ige=croire à=amour ige=geloven croire in nl =liefde à fr =amour párhuzamos igei szerkezetek ige=geloven croire in nl à fr szétbontás geloven in croire à 28 / 33

34 PÉLDÁK ASZIMMETRIA eredmény: aszimmetrikus szerkezetek GYENGE (TARTALMI) ASZIMMETRIA houden van = aimer OBJ szeret vmit ERŐS (FORMAI) ASZIMMETRIA nemen deel aan = participer à részt vesz vmiben zijn van toepassing op = appliquer se à vonatkozik vmire 29 / 33

35 PÉLDÁK ASZIMMETRIA eredmény: aszimmetrikus szerkezetek GYENGE (TARTALMI) ASZIMMETRIA houden van = aimer OBJ szeret vmit ERŐS (FORMAI) ASZIMMETRIA nemen deel aan = participer à részt vesz vmiben zijn van toepassing op = appliquer se à vonatkozik vmire 29 / 33

36 PÉLDÁK ASZIMMETRIA eredmény: aszimmetrikus szerkezetek GYENGE (TARTALMI) ASZIMMETRIA houden van = aimer OBJ szeret vmit ERŐS (FORMAI) ASZIMMETRIA nemen deel aan = participer à részt vesz vmiben zijn van toepassing op = appliquer se à vonatkozik vmire 29 / 33

37 PÉLDÁK SZINONIMÁK eredmény: szinonimák adott szerkezet több megfelelője + gyakorisági viszonyokkal agir se de szó van róla, szóban forog, illeti, vonatkozik szerkezet négy fordítása: holland megfelelő gyakorisági érték gaan om 114 zijn OBJ 69 betreffen OBJ 27 gaan over 24 lexikográfiai felhasználás gépi fordítás: további szabályokat lehet tanulni, hogy melyik fordítás milyen feltételek mellett alkalmazandó 30 / 33

38 PÉLDÁK IDIOMATIKUS MEGFELELŐK eredmény: idiomatikus megfelelők IGÉK maken deel van = faire partie de részét képezi vminek doen beroep op = faire appel à támaszkodik vmire ELÖLJÁRÓK nemen deel aan = participer à részt vesz vmiben doen beroep op = faire appel à fellebbez vkihez hebben effect op = avoir effet sur hatása van vmire houden van = aimer OBJ szeret vmit 31 / 33

39 PÉLDÁK IDIOMATIKUS MEGFELELŐK eredmény: idiomatikus megfelelők IGÉK maken deel van = faire partie de részét képezi vminek doen beroep op = faire appel à támaszkodik vmire ELÖLJÁRÓK nemen deel aan = participer à részt vesz vmiben doen beroep op = faire appel à fellebbez vkihez hebben effect op = avoir effet sur hatása van vmire houden van = aimer OBJ szeret vmit 31 / 33

40 PÉLDÁK IDIOMATIKUS MEGFELELŐK eredmény: idiomatikus megfelelők IGÉK maken deel van = faire partie de részét képezi vminek doen beroep op = faire appel à támaszkodik vmire ELÖLJÁRÓK nemen deel aan = participer à részt vesz vmiben doen beroep op = faire appel à fellebbez vkihez hebben effect op = avoir effet sur hatása van vmire houden van = aimer OBJ szeret vmit 31 / 33

41 PÉLDÁK IDIOMATIKUS MEGFELELŐK eredmény: idiomatikus megfelelők IGÉK maken deel van = faire partie de részét képezi vminek doen beroep op = faire appel à támaszkodik vmire ELÖLJÁRÓK nemen deel aan = participer à részt vesz vmiben doen beroep op = faire appel à fellebbez vkihez hebben effect op = avoir effet sur hatása van vmire houden van = aimer OBJ szeret vmit 31 / 33

42 ÖSSZEFOGLALÁS 1/2 Sokféle szerkezet reprezentációja megfogalmazható a bemutatott absztrakt modellben, így ez az általános keret a változatlan kinyerő eljárással együttműködve számos típusú jellegzetes szerkezet kinyerésére alkalmassá tehető. igei szerkezetek névszói csoport bővítményekkel egyéb bővítményekkel jellegzetes névszói csoportok többszintű szerkezetek párhuzamos szerkezetek 32 / 33

43 ÖSSZEFOGLALÁS 2/2 Párhuzamos korpuszra alkalmazva a módszer kétnyelvű igei szerkezetek hasznos gyűjteményét képes előállítani. Felfedezi a formailag egymásra nem hasonlító, de egymásnak megfelelő, egymás fordításaiként kezelendő igei szerkezeteket is. A módszer egyszerre rendelkezik az alábbi tulajdonságokkal: igei kollokációkinyerés igei vonzatkeret-megállapítás megszakított és változó szórendű szerkezetek kezelése többnyelvű szerkezetek kinyerése párhuzamos korpuszból nyelvfüggetlen eljárás A jövőben hozzájárulhat kétnyelvű szótárak korpuszvezérelt anyaggyűjtési munkálataihoz. 33 / 33

44 ÖSSZEFOGLALÁS 2/2 Párhuzamos korpuszra alkalmazva a módszer kétnyelvű igei szerkezetek hasznos gyűjteményét képes előállítani. Felfedezi a formailag egymásra nem hasonlító, de egymásnak megfelelő, egymás fordításaiként kezelendő igei szerkezeteket is. A módszer egyszerre rendelkezik az alábbi tulajdonságokkal: igei kollokációkinyerés igei vonzatkeret-megállapítás megszakított és változó szórendű szerkezetek kezelése többnyelvű szerkezetek kinyerése párhuzamos korpuszból nyelvfüggetlen eljárás A jövőben hozzájárulhat kétnyelvű szótárak korpuszvezérelt anyaggyűjtési munkálataihoz. Köszönöm a figyelmet! 33 / 33

PÁRHUZAMOS IGEI SZERKEZETEK

PÁRHUZAMOS IGEI SZERKEZETEK PÁRHUZAMOS IGEI SZERKEZETEK KÖZVETLEN KINYERÉSE PÁRHUZAMOS KORPUSZBÓL Sass Bálint sass.balint@nytud.hu MTA Nyelvtudományi Intézet, Budapest MSZNY2010 Szeged, 2010. december 2-3. 1 EGYNYELVŰ IGEI SZERKEZETEK

Részletesebben

IGEI SZERKEZETEK GYAKORISÁGI SZÓTÁRA

IGEI SZERKEZETEK GYAKORISÁGI SZÓTÁRA IGEI SZERKEZETEK GYAKORISÁGI SZÓTÁRA EGY AUTOMATIKUS LEXIKAI KINYERŐ ELJÁRÁS ÉS ALKALMAZÁSA című doktori (Ph.D.) disszertáció nyilvános védése Sass Bálint sass.balint@itk.ppke.hu PPKE ITK Budapest, 2011.

Részletesebben

A Mazsola KORPUSZLEKÉRDEZŐ

A Mazsola KORPUSZLEKÉRDEZŐ A Mazsola KORPUSZLEKÉRDEZŐ Sass Bálint sass.balint@nytud.mta.hu MTA Nyelvtudományi Intézet PPKE ITK Eötvös Collegium Budapest, 2012. április 27. 1 / 34 1 HÁTTÉR 2 HASZNÁLAT 3 MIRE JÓ? 4 PÉLDÁK 2 / 34 1

Részletesebben

Motiváció Eszközök és eljárások Eredmények Távlat. Sass Bálint joker@nytud.hu

Motiváció Eszközök és eljárások Eredmények Távlat. Sass Bálint joker@nytud.hu VONZATKERETEK A MAGYAR NEMZETI SZÖVEGTÁRBAN Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály MSZNY2005 Szeged, 2005. december 8-9. 1 MOTIVÁCIÓ 2 ESZKÖZÖK

Részletesebben

Igei szerkezetek gyakorisági szótára

Igei szerkezetek gyakorisági szótára Igei szerkezetek gyakorisági szótára Egy automatikus lexikai kinyerő eljárás és alkalmazása doktori (Ph.D.) disszertáció tézisei Sass Bálint témavezető: Prószéky Gábor, az MTA doktora Pázmány Péter Katolikus

Részletesebben

A szótárról. 1. Mi ez?

A szótárról. 1. Mi ez? A szótárról 1. Mi ez? A szótár, amit az olvasó a kezében tart, a leggyakoribb magyar igei szerkezeteket tartalmazza. Egynyelvű szótár explicit szótári értelmezések nélkül; a szerkezeteket, azok jelentését

Részletesebben

Reklám CL & LT Modell Mazsola Alkalmazás Példák Befejezés. Sass Bálint

Reklám CL & LT Modell Mazsola Alkalmazás Példák Befejezés. Sass Bálint ESZKÖZ A MAGYAR IGÉK BŐVÍTMÉNYSZERKEZETÉNEK VIZSGÁLATÁRA Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE ITK, MMT Doktori Iskola, Nyelvtechnológia Doktori Program

Részletesebben

Igei szerkezetek gyakorisági szótára

Igei szerkezetek gyakorisági szótára Igei szerkezetek gyakorisági szótára Egy automatikus lexikai kinyerő eljárás és alkalmazása doktori (Ph.D.) disszertáció Sass Bálint témavezető: Prószéky Gábor, az MTA doktora Pázmány Péter Katolikus Egyetem,

Részletesebben

Sass Bálint MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola

Sass Bálint MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola IGEI VONZATKERETEK AZ MNSZ TAGMONDATAIBAN Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola MSZNY2006 Szeged, 2006.

Részletesebben

Doktori téma A lényegesség mérése Kutatóeszköz Alkalmazás Befejezés. Sass Bálint

Doktori téma A lényegesség mérése Kutatóeszköz Alkalmazás Befejezés. Sass Bálint MAZSOLA ESZKÖZ A MAGYAR IGÉK BŐVÍTMÉNYSZERKEZETÉNEK VIZSGÁLATÁRA Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE ITK, MMT Doktori Iskola, Nyelvtechnológia Doktori

Részletesebben

Kérdésfelvetés Alapmódszer Finomítás További lehetőségek. Sass Bálint

Kérdésfelvetés Alapmódszer Finomítás További lehetőségek. Sass Bálint ÉLŐ VAGY ÉLETTELEN? Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola MSZNY2007 Szeged, 2007. december 6 7. 1 KÉRDÉSFELVETÉS

Részletesebben

A HUNGLISH PÁRHUZAMOS KORPUSZ

A HUNGLISH PÁRHUZAMOS KORPUSZ A HUNGLISH PÁRHUZAMOS KORPUSZ MINT OKTATÁSI SEGÉDESZKÖZ Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály XVI. MANYE kongresszus Gödöllő, 2006. április

Részletesebben

28 millió szintaktikailag elemzett mondat és igei szerkezet

28 millió szintaktikailag elemzett mondat és igei szerkezet 28 millió szintaktikailag elemzett mondat és 500000 igei szerkezet Sass Bálint MTA Nyelvtudományi Intézet sass.balint@nytud.mta.hu Kivonat Két nagy méretű, magyar nyelvi erőforrást teszünk közzé. Az egyik

Részletesebben

SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK A MAGYARÓRÁN Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály XVI. MANYE kongresszus Gödöllő, 2006. április 10-12.

Részletesebben

Igei szerkezetek gyakorisági szótára félautomatikus szótárkészítés nyelvtechnológiai eszközök segítségével

Igei szerkezetek gyakorisági szótára félautomatikus szótárkészítés nyelvtechnológiai eszközök segítségével TANULMÁNYOK Alkalmazott Nyelvtudomány X. évfolyam 1-2. szám 2010. SASS BÁLINT ÉS PAJZS JÚLIA MTA Nyelvtudományi Intézet és PPKE ITK IMT Doktori Iskola sass.balint@nytud.hu, pajzs@nytud.hu Igei szerkezetek

Részletesebben

Lexikon és nyelvtechnológia Földesi András /

Lexikon és nyelvtechnológia Földesi András / Lexikon és nyelvtechnológia 2011.11.13. Földesi András / A nyelvi anyag feldolgozásának célja és módszerei Célunk,hogy minden egyes eleme számára leírjuk paradigmatikus alakjainak automatikus szintézisét.

Részletesebben

Mazsola mindenkinek. Sass Bálint MTA Nyelvtudományi Intézet január 18. MSZNY 2018, Szeged

Mazsola mindenkinek. Sass Bálint MTA Nyelvtudományi Intézet január 18. MSZNY 2018, Szeged Mazsola mindenkinek Sass Bálint MTA Nyelvtudományi Intézet 2018. január 18. MSZNY 2018, Szeged Példa http://corpus.nytud.hu/mazsola Lekérdezés: iszik + -t 2/15 Háttér adatbázis Ha a város a tárcáktól pénzt

Részletesebben

Igei bővítménykeretek fordítási ekvivalenseinek kinyerése mélyen elemzett párhuzamos korpuszból

Igei bővítménykeretek fordítási ekvivalenseinek kinyerése mélyen elemzett párhuzamos korpuszból Igei bővítménykeretek fordítási ekvivalenseinek kinyerése mélyen elemzett párhuzamos korpuszból Héja Enikő 1, Takács Dávid 1, Sass Bálint 1 1 MTA Nyelvtudományi Intézet {eheja,takdavid,sass.balint}@nytud.hu

Részletesebben

A magyar létige problémái a számítógépes nyelvi elemzésben

A magyar létige problémái a számítógépes nyelvi elemzésben A magyar létige problémái a számítógépes nyelvi elemzésben Dömötör Andrea PPKE BTK Nyelvtudományi Doktori Iskola Nyelvtechnológia Műhely Témavezető: Prószéky Gábor Komplex vizsga 2018. jún. 1. Létige:

Részletesebben

Az igekötők gépi annotálásának problémái Kalivoda Ágnes

Az igekötők gépi annotálásának problémái Kalivoda Ágnes Az igekötők gépi annotálásának problémái Kalivoda Ágnes Budapest, 2017. február 3. PPKE BTK Bevezetés Mi a probléma? Homográf szóalakok hibás szófaji címkét kaphatnak Mi a megoldás? Szabály alapú javítás

Részletesebben

FŐNÉVI VONZATOK A MAGYAR NYELVBEN

FŐNÉVI VONZATOK A MAGYAR NYELVBEN FŐNÉVI VONZATOK A MAGYAR NYELVBEN A doktori értekezés tézisei írta Kiss Margit Budapest 2005 I. Az értekezés témája, célja A vonzatosság kérdése régóta foglalkoztatja a nyelvtudományt. Már az 1800-as évek

Részletesebben

Intelligens elektronikus szótár és lexikai adatbázis

Intelligens elektronikus szótár és lexikai adatbázis Intelligens elektronikus szótár és lexikai adatbázis IHM-ITEM 48/2002 Oravecz Csaba MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály oravecz@nytud.hu Bevezetés a jelenlegi helyzet: nincs az informatikai

Részletesebben

a Szeged FC Treebankben

a Szeged FC Treebankben Szeged, 2014. január 16 17. 67 Többszintű szintaktikai reprezentáció kialakítása a Szeged FC Treebankben Simkó Katalin Ilona 1, Vincze Veronika 2, Farkas Richárd 1 1 Szegedi Tudományegyetem, TTIK, Informatikai

Részletesebben

Korpuszlekérdezők evolúciója

Korpuszlekérdezők evolúciója Korpuszlekérdezők evolúciója Sass Bálint sass.balint@nytud.mta.hu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály 2015. november 10. korpusz? lekérdező? 2 / 19 korpusz =

Részletesebben

KORPUSZOK, LEKÉRDEZŐK, NEMZETI KORPUSZPORTÁL

KORPUSZOK, LEKÉRDEZŐK, NEMZETI KORPUSZPORTÁL KORPUSZOK, LEKÉRDEZŐK, NEMZETI KORPUSZPORTÁL Sass Bálint sass.balint@nytud.mta.hu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály DHU2015 WS Számítógép az irodalomtudományban

Részletesebben

Mi az? Többértelműség Kutatás NYELVTECHNOLÓGIA. Sass Bálint Pázmány Nap október 17.

Mi az? Többértelműség Kutatás NYELVTECHNOLÓGIA. Sass Bálint Pázmány Nap október 17. NYELVTECHNOLÓGIA Sass Bálint sass@digitus.itk.ppke.hu Pázmány Nap 2007. október 17. 1 MI AZ? 2 TÖBBÉRTELMŰSÉG 3 KUTATÁS 1 MI AZ? 2 TÖBBÉRTELMŰSÉG 3 KUTATÁS BEVEZETŐ Language makes us human. Turing teszt

Részletesebben

A Hunglish Korpusz és szótár

A Hunglish Korpusz és szótár A Hunglish Korpusz és szótár Halácsy Péter 1, Kornai András 1, Németh László 1, Sass Bálint 2 Varga Dániel 1, Váradi Tamás 1 BME Média Oktató és Kutató Központ 1111 Budapest, Stoczek u. 2 {hp,nemeth,daniel}@mokk.bme.hu

Részletesebben

A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás

A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás varadi@nytud.mta.hu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály Tartalom Előzmény Motiváció Cél Fejlesztés Eredmény

Részletesebben

. Argumentumszerkezet: Lexikai szabályok, vagy konstrukciók? Kálmán László március 6.

. Argumentumszerkezet: Lexikai szabályok, vagy konstrukciók? Kálmán László március 6. Argumentumszerkezet: Lexikai szabályok, vagy konstrukciók? Kálmán László MTA/ELTE Elméleti nyelvészet kihelyezett tanszék MTA Nyelvtudományi Intézet kalmanlaszlo@nytudmtahu 2014 március 6 Kálmán László

Részletesebben

Klasszikus héber nyelv 4.: Szintaxis

Klasszikus héber nyelv 4.: Szintaxis Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2015. november 25. Témaválasztás házi dolgozatra (ע "ו ( igeragozás Ismétlés: Mondatok: Arnold & Choi 5. rész A mondat belső

Részletesebben

MAGYAR NYELV a 8. évfolyamosok számára. MNy2 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

MAGYAR NYELV a 8. évfolyamosok számára. MNy2 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ 8. évfolyam MNy2 Javítási-értékelési útmutató MAGYAR NYELV a 8. évfolyamosok számára MNy2 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ A javítási-értékelési útmutatóban feltüntetett válaszokra a megadott pontszámok adhatók.

Részletesebben

MAGYAR NYELV a 8. évfolyamosok számára. MNy2 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

MAGYAR NYELV a 8. évfolyamosok számára. MNy2 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ 8. évfolyam MNy2 Javítási-értékelési útmutató MAGYAR NYELV a 8. évfolyamosok számára MNy2 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ A javítási-értékelési útmutatóban feltüntetett válaszokra a megadott pontszámok adhatók.

Részletesebben

A kibővített Magyar történeti szövegtár új keresőfelülete

A kibővített Magyar történeti szövegtár új keresőfelülete A kibővített Magyar történeti szövegtár új keresőfelülete Sass Bálint MTA Nyelvtudományi Intézet sass.balint@nytud.mta.hu A nyelvtörténeti kutatások újabb eredményei IX. 2016. április 27., Szeged Nszt

Részletesebben

Klasszikus héber nyelv 4.: Szintaxis

Klasszikus héber nyelv 4.: Szintaxis Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2017. november 22. Visszajelzés a beadott házi feladatokkal és a negyedévi zh-val kapcsolatban igék ragozása ע "ו és ל "א

Részletesebben

Szintaxis: elemzések. Nyelvészet az informatikában informatika a nyelvészetben november 6.

Szintaxis: elemzések. Nyelvészet az informatikában informatika a nyelvészetben november 6. Szintaxis: elemzések Nyelvészet az informatikában informatika a nyelvészetben 2013. november 6. Bevezetés Múlt óra: mondatrészek Mai óra: Szintaktikai reprezentációs elméletek Ágrajzok Problémás jelenségek

Részletesebben

Klasszikus héber nyelv 4.: Szintaxis

Klasszikus héber nyelv 4.: Szintaxis Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2016. november 16. Félévközi ZH 45 perc open-book, Arnold-Choi 2 3. Témaválasztás házi dolgozatra Témaválasztás házi dolgozatra

Részletesebben

A tudásszint mérésének és mérhetőségének egy lehetőségéről

A tudásszint mérésének és mérhetőségének egy lehetőségéről HEGEDŰS RITA A tudásszint mérésének és mérhetőségének egy lehetőségéről A magyar nyelv "társtalanságából" eredő elszigeteltsége, nehézsége, bonyolultsága, sőt: megtanulhatatlansága a nagyszámú magyarul

Részletesebben

VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY 2011. Szerkesztette: Tanács Attila. Vincze Veronika

VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY 2011. Szerkesztette: Tanács Attila. Vincze Veronika VIII. Magyar Számítógépes Nyelvészeti Konferencia MSZNY 2011 Szerkesztette: Tanács Attila Vincze Veronika Szeged, 2011. december 1-2. http://www.inf.u-szeged.hu/mszny2011 Tartalomjegyzék I. Többnyelvuség

Részletesebben

Morfológia, szófaji egyértelműsítés. Nyelvészet az informatikában informatika a nyelvészetben október 9.

Morfológia, szófaji egyértelműsítés. Nyelvészet az informatikában informatika a nyelvészetben október 9. Morfológia, szófaji egyértelműsítés Nyelvészet az informatikában informatika a nyelvészetben 2013. október 9. Előző órán Morfológiai alapfogalmak Szóelemzések Ismeretlen szavak elemzése Mai órán Szófajok

Részletesebben

Tartalomjegyzék. Tartalomjegyzék

Tartalomjegyzék. Tartalomjegyzék Tartalomjegyzék A főnév 11 Kis és nagy kezdőbetűk 11 A főnevek neme 12 A főnevek többes száma 13 Nem megszámlálható főnevek 15 Csak többes számban használatos főnevek 16 Foglalkozások 17 Címek, rangok,

Részletesebben

Az optimális megoldást adó algoritmusok

Az optimális megoldást adó algoritmusok Az optimális megoldást adó algoritmusok shop ütemezés esetén Ebben a fejezetben olyan modellekkel foglalkozunk, amelyekben a munkák több műveletből állnak. Speciálisan shop ütemezési problémákat vizsgálunk.

Részletesebben

Francia Nyelvtan Világosan. Bemutatólecke 01.

Francia Nyelvtan Világosan. Bemutatólecke 01. Le français, c est facile! Claire La Grammaire vous explique tout! Francia Nyelvtan Világosan Bemutatólecke 01. A devoir, falloir, pouvoir, savoir segédigék használata A felsorolt módbeli segédigék használata

Részletesebben

Klasszikus héber nyelv 4.: Szintaxis

Klasszikus héber nyelv 4.: Szintaxis Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2014. november 19. Témaválasztás házi dolgozatra Ismétlés: rendhagyó igék A mondat belső szerkezete Az óra céljai: Emlékeztető

Részletesebben

Sass Bálint: Az igei szerkezetek algebrai struktúrája, avagy a duplakocka modell Argumentum 14 (2018), Debreceni Egyetemi Kiadó.

Sass Bálint: Az igei szerkezetek algebrai struktúrája, avagy a duplakocka modell Argumentum 14 (2018), Debreceni Egyetemi Kiadó. 12 Tanulmány Sass Bálint Az igei szerkezetek algebrai struktúrája, avagy a duplakocka modell Abstract In this paper, firstly (1) e define the general construction concept, and describe an abstract model

Részletesebben

Nyelvelemzés sajátkezűleg a magyar INTEX rendszer. Váradi Tamás varadi@nytud.hu

Nyelvelemzés sajátkezűleg a magyar INTEX rendszer. Váradi Tamás varadi@nytud.hu Nyelvelemzés sajátkezűleg a magyar INTEX rendszer Váradi Tamás varadi@nytud.hu Vázlat A történet eddig Az INTEX rendszer A magyar modul Az INTEX korlátai premier előtt: NooJ konklúziók, további teendők

Részletesebben

A vonzatosság alternatív felfogása

A vonzatosság alternatív felfogása A vonzatosság alternatív felfogása Kálmán László MTA Nyelvtudományi Intézet MTA/ELTE Elméleti Nyelvészet Kihelyezett Tanszék kalman.laszlo@nytud.mta.hu 2018. július 5. Kálmán (MTA/ELTE) Vonzatok 2018.

Részletesebben

Az új magyar Braille-rövidírás kialakítása

Az új magyar Braille-rövidírás kialakítása Az új magyar Braille-rövidírás kialakítása Sass Bálint sassbalint@nytudmtahu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály 2013 november 11 Braille-írás A vakok által

Részletesebben

Magyar C2 1 1 096 nyelvi programkövetelmény

Magyar C2 1 1 096 nyelvi programkövetelmény Magyar C2 1 1 096 nyelvi programkövetelmény A javaslattevő alapadatai Javaslatot benyújtó neve Nyelviskolák Szakmai Egyesülete A nyelvi képzésre vonatkozó adatok Nyelv megnevezése Nyelvi képzés szintje

Részletesebben

MAGYAR NYELV a 8. évfolyamosok számára. MNy2 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

MAGYAR NYELV a 8. évfolyamosok számára. MNy2 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ 8. évfolyam MNy2 Javítási-értékelési útmutató MAGYAR NYELV a 8. évfolyamosok számára MNy2 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ A javítási-értékelési útmutatóban feltüntetett válaszokra a megadott pontszámok adhatók.

Részletesebben

Nyelv-ész-gép Új technológiák az információs társadalomban

Nyelv-ész-gép Új technológiák az információs társadalomban Nyelv-ész-gép Új technológiák az információs társadalomban CESAR Csatlakozás az európai nyelvtechnológiai infrastruktúra élvonalához Lendvai Piroska piroska@nytud.hu CEntral and *Közép- és South-East EuropeAn

Részletesebben

Gyakori elemhalmazok

Gyakori elemhalmazok Gyakori elemhalmazok Bankó Tibor June 9, 2010 Bankó Tibor (BME) Gyakori elemhalmazok June 9, 2010 1 / 26 Tartalom 1 Bevezetés 2 Az algoritmusok Egy speciális eset Apriori Eclat FP-Growth 3 Az algoritmusok

Részletesebben

Az annotáció elvei. Oravecz Csaba MTA Nyelvtudományi Intézet {oravecz}@nytud.hu. MANYE vitaülés 2006. február 20.

Az annotáció elvei. Oravecz Csaba MTA Nyelvtudományi Intézet {oravecz}@nytud.hu. MANYE vitaülés 2006. február 20. Oravecz Csaba MTA Nyelvtudományi Intézet {oravecz}@nytud.hu MANYE vitaülés 2006. február 20. Bevezetés Nyelvi erőforrások, szöveges adatbázisok növekvő jelentősége. Bevezetés Nyelvi erőforrások, szöveges

Részletesebben

KOPI. Többnyelvű dokumentum nyelvének megállapítása MTA SZTAKI DSD. Vajna Miklós Pataki Máté MSZNY Department of Distributed Systems

KOPI. Többnyelvű dokumentum nyelvének megállapítása MTA SZTAKI DSD. Vajna Miklós Pataki Máté MSZNY Department of Distributed Systems KOPI MTA SZTAKI Department of Distributed Systems Többnyelvű dokumentum nyelvének megállapítása MSZNY 2011 Vajna Miklós Pataki Máté Probléma Természetes nyelvű dokumentum nyelvének a megállapítása Megoldott

Részletesebben

Á Ő ö Ö ő ú ő ö ő ú ö ő ö Á Ö ö Í ö ő ő ü ü ű ő Í ő ü ö ö ő ö ö ő Í ü ű Í Í Á Í Á Áú ú Í Ü ö ö É ú ü ö ú ö ü Í ő Á ő ü ő Á ú Ö Í Á Í ú Á ű Á ú ú Á ű ő ö ö ö ü ő Á Á Á Á Ő Á Á Ő É Á Á ö Í ő ü ü ü ö Á Í

Részletesebben

Főnévi csoportok és mondatvázak elemzésének lehetősége magyar nyelvű korpuszokon

Főnévi csoportok és mondatvázak elemzésének lehetősége magyar nyelvű korpuszokon Főnévi csoportok és mondatvázak elemzésének lehetősége magyar nyelvű korpuszokon Ligeti-Nagy Noémi Pázmány Doktori Konferencia Budapest, 2016. február 5. Háttér Performancia-alapú elemzés néhány kulcsmotívuma:

Részletesebben

Korpusznyelvészet április 18., ELTE. Sass Bálint MTA Nyelvtudományi Intézet 1/29

Korpusznyelvészet április 18., ELTE. Sass Bálint MTA Nyelvtudományi Intézet 1/29 Korpusznyelvészet 2016 április 18, ELTE Sass Bálint MTA Nyelvtudományi Intézet sassbalint@nytudmtahu 1/29 http://nsztnytudhu/nszthtml 2/29 Mi mindent kell csinálni ahhoz, hogy sima szövegből ilyen korpuszlekérdezőfelület

Részletesebben

Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel

Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel MTA SZTAKI Nyelvtechnológiai Kutatócsoport recski@sztaki.hu TLP20 2010. november 25. Tartalom Előzmények A feladat A hunchunk rendszer A

Részletesebben

KOPI. Fordítási plágiumok keresése MTA SZTAKI DSD. Pataki Máté MSZNY 2011. Department of Distributed Systems

KOPI. Fordítási plágiumok keresése MTA SZTAKI DSD. Pataki Máté MSZNY 2011. Department of Distributed Systems KOPI MTA SZTAKI Department of Distributed Systems Fordítási plágiumok keresése MSZNY 2011 Pataki Máté Probléma 1. Sok a diák 2. Hasznos anyagok az interneten 3. Digitális szakdolgozatok 4. Jó nyelvtudás

Részletesebben

Számítógépes Nyelvészet nyelvi adatbázisok és használatuk

Számítógépes Nyelvészet nyelvi adatbázisok és használatuk Számítógépes Nyelvészet nyelvi adatbázisok és használatuk Mesterséges Intelligencia előadás http://www.inf.u-szeged.hu/hlt 5/3/2011 1 Tartalom A számítógépes szövegfeldolgozás célja Nyelvi adatbázisok

Részletesebben

Különírás-egybeírás automatikusan

Különírás-egybeírás automatikusan Különírás-egybeírás automatikusan Ludányi Zsófia ludanyi.zsofia@nytud.mta.hu Magyar Tudományos Akadémia, Nyelvtudományi Intézet Nyelvtechnológiai Osztály VII. Alkalmazott Nyelvészeti Doktoranduszkonferencia

Részletesebben

Magyar nyelvű néprajzi keresőrendszer

Magyar nyelvű néprajzi keresőrendszer Szeged, 2013. január 7 8. 361 Magyar nyelvű néprajzi keresőrendszer Zsibrita János 1, Vincze Veronika 2 1 Szegedi Tudományegyetem, Informatikai Tanszékcsoport zsibrita@inf.u-szeged.hu 2 MTA-SZTE Mesterséges

Részletesebben

Bevezetés a nyelvtudományba. 7. Szemantika. Gerstner Károly Magyar Nyelvészeti Tanszék

Bevezetés a nyelvtudományba. 7. Szemantika. Gerstner Károly Magyar Nyelvészeti Tanszék Bevezetés a nyelvtudományba 7. Szemantika Gerstner Károly Magyar Nyelvészeti Tanszék Szemantika Jelentéstan minden nyelvi kategóriára kiterjed a nyelv mint jelrendszer megjeleníti a világot: a jeltárgyat

Részletesebben

API-MÁGIA MILLIÓ SORNYI ADAT ÚJRARENDEZÉSE. Előadó: Jaksa Zsombor, drungli.com

API-MÁGIA MILLIÓ SORNYI ADAT ÚJRARENDEZÉSE. Előadó: Jaksa Zsombor, drungli.com API-MÁGIA MILLIÓ SORNYI ADAT ÚJRARENDEZÉSE Előadó: Jaksa Zsombor, drungli.com MIRŐL FOG SZÓLNI AZ ELŐADÁS? Hogyan működik a drungli.com?# Adatok gyűjtése, stratégiák# Ha marad időm még mesélek HOGYAN MŰKÖDIK

Részletesebben

Klasszikus héber nyelv 4.: Szintaxis

Klasszikus héber nyelv 4.: Szintaxis Klasszikus héber nyelv 4.: Szintaxis BBN-HEB11-204 Koltai Kornélia, Biró Tamás 2016. november 23. Visszajelzés a beadott házi feladatokkal kapcsolatban Félévközi ZH eredménye (ע "ו ( igeragozás Ismétlés:

Részletesebben

Igekötős szerkezetek a magyarban

Igekötős szerkezetek a magyarban Igekötős szerkezetek a magyarban Kalivoda Ágnes 2018. június 26., Budapest PPKE BTK Nyelvtudományi Doktori Iskola Nyelvtechnológia Műhely Témavezető: Prószéky Gábor A kutatás célja az igekötős szerkezetek

Részletesebben

TARTALOM. Tartalom. 1. (Bevezető) fejezet A MAGYAR NYELV 11 16. oldal. A határozott névelő: a gitár, az autó

TARTALOM. Tartalom. 1. (Bevezető) fejezet A MAGYAR NYELV 11 16. oldal. A határozott névelő: a gitár, az autó 1. (Bevezető) fejezet A MAGYAR NYELV 11 16. oldal 2. fejezet TALÁLKOZÁS 17 38. oldal 3. fejezet ISMERKEDÉS AZ IRODÁBAN 39 56. oldal 4. fejezet A VÁROSBAN 57 82. oldal TÉMÁK Néhány nemzetközi szó Köszönések

Részletesebben

Magyar C2 1 1 076 nyelvi programkövetelmény

Magyar C2 1 1 076 nyelvi programkövetelmény Magyar C2 1 1 076 nyelvi programkövetelmény A javaslattevő alapadatai Javaslatot benyújtó neve Katedra Nyelviskola Kft. A nyelvi képzésre vonatkozó adatok Nyelv megnevezése Nyelvi képzés szintje Nyelvi

Részletesebben

Német C2 1 1 025 számú nyelvi programkövetelmény

Német C2 1 1 025 számú nyelvi programkövetelmény Német C2 1 1 025 számú nyelvi programkövetelmény A javaslattevő alapadatai Javaslatot benyújtó megnevezése DEBRECENI EGYETEM Bölcsészettudományi Kar A nyelvi képzésre vonatkozó adatok Nyelv megnevezése

Részletesebben

Üzleti szemlélet és a magyar nyelv támogatása a többnyelvű világban

Üzleti szemlélet és a magyar nyelv támogatása a többnyelvű világban Üzleti szemlélet és a magyar nyelv támogatása a többnyelvű világban Prószéky Gábor MorphoLogic & PPKE ITK www.morphologic.hu & www.itk.ppke.hu A magyar nyelv helyzete a digitális korban - MTA, 2013. január

Részletesebben

Statisztikai módszerek a skálafüggetlen hálózatok

Statisztikai módszerek a skálafüggetlen hálózatok Statisztikai módszerek a skálafüggetlen hálózatok vizsgálatára Gyenge Ádám1 1 Budapesti Műszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Számítástudományi és Információelméleti

Részletesebben

MAGYAR NYELV a 8. évfolyamosok számára. MNy2 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

MAGYAR NYELV a 8. évfolyamosok számára. MNy2 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ 8. évfolyam MNy2 Javítási-értékelési útmutató MAGYAR NYELV a 8. évfolyamosok számára MNy2 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ A javítási-értékelési útmutatóban feltüntetett válaszokra a megadott pontszámok adhatók.

Részletesebben

Gyakorlatok. P (n) = P (n 1) + 2P (n 2) + P (n 3) ha n 4, (utolsó lépésként l, hl, u, hu-t léphetünk).

Gyakorlatok. P (n) = P (n 1) + 2P (n 2) + P (n 3) ha n 4, (utolsó lépésként l, hl, u, hu-t léphetünk). Gyakorlatok Din 1 Jelölje P (n) azt a számot, ahányféleképpen mehetünk le egy n lépcsőfokból álló lépcsőn a következő mozgáselemek egy sorozatával (zárójelben, hogy mennyit mozgunk az adott elemmel): lépés

Részletesebben

Strukturált nyelvi adatbázis létrehozása gépi tanulási módszerekkel. Kutatási terv

Strukturált nyelvi adatbázis létrehozása gépi tanulási módszerekkel. Kutatási terv Strukturált nyelvi adatbázis létrehozása gépi tanulási módszerekkel Kutatási terv Gábor Kata A kutatásom célja egy strukturált lexikai adatbázis felépítése magyar nyelvre gépi tanulási módszerek alkalmazásával.

Részletesebben

Nem mind VP, ami állít A névszói állítmány azonosítása számítógépes elemzőben

Nem mind VP, ami állít A névszói állítmány azonosítása számítógépes elemzőben Nem mind VP, ami állít A névszói állítmány azonosítása számítógépes elemzőben Dömötör Andrea PPKE BTK Nyelvtudományi Doktori Iskola domotor.andrea@itk.ppke.hu Kivonat: A kutatás annak lehetőségeit vizsgálja,

Részletesebben

MAGYAR NYELV Tömbösített tanmenet 7. a osztály

MAGYAR NYELV Tömbösített tanmenet 7. a osztály Óra Témakör, tananyag 1. Bevezető óra: ismerkedés az új taneszközökkel 2. Ismétlés: hangtan 3. 4. Ismétlés: a szófajok Ismétlés: szóalaktan 5. Ism.: Az igenevek Tollbamondás 6. Az év eleji tollbamondásértékelése

Részletesebben

A szófajok rendszere

A szófajok rendszere A szófajok rendszere Az egy szófajcsoportba tartozás szempontjai: hasonló jelentéskör, azonos alaki viselkedés (toldalékolhatóság), azonos mondatbeli szerep I. Alapszófajok: Valódi alapszófajok - Jelentés

Részletesebben

MAGYAR NYELV a 8. évfolyamosok számára. MNy1 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

MAGYAR NYELV a 8. évfolyamosok számára. MNy1 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ 8. évfolyam MNy1 Javítási-értékelési útmutató MAGYAR NYELV a 8. évfolyamosok számára MNy1 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ A javítási-értékelési útmutatóban feltüntetett válaszokra a megadott pontszámok adhatók.

Részletesebben

MAGYAR NYELV a 4. évfolyamosok számára. MNy1 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

MAGYAR NYELV a 4. évfolyamosok számára. MNy1 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ 4. évfolyam MNy1 Javítási-értékelési útmutató MAGYAR NYELV a 4. évfolyamosok számára MNy1 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ A javítási-értékelési útmutatóban feltüntetett válaszokra a megadott pontszámok adhatók.

Részletesebben

Analogikus általánosítási folyamatok a gyereknyelvben c. kutatási projekthez

Analogikus általánosítási folyamatok a gyereknyelvben c. kutatási projekthez Szakmai beszámoló az Analogikus általánosítási folyamatok a gyereknyelvben c. kutatási projekthez Kutatásvezető: Babarczy Anna, Budapesti Műszaki és Gazdaságtudományi Egyetem, Kognitív Tudományi Tanszék

Részletesebben

MAGYAR NYELV a 8. évfolyamosok számára. MNy1 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

MAGYAR NYELV a 8. évfolyamosok számára. MNy1 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ 8. évfolyam MNy1 Javítási-értékelési útmutató MAGYAR NYELV a 8. évfolyamosok számára MNy1 JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ A javítási-értékelési útmutatóban feltüntetett válaszokra a megadott pontszámok adhatók.

Részletesebben

4. Fuzzy relációk. Gépi intelligencia I. Fodor János NIMGI1MIEM BMF NIK IMRI

4. Fuzzy relációk. Gépi intelligencia I. Fodor János NIMGI1MIEM BMF NIK IMRI 4. Fuzzy relációk Gépi intelligencia I. Fodor János BMF NIK IMRI NIMGI1MIEM Tartalomjegyzék I 1 Klasszikus relációk Halmazok Descartes-szorzata Relációk 2 Fuzzy relációk Fuzzy relációk véges alaphalmazok

Részletesebben

Intelligens partner rendszer virtuális kórházi osztály megvalósításához

Intelligens partner rendszer virtuális kórházi osztály megvalósításához Intelligens partner rendszer virtuális kórházi osztály megvalósításához 1. Célkitűzések A pályázat célja egy virtuális immunológiai osztály kialakítása, amelynek segítségével a különböző betegségekkel

Részletesebben

Babeş-Bolyai Tudományegyetem, Kolozsvár Bölcsészkar es tanév III. év, II. félév. I. Általános információk

Babeş-Bolyai Tudományegyetem, Kolozsvár Bölcsészkar es tanév III. év, II. félév. I. Általános információk Babeş-Bolyai Tudományegyetem, Kolozsvár Bölcsészkar 2018 2019-es tanév III. év, II. félév I. Általános információk A tantárgy neve: Szintaxis II. Kódja: LLM6124 (MA), LLM6224 (MB), LLM6024 (MM) Kreditszáma:

Részletesebben

Szemantika: modalitás, kompozicionalitás. Nyelvészet az informatikában informatika a nyelvészetben 2013. november 13.

Szemantika: modalitás, kompozicionalitás. Nyelvészet az informatikában informatika a nyelvészetben 2013. november 13. Szemantika: modalitás, kompozicionalitás Nyelvészet az informatikában informatika a nyelvészetben 2013. november 13. Bevezetés Szemantika: jelentéssel foglalkozó nyelvészeti részterület Mi a jelentés?

Részletesebben

KÁROLY KRISZTINA SZÖVEGKOHERENCIA A FORDÍTÁSBAN

KÁROLY KRISZTINA SZÖVEGKOHERENCIA A FORDÍTÁSBAN KÁROLY KRISZTINA SZÖVEGKOHERENCIA A FORDÍTÁSBAN Budapest, 2014 TARTALOM ELŐSZÓ...9 1. BEVEZETÉS...15 1.1. A vizsgálat tárgya...17 1.2. Célkitűzések és kutatási kérdések...18 1.3. A vizsgált nyelvek, műfaj

Részletesebben

Angol nyelv. haladóknak

Angol nyelv. haladóknak Angol nyelv haladóknak PRÓBALECKE Próbalecke Az ELO Könyvkiadó Kft. Angol nyelv haladóknak tananyagsorozatát azoknak ajánljuk, akik az Angol nyelv középhaladóknak tananyagsorozatot már elsajátították,

Részletesebben

Korpusznyelvészet és fordítástudomány

Korpusznyelvészet és fordítástudomány Korpusznyelvészet és fordítástudomány Á"ekintés Töbnyelvű korpuszok - szövegpárhuzamosítás az emberi fordítás gépi támogatása - elektronikus szótárak, terminológiai adatbázis/ terminológia kezelő, fordítómemória,

Részletesebben

EGYSZERŰ, NEM IRÁNYÍTOTT (IRÁNYÍTATLAN) GRÁF

EGYSZERŰ, NEM IRÁNYÍTOTT (IRÁNYÍTATLAN) GRÁF Összefoglaló Gráfok / EGYSZERŰ, NEM IRÁNYÍTOTT (IRÁNYÍTATLAN) GRÁF Adott a G = (V, E) gráf ahol a V a csomópontok, E az élek halmaza E = {(x, y) x, y V, x y (nincs hurokél) és (x, y) = (y, x)) Jelölések:

Részletesebben

BIRTOKLÁST KIFEJEZŐ VAN (HAVE GOT) (valakinek VAN valamije)

BIRTOKLÁST KIFEJEZŐ VAN (HAVE GOT) (valakinek VAN valamije) FELÉPÍTÉSE BIRTOKLÁST KIFEJEZŐ VAN (HAVE GOT) (valakinek VAN valamije) akinek van vmije + HAVE (="van ) GOT + amije van (a birtokos) (E/3. sz: HAS GOT) (a birtok) pl. Marknak van egy számítógépe. Mark

Részletesebben

A FRANCIA NYELVI OSZTÁLYOZÓ VIZSGA KÖVETELMÉNYEI

A FRANCIA NYELVI OSZTÁLYOZÓ VIZSGA KÖVETELMÉNYEI A FRANCIA NYELVI OSZTÁLYOZÓ VIZSGA KÖVETELMÉNYEI Évfolyam Témakörök, kommunikációs ismeretek Nyelvtani ismeretek 9. évf. Üdvözlésformák Bemutatkozó formulák Hogylét kifejezése Francia híres emberek Tanteremben

Részletesebben

Alkalmazott Nyelvészeti Közlemények, Miskolc, VIII. évfolyam, 2. szám (2013), pp. 143 145.

Alkalmazott Nyelvészeti Közlemények, Miskolc, VIII. évfolyam, 2. szám (2013), pp. 143 145. Alkalmazott Nyelvészeti Közlemények, Miskolc, VIII. évfolyam, 2. szám (2013), pp. 143 145. Imre Attila (szerk.) Párbeszédek kultúrája Gdansktól Oszakáig: a VII. Nemzetközi Hungarológiai Kongresszus szekcióelőadásai,

Részletesebben

OpenOffice.org mint fejlesztési platform

OpenOffice.org mint fejlesztési platform Nyílt szoftverek a közigazgatásban OpenOffice.org mint fejlesztési platform dr. Banai Miklós, ügyvezető Koleszár Kázmér, projektvezető ODF OpenDocument Format Szabványos, könnyen kezelhető fájlformátum

Részletesebben

Felvételi tematika INFORMATIKA

Felvételi tematika INFORMATIKA Felvételi tematika INFORMATIKA 2016 FEJEZETEK 1. Természetes számok feldolgozása számjegyenként. 2. Számsorozatok feldolgozása elemenként. Egydimenziós tömbök. 3. Mátrixok feldolgozása elemenként/soronként/oszloponként.

Részletesebben

Egyirányban láncolt lista

Egyirányban láncolt lista Egyirányban láncolt lista A tárhely (listaelem) az adatelem értékén kívül egy mutatót tartalmaz, amely a következő listaelem címét tartalmazza. A láncolt lista első elemének címét egy, a láncszerkezeten

Részletesebben

Érettségi eredmények 2005-től (Békéscsabai Andrássy Gyula Gimnázium és Kollégium)

Érettségi eredmények 2005-től (Békéscsabai Andrássy Gyula Gimnázium és Kollégium) 2005/db közép 2005/db emelt 2005/db összes 2005/jegy közép 2005/jegy emelt 2005/jegy összes 2005/% közép 2005/% emelt 2005/% összes 51 119 170 3,53 5,00 4,42 59,90 99,17 84,27 22 17 39 4,45 4,94 4,7 75,68

Részletesebben

KORPUSZNYELVÉSZETI ESZKÖZ A MAGYAR IGÉK B VÍTMÉNYSZERKEZETÉNEK VIZSGÁLATÁRA

KORPUSZNYELVÉSZETI ESZKÖZ A MAGYAR IGÉK B VÍTMÉNYSZERKEZETÉNEK VIZSGÁLATÁRA KORPUSZNYELVÉSZETI ESZKÖZ A MAGYAR IGÉK B VÍTMÉNYSZERKEZETÉNEK VIZSGÁLATÁRA SASS BÁLINT 1. Bevezetés: korpuszok a nyelvtudományban A XX. század második felében a nyelvészet f irányvonalát a generatív nyelvészet

Részletesebben

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31. Regresszió Csorba János Nagyméretű adathalmazok kezelése 2010. március 31. A feladat X magyarázó attribútumok halmaza Y magyarázandó attribútumok) Kérdés: f : X -> Y a kapcsolat pár tanítópontban ismert

Részletesebben

Nyelvtechnológia a lexikográfia szolgálatában Pajzs Júlia

Nyelvtechnológia a lexikográfia szolgálatában Pajzs Júlia Nyelvtechnológia a lexikográfia szolgálatában Pajzs Júlia Napjaink szótáraink elkészítése és publikálása számos területen összefonódik a nyelvtechnológia eredményeivel. A tanulmányban e szerteágazó kérdéskörnek

Részletesebben