0. előadás Motiváció. Dr. Kallós Gábor

Hasonló dokumentumok
0. előadás Motiváció

Alapszintű formalizmusok

A számítógépes nyelvészet elmélete és gyakorlata. Formális nyelvek elmélete

A modell-ellenőrzés gyakorlata UPPAAL

Nehogy a nyúl visz a puska! Mondat ez? Bizonyára te is látod,

Magyar nyelv és irodalom Fejlesztési terv

Igetövek rendszere. igényel-het, igényl-ő, csörög-ni, csörg-ő

A Mazsola KORPUSZLEKÉRDEZŐ

Magyar nyelvtan tanmenet 4. osztály

középső o Nyelv eleje magasabban magas hátulja magasabban mély o Ajak kerekítés (labiális) rés (illabiális) o Hossz rövid hosszú Mássalhangzók o Idő

2013/14. tanév. 3.osztály

A számítógépes nyelvészet elmélete és gyakorlata. Automaták

ALAKTAN ELŐADÁS 1-2. Alaktan, morfológia tárgya. Morfológia és mondattan viszonya. Morfológia univerzalitása. A szó fogalma I. Alaktan belső ügyei

Javaslat a helyi tanterv elkészítéséhez Magyar nyelv és irodalom 3. osztály

Rendszer szekvencia diagram

Az első és az egyetlen. Beszélő fordítógép, beszélő szótár, beszélő kifejezés gyűjtemény

Mondatkiegészítés adott. Az írásmódtól eltérô. Mondatalkotás. pótlása. Hosszú mássalhangzós. Másolás. Mondatvégi írásjelek

Motiváció Eszközök és eljárások Eredmények Távlat. Sass Bálint

7. előadás Környezetfüggetlen nyelvtanok

Szoftverminőségbiztosítás

NÉMET NYELVBŐL. Magyar Szentek Római Katolikus Óvoda és Általános Iskola 3060 Pásztó, Deák Ferenc utca /

Informatika Rendszerek Alapjai

Ötletek a magyar mint idegen nyelv tanításához feladattípusok szerint

Automaták és formális nyelvek












Tagolatlan mondat szavakra tagolása, helyes leírása Ellenőrzés

Nyelvelemzés sajátkezűleg a magyar INTEX rendszer. Váradi Tamás varadi@nytud.hu

Reklám CL & LT Modell Mazsola Alkalmazás Példák Befejezés. Sass Bálint

2

Helyi tanterv az angol nyelv mint 2. idegen nyelv tanításához normál tantervű osztályokban

Formális nyelvek és automaták

OS TANÉVBEN ÉRVÉNYES TANTÁRGYI PROGRAM LATIN NYELV I., LATIN NYELV II.

Emlékeztető: LR(0) elemzés. LR elemzések (SLR(1) és LR(1) elemzések)

Tartalomjegyzék. Tartalomjegyzék. A főnév 10 A főnevek neme 10 A főnevek többes száma 14 A főnév a mondatban 16 Gyakorlatok 17

SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

Időzített rendszerek és az UPPAAL II

XXXII. BORBÉLY SÁNDOR ORSZÁGOS TANULMÁNYI VERSENY Komplex anyanyelvi készségek tantárgy 3. évfolyam VÁC 2014.

TARTALOM. Tartalom. 1. (Bevezető) fejezet A MAGYAR NYELV oldal. A határozott névelő: a gitár, az autó

... és amit kihagytunk a nyelvi cikkből

Modell alapú tesztelés mobil környezetben

A szóképzés. A szóalkotásnak az a módja, amikor a szótőhöz egy képző hozzájárulásával új szó jön létre.

TANTÁRGYI PROGRAM. 2. osztály. Éves óraszám: 74 óra 2 óra/hét. fogalmak, ismeretek Új tantárgyunk: az anyanyelv. Bevezetés. A beszéd és az írás.

Osztályozó vizsga Angol mint első idegen nyelv

A Formális nyelvek vizsga teljesítése. a) Normál A vizsgán 60 pont szerezhet, amely két 30 pontos részb l áll össze az alábbi módon:

Objektumorientált paradigma és a programfejlesztés

Nyelvészeti módszerek és irányzatok, bibliai és rabbinikus héber

Rendszermodellezés. Modellellenőrzés. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék

MAGYAR NYELV ÉS IRODALOM VIZSGA 8. ÉVFOLYAM

MORFOLÓGIAI FELÉPÍTÉS

Név:... Iskola:... Összpontszám: 240 pont Elért pontszám:... Helyezés:...

Alapszintű formalizmusok

Szó-kincseink könnyedén

8. Laboratóriumi gyakorlat: Bevezetés a reguláris kifejezések használatába

Magyar nyelv és irodalom NYELVTAN TANMENET 3. osztály Készítette: Kő Nóra

Osztályozóvizsga 1/13. K ANGOL NYELV

II. Gyermeknyelv, anyanyelvelsajátítás

Petro Lizanec - Horváth Katalin

Magyar nyelvi felvételi feladatok február 22.

Zsemlyei János A MAI MAGYAR NYELV SZÓKÉSZLETE ÉS SZÓTÁRAI

Miért tanulod a nyelvtant?

Anyanyelvi verseny 2. feladatlap

A Formális nyelvek vizsga teljesítése. a) Normál A vizsgán 60 pont szerezhet, amely két 30 pontos részb l áll össze az alábbi módon:

Rekurzió. Dr. Iványi Péter

BESZÉD ÉS ANYANYELV. Nyelvtan-helyesírás 2. osztályosoknak TANMENET

TestLine - Nyelvtan és irodalom bemeneti mérés Minta feladatsor

Szakterületi modell A fogalmak megjelenítése. 9. fejezet Applying UML and Patterns Craig Larman

Segédanyagok. Formális nyelvek a gyakorlatban. Szintaktikai helyesség. Fordítóprogramok. Formális nyelvek, 1. gyakorlat

TÁJÉKOZTATÓ A SZÓBELI FELVÉTELIRŐL

Modellellenőrzés a vasút automatikai rendszerek fejlesztésében. XIX. Közlekedésfejlesztési és beruházási konferencia Bükfürdő

Tartalomjegyzék. Bevezetés Az ige mondatalkotó képessége. 2. Az Objekt"-ek sorrendje főnevek, ill. névmások esetében.

Operációs rendszerek. 9. gyakorlat. Reguláris kifejezések - alapok, BASH UNIVERSITAS SCIENTIARUM SZEGEDIENSIS UNIVERSITY OF SZEGED

Operációs rendszerek. 9. gyakorlat. BASH recap, reguláris kifejezések UNIVERSITAS SCIENTIARUM SZEGEDIENSIS UNIVERSITY OF SZEGED

Dr`avni izpitni center MAGYAR NYELV ÉS IRODALOM. 1. feladatlap. Nem művészi szöveg elemzése. Szombat, május 29. / 60 perc

A logika, és a matematikai logika alapjait is neves görög tudós filozófus Arisztotelész rakta le "Analitika" című művében, Kr.e. IV. században.

Vizuális nyelv. Olvasás és írás. Ellis, W. (2004) Olvasás, írás és diszlexia október

Formális nyelvek és automaták

A nyelvtani szabályok bemutatási módjai három magyar nyelvkönyvben

MagyarOK A2+ Szita Szilvia - Pelcz Katalin: Tanmenetek. A2.1. Célnyelvi és forrásnyelvi környezet Egy 120 órás tanfolyam 1 60.

KÖVETELMÉNYRENDSZER. Latin nyelv I. Semmelweis Egyetem, Fogorvostudományi Kar, Nyelvi Kommunikációs Igazgatóság

Predikátumkalkulus. 1. Bevezet. 2. Predikátumkalkulus, formalizálás. Predikátumkalkulus alapfogalmai, formalizálás, tagadás, logikailag igaz formulák.

4. Javítás és jegyzetek

6. szint (B1) A standard nyelvtanfolyamokon belül az utolsó szint.

MAGYAR NYELV 5 8. Javasolt óraszámbeosztás

Lexikon és nyelvtechnológia Földesi András /

ANGOL NYELV, MINT ELSŐ IDEGEN NYELV

A modellellenőrzés érdekes alkalmazása: Tesztgenerálás modellellenőrzővel

A szemantikus elemzés helye. A szemantikus elemzés feladatai. A szemantikus elemzés feladatai. Deklarációk és láthatósági szabályok

TANMENETJAVASLAT. a nyelvtan és helyesírás tanításához a 3. évfolyam számára

Fejlett kereső és lekérdező eszközök egy elektronikus szakfolyóirathoz (IBVS)

Az UPPAAL egyes modellezési lehetőségeinek összefoglalása. Majzik István BME Méréstechnika és Információs Rendszerek Tanszék

Átírás:

0. előadás Dr. Kallós Gábor 2017 2018

A reguláris kifejezések alkalmazása széleskörű Szövegek javítása, minták cseréje Érvényesség-ellenőrzés (beíráskor) Védett űrlapok Elektronikus oktatás, javítás Sztringekkel végzett műveletek programozási nyelvekben Pl.: Perl, Python Első alkalmazás: Unix segédprogramok (grep, Emacs, vi) Barátságos programok érhetők el a reguláris kifejezések tanításához, szemléltetéséhez kialakításához, ellenőrzéséhez 2

Automaták, nyelvek, reguláris kifejezések kapcsolata: a JFLAP projekt 3

Sikeres TDK munka az automaták és a nyelvek kapcsolatáról 4

Sikeres TDK munka az automaták és a nyelvek kapcsolatáról 5

Gépi nyelvészet Chomsky eredetileg tisztán a nyelvészet felől indulva alakította ki a formális nyelvi alapokat A feladat bonyolultságáról Tfh. 40 fonémánk van (hangzó, betűjel) Ekkor 1600 kéttagú, 64 000 háromtagú, 2 560 000 négytagú, 102 400 000 öttagú és több mint 4 milliárd féle hattagú kombináció állítható elő Ezeknek persze a nyelv ténylegesen csak jóval kisebb részét használja (pl. bontsd, rontsd) Hasonlóan, a lehetséges mondatkombinációk száma is óriási Példa: egyszerű mondatok, mindegyikben egy ige és két főnév, és mindből csak 1000 lehetőséget használunk: 1 milliárd alternatív mondat! Természetesen itt sem mind értelmes 6

Gépi nyelvészet (folyt.) Chomsky: A mondatszerkesztés a konkrét nyelvtől függetlenül olyan általános sajátosságokat mutat, amelyek az emberi agy szerkezetében rejlő törvényszerűségek szerepére utalnak A mondat mélyszerkezetében transzformációs szabályokkal bázismondatokra bontható Pl.: Elvárjuk, hogy az olvasó, akit ezek a fejtegetések untatnak, tegye félre a jegyzetet, felbomlik: E fejtegetések untatják az olvasót, Az olvasó félreteszi a jegyzetet, Mi elvárjuk ezt 7

Gondolatok kifejezése a nyelv segítségével, a nyelv formális leírása A szavak felsorolása (szótári alakjukban) nem elég, ezeket összhangba kell hozni a mondatszerkesztés meghatározott szabályaival Ember, kutya, félni Az ember fél a kutyától Minden szó meghatározott formában szerepel, és a kijelentés konkrét összefüggéseket fejez ki az adott szavakkal megjelölt fogalmak, objektumok között Példa (formák a nyelvben) Szósor: olvasunk, rajzolunk, sétálunk, beszélünk, nézünk stb.; az -unk, -ünk végződés jelen idő többes szám első személyt fejez ki Szósor: kedves, dolgos, ügyes, szorgalmas stb.; az -s képzővel főnévből mellékneveket képzünk 8

Gondolatok kifejezése a nyelv segítségével, a nyelv formális leírása (folyt.) Az ige, főnév és melléknév kategorizálás meghatározóan fontos Igék: leggyakrabban cselekvést vagy állapotot jelölnek Főnevek: többnyire tárgyak azonosítására Melléknevek: tulajdonságot, minőséget azonosítanak Az előző csoportosítás azonban nem abszolút meghatározó Példa (szófaji csoportok, kivételek) Szósor: járás, olvasás, alvás, írás; cselekvést vagy állapotot jelölnek, mégsem igék hanem főnevek Szósor: bátorság, tartósság, szépség; tulajdonságot, minőséget azonosítanak, mégis főnevek Szó: világosság; itt a világ a szótő, ehhez az -s melléknévképző csatlakozik (az o kötőhang), végül a -ság főnévképző A nyelvben a formalizáció nemcsak a szavakra terjed ki, hanem a szókapcsolatokra, szószerkezetekre és egész mondatokra is Minden nyelvi forma kapcsolatban áll más formákkal, és azok által meghatározott 9

Gépi fordítás Sajátosságok A gép közömbös az általa fordított szöveg tartalma iránt (nem kell értenie a szöveget) Csak formai összefüggésekkel dolgozik Az elvi lehetőség megvan arra, hogy megadjuk a nyelvek közötti formai megfelelések absztrakt rendszerét A nyelv(ek) teljes kifejezési készletét meg kell adnunk! 10

Gépi fordítás (folyt.) A nyelv formális leírása 2. Prefixumok (magyarban: igekötők), képzők és végződések (nem, szám, eset, idő stb.) leválasztása Így a szótő marad meg, ez az adott szó lexikális jelentésének hordozója Ezzel a technikával a készülő automatikus szótár jóval egyszerűbb lesz, mint a teljes reprezentáció Példa Szósor: építeni, építés, építő, épült, ráépíteni, ráépült, ráépítve, ráépített, felépíteni, felépült, felépítve, felépített, hozzáépíteni, hozzáépült, hozzáépítve, hozzáépített, megépíteni, megépült, megépítve, megépített, beépíteni, beépült, beépítve, beépített Hasonlóan: beszélni, sózni Az összes lehetséges alak így már 100 körül van Ugyanakkor a formalizálás segítségével 3 igetővel (épít-, ill. ép-, beszél-, sóz-), 6 képzővel és raggal (-ni, -(é/á)s, -ó/ő, -(ül)t, -(e/o)tt, -v(e/a)), és 5 igekötővel (rá-, fel-, hozzá-, meg-, be-) ezek az alakok megadhatók 11

Gépi fordítás (példa) Célunk: jól körülhatárolt (pl. műszaki) szöveg fordítása, nem ismerjük az adott (műszaki) területet, de van egy nagyon jó szótárunk, és ismerjük az idegen nyelv formai, nyelvtani szerkezetét A fordítás menete Az egyes szavakat a szótár alapján az anyanyelv megfelelő szavaival helyettesítjük Az idegen nyelv grammatikai elemei helyére a saját nyelvbeli megfelelőket tesszük Ha minden szónak pontosan egy jelentése van (spec. szövegnél ez jó eséllyel teljesül), akkor végeredményben a fordításunk értés nélkül is teljesen pontos lehet 12

Gépi fordítás (példa folyt.) Fordítandó szöveg: Ho grammaton apeiros u blepei blepon (görög közmondás); latinra kell fordítanunk, de nem tudunk latinul (sem) Szótövek és végződések szótára A fordítás menete Ho -, gramm- litter- -aton -arum (eddig: Litterarum) apeir- imperit- -os -us (most: imperitus) u non (most: non) blepei videt, blepon videns Végeredmény: Litterarum imperitus non videt videns, azaz A tudományokban tudatlan látva sem lát 13

Szótövező rendszer (lemmatizáló) 14

Időzített automaták Uppaal: valós idejű rendszerek tervezésére és verifikációjára Modellezés véges automatákkal (+ (óra)változók, őrfeltételek, csatornák) Minden folyamat egy-egy véges állapotgéppel írható le (állapotok és átmenetek) A rendszer fő részei: System Editor, Simulator és Verifier Első példa: még nincs időzítés 15

Időzített automaták Első példa folyt. Verifikáció 16

Időzített automaták Második példa (rendszer demó) Átkelés a hídon éjszaka, lámpával Viking harcos állapotgép 17

Időzített automaták Második példa (folyt.) Lámpa állapotgép (A lámpát felveheti 2 vagy 1 harcos) Rendszer deklarációk (Eredeti módosítva) 18

Időzített automaták Második példa (folyt.) Leggyorsabb átkelési mód? Beállítható (Options/Diagnostic Trace/Fastest) 19

Időzített automaták Második példa (folyt.) Leggyorsabb átkelési mód? Lejátszható, kezdet 20

Időzített automaták Második példa (folyt.) Leggyorsabb átkelési mód? Lejátszható, vég 21