0. előadás Motiváció



Hasonló dokumentumok
0. előadás Motiváció. Dr. Kallós Gábor

A számítógépes nyelvészet elmélete és gyakorlata. Formális nyelvek elmélete

Magyar nyelv és irodalom Fejlesztési terv

Igetövek rendszere. igényel-het, igényl-ő, csörög-ni, csörg-ő

A Mazsola KORPUSZLEKÉRDEZŐ

Nehogy a nyúl visz a puska! Mondat ez? Bizonyára te is látod,

Motiváció Eszközök és eljárások Eredmények Távlat. Sass Bálint

Magyar nyelvtan tanmenet 4. osztály

középső o Nyelv eleje magasabban magas hátulja magasabban mély o Ajak kerekítés (labiális) rés (illabiális) o Hossz rövid hosszú Mássalhangzók o Idő

ALAKTAN ELŐADÁS 1-2. Alaktan, morfológia tárgya. Morfológia és mondattan viszonya. Morfológia univerzalitása. A szó fogalma I. Alaktan belső ügyei

Javaslat a helyi tanterv elkészítéséhez Magyar nyelv és irodalom 3. osztály

Az első és az egyetlen. Beszélő fordítógép, beszélő szótár, beszélő kifejezés gyűjtemény

2013/14. tanév. 3.osztály

Ötletek a magyar mint idegen nyelv tanításához feladattípusok szerint












Rendszer szekvencia diagram

Reklám CL & LT Modell Mazsola Alkalmazás Példák Befejezés. Sass Bálint

2

4. Javítás és jegyzetek

Mondatkiegészítés adott. Az írásmódtól eltérô. Mondatalkotás. pótlása. Hosszú mássalhangzós. Másolás. Mondatvégi írásjelek

OS TANÉVBEN ÉRVÉNYES TANTÁRGYI PROGRAM LATIN NYELV I., LATIN NYELV II.

Tartalomjegyzék. Tartalomjegyzék. A főnév 10 A főnevek neme 10 A főnevek többes száma 14 A főnév a mondatban 16 Gyakorlatok 17

SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

NÉMET NYELVBŐL. Magyar Szentek Római Katolikus Óvoda és Általános Iskola 3060 Pásztó, Deák Ferenc utca /

Osztályozóvizsga 1/13. K ANGOL NYELV

TARTALOM. Tartalom. 1. (Bevezető) fejezet A MAGYAR NYELV oldal. A határozott névelő: a gitár, az autó

... és amit kihagytunk a nyelvi cikkből

A szóképzés. A szóalkotásnak az a módja, amikor a szótőhöz egy képző hozzájárulásával új szó jön létre.

BESZÉD ÉS ANYANYELV. Nyelvtan-helyesírás 2. osztályosoknak TANMENET

Tagolatlan mondat szavakra tagolása, helyes leírása Ellenőrzés

Helyi tanterv az angol nyelv mint 2. idegen nyelv tanításához normál tantervű osztályokban

Nyelvészeti módszerek és irányzatok, bibliai és rabbinikus héber

MORFOLÓGIAI FELÉPÍTÉS

MAGYAR NYELV 5 8. Javasolt óraszámbeosztás

A számítógépes nyelvészet elmélete és gyakorlata. Automaták

Automaták és formális nyelvek

Szó-kincseink könnyedén

8. Laboratóriumi gyakorlat: Bevezetés a reguláris kifejezések használatába

TANTÁRGYI PROGRAM. 2. osztály. Éves óraszám: 74 óra 2 óra/hét. fogalmak, ismeretek Új tantárgyunk: az anyanyelv. Bevezetés. A beszéd és az írás.

II. Gyermeknyelv, anyanyelvelsajátítás

Az élet szép, környezetünk tele van fákkal, virágokkal, repdeső madarakkal, vidáman futkározó állatokkal.

Petro Lizanec - Horváth Katalin

Zsemlyei János A MAI MAGYAR NYELV SZÓKÉSZLETE ÉS SZÓTÁRAI

XXXII. BORBÉLY SÁNDOR ORSZÁGOS TANULMÁNYI VERSENY Komplex anyanyelvi készségek tantárgy 3. évfolyam VÁC 2014.

Anyanyelvi verseny 2. feladatlap

Formális nyelvek és automaták

Osztályozó vizsga Angol mint első idegen nyelv

TestLine - Nyelvtan és irodalom bemeneti mérés Minta feladatsor

Kerettantervi ajánlás a helyi tanterv készítéséhez az EMMI kerettanterv 51/2012. (XII. 21.) EMMI rendelet 2. sz. melléklet

Szakterületi modell A fogalmak megjelenítése. 9. fejezet Applying UML and Patterns Craig Larman

7. előadás Környezetfüggetlen nyelvtanok

Operációs rendszerek. 9. gyakorlat. Reguláris kifejezések - alapok, BASH UNIVERSITAS SCIENTIARUM SZEGEDIENSIS UNIVERSITY OF SZEGED

Segédanyagok. Formális nyelvek a gyakorlatban. Szintaktikai helyesség. Fordítóprogramok. Formális nyelvek, 1. gyakorlat

Dr`avni izpitni center MAGYAR NYELV ÉS IRODALOM. 1. feladatlap. Nem művészi szöveg elemzése. Szombat, május 29. / 60 perc

Operációs rendszerek. 9. gyakorlat. BASH recap, reguláris kifejezések UNIVERSITAS SCIENTIARUM SZEGEDIENSIS UNIVERSITY OF SZEGED

Vizuális nyelv. Olvasás és írás. Ellis, W. (2004) Olvasás, írás és diszlexia október

Nyelvelemzés sajátkezűleg a magyar INTEX rendszer. Váradi Tamás varadi@nytud.hu

MAGYAR NYELV ÉS IRODALOM VIZSGA 8. ÉVFOLYAM

MagyarOK A2+ Szita Szilvia - Pelcz Katalin: Tanmenetek. A2.1. Célnyelvi és forrásnyelvi környezet Egy 120 órás tanfolyam 1 60.

MagyarOK 1. tanmenetek

Magyar nyelv és irodalom NYELVTAN TANMENET 3. osztály Készítette: Kő Nóra

KÖVETELMÉNYRENDSZER. Latin nyelv I. Semmelweis Egyetem, Fogorvostudományi Kar, Nyelvi Kommunikációs Igazgatóság

Név:... Iskola:... Összpontszám: 240 pont Elért pontszám:... Helyezés:...

hang Példamondatok: hang hang hang hang Feladatok: hang

MagyarOK 1. tanmenetek

6. szint (B1) A standard nyelvtanfolyamokon belül az utolsó szint.

ANGOL NYELV, MINT ELSŐ IDEGEN NYELV

Informatika Rendszerek Alapjai

Objektumorientált paradigma és a programfejlesztés

Lexikon és nyelvtechnológia Földesi András /

MagyarOK 1. tanmenetek

KREATÍVAN HASZNÁLHATÓ IDEGENNYELV-TUDÁS MEGSZERZÉSÉNEK NYELVPEDAGÓGIÁJA NEUROLINGVISZTIKAI MEGKÖZELÍTÉSBEN

Az eredményes nyelvtanulás alapelvei 1.

ÉG A GYERTYA, ÉG. 1. Bontsuk betűkre a szót! SZERETET = _ Miből indul ki? Abból, hogy valaki _

Miért tanulod a nyelvtant?

Szemantika: modalitás, kompozicionalitás. Nyelvészet az informatikában informatika a nyelvészetben november 13.

Az angol nyelv logikája 6 MONDATSZERKEZET 1. A kijelentés

NT 56365/NAT SAG ZA SAGOM 1 Tanmenetjavaslat

Magyar nyelvi felvételi feladatok február 22.

KÉPZÉSI PROGRAM C képzési kör C képzési kör

Dr`avni izpitni center MAGYAR NYELV ÉS IRODALOM. 1. feladatlap. Nem művészi szöveg elemzése. Kedd, február 01. / 60 perc

Beszédfeldolgozási zavarok és a tanulási nehézségek összefüggései. Gósy Mária MTA Nyelvtudományi Intézete

Javaslat a helyi tanterv elkészítéséhez Magyar nyelv és irodalom 4. osztály

Európai Gazdasági és Monetáris Unió

*M * MAGYAR NYELV MINT ANYANYELV. 2. feladatlap. Nem művészi szöveg elemzése augusztus 25., csütörtök / 90 perc ŐSZI VIZSGAIDŐSZAK

8. Laboratóriumi gyakorlat: Bevezetés a reguláris kifejezések használatába

Emlékeztető: LR(0) elemzés. LR elemzések (SLR(1) és LR(1) elemzések)

A GONDOLKODTATÓ PÖSZETERÁPIA, azaz egy terápiás könyvegység bemutatása

nyelv: 2) Kérdezz meg 3 embert a környezetedben arról, milyen nyelven tud beszélni, írni, olvasni. Írd le a válaszaikat!

Knoch László: Információelmélet LOGIKA

Átírás:

0. előadás Dr. Kallós Gábor 2015 2016 1

A reguláris kifejezések alkalmazása széleskörű Szövegek javítása, minták cseréje Érvényesség-ellenőrzés (beíráskor) Védett űrlapok Elektronikus oktatás, javítás Sztringekkel végzett műveletek programozási nyelvekben Pl.: Perl, Python Első alkalmazás: Unix segédprogramok (grep, Emacs, vi) Barátságos programok érhetők el a reguláris kifejezések tanításához, szemléltetéséhez kialakításához, ellenőrzéséhez 2

Automaták, nyelvek, reguláris kifejezések kapcsolata: a JFLAP projekt 3

Sikeres TDK munka az automaták és a nyelvek kapcsolatáról 4

Sikeres TDK munka az automaták és a nyelvek kapcsolatáról 5

Gépi nyelvészet Chomsky eredetileg tisztán a nyelvészet felől indulva alakította ki a formális nyelvi alapokat A feladat bonyolultságáról Tfh. 40 fonémánk van (hangzó, betűjel) Ekkor 1600 kéttagú, 64 000 háromtagú, 2 560 000 négytagú, 102 400 000 öttagú és több mint 4 milliárd féle hattagú kombináció állítható elő Ezeknek persze a nyelv ténylegesen csak jóval kisebb részét használja (pl. bontsd, rontsd) Hasonlóan, a lehetséges mondatkombinációk száma is óriási Példa: egyszerű mondatok, mindegyikben egy ige és két főnév, és mindegyikből csak 1000 lehetőséget használunk: 1 milliárd alternatív mondat! Természetesen itt sem mind értelmes Megoldás (legalább részben): szótárprogramok Chomsky: A mondatszerkesztés a konkrét nyelvtől függetlenül olyan általános sajátosságokat mutat, amelyek az emberi agy szerkezetében rejlő törvényszerűségek szerepére utalnak A mondat mélyszerkezetében transzformációs szabályokkal bázismondatokra bontható Pl.: Elvárjuk, hogy az olvasó, akit ezek a fejtegetések untatnak, tegye félre a jegyzetet, felbomlik: E fejtegetések untatják az olvasót, Az olvasó félreteszi a jegyzetet, Mi elvárjuk ezt 6

Gondolatok kifejezése a nyelv segítségével, a nyelv formális leírása A szavak felsorolása (szótári alakjukban) nem elég, ezeket összhangba kell hozni a mondatszerkesztés meghatározott szabályaival Ember, kutya, félni Az ember fél a kutyától Minden szó meghatározott formában szerepel, és a kijelentés konkrét összefüggéseket fejez ki az adott szavakkal megjelölt fogalmak, objektumok között Példa (formák a nyelvben) Szósor: olvasunk, rajzolunk, sétálunk, beszélünk, nézünk stb.; az -unk, -ünk végződés jelen idő többes szám első személyt fejez ki Szósor: kedves, dolgos, ügyes, szorgalmas stb.; az -s képzővel főnévből mellékneveket képzünk Az ige, főnév és melléknév kategorizálás meghatározóan fontos Igék: leggyakrabban cselekvést vagy állapotot jelölnek Főnevek: többnyire tárgyak azonosítására Melléknevek: tulajdonságot, minőséget azonosítanak Az előző csoportosítás azonban nem abszolút meghatározó Példa (szófaji csoportok, kivételek) Szósor: járás, olvasás, alvás, írás; cselekvést vagy állapotot jelölnek, mégsem igék hanem főnevek Szósor: bátorság, tartósság, szépség; tulajdonságot, minőséget azonosítanak, mégis főnevek Szó: világosság; itt a világ a szótő, ehhez az -s melléknévképző csatlakozik (az o kötőhang), végül a -ság főnévképző A nyelvben a formalizáció nemcsak a szavakra terjed ki, hanem a szókapcsolatokra, szószerkezetekre és egész mondatokra is Minden nyelvi forma kapcsolatban áll más formákkal, és azok által meghatározott 7

Gépi fordítás Sajátosságok A gép közömbös az általa fordított szöveg tartalma iránt (nem kell értenie a szöveget) Csak formai összefüggésekkel dolgozik Az elvi lehetőség megvan arra, hogy megadjuk a nyelvek közötti formai megfelelések absztrakt rendszerét A nyelv(ek) teljes kifejezési készletét meg kell adnunk! A nyelv formális leírása 2. Példa Prefixumok (magyarban: igekötők), képzők és végződések (nem, szám, eset, idő stb.) leválasztása Így a szótő marad meg, ez az adott szó lexikális jelentésének hordozója Ezzel a technikával a készülő automatikus szótár jóval egyszerűbb lesz, mint a teljes reprezentáció Szósor: építeni, építés, építő, épült, ráépíteni, ráépült, ráépítve, ráépített, felépíteni, felépült, felépítve, felépített, hozzáépíteni, hozzáépült, hozzáépítve, hozzáépített, megépíteni, megépült, megépítve, megépített, beépíteni, beépült, beépítve, beépített Hasonlóan: beszélni, sózni Az összes lehetséges alak így már 100 körül van Ugyanakkor a formalizálás segítségével 3 igetővel (épít-, ill. ép-, beszél-, sóz-), 6 képzővel és raggal (-ni, -(é/á)s, -ó/ő, -(ül)t, -(e/o)tt, -v(e/a)), és 5 igekötővel (rá-, fel-, hozzá-, meg-, be-) ezek az alakok megadhatók 8

Gépi fordítás (példa) Célunk: jól körülhatárolt (pl. műszaki) szöveg fordítása, nem ismerjük az adott (műszaki) területet, de van egy nagyon jó szótárunk, és ismerjük az idegen nyelv formai, nyelvtani szerkezetét A fordítás menete Az egyes szavakat a szótár alapján az anyanyelv megfelelő szavaival helyettesítjük Az idegen nyelv grammatikai elemei helyére a saját nyelvbeli megfelelőket tesszük Ha minden szónak pontosan egy jelentése van (spec. szövegnél ez jó eséllyel teljesül), akkor végeredményben a fordításunk értés nélkül is teljesen pontos lehet Fordítandó szöveg: Ho grammaton apeiros u blepei blepon (görög közmondás); latinra kell fordítanunk, de nem tudunk latinul (sem) Szótövek és végződések szótára A fordítás menete Ho -, gramm- litter- -aton -arum (eddig: Litterarum) apeir- imperit- -os -us (most: imperitus) u non (most: non) blepei videt, blepon videns Végeredmény: Litterarum imperitus non videt videns, azaz A tudományokban tudatlan látva sem lát 9

Szótövező rendszer (lemmatizáló) 10