Az URaLUID adatbázis bemutatása
|
|
- Endre Pásztor
- 8 évvel ezelőtt
- Látták:
Átírás
1 Hatás alatt álló nyelvek Az URaLUID adatbázis bemutatása Simon Eszter MTA Nyelvtudományi Intézet január Finnugor Szeminárium Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
2 Az előadás vázlata 1 Projekt 2 Szöveggyűjtés 3 Szövegfeldolgozás Transzkripció és transzliteráció Morfológiai elemzés Fordítások Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
3 Projekt A projekt Az uráli nyelvek mondattanának változása aszimmetrikus kontaktushelyzetben a Nemzeti Kutatási, Fejlesztési és Innovációs Hivatal támogatásával (ERC 15 HU, OTKA ) február július MTA Nyelvtudományi Intézet projektvezető: É. Kiss Katalin interdiszciplináris csapat: kutatók a finnugor, a nyelvtechnológiai és az elméleti nyelvészeti osztályról Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
4 Szöveggyűjtés Koncepció régi és új szövegek lehetőleg beszélt nyelvi vagy ahhoz közel álló műfaj ideális esetben a dialektális és szociolingvisztikai tényezők ki vannak egyensúlyozva 4000 token/kor/nyelv mennyiségű anyag teljes annotációval ellátva ha kevés munkával megszerezhető, akkor jöhet minden más anyag is, de az nem feltétlenül lesz végigannotálva Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
5 Szöveggyűjtés Szöveggyűjtés Udmurt régi: Munkácsi (1885), déli, folklór Wichmann (1901), déli és északi, folklór új: Мынам малпанъёсы (2014), blog Марайко (2014), blog Tundrai nyenyec régi: Lehtisalo (1947), keleti és középső, folklór új: Нярьяна Нгэрм ( ), középső, újságcikkek Лабанаускас (1995), keleti, folklór Пушкарёва-Хомич (2001), keleti, folklór Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
6 Szöveggyűjtés Szöveggyűjtés Szinjai hanti régi: Steinitz (1937), déli, folklór új: interjúk (Ruttkay-Miklián Esztertől) Szurguti hanti régi: Paasonen (1901), jugáni, folklór új: Песикова-Волкова (2013), interjúk Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
7 Szövegfeldolgozás Szövegfeldolgozottsági szintek eredeti szöveg cirill FUT lejegyzés(ek) IPA fordítás angol orosz német magyar morfológiai információk lemma szófajkód inflexiós kódok Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
8 Szövegfeldolgozás Az eredeti szöveg előálĺıtása Transzkripció és transzliteráció beszkennelt könyv OCR kézi javítás eredeti szöveg egységes karaktertábla: minden nyelv minden lejegyzési, átírási és írásrendszerének minden karaktere szerepel a Unicode-kódjával, -nevével és Prószéky-kódjával ezekkel a karakterekkel történik a hangzó szövegek lejegyzése, ezekre a karakterekre tanítjuk be az optikai karakterfelismerőt, ezekre a karakterekre normalizáljuk a különböző forrásokból származó szövegeket, és ezek szolgáltatják a különböző irányú konverziók bemeneti és kimeneti karakterállományát is Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
9 Szövegfeldolgozás Transzkripció és transzliteráció Karakterszintű normalizálás különböző források UTF-8 kódolású plain text fájlok normalizálás: nem Unicode-karakterek lecserélése Unicode-karakterekre idegen nyelvű részek eltávoĺıtása latin karakterek cirillre cserélése a cirill szövegben, pl. ван!= вaн az általunk használt összes karakter megjeleníthető a Charis SIL fontkészlettel (+ a böngészőben be kell álĺıtani a karakterkódolást: View/Text encoding/unicode) Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
10 Szövegfeldolgozás Transzkripció és transzliteráció Transzkripció és transzliteráció eredeti szöveg átírási szabályok automatikus konverzió átirat ahol az eredeti szöveg lehet cirill vagy valamilyen FUT, az átirat pedig lehet cirill, valamilyen FUT vagy IPA FUT-ok: Steinitz, RME, SzOCh, Munkácsi, Wichmann, Hajdú, Mus Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
11 Konverzió Szövegfeldolgozás Transzkripció és transzliteráció összesen 12 konverziós irány szinjai hanti: Steinitz2IPA, Steinitz2RME szurguti hanti: cirill2szoch, SzOCh2IPA udmurt: Munkácsi2IPA, Wichmann2IPA, IPA2cirill, cirill2ipa tundrai nyenyec: Hajdú2Mus, Hajdú2IPA, Hajdú2cirill, cirill2ipa Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
12 Szövegfeldolgozás Transzkripció és transzliteráció Konverzió példa #in first syllable: s/([ ( ][čjgklmnńnprstw])a/\15:/g s/ a/ 5:/g s/\(a/\(5:/g s/ k a/ k 5:/g s/ t a/ t 5:/g #else: s/a/5/g Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
13 Szövegfeldolgozás Morfológiai elemzés Morfológiai elemzés A cél: angol glosszázás az általunk létrehozott glosszázási rövidítéseket tartalmazó táblázat alapján A táblázat az alábbi nemzetközi sztenderdek alapján készült: Leipzig Glossing Rules kódtábla a Wikipédia Glossing abbreviations című oldalának kódjai kurrens szakirodalom Leképezés és konverzió: az elérhető morfológiai elemzők kimenete a mi kódtáblánk Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
14 Morfológiai elemzők Szövegfeldolgozás Morfológiai elemzés Udmurt: MorphoLogic & Giellatekno Tundrai nyenyec: Giellatekno Szinjai hanti: MorphoLogic Szurguti hanti: nincs Zipf törvénye alapján: a néhány leggyakoribb szó lefedi a teljes szöveg nagy százalékát a min. ötször előforduló szavak kilistázása elemzések hozzájuk rendelése kézzel a szöveg több mint 60%-ához automatikusan hozzárendelődik az elemzés Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
15 Szövegfeldolgozás Morfológiai elemzés Morfológiai annotáció Amit kapunk: lemma szófajkód inflexiós kódok derivációs kódok morféma szinten szegmentált szóalak és kódok magyar lemma angol lemma Ami kell nekünk: lemma szófajkód inflexiós kódok angol lemma Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
16 Példa Szövegfeldolgozás Morfológiai elemzés YRK Hajdú: jā mīdaxana amkerta jankūwi YRK Mus: ja midaxana amkerta jankuwi YRK IPA: ja mi:daxana ămkerta jănkuwi YRK cirill: я мыдахана амкэрта яңкувы lemma: я мы ңамгэ яңгось szófaj: N Ptcp Pron.neg V glossza: earth create.ipfv.ptcp.loc nothing neg.ex.infer ENG: GER: HUN: when the earth was created, there was nothing zur zeit der erschaffung der erde gab es nichts a Föld teremtésének idején nem volt semmi Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
17 Fordítások Szövegfeldolgozás Fordítások Udmurt régi: Munkácsi: angol, magyar Wichmann: angol, német új: Мынам малпанъёсы: Марайко: Tundrai nyenyec régi: Lehtisalo: angol, német, magyar új: Нярьяна Нгэрм: Лабанаускас: Пушкарёва-Хомич: magyar és orosz készül Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
18 Szövegfeldolgozás Fordítások Fordítások Szinjai hanti régi: Steinitz: angol, magyar, német új: interjúk (Ruttkay-Miklián Esztertől): Szurguti hanti régi: Paasonen: angol, magyar, német, orosz új: Песикова-Волкова: orosz; angol, magyar készül Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
19 Szövegfeldolgozás Fordítások Köszönöm a figyelmet! simon.eszter@nytud.mta.hu Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
Az Ómagyar Korpusz bemutatása
Az Ómagyar Korpusz bemutatása Simon Eszter 2017. január 13. 29. Finnugor Szeminárium Simon Eszter Az Ómagyar Korpusz bemutatása Az előadás vázlata 1 A projektek 2 A korpusz anyaga 3 A feldolgozás lépései
OTKA 71707: OBI-UGOR MORFOLÓGIAI ELEMZŐK ÉS KORPUSZOK
OTKA 71707: OBI-UGOR MORFOLÓGIAI ELEMZŐK ÉS KORPUSZOK Írta: Fejes László 2008. január 30 A projekt/pályázat vezető kutatója: Fejes László A jelen pályázatban szereplő résztvevő: Sipos Mária, Ruttkay-Miklián
Magyar nyelvű történeti korpuszok
Magyar nyelvű történeti korpuszok Simon Eszter Debrecen, 2019. február 7. MTA Nyelvtudományi Intézet Az előadás vázlata 1. A történeti korpuszok jellemzői 2. A történeti szövegek feldolgozása 3. A korpuszok
A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás
A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás varadi@nytud.mta.hu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály Tartalom Előzmény Motiváció Cél Fejlesztés Eredmény
Nyelvészet. I. Témakör: Leíró nyelvtan
Nyelvészet I. Témakör: Leíró nyelvtan 1. A magyar magánhangzó-harmónia és a hangtani hasonulások jellegzetességei KASSAI ILONA (1998): A beszédlánc fonetikai jelenségei. In: Kassai Ilona: Fonetika. Budapest:
KORPUSZOK, LEKÉRDEZŐK, NEMZETI KORPUSZPORTÁL
KORPUSZOK, LEKÉRDEZŐK, NEMZETI KORPUSZPORTÁL Sass Bálint sass.balint@nytud.mta.hu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály DHU2015 WS Számítógép az irodalomtudományban
VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY 2011. Szerkesztette: Tanács Attila. Vincze Veronika
VIII. Magyar Számítógépes Nyelvészeti Konferencia MSZNY 2011 Szerkesztette: Tanács Attila Vincze Veronika Szeged, 2011. december 1-2. http://www.inf.u-szeged.hu/mszny2011 Tartalomjegyzék I. Többnyelvuség
Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György
Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György Témavezető: Prószéky Gábor Bevezetés Előfeldolgozó algoritmusok Napjaink
Korpuszlekérdezők evolúciója
Korpuszlekérdezők evolúciója Sass Bálint sass.balint@nytud.mta.hu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály 2015. november 10. korpusz? lekérdező? 2 / 19 korpusz =
Bevezetés a számítástechnikába
Bevezetés a számítástechnikába Beadandó feladat, kódrendszerek Fodor Attila Pannon Egyetem Műszaki Informatikai Kar Villamosmérnöki és Információs Rendszerek Tanszék foa@almos.vein.hu 2010 október 12.
SZAKMAI ÖNÉLETRAJZ Farkas Judit
SZAKMAI ÖNÉLETRAJZ Farkas Judit I. Személyi adatok Név: Farkas Judit Születési hely, idő:, 1979. 04. 01. Anyja neve: Mohai Margit Judit Személyi igazolvány száma: 335364SA Munkahely: MTA Nyelvtudományi
A kibővített Magyar történeti szövegtár új keresőfelülete
A kibővített Magyar történeti szövegtár új keresőfelülete Sass Bálint MTA Nyelvtudományi Intézet sass.balint@nytud.mta.hu A nyelvtörténeti kutatások újabb eredményei IX. 2016. április 27., Szeged Nszt
Blaho Sylvia, Sass Bálint & Simon Eszter. MTA Nyelvtudományi Intézet február 4.
A készülő MGTSz adatbázis felépítése Blaho Sylvia, Sass Bálint & Simon Eszter MTA Nyelvtudományi Intézet 2010. február 4. Az előadás vázlata 1 A projekt bemutatása A szöveg feldolgozásának szintjei A korpusz
Különírás-egybeírás automatikusan
Különírás-egybeírás automatikusan Ludányi Zsófia ludanyi.zsofia@nytud.mta.hu Magyar Tudományos Akadémia, Nyelvtudományi Intézet Nyelvtechnológiai Osztály VII. Alkalmazott Nyelvészeti Doktoranduszkonferencia
A Szótári Osztály évi jelentése
A Szótári Osztály 2017. évi jelentése I. Az osztály fő feladatai 2017-ben A magyar nyelv nagyszótára VII. kötete el kezdetű szócikkeinek főszerkesztése, az em ez és fa fek kezdetű szócikkek írása és szerkesztése,
Adatbázis rendszerek. 4. előadás Redundancia, normalizálás
Adatbázis rendszerek 4. előadás Redundancia, normalizálás Molnár Bence Szerkesztette: Koppányi Zoltán HF tapasztalatok HF tapasztalatok [ABR] az email címbe! Ne emailbe küldjük a házikat, töltsétek fel
DSD. Szkennelt szövegek digitalizálása során keletkező hibák elemzése magyar szövegek esetében. Pataki Máté Tóth Zoltán MTA SZTAKI DSD
MTA SZTAKI Department of Distributed Systems Szkennelt szövegek digitalizálása során keletkező hibák elemzése magyar szövegek esetében Pataki Máté Tóth Zoltán Tartalomjegyzék Szöveges dokumentumok digitalizálása
Tanegységlista (BA) Modern filológia képzési ág. Germanisztika alapszak (BA) német nemzetiségi szakirány. a 2015-tól fölvett hallgatóknak
Tanegységlista (BA) Modern filológia képzési ág Germanisztika alapszak (BA) német nemzetiségi szakirány a 2015-tól fölvett hallgatóknak 1 Jelek, rövidítések: G = gyakorlati jegy K = kollokvium Sz = szigorlat
Webdesign II Oldaltervezés 3. Tipográfiai alapismeretek
Webdesign II Oldaltervezés 3. Tipográfiai alapismeretek Tipográfia Tipográfia: kép és szöveg együttes elrendezésével foglalkozik. A tipográfiát hagyományosan a grafikai tervezéssel, főként a nyomdai termékek
Motiváció Eszközök és eljárások Eredmények Távlat. Sass Bálint joker@nytud.hu
VONZATKERETEK A MAGYAR NEMZETI SZÖVEGTÁRBAN Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály MSZNY2005 Szeged, 2005. december 8-9. 1 MOTIVÁCIÓ 2 ESZKÖZÖK
Félévi óraszám Ajánlott félév. Követelmény. Heti óraszám. Felvétel típusa. Kreditpont. Felvétele. típusa
Felvétele Kreditpont Követelmény típusa Heti óraszám Félévi óraszám Ajánlott félév Felvétel típusa Szabadon választható Minor Más szakon Meghirdető tanszék/intézet MAGYAR ALAPSZAK (BA) TANTÁRGYLISTÁJA
PureToken: egy új tokenizáló eszköz
Szeged, 2013. január 7 8. 305 PureToken: egy új tokenizáló eszköz Indig Balázs 1 1 Pázmány Péter Katolikus Egyetem, Információs Technológiai Kar, MTA-PPKE Magyar Nyelvtechnológiai Kutatócsoport 1083 Budapest,
Könyvtári szabványok és szabályzatok jegyzéke
Könyvtári szabványok és szabályzatok jegyzéke SZABVÁNY/SZABÁLYZAT LEVÁLTÓ NEMZETKÖZI SZABVÁNY KORÁBBAN (A visszavont szabványok piros színnel kiemelve.) MSZ ISO 4:2000 Információ és dokumentáció. A kiadványok
Az igekötők gépi annotálásának problémái Kalivoda Ágnes
Az igekötők gépi annotálásának problémái Kalivoda Ágnes Budapest, 2017. február 3. PPKE BTK Bevezetés Mi a probléma? Homográf szóalakok hibás szófaji címkét kaphatnak Mi a megoldás? Szabály alapú javítás
Simon Eszter. 2012. április 19. MTA Nyelvtudományi Intézet. Korpuszépítés ómagyar kódexekből. Simon Eszter. Bemutatás. Anyaggyűjtés.
MTA Nyelvtudományi Intézet 2012 április 19 Az előadás vázlata 1 A projekt bemutatása 2 A korpusz anyagának összegyűjtése 3 A korpusz anyagának feldolgozása A betűhű szöveg előállítása 4 5 6 i elemzés és
Korpusznyelvészet április 18., ELTE. Sass Bálint MTA Nyelvtudományi Intézet 1/29
Korpusznyelvészet 2016 április 18, ELTE Sass Bálint MTA Nyelvtudományi Intézet sassbalint@nytudmtahu 1/29 http://nsztnytudhu/nszthtml 2/29 Mi mindent kell csinálni ahhoz, hogy sima szövegből ilyen korpuszlekérdezőfelület
XML / CSV specifikáció
Ajánlatok átadása az rendszerébe Termékeinek az Olcsóbbat.hu rendszerében történő megjelenítéséhez termékadatbázisát az ebben a dokumentumban megfogalmazott szabályoknak megfelelően kell formáznia, legyen
A HUNGLISH PÁRHUZAMOS KORPUSZ
A HUNGLISH PÁRHUZAMOS KORPUSZ MINT OKTATÁSI SEGÉDESZKÖZ Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály XVI. MANYE kongresszus Gödöllő, 2006. április
Lexikon és nyelvtechnológia Földesi András /
Lexikon és nyelvtechnológia 2011.11.13. Földesi András / A nyelvi anyag feldolgozásának célja és módszerei Célunk,hogy minden egyes eleme számára leírjuk paradigmatikus alakjainak automatikus szintézisét.
1. feladat: A decimális kódokat az ASCII kódtábla alapján kódold vissza karakterekké és megkapod a megoldást! Kitől van az idézet?
Projekt feladatai: 1. feladat: A decimális kódokat az ASCII kódtábla alapján kódold vissza karakterekké és megkapod a megoldást! Kitől van az idézet? 65 109 105 32 105 103 97 122 160 110 32 115 122 160
A Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály jelentése a évről. Kiemelkedő kutatási és más jellegű eredmények
A Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály jelentése a 2017. évről Kiemelkedő kutatási és más jellegű eredmények Folytatódott az Új, innovatív turisztikai szolgáltatás alapjainak megteremtése
Igekötős szerkezetek a magyarban
Igekötős szerkezetek a magyarban Kalivoda Ágnes 2018. június 26., Budapest PPKE BTK Nyelvtudományi Doktori Iskola Nyelvtechnológia Műhely Témavezető: Prószéky Gábor A kutatás célja az igekötős szerkezetek
A Humor új Fo(r)mája
A Humor új Fo(r)mája Novák Attila MTA PPKE Nyelvtechnológiai Kutatócsoport Pázmány Péter Katolikus Egyetem Információtechnológiai és Bionikai Kar 1083 Budapest, Práter utca 50/a novak.attila@itk.ppke.hu
Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel
Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel MTA SZTAKI Nyelvtechnológiai Kutatócsoport recski@sztaki.hu TLP20 2010. november 25. Tartalom Előzmények A feladat A hunchunk rendszer A
(4 félév, 20+30=50 kredit; nappali)
Érvényes: 201/201 tanévtől Mintatanterv kód: BJPSP1201BASPN, BJPSP2201BASPN, BFSSP1201BASPN, BFSSP2201BASPN, BJPSP3201BASPN, BJPSP201BASPN Mintatanterv keleti nyelvek és kultúrák BA szakos hallgatók számára
formalizmusa Egy morfológiai elemző kimeneti formalizmusának három, egymásnak gyakran
Általános célú morfológiai elemző kimeneti formalizmusa Kornai András, Rebrus Péter, Vajda Péter Halácsy Péter, Rung András, Trón Viktor Kivonat Az alábbi írásban egy a szóalakok morfoszintaktikai ábrázolására
3. melléklet: Innovációs és eredményességi mutatók Összesített innovációs index, 2017 (teljesítmény a 2010-es EU-átlag arányában)
3. melléklet: Innovációs és eredményességi mutatók 3.1. Összesített innovációs index, 2017 (teljesítmény a 2010-es EU-átlag arányában) 3.1.1. Az EU innovációs eredménytáblája (European Innovation Scoreboard)
Optikai karakterfelismerés
Optikai karakterfelismerés Az optikai karakterfelismerés feladata A különböző formátumú dokumentumok kezelésének egyik speciális esete, amikor a kezelendő dokumentumok még nem állnak rendelkezésre elektronikus
SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK
SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK A MAGYARÓRÁN Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály XVI. MANYE kongresszus Gödöllő, 2006. április 10-12.
Intelligens elektronikus szótár és lexikai adatbázis
Intelligens elektronikus szótár és lexikai adatbázis IHM-ITEM 48/2002 Oravecz Csaba MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály oravecz@nytud.hu Bevezetés a jelenlegi helyzet: nincs az informatikai
Készítette: Molnár Dávid. Beszédadatbázisok. A BUSZI és a nyelvjárási hangarchívumok
Készítette: Molnár Dávid Beszédadatbázisok A BUSZI és a nyelvjárási hangarchívumok Nyelvváltozatok és nyelvi változatosság Három fő nyelvváltozat-típus: i. területi nyelvváltozatok, ii. társadalmi nyelvváltozatok,
Újdonságok az OpenOffice.org Lingucomponent moduljában
Újdonságok az OpenOffice.org Lingucomponent moduljában Németh László Lingucomponent projektvezető 2009-11-06 Összefoglaló Mondatellenőrzés: API és bővítmények Tezaurusz komponens: tövezés és ragozás Elválasztás:
ME BTK MAGYAR SZAKOS OSZTATLAN TANÁRKÉPZÉS
ME BTK MAGYAR SZAKOS OSZTATLAN TANÁRKÉPZÉS A Miskolci Egyetem Bölcsészettudományi Kara (ME BTK) magyar szakos képzéseinek megtervezésekor alapvetően két tényezőt vettünk figyelembe: a hagyományos magyar
Bevezetés az e-magyar programcsomag használatába
Bevezetés az e-magyar programcsomag használatába Vadász Noémi 2019. február 7. MTA Nyelvtudományi Intézet vadasz.noemi@nytud.mta.hu Az előadás felépítése 1. szövegelemzés számítógéppel elemzési lépések
Tananyagok. = Feladatsorok. Hogyan készült? Adaptált tartalom Interdiszciplinaritás
Tananyagok = Feladatsorok Hogyan készült? Adaptált tartalom Interdiszciplinaritás Hogyan készült? a. kérdőívek b. előkészítés, NAT c. tananyagvázlatok d. konzultációk e. tesztelés f. véglegesítés külön-külön
Nyelv-ész-gép Új technológiák az információs társadalomban
Nyelv-ész-gép Új technológiák az információs társadalomban CESAR Csatlakozás az európai nyelvtechnológiai infrastruktúra élvonalához Lendvai Piroska piroska@nytud.hu CEntral and *Közép- és South-East EuropeAn
Adatbázis Rendszerek II. 5. PLSQL Csomagok 16/1B IT MAN
Adatbázis Rendszerek II. 5. PLSQL Csomagok 16/1B IT MAN B IT v: 2016.03.03 MAN Csomagok A DBMS csomagok a PL/SQL alkalmazások fejlesztését segítik, bennük tároljuk a létrehozott programok kódjait. A specifikációs
Tanulmányok a középmagyar kor mondattana köréből
Tanulmányok a középmagyar kor mondattana köréből 1 2 3 Segédkönyvek a nyelvészet tanulmányozásához 89. Tanulmányok a középmagyar kor mondattana köréből Szerkesztette Haader Lea Horváth László Tinta könyvkiadó
ME BTK MAGYAR SZAKOS OSZTATLAN TANÁRKÉPZÉS
ME BTK MAGYAR SZAKOS OSZTATLAN TANÁRKÉPZÉS A Miskolci Egyetem Bölcsészettudományi Kara (ME BTK) magyar szakos képzéseinek megtervezésekor alapvetően két tényezőt vettünk figyelembe: a hagyományos magyar
Osztatlan némettanár képzés tanterve (5+1) és (4+1) A képzési és kimeneti követelményeknek való megfelelés bemutatása
Osztatlan némettanár képzés tanterve (5+) és (4+) A képzési és kimeneti követelményeknek való megfelelés bemutatása KÖZÉP- ÉS ÁLTALÁNOS ISKOLAI NÉMETTANÁR KÉPZÉS: KÖZÖS SZAKASZ Tantárgy neve Félév és óraszám
Tanegységlista (BA) Modern filológia képzési ág. Germanisztika alapszak (BA) néderlandisztika szakirány. a 2017-től fölvett hallgatóknak
Tanegységlista (BA) Modern filológia képzési ág Germanisztika alapszak (BA) néderlandisztika szakirány a 2017-től fölvett hallgatóknak 1 Jelek, rövidítések: EF = egyéni felkészülés G = gyakorlati jegy
A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága
A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága Az elemzésektől a keresőfelületig DELITE Angol Nyelvészeti Tanszék 2014. 03. 12. Csernyi Gábor 1 Célok, előzmények Mit?
Gyakorló 9. feladat megoldási útmutató
Gyakorló 9. feladat megoldási útmutató 1. Minek a leírása a következő? Aktív hálózati hardver eszközök (pl.: routerek) és szoftverek segítségével létrehozott biztonsági rendszer két hálózat (jellemzően
- - 2006. szeptemberétől
- - Germanisztika alapszak - német szakirány mintatanterve - - 2006. szeptemberétől "A" típusú tantárgyak 1 2 3 4 5 6 7 8 9 10 Tantárgy neve Tantárgy kódja Heti Tantárgyfelelős Meghirdetés kontakt Félévi
MSD-KR harmonizáció a Szeged Treebank 2.5-ben
Szeged, 2010. december 2 3. 349 MSD-KR harmonizáció a Szeged Treebank 2.5-ben Farkas Richárd 1, Szeredi Dániel 2, Varga Dániel 2, Vincze Veronika 3 1 MTA-SZTE, Mesterséges Intelligencia Tanszéki Kutatócsoport
Petőfi Irodalmi Múzeum. megújuló rendszere technológiaváltás
Petőfi Irodalmi Múzeum A Digitális Irodalmi Akadémia megújuló rendszere technológiaváltás II. Partnerek, feladatok Petőfi Irodalmi Múzeum Megrendelő, szakmai vezetés, kontroll Konzorcium MTA SZTAKI Internet
Elérhető szótárak a magyar nyelv oktatásában és használatában. M. P i n t é r T i b o r
Elérhető szótárak a magyar nyelv oktatásában és használatában M. P i n t é r T i b o r CÉL I. Magyar nyelvi segítség (nyelvtanuláshoz) Papíralapon Elektronikusan On-line Kérdés, hogy ezt az elérhető szótárak
Tartalomjegyzék Bevezető...1 Adatátvétel Windows alkalmazásból...1 Adatátvétel webes alkalmazásból...2 Adatforrás formátuma...2 Megvalósítás...
Számlázó Program adatátvétel Dukumentáció változatszáma: 1.8 Tartalomjegyzék Bevezető...1 Adatátvétel Windows alkalmazásból...1 Adatátvétel webes alkalmazásból...2 Adatforrás formátuma...2 Megvalósítás...5
Megyei statisztikai profil a Smart Specialisation Strategy (S3) megalapozásához Csongrád megye
Megyei statisztikai profil a Smart Specialisation Strategy (S3) megalapozásához Csongrád megye Az alábbi statisztikai profil a megye általános, a Smart Specialisation Strategy (S3)-hoz kapcsolódó stratégiaalkotás
Laborgyakorlat 3 A modul ellenőrzése szimulációval. Dr. Oniga István
Laborgyakorlat 3 A modul ellenőrzése szimulációval Dr. Oniga István Szimuláció és verifikáció Szimulációs lehetőségek Start Ellenőrzés után Viselkedési Funkcionális Fordítás után Leképezés után Időzítési
Angol-Amerikai Intézet 3 tanszékbıl áll
2017. augusztus 28. Angol-Amerikai Intézet 3 tanszékbıl áll Anglisztika Tanszék Amerikanisztika Tanszék Angoltanár-képzı és Alkalmazott Nyelvészeti Tanszék (=ELTEAL) http://elteal.ieas-szeged.hu/ Többféle
ELEKTRONIKUS ŰRLAP A NYILVÁNTARTÁSOK REGISZTERÉBE
Főlap Bejelentés célja A nyilvántartás ja Megnevezése Adatváltozás REG_1011 A nyilvántartást vezető szervezet Megnevezése ja (Törzsszám) Kapcsolattartó KEKKH 15721475 OKMÁNYFELÜGYELETI FŐOSZTÁLY (OKMANYFELUGY.FOOSZTALY@KEKKH.GOV.HU)
BA Germanisztika alapképzés mintatanterve (180 kredit, 6 félév)
BA Germanisztika alapképzés mintatanterve (180 kredit, 6 félév) Neptun kód Tanegység Heti Féléves Beszámolási óraszám óraszám kötelezettség Kredit Megjegyzés Előfeltétel 1. év 1. félév BTSBN001X01 Filozófia
Az új magyar Braille-rövidírás kialakítása
Az új magyar Braille-rövidírás kialakítása Sass Bálint sassbalint@nytudmtahu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály 2013 november 11 Braille-írás A vakok által
b o o k s 2 e b o o k s. e u
eod eod eod eod eod eod EOD az MTA Könyvtárában Kapus Erika tájékoztató könyvtáros Tájékoztatási és Olvasószolgálati Osztály b o o k s 2 e b o o k s. e u ebooks on Demand e-könyvek megrendelésre 10 ország
Karán című konferencián, 2010. október 28-án elhangzott előadás szerkesztett változata.
Zólyomi Gábor Hogyan tanítsunk meg sumerül egy honlapot, és minek? 1 Az érdeklődő laikus vagy szakember, ha napjainkban ékírásos szövegeket szeretne tanulmányozni, akkor tudományos és kevésbé tudományos
BIG DATA ÉS GÉPI TANULÁS KÖRNYEZET AZ MTA CLOUD-ON KACSUK PÉTER, NAGY ENIKŐ, PINTYE ISTVÁN, HAJNAL ÁKOS, LOVAS RÓBERT
BIG DATA ÉS GÉPI TANULÁS KÖRNYEZET AZ MTA CLOUD-ON KACSUK PÉTER, NAGY ENIKŐ, PINTYE ISTVÁN, HAJNAL ÁKOS, LOVAS RÓBERT TARTALOM MTA Cloud Big Data és gépi tanulást támogató szoftver eszközök Apache Spark
GERMANISZTIKA ALAPSZAK (BA) MINTATANTERVE NÉMET szakirány Germanisztika fakultatív modul NAPPALI TAGOZAT Érvényes a 2014/2015.
GERMANISZTIKA ALAPSZAK (BA) MINTATANTERVE NÉMET szakirány NAPPALI TAGOZAT Érvényes a 2014/2015. tanévtől Tárgykód Tantárgy megnevezése Előeltétel Felvétele Kreditpont Követelmény típusa Heti óraszám Ajánlott
PTE BTK Magyar Nyelv- és Irodalomtudományi Intézet Nyelvtudományi Tanszék
PTE BTK Magyar Nyelv- és Irodalomtudományi Intézet Nyelvtudományi Tanszék Hasonlóságok és különbözőségek a nyelvben és a nyelvi nevelésben 2019. június 17 18. Program Pécs Program Június 17. hétfő 9:30
magyar (BA)-BTK XXX-MAGTANB2/ képzési terv
magyar (BA)-BTK XXX-MAGTANB2/14-15-1-1 képzési terv Bölcsészettudományi Kar Kód: XXX-MAGTANB2/14-15-1-1 Szükséges kredit: 180 Félévek száma: 6 Tantermi órák száma:. Gyakorlati képzés: %. Az írásos tanterv
Tanegységlista (BA) Modern filológia képzési ág. Germanisztika alapszak (BA) néderlandisztika szakirány. a 2015-től fölvett hallgatóknak
Tanegységlista (BA) Modern filológia képzési ág Germanisztika alapszak (BA) néderlandisztika szakirány a 2015-től fölvett hallgatóknak Jelek, rövidítések: EF = egyéni felkészülés G = gyakorlati jegy K
Angol-Amerikai Intézet 3 tanszékbıl áll
2016. augusztus 29. Angol-Amerikai Intézet 3 tanszékbıl áll Anglisztika Tanszék Amerikanisztika Tanszék Angoltanár-képzı és Alkalmazott Nyelvészeti Tanszék (=ELTEAL) http://elteal.ieas-szeged.hu/ Többféle
Tanegységlista (BA) Modern filológia képzési ág
Tanegységlista (BA) Modern filológia képzési ág Szlavisztika alapszak Orosz szakirány a 2015-től fölvett hallgatóknak 1 Jelek, rövidítések: EF = egyéni felkészülés G = gyakorlati jegy K = kollokvium Sz
Egy általános célú morfológiai annotáció kiterjesztése
Egy általános célú morfológiai annotáció kiterjesztése Recski Gábor MTA SZTAKI, Nyelvtechnológiai Kutatócsoport recski@sztaki.hu Kivonat: Egy szó nyelvtani jegyeinek kódolására számos különböző annotációs
Üzleti szemlélet és a magyar nyelv támogatása a többnyelvű világban
Üzleti szemlélet és a magyar nyelv támogatása a többnyelvű világban Prószéky Gábor MorphoLogic & PPKE ITK www.morphologic.hu & www.itk.ppke.hu A magyar nyelv helyzete a digitális korban - MTA, 2013. január
Mély neuronhálók alkalmazása és optimalizálása
magyar nyelv beszédfelismerési feladatokhoz 2015. január 10. Konzulens: Dr. Mihajlik Péter A megvalósítandó feladatok Irodalomkutatás Nyílt kutatási eszközök keresése, beszédfelismer rendszerek tervezése
2015. június Osztály:Gyermekfogászat
2015. június Osztály:Gyermekfogászat Orvos Rendelési idő Orvos Rendelési idő Délelőtt Délután június 1. június 2. június 3. június 4. 7.30-13.30 dr.bálint Szilvia június 5. dr.földes Katalin június 8.
KÖZBESZERZÉSI ADATBÁZIS (KBA) A KBT. NOVEMBER 1-JEI VÁLTOZÁSAI
KÖZBESZERZÉSI ADATBÁZIS (KBA) A KBT. NOVEMBER 1-JEI VÁLTOZÁSAI Dr. Nagy András szakmai főtanácsadó Közbeszerzési Hatóság Informatikai Főosztály 2013. November 26. Bevezetés I. 2013. július 1-től Kbt. 31.
A Mazsola KORPUSZLEKÉRDEZŐ
A Mazsola KORPUSZLEKÉRDEZŐ Sass Bálint sass.balint@nytud.mta.hu MTA Nyelvtudományi Intézet PPKE ITK Eötvös Collegium Budapest, 2012. április 27. 1 / 34 1 HÁTTÉR 2 HASZNÁLAT 3 MIRE JÓ? 4 PÉLDÁK 2 / 34 1
w w w. h a n s a g i i s k. h u
Weblapkészítés weblap: hypertext kódolású dokumentumok, melyek szöveget képet linkeket, könyvjelzőket/horgonyokat táblázatokat / szövegdobozokat és más objektumokat tartalmaznak. Kódolásuk HTML (Hypertext
PurePos: hatékony morfológiai egyértelműsítő modul
PurePos: hatékony morfológiai egyértelműsítő modul Orosz György PPKE ITK Interdiszciplináris Műszaki Tudományok Doktori Iskola oroszgy@itk.ppke.hu Kivonat: A szófaji egyértelműsítés a számítógépes nyelvfeldolgozás
A 2017 szeptemberétől érvényes kurzuslisták BA major szakosok nyelvészeti tárgyai
2017-től érvényes!!! 1 A 2017 szeptemberétől érvényes kurzuslisták BA major szakosok nyelvészeti tárgyai 1. félév (ősz) 2. félév (tavasz) Bevezetés a nyelvtudományba (előadás, 2 óra/ 2 Magyar nyelvészeti
Doktori téma A lényegesség mérése Kutatóeszköz Alkalmazás Befejezés. Sass Bálint
MAZSOLA ESZKÖZ A MAGYAR IGÉK BŐVÍTMÉNYSZERKEZETÉNEK VIZSGÁLATÁRA Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE ITK, MMT Doktori Iskola, Nyelvtechnológia Doktori
Tanóra / modul címe: A MAGYAR İSTÖRTÉNET PROBLÉMÁI
Tanóra / modul címe: A MAGYAR İSTÖRTÉNET PROBLÉMÁI A tanóra célja: Az óra a őstörténet és az annak kutatásával kapcsolatos problémákra hívja fel a figyelmet. Az őstörténet fogalmának feltárásával összefüggésben
HTML é s wéblapféjlészté s
HTML é s wéblapféjlészté s 1. Melyik országból ered a hipertext-es felület kialakítása? USA Japán Svájc 2. Webfejlesztéskor ha a site-on belül hivatkozunk egy file-ra, akkor az elérési útnak... relatívnak
Szemle Beregszászi Anikó és Csernicskó István: itt mennyit ér a szó? Írások a kárpátaljai magyarok nyelvhasználatáról.
Szemle Beregszászi Anikó és Csernicskó István: itt mennyit ér a szó? Írások a kárpátaljai magyarok nyelvhasználatáról. PoliPrint, Ungvár, 2004. 206 lap 1. Új kötettel ajándékozta meg 2004 utolsó napjaiban
Szavazókör nyitvatartása
1. Airault Frédérick Sebastien anyanyelvi lektor Francia Tanszék 2. Balló Ilona Larisza nyelvtanár Szlavisztikai Intézet 3. Dr. Bartáné Kustár Katalin ügyvivő-szakértő Dékáni Hivatal 4. Bertalan Ibolya
Tanegységlista (BA) Modern filológia képzési ág. Germanisztika alapszak (BA) német szakirány 2019-től fölvett hallgatóknak
Tanegységlista (BA) Modern filológia képzési ág Germanisztika alapszak (BA) német szakirány 2019-től fölvett hallgatóknak 1 Jelek, rövidítések: EF = egyéni felkészülés G = gyakorlati jegy K = kollokvium
Tanegységlista (BA) 2015-től fölvett hallgatóknak
Tanegységlista (BA) Szabad bölcsészet alapszak művészettörténet specializáció* 2015-től fölvett hallgatóknak *A 38/2014. (IV.30.) EMMI rendelet a szabad bölcsészet alapképzési szak képzési- és kimeneti
Programozás. (GKxB_INTM021) Dr. Hatwágner F. Miklós május 6. Széchenyi István Egyetem, Gy r
Programozás (GKxB_INTM021) Széchenyi István Egyetem, Gy r 2018. május 6. Parancssori paraméterek Parancssorban történ programindításkor a program nevét követ en szóközökkel elválasztva paraméterek (command
1999-ben beadott pályázatok adatai
1999-ben beadott pályázatok adatai sorszám kezdő iktatószám ELTE munkaszám Támogató Pályázat címe Témavezető Tanszék Nyert összeg 1 462/1999 1620 Tantárgypedagógiák az óvodapedagógus- és tanítóképzés folyamatában:
Obi-ugor nyelvek digitális adatbázisa
MAGYAR NYELVJÁRÁSOK 52 (2014): 19 30. A DEBRECENI EGYETEM MAGYAR NYELVTUDOMÁNYI TANSZÉKÉNEK LEKTORÁLT FOLYÓIRATA Obi-ugor nyelvek digitális adatbázisa BAKRÓ-NAGY MARIANNE Írásom célja, hogy bemutassam
KOPI. Többnyelvű dokumentum nyelvének megállapítása MTA SZTAKI DSD. Vajna Miklós Pataki Máté MSZNY Department of Distributed Systems
KOPI MTA SZTAKI Department of Distributed Systems Többnyelvű dokumentum nyelvének megállapítása MSZNY 2011 Vajna Miklós Pataki Máté Probléma Természetes nyelvű dokumentum nyelvének a megállapítása Megoldott
Interdiszciplináris Doktori Iskola. A Kárpát-medence és a szomszédos birodalmak között Doktori Program. Képzési program
Interdiszciplináris Doktori Iskola A Kárpát-medence és a szomszédos birodalmak 900 1800 között Doktori Program Képzési program A KÉPZÉS ÁLTALÁNOS JELLEMZŐI A 2016 szeptemberében tanulmányaikat megkezdő
Nyelvi tudásra épülő fordítómemória
Nyelvi tudásra épülő fordítómemória Hodász Gábor 1, Grőbler Tamás 2 1 Pázmány Péter Katolikus Egyetem Információs Technológiai Kar Budapest hodasz@morphologic.hu 2 MorphoLogic Kft. Budapest grobler@morphologic.hu
Java programozási nyelv 6. rész Java a gyakorlatban
Java programozási nyelv 6. rész Java a gyakorlatban Nyugat-Magyarországi Egyetem Faipari Mérnöki Kar Informatikai Intézet Soós Sándor 2004. október A Java programozási nyelv Soós Sándor 1/16 Tartalomjegyzék
Hagyjuk vagy fejlesszük? A magyar műszaki nyelv jelenéről és jövőjéről. Dr. Balázs Géza tszv. egyetemi tanár ELTE Mai Magyar Nyelvi Tanszék
Hagyjuk vagy fejlesszük? A magyar műszaki nyelv jelenéről és jövőjéről Dr. Balázs Géza tszv. egyetemi tanár ELTE Mai Magyar Nyelvi Tanszék Sztenderd - szaknyelv A fejlett nyelvek rétegződnek sztenderd
MAGYAR SZAKOS OSZTATLAN TANÁRKÉPZÉS, LEVELEZŐ
MAGYAR SZAKOS OSZTATLAN TANÁRKÉPZÉS, LEVELEZŐ I. ÉVF. ÓRARENDJE 7 8. 13.15 14.45 Az órák helye: általában a B/2. ép. III. em., 304-es terem. Szept. 14.p. 14től Bevezetés a nyelvtudományba ea. (Dr. Pethő
Külgazdasági és Külügyminisztérium. 1. sz. Melléklet
1. sz. Melléklet A meghirdetett vendégoktatói ösztöndíjak a 2018/2019-es tanévtől és a fogadóintézmények által meghatározott feltételek 1. Strasbourg (Franciaország), Strasbourgi Egyetem francia szakos