Az URaLUID adatbázis bemutatása
|
|
- Endre Pásztor
- 6 évvel ezelőtt
- Látták:
Átírás
1 Hatás alatt álló nyelvek Az URaLUID adatbázis bemutatása Simon Eszter MTA Nyelvtudományi Intézet január Finnugor Szeminárium Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
2 Az előadás vázlata 1 Projekt 2 Szöveggyűjtés 3 Szövegfeldolgozás Transzkripció és transzliteráció Morfológiai elemzés Fordítások Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
3 Projekt A projekt Az uráli nyelvek mondattanának változása aszimmetrikus kontaktushelyzetben a Nemzeti Kutatási, Fejlesztési és Innovációs Hivatal támogatásával (ERC 15 HU, OTKA ) február július MTA Nyelvtudományi Intézet projektvezető: É. Kiss Katalin interdiszciplináris csapat: kutatók a finnugor, a nyelvtechnológiai és az elméleti nyelvészeti osztályról Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
4 Szöveggyűjtés Koncepció régi és új szövegek lehetőleg beszélt nyelvi vagy ahhoz közel álló műfaj ideális esetben a dialektális és szociolingvisztikai tényezők ki vannak egyensúlyozva 4000 token/kor/nyelv mennyiségű anyag teljes annotációval ellátva ha kevés munkával megszerezhető, akkor jöhet minden más anyag is, de az nem feltétlenül lesz végigannotálva Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
5 Szöveggyűjtés Szöveggyűjtés Udmurt régi: Munkácsi (1885), déli, folklór Wichmann (1901), déli és északi, folklór új: Мынам малпанъёсы (2014), blog Марайко (2014), blog Tundrai nyenyec régi: Lehtisalo (1947), keleti és középső, folklór új: Нярьяна Нгэрм ( ), középső, újságcikkek Лабанаускас (1995), keleti, folklór Пушкарёва-Хомич (2001), keleti, folklór Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
6 Szöveggyűjtés Szöveggyűjtés Szinjai hanti régi: Steinitz (1937), déli, folklór új: interjúk (Ruttkay-Miklián Esztertől) Szurguti hanti régi: Paasonen (1901), jugáni, folklór új: Песикова-Волкова (2013), interjúk Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
7 Szövegfeldolgozás Szövegfeldolgozottsági szintek eredeti szöveg cirill FUT lejegyzés(ek) IPA fordítás angol orosz német magyar morfológiai információk lemma szófajkód inflexiós kódok Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
8 Szövegfeldolgozás Az eredeti szöveg előálĺıtása Transzkripció és transzliteráció beszkennelt könyv OCR kézi javítás eredeti szöveg egységes karaktertábla: minden nyelv minden lejegyzési, átírási és írásrendszerének minden karaktere szerepel a Unicode-kódjával, -nevével és Prószéky-kódjával ezekkel a karakterekkel történik a hangzó szövegek lejegyzése, ezekre a karakterekre tanítjuk be az optikai karakterfelismerőt, ezekre a karakterekre normalizáljuk a különböző forrásokból származó szövegeket, és ezek szolgáltatják a különböző irányú konverziók bemeneti és kimeneti karakterállományát is Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
9 Szövegfeldolgozás Transzkripció és transzliteráció Karakterszintű normalizálás különböző források UTF-8 kódolású plain text fájlok normalizálás: nem Unicode-karakterek lecserélése Unicode-karakterekre idegen nyelvű részek eltávoĺıtása latin karakterek cirillre cserélése a cirill szövegben, pl. ван!= вaн az általunk használt összes karakter megjeleníthető a Charis SIL fontkészlettel (+ a böngészőben be kell álĺıtani a karakterkódolást: View/Text encoding/unicode) Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
10 Szövegfeldolgozás Transzkripció és transzliteráció Transzkripció és transzliteráció eredeti szöveg átírási szabályok automatikus konverzió átirat ahol az eredeti szöveg lehet cirill vagy valamilyen FUT, az átirat pedig lehet cirill, valamilyen FUT vagy IPA FUT-ok: Steinitz, RME, SzOCh, Munkácsi, Wichmann, Hajdú, Mus Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
11 Konverzió Szövegfeldolgozás Transzkripció és transzliteráció összesen 12 konverziós irány szinjai hanti: Steinitz2IPA, Steinitz2RME szurguti hanti: cirill2szoch, SzOCh2IPA udmurt: Munkácsi2IPA, Wichmann2IPA, IPA2cirill, cirill2ipa tundrai nyenyec: Hajdú2Mus, Hajdú2IPA, Hajdú2cirill, cirill2ipa Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
12 Szövegfeldolgozás Transzkripció és transzliteráció Konverzió példa #in first syllable: s/([ ( ][čjgklmnńnprstw])a/\15:/g s/ a/ 5:/g s/\(a/\(5:/g s/ k a/ k 5:/g s/ t a/ t 5:/g #else: s/a/5/g Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
13 Szövegfeldolgozás Morfológiai elemzés Morfológiai elemzés A cél: angol glosszázás az általunk létrehozott glosszázási rövidítéseket tartalmazó táblázat alapján A táblázat az alábbi nemzetközi sztenderdek alapján készült: Leipzig Glossing Rules kódtábla a Wikipédia Glossing abbreviations című oldalának kódjai kurrens szakirodalom Leképezés és konverzió: az elérhető morfológiai elemzők kimenete a mi kódtáblánk Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
14 Morfológiai elemzők Szövegfeldolgozás Morfológiai elemzés Udmurt: MorphoLogic & Giellatekno Tundrai nyenyec: Giellatekno Szinjai hanti: MorphoLogic Szurguti hanti: nincs Zipf törvénye alapján: a néhány leggyakoribb szó lefedi a teljes szöveg nagy százalékát a min. ötször előforduló szavak kilistázása elemzések hozzájuk rendelése kézzel a szöveg több mint 60%-ához automatikusan hozzárendelődik az elemzés Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
15 Szövegfeldolgozás Morfológiai elemzés Morfológiai annotáció Amit kapunk: lemma szófajkód inflexiós kódok derivációs kódok morféma szinten szegmentált szóalak és kódok magyar lemma angol lemma Ami kell nekünk: lemma szófajkód inflexiós kódok angol lemma Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
16 Példa Szövegfeldolgozás Morfológiai elemzés YRK Hajdú: jā mīdaxana amkerta jankūwi YRK Mus: ja midaxana amkerta jankuwi YRK IPA: ja mi:daxana ămkerta jănkuwi YRK cirill: я мыдахана амкэрта яңкувы lemma: я мы ңамгэ яңгось szófaj: N Ptcp Pron.neg V glossza: earth create.ipfv.ptcp.loc nothing neg.ex.infer ENG: GER: HUN: when the earth was created, there was nothing zur zeit der erschaffung der erde gab es nichts a Föld teremtésének idején nem volt semmi Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
17 Fordítások Szövegfeldolgozás Fordítások Udmurt régi: Munkácsi: angol, magyar Wichmann: angol, német új: Мынам малпанъёсы: Марайко: Tundrai nyenyec régi: Lehtisalo: angol, német, magyar új: Нярьяна Нгэрм: Лабанаускас: Пушкарёва-Хомич: magyar és orosz készül Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
18 Szövegfeldolgozás Fordítások Fordítások Szinjai hanti régi: Steinitz: angol, magyar, német új: interjúk (Ruttkay-Miklián Esztertől): Szurguti hanti régi: Paasonen: angol, magyar, német, orosz új: Песикова-Волкова: orosz; angol, magyar készül Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
19 Szövegfeldolgozás Fordítások Köszönöm a figyelmet! simon.eszter@nytud.mta.hu Simon Eszter (MTA NyTI) Hatás alatt álló nyelvek január / 19
Az Ómagyar Korpusz bemutatása
Az Ómagyar Korpusz bemutatása Simon Eszter 2017. január 13. 29. Finnugor Szeminárium Simon Eszter Az Ómagyar Korpusz bemutatása Az előadás vázlata 1 A projektek 2 A korpusz anyaga 3 A feldolgozás lépései
RészletesebbenOTKA 71707: OBI-UGOR MORFOLÓGIAI ELEMZŐK ÉS KORPUSZOK
OTKA 71707: OBI-UGOR MORFOLÓGIAI ELEMZŐK ÉS KORPUSZOK Írta: Fejes László 2008. január 30 A projekt/pályázat vezető kutatója: Fejes László A jelen pályázatban szereplő résztvevő: Sipos Mária, Ruttkay-Miklián
RészletesebbenMagyar nyelvű történeti korpuszok
Magyar nyelvű történeti korpuszok Simon Eszter Debrecen, 2019. február 7. MTA Nyelvtudományi Intézet Az előadás vázlata 1. A történeti korpuszok jellemzői 2. A történeti szövegek feldolgozása 3. A korpuszok
RészletesebbenA Magyar Nemzeti Szövegtár új változatáról Váradi Tamás
A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás varadi@nytud.mta.hu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály Tartalom Előzmény Motiváció Cél Fejlesztés Eredmény
RészletesebbenNyelvészet. I. Témakör: Leíró nyelvtan
Nyelvészet I. Témakör: Leíró nyelvtan 1. A magyar magánhangzó-harmónia és a hangtani hasonulások jellegzetességei KASSAI ILONA (1998): A beszédlánc fonetikai jelenségei. In: Kassai Ilona: Fonetika. Budapest:
RészletesebbenKORPUSZOK, LEKÉRDEZŐK, NEMZETI KORPUSZPORTÁL
KORPUSZOK, LEKÉRDEZŐK, NEMZETI KORPUSZPORTÁL Sass Bálint sass.balint@nytud.mta.hu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály DHU2015 WS Számítógép az irodalomtudományban
RészletesebbenVIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY 2011. Szerkesztette: Tanács Attila. Vincze Veronika
VIII. Magyar Számítógépes Nyelvészeti Konferencia MSZNY 2011 Szerkesztette: Tanács Attila Vincze Veronika Szeged, 2011. december 1-2. http://www.inf.u-szeged.hu/mszny2011 Tartalomjegyzék I. Többnyelvuség
RészletesebbenHibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György
Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György Témavezető: Prószéky Gábor Bevezetés Előfeldolgozó algoritmusok Napjaink
RészletesebbenKorpuszlekérdezők evolúciója
Korpuszlekérdezők evolúciója Sass Bálint sass.balint@nytud.mta.hu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály 2015. november 10. korpusz? lekérdező? 2 / 19 korpusz =
RészletesebbenBevezetés a számítástechnikába
Bevezetés a számítástechnikába Beadandó feladat, kódrendszerek Fodor Attila Pannon Egyetem Műszaki Informatikai Kar Villamosmérnöki és Információs Rendszerek Tanszék foa@almos.vein.hu 2010 október 12.
RészletesebbenSZAKMAI ÖNÉLETRAJZ Farkas Judit
SZAKMAI ÖNÉLETRAJZ Farkas Judit I. Személyi adatok Név: Farkas Judit Születési hely, idő:, 1979. 04. 01. Anyja neve: Mohai Margit Judit Személyi igazolvány száma: 335364SA Munkahely: MTA Nyelvtudományi
RészletesebbenA kibővített Magyar történeti szövegtár új keresőfelülete
A kibővített Magyar történeti szövegtár új keresőfelülete Sass Bálint MTA Nyelvtudományi Intézet sass.balint@nytud.mta.hu A nyelvtörténeti kutatások újabb eredményei IX. 2016. április 27., Szeged Nszt
RészletesebbenBlaho Sylvia, Sass Bálint & Simon Eszter. MTA Nyelvtudományi Intézet február 4.
A készülő MGTSz adatbázis felépítése Blaho Sylvia, Sass Bálint & Simon Eszter MTA Nyelvtudományi Intézet 2010. február 4. Az előadás vázlata 1 A projekt bemutatása A szöveg feldolgozásának szintjei A korpusz
RészletesebbenKülönírás-egybeírás automatikusan
Különírás-egybeírás automatikusan Ludányi Zsófia ludanyi.zsofia@nytud.mta.hu Magyar Tudományos Akadémia, Nyelvtudományi Intézet Nyelvtechnológiai Osztály VII. Alkalmazott Nyelvészeti Doktoranduszkonferencia
RészletesebbenA Szótári Osztály évi jelentése
A Szótári Osztály 2017. évi jelentése I. Az osztály fő feladatai 2017-ben A magyar nyelv nagyszótára VII. kötete el kezdetű szócikkeinek főszerkesztése, az em ez és fa fek kezdetű szócikkek írása és szerkesztése,
RészletesebbenAdatbázis rendszerek. 4. előadás Redundancia, normalizálás
Adatbázis rendszerek 4. előadás Redundancia, normalizálás Molnár Bence Szerkesztette: Koppányi Zoltán HF tapasztalatok HF tapasztalatok [ABR] az email címbe! Ne emailbe küldjük a házikat, töltsétek fel
RészletesebbenDSD. Szkennelt szövegek digitalizálása során keletkező hibák elemzése magyar szövegek esetében. Pataki Máté Tóth Zoltán MTA SZTAKI DSD
MTA SZTAKI Department of Distributed Systems Szkennelt szövegek digitalizálása során keletkező hibák elemzése magyar szövegek esetében Pataki Máté Tóth Zoltán Tartalomjegyzék Szöveges dokumentumok digitalizálása
RészletesebbenTanegységlista (BA) Modern filológia képzési ág. Germanisztika alapszak (BA) német nemzetiségi szakirány. a 2015-tól fölvett hallgatóknak
Tanegységlista (BA) Modern filológia képzési ág Germanisztika alapszak (BA) német nemzetiségi szakirány a 2015-tól fölvett hallgatóknak 1 Jelek, rövidítések: G = gyakorlati jegy K = kollokvium Sz = szigorlat
RészletesebbenWebdesign II Oldaltervezés 3. Tipográfiai alapismeretek
Webdesign II Oldaltervezés 3. Tipográfiai alapismeretek Tipográfia Tipográfia: kép és szöveg együttes elrendezésével foglalkozik. A tipográfiát hagyományosan a grafikai tervezéssel, főként a nyomdai termékek
RészletesebbenMotiváció Eszközök és eljárások Eredmények Távlat. Sass Bálint joker@nytud.hu
VONZATKERETEK A MAGYAR NEMZETI SZÖVEGTÁRBAN Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály MSZNY2005 Szeged, 2005. december 8-9. 1 MOTIVÁCIÓ 2 ESZKÖZÖK
RészletesebbenFélévi óraszám Ajánlott félév. Követelmény. Heti óraszám. Felvétel típusa. Kreditpont. Felvétele. típusa
Felvétele Kreditpont Követelmény típusa Heti óraszám Félévi óraszám Ajánlott félév Felvétel típusa Szabadon választható Minor Más szakon Meghirdető tanszék/intézet MAGYAR ALAPSZAK (BA) TANTÁRGYLISTÁJA
RészletesebbenPureToken: egy új tokenizáló eszköz
Szeged, 2013. január 7 8. 305 PureToken: egy új tokenizáló eszköz Indig Balázs 1 1 Pázmány Péter Katolikus Egyetem, Információs Technológiai Kar, MTA-PPKE Magyar Nyelvtechnológiai Kutatócsoport 1083 Budapest,
RészletesebbenKönyvtári szabványok és szabályzatok jegyzéke
Könyvtári szabványok és szabályzatok jegyzéke SZABVÁNY/SZABÁLYZAT LEVÁLTÓ NEMZETKÖZI SZABVÁNY KORÁBBAN (A visszavont szabványok piros színnel kiemelve.) MSZ ISO 4:2000 Információ és dokumentáció. A kiadványok
RészletesebbenAz igekötők gépi annotálásának problémái Kalivoda Ágnes
Az igekötők gépi annotálásának problémái Kalivoda Ágnes Budapest, 2017. február 3. PPKE BTK Bevezetés Mi a probléma? Homográf szóalakok hibás szófaji címkét kaphatnak Mi a megoldás? Szabály alapú javítás
RészletesebbenSimon Eszter. 2012. április 19. MTA Nyelvtudományi Intézet. Korpuszépítés ómagyar kódexekből. Simon Eszter. Bemutatás. Anyaggyűjtés.
MTA Nyelvtudományi Intézet 2012 április 19 Az előadás vázlata 1 A projekt bemutatása 2 A korpusz anyagának összegyűjtése 3 A korpusz anyagának feldolgozása A betűhű szöveg előállítása 4 5 6 i elemzés és
RészletesebbenKorpusznyelvészet április 18., ELTE. Sass Bálint MTA Nyelvtudományi Intézet 1/29
Korpusznyelvészet 2016 április 18, ELTE Sass Bálint MTA Nyelvtudományi Intézet sassbalint@nytudmtahu 1/29 http://nsztnytudhu/nszthtml 2/29 Mi mindent kell csinálni ahhoz, hogy sima szövegből ilyen korpuszlekérdezőfelület
RészletesebbenXML / CSV specifikáció
Ajánlatok átadása az rendszerébe Termékeinek az Olcsóbbat.hu rendszerében történő megjelenítéséhez termékadatbázisát az ebben a dokumentumban megfogalmazott szabályoknak megfelelően kell formáznia, legyen
RészletesebbenA HUNGLISH PÁRHUZAMOS KORPUSZ
A HUNGLISH PÁRHUZAMOS KORPUSZ MINT OKTATÁSI SEGÉDESZKÖZ Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály XVI. MANYE kongresszus Gödöllő, 2006. április
RészletesebbenLexikon és nyelvtechnológia Földesi András /
Lexikon és nyelvtechnológia 2011.11.13. Földesi András / A nyelvi anyag feldolgozásának célja és módszerei Célunk,hogy minden egyes eleme számára leírjuk paradigmatikus alakjainak automatikus szintézisét.
Részletesebben1. feladat: A decimális kódokat az ASCII kódtábla alapján kódold vissza karakterekké és megkapod a megoldást! Kitől van az idézet?
Projekt feladatai: 1. feladat: A decimális kódokat az ASCII kódtábla alapján kódold vissza karakterekké és megkapod a megoldást! Kitől van az idézet? 65 109 105 32 105 103 97 122 160 110 32 115 122 160
RészletesebbenA Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály jelentése a évről. Kiemelkedő kutatási és más jellegű eredmények
A Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály jelentése a 2017. évről Kiemelkedő kutatási és más jellegű eredmények Folytatódott az Új, innovatív turisztikai szolgáltatás alapjainak megteremtése
RészletesebbenIgekötős szerkezetek a magyarban
Igekötős szerkezetek a magyarban Kalivoda Ágnes 2018. június 26., Budapest PPKE BTK Nyelvtudományi Doktori Iskola Nyelvtechnológia Műhely Témavezető: Prószéky Gábor A kutatás célja az igekötős szerkezetek
RészletesebbenA Humor új Fo(r)mája
A Humor új Fo(r)mája Novák Attila MTA PPKE Nyelvtechnológiai Kutatócsoport Pázmány Péter Katolikus Egyetem Információtechnológiai és Bionikai Kar 1083 Budapest, Práter utca 50/a novak.attila@itk.ppke.hu
RészletesebbenFőnévi csoportok azonosítása szabályalapú és hibrid módszerekkel
Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel MTA SZTAKI Nyelvtechnológiai Kutatócsoport recski@sztaki.hu TLP20 2010. november 25. Tartalom Előzmények A feladat A hunchunk rendszer A
Részletesebben(4 félév, 20+30=50 kredit; nappali)
Érvényes: 201/201 tanévtől Mintatanterv kód: BJPSP1201BASPN, BJPSP2201BASPN, BFSSP1201BASPN, BFSSP2201BASPN, BJPSP3201BASPN, BJPSP201BASPN Mintatanterv keleti nyelvek és kultúrák BA szakos hallgatók számára
Részletesebbenformalizmusa Egy morfológiai elemző kimeneti formalizmusának három, egymásnak gyakran
Általános célú morfológiai elemző kimeneti formalizmusa Kornai András, Rebrus Péter, Vajda Péter Halácsy Péter, Rung András, Trón Viktor Kivonat Az alábbi írásban egy a szóalakok morfoszintaktikai ábrázolására
Részletesebben3. melléklet: Innovációs és eredményességi mutatók Összesített innovációs index, 2017 (teljesítmény a 2010-es EU-átlag arányában)
3. melléklet: Innovációs és eredményességi mutatók 3.1. Összesített innovációs index, 2017 (teljesítmény a 2010-es EU-átlag arányában) 3.1.1. Az EU innovációs eredménytáblája (European Innovation Scoreboard)
RészletesebbenOptikai karakterfelismerés
Optikai karakterfelismerés Az optikai karakterfelismerés feladata A különböző formátumú dokumentumok kezelésének egyik speciális esete, amikor a kezelendő dokumentumok még nem állnak rendelkezésre elektronikus
RészletesebbenSZÁMÍTÓGÉPES NYELVI ADATBÁZISOK
SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK A MAGYARÓRÁN Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály XVI. MANYE kongresszus Gödöllő, 2006. április 10-12.
RészletesebbenIntelligens elektronikus szótár és lexikai adatbázis
Intelligens elektronikus szótár és lexikai adatbázis IHM-ITEM 48/2002 Oravecz Csaba MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály oravecz@nytud.hu Bevezetés a jelenlegi helyzet: nincs az informatikai
RészletesebbenKészítette: Molnár Dávid. Beszédadatbázisok. A BUSZI és a nyelvjárási hangarchívumok
Készítette: Molnár Dávid Beszédadatbázisok A BUSZI és a nyelvjárási hangarchívumok Nyelvváltozatok és nyelvi változatosság Három fő nyelvváltozat-típus: i. területi nyelvváltozatok, ii. társadalmi nyelvváltozatok,
RészletesebbenÚjdonságok az OpenOffice.org Lingucomponent moduljában
Újdonságok az OpenOffice.org Lingucomponent moduljában Németh László Lingucomponent projektvezető 2009-11-06 Összefoglaló Mondatellenőrzés: API és bővítmények Tezaurusz komponens: tövezés és ragozás Elválasztás:
RészletesebbenME BTK MAGYAR SZAKOS OSZTATLAN TANÁRKÉPZÉS
ME BTK MAGYAR SZAKOS OSZTATLAN TANÁRKÉPZÉS A Miskolci Egyetem Bölcsészettudományi Kara (ME BTK) magyar szakos képzéseinek megtervezésekor alapvetően két tényezőt vettünk figyelembe: a hagyományos magyar
RészletesebbenBevezetés az e-magyar programcsomag használatába
Bevezetés az e-magyar programcsomag használatába Vadász Noémi 2019. február 7. MTA Nyelvtudományi Intézet vadasz.noemi@nytud.mta.hu Az előadás felépítése 1. szövegelemzés számítógéppel elemzési lépések
RészletesebbenTananyagok. = Feladatsorok. Hogyan készült? Adaptált tartalom Interdiszciplinaritás
Tananyagok = Feladatsorok Hogyan készült? Adaptált tartalom Interdiszciplinaritás Hogyan készült? a. kérdőívek b. előkészítés, NAT c. tananyagvázlatok d. konzultációk e. tesztelés f. véglegesítés külön-külön
RészletesebbenNyelv-ész-gép Új technológiák az információs társadalomban
Nyelv-ész-gép Új technológiák az információs társadalomban CESAR Csatlakozás az európai nyelvtechnológiai infrastruktúra élvonalához Lendvai Piroska piroska@nytud.hu CEntral and *Közép- és South-East EuropeAn
RészletesebbenAdatbázis Rendszerek II. 5. PLSQL Csomagok 16/1B IT MAN
Adatbázis Rendszerek II. 5. PLSQL Csomagok 16/1B IT MAN B IT v: 2016.03.03 MAN Csomagok A DBMS csomagok a PL/SQL alkalmazások fejlesztését segítik, bennük tároljuk a létrehozott programok kódjait. A specifikációs
RészletesebbenTanulmányok a középmagyar kor mondattana köréből
Tanulmányok a középmagyar kor mondattana köréből 1 2 3 Segédkönyvek a nyelvészet tanulmányozásához 89. Tanulmányok a középmagyar kor mondattana köréből Szerkesztette Haader Lea Horváth László Tinta könyvkiadó
RészletesebbenME BTK MAGYAR SZAKOS OSZTATLAN TANÁRKÉPZÉS
ME BTK MAGYAR SZAKOS OSZTATLAN TANÁRKÉPZÉS A Miskolci Egyetem Bölcsészettudományi Kara (ME BTK) magyar szakos képzéseinek megtervezésekor alapvetően két tényezőt vettünk figyelembe: a hagyományos magyar
RészletesebbenOsztatlan némettanár képzés tanterve (5+1) és (4+1) A képzési és kimeneti követelményeknek való megfelelés bemutatása
Osztatlan némettanár képzés tanterve (5+) és (4+) A képzési és kimeneti követelményeknek való megfelelés bemutatása KÖZÉP- ÉS ÁLTALÁNOS ISKOLAI NÉMETTANÁR KÉPZÉS: KÖZÖS SZAKASZ Tantárgy neve Félév és óraszám
RészletesebbenTanegységlista (BA) Modern filológia képzési ág. Germanisztika alapszak (BA) néderlandisztika szakirány. a 2017-től fölvett hallgatóknak
Tanegységlista (BA) Modern filológia képzési ág Germanisztika alapszak (BA) néderlandisztika szakirány a 2017-től fölvett hallgatóknak 1 Jelek, rövidítések: EF = egyéni felkészülés G = gyakorlati jegy
RészletesebbenA HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága
A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága Az elemzésektől a keresőfelületig DELITE Angol Nyelvészeti Tanszék 2014. 03. 12. Csernyi Gábor 1 Célok, előzmények Mit?
RészletesebbenGyakorló 9. feladat megoldási útmutató
Gyakorló 9. feladat megoldási útmutató 1. Minek a leírása a következő? Aktív hálózati hardver eszközök (pl.: routerek) és szoftverek segítségével létrehozott biztonsági rendszer két hálózat (jellemzően
Részletesebben- - 2006. szeptemberétől
- - Germanisztika alapszak - német szakirány mintatanterve - - 2006. szeptemberétől "A" típusú tantárgyak 1 2 3 4 5 6 7 8 9 10 Tantárgy neve Tantárgy kódja Heti Tantárgyfelelős Meghirdetés kontakt Félévi
RészletesebbenMSD-KR harmonizáció a Szeged Treebank 2.5-ben
Szeged, 2010. december 2 3. 349 MSD-KR harmonizáció a Szeged Treebank 2.5-ben Farkas Richárd 1, Szeredi Dániel 2, Varga Dániel 2, Vincze Veronika 3 1 MTA-SZTE, Mesterséges Intelligencia Tanszéki Kutatócsoport
RészletesebbenPetőfi Irodalmi Múzeum. megújuló rendszere technológiaváltás
Petőfi Irodalmi Múzeum A Digitális Irodalmi Akadémia megújuló rendszere technológiaváltás II. Partnerek, feladatok Petőfi Irodalmi Múzeum Megrendelő, szakmai vezetés, kontroll Konzorcium MTA SZTAKI Internet
RészletesebbenElérhető szótárak a magyar nyelv oktatásában és használatában. M. P i n t é r T i b o r
Elérhető szótárak a magyar nyelv oktatásában és használatában M. P i n t é r T i b o r CÉL I. Magyar nyelvi segítség (nyelvtanuláshoz) Papíralapon Elektronikusan On-line Kérdés, hogy ezt az elérhető szótárak
RészletesebbenTartalomjegyzék Bevezető...1 Adatátvétel Windows alkalmazásból...1 Adatátvétel webes alkalmazásból...2 Adatforrás formátuma...2 Megvalósítás...
Számlázó Program adatátvétel Dukumentáció változatszáma: 1.8 Tartalomjegyzék Bevezető...1 Adatátvétel Windows alkalmazásból...1 Adatátvétel webes alkalmazásból...2 Adatforrás formátuma...2 Megvalósítás...5
RészletesebbenMegyei statisztikai profil a Smart Specialisation Strategy (S3) megalapozásához Csongrád megye
Megyei statisztikai profil a Smart Specialisation Strategy (S3) megalapozásához Csongrád megye Az alábbi statisztikai profil a megye általános, a Smart Specialisation Strategy (S3)-hoz kapcsolódó stratégiaalkotás
RészletesebbenLaborgyakorlat 3 A modul ellenőrzése szimulációval. Dr. Oniga István
Laborgyakorlat 3 A modul ellenőrzése szimulációval Dr. Oniga István Szimuláció és verifikáció Szimulációs lehetőségek Start Ellenőrzés után Viselkedési Funkcionális Fordítás után Leképezés után Időzítési
RészletesebbenAngol-Amerikai Intézet 3 tanszékbıl áll
2017. augusztus 28. Angol-Amerikai Intézet 3 tanszékbıl áll Anglisztika Tanszék Amerikanisztika Tanszék Angoltanár-képzı és Alkalmazott Nyelvészeti Tanszék (=ELTEAL) http://elteal.ieas-szeged.hu/ Többféle
RészletesebbenELEKTRONIKUS ŰRLAP A NYILVÁNTARTÁSOK REGISZTERÉBE
Főlap Bejelentés célja A nyilvántartás ja Megnevezése Adatváltozás REG_1011 A nyilvántartást vezető szervezet Megnevezése ja (Törzsszám) Kapcsolattartó KEKKH 15721475 OKMÁNYFELÜGYELETI FŐOSZTÁLY (OKMANYFELUGY.FOOSZTALY@KEKKH.GOV.HU)
RészletesebbenBA Germanisztika alapképzés mintatanterve (180 kredit, 6 félév)
BA Germanisztika alapképzés mintatanterve (180 kredit, 6 félév) Neptun kód Tanegység Heti Féléves Beszámolási óraszám óraszám kötelezettség Kredit Megjegyzés Előfeltétel 1. év 1. félév BTSBN001X01 Filozófia
RészletesebbenAz új magyar Braille-rövidírás kialakítása
Az új magyar Braille-rövidírás kialakítása Sass Bálint sassbalint@nytudmtahu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály 2013 november 11 Braille-írás A vakok által
Részletesebbenb o o k s 2 e b o o k s. e u
eod eod eod eod eod eod EOD az MTA Könyvtárában Kapus Erika tájékoztató könyvtáros Tájékoztatási és Olvasószolgálati Osztály b o o k s 2 e b o o k s. e u ebooks on Demand e-könyvek megrendelésre 10 ország
RészletesebbenKarán című konferencián, 2010. október 28-án elhangzott előadás szerkesztett változata.
Zólyomi Gábor Hogyan tanítsunk meg sumerül egy honlapot, és minek? 1 Az érdeklődő laikus vagy szakember, ha napjainkban ékírásos szövegeket szeretne tanulmányozni, akkor tudományos és kevésbé tudományos
RészletesebbenBIG DATA ÉS GÉPI TANULÁS KÖRNYEZET AZ MTA CLOUD-ON KACSUK PÉTER, NAGY ENIKŐ, PINTYE ISTVÁN, HAJNAL ÁKOS, LOVAS RÓBERT
BIG DATA ÉS GÉPI TANULÁS KÖRNYEZET AZ MTA CLOUD-ON KACSUK PÉTER, NAGY ENIKŐ, PINTYE ISTVÁN, HAJNAL ÁKOS, LOVAS RÓBERT TARTALOM MTA Cloud Big Data és gépi tanulást támogató szoftver eszközök Apache Spark
RészletesebbenGERMANISZTIKA ALAPSZAK (BA) MINTATANTERVE NÉMET szakirány Germanisztika fakultatív modul NAPPALI TAGOZAT Érvényes a 2014/2015.
GERMANISZTIKA ALAPSZAK (BA) MINTATANTERVE NÉMET szakirány NAPPALI TAGOZAT Érvényes a 2014/2015. tanévtől Tárgykód Tantárgy megnevezése Előeltétel Felvétele Kreditpont Követelmény típusa Heti óraszám Ajánlott
RészletesebbenPTE BTK Magyar Nyelv- és Irodalomtudományi Intézet Nyelvtudományi Tanszék
PTE BTK Magyar Nyelv- és Irodalomtudományi Intézet Nyelvtudományi Tanszék Hasonlóságok és különbözőségek a nyelvben és a nyelvi nevelésben 2019. június 17 18. Program Pécs Program Június 17. hétfő 9:30
Részletesebbenmagyar (BA)-BTK XXX-MAGTANB2/ képzési terv
magyar (BA)-BTK XXX-MAGTANB2/14-15-1-1 képzési terv Bölcsészettudományi Kar Kód: XXX-MAGTANB2/14-15-1-1 Szükséges kredit: 180 Félévek száma: 6 Tantermi órák száma:. Gyakorlati képzés: %. Az írásos tanterv
RészletesebbenTanegységlista (BA) Modern filológia képzési ág. Germanisztika alapszak (BA) néderlandisztika szakirány. a 2015-től fölvett hallgatóknak
Tanegységlista (BA) Modern filológia képzési ág Germanisztika alapszak (BA) néderlandisztika szakirány a 2015-től fölvett hallgatóknak Jelek, rövidítések: EF = egyéni felkészülés G = gyakorlati jegy K
RészletesebbenAngol-Amerikai Intézet 3 tanszékbıl áll
2016. augusztus 29. Angol-Amerikai Intézet 3 tanszékbıl áll Anglisztika Tanszék Amerikanisztika Tanszék Angoltanár-képzı és Alkalmazott Nyelvészeti Tanszék (=ELTEAL) http://elteal.ieas-szeged.hu/ Többféle
RészletesebbenTanegységlista (BA) Modern filológia képzési ág
Tanegységlista (BA) Modern filológia képzési ág Szlavisztika alapszak Orosz szakirány a 2015-től fölvett hallgatóknak 1 Jelek, rövidítések: EF = egyéni felkészülés G = gyakorlati jegy K = kollokvium Sz
RészletesebbenEgy általános célú morfológiai annotáció kiterjesztése
Egy általános célú morfológiai annotáció kiterjesztése Recski Gábor MTA SZTAKI, Nyelvtechnológiai Kutatócsoport recski@sztaki.hu Kivonat: Egy szó nyelvtani jegyeinek kódolására számos különböző annotációs
RészletesebbenÜzleti szemlélet és a magyar nyelv támogatása a többnyelvű világban
Üzleti szemlélet és a magyar nyelv támogatása a többnyelvű világban Prószéky Gábor MorphoLogic & PPKE ITK www.morphologic.hu & www.itk.ppke.hu A magyar nyelv helyzete a digitális korban - MTA, 2013. január
RészletesebbenMély neuronhálók alkalmazása és optimalizálása
magyar nyelv beszédfelismerési feladatokhoz 2015. január 10. Konzulens: Dr. Mihajlik Péter A megvalósítandó feladatok Irodalomkutatás Nyílt kutatási eszközök keresése, beszédfelismer rendszerek tervezése
Részletesebben2015. június Osztály:Gyermekfogászat
2015. június Osztály:Gyermekfogászat Orvos Rendelési idő Orvos Rendelési idő Délelőtt Délután június 1. június 2. június 3. június 4. 7.30-13.30 dr.bálint Szilvia június 5. dr.földes Katalin június 8.
RészletesebbenKÖZBESZERZÉSI ADATBÁZIS (KBA) A KBT. NOVEMBER 1-JEI VÁLTOZÁSAI
KÖZBESZERZÉSI ADATBÁZIS (KBA) A KBT. NOVEMBER 1-JEI VÁLTOZÁSAI Dr. Nagy András szakmai főtanácsadó Közbeszerzési Hatóság Informatikai Főosztály 2013. November 26. Bevezetés I. 2013. július 1-től Kbt. 31.
RészletesebbenA Mazsola KORPUSZLEKÉRDEZŐ
A Mazsola KORPUSZLEKÉRDEZŐ Sass Bálint sass.balint@nytud.mta.hu MTA Nyelvtudományi Intézet PPKE ITK Eötvös Collegium Budapest, 2012. április 27. 1 / 34 1 HÁTTÉR 2 HASZNÁLAT 3 MIRE JÓ? 4 PÉLDÁK 2 / 34 1
Részletesebbenw w w. h a n s a g i i s k. h u
Weblapkészítés weblap: hypertext kódolású dokumentumok, melyek szöveget képet linkeket, könyvjelzőket/horgonyokat táblázatokat / szövegdobozokat és más objektumokat tartalmaznak. Kódolásuk HTML (Hypertext
RészletesebbenPurePos: hatékony morfológiai egyértelműsítő modul
PurePos: hatékony morfológiai egyértelműsítő modul Orosz György PPKE ITK Interdiszciplináris Műszaki Tudományok Doktori Iskola oroszgy@itk.ppke.hu Kivonat: A szófaji egyértelműsítés a számítógépes nyelvfeldolgozás
RészletesebbenA 2017 szeptemberétől érvényes kurzuslisták BA major szakosok nyelvészeti tárgyai
2017-től érvényes!!! 1 A 2017 szeptemberétől érvényes kurzuslisták BA major szakosok nyelvészeti tárgyai 1. félév (ősz) 2. félév (tavasz) Bevezetés a nyelvtudományba (előadás, 2 óra/ 2 Magyar nyelvészeti
RészletesebbenDoktori téma A lényegesség mérése Kutatóeszköz Alkalmazás Befejezés. Sass Bálint
MAZSOLA ESZKÖZ A MAGYAR IGÉK BŐVÍTMÉNYSZERKEZETÉNEK VIZSGÁLATÁRA Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE ITK, MMT Doktori Iskola, Nyelvtechnológia Doktori
RészletesebbenTanóra / modul címe: A MAGYAR İSTÖRTÉNET PROBLÉMÁI
Tanóra / modul címe: A MAGYAR İSTÖRTÉNET PROBLÉMÁI A tanóra célja: Az óra a őstörténet és az annak kutatásával kapcsolatos problémákra hívja fel a figyelmet. Az őstörténet fogalmának feltárásával összefüggésben
RészletesebbenHTML é s wéblapféjlészté s
HTML é s wéblapféjlészté s 1. Melyik országból ered a hipertext-es felület kialakítása? USA Japán Svájc 2. Webfejlesztéskor ha a site-on belül hivatkozunk egy file-ra, akkor az elérési útnak... relatívnak
RészletesebbenSzemle Beregszászi Anikó és Csernicskó István: itt mennyit ér a szó? Írások a kárpátaljai magyarok nyelvhasználatáról.
Szemle Beregszászi Anikó és Csernicskó István: itt mennyit ér a szó? Írások a kárpátaljai magyarok nyelvhasználatáról. PoliPrint, Ungvár, 2004. 206 lap 1. Új kötettel ajándékozta meg 2004 utolsó napjaiban
RészletesebbenSzavazókör nyitvatartása
1. Airault Frédérick Sebastien anyanyelvi lektor Francia Tanszék 2. Balló Ilona Larisza nyelvtanár Szlavisztikai Intézet 3. Dr. Bartáné Kustár Katalin ügyvivő-szakértő Dékáni Hivatal 4. Bertalan Ibolya
RészletesebbenTanegységlista (BA) Modern filológia képzési ág. Germanisztika alapszak (BA) német szakirány 2019-től fölvett hallgatóknak
Tanegységlista (BA) Modern filológia képzési ág Germanisztika alapszak (BA) német szakirány 2019-től fölvett hallgatóknak 1 Jelek, rövidítések: EF = egyéni felkészülés G = gyakorlati jegy K = kollokvium
RészletesebbenTanegységlista (BA) 2015-től fölvett hallgatóknak
Tanegységlista (BA) Szabad bölcsészet alapszak művészettörténet specializáció* 2015-től fölvett hallgatóknak *A 38/2014. (IV.30.) EMMI rendelet a szabad bölcsészet alapképzési szak képzési- és kimeneti
RészletesebbenProgramozás. (GKxB_INTM021) Dr. Hatwágner F. Miklós május 6. Széchenyi István Egyetem, Gy r
Programozás (GKxB_INTM021) Széchenyi István Egyetem, Gy r 2018. május 6. Parancssori paraméterek Parancssorban történ programindításkor a program nevét követ en szóközökkel elválasztva paraméterek (command
Részletesebben1999-ben beadott pályázatok adatai
1999-ben beadott pályázatok adatai sorszám kezdő iktatószám ELTE munkaszám Támogató Pályázat címe Témavezető Tanszék Nyert összeg 1 462/1999 1620 Tantárgypedagógiák az óvodapedagógus- és tanítóképzés folyamatában:
RészletesebbenObi-ugor nyelvek digitális adatbázisa
MAGYAR NYELVJÁRÁSOK 52 (2014): 19 30. A DEBRECENI EGYETEM MAGYAR NYELVTUDOMÁNYI TANSZÉKÉNEK LEKTORÁLT FOLYÓIRATA Obi-ugor nyelvek digitális adatbázisa BAKRÓ-NAGY MARIANNE Írásom célja, hogy bemutassam
RészletesebbenKOPI. Többnyelvű dokumentum nyelvének megállapítása MTA SZTAKI DSD. Vajna Miklós Pataki Máté MSZNY Department of Distributed Systems
KOPI MTA SZTAKI Department of Distributed Systems Többnyelvű dokumentum nyelvének megállapítása MSZNY 2011 Vajna Miklós Pataki Máté Probléma Természetes nyelvű dokumentum nyelvének a megállapítása Megoldott
RészletesebbenInterdiszciplináris Doktori Iskola. A Kárpát-medence és a szomszédos birodalmak között Doktori Program. Képzési program
Interdiszciplináris Doktori Iskola A Kárpát-medence és a szomszédos birodalmak 900 1800 között Doktori Program Képzési program A KÉPZÉS ÁLTALÁNOS JELLEMZŐI A 2016 szeptemberében tanulmányaikat megkezdő
RészletesebbenNyelvi tudásra épülő fordítómemória
Nyelvi tudásra épülő fordítómemória Hodász Gábor 1, Grőbler Tamás 2 1 Pázmány Péter Katolikus Egyetem Információs Technológiai Kar Budapest hodasz@morphologic.hu 2 MorphoLogic Kft. Budapest grobler@morphologic.hu
RészletesebbenJava programozási nyelv 6. rész Java a gyakorlatban
Java programozási nyelv 6. rész Java a gyakorlatban Nyugat-Magyarországi Egyetem Faipari Mérnöki Kar Informatikai Intézet Soós Sándor 2004. október A Java programozási nyelv Soós Sándor 1/16 Tartalomjegyzék
RészletesebbenHagyjuk vagy fejlesszük? A magyar műszaki nyelv jelenéről és jövőjéről. Dr. Balázs Géza tszv. egyetemi tanár ELTE Mai Magyar Nyelvi Tanszék
Hagyjuk vagy fejlesszük? A magyar műszaki nyelv jelenéről és jövőjéről Dr. Balázs Géza tszv. egyetemi tanár ELTE Mai Magyar Nyelvi Tanszék Sztenderd - szaknyelv A fejlett nyelvek rétegződnek sztenderd
RészletesebbenMAGYAR SZAKOS OSZTATLAN TANÁRKÉPZÉS, LEVELEZŐ
MAGYAR SZAKOS OSZTATLAN TANÁRKÉPZÉS, LEVELEZŐ I. ÉVF. ÓRARENDJE 7 8. 13.15 14.45 Az órák helye: általában a B/2. ép. III. em., 304-es terem. Szept. 14.p. 14től Bevezetés a nyelvtudományba ea. (Dr. Pethő
RészletesebbenKülgazdasági és Külügyminisztérium. 1. sz. Melléklet
1. sz. Melléklet A meghirdetett vendégoktatói ösztöndíjak a 2018/2019-es tanévtől és a fogadóintézmények által meghatározott feltételek 1. Strasbourg (Franciaország), Strasbourgi Egyetem francia szakos
Részletesebben