A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás
|
|
- Ede Balázs
- 8 évvel ezelőtt
- Látták:
Átírás
1 A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály
2 Tartalom Előzmény Motiváció Cél Fejlesztés Eredmény 2/15
3 Előzmény Magyar Nemzeti Szövegtár (MNSz) 1998 és 2001 között készült 90-es évek második felének nyelvhasználatából merített reprezentatív minta az első, az akkori gyakorlatban is jelentős méretűnek számító, nyelvileg elemzett, hálózati lekérdező felületen bárki számára szabadon hozzáférhető korpusz 187 millió szó, határon túli nyelvváltozatokkal kibővített anyag több mint 7000 felhasználó, több tucat tanulmány az MNSz adatai alapján 3/15
4 Motiváció 15 évvel később... nyelvi erőforrásokkal szemben támasztott igények jelentős mértékben változtak adatközpontú módszerek/alkalmazások elterjedése és sikeressége a számítógépes nyelvfeldolgozás területén minél több a nyelvi adat, annál jobbak az eredmények fejlett(ebb) nyelvi elemző eszközök jobb minőségű és részletesebb nyelvi elemzés és annotáció reprezentativitás megőrzése a nyelvhasználat újabb és újabb mintavételezése, a nyelvi változatok széles skálájából... az MNSz mára elavulttá vált. 4/15
5 Cél Megnövelt... minőség. A korpusz anyagának minden feldolgozási és elemzési lépésében új, korszerű számítógépes nyelvészeti technológia felhasználása. méret. A korpusz anyagának bővítése 1000 millió szóra. lefedettség és reprezentativitás. Újabb mintavétel a mai magyar nyelvhasználatnak a Szövegtárban eddig is szereplő, valamint további változataiból ( social media ). MNSz2: Korszerű nyelvi erőforrás létrehozása, amely színvonalasan szolgálja ki a magyar nyelvi adatokat felhasználó kutatásokat, és az érdeklődő nagyközönséget is. 5/15
6 Cél Megnövelt... minőség. A korpusz anyagának minden feldolgozási és elemzési lépésében új, korszerű számítógépes nyelvészeti technológia felhasználása. méret. A korpusz anyagának bővítése 1000 millió szóra. lefedettség és reprezentativitás. Újabb mintavétel a mai magyar nyelvhasználatnak a Szövegtárban eddig is szereplő, valamint további változataiból ( social media ). MNSz2: Korszerű nyelvi erőforrás létrehozása, amely színvonalasan szolgálja ki a magyar nyelvi adatokat felhasználó kutatásokat, és az érdeklődő nagyközönséget is. 5/15
7 Fejlesztés Anyaggyűjtés szerzői jogi kérdések tisztázása elegendő metaadat (interneten elérhető szövegek automatikus letöltése nem feltétlen megfelelő) automatikus feldolgozhatóság pdf, OCR nem használható Előfeldolgozás, szövegnormalizálás szöveges tartalom és alapvető dokumentumszerkezet azonosítása (közel) duplikátumok és idegen nyelvű szövegrészek kiszűrése 6/15
8 Fejlesztés Elemzés és annotáció részletes morfoszintaktikai elemzés újratervezett automatikus egyértelműsítő architektúrával (morfémákra, összetételekre, szótagszerkezetre vonatkozó információk) szabványos XML formátum, IOB belső reprezentáció 7/15
9 IOB formátum 8/15
10 Fejlesztés Elemzés és annotáció részletes morfoszintaktikai elemzés újratervezett automatikus egyértelműsítő architektúrával (morfémákra, összetételekre, szótagszerkezetre vonatkozó információk) szabványos XML formátum, IOB belső reprezentáció Korpuszkezelő robusztus, több milliárd szavas adatbázist kezelni képes gyors válaszidő 9/15
11 Eredmény MNSz: 187 m. MNSz2 (+MNSz): 1091 m. 10/15
12 Eredmény MNSz: 187 m. MNSz2 (+MNSz): 1091 m. 10/15
13 Eredmény Intelligens korpusz összetett menüvezérelt keresés a kódolt információ minden részletére morfo(fono)lógiai jelenségek többszavas kifejezések: kollokációk, igei argumentumok megjelenítési beállítások: szövegkörnyezet, metaadatok megoszlásvizsgálatok, beépített utófeldolgozás (több szintű gyakorisági listák, megelőző eredmények további szűrése és feldolgozása) 11/15
14 "piros..." 12/15
15 "piros lámpa" 13/15
16 Felhasználói felület 14/15
17 15/15 Köszönöm a figyelmet!
A MAGYAR NEMZETI SZÖVEGTÁR EGYMILLIÁRD SZAVAS ÚJ VÁLTOZATA
Magyar Tudomány 2014/9 A MAGYAR NEMZETI SZÖVEGTÁR EGYMILLIÁRD SZAVAS ÚJ VÁLTOZATA Váradi Tamás Oravecz Csaba tudományos főmunkatárs, osztályvezető, tudományos munkatárs, MTA Nyelvtudományi Intézet Nyelvtechnológiai
A HUNGLISH PÁRHUZAMOS KORPUSZ
A HUNGLISH PÁRHUZAMOS KORPUSZ MINT OKTATÁSI SEGÉDESZKÖZ Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály XVI. MANYE kongresszus Gödöllő, 2006. április
KORPUSZOK, LEKÉRDEZŐK, NEMZETI KORPUSZPORTÁL
KORPUSZOK, LEKÉRDEZŐK, NEMZETI KORPUSZPORTÁL Sass Bálint sass.balint@nytud.mta.hu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály DHU2015 WS Számítógép az irodalomtudományban
A kibővített Magyar történeti szövegtár új keresőfelülete
A kibővített Magyar történeti szövegtár új keresőfelülete Sass Bálint MTA Nyelvtudományi Intézet sass.balint@nytud.mta.hu A nyelvtörténeti kutatások újabb eredményei IX. 2016. április 27., Szeged Nszt
A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága
A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága Az elemzésektől a keresőfelületig DELITE Angol Nyelvészeti Tanszék 2014. 03. 12. Csernyi Gábor 1 Célok, előzmények Mit?
Korpuszlekérdezők evolúciója
Korpuszlekérdezők evolúciója Sass Bálint sass.balint@nytud.mta.hu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály 2015. november 10. korpusz? lekérdező? 2 / 19 korpusz =
SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK
SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK A MAGYARÓRÁN Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály XVI. MANYE kongresszus Gödöllő, 2006. április 10-12.
Nyelvelemzés sajátkezűleg a magyar INTEX rendszer. Váradi Tamás varadi@nytud.hu
Nyelvelemzés sajátkezűleg a magyar INTEX rendszer Váradi Tamás varadi@nytud.hu Vázlat A történet eddig Az INTEX rendszer A magyar modul Az INTEX korlátai premier előtt: NooJ konklúziók, további teendők
A Mazsola KORPUSZLEKÉRDEZŐ
A Mazsola KORPUSZLEKÉRDEZŐ Sass Bálint sass.balint@nytud.mta.hu MTA Nyelvtudományi Intézet PPKE ITK Eötvös Collegium Budapest, 2012. április 27. 1 / 34 1 HÁTTÉR 2 HASZNÁLAT 3 MIRE JÓ? 4 PÉLDÁK 2 / 34 1
Az annotáció elvei. Oravecz Csaba MTA Nyelvtudományi Intézet {oravecz}@nytud.hu. MANYE vitaülés 2006. február 20.
Oravecz Csaba MTA Nyelvtudományi Intézet {oravecz}@nytud.hu MANYE vitaülés 2006. február 20. Bevezetés Nyelvi erőforrások, szöveges adatbázisok növekvő jelentősége. Bevezetés Nyelvi erőforrások, szöveges
Reklám CL & LT Modell Mazsola Alkalmazás Példák Befejezés. Sass Bálint
ESZKÖZ A MAGYAR IGÉK BŐVÍTMÉNYSZERKEZETÉNEK VIZSGÁLATÁRA Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE ITK, MMT Doktori Iskola, Nyelvtechnológia Doktori Program
Motiváció Eszközök és eljárások Eredmények Távlat. Sass Bálint joker@nytud.hu
VONZATKERETEK A MAGYAR NEMZETI SZÖVEGTÁRBAN Sass Bálint joker@nytud.hu Magyar Tudományos Akadémia Nyelvtudományi Intézet Korpusznyelvészeti Osztály MSZNY2005 Szeged, 2005. december 8-9. 1 MOTIVÁCIÓ 2 ESZKÖZÖK
A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása
A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása Előadók: Toldi Klára Vincze Andrea 1 Előzmények 1997-2002 A nemzetközi könyvtári trendek hatására a hazai könyvtárügyben is megjelenik az informatika
Sass Bálint MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola
IGEI VONZATKERETEK AZ MNSZ TAGMONDATAIBAN Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola MSZNY2006 Szeged, 2006.
Doktori téma A lényegesség mérése Kutatóeszköz Alkalmazás Befejezés. Sass Bálint
MAZSOLA ESZKÖZ A MAGYAR IGÉK BŐVÍTMÉNYSZERKEZETÉNEK VIZSGÁLATÁRA Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE ITK, MMT Doktori Iskola, Nyelvtechnológia Doktori
Nyelv-ész-gép Új technológiák az információs társadalomban
Nyelv-ész-gép Új technológiák az információs társadalomban CESAR Csatlakozás az európai nyelvtechnológiai infrastruktúra élvonalához Lendvai Piroska piroska@nytud.hu CEntral and *Közép- és South-East EuropeAn
A Hunglish Korpusz és szótár
A Hunglish Korpusz és szótár Halácsy Péter 1, Kornai András 1, Németh László 1, Sass Bálint 2 Varga Dániel 1, Váradi Tamás 1 BME Média Oktató és Kutató Központ 1111 Budapest, Stoczek u. 2 {hp,nemeth,daniel}@mokk.bme.hu
Önálló labor feladatkiírásaim tavasz
Önálló labor feladatkiírásaim 2016. tavasz (ezekhez kapcsolódó saját témával is megkereshetnek) Mészáros Tamás http://www.mit.bme.hu/~meszaros/ Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika
Intelligens elektronikus szótár és lexikai adatbázis
Intelligens elektronikus szótár és lexikai adatbázis IHM-ITEM 48/2002 Oravecz Csaba MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály oravecz@nytud.hu Bevezetés a jelenlegi helyzet: nincs az informatikai
Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése
Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése 1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Természetes nyelv feldolgozás 2 Tudásalapú információ-kereső rendszerek
Boros Andrea és Ignéczi Lilla Neumann-ház, Budapest. Networkshop 2004 konferencia Győr, április 4 7.
Boros Andrea és Ignéczi Lilla Neumann-ház, Budapest Networkshop 2004 konferencia Győr, április 4 7. www.webkat.hu A WebKat.hu 2004 februárjában: 213 459 rekord 44 087 saját anyag Cél: a magyar kulturális
Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.
Tudásmodellezés Kereskedelmi Alkalmazásokban Dezsényi Csaba Ovitas Magyarország kft. Tudásmenedzsment Adat -> Információ -> Tudás Intézményi tudásvagyon hatékony kezelése az üzleti célok megvalósításának
Az igekötők gépi annotálásának problémái Kalivoda Ágnes
Az igekötők gépi annotálásának problémái Kalivoda Ágnes Budapest, 2017. február 3. PPKE BTK Bevezetés Mi a probléma? Homográf szóalakok hibás szófaji címkét kaphatnak Mi a megoldás? Szabály alapú javítás
Új fejlesztések, együttműködések a Magyar Elektronikus Könyvtárban, 2011-ben
Networkshop, 2012. Veszprém, NIIF Új fejlesztések, együttműködések a Magyar Elektronikus Könyvtárban, 2011-ben Networkshop, 2012. április 11. Tartalom 1. Mobil fejlesztések E-book formátumok MEK (Magyar
SZÖVEGES LEJEGYZÉSBŐL NYELVI ADATBÁZIS
SZÖVEGES LEJEGYZÉSBŐL NYELVI ADATBÁZIS Oravecz Csaba és Sass Bálint {oravecz,joker}@nytud.hu MTA Nyelvtudományi Intézet BUSZI I. szimpózium 2008. december 9. 1 BEVEZETŐ (Beszélt) nyelvi adatbázis 2 KITEKINTÉS
Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel
Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel MTA SZTAKI Nyelvtechnológiai Kutatócsoport recski@sztaki.hu TLP20 2010. november 25. Tartalom Előzmények A feladat A hunchunk rendszer A
Különírás-egybeírás automatikusan
Különírás-egybeírás automatikusan Ludányi Zsófia ludanyi.zsofia@nytud.mta.hu Magyar Tudományos Akadémia, Nyelvtudományi Intézet Nyelvtechnológiai Osztály VII. Alkalmazott Nyelvészeti Doktoranduszkonferencia
E-Kataszteri rendszer ismertető
E-Kataszteri rendszer ismertető Az E-Szoftverfejlesztő Kft. által fejlesztett KATAwin kataszteri és eszköznyilvántartó rendszert 2,600 db önkormányzat alkalmazza évek óta. Teljeskörű Certop minősítéssel
Szövegbányászati rendszer fejlesztése a Magyar Elektronikus Könyvtár számára
Szövegbányászati rendszer fejlesztése a Magyar Elektronikus Könyvtár számára Vázsonyi Miklós VÁZSONYI Informatikai és Tanácsadó Kft. BME Információ- és Tudásmenedzsment Tanszék 1/23 Tartalom A MEK jelenlegi
Petőfi Irodalmi Múzeum. megújuló rendszere technológiaváltás
Petőfi Irodalmi Múzeum A Digitális Irodalmi Akadémia megújuló rendszere technológiaváltás II. Partnerek, feladatok Petőfi Irodalmi Múzeum Megrendelő, szakmai vezetés, kontroll Konzorcium MTA SZTAKI Internet
OpenOffice.org mint fejlesztési platform
Nyílt szoftverek a közigazgatásban OpenOffice.org mint fejlesztési platform dr. Banai Miklós, ügyvezető Koleszár Kázmér, projektvezető ODF OpenDocument Format Szabványos, könnyen kezelhető fájlformátum
Mi ez pontosan? Miért készült? Miért nehéz?
Mi ez pontosan? A helyesírási tanácsadó portál egy olyan interneten keresztül elérhető szoftvereszköz, amely segít a mindenkori helyesírási szabályzat szerinti helyesen írott alak megtalálásában. A megoldás
Lexikon és nyelvtechnológia Földesi András /
Lexikon és nyelvtechnológia 2011.11.13. Földesi András / A nyelvi anyag feldolgozásának célja és módszerei Célunk,hogy minden egyes eleme számára leírjuk paradigmatikus alakjainak automatikus szintézisét.
Enterprise extended Output Management. exom - Greendoc Systems Kft. 1
Enterprise extended Output Management exom - Greendoc Systems Kft. 1 exom - Greendoc Systems Kft. 2 Sokféle bementi adatformátum kezelése Adatok fogadása különböző csatornákon Előfeldolgozás: típus meghatározás,
A Java EE 5 plattform
A Java EE 5 platform Ficsor Lajos Általános Informatikai Tanszék Miskolci Egyetem Utolsó módosítás: 2007. 11. 13. A Java EE 5 platform A Java EE 5 plattform A J2EE 1.4 után következő verzió. Alapvető továbbfejlesztési
Cikkarchívum fejlesztése
Cikkarchívum fejlesztése Burmeister Erzsébet Cséfai János Miskolci Egyetem Monguz Kft. Könyvtár, Levéltár, Múzeum. április 27-29. Előzmények eszközök beszerzése TIOP 1.2.3 Tudásdepó Express pályázat szerverek
Megújult az ARTISJUS Szerzői Információs Rendszere (SZIR) Online adatszolgáltatás szerzőknek bármikor, bárhonnan
Megújult az ARTISJUS Szerzői Információs Rendszere (SZIR) Online adatszolgáltatás szerzőknek bármikor, bárhonnan Grafikus megjelenítés A grafikus felület lehetővé teszi a jogdíjak és elhangzások áttekinthetőbb
A DALNET24 projekt aktualitásai
GISopen 2015. Székesfehérvár 2015. március 27. Doroszlai Tamás FÖMI-FFÜO ov Földmérési és Távérzékelési Intézet Digitális földhivatal Földhivatali elektronikus dokumentum kezelés Az elektronikus dokumentum
Dspace fejlesztési tapasztalatok, problémák és megoldások
Dspace fejlesztési tapasztalatok, problémák és megoldások Takács Ákos, fejlesztő takacs.akos@lib.pte.hu Könyvtári igények Az egyetemen keletkezett dokumentumok tárolása Disszertációk Publikációk Szakdolgozatok
Mesterséges Intelligencia Elektronikus Almanach
Mesterséges Intelligencia Elektronikus Almanach Dobrowiecki Tadeusz, Mészáros Tamás Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék MI Almanach a projekt
Videóportálok a felsőoktatásban
Kovács András NIIF Intézet NetworkShop 2009, Szeged 2009. április 15. Mire jó egy Nemzeti videóportál? Információs Infrastruktúra Fejlesztési Intézet Multimédia repozitórium-ok: Felsőoktatás-kutatás:
A számítógépes nyelvészet elmélete és gyakorlata. Korpuszok
A számítógépes nyelvészet elmélete és gyakorlata Korpuszok Mi a korpusz? A korpusz ténylegesen előforduló írott, vagy lejegyzett beszélt nyelvi adatok gyűjteménye. A szövegeket valamilyen szempont szerint
E-learning alapú ügyféltámogató rendszer könyvtárak és felsőoktatási intézmények részére
E-learning alapú ügyféltámogató rendszer könyvtárak és felsőoktatási intézmények részére Networkshop 2014 PTE Szentágothai János Kutatóközpont Pécs, 2014. április 23-25. dr. Sinka Róbert, PhD e-learning
Képi információk hatékony feldolgozása széles társadalmi rétegeket érintő egészségügyi problémákban
Képi információk hatékony feldolgozása széles társadalmi rétegeket érintő egészségügyi problémákban Hajdu András Debreceni Egyetem, Informatikai Kar 2. Magyar Jövő Internet Konferencia Budapest, 2015.
Magyar nyelvű történeti korpuszok
Magyar nyelvű történeti korpuszok Simon Eszter Debrecen, 2019. február 7. MTA Nyelvtudományi Intézet Az előadás vázlata 1. A történeti korpuszok jellemzői 2. A történeti szövegek feldolgozása 3. A korpuszok
PIAC_ Nemzetközi Határozatkereső rendszer fejlesztése. Szakmai fórum február 29.
PIAC_13-1-2013-0117 Nemzetközi Határozatkereső rendszer fejlesztése Szakmai fórum 2016. február 29. A LEXPERT Nemzetközi Határozatkereső projekt célja Egy olyan új alkalmazás létrehozása, amely - naprakészen
Multimédiás adatbázisok
Multimédiás adatbázisok Multimédiás adatbázis kezelő Olyan adatbázis kezelő, mely támogatja multimédiás adatok (dokumentum, kép, hang, videó) tárolását, módosítását és visszakeresését Minimális elvárás
Egy szónak is száz a vége
Egy szónak is száz a vége Oravecz Csaba MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály oravecz@nytud.hu Magyar tudomány napja, MTA, 2003. 11. 04. Bevezetés mit lát a számítógép a természetes nyelvi
Útmutató a Domus elektronikus pályázati rendszerben történő pályázáshoz. https://aat.mta.hu/aat
Útmutató a Domus elektronikus pályázati rendszerben történő pályázáshoz https://aat.mta.hu/aat 1 Belépés a pályázati rendszerbe Kattintson a Pályázatok menüponton belül a Domus gombra. Kérdéseikkel, észrevételeikkel
EGY MÓDSZERTANI KÍSÉRLET A RAKTÁRI JEGYZÉKEK SZÁMÍTÓGÉPES MEGJELENÍTÉSE
EGY MÓDSZERTANI KÍSÉRLET A RAKTÁRI JEGYZÉKEK SZÁMÍTÓGÉPES MEGJELENÍTÉSE Boross István MNL Veszprém Megyei Levéltára Juhász Zoltán Pannon Egyetem MNL Veszprém Megyei Levéltára, 2014. május 20. A MÓDSZERTANI
Beszéd- és nyelvelemző szoftverek a versenyképességért és az esélyegyenlőségért
Szegedi Tudományegyetem Juhász Gyula Pedagógusképző Kar Magyar és Alkalmazott Nyelvészeti Tanszék Beszéd- és nyelvelemző szoftverek a versenyképességért és az esélyegyenlőségért HunCLARIN korpuszok és
E-Kataszteri rendszer ismertető
E-Kataszteri rendszer ismertető Az E-Szoftverfejlesztő Kft. által fejlesztett KATAwin kataszteri és eszköznyilvántartó rendszert 2,700 db önkormányzat alkalmazza évek óta. Teljeskörű Certop minősítéssel
Elosztott könyvtári rendszerek megvalósítása a Z39.50 és az OAI protokoll használatával
Elosztott könyvtári rendszerek megvalósítása a Z39.50 és az OAI protokoll használatával Tóth Kornél MTA SZTAKI NWS 2004, Győr rendszerek 1 Könyvtári hálózatok kialakulása Nagygépes rendszerek PC-s helyi
A RAKTÁRI JEGYZÉKEK SZÁMÍTÓGÉPES FELDOLGOZÁSA: ADATMODELLEZÉS ÉS SZABVÁNYOK
A RAKTÁRI JEGYZÉKEK SZÁMÍTÓGÉPES FELDOLGOZÁSA: ADATMODELLEZÉS ÉS SZABVÁNYOK Boross István MNL Veszprém Megyei Levéltára Juhász Zoltán Pannon Egyetem Budapest Főváros Levéltára, 2014. május 6. MÓDSZERTANI
Beszámoló a 13. ECDL (European Conference on Digital Libraries) konferenciáról
Beszámoló a 13. ECDL (European Conference on Digital Libraries) konferenciáról Időpont: 2009. szeptember 28-30. Helyszín: Korfu Készítette: Naszádos Edit (Informatikai Osztály) Résztvevők Több mint 200
Korpuszkeresés, NoSkE, Mtsz, MNSZ2, NKP
Korpuszkeresés, NoSkE, Mtsz, MNSZ2, NKP 2016. június 1. szeminárium, MTA NYTI Sass Bálint sass.balint@nytud.mta.hu Cím NoSkE = korpuszkezelő rendszer ( lényeg!) NoSketchEngine (régi nevén: Manatee/Bonito)
A magyar létige problémái a számítógépes nyelvi elemzésben
A magyar létige problémái a számítógépes nyelvi elemzésben Dömötör Andrea PPKE BTK Nyelvtudományi Doktori Iskola Nyelvtechnológia Műhely Témavezető: Prószéky Gábor Komplex vizsga 2018. jún. 1. Létige:
Blaho Sylvia, Sass Bálint & Simon Eszter. MTA Nyelvtudományi Intézet február 4.
A készülő MGTSz adatbázis felépítése Blaho Sylvia, Sass Bálint & Simon Eszter MTA Nyelvtudományi Intézet 2010. február 4. Az előadás vázlata 1 A projekt bemutatása A szöveg feldolgozásának szintjei A korpusz
Forrás és idéző közlemények felvitele importtal
MTMT2 lépésről lépésre Forrás és idéző közlemények felvitele importtal MTA KIK MTMT O. 2018.10.15. Közlemények importálási lehetősége Az MTMT1-ben bevált módon továbbra is lehetőség van a nagy nemzetközi
Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György
Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György Témavezető: Prószéky Gábor Bevezetés Előfeldolgozó algoritmusok Napjaink
AZ INTEGRÁLT NYOMONKÖVETŐ RENDSZER BEMUTATÁSA (TÁMOP 3.4.2-B) Kern Zoltán Közoktatási szakértő Kern.zoltan@educatio.hu
AZ INTEGRÁLT NYOMONKÖVETŐ RENDSZER BEMUTATÁSA (TÁMOP 3.4.2-B) Kern Zoltán Közoktatási szakértő Kern.zoltan@educatio.hu Integrált (Elektronikus) Nyomonkövető Rendszer Miért használjuk? Hogyan használjuk?
*Ezen felületet kell kitölteni saját fiók létrehozásáho z
Olvasóink otthonról is kereshetnek az EBSCOhost adatbázisban, olvasójegy számuk megadásával. (pl.: VFMK és hat számjegy) http://search.ebscohost.com/login.aspx?authtype=ip,cookie,cpid&custid=s5028516 Vonalkódunk
Sz. Sz. Sz. R. Kiadási jegyzék. Szilágyi Attila. Verzió: 40. Kézirat lezárva: 2015-07-12
Sz. Sz. Sz. R. Kiadási jegyzék Szilágyi Attila Verzió: 40 Kézirat lezárva: 2015-07-12 Tartalomjegyzék Tartalomjegyzék...3 8.0.1.5 (2015.07.12.)...5 8.0.0.7 (2015.06.29.)...7 8.0.0.0 (2015.06.29.)...9
A HunTéka elektronikus könyvtár modulja
A HunTéka elektronikus könyvtár modulja A HunTéka integrált könyvtári rendszer 2002-ben debütált az MTA SZTAKI és az ikron Kft. több éves közös fejlesztésének eredményeként. Jelenleg több mint 44 intézményben
Igei szerkezetek gyakorisági szótára
Igei szerkezetek gyakorisági szótára Egy automatikus lexikai kinyerő eljárás és alkalmazása doktori (Ph.D.) disszertáció tézisei Sass Bálint témavezető: Prószéky Gábor, az MTA doktora Pázmány Péter Katolikus
Igekötős szerkezetek a magyarban
Igekötős szerkezetek a magyarban Kalivoda Ágnes 2018. június 26., Budapest PPKE BTK Nyelvtudományi Doktori Iskola Nyelvtechnológia Műhely Témavezető: Prószéky Gábor A kutatás célja az igekötős szerkezetek
Fülöp Csaba, Kovács László, Micsik András
Rendszerek Osztály Metaadatsémák nyilvántartása szemantikus web alapon Fülöp Csaba, Kovács László, Micsik András MTA SZTAKI Bemutatás A CORES az európai közösség projektje a Szemantikus Web témakörben
Egy szónak is száz a vége
Egy szónak is száz a vége Oravecz Csaba MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály oravecz@nytud.hu Bevezetés mit lát a számítógép a természetes nyelvi megnyilatkozásokból? karaktersorozatokat
Videoportál metaadat szerkezete
Videoportál metaadat szerkezete Bánki Zsolt István Petőfi Irodalmi Múzeum Videoportál workshop 2009. október 27. Metaadat fogalma Adatok az adatokról A metaadattal összekötött tartalmat
NightHawk AccessControl
NightHawk AccessControl Poker Edition Version: 2.0 2012. január 1 Tartalomjegyzék Rendszer elemei... 3 Felhasználói felület... 3 Nap nyitása, zárása... 4 Új játékos felvitele... 4 Ki és beléptetés... 5
AZ ÜGYFÉL KOMMUNIKÁCIÓ ÚJ FORMÁI POZITÍV ÜGYFÉLÉLMÉNY SZÖVEGBÁNYÁSZATI MEGOLDÁSOK
AZ ÜGYFÉL KOMMUNIKÁCIÓ ÚJ FORMÁI POZITÍV ÜGYFÉLÉLMÉNY SZÖVEGBÁNYÁSZATI MEGOLDÁSOK HOFGESANG PÉTER ÜZLETI INTELLIGENCIA A JÖVŐ, AHOGY MI LÁTJUK Hagyományos és új kommunikációs formák Szöveges adatok Szöveganalitika
Elektronikus szolgáltatás igénylés megvalósítása a NIIFI-ben. 2011/11/10 https://webform.niif.hu HBONE Workshop. Kiss Zoltán
megvalósítása a NIIFI-ben 2011/11/10 https://webform.niif.hu HBONE Workshop Kiss Zoltán Ezelőtt 2. oldal 3. oldal 4. oldal Célok Dedikált oldal a szolgáltatás igényléseknek - saját súgóval Munkamenet gyorsítás
TERC V.I.P. hardverkulcs regisztráció
TERC V.I.P. hardverkulcs regisztráció 2014. második félévétől kezdődően a TERC V.I.P. költségvetés-készítő program hardverkulcsát regisztrálniuk kell a felhasználóknak azon a számítógépen, melyeken futtatni
Angol szótár V2.0.0.0
Angol szótár V2.0.0.0 Bemutató Verzió Felhasználói Kézikönyv Készítette: Szűcs Zoltán. 2536 Nyergesújfalu, Pala u. 7. Tel \ Fax: 33-355 - 712. Mobil: 30-529-12-87. E-mail: info@szis.hu. Internet: www.szis.hu.
1. Az Android platform bemutatása (Ekler Péter)... 1 1.1. Az Android sikerességének okai... 1 1.2. Az Android platform története... 3 1.3. Android-verziók... 5 1.4. Android Market (Google Play)... 13 1.5.
Az audiovizuális művekhez való online hozzáférés megkönnyítése az Európai Unióban: magyar javaslatok. Dr. Rozgonyi Krisztina
Az audiovizuális művekhez való online hozzáférés megkönnyítése az Európai Unióban: magyar javaslatok Dr. Rozgonyi Krisztina Előzmények 1. Európai Bizottság COM(2012)789 számú, az egységes digitális piacon
Milyen újdonságokra számíthatunk? Az EESZT standardizációstörekvései. dr. Horváth Lajos október 11.
Milyen újdonságokra számíthatunk? Az EESZT standardizációstörekvései dr. Horváth Lajos 2018. október 11. 1 Jelenlegi helyzet Tartalom Az egészségügyi dokumentumok szakmai tartalmi heterogenitása Forma
Hiteles elektronikus postafiók Perkapu
Hiteles elektronikus postafiók Perkapu 2018.10.27. Tartalom Bevezetés...2 Bejelentkezés a Hiteles Elektronikus Postafiókba...2 Perkapu tárhely kiválasztása...2 Beérkezett üzenetek...3 Dokumentumletöltés...4
Kérdésfelvetés Alapmódszer Finomítás További lehetőségek. Sass Bálint
ÉLŐ VAGY ÉLETTELEN? Sass Bálint joker@nytud.hu MTA Nyelvtudományi Intézet, Nyelvtechnológiai Osztály PPKE, Információs Technológiai Kar, MMT Doktori Iskola MSZNY2007 Szeged, 2007. december 6 7. 1 KÉRDÉSFELVETÉS
ÖFFK II. projekt keretében megvalósítandó koordinációs kutatás workshop sorozata. Makó
ÖFFK II. projekt keretében megvalósítandó koordinációs kutatás workshop sorozata Makó 2016.11.22. Tartalom 1. Kutatás keretei 2. Módszertan a mai munkához 3. Megyei workshop eredményeinek összefoglalója
Felhasználói segédlet a PubMed adatbázis használatához. Publikációk keresése, letöltése valamint importja
Felhasználói segédlet a PubMed adatbázis használatához. Publikációk keresése, letöltése valamint importja A PubMed Medline adatbázis internet címe: http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=pubmed
Zimbra levelező rendszer
Zimbra levelező rendszer Budapest, 2011. január 11. Tartalomjegyzék Tartalomjegyzék... 2 Dokumentum információ... 3 Változások... 3 Bevezetés... 4 Funkciók... 5 Email... 5 Társalgás, nézetek, és keresés...
Belföldi Termékosztályozás V2.0.0.0
Belföldi Termékosztályozás V2.0.0.0 Bemutató Verzió Felhasználói Kézikönyv Készítette: Szűcs Zoltán. 2536 Nyergesújfalu, Pala u. 7. Tel \ Fax: 33-355 - 712. Mobil: 30-529-12-87. E-mail: info@szis.hu Internet:
Keresés korpuszban október 19., SZTE JGYPK Sass Bálint MTA Nyelvtudományi Intézet
Keresés korpuszban Beszéd- és nyelvelemző szoftverek a versenyképességért és az esélyegyenlőségért 2018. október 19., SZTE JGYPK Sass Bálint MTA Nyelvtudományi Intézet sass.balint@nytud.mta.hu Témák NoSkE
iseries Client Access Express - Mielőtt elkezdi
iseries Client Access Express - Mielőtt elkezdi iseries Client Access Express - Mielőtt elkezdi ii iseries: Client Access Express - Mielőtt elkezdi Tartalom Rész 1. Client Access Express - Mielőtt elkezdi.................
Rostás Sándor szds. MH GEOSZ Műszaki és információs osztály térképész főtiszt (ov. h.)
DITAB-50 az új topográfiai adatbázis Rostás Sándor szds. MH GEOSZ Műszaki és információs osztály térképész főtiszt (ov. h.) Az előadás tartalma 1. Bevezetés 2. Célja 3. Kialakítása 4. Jelenlegi állapot
KÖNYVTÁRI KATALÓGUS HASZNÁLATI ÚTMUTATÓ
KÖNYVTÁRI KATALÓGUS HASZNÁLATI ÚTMUTATÓ Mi az OPAC? Az OPAC az Online Public Access Catalogue rövidítése. Jelentése olyan számítógépes katalógus, mely nyilvános, bárki számára közvetlenül, általában ingyen
VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY 2011. Szerkesztette: Tanács Attila. Vincze Veronika
VIII. Magyar Számítógépes Nyelvészeti Konferencia MSZNY 2011 Szerkesztette: Tanács Attila Vincze Veronika Szeged, 2011. december 1-2. http://www.inf.u-szeged.hu/mszny2011 Tartalomjegyzék I. Többnyelvuség
BIRDIE. Business Information Reporter and Datalyser. Előadó: Schneidler József
BIRDIE Business Information Reporter and Datalyser Előadó: Schneidler József BIRDIE RIPORT RIPORT KÉSZÍTŐ ÉS ÉS TERJESZTŐ RENDSZER A Daten-Kontor Kft. saját fejlesztésű dobozos alkalmazása A BIRDIE célja:
Számítástechnikai kommunikációs lehetőségek a QB-Pharma rendszerrel. Előadó: Bagi Zoltán Quadro Byte Kft. ügyvezető
Számítástechnikai kommunikációs lehetőségek a QB-Pharma rendszerrel. Előadó: Bagi Zoltán Quadro Byte Kft. ügyvezető Az Uniós országokban már alkalmazott új lehetőségek Korszerű zárt hálózatok, rendszerek,
DATR bevezetése Békés megyében
DATR bevezetése Békés megyében Zátonyi Richárd / Békés Megyei Földhivatal adatvédelmi biztos/ Térkép az adatbázisban Mit jelent az adatbázis alapon történő térképkezelés? Egyszerre több száz felhasználó
Taninform KIR kapcsolat
Taninform KIR kapcsolat Cél A Taninform KIR adatkapcsolat célja, hogy a mindkét rendszerben megtalálható és tárolt, iskolai adminisztrációval kapcsolatos alapadatokat az intézmények könnyen szinkronban
AUT INVENIAM VIAM, AUT FACIAM
AUT INVENIAM VIAM, AUT FACIAM A hagyományos és speciális közgyűjteményi dokumentumok digitalizálásának és bemutatásának legújabb eszközei Mészáros Zoltán Magyar Könyvtárosok Egyesülete 49. Vándorgyűlése,
ADATROBBANÁS. A helyzet alulról január 21. Pajna Sándor. vezérigazgató
2016. 01. 26. 1 ADATROBBANÁS A helyzet alulról 2016. január 21. Pajna Sándor vezérigazgató 2016. 01. 26. 2 Áruk információ tartalmának változása 60 50 Információ(%) Nyersanyag(%) Energia(%) 40 30 20 10
Használati útmutató Az online példatárhoz
Használati útmutató Az online példatárhoz A Példatár egy többféle szűrési feltétellel és találati megjelenítéssel rendelkező online adatbázis: I. Keresés 1. Találati lista 2. Térképes megjelenítés 3. Alrendszerek
Hamisítás, kalózkodás a szellemi tulajdon vizein Budapest, 2008. november 20. Magyar Szabadalmi Hivatal
Vigyázat hamisítják! emarks projekt intelligens informatikai megoldás a hamisítás kiszűrésére Vadász Ágnes Hamisítás, kalózkodás a szellemi tulajdon vizein Budapest, 2008. november 20. 1 Hamisítási esetek
Folyamatok rugalmas irányítása. FourCorm Kft.
Folyamatok rugalmas irányítása FourCorm Kft. www.frckft.hu 1 Dokumentumok áramlása Gyakran szekvenciális Rengeteg felesleges másolat Információk alacsony rendelkezésre állása Nincs szolgálati út- és határidőfigyelés
Ügyfél- és címadatok feldolgozása Talenddel
Ügyfél- és címadatok feldolgozása Talenddel 2012.október 4. Dr. Miskolczi Mátyás, Kiss György A Stratisról röviden Jellemzők - Alapítva: 1998 - Tisztán magyar tulajdon - 50 tanácsadó - 140 ügyfél - 500+
Reenger alkalmazás Felhasználói kézikönyv
Reenger alkalmazás Felhasználói kézikönyv 1. Üdvözöljük a Nord Telekomnál-nál 1.1 - A Reenger androidos verziójáról 1.1.1 - Újdonságok 1.2 Funkciók 1.3 Reenger kezelőfelület és Felhasználói funkciók 2.