Nyelv-ész-gép Új technológiák az információs társadalomban

Hasonló dokumentumok
A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás

Az NIIF Intézet és a ÚMFT TÁMOP programok bemutatása

Mobil Internet és a tesztelésére szolgáló infrastruktúra

A kezdeményezés célkitűzése

Budapesti Műszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar. Budapesti Műszaki és Gazdaságtudományi Egyetem

Villamosmérnöki és Informatikai Kar. A Budapesti Műszaki és Gazdaságtudományi Egyetem (BME) számokban

30 MB INFORMATIKAI PROJEKTELLENŐR

A JÖVŐ INTERNET KUTATÁSKOORDINÁCIÓS KÖZPONT SZERVEZETI ÉS MŰKÖDÉSI SZABÁLYZATA

Többnyelvű tezaurusz építése és szolgáltatása webes környezetben

A Hunglish Korpusz és szótár

Információs társadalom

Hát én immár mit válasszak?

Smart Strategic Planner

Infor PM10 Üzleti intelligencia megoldás

I formá m ció i s s t ársa s da d lo l m Ált l a t lá l nos s t u t dniva v ló l k B F D. B a B kon o yi P é P t é er c Fıi ı sk s ol o a l i tanár

Nemzeti Nukleáris Kutatási Program

KOPI. KOPI A fordítási plágiumok keresője MTA SZTAKI DSD. Pataki Máté Kovács László. Department of Distributed Systems

Tudásbázis a közgazdasági szférában

Központi szociális információs fejlesztések

Fülöp Csaba, Kovács László, Micsik András

A PEDAGÓGIAI TUDÁSMENEDZSMENT- RENDSZER ELEMEI

1. TANULÁS 1.1. Biztonságos eszközhasználat, felelős tartalomkezelés A felmérés eredményének összegzése 2-3- mondatban, egy bekezdésben.

SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

elearning TAPASZTALATOK ÉS TERVEK A ZRÍNYI MIKLÓS NEMZETVÉDELMI EGYETEMEN

Mesterséges Intelligencia Elektronikus Almanach

Jövő Internet Nemzeti Technológiai Platform IVSZ Menta. Dr. Bakonyi Péter BME EIT HUNGARNET

Kenyeres István (Budapest Főváros Levéltára) Szabadkai Levéltári Nap Előadás-vázlat

EURÓPAI BIZOTTSÁG III. MELLÉKLET ÚTMUTATÓ A PARTNERSÉGI MEGÁLLAPODÁSHOZ

Fordítás, többnyelvűség, szótárak

Miért jó nekünk kutatóknak a felhő? Kacsuk Péter MTA SZTAKI

Prof. Dr. Palotás Árpád Bence Projektvezető. 2. disszeminációs konferencia május 17.

KÚTFŐ projekt mit is végeztünk?

Üzleti szemlélet és a magyar nyelv támogatása a többnyelvű világban

BIG DATA ÉS GÉPI TANULÁS KÖRNYEZET AZ MTA CLOUD-ON KACSUK PÉTER, NAGY ENIKŐ, PINTYE ISTVÁN, HAJNAL ÁKOS, LOVAS RÓBERT

Gyakorlati tudnivalók

A BME VIK FMD pályázatának specifikumai

A felhőről általában. Kacsuk Péter MTA SZTAKI

Könyvtári szolgáltatások összehangolt infrastruktúra fejlesztése Borsod-Abaúj-Zemplén megyében

Elektronikus Közigazgatás megvalósítása

A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása

Szövetségi (föderatív) jogosultságkezelés

SCHNETv6 IPv6 a Schönherzben. 5/7/12 Tóth Ferenc - IPv6 a Schönherzben 1

Networkshop Kaposvár Balaskó Á., Kozlovszky M., Karóczkai K., Márton I., Kacsuk P. MTA SZTAKI

A GAZDASÁGTUDOMÁNYI KAR SZERVEZETI ÖNÉRTÉKELÉSÉNEK EREDMÉNYEI 2005.

Üzleti architektúra menedzsment, a digitális integrált irányítási rendszer


1. A megyében végzett jelentősebb kutatási témák, projektek ráfordításainak ágazati megoszlása (összesen millió Ft-ról áll rendelkezésre adat):

Kistérségi. Információs Rendszer Fejlesztési Irányok. Honfi Vid KE ÁTK egyetemi tanársegéd Balaton-Park Kht ügyvezető

Környezetipari és Megújuló Energetikai Kompetenciaés Innovációs Központ (KÖMEKIK)

WEB2GRID: Desktop Grid a Web 2.0 szolgálatában

Az egyetemek fejlesztő szerepe egy transznacionális tudásrégióban

Városi tömegközlekedés és utastájékoztatás szoftver támogatása

Lexikon és nyelvtechnológia Földesi András /

Digitális Felsőoktatási, Kutatási és Közgyűjteményi Infrastruktúra-fejlesztési Stratégia

Worldwide LHC Computing Grid

18. számú melléklet Megvalósíthatósági tanulmány a Társadalmi Megújulás Operatív Program

ChemLog Chemical Logistics Cooperation in Central and Eastern Europe A ChemLog projekt általános ismertetése

A fejétől bűzlik-e a hal? avagy A vezetői kultúra és az etikus üzleti magatartás kapcsolatának vizsgálata Közép Európában

2011. évi teljesítés

TÁMOP C-12/1/KONV

Az AVIR eredményei és továbbfejlesztésének irányai

bizalom építőkövei Kiberbiztonság és a Magyarország, június 7.

Visszatekintés a Jövő Internet NTP öt évére. Dr. Bakonyi Péter Jövő Internet NTP.

icollware szoftver portfolió

Digitális Oktatási Stratégia

Vezetői információs rendszerek

IdomSoft Informatikai Zártkörűen Működő Részvénytársaság


TÁMOP : ÁTFOGÓ MINŐSÉGFEJLESZTÉS A KÖZOKTATÁSBAN

A GUTS Projekt. Fenntartható Városi Közlekedési Rendszerek. Győr, Mobilis, junius.28.

Infokommunikációs eszközök szerepe a sikeres pályáztatás illetve megvalósítás érdekében

Az Európai Unió 7. kutatás - fejlesztési keretprogramja

TÁMOP kiemelt projekt. Központi szociális információs fejlesztések a szociális szolgáltatások modernizációja keretében

Múzeumok - ma Tudományos munka (szakma) Minerva project. Nemzeti Képviselők Csoportja (NRG) keretein belül. Közművelődés (közönség)

Csoportkezelés a szövetségben

Műszaki Informatikai Kar Három Dimenzióban

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

Társadalmi kapcsolathálózat-elemzés

Informatikai laboratórium. 1. Laboratórium megnevezése: Informatikai laboratórium. 2. Laboratórium elhelyezése: Inf. épület 1. emelet 101.

3. melléklet: Innovációs és eredményességi mutatók Összesített innovációs index, 2017 (teljesítmény a 2010-es EU-átlag arányában)

Dr. Hengl Melinda. A siketek felsőoktatásának aktuális kihívásai

MTA: KUTATÁS A JÖVŐNKÉRT

A JRC DRDSI adatszolgáltatási infrastruktúra programja

Az információs portáloktól a tudásportálokig

Menetrendkezelő Rendszer

Biomatika Intézet Neumann János Informatikai Kar Óbudai Egyetem. Dr. Kozlovszky Miklós egyetemi docens, intézetigazgató, OE NIK

Miskolc MJV Önkormányzatának eredményei a Miskolc EgyetemVáros 2015 projekt megvalósításához kapcsolódóan

Kistérségi közösségfejlesztés Borsod- Abaúj- Zemplén megyében

Szűkség van e könyvtárra századunkban? Szőcs Géza

A Szoftver és Szolgáltatások. Stratégiai kutatási terve. Kondorosi Károly, BME IIT. Szoftvertechnológiai Fórum február 2.

Mi legyen az informatika tantárgyban?

Határozatok a SZIE Gazdasági Tanács március 19-én tartott üléséről

MTA Cloud Use cases MTA Cloud workshop. Hernáth Szabolcs MTA WIGNER FK

TÁMOGATÁSHOZ KAPCSOLÓDÓ FŐBB TUDNIVALÓK

A stratégiai tervezés módszertana. Koplányi Emil. elearning Igazgatóság Educatio KHT.

Informatikai projektellenőr szerepe/feladatai Informatika / Az informatika térhódítása Függőség az információtól / informatikától Információs

stratégiai kutatási terve

SAJTÓKÖZLEMÉNY Azonnali közlésre és korlátlan felhasználásra

World Wide DSD Web. Csoportmunka

Ny-D Régió szerepe az erdő- és fahasznosításban

Átírás:

Nyelv-ész-gép Új technológiák az információs társadalomban

CESAR Csatlakozás az európai nyelvtechnológiai infrastruktúra élvonalához Lendvai Piroska piroska@nytud.hu

CEntral and *Közép- és South-East EuropeAn kelet-európai Resources* erőforrások Nagyszabású EUs projekt 9 partner, 2 millió támogatás MTA Nyelvtudományi Intézet koordinálásával 2011-2013 Nemzeti nyelvi infrastruktúrák egységesítése, összekapcsolása

Partnerek MTA Nyelvtudományi Intézet BME Távközlési és Médiainformatikai Tanszék Lengyel Tud. Akadémia Informatikai Intézet (P) Lódz-i Egyetem (P) Szlovák Tud. Akadémia Nyelvtudományi Intézet (SK) Bolgár Nyelvi Intézet (BG) Mihajlo Pupin Intézet (SRB) Belgrádi Egyetem Matematika Kar (SRB) Zágrábi Egyetem Bölcsészettudományi Kar (HR)

Motiváció A képviselt 6 nyelv EU tagországok, vagy csatlakozásra váró országok nemzeti nyelvei A páneurópai egységes digitális piac létrehozásához elengedhetetlen ezek nyelvtechnológiai támogatottsága Az észak-európai és dél-európai régiókban a CESARhoz hasonló projektek folynak majd Nyelvi erőforrások állnak a piacot lehetővé tevő szoftverek mögött, folyamatosan fejlesztendők MT 6. Stratégiai cél: Többnyelvűség, a nyelvi korlátok leküzdése

Nyelvi erőforrások, nyelvi infrastruktúra Írott és beszélt nyelvi adatbázisok Nagyméretű szöveges (tanító)állományok Feldolgozó/szintetizáló eszközök, címkézők szógyűjtemény, nyelvtani szerkezetek, szókincs stb. leírása korpusz szó-, mondatelemző, szótövesítő, párhuzamosító

Eddigi állapot Nyelvtechnológia idáig autonóm módon fejlődött, országonkénti eltérésekkel Nemzeti támogatással, kutatási, kereskedelmi célokra készültek nyelvi erőforrások Egymástól elszigetelten, ami a ma igényelt kompatibilitást, emiatt az újrafelhasználást gátolja

A CESAR projekt célja Európai Unió nyelvtechnológiai igényeinek támogatása A nyelvi erőforrások sokszor nem hasonlítanak egymásra, mert adott szempontok szerint, adott alkalmazások támogatására készültek Egységesíteni, szabványosítani: felépítésükben, nyelvtől független jellemzőikben

A CESAR projekt célja Európai Unió nyelvtechnológiai igényeinek támogatása

A CESAR projekt célja Európai Unió nyelvtechnológiai igényeinek támogatása Ha az EU piacát nyelvileg támogató alkalmazások elemei hasonlítanak egymáshoz, nő köztük a kompatibilitás a szoftverek, azok moduljai más nyelvekhez és célokhoz adaptálhatóvá válnak

A CESAR projekt célja Európai Unió nyelvtechnológiai igényeinek támogatása EU ehhez összefogó keretrendszert ad META-SHARE platform Ebbe kell az egymással összehangolt erőforrásokat beszállítani

Szintre- és szinkronba hozás Kevés a többnyelvű, párhuzamosított anyag o Nyelvpárok szerint mondat/szószinten egymás mellé rendezett szövegek o horvát-angol, horvát-francia o szlovák-orosz, szlovák-francia o Két- vagy többnyelvű szószedetek o Nyelvfüggetlen elemzők Általában egynyelvű erőforrások

Összekapcsolás Bekérni, kiterjeszteni, szabványosítani, modularizálni, dokumentálni Összekapcsolni horvát-angol-francia szlovák-orosz-francia horvát-angol-francia-szlovák-orosz Eredmény: többnyelvű (multilingvális) erőforrások

Páneurópai egységes digitális piac támogatása Bármilyen ipari vagy kutatási fejlesztéshez bárki felhasználhassa ezt a nyelvi infrastruktúrát Elemekre, építőkövekre bontva központi helyen kell tárolni Egyértelmű legyen, mi az, ami ott található egységes jellemzők kialakítása ( metaadatok )

Elérhetővé tett erőforrások Magyar és többnyelvű anyagok központi elhelyezése Elérhetővé (nem feltétlenül ingyenessé) tétel Ipar és fejlesztők számára Webes szolgáltatásként Szabványos licenszmegoldások alkalmazásával Létező jogi státuszok megőrzésével

Kívánt eredmény Az EU nyelveinek meglévő erőforrásain alapuló, kombinálható infrastruktúra Eredetileg más nyelvre fejlesztett alkalmazásokban is megjelenhet a magyar pl. lengyel piaci elemzőben, vagy annak részmegoldásait átvéve Magyarra kialakítandó szoftverekbe bekapcsolhatóak lesznek más EUs nyelvek

A CESAR küldetése Közvetítői szerep a nyelvtechnológiai közösség és a digitális piac egésze között A piac igényeinek felmérése A felhasználás mértékének kiértékelése A közép- és kelet-európai erőforrások EUs vérkeringésbe való becsatlakoztatása Régiós ipari és kutatói kulcsszereplők összefogásával