Önálló labor feladatkiírásaim tavasz

Hasonló dokumentumok
Önálló labor feladatkiírásaim tavasz

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése

A szemantikus világháló oktatása

BSc Témalaboratórum (BME VIMIAL00) Előzetes tájékoztató előadás 2018 ősz. Dr. Ráth István

Mesterséges Intelligencia Elektronikus Almanach. Konzorciumi partnerek

Mesterséges Intelligencia Elektronikus Almanach

Modell alapú tesztelés mobil környezetben

Fejlett kereső és lekérdező eszközök egy elektronikus szakfolyóirathoz (IBVS)

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből

A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás

A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása

A tananyag beosztása, informatika, szakközépiskola, 9. évfolyam 36

KOPI. KOPI Online Plágiumkereső és Információs Portál DSD. Pataki Máté MTA SZTAKI. Elosztott Rendszerek Osztály

Szemantikus világháló a BME-n

7. Óravázlat. frontális, irányított beszélgetés. projektor, vagy interaktív tábla az ismétléshez,

Szemantikus Web Semantic Web A szemantikus web alkalmas megközelítés, illetve megfelel nyelvekkel, eszközökkel támogatja az intelligens információs

Szemantikus Web Semantic Web A szemantikus web alkalmas megközelítés, illetve megfelel nyelvekkel, eszközökkel támogatja az intelligens információs

A HUNGLISH PÁRHUZAMOS KORPUSZ

KOPI. KOPI A fordítási plágiumok keresője MTA SZTAKI DSD. Pataki Máté Kovács László. Department of Distributed Systems

Szövegbányászati rendszer fejlesztése a Magyar Elektronikus Könyvtár számára

A DALNET24 projekt aktualitásai

Szolgáltatásintegráció (VIMIM234) tárgy bevezető

Hely- és kontextusfüggő alkalmazások fejlesztését támogató keretrendszer mobil környezetben

A kibővített Magyar történeti szövegtár új keresőfelülete

Önálló laboratórium (BME VIMIA376 / VIMIAL01) és Szakdolgozat készítés (BME VIMIA411) Előzetes tájékoztató előadás 2018 tavasz

Fülöp Csaba, Kovács László, Micsik András

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

Tudásalapú információ integráció

Mezőgazdasági külső információs rendszerek fejlesztése

TSIMMIS egy lekérdezés centrikus megközelítés. TSIMMIS célok, technikák, megoldások TSIMMIS korlátai További lehetségek

Beszédtechnológia az információs esélyegyenlőség szolgálatában

Ágensalapú információbeszerzés és -megosztás

Enterprise extended Output Management. exom - Greendoc Systems Kft. 1

HELYI TANTERV. Informatika

Modell alapú tesztelés: célok és lehetőségek

Bevezetés A harmadik szoftverkrízis korát éljük! Szoftverkrízisek: 1. nincs elég olcsó: hardver, szoftver, programozó 2. nincs elég olcsó: szoftver, p

Steps Towards an Ontology Based Learning Environment. Anita Pintér Corvinno Technologia Transzfer Kft

Dokumentumok Information kezelése? Management Információ - management. Professzionális dokumentumkezelés hiteles másolat készítés. Offisys Kft.

Gyakorlati vizsgatevékenység A

Rendszermodellezés: házi feladat bemutatás

Automatikus tesztgenerálás modell ellenőrző segítségével

A Hunglish Korpusz és szótár

Folyamatok rugalmas irányítása. FourCorm Kft.

Digitális kultúra, avagy hová lett az informatika az új NAT-ban? Farkas Csaba

Gyakorlati vizsgatevékenység B

Oktatás és tanulás online környezetben

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

AZ ÜGYFÉL KOMMUNIKÁCIÓ ÚJ FORMÁI POZITÍV ÜGYFÉLÉLMÉNY SZÖVEGBÁNYÁSZATI MEGOLDÁSOK

Beszédfelismerés alapú megoldások. AITIA International Zrt. Fegyó Tibor

Kétféle ismeret van: magunk rendelkezünk a szükséges információval, vagy tudjuk, hogy az hol lelhető fel. Samuel Johnson

A Magyar Tudományos Művek Tára

2. 3. Keresés az Interneten. Navigáció az Interneten: Megoldások. Internetes keresés buktatói. 1. Keresőmotorok. Webes keresési lehetőségek

Információs társadalom

A KÖZÉPSZINTŰ ÉRETTSÉGI VIZSGA INFORMATIKA TÉMAKÖREI: 1. Információs társadalom

OSZTÁLYOZÓ VIZSGA KÖVETELMÉNYEK -IT ANGOL SZAKMAI NYELV-

Szolgáltatásintegráció (VIMIM234) tárgy bevezető

DIGITÁLIS KOMPETENCIA FEJLESZTÉSE TANÍTÁSI ÓRÁKON

АZ ISKOLAI KÖNYVTÁR ELEKTRONIKUS KATALÓGUSÁNAK FELHASZNÁLÓI UTASÍTÁSA - SZIRÉN ADATBÁZISÁNAK KERESÉSE

PROJEKTTERV HÁLÓZATOK A HÉTKÖZNAPI ÉLETBEN

web2-es és web3-as szolgáltatások

SZÓBELI ÉRETTSÉGI TÉMAKÖRÖK

Emerald: Integrált jogi modellező keretrendszer

Department of Distributed Systems MTA SZTAKI DSD

Vállalati információs rendszerek I, MIN5B6IN, 5 kredit, K. 4. A meghirdetés ideje (mintatanterv szerint vagy keresztfélében):

Adatbázis-kezelő rendszerek. dr. Siki Zoltán

A RAKTÁRI JEGYZÉKEK SZÁMÍTÓGÉPES FELDOLGOZÁSA: ADATMODELLEZÉS ÉS SZABVÁNYOK

Evezz a mélyre! Haladó kutatási tippek bölcsészet- és társadalomtudományok témakörben

Váci Mihály Kulturális Központ Cím: Telefon: Fax: Web: Nyilvántartásba vételi szám:

INFORMATIKA TANMENET SZAKKÖZÉPISKOLA 9.NY OSZTÁLY HETI 4 ÓRA 37 HÉT/ ÖSSZ 148 ÓRA

Informatika 6. évfolyam

Dr. Ráth István

1. tétel: A kommunikációs folyamat

Lexikológia, lexikográfia a MID oktatásában

Bánki Zsolt István Csáki Zoltán Petőfi Irodalmi Múzeum Könyvtár és Informatika. Networkshop 2014 Pécs

Elektronikus Almanach

Online információkeresés. Dr. Nyéki Lajos 2016

Petőfi Irodalmi Múzeum. megújuló rendszere technológiaváltás

Mészáros Tamás. Ágensalapú információbeszerzés és -megosztás

Az egységes tartalomkezelés üzleti előnyei

Döntéstámogatás terepi gyakorlatokon

Mi legyen az informatika tantárgyban?

Publikációgyűjtemény tudásbázisának építése természetes nyelven

Történet John Little (1970) (Management Science cikk)

Informatika tanterv nyelvi előkészítő osztály heti 2 óra

Informatika 9Ny. Az informatikai eszközök használata

Big Data adattárházas szemmel. Arató Bence ügyvezető, BI Consulting

Tartalom. Előszó feladat: Fordítás a megszokott eszközökkel A számítógép hatékony használatáról... 18

Új fejlesztések, együttműködések a Magyar Elektronikus Könyvtárban, 2011-ben

Informatika szóbeli vizsga témakörök

Rendszermodellezés. Modellellenőrzés. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék

Dr. Pataricza András Dr. Ráth István

Modellező eszközök, kódgenerálás

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

30 MB INFORMATIKAI PROJEKTELLENŐR

Objektumorientált paradigma és a programfejlesztés

Mesterséges Intelligencia Elektronikus Almanach

ÉRETTSÉGI TÉTELCÍMEK 2018 Informatika

ALAPÍTÁSI ENGEDÉLYT KAPOTT KÖNYVTÁRI KÉPZÉSI PROGRAMOK Szakmai programok Budapest Budavári Palota F. épület

Programozási Technológia előadás bevezetés. Előadó: Lengyel Zsolt

Lőre Vendel- Csigó Györbiró Alpár Üzleti szimulációk az oktatásban

Átírás:

Önálló labor feladatkiírásaim 2015. tavasz (ezekhez kapcsolódó saját témával is megkereshetnek) Mészáros Tamás http://www.mit.bme.hu/~meszaros/ Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Mészáros Tamás témakiírásai 1 / 9

Információkeresés és -szolgáltatás, intelligens ágensek Információkeresés (information retrieval) tárolt szöveghalmazban az igényelt információ megtalálása szövegek elemzése és keresések futtatása strukturált szövegek (XML) létrehozása, feldolgozása és felhasználása pl.: webes keresőrendszerek, könyvtári keresők, üzleti adatelemző és -tisztító rendszerek, spam szűrés, desktop kereső, tudáskinyerők, stb. Információszolgáltatás (kapcsolat a felhasználóval) felhasználó modellezés (az igényelt információ kontextusa) információbevitel, keresés és lekérdezés természetes nyelven Intelligens ágensek alkalmazása észleli a környezetét és beavatkozói segítségével önállóan cselekszik kommunikál más entitásokkal (ágensekkel, emberekkel, stb.) közösségi entitás (több-ágens rendszerekben kooperál és verseng) modellezési és alkalmazásfejlesztési eszköz (Java-alapú) pl.: web indexelő robot, szövegelemző hálózat, felhasználói interfész ágens,... Mészáros Tamás témakiírásai 2 / 9

Szövegfeldolgozás, szövegbányászat Szövegek... strukturálatlan, szabad szöveg, természetes nyelvű strukturált (pl. XML), meghatározott nyelvtani és értelmezési rendszerrel jellemzően a kettő keveréke... gépi feldolgozása,... statisztikai feldolgozás, index építés, kulcsszó kiemelés kivonatolás, lényeges részek felismerése nyelvi elemzés (szavak, entitások, mondatok,...) strukturált formára alakítás (többféle elemzési módszerrel) XML technológiák (Schema, XML, XPath, XQuery) alkalmazása... és az eredmények felhasználása információkeresés és lekérdezés különböző szövegkorpuszok jellemzése, összevetése és klaszterezése tudásbányászat, összefüggések, állítások kinyerése... Mészáros Tamás témakiírásai 3 / 9

Irodalmi szövegek számítógépes elemzése (Az MTA Irodalomtudományi Intézettel közös feladatkiírás) Vajon Shakespeare írta az összes művét? Ki kivel állt kapcsolatban, kinek mely más szerzőre volt hatása Hogyan változott egyes szavak gyakorisága az idő folyamán? 1800-1970 között a nő szó a férfi -hez képest elenyésző gyakoriságú volt, 1980 óta nagyjából egyforma arányban fordulnak elő az angol irodalomban. Az 1880 szó használatának gyakorisága 1912-re feleződött meg, míg az 1973 már nagyjából 1983-ra elérte ezt a szintet. Egyre gyorsabban felejtünk? Az 1800-1840 között találmányok nevei kb. 66 év után terjedtek el írásban, míg az 1880-1920 közöttieknek ez csak 27 évig tartott 2010 óta jelentek meg jelentősebb (angol) publikációk a témakörben A magyar írásbeliség ilyen jellegű vizsgálata úttörő munkának számít Példaként Mikes Kelemen igen terjedelmes életművének vizsgálata a cél Digitalizált változatban már rendelkezésre áll, most zajlik a szótárkészítés A szövegnek létezik mai átírása, de az eredeti nyelvezet is vizsgálható A szótár a szavak értelmezésében, eltérő szóalakok felismerésében segít A feladat nyitott, egyéni ötletekkel is elő szabad, sőt kell állni Mészáros Tamás témakiírásai 4 / 9

A Villanyspenót bővítése (Az Országos Széchenyi Könyvtárral közös feladatkiírás) Az OSZK nagyszabású digitalizálási projektbe kezd cél a teljes állomány digitalizálása és OCR-erezése a szöveggyűjtemény mellé szakértői rendszereket és létrehoznak, amelyek összefogják egy-egy tudományterület anyagait ezek más online tartalom és tudásforrásokat is integrálni kívánnak A Villanyspenót egy online irodalomtörténeti rendszer ezt más adatbázisokkal és a digitalizált szövegekkel kapcsolnák össze a kapcsolódási pontokat lehetőleg automatikusan kell felderíteni ehhez tisztítani és elemezni kell a szöveget (programozottan) szövegelemzési és szövegbányászati módszerek alkalmazásával fogalmak, nevek, évszámok, korszakok, címek, bibliográfiai adatok, stb. Technológiák (gyakorlatban megismerhetők, előismeret előny) web (Javascript, node.js, Angular, Java) adatbázis (nosql, Mongodb) szövegelemzés és -bányászat (reguláris kifejezések, XML, stb.) Mészáros Tamás témakiírásai 5 / 9

Közlekedési hálózatok ágensalapú modellezése Úthálózatok és az ott közlekedő autósok modellezése Bizonyos szempontok szerint reális modell legyen Az ágensalapú megközelítés érdekes lehet Próbáljuk meg az autósok viselkedését is modellezni Agresszív, szabálykövető, tutyi-mutyi, stb. A különböző viselkedésű autósok megfigyelése a szimulációban Mire használható? A hálózat megfigyelése a szimulált rendszerben (a valóságban nehéz) Kísérletezésre (viselkedések, hálózati konfiguráció, stb.) Közlekedési lámpák jobb hangolására Úthálózatok átalakítására (lásd Wekerle és az egyirányú utak) Nagy ágenspopuláció hatékony futtatása (pl. A GPGPU érdekes lehet) Sokan dolgoztak már a témában, az ő eredményeik felhasználhatók. Mészáros Tamás témakiírásai 6 / 9

Kontrollált természetes nyelvek alkalmazása Természetes nyelvű kommunikáció a számítógéppel ideális lenne Kontrollált természetes nyelvek Mintha természetes lenne (jól érthető, megtanulható) Alkalmazási területre szabható (mesterséges) Jól elemezhető (igen egyszerű elemző is elég lehet) Jól értelmezhető (egyértelmű szemantika, automatikus fordítás) Mire használható? Bonyolult interfészek egyszerűvé válnak: a nyelv biztosítja az összetettségüket, nem a felületi elemek Olyanok is használhatják, akik egy számítógépes felületen elvesznek Akkor is működik, ha nem áll rendelkezésre megfelelő interfész eszköz Hangalapú kommunikációt is lehetővé tesz (pl. Google Speech Input) Tudásbevitel Elemezhető, a számítógép által megérthető szöveg Formális (pl. logikai) reprezentációra alakítható Mészáros Tamás témakiírásai 7 / 9

Nyelvalkotás A természetesre hasonlító, mesterséges nyelvek létrehozása Komolyabb példák: Basic English (850 szóból álló angol), légiirányítás, technikai dokumentációk nyelvezete, ontológiák leírása, stb. Könnyedebb példák: Klingon, Dothraki, Valyrian, Castithan, Irathient, stb. (Ezek mögött is komoly elmélet húzódik meg.) Mi a célunk? Általános kommunikáció megvalósítása (ezzel nem foglalkozunk) Valamilyen problémakörhöz kapcsolódó feladat megoldása (résznyelv) azaz alkalmazási területhez és célhoz kötött nyelv megalkotása Mire és hogyan használhatjuk? Adat- és tudásbázisok (természetes nyelvű) bővítése és lekérdezése Konkrét példa: tudományos közlemények állításainak formálisabb leírása ún. szemantikus absztrakt segítségével. A szókincset a tárgyterület adja, a feladat a bevitelhez és a lekérdezéshez használható nyelv létrehozása Mészáros Tamás témakiírásai 8 / 9

Általános tudnivalók mit várok és mit nyújtok Mindent szabad, ami örömet okoz a motiváció érdekében a feladatkírást a hallgatóval közösen véglegesítem szabad saját (akár irreálisnak tűnő) ötletekkel változtatni a feladaton a feladat méretének helyes meghatározása a konzulens feladata Előzetes jelentkezés a konzulensnél rövid bemutatkozás (előismeretek) miért érdekli a téma (mi a motiváció) milyen elképzelései vannak a feladatkiírás módosításával kapcsolatban Az önálló labor menete közösen megalkotott specifikáció és vázlatos munkaterv heti rendszeres konzultációk (aki jól halad, annál ritkábban is lehet) fontos a terület önálló felfedezése, de irodalmat bőségesen adok a terveket megbeszéljük, az implementáció önálló munka nem a tökéletes termék a cél, hanem a terület megismerése, megértése Mészáros Tamás témakiírásai 9 / 9