SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből

Hasonló dokumentumok
Teljesen elosztott adatbányászat alprojekt

Teljesen elosztott adatbányászat pletyka algoritmusokkal. Jelasity Márk Ormándi Róbert, Hegedűs István

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

Kollektív tanulás milliós hálózatokban. Jelasity Márk

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

Modellkiválasztás és struktúrák tanulása

Mesterséges Intelligencia Elektronikus Almanach. Konzorciumi partnerek

Összeállította Horváth László egyetemi tanár

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Hálózati réteg. WSN topológia. Útvonalválasztás.

I I. H é t f ő Óra IR IR 012 3

Tudásalapú információ integráció

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

Intelligens adatelemzés

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

ProSeniis projekt. Monos János GE Healthcare

Közösség detektálás gráfokban

Kurzuskód Kurzus címe, típusa (ea, sz, gy, lab, konz stb.) Tárgyfelelős Előfeltétel (kurzus kódja) típusa

Újfajta, automatikus, döntési fa alapú adatbányászati módszer idősorok osztályozására

A hálózattervezés alapvető ismeretei

Tipikus időbeli internetezői profilok nagyméretű webes naplóállományok alapján

Webes keres rendszerek. Webtechnológiák. Webes keres rendszerek. Webes keres rendszerek. Répási Tibor egyetemi tanársegéd

A PhysioBank adatmegjelenítő szoftvereinek hatékonysága

PÁLYÁZATI FELHÍVÁS Pályázati azonosító: GRAF-1603

Gépi tanulás és Mintafelismerés

Teljesen elosztott adatfeldogozás és adatbányászat

A szemantikus világháló oktatása

Történet John Little (1970) (Management Science cikk)

Kutatás-fejlesztési eredmények a Számítógépes Algoritmusok és Mesterséges Intelligencia Tanszéken. Dombi József

Gépi tanulás a gyakorlatban. Bevezetés

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

BitTorrent felhasználók értékeléseinek következtetése a viselkedésük alapján. Hegedűs István

A szak specializációi

1. gyakorlat. Mesterséges Intelligencia 2.

MESTERSÉGES INTELLIGENCIA ÉS HATÁRTERÜLETEI

Beltéri autonóm négyrotoros helikopter szabályozó rendszerének kifejlesztése és hardware-in-the-loop tesztelése

Kulcs véleményvezér kutatás Közösségi hálózatelemzés

Emerald: Integrált jogi modellező keretrendszer

Big Data az adattárházban

Adatbányászati technikák (VISZM185) 2015 tavasz

ACTA CAROLUS ROBERTUS

Kurzus címe, típusa (ea, sz, gy, lab, konz stb.) Tárgyfelelős Előfeltétel (kurzus kódja) Előfeltétel típusa

Nemzeti tananyagfejlesztés és országos referenciaiskola hálózat kialakítása digitális kiegészítő oktatási anyagok létrehozása az új NAT hoz

VIII. Magyar Számítógépes. Nyelvészeti Konferencia MSZNY Szerkesztette: Tanács Attila. Vincze Veronika

Modellezett orvosszakmai protokollok, folyamatvezérelt páciens életút

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

Számítási intelligencia

Mezőgazdasági külső információs rendszerek fejlesztése

Szövegbányászati rendszer fejlesztése a Magyar Elektronikus Könyvtár számára

Számítsuk ki a nyelvet! Matematika, fizika és algoritmusok a nyelvben

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

Óbudai Egyetem Neumann János Informatikai Kar. Intelligens Mérnöki Rendszerek Intézet

1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok. HálózatokII, 2007

Az oktatás jelenlegi helyzete - jövőképe Információ alapú közoktatás fejlesztés a KIR bázisán

Tartalomjegyzék. Tartalomjegyzék... 3 Előszó... 9

ÉLET A FELHŐBEN - HATÉKONYSÁGNÖVELÉS CLOUD TECHNOLÓGIÁVAL. Baranyi Fanni Microsoft Online Szolgáltatások Értékesítési Szakértő

TANTÁRGYI ADATLAP I. TANTÁRGYLEÍRÁS

Különböző hagyományos és nem-hagyományos eljárások kombinálása: miért és hogyan? április 16.

Kódverifikáció gépi tanulással

Modellellenőrzés. dr. Majzik István BME Méréstechnika és Információs Rendszerek Tanszék

Mesterséges neurális hálózatok II. - A felügyelt tanítás paraméterei, gyorsító megoldásai - Versengéses tanulás

Oktatott tárgyak a 2017/18. tanév I. félévében

Új módszerek és eszközök infokommunikációs hálózatok forgalmának vizsgálatához

Informatika. Magyar-angol két tanítási nyelvű osztály tanterve. 9. évfolyam

Networkshop Kaposvár Balaskó Á., Kozlovszky M., Karóczkai K., Márton I., Kacsuk P. MTA SZTAKI

Matematika és Számítástudomány Tanszék

Neurális hálózatok bemutató

KOMPOZITLEMEZ ORTOTRÓP

TANTÁRGYI ADATLAP I. TANTÁRGYLEÍRÁS

PÁLYÁZATI FELHÍVÁS EFOP VEKOP forrásból támogatott től induló tudományos ösztöndíjak SZTE hallgatói számára

Valószínűségszámítás és statisztika

MECHATRONIKAI MÉRNÖKI ALAPKÉPZÉSI SZAK. 2. Az alapképzési szakon szerezhető végzettségi szint és a szakképzettség oklevélben szereplő megjelölése:

3D számítógépes geometria és alakzatrekonstrukció

Gépi tanulás a gyakorlatban. Lineáris regresszió

Számítógépes döntéstámogatás. Bevezetés és tematika

SeaHunter a fejvadász

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban

ADATBÁNYÁSZATI SZOFTVER HASZNÁLATA SZÖVEGOSZTÁLYOZÁSHOZ DATA MINING SOFTWARE FOR TEXT CLASSIFICATION

Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György

MATEMATIKA - STATISZTIKA TANSZÉK

Parametrikus tervezés

Összefoglalás és gyakorlás

Informatikai Kar Eötvös Loránd Tudományegyetem Mesterséges neuronhálók

PEDAGÓGIAI MUNKA TÁMOGATÁSA AZ INNOVÁCIÓ ÉS TUDÁSMENEDZSMENT ESZKÖZEIVEL

TANMENET. IV: Béla Általános Iskola Iskola címe: 3664 Járdánháza IV. Béla út 131. Csoport életkor (év): 14 Kitöltés dátuma (év.hó.nap):

Az informatika kulcsfogalmai

Hogyan teremtsünk értéket strukturálatlan adatokból?

Kulcsszókinyerés alapú dokumentumklaszterezés

Industrial Internet Együttműködés és Innováció

Informatika a valós világban: a számítógépek és környezetünk kapcsolódási lehetőségei

Hadházi Dániel.

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Informatikai Intézet Alkalmazott Informatikai Intézeti Tanszék

Félévi óraszám Ajánlott félév. Követelmény. Heti óraszám. Felvétel típusa. Kreditpont. Felvétele. típusa

Szövegbányászat Információ Visszakeresés és egyéb alkalmazások

Fogalomtár Etikus hackelés tárgyban Azonosító: S2_Fogalomtar_v1 Silent Signal Kft. Web:

Projekt beszámoló. NEWSIT News basedearlywarning System forintradaytrading: Hír alapú Korai Figyelmeztető Rendszer Napon belüli Kereskedéshez

Tanulás tanuló gépek tanuló algoritmusok mesterséges neurális hálózatok

3D-s számítógépes geometria és alakzatrekonstrukció

KÖVETKEZŐ GENERÁCIÓS NAGYVÁLLALATI TARTALOMKEZELŐ MEGOLDÁSOK Stratis Kft. / Autonomy üzleti reggeli / Mezei Ferenc üzletág-igazgató

Átírás:

2010/2011 tavaszi félév SZTE Eötvös Loránd Kollégium 1. Dombi József: Fuzzy elmélet és alkalmazásai 2011. március 3. 19:00 2. Móra György: Információkinyerés természetes nyelvű szövegekből 2011. március 31. 19:00 3. Nagy István: Tanulás pozitív és jelöletlen példákból 2011. április 1. 8:30 4. Krész Miklós: Gráf alapú adatbányászat 2011. április 15. 8:00 5. Harka Győző: Internetes kataklizmák 2011. április 19. 19:00 (Eötvös Esték keretében) 6. Berend Gábor: Kulcsszókinyerési technikák 2011. április 21. 19:00 7. Jelasity Márk: Elosztott adatbányászat 2011. április 29. 9:00 8. Bánhalmi András: Neurológiai betegek adatainak feldolgozása 2011. május 12. 19:00

Dombi József: Fuzzy elmélet és alkalmazásai Időpont: 2011. március 3. 19:00 A fuzzy logika a többértékű logika egy formája, 1965- ben Zadeh egy tanulmányával született meg. A fuzzy logikában nem pusztán "igen" és "nem" létezik, hanem átmenet is e kettő között. Maga a fuzzy szó elmosódottat jelent, utalva a bizonytalanságra. Ez a tudományterület az elmúlt fél évszázadban nagy teret nyert nem csak az informatikában, hanem a nyelvtudományi és logikai szemantikában, a matematikai logikában és a valószínűségelméletben is. Az előadás kitér a fuzzy logika alapjaira és a fuzzy logikán alapuló irányításra, mely egyre gyakrabban használt napjainkban elsősorban gépek, robotok illetve háztartási készülékek i- rányítására. 1

Móra György: Információkinyerés természetes nyelvű szövegekből Időpont: 2011. március 31. 19:00 Mi az a természetes nyelvfeldolgozás Milyen feladatok vannak (információ-visszakeresés, kivonatolás, illetve információkinyerés) Mi a kettő közötti különbség, melyik mire jó Hol van szükség automatikus információkinyerésre Mik azt alapvető technikái, milyen módszereket használnak (szakértői rendszerek, gépi tanulás, hibrid rendszerek, nyelvészeti eszközök) Gépi tanulási megközelítések Hogyan mérhető a teljesítmény (kiértékelési metrikák, versenyek) Tudomány vs. ipar 2

Nagy István: Tanulás pozitív és jelöletlen példákból Időpont: 2011. április 1. 8:30 Szövegek osztályozása egy igen fontos és inzenzíven kutatott terület az információkinyerésen és a gépi tanuláson belül. Ahhoz, hogy egy szövegosztályozót konstruálhassunk, szükséges tanítópéldák gyűjtése, melyek fel vannak címkézve az előre definiált osztályok címkéivel. Ez a címkézés gyakran manuálisan történik, ami igen nehéz és költséges folyamat eredménye. Ahhoz, hogy egy osztályozó modellt kapjunk egy osztályozó algoritmust kell tanítani ezeken a tanítópéldákon. Az ilyen típusú osztályozók a felügyelet gépitanulás osztályába tartoznak mivel, minden tanítópélda fel van címkézve az algoritmus számára. Előadásomban speciális, nem felügyelt tanulás osztályba tartozó megközelítéseket fogok ismertetni. Kétosztályos (pozitív és negatív) problémákra fókuszálva, mely során csupán pozitív tanítópéldákból tanítjuk az algoritmusokat. 3

Krész Miklós: Gráf alapú adatbányászat Időpont: 2011. április 15 8:00 Az utóbbi években a nem struktúrált adatok elemzése központi kérdéssé vált mind az ipari (telekommunikáció, pénzügyi szféra), mind az akadémiai (bioinformatika, szociológia, közgazdaságtan) kutatás terén. A fenti típusú adatok reprezentációjában a rejtett gráfstruktúra rendkívül hasznosnak bizonyult az elemzések során. Az előadás során bemutatásra kerülnek olyan gráfstruktúrára épülő modellek és hatékony algoritmusok, melyek különböző adatbányászati elemzések alapját képezhetik nagyméretű (milliós nagyságrendű), strukturálatlan adathalmazokon is. Szintén ismertetjük azon projekteket (biológia, környezettudomány, telekommunikáció, pénzügyi szféra), ahol a kifejlesztett módszerek alkalmazást nyertek. 4

Berend Gábor: Kulcsszókinyerési technikák Időpont: 2011. április 21. 19:00 Az elektronikus, azon belül is az online szöveges tartalmak méretének robbanása újszerű megközelítéseket tesz szükségessé kategorizálásukra. Egy ilyen elterjedt módszer az ún. címkézés eljárása, amely során dokumentumainkat az azokat tömören és jól leíró kulcskifejezésekkel látjuk el. A szöveges dokumentumokból történő kulcsszókinyerés számos alkalmazási területen hasznosítható, a katalogizáló- és kivonatoló rendszerektől kezdve egészen az információ-visszakereső módszerekig. A kulcsszavakkal el nem látott dokumentumok mennyiségének folyamatos és markáns növekedése miatt azonban feldolgozásuk csupán automatikus eszközök segítségével képzelhető el. A kulcsszavak egy része egzaktul a szövegben is megtalálható, de kulcskifejezések lehetnek olyan absztrakt címkék is, amik a dokumentumban magában nem fordulnak elő, mégis szemantikus kapcsolatba hozhatók a leírtakkal. Előadásomban az absztrakt es nem absztrakt kulcsszavak eltérő doménekből (tudományos publikációk, hírdokumentumok) történú kinyerésére fókuszálok majd. 5

Jelasity Márk: Elosztott adatbányászat Időpont: 2011. április 29 9:00 A nagyméretű elosztott rendszerekben, mint pl. a peerto-peer hálózatok, vagy szenzorhálózatok, nagy mennyiségű adat keletkezik ill. áll rendelkezésre tejlesen elosztott formában, azaz a hálózat egyes csomópontjaiban szétszórva. Ennek a hatalmas adatmennyiségnek a központi feldolgozása költséges, és adatvédelmi problémákat is felvet. Az előadásban ismertetek olyan algoritmusokat, amelyek képesek tolerálni ezeknek a hálózatoknak az ellenséges körülményeit: a nagy üzenetvesztési valószínűséget, a csomópontok esetleges meghibásodásait, a késleltetéseket, és a nagyon nagy méretet is. A csomópontok csak lokálisan kommunikálnak, nincs egy csomópontnak sem kitüntetett szerepe, mégis hatékonyan konvergál a rendszer állapota az általunk megkívánt állapotba, ami pl egy gépi tanulási modell az adatok felett, vagy valamilyen globális számítási feladat eredménye. 6

Bánhalmi András: Neurológiai betegek adatainak feldolgozása 2011. május 12. 19:00 Egy, a neurológiai betegek otthoni ápolásást, monitorozását célzó projekt kapcsán felmerülő néhány összetettebb adatelemzési, kiértékelési feladatot vázolok fel, ezek közül: nyelvi tesztek, feladatokhoz kapcsolódóan a beteg kiejtésének kiértékelése kognitív tesztekhez kapcsolódóan érintőképernyős rajzolási feladat kiértékelése otthoni torna végzése (csuklóra rögzített gyorsulásmérő) alvás monitorozása (nyomásszenzor-mátrix jeleinek kiértékelése) mozgásérzékelő hálózatból származó adatsorok 7