Adatbányászat. Data Mining: Concepts and Techniques (3 rd ed.)

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Adatbányászat. Data Mining: Concepts and Techniques (3 rd ed.)"

Átírás

1 Adatbányászat Data Mining: Concepts and Techniques (3 rd ed.) Jiawei Han, Micheline Kamber, and Jian Pei University of Illinois at Urbana-Champaign & Simon Fraser University 2009 Han, Kamber & Pei. All rights reserved. Adattárházak és adatbányászat 1

2 Mirıl szól a kurzus? Bevezetés az adattárházak és adatbányászat technológiákba Bevezetés Ismerjük meg az adatainkat! Az adatok elıfeldolgozása (Data Preprocessing) Bevezetés az adattárházak és OLAP technológiákba (Data Warehouse and OLAP Technology) Adatkockák használata (Data Cube Technology ) Gyakori minták és asszociációk keresése (Mining Frequent Patterns & Association) Osztályozás (Classification) Klaszterezés (Cluster Analysis) Adattárházak és adatbányászat 2

3 A könyvben olvasható alkalmazási területek, haladó témák Adatfolyamok, idısorok, szekvenciák adatbányászata Gráfok, közösségi hálók, multirelációk adatbányászata Objektumok, téridı-adatok, multimedia objektumok, szövegek, weben található információ adatbányászata Alkalmazások és aktuális irányzatok az adatbányászatban Üzleti adatok bányászata Biológiai adatok bányászata Vizuális adatbányászat (képek, videók) Adatvédelem-ırzı adatbányászat Adattárházak és adatbányászat 3

4 A könyv szerzıjének oldala: Adattárházak és adatbányászat 4

5 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 5

6 Miért kell adatbányászat? Adatrobbanás zajlik: terabájtokról áttérünk a petabájtokra Nagy adatgyőjtemények keletkeznek és érhetık el Automatikus adatgyőjtı mérıeszközök, adatbázisrendszerek, Web, közösségi hálók, számítógépes ügyfélszolgálatok Nagy mennyiségő nyers adat keletkezik a következı területeken Üzleti élet: Web, e-kereskedelem, pénzügyi tranzakciók, tızsde Tudomány: távérzékelı berendezések, bioinformatika, tudományos szimulációk Közösségi és mindennapos élet: Facebook, hírek, digitális kamerák, YouTube Ellep bennünket a rengeteg adat, bár mi valójában inkább tudásra vágyunk! A szükség szüli az új technológiát: Az adatbányászat a nagy mennyiségő adatok automatikus elemzése Adattárházak és adatbányászat 6

7 A tudomány fejlıdése 1600 elıtt, empirikus (tapasztaláson alapuló) tudomány , elméleti tudomány Minden terület kifejlesztette a saját elméleti megalapozását. Az elméleti modellek kísérletezésre ösztönöznek, illetve általános érvényő tudást fogalmaznak meg , számítógép-tudomány A legtöbb terület egy számítógépes részterületet is kifejlesztett (kísérleti, elméleti, számítógépes fizika vagy empirikus, elméleti nyelvészet, illetve formális nyelvek.) A számítógép-tudományt a szimulációk iránti igény hozta létre, mivel sok esetben a bonyolult matematikai modelleknek nincs zárt formulával megadható megoldása. 1990, adattudomány A tudományos eszközök, szimulációk adatözönt generálnak. Megnyílt a lehetıség, hogy több petabájtnyi adatot lehessen olcsón tárolni, kezelni. Az Internet és a Grid rendszerek révén ezeket az adathalmazokat könnyen el lehet érni. A tudományos információkezelési, információgyőjtési, szervezési, lekérdezési, megjelenítési feladatok száma az adatmennyiség arányában növekszik. (Minél több az adat, annál többféle feldolgozásra vagyunk kíváncsiak.) Az adatbányászat napjaink egyik fı kihívása! A csillagászatban keletkezı hatalmas adathalmazok közös feldolgozására létrehozott architektúra: The Sloan Digital Sky Survey Jim Gray and Alex Szalay, The World Wide Telescope: An Archetype for Online Science, Comm. ACM, 45(11): 50-54, Nov Adattárházak és adatbányászat 7

8 Az adatbázis technológia fejlıdése 1960: 1970: 1980: 1990: 2000 Adatgyőjtemények, hálós és hierarchikus adatbázis-kezelık, IMS, IDMS Relációs adatmodell bevezetése relációs adatbázis-kezelık (RDBMS) megjelenése RDBMS elterjedése, új adatmodellek támogatása (objektumorientált, deduktív, stb.) Alkalmazásspecifikus adatbázis-kezelık (térinformatika, mérnöki tervezések, stb.) Adatbányászat, adattárházak, multimédia adatbázisok, web-adatbzisok Adatfolyamok kezelése, bányászata Adatbányászat alkalmazása egyre több területen Webtechnológiák, szemantikus technológiák, felhıkörnyezetek Adattárházak és adatbányászat 8

9 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 9

10 Mi az adatbányászat? Az adatbányászat (tudás kinyerése az adatokból) Érdekes (nem triviális, implicit, eddig nem ismert és potenciálisan hasznos) mintákat (azaz tudást) akarunk kinyerni a nagyon nagy adathalmazokból lehetıleg automatikusan, és minél hatékonyabban. Más elnevezések Tudásfeltárás az adatbázisokban (Knowledge discovery in databases - KDD), tudáskinyerés (knowledge extraction), adatelemzés, mintaelemzés (data/pattern analysis), információ-betakarítás (information harvesting), üzleti intelligencia (business intelligence). Mi nem adatbányászat? Egyszerő keresések, lekérdezések végrehajtása (Deduktív) szakértıi rendszerek Adattárházak és adatbányászat 10

11 A tudásfeltárás (KDD) folyamata Az adattárház használata ki is maradhat! A minták értékelése Adatbányászat Feladatorientált adatok Adattárház Adatok kiválasztása Adattisztítás Adatintegráció Adatbázisok Adattárházak és adatbányászat 11

12 Hogy néz ez ki a web-bányászat esetében? Mibıl áll a web-adatokon végzett tudásfeltárás? Adattisztítás Több forrásból származó adatok integrációja Az adatokból adattárház építése Adatkockák készítése Az adatbányászathoz szükséges adatok kiválasztása Adatbányászat elvégzése Az eredményekbıl jelentések készítése, megjelenítése A talált minták, összefüggések (tudás) tárolása a tudásbázisban Adattárházak és adatbányászat 12

13 Adatbányászat az üzleti intelligenciában A döntéstámogatás piramisa Prezentáció Vizualizációs technikák Adatbányászat Információfelderítés Döntéshozó Üzleti elemzı Adatelemzı Adatelemzés Statisztikai összegzések, lekérdezések, jelentések Elıfeldolgozás/Integráció, adattárház építése Adatforrások Dokumentumok, fájlok, weboldalak, kísérleti eredmények, adatbázisok Döntéshozatal Rendszergazda Adattárházak és adatbányászat 13

14 A KDD folyamat: Mesterséges intelligencia és statisztikai nézıpontból Input adatok Adatbányászat Elıfeldolgozás Utófeldolgozás Adatintegráció Normalizálás Lényeges tulajdonságok kiválasztása Dimenziócsökkentés Minták keresése Asszociáció és korreláció Osztályozás Klaszterezés Kiugró értékek elemzése Minták értékelése Minták kiválasztása Minták interpretálása Minták megjelenítése Adattárházak és adatbányászat 14

15 Az adatbányászat, mint multidiszciplinális tudomány Gépi tanulás Mintafelismerés Statisztika Alkalmazások Adatbányászat Megjelenítés Algoritmusok Adatbázisok Hatékony számítási modellek Adattárházak és adatbányászat 15

16 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 16

17 Az adatbányászat különbözı aspektusai Milyen típusú összefüggést, tudást bányászunk? Jellemzés, (karakterizáció), megkülönböztetés, (diszkrimináció), kapcsolódás (asszociáció), osztályozás (klasszifikáció), csoportosítás (klaszterezés), trendre illeszkedés/trendtıl eltérés, kiugró (outlier) esetek elemzése. Lehet leíró vagy elırejelzı (Descriptive vagy predictive) adatbányászat Több szintő adatbányászat Milyen adatokban bányászunk? Relációs adatbázis, adattárház, tranzakciós adatbázis, adatfolyam, objektumorientált vagy objektum relációs adatbázis, aktív adatbázis, térinformatikai adatbázis, multimédia adatbázis, heterogén adatbázis, örökölt adatbázis, webadatok, hálózatok Milyen technikákat használunk? Adatbázis technológiák, adattárház technológiák (OLAP), gépi tanulás, statisztika, vizualizáció Mire használjuk az adatbnyászatot Kereskedelem, telekommunikáció, bankrendszer, csalásfelderítés, bioinformatika, tızsdeelemzés, szövegbányászat (szemantikus web), webbányászat Adattárházak és adatbányászat 17

18 Miért van szükség ennyiféle terület összevegyítésére? Hatalmas adatmennyiséggel kell dolgozni Az algoritmusoknak skálázhatóknak kell lenniük több terabájt adat esetére is Nagy dimenziójú adatokkal kell dolgozni A génchipek esetében például több tízezer dimenziójú adatok keletkezhetnek (minden pixelnek egy adatvektort felel meg) Összetett struktúrájú, különféle típusú adatokat kell vizsgálni Adatfolyam keletkeznek a mérımőszerekben Idısorok, szekvenciák Struktúrák, gráfok, közösségi hálók, összekapcsolt adatok (szemantikus web) Heterogén adatbázisok, örökölt (régi) adatbázisok Téradatok, téridı adatok, multimédia, szöveg, weboldalak szoftverek, forráskódok, szimulációk Új összetett alkalmazásokat kell készíteni Adattárházak és adatbányászat 18

19 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 19

20 Az adatbányászat technikái: 1. Általánosítás Információ integráció, adattárház építése Adattisztítás, transzformálás, integráció, többdimenziós adatmodell készítése Adatkockák technológiája Ezek olyan skálázható módszerek, amelyek például materializációval többdimenziós aggregátumokat lehet hatékonyan kiszámítani OLAP (online analytical processing) online elemzések Többdimenziós fogalmi leírások: karakterizáció és diszkrimináció (hogyan jellemezhetı, hol vannak eltérések) Az adatok általánosítása, jellemzése, például a száraz és csapadékos területek összehasonlítása Adattárházak és adatbányászat 20

21 Az adatbányászat technikái: 2. Asszociáció és korreláció Gyakori minták (gyakori elemhalmazok) keresése Milyen termékeket vásárolnak gyakran együtt egy boltban? Többféle összefüggés lehetséges: Asszociáció, korreláció, oksági viszony Egy tipikus asszociációs szabály Pelenka Sör [0.5%, 75%] (support, confidence) (támasz és megbízhatóság) Vajon a szoros asszociációban álló elemek statisztikai értelemben is erısen korreláltak? Hogy lehet ilyen szabályokat hatékonyan elıállítani egy nagy adatbázis esetében? Hogyan használhatjuk fel ezeket a szabályokat klaszterezésre, osztályozásra vagy más alkalmazásokra? Adattárházak és adatbányászat 21

22 Az adatbányászat technikái: 3. Osztályozás Osztályozás, címkék elırejelzése Egy tanuló adathalmazra modelleket (függvényeket illesztünk) Osztályokat, fogalmakat jellemzünk, vagy különböztetünk meg és ezt elırejelzésre is használhatjuk Osztályozzuk az országokat éghajlatuk alapján (szárazföldi, mediterrán, trópusi), úgy hogy mérjük az évi középhımérsékletet, csapadékot, stb. vagy az autók márkája, kora, súlya, mérete, stb. ismeretében osztályozzuk az autókat, hogy mennyi az éves szervízköltség (sok, közepes, kevés) Egy új megfigyelt egyed esetében a tulajdonságai alapján jósoljuk meg, hogy melyik osztályba fog tartozni. Tipikus módszerek Döntési fák, naïve Bayesian osztályozó, támaszvektor gépek (SVM - support vector machines), neurális hálók, szabályalapú osztályozás, mintalapú osztályozó, logistic regresszió, Tipikus alkalmazások: Hitelkártyacsalások felderítése, direktmarketing, ajánló rendszerek, véelmények (csillagok) elırejelzése, betegség megjóslása a szimptómákból. Adattárházak és adatbányászat 22

23 Az adatbányászat technikái: 4. Klaszterezés Nem felügyelt tanulás (Unsupervised learning) (vagyis nincsenek elıre megadott címkék a csoportokhoz, osztályokhoz rendelve) Magukat az adatokat csoportosítjuk, hogy új kategóriákat fedezzünk fel, például utcai rablások alapján különbözı veszélyezettségő területeket különböztethetünk meg, vagy a házak értékeit vizsgálva egy adott ház helyébıl az értékére következtethetünk Az alapelv: Maximalizáljuk az osztályokon belüli hasonlóságot ÉS minimalizáljuk az osztályok közötti hasonlóságot Rengeteg klaszterezési módszer létezik. Adattárházak és adatbányászat 23

24 Az adatbányászat technikái: 5. Kiugró objektumok elemzése Mit tekintünk kiugró objektumnak? Kiugró (Outlier) objektum: olyan adatobjektum, amely az adatobjektumok általános viselkedésének nem felel meg, például valamelyik komponense nagyon eltér az átlagtól. Minek tekintsük, zajnak vagy kivételnek? Ami az egyik szempontból hiba, szemét, az egy másik vizsgálat számára értéket jelent, például csalásra következtethetünk, ha a szokásos használattól nagyon eltér egy bankkártya használata. Milyen módszereket használhatunk? Klaszterezés, regresszió, Ritka események felderítése (például CERN gyorsítójában a mért adatok alapján keletkezett-e új részecske) Adattárházak és adatbányászat 24

25 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 25

26 Milyen adatokban bányászunk? Az adatok egy részét adatbázisokban tároljuk, alkalmazásokkal dolgozzuk fel. Relációs adatbázis, adattárház, tranzakciós adatbázis Speciális adathalmazok és alkalmazások Adatfolyamok, mőszerek adatai Idısorok, idıszakos adatok, szekvenciák (például génszekvenciák) Strukturált adatok, gráfok, hálózatok, összekapcsolt adatok Objektumrelációs adatbázisok Heterogén, örökölt adatbázisok Tér- és téridıadatok Multimédia adatbázisok Dokumentumrendszerek, szöveges adatbázisok Internet: World-Wide Web Adattárházak és adatbányászat 26

27 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 27

28 Idıindexes és rendezett adatok: Szekvenciális minták, trendek Alkalmazási terület: szekvenciák, trendek, fejlıdésvizsgálat Trendek, idısorok, eltérések elemzése: függvényillesztés, regresszió, például y érték elırejelzése az x ismeretében, ha lineáris viszonyt tételezünk fel. Szekvenciális minták bányászata Minta például, hogy a kamera vásárlása után venni fogunk nagy kapacitású SD kártyát is Ismétlıdések, periodicitás keresése, kiszőrése Biológiai (gén-) szekvenciák vizsgálata (motívumkeresés) Melyek a biológiai jelentéssel bíró motívumok, egymás utáni motívumok Hasonlóságalapú összehasonlító elemzések Adatfolyamok bányászata potenciálisan végtelen adatfolyamok (rendezett adatok vagy idısorok) Adattárházak és adatbányászat 28

29 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 29

30 Struktúrák és hálózatok elemzése Gráfok adatbányászata Keressünk gyakori részgráfokat (például nagy molekulákban gyakori egyszerő összetevıket gyógyszerkutatás), keressünk gyakori részfákat XML dokumentumokban Hálózatok elemzése Közösségi hálók felépítése: aktorok (objektumok - csúcsok) és kapcsolatok (irányított, vagy közönséges élek) például derítsük fel az Adatbányászattal foglalkozó szerzık kapcsolati hálóját, vagy derítsük fel a terroristák hálózatát (ki kit ismer, ki kinek telefonált, kik mikor hol voltak együtt) Többszörös heterogén hálózatok vizsgálata Egy személy egyszerre többféle hálózatnak is tagja: barátok hálózata, rokoni hálózat, osztálytársak hálózata, telefonhívások hálózata A kapcsolatok (Links) értelmezésének, szemantikájánakbányászata Webbányászat A Weboldalak hálózat, rangsorolásis (a Google PageRank és HITS algoritmusai) Alkalmazások webközösségek felderítése, véleménybányászat. klikkelemzés, reklám Adattárházak és adatbányászat 30

31 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 31

32 A tudás értéke Minden kibányászott minta érdekes? Kimerítı kereséssel túl sok mintát kaphatunk Van, ami csak bizonyos helyre, idıre, dimenzióra jellemzı, vagyis nem elég általános Van, ami csak múló összefüggés, az aktuális adatokra véletlenül teljesül Próbáljuk mérni a tudás érdekességét és csak érdekes tudást bányásszunk ki az adatokból milyen tudás kell: leíró vagy elırejelzı milyen eseteket fed le, lehetıleg minél többet mennyire tipikus vagy újszerő a minta (esıben viszünk ernyıt: érdektelen, esıben levisszük a vízilovat sétálni: érdekes) mennyire pontos az összefüggés a lefedett esetekben mennyire idıszerő (mindenki vízilovat tart otthon) Adattárházak és adatbányászat 32

33 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 33

34 Adatbányászati alkalmazások Weboldalak elemzése: a weboldalak osztályozása témák szerint, fontosságuk szerint, spamoldalak felderítése, klaszterezése a PageRank és a HITS algoritmussal Közösségek felderítése (Collaborative analysis), ajánló rendszerek (milyen videó fog tetszeni azok alapján, amiket eddig néztünk) Objektumok beazonosítása (Entity resolution) Célzott marketing vásárlói kosár elemzésével Biológiai, orvosi adatelemzések: osztályozás, klaszterezés (microchip adatokon), fertızések terjedése, biológiai hálózatok, génszekvenciák elemzése Adatbányászat a szoftvertervezésben, tesztelésben Ingyenes és kereskedelmi adatbányászati eszközök (weka, RapidMiner, R, SAS, MS SQL-Server Analysis Manager, Oracle Data Mining Tools) Adattárházak és adatbányászat 34

35 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 35

36 Új irányok az adatbányászatban Adatbányászati algoritmusok hatékonysági javítása, skálázhatósága Párhuzamos, osztott adatok, adatfolyamok bányászata, inkrementális Nagyon nagy dimenziók kezelése Bizonytalanság, zajos, nem teljes adatok kezelése Kiegészítı összefüggések, megszorítások, szakértı háttértudás bevonása az adatbányászatba Minták értékelése, tudásintegráció Bioinformatika, közösségi hálózatok elemzése Alkalmazásfüggı, szakmaspecifikus adatbányászat Láthatalan adatbányászat (beágyazott rendszerekben, külöbözı modulok részeként) Adatbiztonság, adatvédelem, mint az adatbázis-kezelésben Adattárházak és adatbányászat 36

37 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 37

38 Az adatbányászat története dióhéjban 1989 IJCAI Workshop on Knowledge Discovery in Databases Knowledge Discovery in Databases (G. Piatetsky-Shapiro and W. Frawley, 1991) Workshops on Knowledge Discovery in Databases Advances in Knowledge Discovery and Data Mining (U. Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy, 1996) International Conferences on Knowledge Discovery in Databases and Data Mining (KDD 95-98) Journal of Data Mining and Knowledge Discovery (1997) ACM SIGKDD conferences since 1998 and SIGKDD Explorations Adatbányászati konferenciák PAKDD (1997), PKDD (1997), SIAM-Data Mining (2001), (IEEE) ICDM (2001), etc. ACM Transactions on KDD 2007 Adattárházak és adatbányászat 38

39 Adatbányászati konferenciák és folyóiratok KDD konferenciák ACM SIGKDD Int. Conf. on Knowledge Discovery in Databases and Data Mining (KDD) SIAM Data Mining Conf. (SDM) (IEEE) Int. Conf. on Data Mining (ICDM) Conf. on Principles and practices of Knowledge Discovery and Data Mining (PKDD) Pacific-Asia Conf. on Knowledge Discovery and Data Mining (PAKDD) Nagy konferenciák részeként: ACM SIGMOD VLDB (IEEE) ICDE WWW, SIGIR ICML, CVPR, NIPS Folyóiratok Data Mining and Knowledge Discovery (DAMI or DMKD) IEEE Trans. On Knowledge and Data Eng. (TKDE) KDD Explorations ACM Trans. on KDD Adattárházak és adatbányászat 39

40 Hol találunk cikkeket? ACM, DBLP, CiteSeer, Google Data mining and KDD (SIGKDD: CDROM) Conferences: ACM-SIGKDD, IEEE-ICDM, SIAM-DM, PKDD, PAKDD, etc. Journal: Data Mining and Knowledge Discovery, KDD Explorations, ACM TKDD Database systems (SIGMOD: ACM SIGMOD Anthology CD ROM) Conferences: ACM-SIGMOD, ACM-PODS, VLDB, IEEE-ICDE, EDBT, ICDT, DASFAA Journals: IEEE-TKDE, ACM-TODS/TOIS, JIIS, J. ACM, VLDB J., Info. Sys., etc. AI & Machine Learning Conferences: Machine learning (ML), AAAI, IJCAI, COLT (Learning Theory), CVPR, NIPS, etc. Journals: Machine Learning, Artificial Intelligence, Knowledge and Information Systems, IEEE-PAMI, etc. Web and IR Conferences: SIGIR, WWW, CIKM, etc. Journals: WWW: Internet and Web Information Systems, Statistics Conferences: Joint Stat. Meeting, etc. Journals: Annals of statistics, etc. Visualization Conference proceedings: CHI, ACM-SIGGraph, etc. Journals: IEEE Trans. visualization and computer graphics, etc. Adattárházak és adatbányászat 40

41 Néhány ajánlott könyv S. Chakrabarti. Mining the Web: Statistical Analysis of Hypertex and Semi-Structured Data. Morgan Kaufmann, 2002 R. O. Duda, P. E. Hart, and D. G. Stork, Pattern Classification, 2ed., Wiley-Interscience, 2000 T. Dasu and T. Johnson. Exploratory Data Mining and Data Cleaning. John Wiley & Sons, 2003 U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy. Advances in Knowledge Discovery and Data Mining. AAAI/MIT Press, 1996 U. Fayyad, G. Grinstein, and A. Wierse, Information Visualization in Data Mining and Knowledge Discovery, Morgan Kaufmann, 2001 J. Han and M. Kamber. Data Mining: Concepts and Techniques. Morgan Kaufmann, 2 nd ed., 2006 D. J. Hand, H. Mannila, and P. Smyth, Principles of Data Mining, MIT Press, 2001 T. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer-Verlag, 2001 B. Liu, Web Data Mining, Springer T. M. Mitchell, Machine Learning, McGraw Hill, 1997 G. Piatetsky-Shapiro and W. J. Frawley. Knowledge Discovery in Databases. AAAI/MIT Press, 1991 P.-N. Tan, M. Steinbach and V. Kumar, Introduction to Data Mining, Wiley, 2005 S. M. Weiss and N. Indurkhya, Predictive Data Mining, Morgan Kaufmann, 1998 I. H. Witten and E. Frank, Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations, Morgan Kaufmann, 2 nd ed Adattárházak és adatbányászat 41

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék Adatelemzés intelligens módszerekkel Hullám Gábor Adatelemzés hagyományos megközelítésben I. Megválaszolandó

Részletesebben

Tudásalapú információ integráció

Tudásalapú információ integráció Tudásalapú információ integráció (A Szemantikus Web megközelítés és a másik irány) Tanszéki értekezlet, 2008. május 14. 1 Miért van szükségünk ilyesmire? WWW: (Alkalmazások) Keresés a weben (pl. összehasonlítás

Részletesebben

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban Statisztikai eljárások a mintafelismerésben és a gépi tanulásban Varga Domonkos (I.évf. PhD hallgató) 2014 május A prezentáció felépítése 1) Alapfogalmak 2) A gépi tanulás, mintafelismerés alkalmazási

Részletesebben

A TANTÁRGY ADATLAPJA

A TANTÁRGY ADATLAPJA A TANTÁRGY ADATLAPJA 1. A képzési program adatai 1.1 Felsőoktatási intézmény Babeș Bolyai Tudományegyetem 1.2 Kar Matematika és Informatika Kar 1.3 Intézet Magyar Matematika és Informatika Intézet 1.4

Részletesebben

Adatbányászat az Oracle9i-ben. Fekete Zoltán vezető termékmenedzser Zoltan.Fekete@oracle.com

Adatbányászat az Oracle9i-ben. Fekete Zoltán vezető termékmenedzser Zoltan.Fekete@oracle.com Agenda Az Oracle9i adattárház tulajdonságai Adatbányászat az Oracle9i-ben DM, Personalization az Oracle9i-ben, architektúra Integrált adatbányászat az Oracle CRM-ben Szünet Perszonalizációs felhasználási

Részletesebben

Multimédiás adatbázisok

Multimédiás adatbázisok Multimédiás adatbázisok Multimédiás adatbázis kezelő Olyan adatbázis kezelő, mely támogatja multimédiás adatok (dokumentum, kép, hang, videó) tárolását, módosítását és visszakeresését Minimális elvárás

Részletesebben

A hierarchikus adatbázis struktúra jellemzői

A hierarchikus adatbázis struktúra jellemzői A hierarchikus adatbázis struktúra jellemzői Az első adatbázis-kezelő rendszerek a hierarchikus modellen alapultak. Ennek az volt a magyarázata, hogy az élet sok területén első közelítésben elég jól lehet

Részletesebben

Történet John Little (1970) (Management Science cikk)

Történet John Little (1970) (Management Science cikk) Információ menedzsment Szendrői Etelka Rendszer- és Szoftvertechnológia Tanszék szendroi@witch.pmmf.hu Vezetői információs rendszerek Döntéstámogató rendszerek (Decision Support Systems) Döntések információn

Részletesebben

Adatbányászat és Perszonalizáció az Oracle9i-ben

Adatbányászat és Perszonalizáció az Oracle9i-ben Adatbányászat és Perszonalizáció az Oracle9i-ben Oracle9i adatbányászat 2000. szeptember 6. Fekete Zoltán Palaczk Péter Agenda Oracle9i Database Teljes e-business Intelligence infrastruktúra Mi is az adatbányászat?

Részletesebben

Adatbányászati technikák (VISZM185) 2015 tavasz

Adatbányászati technikák (VISZM185) 2015 tavasz Adatbányászati technikák (VISZM185) 2015 tavasz Csima Judit BME, VIK, Számítástudományi és Információelméleti Tanszék 2015. február 11. Csima Judit Adatbányászati technikák (VISZM185) 2015 tavasz 1 / 27

Részletesebben

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben. Tartalom Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben. Előszó 1. Az adatbányászatról általában 19 1.1. Miért adatbányászat? 21 1.2. Technológia a rejtett információk

Részletesebben

Vezetői információs rendszerek

Vezetői információs rendszerek Vezetői információs rendszerek Kiadott anyag: Vállalat és információk Elekes Edit, 2015. E-mail: elekes.edit@eng.unideb.hu Anyagok: eng.unideb.hu/userdir/vezetoi_inf_rd 1 A vállalat, mint információs rendszer

Részletesebben

Big Data az adattárházban

Big Data az adattárházban Big Data az adattárházban A párbaj folytatódik? Néhány fontos Big Data projekt Cég Téma Adat Újfajta Mennyiség Saját adat? Típus Google Influenza Google I big I Előjelzés előjelzés Farecast Xoom Chicagoi

Részletesebben

Adatbányászat: Bevezetés. 1. fejezet. Tan, Steinbach, Kumar Bevezetés az adatbányászatba

Adatbányászat: Bevezetés. 1. fejezet. Tan, Steinbach, Kumar Bevezetés az adatbányászatba Adatbányászat: Bevezetés 1. fejezet Tan, Steinbach, Kumar Bevezetés az adatbányászatba előadás-fóliák fordította Ispány Márton Logók és támogatás A tananyag a TÁMOP-4.1.2-08/1/A-2009-0046 számú Kelet-magyarországi

Részletesebben

Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time)

Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time) Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time) (specializáció választás a 4. félévben, specializációra lépés feltétele: az egyik szigorlat

Részletesebben

Adatbázisrendszerek április 17.

Adatbázisrendszerek április 17. Adatbázisrendszerek Áttekintés az adattárházakról és az OLAP-ról 2018. április 17. Az adattárházak célja 2 A számítási kapacitások állandó növekedése és az analitikai eszközök és módszerek egyre összetettebbé

Részletesebben

Entity Resolution azonosságfeloldás

Entity Resolution azonosságfeloldás 1 Entity Resolution azonosságfeloldás Entity Resolution (ER) is the process of identifying groups of records that refer to the same real-world entity. rejtett, való világbeli entitásokhoz köthető megfigyelések

Részletesebben

Neurális hálózatok bemutató

Neurális hálózatok bemutató Neurális hálózatok bemutató Füvesi Viktor Miskolci Egyetem Alkalmazott Földtudományi Kutatóintézet Miért? Vannak feladatok amelyeket az agy gyorsabban hajt végre mint a konvencionális számítógépek. Pl.:

Részletesebben

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter

Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter Bevezető az Oracle9i adattárházas újdonságaihoz Elemzési és vezetői információs igények 80:20 az adatgyűjtés javára! Adattárházak kínálta

Részletesebben

Mit mond a XXI. század emberének a statisztika?

Mit mond a XXI. század emberének a statisztika? Mit mond a XXI. század emberének a statisztika? Rudas Tamás Magyar Tudományos Akadémia Társadalomtudományi Kutatóközpont Eötvös Loránd Tudományegyetem Statisztika Tanszék Nehéz a jövőbe látni Változik

Részletesebben

ADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu

ADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu ADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu Számonkérés 2 Papíros (90 perces) zh az utolsó gyakorlaton. Segédanyag nem használható Tematika 1. félév 3 Óra Dátum Gyakorlat 1. 2010.09.28.

Részletesebben

Gáspár Bencéné Vér Katalin *

Gáspár Bencéné Vér Katalin * 109 Gáspár Bencéné Vér Katalin * ADATBÁNYÁSZAT A GAZDASÁGI ÉLETBEN Az adatbányászat egy döntéstámogatási módszer, olyan üzleti intelligencia megoldás, amely új üzleti lehetõségeket segít megtalálni és

Részletesebben

Mesterséges Intelligencia Elektronikus Almanach. Konzorciumi partnerek

Mesterséges Intelligencia Elektronikus Almanach. Konzorciumi partnerek Mesterséges Intelligencia Elektronikus Almanach Konzorciumi partnerek 1 Konzorcium Budpesti Mőszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Méréstechnika és Információs Rendszerek

Részletesebben

2009.04.29. 2009. április 24. INFO Savaria 2009 2. 2009. április 24. INFO Savaria 2009 4. 2009. április 24. INFO Savaria 2009 3

2009.04.29. 2009. április 24. INFO Savaria 2009 2. 2009. április 24. INFO Savaria 2009 4. 2009. április 24. INFO Savaria 2009 3 Négy adatbázis-kezelı rendszer összehasonlítása webes környezetben Sterbinszky Nóra snorav@gmail.com Áttekintés Növekvı igény hatékony adatbázis- kezelıkre a világhálón Hogyan mérhetı ezek teljesítménye

Részletesebben

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017. Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017. Vizuális feldolgozórendszerek feladatai Mesterséges intelligencia és idegtudomány Mesterséges intelligencia és idegtudomány Párhuzamos problémák

Részletesebben

Gépi tanulás a gyakorlatban. Bevezetés

Gépi tanulás a gyakorlatban. Bevezetés Gépi tanulás a gyakorlatban Bevezetés Motiváció Nagyon gyakran találkozunk gépi tanuló alkalmazásokkal Spam detekció Karakter felismerés Fotó címkézés Szociális háló elemzés Piaci szegmentáció analízis

Részletesebben

Szemantikus technológiák területei. Rácz Gábor,

Szemantikus technológiák területei. Rácz Gábor, Szemantikus technológiák területei Rácz Gábor, 2011.10.14. Alkalmazások Cégek közötti együttműködés (Searchy) Telekommunikáció Mobiltelefonos tartalomszolgáltatás (KTF) DBPedia Mobile OntoWiki Mobile Kockázatkezelés

Részletesebben

Hogyan lesz adatbányából aranybánya?

Hogyan lesz adatbányából aranybánya? Hogyan lesz adatbányából aranybánya? Szolgáltatások kapacitástervezése a Budapest Banknál Németh Balázs Budapest Bank Fehér Péter - Corvinno Visontai Balázs - KFKI Tartalom 1. Szolgáltatás életciklus 2.

Részletesebben

Teljesen elosztott adatbányászat alprojekt

Teljesen elosztott adatbányászat alprojekt Teljesen elosztott adatbányászat alprojekt Hegedűs István, Ormándi Róbert, Jelasity Márk Big Data jelenség Big Data jelenség Exponenciális növekedés a(z): okos eszközök használatában, és a szenzor- és

Részletesebben

Big Data: a több adatnál is több

Big Data: a több adatnál is több Big Data: a több adatnál is több Sidló Csaba István MTA Számítástechnikai és Automatizálási Kutatóintézet Üzleti Intelligencia és Adattárházak Csoport sidlo@sztaki.mta.hu http://dms.sztaki.hu CIO Hungary

Részletesebben

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből 2010/2011 tavaszi félév SZTE Eötvös Loránd Kollégium 1. Dombi József: Fuzzy elmélet és alkalmazásai 2011. március 3. 19:00 2. Móra György: Információkinyerés természetes nyelvű szövegekből 2011. március

Részletesebben

Retro adatbányászat. Kovács Gyula Andego Tanácsadó Kft.

Retro adatbányászat. Kovács Gyula Andego Tanácsadó Kft. Retro adatbányászat Kovács Gyula Andego Tanácsadó Kft. Adattárház Fórum 2012 Magunkról 2010-ben alapították magánszemélyek (az alapítók több mint egy évtizedes BI tapasztalatokkal rendelkeznek) Andego

Részletesebben

Informatikai alapismeretek Földtudományi BSC számára

Informatikai alapismeretek Földtudományi BSC számára Informatikai alapismeretek Földtudományi BSC számára 2010-2011 Őszi félév Heizlerné Bakonyi Viktória HBV@ludens.elte.hu Titkosítás,hitelesítés Szimmetrikus DES 56 bites kulcs (kb. 1000 év) felcserél, helyettesít

Részletesebben

Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time)

Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time) Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time) (A képzés közös része, szakirányválasztás a 3. félév végén) Tárgykód Félév Tárgynév Tárgy

Részletesebben

Geoinformatikai rendszerek

Geoinformatikai rendszerek Geoinformatikai rendszerek Térinfomatika Földrajzi információs rendszerek (F.I.R. G.I.S.) Térinformatika 1. a térinformatika a térbeli információk elméletével és feldolgozásuk gyakorlati kérdéseivel foglalkozó

Részletesebben

Célkitűzések Az Oracle10 g felépítésének, használatának alapszíntű megismerése

Célkitűzések Az Oracle10 g felépítésének, használatának alapszíntű megismerése BEVEZETÉS Célkitűzések Az Oracle10g felépítésének, használatának alapszíntű megismerése A relációs adatbázis-kezelés elméleti és gyakorlati vonatkozásainak áttekintése Az SQL, PL/SQL nyelvek használatának

Részletesebben

FİBB PONTOK PIACKUTATÁS (MARKETINGKUTATÁS) Kutatási terv október 20.

FİBB PONTOK PIACKUTATÁS (MARKETINGKUTATÁS) Kutatási terv október 20. FİBB PONTOK PIACKUTATÁS (MARKETINGKUTATÁS) 2010. október 20. A kutatási terv fogalmának, a különbözı kutatási módszerek osztályozása, a feltáró és a következtetı kutatási módszerek közötti különbségtétel

Részletesebben

Dr. Sasvári Péter Egyetemi docens

Dr. Sasvári Péter Egyetemi docens A magyarországi vállalkozások Üzleti Intelligencia használatának vizsgálata Dr. Sasvári Péter Egyetemi docens II. IRI Társadalomtudományi Konferencia, 2014. április 25-26. Nové Zámky (Érsekújvár) Gymnázium

Részletesebben

Információs Rendszerek Szakirány

Információs Rendszerek Szakirány Információs Rendszerek Szakirány Laki Sándor Kommunikációs Hálózatok Kutatócsoport ELTE IK - Információs Rendszerek Tanszék lakis@elte.hu http://lakis.web.elte.hu Információs Rendszerek szakirány Közös

Részletesebben

Gyors sikerek adatbányászati módszerekkel

Gyors sikerek adatbányászati módszerekkel Gyors sikerek adatbányászati módszerekkel Kezdő adatbányászati workshop Petrócziné Huczman Zsuzsanna 2015.10.13. Bemutatkozás BME, műszaki informatika szak, adatbányászati szakirány Citibank Data Explorer

Részletesebben

Gazdasági informatika alapjai

Gazdasági informatika alapjai PSZK Mesterképzési és Távoktatási Központ / H-1149 Budapest, Buzogány utca 10-12. / 1426 Budapest Pf.:35 II. évfolyam Név: Neptun kód: Kurzus: Tanár neve: HÁZI DOLGOZAT 2. Gazdasági informatika alapjai

Részletesebben

Az üzleti intelligencia megoldások helye és szerepe a magyar vállalatok életében. Dr. Kovács László Dr. Sasvári Péter Miskolci Egyetem

Az üzleti intelligencia megoldások helye és szerepe a magyar vállalatok életében. Dr. Kovács László Dr. Sasvári Péter Miskolci Egyetem Az üzleti intelligencia megoldások helye és szerepe a magyar vállalatok életében Dr. Kovács László Dr. Sasvári Péter Miskolci Egyetem 1 Mit jelent a BI? Mi jellemzi a BI értelmezésének fejlődését, az értelmezési

Részletesebben

Mérnök informatikus mesterszak mintatanterve (GE-MI) nappali tagozat/ MSc in, full time Érvényes: 2011/2012. tanév 1. félévétől, felmenő rendszerben

Mérnök informatikus mesterszak mintatanterve (GE-MI) nappali tagozat/ MSc in, full time Érvényes: 2011/2012. tanév 1. félévétől, felmenő rendszerben Mérnök informatikus mesterszak mintatanterve (GE-MI) nappali tagozat/ MSc in, full time Érvényes: 2011/2012. tanév 1. félévétől, felmenő rendszerben Tantárgy Tárgykód I. félév ősz II. félév tavasz Algoritmusok

Részletesebben

Modellkiválasztás és struktúrák tanulása

Modellkiválasztás és struktúrák tanulása Modellkiválasztás és struktúrák tanulása Szervezőelvek keresése Az unsupervised learning egyik fő célja Optimális reprezentációk Magyarázatok Predikciók Az emberi tanulás alapja Általános strukturális

Részletesebben

Projektvezetői döntések támogatása webbányászattal

Projektvezetői döntések támogatása webbányászattal NETWORKSHOP 2008 2008. március 17-19. Dunaújváros, Dunaújvárosi Főiskola Projektvezetői döntések támogatása webbányászattal Bóta László Ph.D. hallgató (BME) Eszterházy Károly Főiskola, Eger BI (Business

Részletesebben

Követelmények Bevezetés. Adatbányászat. Szegedi Tudományegyetem. Adatbányászat

Követelmények Bevezetés. Adatbányászat. Szegedi Tudományegyetem. Adatbányászat Szegedi Tudományegyetem gyakorlat Gyakorlaton elérhető: max. 50 pont 2 db ZH (okt. 7/14. és nov. 25.): 25-25 pont (min. 8 pont/zh) Javító ZH: félév végén az egész éves gyakorlati anyagból a minimális összpontszámot

Részletesebben

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 0. A Wolfram Alpha tudásgép. https://www.wolframalpha.

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 0. A Wolfram Alpha tudásgép. https://www.wolframalpha. Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 0. A Wolfram Alpha tudásgép https://www.wolframalpha.com/ Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás

Részletesebben

A TANTÁRGY ADATLAPJA

A TANTÁRGY ADATLAPJA A TANTÁRGY ADATLAPJA 1. A képzési program adatai 1.1 Felsőoktatási intézmény Babeș Bolyai Tudományegyetem 1.2 Kar Matematika és Informatika Kar 1.3 Intézet Magyar Matematika és Informatika Intézet 1.4

Részletesebben

Microsoft SQL Server telepítése

Microsoft SQL Server telepítése Microsoft SQL Server telepítése Az SQL Server a Microsoft adatbázis kiszolgáló megoldása Windows operációs rendszerekre. Az SQL Server 1.0 verziója 1989-ben jelent meg, amelyet tizenegy további verzió

Részletesebben

A TANTÁRGY ADATLAPJA

A TANTÁRGY ADATLAPJA A TANTÁRGY ADATLAPJA 1. A képzési program adatai 1.1 Felsőoktatási intézmény Babeș Bolyai Tudományegyetem 1.2 Kar Matematika és Informatika Kar 1.3 Intézet Magyar Matematika és Informatika Intézet 1.4

Részletesebben

A Jövő Internet Nemzeti Kutatási Program bemutatása

A Jövő Internet Nemzeti Kutatási Program bemutatása A Jövő Internet Nemzeti Kutatási Program bemutatása Dr. Bakonyi Péter és Dr. Sallai Gyula Jövő Internet Kutatáskoordinációs Központ Budapesti Műszaki és Gazdaságtudományi Egyetem Budapest, 2013. június

Részletesebben

VIR alapfogalmai. Előadásvázlat. dr. Kovács László

VIR alapfogalmai. Előadásvázlat. dr. Kovács László VIR alapfogalmai Előadásvázlat dr. Kovács László Információ szerepe Információ-éhes világban élünk Mi is az információ? - újszerű ismeret - jelentés Hogyan mérhető az információ? - statisztikai - szintaktikai

Részletesebben

Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com

Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com Adatelemzés SAS Enterprise Guide használatával Soltész Gábor solteszgabee[at]gmail.com Tartalom SAS Enterprise Guide bemutatása Kezelőfelület Adatbeolvasás Szűrés, rendezés Új változó létrehozása Elemzések

Részletesebben

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése 1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Természetes nyelv feldolgozás 2 Tudásalapú információ-kereső rendszerek

Részletesebben

VÁLLALATI INFORMÁCIÓS RENDSZEREK. Debrenti Attila Sándor

VÁLLALATI INFORMÁCIÓS RENDSZEREK. Debrenti Attila Sándor VÁLLALATI INFORMÁCIÓS RENDSZEREK Debrenti Attila Sándor Információs rendszer 2 Információs rendszer: az adatok megszerzésére, tárolására és a tárolt adatok különböző szempontok szerinti feldolgozására,

Részletesebben

za TANTÁRGY ADATLAPJA

za TANTÁRGY ADATLAPJA za TANTÁRGY ADATLAPJA 1. A képzési program adatai 1.1 Felsőoktatási intézmény Babeș Bolyai Tudományegyetem 1.2 Kar Matematika és Informatika Kar 1.3 Intézet Magyar Matematika és Informatika Intézet 1.4

Részletesebben

Adatbányászat és Perszonalizáció architektúra

Adatbányászat és Perszonalizáció architektúra Adatbányászat és Perszonalizáció architektúra Oracle9i Teljes e-üzleti intelligencia infrastruktúra Oracle9i Database Integrált üzleti intelligencia szerver Data Warehouse ETL OLAP Data Mining M e t a

Részletesebben

Virtuális Obszervatórium. Gombos Gergő

Virtuális Obszervatórium. Gombos Gergő Virtuális Obszervatórium Gombos Gergő Áttekintés Motiváció, probléma felvetés Megoldások Virtuális obszervatóriumok NMVO Twitter VO Gombos Gergő Virtuális Obszervatórium 2 Motiváció Tudományos módszer

Részletesebben

BIG DATA ELEMZÉSEK LEHETŐSÉGEI

BIG DATA ELEMZÉSEK LEHETŐSÉGEI BIG DATA ELEMZÉSEK LEHETŐSÉGEI A KÖRNYEZETVÉDELMI MODELLEZÉSBEN Dr. Torma A. 2015.11.13. 2015/11/13 Dr. TORMA A. >> Széchenyi István Egyetem 2 Tartalom 1. A Big Data fogalma 2. Pár érdekes adat a Big Data

Részletesebben

Intelligens adatelemzés

Intelligens adatelemzés Antal Péter, Antos András, Horváth Gábor, Hullám Gábor, Kocsis Imre, Marx Péter, Millinghoffer András, Pataricza András, Salánki Ágnes Intelligens adatelemzés Szerkesztette: Antal Péter A jegyzetben az

Részletesebben

Vezetői információs rendszerek

Vezetői információs rendszerek Vezetői információs rendszerek 7. előadás: Stratégiai menedzsment és informatikai támogatás 2. Elekes Edit, 2015. E-mail: elekes.edit@eng.unideb.hu Anyagok: eng.unideb.hu/userdir/elekes Edit/Vezetoi_inf_rd

Részletesebben

Mesterséges Intelligencia Elektronikus Almanach. MI Almanach projektismertetı rendezvény április 29., BME, I. ép., IB.017., 9h-12h.

Mesterséges Intelligencia Elektronikus Almanach. MI Almanach projektismertetı rendezvény április 29., BME, I. ép., IB.017., 9h-12h. Mesterséges Intelligencia Elektronikus Almanach Neurális hálózatokh 1 BME 1990: Miért neurális hálók? - az érdeklıdésünk terébe kerül a neurális hálózatok témakör - fıbb okok: - adaptív rendszerek - felismerési

Részletesebben

Adatbányászat SAS Enterprise Miner

Adatbányászat SAS Enterprise Miner Adatbányászat SAS Enterprise Miner Hajas Csilla ELTE SAS gyakorlataihoz segédlet. Forrásként (a webrıl letöltve) felhasználtam Kiss Attila, Lukács András, Sidló Csaba és Kósa Balázs diasorozatait is, lásd

Részletesebben

Takács Árpád K+F irányok

Takács Árpád K+F irányok Takács Árpád K+F irányok 2016. 06. 09. arpad.takacs@adasworks.com A jövőre tervezünk Az AdasWorks mesterséges intelligencia alapú szoftverterfejlesztéssel és teljes önvezető megoldásokkal forradalmasítja

Részletesebben

A PhysioBank adatmegjelenítő szoftvereinek hatékonysága

A PhysioBank adatmegjelenítő szoftvereinek hatékonysága A PhysioBank adatmegjelenítő szoftvereinek hatékonysága Kaczur Sándor kaczur@gdf.hu GDF Informatikai Intézet 2012. november 14. Célok, kutatási terv Szabályos EKG-felvétel: P, Q, R, S, T csúcs Anatómiai

Részletesebben

TSIMMIS egy lekérdezés centrikus megközelítés. TSIMMIS célok, technikák, megoldások TSIMMIS korlátai További lehetségek

TSIMMIS egy lekérdezés centrikus megközelítés. TSIMMIS célok, technikák, megoldások TSIMMIS korlátai További lehetségek TSIMMIS egy lekérdezés centrikus megközelítés TSIMMIS célok, technikák, megoldások TSIMMIS korlátai További lehetségek 1 Információk heterogén információs forrásokban érhetk el WWW Társalgás Jegyzet papírok

Részletesebben

D é n e s T a m á s matematikus-kriptográfus

D é n e s T a m á s matematikus-kriptográfus D é n e s T a m á s matematikus-kriptográfus e-mail: tdenest@freemail.hu Gondolatok a társadalomkutatás módszertanáról és oktatásáról (Társadalom-holográfia) 1. Elméleti elızmények A társadalomkutatás

Részletesebben

Gépi tanulás a gyakorlatban SVM

Gépi tanulás a gyakorlatban SVM Gépi tanulás a gyakorlatban SVM Klasszifikáció Feladat: előre meghatározott csoportok elkülönítése egymástól Osztályokat elkülönítő felület Osztályokhoz rendelt döntési függvények Klasszifikáció Feladat:

Részletesebben

Az információs rendszerek adatai

Az információs rendszerek adatai Az információs rendszerek adatai Nagy mennyiségű adat Tárolás Karbantartás Visszakeresés, feldolgozás Adatbázis 2 Az adatbázis fogalma Az adatbázis együtt tárolt, egymással kapcsolatban levő adatok rendszere.

Részletesebben

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft. Tudásmodellezés Kereskedelmi Alkalmazásokban Dezsényi Csaba Ovitas Magyarország kft. Tudásmenedzsment Adat -> Információ -> Tudás Intézményi tudásvagyon hatékony kezelése az üzleti célok megvalósításának

Részletesebben

Az egységes tartalomkezelés üzleti előnyei

Az egységes tartalomkezelés üzleti előnyei CNW Rendszerintegrációs Zrt. Mészáros Tamás értékesítési igazgató Az egységes tartalomkezelés üzleti előnyei NetRegisterX - Webes dokumentumkezelési megoldások A-Z-ig 1 Az éves papírfelhasználás mértéke

Részletesebben

GEOSTATISZTIKA II. Geográfus MSc szak. 2019/2020 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

GEOSTATISZTIKA II. Geográfus MSc szak. 2019/2020 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ GEOSTATISZTIKA II. Geográfus MSc szak 2019/2020 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ Miskolci Egyetem Műszaki Földtudományi Kar Geofizikai és Térinformatikai Intézet A tantárgy adatlapja Tantárgy neve:

Részletesebben

Gáspár Bencéné Vér Katalin * AZ ÜZLETI INTELLIGENCIA RENDSZEREINEK KIALAKULÁSÁRÓL

Gáspár Bencéné Vér Katalin * AZ ÜZLETI INTELLIGENCIA RENDSZEREINEK KIALAKULÁSÁRÓL 123 Gáspár Bencéné Vér Katalin * AZ ÜZLETI INTELLIGENCIA RENDSZEREINEK KIALAKULÁSÁRÓL Az igazi szûk keresztmetszet nem technológiai, nem pénzügyi, de még csak nem is információs szûkösség. A kényszertényezõ

Részletesebben

Az adatbázisrendszerek világa

Az adatbázisrendszerek világa Az adatbázisrendszerek világa Tankönyv: Ullman-Widom: Adatbázisrendszerek Alapvetés Második, átdolgozott kiadás, Panem, 2009 1.1. Az adatbázisrendszerek fejlődése 1.2. Az adatbázis-kezelő rendszerek áttekintése

Részletesebben

A szak specializációi

A szak specializációi A szak specializációi Specializációk A specializációválasztás során a hallgatónak preferenciasorrendet kell megjelölnie, legalább két specializáció megadásával. A specializációkra történő besorolás a hallgatók

Részletesebben

1. elıadás. Információelmélet Információ technológia Információ menedzsment

1. elıadás. Információelmélet Információ technológia Információ menedzsment http://vigzoltan.hu 1. elıadás A számítógépes információ rendszerk tudománya, amely tartalmazza az alábbiakat: Elméleti összefüggések Szemlélet Módszertant a tervezéshez, fejlesztéshez üzemeltetéshez Tartalmazza

Részletesebben

ADATBÁZIS-KEZELÉS. Adatbázis-kezelő rendszerek

ADATBÁZIS-KEZELÉS. Adatbázis-kezelő rendszerek ADATBÁZIS-KEZELÉS Adatbázis-kezelő rendszerek Adat (Data) Észlelhető, felfogható ismeret Jelsorozat Tény, közlés Valakinek vagy valaminek a jellemzője Adatbázis (Data Base, DB) Hosszú ideig évekig meglévő

Részletesebben

Nagyméretű adathalmazok kezelése (BMEVISZM144) Reinhardt Gábor április 5.

Nagyméretű adathalmazok kezelése (BMEVISZM144) Reinhardt Gábor április 5. Asszociációs szabályok Budapesti Műszaki- és Gazdaságtudományi Egyetem 2012. április 5. Tartalom 1 2 3 4 5 6 7 ismétlés A feladat Gyakran együtt vásárolt termékek meghatározása Tanultunk rá hatékony algoritmusokat

Részletesebben

A bioinformatika oldaláról a Human Protein Szervezet (Human Protein Organization HUPO) alelnöke bemutatta, hogy az ő szakterületükön.

A bioinformatika oldaláról a Human Protein Szervezet (Human Protein Organization HUPO) alelnöke bemutatta, hogy az ő szakterületükön. 1025 Folyóiratszemle Sedransk, N. Young, L. J. Kelner, K. L. Moffitt, R. A. Thakar, A. Raddick, J. Ungvarsky, E. J. Carlson, R. W. Apweiler, R. Cox, L. H. Nolan, D. Soper, K. Spiegelman, C.: Legyenek nyilvánosak

Részletesebben

3D számítógépes geometria és alakzatrekonstrukció

3D számítógépes geometria és alakzatrekonstrukció 3D számítógépes geometria és alakzatrekonstrukció 14. Digitális Alakzatrekonstrukció - Bevezetés http://cg.iit.bme.hu/portal/node/312 https://www.vik.bme.hu/kepzes/targyak/viiima01 Dr. Várady Tamás, Dr.

Részletesebben

PROGRAMTERVEZŐ INFORMATIKUS ALAPKÉPZÉSI SZAK

PROGRAMTERVEZŐ INFORMATIKUS ALAPKÉPZÉSI SZAK PROGRAMTERVEZŐ INFORMATIKUS ALAPKÉPZÉSI SZAK 1. Az alapképzési szak megnevezése: programtervező informatikus (Computer Science) 2. Az alapképzési szakon szerezhető végzettségi szint és a szakképzettség

Részletesebben

PROJEKTVEZETŐI DÖNTÉSEK TÁMOGATÁSA WEBBÁNYÁSZATTAL

PROJEKTVEZETŐI DÖNTÉSEK TÁMOGATÁSA WEBBÁNYÁSZATTAL PROJEKTVEZETŐI DÖNTÉSEK TÁMOGATÁSA WEBBÁNYÁSZATTAL Bóta László, e-mail: botal@ektf.hu Eszterházy Károly Főiskola Adatbányászat, a webbányászat alapja A jól működő projektek döntés-előkészítési és ellenőrzési

Részletesebben

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31. Regresszió Csorba János Nagyméretű adathalmazok kezelése 2010. március 31. A feladat X magyarázó attribútumok halmaza Y magyarázandó attribútumok) Kérdés: f : X -> Y a kapcsolat pár tanítópontban ismert

Részletesebben

Pannon Egyetem Vegyészmérnöki és Anyagtudományok Doktori Iskola

Pannon Egyetem Vegyészmérnöki és Anyagtudományok Doktori Iskola Pannon Egyetem Vegyészmérnöki és Anyagtudományok Doktori Iskola Doktori (Ph.D.) értekezés tézisei Számítási intelligencia alapú regressziós technikák és Készítette Kenesei Tamás Péter Témavezető: Dr. habil.

Részletesebben

Adatbányászat: Bevezetés. 1. fejezet. Tan, Steinbach, Kumar Bevezetés az adatbányászatba

Adatbányászat: Bevezetés. 1. fejezet. Tan, Steinbach, Kumar Bevezetés az adatbányászatba Adatbányászat: Bevezetés 1. fejezet Tan, Steinbach, Kumar Bevezetés az adatbányászatba előadás-fóliák fordította Ispány Márton Mi az adatbányászat? Bár hosszú évek óta alkalmazzuk még mindig nincs egyértelmű

Részletesebben

TANTÁRGYI ÚTMUTATÓ. Alkalmazott számítástechnika. tanulmányokhoz

TANTÁRGYI ÚTMUTATÓ. Alkalmazott számítástechnika. tanulmányokhoz 2. évfolyam szakirány BA TANTÁRGYI ÚTMUTATÓ Alkalmazott számítástechnika tanulmányokhoz TÁVOKTATÁS Tanév (2014/2015) 1. félév A KURZUS ALAPADATAI Tárgy megnevezése: Alkalmazott Számítástechnika Tanszék:

Részletesebben

Tisztán kivehetı tendencia: kommunikációs hálózatok egyre bonyolultabbakká válnak Hálózat bonyolultsága

Tisztán kivehetı tendencia: kommunikációs hálózatok egyre bonyolultabbakká válnak Hálózat bonyolultsága @ Budapest University of Technology and Economics Nagy hálózatok evolúciója Gulyás András, Heszberger Zalán High Speed Networks Laboratory Internet trendek Tisztán kivehetı tendencia: kommunikációs hálózatok

Részletesebben

Döntéstámogatás terepi gyakorlatokon

Döntéstámogatás terepi gyakorlatokon Döntéstámogatás terepi gyakorlatokon Forczek Erzsébet 1 Karsai János 1 - Berke József 2 1 Szegedi Tudományegyetem, Általános Orvostudományi Kar Orvosi Informatikai Intézet, 6720 Szeged, Korányi fasor 9.

Részletesebben

Számítógépes döntéstámogatás. Bevezetés és tematika

Számítógépes döntéstámogatás. Bevezetés és tematika SZDT-01 p. 1/18 Számítógépes döntéstámogatás Bevezetés és tematika Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Előadás SZDT-01 p. 2/18 SZDT-01

Részletesebben

{simplecaddy code=1004}

{simplecaddy code=1004} {simplecaddy code=1004} Könyvünk az adatbányászat tevékenységének lépéseit részletesen bemutatva kívánja megismertetni az olvasót, azzal hogy milyen jellegű gazdasági, mérnöki, illetve tudományos problémák

Részletesebben

Kompetenciák fejlesztése a pedagógusképzésben. IKT kompetenciák. Farkas András f_andras@bdf.hu

Kompetenciák fejlesztése a pedagógusképzésben. IKT kompetenciák. Farkas András f_andras@bdf.hu Kompetenciák fejlesztése a pedagógusképzésben IKT kompetenciák Farkas András f_andras@bdf.hu A tanítás holisztikus folyamat, összekapcsolja a nézeteket, a tantárgyakat egymással és a tanulók személyes

Részletesebben

Takács Gábor mérnök informatikus, okl. mérnöktanár

Takács Gábor mérnök informatikus, okl. mérnöktanár Takács Gábor mérnök informatikus, okl. mérnöktanár takacsg@sze.hu http://rs1.sze.hu/~takacsg/ Big Data Definition Big Data is data that can t be stored or analyzed using traditional tools. Információ tartalom,

Részletesebben

Üzleti intelligencia skálázható architektúrákon

Üzleti intelligencia skálázható architektúrákon Üzleti intelligencia skálázható architektúrákon Doktori értekezés tézisek Sidló Csaba István Témavezető: Lukács András Ph.D. Eötvös Loránd Tudományegyetem Informatikai Kar Információs Rendszerek Tanszék

Részletesebben

Micskei Zoltán Strausz György. Méréstechnika és Információs Rendszerek Tanszék.

Micskei Zoltán Strausz György. Méréstechnika és Információs Rendszerek Tanszék. Micskei Zoltán Strausz György Méréstechnika és Információs Rendszerek Tanszék https://www.mit.bme.hu/oktatas/targyak/vimiac04 1 Hogyan építsünk információ gazdag megoldásokat? Információ/adat integráció

Részletesebben

A webanalitika változó világa 4 felvonásban

A webanalitika változó világa 4 felvonásban A webanalitika változó világa 4 felvonásban Arató Bence, BI Consulting Email: arato@bi.hu, Twitter: @aratob Traffic Meetup, 2013.02.06 1 Bemutatkozás 15 éves szakmai tapasztalat az üzleti intelligencia

Részletesebben

- Adat, információ, tudás definíciói, összefüggéseik reprezentációtípusok Részletesebben a téma az AI alapjai című tárgyban

- Adat, információ, tudás definíciói, összefüggéseik reprezentációtípusok Részletesebben a téma az AI alapjai című tárgyban I. Intelligens tervezőrendszerek - Adat, információ, tudás definíciói, összefüggéseik reprezentációtípusok Részletesebben a téma az AI alapjai című tárgyban Adat = struktúrálatlan tények, amelyek tárolhatók,

Részletesebben

Az információs rendszerek adatai

Az információs rendszerek adatai Az információs rendszerek adatai Nagy mennyiségű adat Tárolás Karbantartás Visszakeresés, feldolgozás Adatbázis 2 Az adatbázis fogalma Az adatbázis együtt tárolt, egymással kapcsolatban levő adatok rendszere.

Részletesebben

A szemantikus világháló oktatása

A szemantikus világháló oktatása A szemantikus világháló oktatása Szeredi Péter Lukácsy Gergely Budapesti Műszaki és Gazdaságtudományi Egyetem Számítástudományi és Információelméleti Tanszék ➀ A szemantikus világháló... c. tárgy ➁ A tananyag

Részletesebben

Adatbányászat. Gyakori elemhalmazok Asszociációs és döntési szabályok. Szegedi Tudományegyetem. Vásárlói kosarak Gyakori elemhalmazok FP-growth

Adatbányászat. Gyakori elemhalmazok Asszociációs és döntési szabályok. Szegedi Tudományegyetem. Vásárlói kosarak Gyakori elemhalmazok FP-growth Asszociációs és döntési szabályok Szegedi Tudományegyetem Mire megyünk a gyakori elemhalmazokkal? A különféle adatbázisokban gyakran együttesen előforduló jellemzők ismerete hasznos lehet Mit kezd vele

Részletesebben

Gépi tanulás és Mintafelismerés

Gépi tanulás és Mintafelismerés Gépi tanulás és Mintafelismerés jegyzet Csató Lehel Matematika-Informatika Tanszék BabesBolyai Tudományegyetem, Kolozsvár 2007 Aug. 20 2 1. fejezet Bevezet A mesterséges intelligencia azon módszereit,

Részletesebben