Adatbányászat. Data Mining: Concepts and Techniques (3 rd ed.)
|
|
- Gergely Fazekas
- 8 évvel ezelőtt
- Látták:
Átírás
1 Adatbányászat Data Mining: Concepts and Techniques (3 rd ed.) Jiawei Han, Micheline Kamber, and Jian Pei University of Illinois at Urbana-Champaign & Simon Fraser University 2009 Han, Kamber & Pei. All rights reserved. Adattárházak és adatbányászat 1
2 Mirıl szól a kurzus? Bevezetés az adattárházak és adatbányászat technológiákba Bevezetés Ismerjük meg az adatainkat! Az adatok elıfeldolgozása (Data Preprocessing) Bevezetés az adattárházak és OLAP technológiákba (Data Warehouse and OLAP Technology) Adatkockák használata (Data Cube Technology ) Gyakori minták és asszociációk keresése (Mining Frequent Patterns & Association) Osztályozás (Classification) Klaszterezés (Cluster Analysis) Adattárházak és adatbányászat 2
3 A könyvben olvasható alkalmazási területek, haladó témák Adatfolyamok, idısorok, szekvenciák adatbányászata Gráfok, közösségi hálók, multirelációk adatbányászata Objektumok, téridı-adatok, multimedia objektumok, szövegek, weben található információ adatbányászata Alkalmazások és aktuális irányzatok az adatbányászatban Üzleti adatok bányászata Biológiai adatok bányászata Vizuális adatbányászat (képek, videók) Adatvédelem-ırzı adatbányászat Adattárházak és adatbányászat 3
4 A könyv szerzıjének oldala: Adattárházak és adatbányászat 4
5 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 5
6 Miért kell adatbányászat? Adatrobbanás zajlik: terabájtokról áttérünk a petabájtokra Nagy adatgyőjtemények keletkeznek és érhetık el Automatikus adatgyőjtı mérıeszközök, adatbázisrendszerek, Web, közösségi hálók, számítógépes ügyfélszolgálatok Nagy mennyiségő nyers adat keletkezik a következı területeken Üzleti élet: Web, e-kereskedelem, pénzügyi tranzakciók, tızsde Tudomány: távérzékelı berendezések, bioinformatika, tudományos szimulációk Közösségi és mindennapos élet: Facebook, hírek, digitális kamerák, YouTube Ellep bennünket a rengeteg adat, bár mi valójában inkább tudásra vágyunk! A szükség szüli az új technológiát: Az adatbányászat a nagy mennyiségő adatok automatikus elemzése Adattárházak és adatbányászat 6
7 A tudomány fejlıdése 1600 elıtt, empirikus (tapasztaláson alapuló) tudomány , elméleti tudomány Minden terület kifejlesztette a saját elméleti megalapozását. Az elméleti modellek kísérletezésre ösztönöznek, illetve általános érvényő tudást fogalmaznak meg , számítógép-tudomány A legtöbb terület egy számítógépes részterületet is kifejlesztett (kísérleti, elméleti, számítógépes fizika vagy empirikus, elméleti nyelvészet, illetve formális nyelvek.) A számítógép-tudományt a szimulációk iránti igény hozta létre, mivel sok esetben a bonyolult matematikai modelleknek nincs zárt formulával megadható megoldása. 1990, adattudomány A tudományos eszközök, szimulációk adatözönt generálnak. Megnyílt a lehetıség, hogy több petabájtnyi adatot lehessen olcsón tárolni, kezelni. Az Internet és a Grid rendszerek révén ezeket az adathalmazokat könnyen el lehet érni. A tudományos információkezelési, információgyőjtési, szervezési, lekérdezési, megjelenítési feladatok száma az adatmennyiség arányában növekszik. (Minél több az adat, annál többféle feldolgozásra vagyunk kíváncsiak.) Az adatbányászat napjaink egyik fı kihívása! A csillagászatban keletkezı hatalmas adathalmazok közös feldolgozására létrehozott architektúra: The Sloan Digital Sky Survey Jim Gray and Alex Szalay, The World Wide Telescope: An Archetype for Online Science, Comm. ACM, 45(11): 50-54, Nov Adattárházak és adatbányászat 7
8 Az adatbázis technológia fejlıdése 1960: 1970: 1980: 1990: 2000 Adatgyőjtemények, hálós és hierarchikus adatbázis-kezelık, IMS, IDMS Relációs adatmodell bevezetése relációs adatbázis-kezelık (RDBMS) megjelenése RDBMS elterjedése, új adatmodellek támogatása (objektumorientált, deduktív, stb.) Alkalmazásspecifikus adatbázis-kezelık (térinformatika, mérnöki tervezések, stb.) Adatbányászat, adattárházak, multimédia adatbázisok, web-adatbzisok Adatfolyamok kezelése, bányászata Adatbányászat alkalmazása egyre több területen Webtechnológiák, szemantikus technológiák, felhıkörnyezetek Adattárházak és adatbányászat 8
9 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 9
10 Mi az adatbányászat? Az adatbányászat (tudás kinyerése az adatokból) Érdekes (nem triviális, implicit, eddig nem ismert és potenciálisan hasznos) mintákat (azaz tudást) akarunk kinyerni a nagyon nagy adathalmazokból lehetıleg automatikusan, és minél hatékonyabban. Más elnevezések Tudásfeltárás az adatbázisokban (Knowledge discovery in databases - KDD), tudáskinyerés (knowledge extraction), adatelemzés, mintaelemzés (data/pattern analysis), információ-betakarítás (information harvesting), üzleti intelligencia (business intelligence). Mi nem adatbányászat? Egyszerő keresések, lekérdezések végrehajtása (Deduktív) szakértıi rendszerek Adattárházak és adatbányászat 10
11 A tudásfeltárás (KDD) folyamata Az adattárház használata ki is maradhat! A minták értékelése Adatbányászat Feladatorientált adatok Adattárház Adatok kiválasztása Adattisztítás Adatintegráció Adatbázisok Adattárházak és adatbányászat 11
12 Hogy néz ez ki a web-bányászat esetében? Mibıl áll a web-adatokon végzett tudásfeltárás? Adattisztítás Több forrásból származó adatok integrációja Az adatokból adattárház építése Adatkockák készítése Az adatbányászathoz szükséges adatok kiválasztása Adatbányászat elvégzése Az eredményekbıl jelentések készítése, megjelenítése A talált minták, összefüggések (tudás) tárolása a tudásbázisban Adattárházak és adatbányászat 12
13 Adatbányászat az üzleti intelligenciában A döntéstámogatás piramisa Prezentáció Vizualizációs technikák Adatbányászat Információfelderítés Döntéshozó Üzleti elemzı Adatelemzı Adatelemzés Statisztikai összegzések, lekérdezések, jelentések Elıfeldolgozás/Integráció, adattárház építése Adatforrások Dokumentumok, fájlok, weboldalak, kísérleti eredmények, adatbázisok Döntéshozatal Rendszergazda Adattárházak és adatbányászat 13
14 A KDD folyamat: Mesterséges intelligencia és statisztikai nézıpontból Input adatok Adatbányászat Elıfeldolgozás Utófeldolgozás Adatintegráció Normalizálás Lényeges tulajdonságok kiválasztása Dimenziócsökkentés Minták keresése Asszociáció és korreláció Osztályozás Klaszterezés Kiugró értékek elemzése Minták értékelése Minták kiválasztása Minták interpretálása Minták megjelenítése Adattárházak és adatbányászat 14
15 Az adatbányászat, mint multidiszciplinális tudomány Gépi tanulás Mintafelismerés Statisztika Alkalmazások Adatbányászat Megjelenítés Algoritmusok Adatbázisok Hatékony számítási modellek Adattárházak és adatbányászat 15
16 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 16
17 Az adatbányászat különbözı aspektusai Milyen típusú összefüggést, tudást bányászunk? Jellemzés, (karakterizáció), megkülönböztetés, (diszkrimináció), kapcsolódás (asszociáció), osztályozás (klasszifikáció), csoportosítás (klaszterezés), trendre illeszkedés/trendtıl eltérés, kiugró (outlier) esetek elemzése. Lehet leíró vagy elırejelzı (Descriptive vagy predictive) adatbányászat Több szintő adatbányászat Milyen adatokban bányászunk? Relációs adatbázis, adattárház, tranzakciós adatbázis, adatfolyam, objektumorientált vagy objektum relációs adatbázis, aktív adatbázis, térinformatikai adatbázis, multimédia adatbázis, heterogén adatbázis, örökölt adatbázis, webadatok, hálózatok Milyen technikákat használunk? Adatbázis technológiák, adattárház technológiák (OLAP), gépi tanulás, statisztika, vizualizáció Mire használjuk az adatbnyászatot Kereskedelem, telekommunikáció, bankrendszer, csalásfelderítés, bioinformatika, tızsdeelemzés, szövegbányászat (szemantikus web), webbányászat Adattárházak és adatbányászat 17
18 Miért van szükség ennyiféle terület összevegyítésére? Hatalmas adatmennyiséggel kell dolgozni Az algoritmusoknak skálázhatóknak kell lenniük több terabájt adat esetére is Nagy dimenziójú adatokkal kell dolgozni A génchipek esetében például több tízezer dimenziójú adatok keletkezhetnek (minden pixelnek egy adatvektort felel meg) Összetett struktúrájú, különféle típusú adatokat kell vizsgálni Adatfolyam keletkeznek a mérımőszerekben Idısorok, szekvenciák Struktúrák, gráfok, közösségi hálók, összekapcsolt adatok (szemantikus web) Heterogén adatbázisok, örökölt (régi) adatbázisok Téradatok, téridı adatok, multimédia, szöveg, weboldalak szoftverek, forráskódok, szimulációk Új összetett alkalmazásokat kell készíteni Adattárházak és adatbányászat 18
19 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 19
20 Az adatbányászat technikái: 1. Általánosítás Információ integráció, adattárház építése Adattisztítás, transzformálás, integráció, többdimenziós adatmodell készítése Adatkockák technológiája Ezek olyan skálázható módszerek, amelyek például materializációval többdimenziós aggregátumokat lehet hatékonyan kiszámítani OLAP (online analytical processing) online elemzések Többdimenziós fogalmi leírások: karakterizáció és diszkrimináció (hogyan jellemezhetı, hol vannak eltérések) Az adatok általánosítása, jellemzése, például a száraz és csapadékos területek összehasonlítása Adattárházak és adatbányászat 20
21 Az adatbányászat technikái: 2. Asszociáció és korreláció Gyakori minták (gyakori elemhalmazok) keresése Milyen termékeket vásárolnak gyakran együtt egy boltban? Többféle összefüggés lehetséges: Asszociáció, korreláció, oksági viszony Egy tipikus asszociációs szabály Pelenka Sör [0.5%, 75%] (support, confidence) (támasz és megbízhatóság) Vajon a szoros asszociációban álló elemek statisztikai értelemben is erısen korreláltak? Hogy lehet ilyen szabályokat hatékonyan elıállítani egy nagy adatbázis esetében? Hogyan használhatjuk fel ezeket a szabályokat klaszterezésre, osztályozásra vagy más alkalmazásokra? Adattárházak és adatbányászat 21
22 Az adatbányászat technikái: 3. Osztályozás Osztályozás, címkék elırejelzése Egy tanuló adathalmazra modelleket (függvényeket illesztünk) Osztályokat, fogalmakat jellemzünk, vagy különböztetünk meg és ezt elırejelzésre is használhatjuk Osztályozzuk az országokat éghajlatuk alapján (szárazföldi, mediterrán, trópusi), úgy hogy mérjük az évi középhımérsékletet, csapadékot, stb. vagy az autók márkája, kora, súlya, mérete, stb. ismeretében osztályozzuk az autókat, hogy mennyi az éves szervízköltség (sok, közepes, kevés) Egy új megfigyelt egyed esetében a tulajdonságai alapján jósoljuk meg, hogy melyik osztályba fog tartozni. Tipikus módszerek Döntési fák, naïve Bayesian osztályozó, támaszvektor gépek (SVM - support vector machines), neurális hálók, szabályalapú osztályozás, mintalapú osztályozó, logistic regresszió, Tipikus alkalmazások: Hitelkártyacsalások felderítése, direktmarketing, ajánló rendszerek, véelmények (csillagok) elırejelzése, betegség megjóslása a szimptómákból. Adattárházak és adatbányászat 22
23 Az adatbányászat technikái: 4. Klaszterezés Nem felügyelt tanulás (Unsupervised learning) (vagyis nincsenek elıre megadott címkék a csoportokhoz, osztályokhoz rendelve) Magukat az adatokat csoportosítjuk, hogy új kategóriákat fedezzünk fel, például utcai rablások alapján különbözı veszélyezettségő területeket különböztethetünk meg, vagy a házak értékeit vizsgálva egy adott ház helyébıl az értékére következtethetünk Az alapelv: Maximalizáljuk az osztályokon belüli hasonlóságot ÉS minimalizáljuk az osztályok közötti hasonlóságot Rengeteg klaszterezési módszer létezik. Adattárházak és adatbányászat 23
24 Az adatbányászat technikái: 5. Kiugró objektumok elemzése Mit tekintünk kiugró objektumnak? Kiugró (Outlier) objektum: olyan adatobjektum, amely az adatobjektumok általános viselkedésének nem felel meg, például valamelyik komponense nagyon eltér az átlagtól. Minek tekintsük, zajnak vagy kivételnek? Ami az egyik szempontból hiba, szemét, az egy másik vizsgálat számára értéket jelent, például csalásra következtethetünk, ha a szokásos használattól nagyon eltér egy bankkártya használata. Milyen módszereket használhatunk? Klaszterezés, regresszió, Ritka események felderítése (például CERN gyorsítójában a mért adatok alapján keletkezett-e új részecske) Adattárházak és adatbányászat 24
25 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 25
26 Milyen adatokban bányászunk? Az adatok egy részét adatbázisokban tároljuk, alkalmazásokkal dolgozzuk fel. Relációs adatbázis, adattárház, tranzakciós adatbázis Speciális adathalmazok és alkalmazások Adatfolyamok, mőszerek adatai Idısorok, idıszakos adatok, szekvenciák (például génszekvenciák) Strukturált adatok, gráfok, hálózatok, összekapcsolt adatok Objektumrelációs adatbázisok Heterogén, örökölt adatbázisok Tér- és téridıadatok Multimédia adatbázisok Dokumentumrendszerek, szöveges adatbázisok Internet: World-Wide Web Adattárházak és adatbányászat 26
27 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 27
28 Idıindexes és rendezett adatok: Szekvenciális minták, trendek Alkalmazási terület: szekvenciák, trendek, fejlıdésvizsgálat Trendek, idısorok, eltérések elemzése: függvényillesztés, regresszió, például y érték elırejelzése az x ismeretében, ha lineáris viszonyt tételezünk fel. Szekvenciális minták bányászata Minta például, hogy a kamera vásárlása után venni fogunk nagy kapacitású SD kártyát is Ismétlıdések, periodicitás keresése, kiszőrése Biológiai (gén-) szekvenciák vizsgálata (motívumkeresés) Melyek a biológiai jelentéssel bíró motívumok, egymás utáni motívumok Hasonlóságalapú összehasonlító elemzések Adatfolyamok bányászata potenciálisan végtelen adatfolyamok (rendezett adatok vagy idısorok) Adattárházak és adatbányászat 28
29 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 29
30 Struktúrák és hálózatok elemzése Gráfok adatbányászata Keressünk gyakori részgráfokat (például nagy molekulákban gyakori egyszerő összetevıket gyógyszerkutatás), keressünk gyakori részfákat XML dokumentumokban Hálózatok elemzése Közösségi hálók felépítése: aktorok (objektumok - csúcsok) és kapcsolatok (irányított, vagy közönséges élek) például derítsük fel az Adatbányászattal foglalkozó szerzık kapcsolati hálóját, vagy derítsük fel a terroristák hálózatát (ki kit ismer, ki kinek telefonált, kik mikor hol voltak együtt) Többszörös heterogén hálózatok vizsgálata Egy személy egyszerre többféle hálózatnak is tagja: barátok hálózata, rokoni hálózat, osztálytársak hálózata, telefonhívások hálózata A kapcsolatok (Links) értelmezésének, szemantikájánakbányászata Webbányászat A Weboldalak hálózat, rangsorolásis (a Google PageRank és HITS algoritmusai) Alkalmazások webközösségek felderítése, véleménybányászat. klikkelemzés, reklám Adattárházak és adatbányászat 30
31 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 31
32 A tudás értéke Minden kibányászott minta érdekes? Kimerítı kereséssel túl sok mintát kaphatunk Van, ami csak bizonyos helyre, idıre, dimenzióra jellemzı, vagyis nem elég általános Van, ami csak múló összefüggés, az aktuális adatokra véletlenül teljesül Próbáljuk mérni a tudás érdekességét és csak érdekes tudást bányásszunk ki az adatokból milyen tudás kell: leíró vagy elırejelzı milyen eseteket fed le, lehetıleg minél többet mennyire tipikus vagy újszerő a minta (esıben viszünk ernyıt: érdektelen, esıben levisszük a vízilovat sétálni: érdekes) mennyire pontos az összefüggés a lefedett esetekben mennyire idıszerő (mindenki vízilovat tart otthon) Adattárházak és adatbányászat 32
33 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 33
34 Adatbányászati alkalmazások Weboldalak elemzése: a weboldalak osztályozása témák szerint, fontosságuk szerint, spamoldalak felderítése, klaszterezése a PageRank és a HITS algoritmussal Közösségek felderítése (Collaborative analysis), ajánló rendszerek (milyen videó fog tetszeni azok alapján, amiket eddig néztünk) Objektumok beazonosítása (Entity resolution) Célzott marketing vásárlói kosár elemzésével Biológiai, orvosi adatelemzések: osztályozás, klaszterezés (microchip adatokon), fertızések terjedése, biológiai hálózatok, génszekvenciák elemzése Adatbányászat a szoftvertervezésben, tesztelésben Ingyenes és kereskedelmi adatbányászati eszközök (weka, RapidMiner, R, SAS, MS SQL-Server Analysis Manager, Oracle Data Mining Tools) Adattárházak és adatbányászat 34
35 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 35
36 Új irányok az adatbányászatban Adatbányászati algoritmusok hatékonysági javítása, skálázhatósága Párhuzamos, osztott adatok, adatfolyamok bányászata, inkrementális Nagyon nagy dimenziók kezelése Bizonytalanság, zajos, nem teljes adatok kezelése Kiegészítı összefüggések, megszorítások, szakértı háttértudás bevonása az adatbányászatba Minták értékelése, tudásintegráció Bioinformatika, közösségi hálózatok elemzése Alkalmazásfüggı, szakmaspecifikus adatbányászat Láthatalan adatbányászat (beágyazott rendszerekben, külöbözı modulok részeként) Adatbiztonság, adatvédelem, mint az adatbázis-kezelésben Adattárházak és adatbányászat 36
37 Bevezetés Miért kell adatbányászat? Mi az adatbányászat? Az adatbányászat különbözı aspektusai Adatbányászati funkciók: Milyen mintákat keressünk? Milyen adatokban bányászunk? Idıindexes és rendezett adatok: Szekvenciális minták, trendek keresése, fejlıdési minták keresése Struktúrák és hálózatok elemzése A tudás értéke Adatbányászati alkalmazások Új irányok az adatbányászatban Az adatbányászat története dióhéjban Adattárházak és adatbányászat 37
38 Az adatbányászat története dióhéjban 1989 IJCAI Workshop on Knowledge Discovery in Databases Knowledge Discovery in Databases (G. Piatetsky-Shapiro and W. Frawley, 1991) Workshops on Knowledge Discovery in Databases Advances in Knowledge Discovery and Data Mining (U. Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy, 1996) International Conferences on Knowledge Discovery in Databases and Data Mining (KDD 95-98) Journal of Data Mining and Knowledge Discovery (1997) ACM SIGKDD conferences since 1998 and SIGKDD Explorations Adatbányászati konferenciák PAKDD (1997), PKDD (1997), SIAM-Data Mining (2001), (IEEE) ICDM (2001), etc. ACM Transactions on KDD 2007 Adattárházak és adatbányászat 38
39 Adatbányászati konferenciák és folyóiratok KDD konferenciák ACM SIGKDD Int. Conf. on Knowledge Discovery in Databases and Data Mining (KDD) SIAM Data Mining Conf. (SDM) (IEEE) Int. Conf. on Data Mining (ICDM) Conf. on Principles and practices of Knowledge Discovery and Data Mining (PKDD) Pacific-Asia Conf. on Knowledge Discovery and Data Mining (PAKDD) Nagy konferenciák részeként: ACM SIGMOD VLDB (IEEE) ICDE WWW, SIGIR ICML, CVPR, NIPS Folyóiratok Data Mining and Knowledge Discovery (DAMI or DMKD) IEEE Trans. On Knowledge and Data Eng. (TKDE) KDD Explorations ACM Trans. on KDD Adattárházak és adatbányászat 39
40 Hol találunk cikkeket? ACM, DBLP, CiteSeer, Google Data mining and KDD (SIGKDD: CDROM) Conferences: ACM-SIGKDD, IEEE-ICDM, SIAM-DM, PKDD, PAKDD, etc. Journal: Data Mining and Knowledge Discovery, KDD Explorations, ACM TKDD Database systems (SIGMOD: ACM SIGMOD Anthology CD ROM) Conferences: ACM-SIGMOD, ACM-PODS, VLDB, IEEE-ICDE, EDBT, ICDT, DASFAA Journals: IEEE-TKDE, ACM-TODS/TOIS, JIIS, J. ACM, VLDB J., Info. Sys., etc. AI & Machine Learning Conferences: Machine learning (ML), AAAI, IJCAI, COLT (Learning Theory), CVPR, NIPS, etc. Journals: Machine Learning, Artificial Intelligence, Knowledge and Information Systems, IEEE-PAMI, etc. Web and IR Conferences: SIGIR, WWW, CIKM, etc. Journals: WWW: Internet and Web Information Systems, Statistics Conferences: Joint Stat. Meeting, etc. Journals: Annals of statistics, etc. Visualization Conference proceedings: CHI, ACM-SIGGraph, etc. Journals: IEEE Trans. visualization and computer graphics, etc. Adattárházak és adatbányászat 40
41 Néhány ajánlott könyv S. Chakrabarti. Mining the Web: Statistical Analysis of Hypertex and Semi-Structured Data. Morgan Kaufmann, 2002 R. O. Duda, P. E. Hart, and D. G. Stork, Pattern Classification, 2ed., Wiley-Interscience, 2000 T. Dasu and T. Johnson. Exploratory Data Mining and Data Cleaning. John Wiley & Sons, 2003 U. M. Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy. Advances in Knowledge Discovery and Data Mining. AAAI/MIT Press, 1996 U. Fayyad, G. Grinstein, and A. Wierse, Information Visualization in Data Mining and Knowledge Discovery, Morgan Kaufmann, 2001 J. Han and M. Kamber. Data Mining: Concepts and Techniques. Morgan Kaufmann, 2 nd ed., 2006 D. J. Hand, H. Mannila, and P. Smyth, Principles of Data Mining, MIT Press, 2001 T. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer-Verlag, 2001 B. Liu, Web Data Mining, Springer T. M. Mitchell, Machine Learning, McGraw Hill, 1997 G. Piatetsky-Shapiro and W. J. Frawley. Knowledge Discovery in Databases. AAAI/MIT Press, 1991 P.-N. Tan, M. Steinbach and V. Kumar, Introduction to Data Mining, Wiley, 2005 S. M. Weiss and N. Indurkhya, Predictive Data Mining, Morgan Kaufmann, 1998 I. H. Witten and E. Frank, Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations, Morgan Kaufmann, 2 nd ed Adattárházak és adatbányászat 41
The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék Adatelemzés intelligens módszerekkel Hullám Gábor Adatelemzés hagyományos megközelítésben I. Megválaszolandó
RészletesebbenTudásalapú információ integráció
Tudásalapú információ integráció (A Szemantikus Web megközelítés és a másik irány) Tanszéki értekezlet, 2008. május 14. 1 Miért van szükségünk ilyesmire? WWW: (Alkalmazások) Keresés a weben (pl. összehasonlítás
RészletesebbenStatisztikai eljárások a mintafelismerésben és a gépi tanulásban
Statisztikai eljárások a mintafelismerésben és a gépi tanulásban Varga Domonkos (I.évf. PhD hallgató) 2014 május A prezentáció felépítése 1) Alapfogalmak 2) A gépi tanulás, mintafelismerés alkalmazási
RészletesebbenA TANTÁRGY ADATLAPJA
A TANTÁRGY ADATLAPJA 1. A képzési program adatai 1.1 Felsőoktatási intézmény Babeș Bolyai Tudományegyetem 1.2 Kar Matematika és Informatika Kar 1.3 Intézet Magyar Matematika és Informatika Intézet 1.4
RészletesebbenAdatbányászat az Oracle9i-ben. Fekete Zoltán vezető termékmenedzser Zoltan.Fekete@oracle.com
Agenda Az Oracle9i adattárház tulajdonságai Adatbányászat az Oracle9i-ben DM, Personalization az Oracle9i-ben, architektúra Integrált adatbányászat az Oracle CRM-ben Szünet Perszonalizációs felhasználási
RészletesebbenMultimédiás adatbázisok
Multimédiás adatbázisok Multimédiás adatbázis kezelő Olyan adatbázis kezelő, mely támogatja multimédiás adatok (dokumentum, kép, hang, videó) tárolását, módosítását és visszakeresését Minimális elvárás
RészletesebbenA hierarchikus adatbázis struktúra jellemzői
A hierarchikus adatbázis struktúra jellemzői Az első adatbázis-kezelő rendszerek a hierarchikus modellen alapultak. Ennek az volt a magyarázata, hogy az élet sok területén első közelítésben elég jól lehet
RészletesebbenTörténet John Little (1970) (Management Science cikk)
Információ menedzsment Szendrői Etelka Rendszer- és Szoftvertechnológia Tanszék szendroi@witch.pmmf.hu Vezetői információs rendszerek Döntéstámogató rendszerek (Decision Support Systems) Döntések információn
RészletesebbenAdatbányászat és Perszonalizáció az Oracle9i-ben
Adatbányászat és Perszonalizáció az Oracle9i-ben Oracle9i adatbányászat 2000. szeptember 6. Fekete Zoltán Palaczk Péter Agenda Oracle9i Database Teljes e-business Intelligence infrastruktúra Mi is az adatbányászat?
RészletesebbenAdatbányászati technikák (VISZM185) 2015 tavasz
Adatbányászati technikák (VISZM185) 2015 tavasz Csima Judit BME, VIK, Számítástudományi és Információelméleti Tanszék 2015. február 11. Csima Judit Adatbányászati technikák (VISZM185) 2015 tavasz 1 / 27
RészletesebbenTartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.
Tartalom Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben. Előszó 1. Az adatbányászatról általában 19 1.1. Miért adatbányászat? 21 1.2. Technológia a rejtett információk
RészletesebbenVezetői információs rendszerek
Vezetői információs rendszerek Kiadott anyag: Vállalat és információk Elekes Edit, 2015. E-mail: elekes.edit@eng.unideb.hu Anyagok: eng.unideb.hu/userdir/vezetoi_inf_rd 1 A vállalat, mint információs rendszer
RészletesebbenBig Data az adattárházban
Big Data az adattárházban A párbaj folytatódik? Néhány fontos Big Data projekt Cég Téma Adat Újfajta Mennyiség Saját adat? Típus Google Influenza Google I big I Előjelzés előjelzés Farecast Xoom Chicagoi
RészletesebbenAdatbányászat: Bevezetés. 1. fejezet. Tan, Steinbach, Kumar Bevezetés az adatbányászatba
Adatbányászat: Bevezetés 1. fejezet Tan, Steinbach, Kumar Bevezetés az adatbányászatba előadás-fóliák fordította Ispány Márton Logók és támogatás A tananyag a TÁMOP-4.1.2-08/1/A-2009-0046 számú Kelet-magyarországi
RészletesebbenMérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time)
Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time) (specializáció választás a 4. félévben, specializációra lépés feltétele: az egyik szigorlat
RészletesebbenAdatbázisrendszerek április 17.
Adatbázisrendszerek Áttekintés az adattárházakról és az OLAP-ról 2018. április 17. Az adattárházak célja 2 A számítási kapacitások állandó növekedése és az analitikai eszközök és módszerek egyre összetettebbé
RészletesebbenEntity Resolution azonosságfeloldás
1 Entity Resolution azonosságfeloldás Entity Resolution (ER) is the process of identifying groups of records that refer to the same real-world entity. rejtett, való világbeli entitásokhoz köthető megfigyelések
RészletesebbenNeurális hálózatok bemutató
Neurális hálózatok bemutató Füvesi Viktor Miskolci Egyetem Alkalmazott Földtudományi Kutatóintézet Miért? Vannak feladatok amelyeket az agy gyorsabban hajt végre mint a konvencionális számítógépek. Pl.:
RészletesebbenSikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter
Sikerünk kulcsa: az információ De honnan lesz adatunk? Palaczk Péter Bevezető az Oracle9i adattárházas újdonságaihoz Elemzési és vezetői információs igények 80:20 az adatgyűjtés javára! Adattárházak kínálta
RészletesebbenMit mond a XXI. század emberének a statisztika?
Mit mond a XXI. század emberének a statisztika? Rudas Tamás Magyar Tudományos Akadémia Társadalomtudományi Kutatóközpont Eötvös Loránd Tudományegyetem Statisztika Tanszék Nehéz a jövőbe látni Változik
RészletesebbenADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu
ADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu Számonkérés 2 Papíros (90 perces) zh az utolsó gyakorlaton. Segédanyag nem használható Tematika 1. félév 3 Óra Dátum Gyakorlat 1. 2010.09.28.
RészletesebbenGáspár Bencéné Vér Katalin *
109 Gáspár Bencéné Vér Katalin * ADATBÁNYÁSZAT A GAZDASÁGI ÉLETBEN Az adatbányászat egy döntéstámogatási módszer, olyan üzleti intelligencia megoldás, amely új üzleti lehetõségeket segít megtalálni és
RészletesebbenMesterséges Intelligencia Elektronikus Almanach. Konzorciumi partnerek
Mesterséges Intelligencia Elektronikus Almanach Konzorciumi partnerek 1 Konzorcium Budpesti Mőszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Méréstechnika és Információs Rendszerek
Részletesebben2009.04.29. 2009. április 24. INFO Savaria 2009 2. 2009. április 24. INFO Savaria 2009 4. 2009. április 24. INFO Savaria 2009 3
Négy adatbázis-kezelı rendszer összehasonlítása webes környezetben Sterbinszky Nóra snorav@gmail.com Áttekintés Növekvı igény hatékony adatbázis- kezelıkre a világhálón Hogyan mérhetı ezek teljesítménye
RészletesebbenMit látnak a robotok? Bányai Mihály Matemorfózis, 2017.
Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017. Vizuális feldolgozórendszerek feladatai Mesterséges intelligencia és idegtudomány Mesterséges intelligencia és idegtudomány Párhuzamos problémák
RészletesebbenGépi tanulás a gyakorlatban. Bevezetés
Gépi tanulás a gyakorlatban Bevezetés Motiváció Nagyon gyakran találkozunk gépi tanuló alkalmazásokkal Spam detekció Karakter felismerés Fotó címkézés Szociális háló elemzés Piaci szegmentáció analízis
RészletesebbenSzemantikus technológiák területei. Rácz Gábor,
Szemantikus technológiák területei Rácz Gábor, 2011.10.14. Alkalmazások Cégek közötti együttműködés (Searchy) Telekommunikáció Mobiltelefonos tartalomszolgáltatás (KTF) DBPedia Mobile OntoWiki Mobile Kockázatkezelés
RészletesebbenHogyan lesz adatbányából aranybánya?
Hogyan lesz adatbányából aranybánya? Szolgáltatások kapacitástervezése a Budapest Banknál Németh Balázs Budapest Bank Fehér Péter - Corvinno Visontai Balázs - KFKI Tartalom 1. Szolgáltatás életciklus 2.
RészletesebbenTeljesen elosztott adatbányászat alprojekt
Teljesen elosztott adatbányászat alprojekt Hegedűs István, Ormándi Róbert, Jelasity Márk Big Data jelenség Big Data jelenség Exponenciális növekedés a(z): okos eszközök használatában, és a szenzor- és
RészletesebbenBig Data: a több adatnál is több
Big Data: a több adatnál is több Sidló Csaba István MTA Számítástechnikai és Automatizálási Kutatóintézet Üzleti Intelligencia és Adattárházak Csoport sidlo@sztaki.mta.hu http://dms.sztaki.hu CIO Hungary
RészletesebbenSZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből
2010/2011 tavaszi félév SZTE Eötvös Loránd Kollégium 1. Dombi József: Fuzzy elmélet és alkalmazásai 2011. március 3. 19:00 2. Móra György: Információkinyerés természetes nyelvű szövegekből 2011. március
RészletesebbenRetro adatbányászat. Kovács Gyula Andego Tanácsadó Kft.
Retro adatbányászat Kovács Gyula Andego Tanácsadó Kft. Adattárház Fórum 2012 Magunkról 2010-ben alapították magánszemélyek (az alapítók több mint egy évtizedes BI tapasztalatokkal rendelkeznek) Andego
RészletesebbenInformatikai alapismeretek Földtudományi BSC számára
Informatikai alapismeretek Földtudományi BSC számára 2010-2011 Őszi félév Heizlerné Bakonyi Viktória HBV@ludens.elte.hu Titkosítás,hitelesítés Szimmetrikus DES 56 bites kulcs (kb. 1000 év) felcserél, helyettesít
RészletesebbenMérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time)
Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time) (A képzés közös része, szakirányválasztás a 3. félév végén) Tárgykód Félév Tárgynév Tárgy
RészletesebbenGeoinformatikai rendszerek
Geoinformatikai rendszerek Térinfomatika Földrajzi információs rendszerek (F.I.R. G.I.S.) Térinformatika 1. a térinformatika a térbeli információk elméletével és feldolgozásuk gyakorlati kérdéseivel foglalkozó
RészletesebbenCélkitűzések Az Oracle10 g felépítésének, használatának alapszíntű megismerése
BEVEZETÉS Célkitűzések Az Oracle10g felépítésének, használatának alapszíntű megismerése A relációs adatbázis-kezelés elméleti és gyakorlati vonatkozásainak áttekintése Az SQL, PL/SQL nyelvek használatának
RészletesebbenFİBB PONTOK PIACKUTATÁS (MARKETINGKUTATÁS) Kutatási terv október 20.
FİBB PONTOK PIACKUTATÁS (MARKETINGKUTATÁS) 2010. október 20. A kutatási terv fogalmának, a különbözı kutatási módszerek osztályozása, a feltáró és a következtetı kutatási módszerek közötti különbségtétel
RészletesebbenDr. Sasvári Péter Egyetemi docens
A magyarországi vállalkozások Üzleti Intelligencia használatának vizsgálata Dr. Sasvári Péter Egyetemi docens II. IRI Társadalomtudományi Konferencia, 2014. április 25-26. Nové Zámky (Érsekújvár) Gymnázium
RészletesebbenInformációs Rendszerek Szakirány
Információs Rendszerek Szakirány Laki Sándor Kommunikációs Hálózatok Kutatócsoport ELTE IK - Információs Rendszerek Tanszék lakis@elte.hu http://lakis.web.elte.hu Információs Rendszerek szakirány Közös
RészletesebbenGyors sikerek adatbányászati módszerekkel
Gyors sikerek adatbányászati módszerekkel Kezdő adatbányászati workshop Petrócziné Huczman Zsuzsanna 2015.10.13. Bemutatkozás BME, műszaki informatika szak, adatbányászati szakirány Citibank Data Explorer
RészletesebbenGazdasági informatika alapjai
PSZK Mesterképzési és Távoktatási Központ / H-1149 Budapest, Buzogány utca 10-12. / 1426 Budapest Pf.:35 II. évfolyam Név: Neptun kód: Kurzus: Tanár neve: HÁZI DOLGOZAT 2. Gazdasági informatika alapjai
RészletesebbenAz üzleti intelligencia megoldások helye és szerepe a magyar vállalatok életében. Dr. Kovács László Dr. Sasvári Péter Miskolci Egyetem
Az üzleti intelligencia megoldások helye és szerepe a magyar vállalatok életében Dr. Kovács László Dr. Sasvári Péter Miskolci Egyetem 1 Mit jelent a BI? Mi jellemzi a BI értelmezésének fejlődését, az értelmezési
RészletesebbenMérnök informatikus mesterszak mintatanterve (GE-MI) nappali tagozat/ MSc in, full time Érvényes: 2011/2012. tanév 1. félévétől, felmenő rendszerben
Mérnök informatikus mesterszak mintatanterve (GE-MI) nappali tagozat/ MSc in, full time Érvényes: 2011/2012. tanév 1. félévétől, felmenő rendszerben Tantárgy Tárgykód I. félév ősz II. félév tavasz Algoritmusok
RészletesebbenModellkiválasztás és struktúrák tanulása
Modellkiválasztás és struktúrák tanulása Szervezőelvek keresése Az unsupervised learning egyik fő célja Optimális reprezentációk Magyarázatok Predikciók Az emberi tanulás alapja Általános strukturális
RészletesebbenProjektvezetői döntések támogatása webbányászattal
NETWORKSHOP 2008 2008. március 17-19. Dunaújváros, Dunaújvárosi Főiskola Projektvezetői döntések támogatása webbányászattal Bóta László Ph.D. hallgató (BME) Eszterházy Károly Főiskola, Eger BI (Business
RészletesebbenKövetelmények Bevezetés. Adatbányászat. Szegedi Tudományegyetem. Adatbányászat
Szegedi Tudományegyetem gyakorlat Gyakorlaton elérhető: max. 50 pont 2 db ZH (okt. 7/14. és nov. 25.): 25-25 pont (min. 8 pont/zh) Javító ZH: félév végén az egész éves gyakorlati anyagból a minimális összpontszámot
RészletesebbenAlkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 0. A Wolfram Alpha tudásgép. https://www.wolframalpha.
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 0. A Wolfram Alpha tudásgép https://www.wolframalpha.com/ Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás
RészletesebbenA TANTÁRGY ADATLAPJA
A TANTÁRGY ADATLAPJA 1. A képzési program adatai 1.1 Felsőoktatási intézmény Babeș Bolyai Tudományegyetem 1.2 Kar Matematika és Informatika Kar 1.3 Intézet Magyar Matematika és Informatika Intézet 1.4
RészletesebbenMicrosoft SQL Server telepítése
Microsoft SQL Server telepítése Az SQL Server a Microsoft adatbázis kiszolgáló megoldása Windows operációs rendszerekre. Az SQL Server 1.0 verziója 1989-ben jelent meg, amelyet tizenegy további verzió
RészletesebbenA TANTÁRGY ADATLAPJA
A TANTÁRGY ADATLAPJA 1. A képzési program adatai 1.1 Felsőoktatási intézmény Babeș Bolyai Tudományegyetem 1.2 Kar Matematika és Informatika Kar 1.3 Intézet Magyar Matematika és Informatika Intézet 1.4
RészletesebbenA Jövő Internet Nemzeti Kutatási Program bemutatása
A Jövő Internet Nemzeti Kutatási Program bemutatása Dr. Bakonyi Péter és Dr. Sallai Gyula Jövő Internet Kutatáskoordinációs Központ Budapesti Műszaki és Gazdaságtudományi Egyetem Budapest, 2013. június
RészletesebbenVIR alapfogalmai. Előadásvázlat. dr. Kovács László
VIR alapfogalmai Előadásvázlat dr. Kovács László Információ szerepe Információ-éhes világban élünk Mi is az információ? - újszerű ismeret - jelentés Hogyan mérhető az információ? - statisztikai - szintaktikai
RészletesebbenAdatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com
Adatelemzés SAS Enterprise Guide használatával Soltész Gábor solteszgabee[at]gmail.com Tartalom SAS Enterprise Guide bemutatása Kezelőfelület Adatbeolvasás Szűrés, rendezés Új változó létrehozása Elemzések
RészletesebbenTudásalapú információ-kereső rendszerek elemzése és kifejlesztése
Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése 1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Természetes nyelv feldolgozás 2 Tudásalapú információ-kereső rendszerek
RészletesebbenVÁLLALATI INFORMÁCIÓS RENDSZEREK. Debrenti Attila Sándor
VÁLLALATI INFORMÁCIÓS RENDSZEREK Debrenti Attila Sándor Információs rendszer 2 Információs rendszer: az adatok megszerzésére, tárolására és a tárolt adatok különböző szempontok szerinti feldolgozására,
Részletesebbenza TANTÁRGY ADATLAPJA
za TANTÁRGY ADATLAPJA 1. A képzési program adatai 1.1 Felsőoktatási intézmény Babeș Bolyai Tudományegyetem 1.2 Kar Matematika és Informatika Kar 1.3 Intézet Magyar Matematika és Informatika Intézet 1.4
RészletesebbenAdatbányászat és Perszonalizáció architektúra
Adatbányászat és Perszonalizáció architektúra Oracle9i Teljes e-üzleti intelligencia infrastruktúra Oracle9i Database Integrált üzleti intelligencia szerver Data Warehouse ETL OLAP Data Mining M e t a
RészletesebbenVirtuális Obszervatórium. Gombos Gergő
Virtuális Obszervatórium Gombos Gergő Áttekintés Motiváció, probléma felvetés Megoldások Virtuális obszervatóriumok NMVO Twitter VO Gombos Gergő Virtuális Obszervatórium 2 Motiváció Tudományos módszer
RészletesebbenBIG DATA ELEMZÉSEK LEHETŐSÉGEI
BIG DATA ELEMZÉSEK LEHETŐSÉGEI A KÖRNYEZETVÉDELMI MODELLEZÉSBEN Dr. Torma A. 2015.11.13. 2015/11/13 Dr. TORMA A. >> Széchenyi István Egyetem 2 Tartalom 1. A Big Data fogalma 2. Pár érdekes adat a Big Data
RészletesebbenIntelligens adatelemzés
Antal Péter, Antos András, Horváth Gábor, Hullám Gábor, Kocsis Imre, Marx Péter, Millinghoffer András, Pataricza András, Salánki Ágnes Intelligens adatelemzés Szerkesztette: Antal Péter A jegyzetben az
RészletesebbenVezetői információs rendszerek
Vezetői információs rendszerek 7. előadás: Stratégiai menedzsment és informatikai támogatás 2. Elekes Edit, 2015. E-mail: elekes.edit@eng.unideb.hu Anyagok: eng.unideb.hu/userdir/elekes Edit/Vezetoi_inf_rd
RészletesebbenMesterséges Intelligencia Elektronikus Almanach. MI Almanach projektismertetı rendezvény április 29., BME, I. ép., IB.017., 9h-12h.
Mesterséges Intelligencia Elektronikus Almanach Neurális hálózatokh 1 BME 1990: Miért neurális hálók? - az érdeklıdésünk terébe kerül a neurális hálózatok témakör - fıbb okok: - adaptív rendszerek - felismerési
RészletesebbenAdatbányászat SAS Enterprise Miner
Adatbányászat SAS Enterprise Miner Hajas Csilla ELTE SAS gyakorlataihoz segédlet. Forrásként (a webrıl letöltve) felhasználtam Kiss Attila, Lukács András, Sidló Csaba és Kósa Balázs diasorozatait is, lásd
RészletesebbenTakács Árpád K+F irányok
Takács Árpád K+F irányok 2016. 06. 09. arpad.takacs@adasworks.com A jövőre tervezünk Az AdasWorks mesterséges intelligencia alapú szoftverterfejlesztéssel és teljes önvezető megoldásokkal forradalmasítja
RészletesebbenA PhysioBank adatmegjelenítő szoftvereinek hatékonysága
A PhysioBank adatmegjelenítő szoftvereinek hatékonysága Kaczur Sándor kaczur@gdf.hu GDF Informatikai Intézet 2012. november 14. Célok, kutatási terv Szabályos EKG-felvétel: P, Q, R, S, T csúcs Anatómiai
RészletesebbenTSIMMIS egy lekérdezés centrikus megközelítés. TSIMMIS célok, technikák, megoldások TSIMMIS korlátai További lehetségek
TSIMMIS egy lekérdezés centrikus megközelítés TSIMMIS célok, technikák, megoldások TSIMMIS korlátai További lehetségek 1 Információk heterogén információs forrásokban érhetk el WWW Társalgás Jegyzet papírok
RészletesebbenD é n e s T a m á s matematikus-kriptográfus
D é n e s T a m á s matematikus-kriptográfus e-mail: tdenest@freemail.hu Gondolatok a társadalomkutatás módszertanáról és oktatásáról (Társadalom-holográfia) 1. Elméleti elızmények A társadalomkutatás
RészletesebbenGépi tanulás a gyakorlatban SVM
Gépi tanulás a gyakorlatban SVM Klasszifikáció Feladat: előre meghatározott csoportok elkülönítése egymástól Osztályokat elkülönítő felület Osztályokhoz rendelt döntési függvények Klasszifikáció Feladat:
RészletesebbenAz információs rendszerek adatai
Az információs rendszerek adatai Nagy mennyiségű adat Tárolás Karbantartás Visszakeresés, feldolgozás Adatbázis 2 Az adatbázis fogalma Az adatbázis együtt tárolt, egymással kapcsolatban levő adatok rendszere.
RészletesebbenAlkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.
Tudásmodellezés Kereskedelmi Alkalmazásokban Dezsényi Csaba Ovitas Magyarország kft. Tudásmenedzsment Adat -> Információ -> Tudás Intézményi tudásvagyon hatékony kezelése az üzleti célok megvalósításának
RészletesebbenAz egységes tartalomkezelés üzleti előnyei
CNW Rendszerintegrációs Zrt. Mészáros Tamás értékesítési igazgató Az egységes tartalomkezelés üzleti előnyei NetRegisterX - Webes dokumentumkezelési megoldások A-Z-ig 1 Az éves papírfelhasználás mértéke
RészletesebbenGEOSTATISZTIKA II. Geográfus MSc szak. 2019/2020 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ
GEOSTATISZTIKA II. Geográfus MSc szak 2019/2020 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ Miskolci Egyetem Műszaki Földtudományi Kar Geofizikai és Térinformatikai Intézet A tantárgy adatlapja Tantárgy neve:
RészletesebbenGáspár Bencéné Vér Katalin * AZ ÜZLETI INTELLIGENCIA RENDSZEREINEK KIALAKULÁSÁRÓL
123 Gáspár Bencéné Vér Katalin * AZ ÜZLETI INTELLIGENCIA RENDSZEREINEK KIALAKULÁSÁRÓL Az igazi szûk keresztmetszet nem technológiai, nem pénzügyi, de még csak nem is információs szûkösség. A kényszertényezõ
RészletesebbenAz adatbázisrendszerek világa
Az adatbázisrendszerek világa Tankönyv: Ullman-Widom: Adatbázisrendszerek Alapvetés Második, átdolgozott kiadás, Panem, 2009 1.1. Az adatbázisrendszerek fejlődése 1.2. Az adatbázis-kezelő rendszerek áttekintése
RészletesebbenA szak specializációi
A szak specializációi Specializációk A specializációválasztás során a hallgatónak preferenciasorrendet kell megjelölnie, legalább két specializáció megadásával. A specializációkra történő besorolás a hallgatók
Részletesebben1. elıadás. Információelmélet Információ technológia Információ menedzsment
http://vigzoltan.hu 1. elıadás A számítógépes információ rendszerk tudománya, amely tartalmazza az alábbiakat: Elméleti összefüggések Szemlélet Módszertant a tervezéshez, fejlesztéshez üzemeltetéshez Tartalmazza
RészletesebbenADATBÁZIS-KEZELÉS. Adatbázis-kezelő rendszerek
ADATBÁZIS-KEZELÉS Adatbázis-kezelő rendszerek Adat (Data) Észlelhető, felfogható ismeret Jelsorozat Tény, közlés Valakinek vagy valaminek a jellemzője Adatbázis (Data Base, DB) Hosszú ideig évekig meglévő
RészletesebbenNagyméretű adathalmazok kezelése (BMEVISZM144) Reinhardt Gábor április 5.
Asszociációs szabályok Budapesti Műszaki- és Gazdaságtudományi Egyetem 2012. április 5. Tartalom 1 2 3 4 5 6 7 ismétlés A feladat Gyakran együtt vásárolt termékek meghatározása Tanultunk rá hatékony algoritmusokat
RészletesebbenA bioinformatika oldaláról a Human Protein Szervezet (Human Protein Organization HUPO) alelnöke bemutatta, hogy az ő szakterületükön.
1025 Folyóiratszemle Sedransk, N. Young, L. J. Kelner, K. L. Moffitt, R. A. Thakar, A. Raddick, J. Ungvarsky, E. J. Carlson, R. W. Apweiler, R. Cox, L. H. Nolan, D. Soper, K. Spiegelman, C.: Legyenek nyilvánosak
Részletesebben3D számítógépes geometria és alakzatrekonstrukció
3D számítógépes geometria és alakzatrekonstrukció 14. Digitális Alakzatrekonstrukció - Bevezetés http://cg.iit.bme.hu/portal/node/312 https://www.vik.bme.hu/kepzes/targyak/viiima01 Dr. Várady Tamás, Dr.
RészletesebbenPROGRAMTERVEZŐ INFORMATIKUS ALAPKÉPZÉSI SZAK
PROGRAMTERVEZŐ INFORMATIKUS ALAPKÉPZÉSI SZAK 1. Az alapképzési szak megnevezése: programtervező informatikus (Computer Science) 2. Az alapképzési szakon szerezhető végzettségi szint és a szakképzettség
RészletesebbenPROJEKTVEZETŐI DÖNTÉSEK TÁMOGATÁSA WEBBÁNYÁSZATTAL
PROJEKTVEZETŐI DÖNTÉSEK TÁMOGATÁSA WEBBÁNYÁSZATTAL Bóta László, e-mail: botal@ektf.hu Eszterházy Károly Főiskola Adatbányászat, a webbányászat alapja A jól működő projektek döntés-előkészítési és ellenőrzési
RészletesebbenRegresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.
Regresszió Csorba János Nagyméretű adathalmazok kezelése 2010. március 31. A feladat X magyarázó attribútumok halmaza Y magyarázandó attribútumok) Kérdés: f : X -> Y a kapcsolat pár tanítópontban ismert
RészletesebbenPannon Egyetem Vegyészmérnöki és Anyagtudományok Doktori Iskola
Pannon Egyetem Vegyészmérnöki és Anyagtudományok Doktori Iskola Doktori (Ph.D.) értekezés tézisei Számítási intelligencia alapú regressziós technikák és Készítette Kenesei Tamás Péter Témavezető: Dr. habil.
RészletesebbenAdatbányászat: Bevezetés. 1. fejezet. Tan, Steinbach, Kumar Bevezetés az adatbányászatba
Adatbányászat: Bevezetés 1. fejezet Tan, Steinbach, Kumar Bevezetés az adatbányászatba előadás-fóliák fordította Ispány Márton Mi az adatbányászat? Bár hosszú évek óta alkalmazzuk még mindig nincs egyértelmű
RészletesebbenTANTÁRGYI ÚTMUTATÓ. Alkalmazott számítástechnika. tanulmányokhoz
2. évfolyam szakirány BA TANTÁRGYI ÚTMUTATÓ Alkalmazott számítástechnika tanulmányokhoz TÁVOKTATÁS Tanév (2014/2015) 1. félév A KURZUS ALAPADATAI Tárgy megnevezése: Alkalmazott Számítástechnika Tanszék:
RészletesebbenTisztán kivehetı tendencia: kommunikációs hálózatok egyre bonyolultabbakká válnak Hálózat bonyolultsága
@ Budapest University of Technology and Economics Nagy hálózatok evolúciója Gulyás András, Heszberger Zalán High Speed Networks Laboratory Internet trendek Tisztán kivehetı tendencia: kommunikációs hálózatok
RészletesebbenDöntéstámogatás terepi gyakorlatokon
Döntéstámogatás terepi gyakorlatokon Forczek Erzsébet 1 Karsai János 1 - Berke József 2 1 Szegedi Tudományegyetem, Általános Orvostudományi Kar Orvosi Informatikai Intézet, 6720 Szeged, Korányi fasor 9.
RészletesebbenSzámítógépes döntéstámogatás. Bevezetés és tematika
SZDT-01 p. 1/18 Számítógépes döntéstámogatás Bevezetés és tematika Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Előadás SZDT-01 p. 2/18 SZDT-01
Részletesebben{simplecaddy code=1004}
{simplecaddy code=1004} Könyvünk az adatbányászat tevékenységének lépéseit részletesen bemutatva kívánja megismertetni az olvasót, azzal hogy milyen jellegű gazdasági, mérnöki, illetve tudományos problémák
RészletesebbenKompetenciák fejlesztése a pedagógusképzésben. IKT kompetenciák. Farkas András f_andras@bdf.hu
Kompetenciák fejlesztése a pedagógusképzésben IKT kompetenciák Farkas András f_andras@bdf.hu A tanítás holisztikus folyamat, összekapcsolja a nézeteket, a tantárgyakat egymással és a tanulók személyes
RészletesebbenTakács Gábor mérnök informatikus, okl. mérnöktanár
Takács Gábor mérnök informatikus, okl. mérnöktanár takacsg@sze.hu http://rs1.sze.hu/~takacsg/ Big Data Definition Big Data is data that can t be stored or analyzed using traditional tools. Információ tartalom,
RészletesebbenÜzleti intelligencia skálázható architektúrákon
Üzleti intelligencia skálázható architektúrákon Doktori értekezés tézisek Sidló Csaba István Témavezető: Lukács András Ph.D. Eötvös Loránd Tudományegyetem Informatikai Kar Információs Rendszerek Tanszék
RészletesebbenMicskei Zoltán Strausz György. Méréstechnika és Információs Rendszerek Tanszék.
Micskei Zoltán Strausz György Méréstechnika és Információs Rendszerek Tanszék https://www.mit.bme.hu/oktatas/targyak/vimiac04 1 Hogyan építsünk információ gazdag megoldásokat? Információ/adat integráció
RészletesebbenA webanalitika változó világa 4 felvonásban
A webanalitika változó világa 4 felvonásban Arató Bence, BI Consulting Email: arato@bi.hu, Twitter: @aratob Traffic Meetup, 2013.02.06 1 Bemutatkozás 15 éves szakmai tapasztalat az üzleti intelligencia
Részletesebben- Adat, információ, tudás definíciói, összefüggéseik reprezentációtípusok Részletesebben a téma az AI alapjai című tárgyban
I. Intelligens tervezőrendszerek - Adat, információ, tudás definíciói, összefüggéseik reprezentációtípusok Részletesebben a téma az AI alapjai című tárgyban Adat = struktúrálatlan tények, amelyek tárolhatók,
RészletesebbenAz információs rendszerek adatai
Az információs rendszerek adatai Nagy mennyiségű adat Tárolás Karbantartás Visszakeresés, feldolgozás Adatbázis 2 Az adatbázis fogalma Az adatbázis együtt tárolt, egymással kapcsolatban levő adatok rendszere.
RészletesebbenA szemantikus világháló oktatása
A szemantikus világháló oktatása Szeredi Péter Lukácsy Gergely Budapesti Műszaki és Gazdaságtudományi Egyetem Számítástudományi és Információelméleti Tanszék ➀ A szemantikus világháló... c. tárgy ➁ A tananyag
RészletesebbenAdatbányászat. Gyakori elemhalmazok Asszociációs és döntési szabályok. Szegedi Tudományegyetem. Vásárlói kosarak Gyakori elemhalmazok FP-growth
Asszociációs és döntési szabályok Szegedi Tudományegyetem Mire megyünk a gyakori elemhalmazokkal? A különféle adatbázisokban gyakran együttesen előforduló jellemzők ismerete hasznos lehet Mit kezd vele
RészletesebbenGépi tanulás és Mintafelismerés
Gépi tanulás és Mintafelismerés jegyzet Csató Lehel Matematika-Informatika Tanszék BabesBolyai Tudományegyetem, Kolozsvár 2007 Aug. 20 2 1. fejezet Bevezet A mesterséges intelligencia azon módszereit,
Részletesebben