Vezetői információs rendszerek

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Vezetői információs rendszerek"

Átírás

1 Adatbányászás I. Adatbányászás Növekvő adatmennyiség egyre nehezebbé válik az adatokból a kívánt információ kinyerése. Új technika szükséges, amely lehetővé teszi, hogy megismerhetővé, kinyerhetővé váljon a nagy adathalmazokban rejlő tudás. (adat tudás) Az új technika: Adatbányászás (Data Mining) az 1990-es években jelent meg az üzleti köztudatban. Az adatbányászás olyan adatelemzési folyamat, a- mely nagy adatbázisokból érvényes, hasznos, rejtett, előzőleg nem ismert információkat tár fel. 1

2 Folyamat: nem automatikusan generálja a korábban nem látott adatokból a felhasználhat tudást, hanem egy rendkívül összetett folyamat révén. Érvényes: az adatokból kinyert információnak pontosnak, teljesnek kell lennie. Pl.: ha valamilyen szempont szerint kell kiválogatni egy adatbázisból a megfelelő ügyfeleket, fontos hogy minden, a kritériumnak megfelelő ügyfelet azonosítsunk. Hasznos: nem elegendő a pontos ismeretek feltárása, a feltárt tudásnak az adott elemzés szempontjából hasznosnak kell lennie. (Hasznosság mérése nem mindig mérhető.) Előzőleg nem ismert: az adatbányászás felfedező jellegű adatelemzés. Adatelemzés célja: megerősítés és felfedezés. Megerősítés: egy adott hipotézis megerősítése. Felfedezés (tudásfeltárás): a rendszer autonóm módon generál hasznos mintákat az adatokból. 2

3 Adatok információvá történő átalakítása: 1. Hagyományos mód az adatok manuális elemzése, interpretálása. Az adott tématerület szakértői időszakosan elemzik az elmúlt időszakban összegyűlt adatok által mutatott trendeket. A szakértők jelentésekben foglalják össze tapasztalataikat ezek a jövőbeli döntéshozatalban hasznosulnak. Ezekben az esetekben az adat alapú tudásfeltárás folyamata lassú, drága és szubjektív. Adatok információvá történő átalakítása: 2. Adatbányászási módszerekkel : - így szakértői döntések automatizálhatók, - az automatizálás lehetővé teszi emberi erőforrás megtakarítását, - továbbá lehetővé válik a kérdésekre adott válaszok reakció idejének lerövidítése. 3

4 Adatok megőrzése: nem kétséges a folyamatosan gyűlő adatok megőrzésére szükség van. Az egyre duzzadó adathalmaz értékes információkat rejthet. Mekkora adathalmaz keletkezhet évente? 2002-es felmérés (Berkeley Egyetem) szerint abban az évben öt exabájt adat keletkezett: 92 %-a merevlemezen, 7 %-a filmen, 0,01 %-a papíron, 0,002 %-a optikai eszközön (DVD,CD) került tárolásra. Mennyi az az öt exabájt? Kb. annyi, mintha a föld minden lakosa (6.3 billió ember) évente egy CD-nyi (800 Mbájt) adatot termelne. Kritikus jelenség: az adatok egyre nagyobb menynyiségben keletkeznek a keletkezés sebessége az elmúlt 3 évben megháromszorozódott. Adat tudás, információ tudás 4

5 Adatbányászás és statisztika: Hasonlóság: mindkettő adatelemzési módszer. Különbözőség: 1. A statisztika mintákból következtet az eredeti sokaság tulajdonságaira, az adatbányászási módszerek pedig a rendelkezésre álló adatbázist elemzik. 2. A statisztika az adatbázison kívüli információra támaszkodva állítja fel a modelljét, hipotézisét és teszteli azt. Az adatbányászás közvetlenül az adatbázisból képes előzőleg nem ismert összefüggések kinyerésére. A tudásfeltárás folyamata és az adatbányászás Adatbázisokban végzett tudásfeltárás : (Knowledge Discovery in Databases, KDD) 1995-ben Montreál itt tartották az első tudásfeltárásról szóló konferenciát. Döntés: 1. KDD azt a teljes folyamatot jelentse, amelynek során az adatokból kinyerjük az információt. 2. Az adatbányászás a tudásfeltárás folyamatának az a lépése, amelyben az adatokban lévő összefüggések felfedezése történik. 5

6 A KDD folyamatának lépései 1. Adatkiválasztás: az elemzéshez szükséges adatok kiolvasása az adatbázisból. 2. Adatelőkészítés: adattisztítás, adatbővítés, adattranszformáció (kódolás) - a nem megfelelő adatok eltávolítása, esetleg a vizsgálatokhoz hiányzó adatok integrálása, az adatoknak a vizsgálatok számára használható alakra hozása. 3. Adatbányászás: olyan eljárás, amely során adatbányászási technikák (klaszterezés, osztályozás, stb.) alkalmazásával feltárjuk az ismeretlen, új trendeket, összefüggéseket, ill. mintázatokat. A KDD folyamatának lépései 4. Jelentéskészítés: az előző lépés eredményeinek a végfelhasználó számára értelmezhető formában történő megadása. A fenti folyamat egyes lépései általában különböző feladatköröket ellátó emberek együttes munkája. Pl. az adatelőkészítési lépésben együtt kell dolgozniuk az adatgyűjtőknek az adatbányászokkal, a jelentés készítés pedig az adatbányászoknak a szakértőkkel való közös tevékenységét igényli. 6

7 Különböző feladatköröket ellátó szakemberek együttes munkája: Adatgyűjtők Adatbányászok Szakértők Üzleti analízis Adatanalízis Adatgyűjtés Adatelőkészítés Adatbányászás Eredmények reprezentálása Üzleti alkalmazás Üzleti visszajelzés A KDD folyamatának jellemzői A tudásfeltárás általában nem lineáris folyamat bármely lépésben előfordulhat hogy az előző lépésben kapott információ nem megfelelő ekkor vissza kell térni a megelőző lépés(ek)hez, és módosított adatokkal, paraméterekkel, esetleg más eszközzel kell folytatni a munkát, megismételve egyes lépés(eke)t a tudásfeltárás általában egy iteratív folyamat. 7

8 A KDD folyamatának jelemzői A tudásfeltárás folyamatában az új tudást az adatbányászási lépés adja, ennek ellenére minden lépés egyforma fontossággal bír. Megfelelő adatok nélkül nem lehetséges ugyanis az adatbázisban meglévő ismeretlen összefüggések megismerése. A folyamat időigényét tekintve sem maga a 3. lépés tart a legtovább, a szükséges idő 80%-át az adatelőkészítés és a kapott eredmények értékelhető formába öntése teszi ki. A KDD és az adatbányászat Az adatbányászás a fentiek szerint egy lépés a tudásfeltárás folyamatában. Ennek ellenére az iparban, a felhasználók körében az adatbányászás elnevezést a KDD szinonimájaként is használják. Az adatbányászás terminológia a teljes folyamatra sokkal elterjedtebb, mint a jóval hosszabb tudásfeltárás adatbázisokban elnevezés. Ezért szerepelt már a definícióban is az adatbányászás egy adatelemző folyamatként. 8

9 Adatbányászáshoz kapcsolódó tudományágak Adatbázisok Szakértői rendszerek Megjelenítés Adatbányászás Gépi tanulás Információ technika Más tudományágak Az adatbányászás alkalmazási lehetőségei Az adatbányászási feladatok osztályozása (adatelemzési szempontból): 1. leíró adatbányászási feladat: az adatbázisban tárolt adatok alap (általános) jellemzőit határozza meg 2. előrejelző (következtetétes) adatbányászási feladat: a meglévő adatokból az alapvető összefüggések, mintázatok (adatok egymáshoz viszonyított elhelyezkedése) feltárásával prognosztizál. 9

10 Leggyakrabban használt adatbányászási technikák 1. A társításelemzés társítási szabályok (asszociációs szabályok) feltárását jelenti Azt vizsgájuk, hogy az adatbázis elemei között létezik-e összefüggés. Ha létezik, akkor ez adatbányászási eszközökkel feltárható és a kapcsolat erőssége is jellemezhető. Ez az eljárás széles körben a kereskedelemben, a bevásárlókosár típusú elemzéseknél használható. PL.: Egy adatbányászási elemzés során a következő társítási szabályt tárták fel: életkor( XY, év) és éves jövedelem (XY, 5-8 millió Ft) autót vesz(xy, Audi), (gyakoriság= 5%, bizonyosság=30%), ahol XY a vásárló azonosítója. Ez a szabály azt fejezi ki, hogy a vizsgált vásárlóknak (az adatbázisban levő rekordoknak) az 5%-ára érvényes az életkorra és a jövedelemre vonatkozó feltétel és 30 % a valószínűsége, hogy az életkorra és a jövedelemre megfogalmazott feltételeknek eleget tevő vásárlók Audi gépkocsit vásárolnak. 10

11 Leggyakrabban használt adatbányászási technikák 2. Csoportosítás (klaszterezés) segítségével az adatoknak csoportokba (klaszterekbe) sorolása történik úgy, hogy az egyes csoportokba egymáshoz hasonló elemek kerüljenek, az egyes csoportok viszont jelentősen különbözzenek egymástól. Az egy csoporthoz tartozó elemek esetén maximalizáljuk, a különböző csoportokhoz tartozó elemek esetében viszont minimalizáljuk a hasonlóságot. A feltárt csoportok lehetnek egymást kizáróak, de akár egymással átfedők is. Az adatok három csoportba (klaszterbe) sorolásának kétdimenziós szemléltetése A klaszterezés tipikus példája: a piackutatás. Vásárlási szokások alapján lehetőleg homogén vásárlói csoportokat határoznak meg. Ezek a csoportok kereskedelmi célcsoportok jól használhatók a marketing tevékenység optimalizálása érdekében bizonyos reklám anyagot csak a megfelelő célcsoporthoz juttatnak el. 11

12 Leggyakrabban használt adatbányászási technikák 3. Az osztályozás jellemzője, hogy egy adott (kiválasztott) ismérv alapján akarjuk az adatbázis elemeit (rekordjait) megkülönböztetni, osztályokba sorolni. Ezt a kiválasztott ismérvet szokás osztálycímkének nevezni. Osztálycímke csak olyan ismérv lehet, ami véges számú különböző értéket vehet fel ez azt jelenti, hogy ismert hány osztály létezik. Az osztályba sorolás osztályozási szabályok alapján történik különféle módszerek segítségével. Cél minden esetben olyan szabály felállítása, amelynek segítségével a legpontosabban lehet szeparálni az adatokat a megfelelő osztályba. Az osztályozást gyakran alkalmazzák pl. pénzintézeti vizsgálatoknál (ügyfelek hitelképességének megadása, biztosítási kockázatbecslés), orvosi alkalmazásoknál. Például egy pénzintézet ügyfeleit hitelképessége szerint szeretné osztályozni jó, közepes és gyenge minősítésű osztályokba. Az osztályba sorolás alapján jellemezni lehet az egyes csoportokba tartozó ügyfeleket, és ezek a- lapján a pénzintézet egy új ügyfél hitelkérelméből azt is el tudja dönteni (előrejelzés), hogy hitel visszafizetés szempontjából jó ügyfél lesz-e. 12

13 A csoportosítás és az osztályozás hasonló technika. Lényeges eltérés van a két módszer között: Az osztályozásnál az osztálycímke megadásával ismertek az osztályok, annak számossága is, míg a csoportosításnál nem ismertek előre a csoportok, az adatok a- lapján kell létrehozni az adatokra jellemző csoportokat. Ezek alapján a klaszterezés olyan osztályozásként is felfogható, ahol nem ismert az osztálycímke. Ezek alapján az osztályozás a gépi tanulás területén a felügyelt tanulás (példák alapján történő tanulás) egy formája, míg a csoportképzés felügyelet nélküli tanulási forma. Leggyakrabban használt adatbányászási technikák 4. A fejlődésanalízis az időben változó adatok időben változó viselkedési szabályosságait modellezi. A regresszió-vizsgálat célja egy előrejelzésre alkalmas függvény megadása, amelynek segítségével ismert értékekből más numerikus érték(ek)re lehet következtetni. Pl. jó példa erre, amikor értékpapír befektetési döntésekhez az értékpapírárak alakulásának előrejelzéséhez az értékpapírt kibocsátó társaságok gazdasági fejlődésének jövőbeli szabályszerűségeit tárják fel adatbányászási módszerekkel. 13

14 Az idősorok elemzése akkor kerül be az adatbányászási feladatok közé, amikor a hagyományos statisztikai idősor elemzési eszközök már nem alkalmazhatók a feladat bonyolultsága (túl sok változó) miatt. Az előállított minták használhatósága Ezekkel a technikákkal elvben nagyon sok szabály, mintázat (minta) előállítható Az előállítható minták jó része nem érdekes a felhasználók szempontjából. Azt szokás mondani, hogy egy minta érdekes: - ha egyszerűen érthető, - adott megbízhatósággal érvényes új, vagy kísérleti adatokon, - hasznos és újszerű. A kapott eredmények érdekességi megítélésére objektív és szubjektív érdekességi mértékek adhatók meg. 14

15 Objektív érdekességi mérték lehet pl. társítási szabályok megadása esetén a kapott szabály megalapozottsága, gyakorisága, azaz az adatbázisban levő adatok (rekordok) százalékos aránya. A szubjektív érdekességi mérték általában valamilyen felhasználói meggyőződést jelent: - nem az elvárásnak megfelelő minták (felhasználói meggyőződésnek ellentmondó) - elvárásnak megfelelő minták. Ez utóbbiak akkor érdekesek, ha megerősítik a felhasználó feltételezését. Az objektív és szubjektív mértékeket mindig társítani célszerű pl. nem ugyanazok az eredmények lesznek érdekesek egy cég kereskedelmi igazgatójának és az alkalmazottak teljesítményét vizsgáló elemzőnek. Az érdekességi mértékek figyelembevétele: 1. Ha az adatbányászás után történik akkor a feltárt mintákat érdekességük szerint rangsorolják, elhagyva az érdekteleneket. 2. Sokkal előnyösebb azonban, ha a mértékek magát az adatbányászási folyamatot irányítják, korlátozzák: ekkor eleve kizárják az érdekességi mértéknek eleget nem tevő minták keresését. 15

16 Adatbányászási módszertanok 1990 évek elején kezdődik a speciális adatbányászási szoftverek kifejlesztése. Első üzleti célú adatbányászási program: Clementine (Integral Solutions Ltd. terméke) Igény az adatbányászási feladatok végrehajtásához módszertan kifejlesztésére ban készült el az iparágaktól független adatbányászási módszertani szabvány a : CRISP_DM (Cross Industry Standard Process for Data Mining) A módszertan lényege: az adatbányászási folyamat mindegyik szakaszában ellenőrzési listákkal, útmutatásokkal, célok és feladatok meghatározásával segíti az elemzési feladat végrehajtását. A felmérések szerint a legelterjedtebb módszertan egyértelműen a CRISP_DM ( 16

17 SAS cég is meghatározta a saját módszertanát: SEMMA (Sample, Explore,Modify, Model, Assess) (mintavételezés, vizsgálat, módosítás, modellezés és értékelés lépésekből áll a módszertan.) ( ner/semma.html ) Nem tekinthető egy teljes adatbányászati projekt megvalósítását leíró módszertannak, hiszen annál szűkebb: csak az elemzés és a modell építés fázisaira szűkül. Lépései: Sample (mintavételezés ): Amennyiben nagy mennyiségű adattal állunk szemben, vegyünk mintát, amely elég kicsi ahhoz, hogy kezelhető legyen, de elég nagy, hogy magában hordozzon minden lényeges információt, amit a teljes sokaság is! (Alkalmazása opcionális!) Explore (vizsgálat) : Keressünk adatainkban összefüggéseket, trendeket, kiugró értékeket, ezzel segítve az adatok megértését, és hipotézisek felállítását! 17

18 Modify (módosítás) : Transzformáljunk változókat, hagyjunk el lényegteleneket, és hozzunk létre újakat a jobb modellalkotás elősegítéséhez! Model (modellezés): Építsünk modelleket, melyek automatikusan megtalálják a szignifikáns változókat, amelyek jó becsléseket, előrejelzéseket képesek adni! Assess (értékelés) : Értékeljük adatainkat az adatbányászati projekt eredményeinek hasznosulása és megbízhatósága alapján! Vizsgáljuk meg, mekkora pontossággal működnek modelljeink! Adatbányászati módszertanok elterjedése: (KDNuggets 2004-es felmérése 170 válasz) Módszertan Százalékos arány CRISP-DM (72) 42 % SEMMA (17) 10 % A cég saját módszertana (11) 6 % Saját módszertan (48) 28 % Egyéb (10) 6 % Semmilyen (12) 7 % 18

19 Az adatbányászási folyamat lépései a CRISP-DM szerint 1. Üzleti célok megadása, helyzetfelmérés 2. Adatok kiválasztása 3. Adatelőkészítés 4. Adatbányászási modellek megadása 5. Eredmények üzleti célú értékelése A nyilak mutatják, hogy az egyes fázisok között visszacsatolások lehetségesek, sőt bizonyos esetekben szükségesek. 6. Eredmények üzleti célú alkalmazása 1. Az üzleti célok definiálása, helyzetfelmérés 1.Üzleti cél pontos meghatározása, a korlátok és a lehetőségek felmérése. 2.El kell végezni a helyzetfelmérést: rendelkezésre álló erőforrások feltárása (beleértve az idő- és anyagi erőforrást), korlátok, kockázatok feltárása és minden olyan egyéb tényező meghatározása, a- mely befolyással lehet a feladat sikeres teljesítésére. Nem hagyható el a költségek és a várható haszon vizsgálata sem. 1. Üzleti célok megadása, helyzetfelmérés 2. Adatok kiválasztása 3. Adatelőkészítés 4. Adatbányászási modellek megadása 5. Eredmények üzleti célú értékelése 6. Eredmények üzleti célú alkalmazása 19

20 1. Üzleti célok megadása, helyzetfelmérés 3.Ezek után következik a meghatározott üzleti cél lefordítása adatbányászási feladattá. 4.Ennek a fázisnak az utolsó lépéseként el kell készíteni az adatbányászási feladat részletes megvalósítási tervét, amely konkrétan tartalmazza az elemzési lépéseket az alkalmazandó technikákkal és eszközökkel együtt. 2. Adatok kiválasztása 3. Adatelőkészítés 4. Adatbányászási modellek megadása 5. Eredmények üzleti célú értékelése 6. Eredmények üzleti célú alkalmazása 2. Az adatok kiválasztása 1.Meg kell adni a megfogalmazott feladat megoldásához szükséges adatokat. 2.Általában iterációs szakasz következik: összhangba kell hozni az elérendő célt és a rendelkezésre álló adatokat, a- mi az előző fázisba való többszöri viszszalépéssel oldható meg. 3.A kiindulási adatok összegyűjtése saját adattárházból, információs rendszerekből, egyéni táblákból, ill. külső adatok beszerzése (pl. árfolyam adatok). 1. Üzleti célok megadása, helyzetfelmérés 2. Adatok kiválasztása 3. Adatelőkészítés 4. Adatbányászási modellek megadása 5. Eredmények üzleti célú értékelése 6. Eredmények üzleti célú alkalmazása 20

21 4.Érdemes ellenőrizni az adatokat feltöltöttség, lefedettség és adathelyesség szempontjából is. 5.Célszerű az összegyűjtött adatokat elemezni: megvizsgálni a tulajdonságaikat, alapstatisztikai számításokat végezni. 1. Üzleti célok megadása, helyzetfelmérés 2. Adatok kiválasztása 3. Adatelőkészítés 4. Adatbányászási modellek megadása 5. Eredmények üzleti célú értékelése 6. Eredmények üzleti célú alkalmazása 3. Adatelőkészítés (előfeldolgozás) Cél: javuljon az adatok minősége és ezzel az adatbányászás eredményessége. Fontos, mert megalapozott döntések csak megbízható adatok ismeretében hozhatók. Feladat: Az adatokban fellépő anomáliák megkeresése, kijavítása és szükség esetén az elemezendő adatmennyiség csökkentése az ezekre fordított idő bőven megtérülhet a döntéshozatal során. 1. Üzleti célok megadása, helyzetfelmérés 2. Adatok kiválasztása 3. Adatelőkészítés 4. Adatbányászási modellek megadása 5. Eredmények üzleti célú értékelése 6. Eredmények üzleti célú alkalmazása 21

22 Az adatok előfeldolgozásának műveletei Ügyfélkód Név Cím Előfiz. dátum Folyóirat 1001 Kiss János Petőfi u HVG 1001 Kiss János Petőfi u Autós élet 1001 Kiss János Blikk 1023 Nagy József Viola u Blikk 1045 Nagy János Rózsa u Sport újság 1056 Kiss János Petőfi u Lakáskultúra Kiinduló adatok: Folyóirat előfizetéseket tartalmazó rekordok ezek esetén nézzük meg az előfeldolgozás leggyakrabban előforduló feladatait. Adattisztítás Szükséges, mert a rendelkezésre álló adatok gyakran hiányosak, zajosak, duplán előfordulhatnak, inkonzisztensek (belső ellentmondást tartalmaznak). Hiányzó adatok esetén használható eljárás: a sor törlése, a hiányzó érték manuális kitöltése, numerikus adatoknál az attribútum átlagértékkel történő pótlása (pl. ügyfél keresete adat esetén), legvalószínűbb érték használata a hiányzó érték pótlására. 22

23 Adattisztítás Zaj: az adatokra rakódott, véletlenszerű hibák. Előfordulása: gyakori, ha az adatok mérési eredményekből adódnak. Gond: A zaj miatt fellépő kiugró értékek általában távol vannak a helyes adatoktól. Javítása: - egyik módja az adatsimítás, amely a kiugró értéket a szomszédos adatok alapján módosítja, - használható módszerek továbbá a kosarazás és a klaszterezés is. Adattisztítás Duplázódás : általában tévedés miatt. Megszüntetése: a felhasználó döntése alapján, vagy mintaelemzési technikák segítségével történhet. Ellentmondásos adatok kiszűrésére már az adatok megadásánál lehetőség van. Az adatbáziskezelő rendszerek ugyanis lehetőséget nyújtanak arra, hogy a bennük tárolt információkra megszorításokat lehessen előírni (constraint). 23

24 Adatok integrálása és transzformálása Az adatok integrálása az a folyamat, amikor a kitűzött feladat megoldásához szükséges, különböző forrásból származó adatokat egyetlen adattárban egyesítik. Probléma: - egyedazonosítás El kell dönteni pl. a különböző helyről származó adatok esetében ugyanazt jelenti-e a vevő_kód és a vásárló_id? - redundáns adatok kiszűrése, - ellentmondó adatértékek felderítésére és kijavítása. Új adatok beszerzése és a felismert hibák javítása utáni állapot: Ügyfél -kód Név Szül. dátum Jövedelem Ft-ban Gépkocsi Cím Előfiz. dátum Folyóirat 1001 Kiss János van Petőfi u HVG 1001 Kiss János van Petőfi u Autós élet 1001 Kiss János van Petőfi u Blikk 1023 Nagy József van Viola u Blikk 1045 Nagy János nincs Rózsa u Sportújság 1001 Kiss János van Petőfi u Lakáskultúra 24

25 Adatok transzformálása A kiindulási adatokat az adatbányászás céljainak, az alkalmazni kívánt technikának megfelelő alakra kell hozni. Pl. a neuron hálózatok alkalmazása numerikus adatokat igényel, míg a döntési fáknál szimbolikus értékek is használhatók. A transzformációnál vigyázni kell arra, hogy ne történjen információvesztés. Gyakran használt transzformáció a normalizálás, amikor az adatokat egy előre megadott tartományba vetítik le, pl. a [0,1] intervallumba. Az adatok redukálása Cél: az adathalmaz elemzése ne váljon lehetetlenné az elemzéshez szükséges idő miatt. Csökkentés végrehajtása: adathalmaz méretében jóval kisebb legyen, de a redukált adathalmazon végzett bányászat várhatóan az eredetivel azonos, vagy majdnem azonos eredményt adjon. Lehetséges módszerek: - dimenziócsökkentés, - adattömörítés, - számosságcsökkentés. 25

26 Az adatok redukálása Dimenziócsökkentés:redukálja az adathalmaz méretét. Az adatbányászási feladat szempontjából érdektelen attribútumo(ka)t eltávolítja, vagy minden attribútumot figyelembe véve új, kevesebb számú attribútumot hoz létre. Adatok tömörítése: az adatokat kódolással, vagy transzformációs műveletekkel hozzuk tömörebb alakra. Számosság csökkentés: a tárolandó rekordok számát csökkentjük Mindhárom esetben számos módszer létezik. A végső adatok Kód Név Kor Jövedelem Autó Ter. kód Folyóirat 1001 Kiss János HVG 1001 Kiss János Autós élet 1001 Kiss János Blikk 1023 Nagy József Blikk 1045 Nagy János Sport újság 1001 Kiss János Lakáskultúra 26

27 A változtatások: A végső adatok 1. Címek helyett területi kódok tömörítés. 2. Születési dátum helyett a kor és a jövedelem helyett jövedelem/1000 így ez a két érték közel azonos nagyságrendű könnyebben értelmezhető és ábrázolható a kettő közötti kapcsolat. 3. Ha a különböző újságok olvasói közötti kapcsolatok az érdekesek, akkor az előfizetési dátum nem fontos, ezért elhagyjuk. 4. Adatbányászási modellek megadása Modellező technika kiválasztása az elemezni kívánt adatok típusa alapján másféle algoritmus használható numerikus adatok esetén, vagy ha pl. jó adós, átlagos adós, rossz adós kategória váltózók szerint kell elemezni. 1. Üzleti célok megadása, helyzetfelmérés 2. Adatok kiválasztása 3. Adatelőkészítés 4. Adatbányászási modellek megadása 5. Eredmények üzleti célú értékelése 6. Eredmények üzleti célú alkalmazása Modell tesztelési módszerének meghatározása adatokból tanuló mintát és teszt mintát kell létrehozni. 27

28 Modellalkotás: a kiválasztott algoritmus alkalmazását jelenti. Az előzőleg kiválasztott technikával elvégezésre kerül a mintakeresés a rendelkezésre álló adatok között. A modell kiértékelése: a feltárt ismeretek értelmezését, megjelenítését jelenti. Ha az eredmények nem megfelelők, akkor az előző fázishoz való visszatéréssel kell folytatni a feladat megoldását. 1. Üzleti célok megadása, helyzetfelmérés 2. Adatok kiválasztása 3. Adatelőkészítés 4. Adatbányászási modellek megadása 5. Eredmények üzleti célú értékelése 6. Eredmények üzleti célú alkalmazása 5. A kapott eredmények üzleti célú értékelése Kapott eredmények vizsgálata: mennyire felelnek meg az előzetes üzleti elvárásoknak. Döntés a további teendőkről: - befejezés esetén: eredményeket értelmezhető formában át kell adni a felhasználóknak, - újabb kérdések felvetődése esetén vagy ha a kapott eredmények nem használhatók iterációs folyamat következik. 1. Üzleti célok megadása, helyzetfelmérés 2. Adatok kiválasztása 3. Adatelőkészítés 4. Adatbányászási modellek megadása 5. Eredmények üzleti célú értékelése 6. Eredmények üzleti célú alkalmazása 28

29 6. Az eredmények üzleti célú alkalmazása Ebben a fázisban kell megtervezni az eredmények felhasználását, beépítését az üzleti folyamatokba Biztosítani kell az alkalmazás frissítését, elkerülve a már nem aktuális adatokra épült modellek alkalmazását. Összefoglaló jelentés készítése: tartalmaznia kell a végrehajtott lépéseket, a kapott eredményeket és a jövőre vonatkozó, más feladatoknál is használható tapasztalatokat. 1. Üzleti célok megadása, helyzetfelmérés 2. Adatok kiválasztása 3. Adatelőkészítés 4. Adatbányászási modellek megadása 5. Eredmények üzleti célú értékelése 6. Eredmények üzleti célú alkalmazása Célszerű ismertetni a pozitívumok mellett a negatívumokat is: hol van szükség felülvizsgálatra, módosításokra. Megismerve a felhasználók tapasztalatait, összehasonlítható a valóság és a modell. A különbségek feltárása új modellek megalkotását ösztönözheti, vagy az összehasonlítás akár olyan tény(eke)t is kimutathat, amely(ek) a továbbiakban üzleti célként is használható(k). 1. Üzleti célok megadása, helyzetfelmérés 2. Adatok kiválasztása 3. Adatelőkészítés 4. Adatbányászási modellek megadása 5. Eredmények üzleti célú értékelése 6. Eredmények üzleti célú alkalmazása 29

30 30

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben. Tartalom Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben. Előszó 1. Az adatbányászatról általában 19 1.1. Miért adatbányászat? 21 1.2. Technológia a rejtett információk

Részletesebben

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék Adatelemzés intelligens módszerekkel Hullám Gábor Adatelemzés hagyományos megközelítésben I. Megválaszolandó

Részletesebben

Témaválasztás, kutatási kérdések, kutatásmódszertan

Témaválasztás, kutatási kérdések, kutatásmódszertan Témaválasztás, kutatási kérdések, kutatásmódszertan Dr. Dernóczy-Polyák Adrienn PhD egyetemi adjunktus, MMT dernoczy@sze.hu A projekt címe: Széchenyi István Egyetem minőségi kutatói utánpótlás nevelésének

Részletesebben

S atisztika 2. előadás

S atisztika 2. előadás Statisztika 2. előadás 4. lépés Terepmunka vagy adatgyűjtés Kutatási módszerek osztályozása Kutatási módszer Feltáró kutatás Következtető kutatás Leíró kutatás Ok-okozati kutatás Keresztmetszeti kutatás

Részletesebben

Az éghajlati modellek eredményeinek alkalmazhatósága hatásvizsgálatokban

Az éghajlati modellek eredményeinek alkalmazhatósága hatásvizsgálatokban Az éghajlati modellek eredményeinek alkalmazhatósága hatásvizsgálatokban Szépszó Gabriella Országos Meteorológiai Szolgálat, szepszo.g@met.hu RCMTéR hatásvizsgálói konzultációs workshop 2015. június 23.

Részletesebben

Kvantitatív módszerek

Kvantitatív módszerek Kvantitatív módszerek szimuláció Kovács Zoltán Szervezési és Vezetési Tanszék E-mail: kovacsz@gtk.uni-pannon.hu URL: http://almos/~kovacsz Mennyiségi problémák megoldása analitikus numerikus szimuláció

Részletesebben

PIACKUTATÁS (MARKETINGKUTATÁS)

PIACKUTATÁS (MARKETINGKUTATÁS) PIACKUTATÁS (MARKETINGKUTATÁS). FŐBB PONTOK A kutatási terv fogalmának meghatározása, a különböző kutatási módszerek osztályozása, a feltáró és a következtető kutatási módszerek közötti különbségtétel

Részletesebben

Hogyan lesz adatbányából aranybánya?

Hogyan lesz adatbányából aranybánya? Hogyan lesz adatbányából aranybánya? Szolgáltatások kapacitástervezése a Budapest Banknál Németh Balázs Budapest Bank Fehér Péter - Corvinno Visontai Balázs - KFKI Tartalom 1. Szolgáltatás életciklus 2.

Részletesebben

Leggyakrabban használt adatbányászási technikák. Vezetői információs rendszerek

Leggyakrabban használt adatbányászási technikák. Vezetői információs rendszerek Leggyakrabban használt adatbányászási technikák ADATBÁNYÁSZÁS II. 1. A társításelemzés társítási szabályok (asszociációs szabályok) feltárását jelenti. Azt vizsgájuk, hogy az adatbázis elemei között létezik-e

Részletesebben

Projektvezetői döntések támogatása webbányászattal

Projektvezetői döntések támogatása webbányászattal NETWORKSHOP 2008 2008. március 17-19. Dunaújváros, Dunaújvárosi Főiskola Projektvezetői döntések támogatása webbányászattal Bóta László Ph.D. hallgató (BME) Eszterházy Károly Főiskola, Eger BI (Business

Részletesebben

II. rész: a rendszer felülvizsgálati stratégia kidolgozását támogató funkciói. Tóth László, Lenkeyné Biró Gyöngyvér, Kuczogi László

II. rész: a rendszer felülvizsgálati stratégia kidolgozását támogató funkciói. Tóth László, Lenkeyné Biró Gyöngyvér, Kuczogi László A kockázat alapú felülvizsgálati és karbantartási stratégia alkalmazása a MOL Rt.-nél megvalósuló Statikus Készülékek Állapot-felügyeleti Rendszerének kialakításában II. rész: a rendszer felülvizsgálati

Részletesebben

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA BESZÉDTUDOMÁNY Az emberi kommunikáció egyik leggyakrabban használt eszköze a nyelv. A nyelv hangzó változta, a beszéd a nyelvi kommunikáció

Részletesebben

Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com

Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com Adatelemzés SAS Enterprise Guide használatával Soltész Gábor solteszgabee[at]gmail.com Tartalom SAS Enterprise Guide bemutatása Kezelőfelület Adatbeolvasás Szűrés, rendezés Új változó létrehozása Elemzések

Részletesebben

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016 Gyakorlat 8 1xANOVA Dr. Nyéki Lajos 2016 A probléma leírása Azt vizsgáljuk, hogy milyen hatása van a család jövedelmének a tanulók szövegértés teszten elért tanulmányi eredményeire. A minta 59 iskola adatait

Részletesebben

Méréselmélet MI BSc 1

Méréselmélet MI BSc 1 Mérés és s modellezés 2008.02.15. 1 Méréselmélet - bevezetés a mérnöki problémamegoldás menete 1. A probléma kitűzése 2. A hipotézis felállítása 3. Kísérlettervezés 4. Megfigyelések elvégzése 5. Adatok

Részletesebben

ELEMZŐ KAPACITÁS FEJLESZTÉSE, MÓDSZERTANI FEJLESZTÉS MEGVALÓSÍTÁSA

ELEMZŐ KAPACITÁS FEJLESZTÉSE, MÓDSZERTANI FEJLESZTÉS MEGVALÓSÍTÁSA TÁMOP-2.4.8-12/1-2012-0001 A munkahelyi egészség és biztonság fejlesztése, a munkaügyi ellenőrzés fejlesztése ELEMZŐ KAPACITÁS FEJLESZTÉSE, MÓDSZERTANI FEJLESZTÉS MEGVALÓSÍTÁSA Előadó: Szentesi Fekete

Részletesebben

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015 A mérés problémája a pedagógiában Dr. Nyéki Lajos 2015 A mérés fogalma Mérésen olyan tevékenységet értünk, amelynek eredményeként a vizsgált jelenség számszerűen jellemezhetővé, más hasonló jelenségekkel

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

A Bankok Bázel II megfelelésének informatikai validációja

A Bankok Bázel II megfelelésének informatikai validációja A Bankok Bázel II megfelelésének informatikai validációja 2010. november 30. Informatika felügyeleti főosztály: Gajdosné Sági Katalin Gajdos.Katalin@PSZAF.hu Kofrán László - Kofran.Laszlo@PSZAF.hu Bázel

Részletesebben

Működési kockázatkezelés fejlesztése a CIB Bankban. IT Kockázatkezelési konferencia 2007.09.19. Kállai Zoltán, Mogyorósi Zoltán

Működési kockázatkezelés fejlesztése a CIB Bankban. IT Kockázatkezelési konferencia 2007.09.19. Kállai Zoltán, Mogyorósi Zoltán Működési kockázatkezelés fejlesztése a CIB Bankban IT Kockázatkezelési konferencia 2007.09.19. Kállai Zoltán, Mogyorósi Zoltán 1 A Működési Kockázatkezelés eszköztára Historikus adatok gyűjtése és mennyiségi

Részletesebben

Verifikáció és validáció Általános bevezető

Verifikáció és validáció Általános bevezető Verifikáció és validáció Általános bevezető Általános Verifikáció és validáció verification and validation - V&V: ellenőrző és elemző folyamatok amelyek biztosítják, hogy a szoftver megfelel a specifikációjának

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

Mérés és modellezés 1

Mérés és modellezés 1 Mérés és modellezés 1 Mérés és modellezés A mérnöki tevékenység alapeleme a mérés. A mérés célja valamely jelenség megismerése, vizsgálata. A mérés tervszerűen végzett tevékenység: azaz rögzíteni kell

Részletesebben

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes

Részletesebben

Gépi tanulás a gyakorlatban. Bevezetés

Gépi tanulás a gyakorlatban. Bevezetés Gépi tanulás a gyakorlatban Bevezetés Motiváció Nagyon gyakran találkozunk gépi tanuló alkalmazásokkal Spam detekció Karakter felismerés Fotó címkézés Szociális háló elemzés Piaci szegmentáció analízis

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

BIG DATA ELEMZÉSEK LEHETŐSÉGEI

BIG DATA ELEMZÉSEK LEHETŐSÉGEI BIG DATA ELEMZÉSEK LEHETŐSÉGEI A KÖRNYEZETVÉDELMI MODELLEZÉSBEN Dr. Torma A. 2015.11.13. 2015/11/13 Dr. TORMA A. >> Széchenyi István Egyetem 2 Tartalom 1. A Big Data fogalma 2. Pár érdekes adat a Big Data

Részletesebben

Jogosultság-monitorozó rendszer kialakítása

Jogosultság-monitorozó rendszer kialakítása Jogosultság-monitorozó rendszer kialakítása Csizmadia Attila CISA Jogosultságkezelés jelentősége Miért fontos? Mindenkinek van valamilyen válasza A válaszok különböző megközelítésűek lehetnek Egy közös

Részletesebben

MKKV ügyfelek adósminősítő modelljének fejlesztése RapidMiner a TakarékBankban Frindt Anna Magyar Takarékszövetkezeti Bank Zrt. 1 Budapest, 2011.10.06. A Takarékbank és a Takarékszövetkezetek/Bankok 1989

Részletesebben

Modellezési Kockázat. Kereskedelmi Banki Kockázatmodellezés. Molnár Márton Modellezési Vezető (Kockázatkezelés)

Modellezési Kockázat. Kereskedelmi Banki Kockázatmodellezés. Molnár Márton Modellezési Vezető (Kockázatkezelés) Modellezési Kockázat Kereskedelmi Banki Kockázatmodellezés Molnár Márton Modellezési Vezető (Kockázatkezelés) Modellek Kockázata Adathibák Szabályozói elvárások figyelmen kívül hagyása Becslési Bizonytalanság

Részletesebben

Értékesítések (összes, geográfiai -, ügyfelenkénti-, termékenkénti megoszlás)

Értékesítések (összes, geográfiai -, ügyfelenkénti-, termékenkénti megoszlás) Saját vállalkozás Értékesítések (összes, geográfiai -, ügyfelenkénti-, termékenkénti megoszlás) Piaci részesedés Haszonkulcs Marketing folyamatok Marketing szervezet Értékesítési/marketing kontrol adatok

Részletesebben

Intelligens beágyazott rendszer üvegházak irányításában

Intelligens beágyazott rendszer üvegházak irányításában P5-T6: Algoritmustervezési környezet kidolgozása intelligens autonóm rendszerekhez Intelligens beágyazott rendszer üvegházak irányításában Eredics Péter, Dobrowiecki P. Tadeusz, BME-MIT 1 Üvegházak Az

Részletesebben

E L Ő T E R J E S Z T É S

E L Ő T E R J E S Z T É S E L Ő T E R J E S Z T É S Zirc Városi Önkormányzat Képviselő-testülete 2005. december 19-i ülésére Tárgy: Zirc Városi Önkormányzat 2006. évi belső ellenőrzési tervének kockázatelemzése Előterjesztés tartalma:

Részletesebben

Dr. Sasvári Péter Egyetemi docens

Dr. Sasvári Péter Egyetemi docens A magyarországi vállalkozások Üzleti Intelligencia használatának vizsgálata Dr. Sasvári Péter Egyetemi docens II. IRI Társadalomtudományi Konferencia, 2014. április 25-26. Nové Zámky (Érsekújvár) Gymnázium

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés Gépi tanulás a gyakorlatban Kiértékelés és Klaszterezés Hogyan alkalmazzuk sikeresen a gépi tanuló módszereket? Hogyan válasszuk az algoritmusokat? Hogyan hangoljuk a paramétereiket? Precízebben: Tegyük

Részletesebben

A CRD prevalidáció informatika felügyelési vonatkozásai

A CRD prevalidáció informatika felügyelési vonatkozásai A CRD prevalidáció informatika felügyelési vonatkozásai Budapest, 2007. január 18. Gajdosné Sági Katalin PSZÁF, Informatika felügyeleti főosztály gajdos.katalin@pszaf.hu Tartalom CRD előírások GL10 ajánlás

Részletesebben

1. gyakorlat. Mesterséges Intelligencia 2.

1. gyakorlat. Mesterséges Intelligencia 2. 1. gyakorlat Mesterséges Intelligencia. Elérhetőségek web: www.inf.u-szeged.hu/~gulyasg mail: gulyasg@inf.u-szeged.hu Követelmények (nem teljes) gyakorlat látogatása kötelező ZH írása a gyakorlaton elhangzott

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. 1 Mérési hibák súlya és szerepe a mérési eredményben A mérési hibák csoportosítása A hiba rendűsége Mérési bizonytalanság Standard és kiterjesztett

Részletesebben

Asszociációs szabályok

Asszociációs szabályok Asszociációs szabályok Nikházy László Nagy adathalmazok kezelése 2010. március 10. Mi az értelme? A ö asszociációs szabály azt állítja, hogy azon vásárlói kosarak, amik tartalmaznak pelenkát, általában

Részletesebben

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter. 2010. június

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter. 2010. június ÖKONOMETRIA ÖKONOMETRIA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi Tanszék, az MTA

Részletesebben

TANTÁRGYI ÚTMUTATÓ. Alkalmazott számítástechnika. tanulmányokhoz

TANTÁRGYI ÚTMUTATÓ. Alkalmazott számítástechnika. tanulmányokhoz 2. évfolyam szakirány BA TANTÁRGYI ÚTMUTATÓ Alkalmazott számítástechnika tanulmányokhoz TÁVOKTATÁS Tanév (2014/2015) 1. félév A KURZUS ALAPADATAI Tárgy megnevezése: Alkalmazott Számítástechnika Tanszék:

Részletesebben

TPM egy kicsit másképp Szollár Lajos, TPM Koordinátor

TPM egy kicsit másképp Szollár Lajos, TPM Koordinátor TPM egy kicsit másképp Szollár Lajos, TPM Koordinátor 2013.06.18 A TPM A TPM a Total Productive Maintenance kifejezés rövidítése, azaz a teljes, a gyártásba integrált karbantartást jelenti. A TPM egy állandó

Részletesebben

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető! BGF KKK Módszertani Intézeti Tanszéki Osztály Budapest, 2012.. Név:... Neptun kód:... Érdemjegy:..... STATISZTIKA II. VIZSGADOLGOZAT Feladatok 1. 2. 3. 4. 5. 6. Összesen Szerezhető pontszám 21 20 7 22

Részletesebben

Intelligens adatelemzés

Intelligens adatelemzés Antal Péter, Antos András, Horváth Gábor, Hullám Gábor, Kocsis Imre, Marx Péter, Millinghoffer András, Pataricza András, Salánki Ágnes Intelligens adatelemzés Szerkesztette: Antal Péter A jegyzetben az

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,

Részletesebben

Mintavételi eljárások

Mintavételi eljárások Mintavételi eljárások Daróczi Gergely, PPKE BTK 2008. X.6. Óravázlat A mintavétel célja Alapfogalmak Alapsokaság, mintavételi keret, megfigyelési egység, mintavételi egység... Nem valószínűségi mintavételezési

Részletesebben

IRÁNYTŰ A SZABÁLYTENGERBEN

IRÁNYTŰ A SZABÁLYTENGERBEN IRÁNYTŰ A SZABÁLYTENGERBEN amikor Bábel tornya felépül BRM konferencia 2008 október 29 BCA Hungary A Csapat Cégalapítás: 2006 Tanácsadói létszám: 20 fő Tapasztalat: Átlagosan 5+ év tanácsadói tapasztalat

Részletesebben

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017. Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017. Vizuális feldolgozórendszerek feladatai Mesterséges intelligencia és idegtudomány Mesterséges intelligencia és idegtudomány Párhuzamos problémák

Részletesebben

Képesség. Beszámoló Verify képességtesztek eredményéről. Név László Hammer. Dátum 2018 szeptember 28. SHL.com

Képesség. Beszámoló Verify képességtesztek eredményéről. Név László Hammer. Dátum 2018 szeptember 28. SHL.com Képesség Név László Hammer Dátum. SHL.com Beszámoló képességtesztek Ez a képességteszt-jelentés Hammer László Verify képességteszten szerzett pontszámát mutatja. Nem felügyelt képességteszt használata

Részletesebben

Ariadne Kábeltesztelő Rendszer. Neuron intelligens megoldások a kábelipar számára.

Ariadne Kábeltesztelő Rendszer. Neuron intelligens megoldások a kábelipar számára. Ariadne Kábeltesztelő Rendszer Neuron intelligens megoldások a kábelipar számára. 1. BEMUTATKOZÁS A vállalkozásunk mérnök-tervező csapata a gépjármű kábelgyártás területén használatos gyártó- és ellenőrző

Részletesebben

Új módszertan a kerékpározás mérésében

Új módszertan a kerékpározás mérésében Új módszertan a kerékpározás mérésében Megváltoztattuk reprezentatív kutatásunk módszertanát, mely 21 márciusa óta méri rendszeresen a magyarországi kerékpárhasználati szokásokat. Ezáltal kiszűrhetővé

Részletesebben

A távérzékelt felvételek tematikus kiértékelésének lépései

A távérzékelt felvételek tematikus kiértékelésének lépései A távérzékelt felvételek tematikus kiértékelésének lépései Csornai Gábor László István Földmérési és Távérzékelési Intézet Mezőgazdasági és Vidékfejlesztési Igazgatóság Az előadás 2011-es átdolgozott változata

Részletesebben

Mérési hibák 2006.10.04. 1

Mérési hibák 2006.10.04. 1 Mérési hibák 2006.10.04. 1 Mérés jel- és rendszerelméleti modellje Mérési hibák_labor/2 Mérési hibák mérési hiba: a meghatározandó értékre a mérés során kapott eredmény és ideális értéke közötti különbség

Részletesebben

CEBS Consultative Paper 10 (folytatás) Krekó Béla PSZÁF, 2005. szeptember 15.

CEBS Consultative Paper 10 (folytatás) Krekó Béla PSZÁF, 2005. szeptember 15. CEBS Consultative Paper 10 (folytatás) Krekó Béla PSZÁF, 2005. szeptember 15. 1 3.3.3 Minősítési rendszerek és a kockázatok számszerűsítése Minősítések hozzárendelése PD, LGD, CF meghatározása Közös vizsgálati

Részletesebben

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31. Regresszió Csorba János Nagyméretű adathalmazok kezelése 2010. március 31. A feladat X magyarázó attribútumok halmaza Y magyarázandó attribútumok) Kérdés: f : X -> Y a kapcsolat pár tanítópontban ismert

Részletesebben

Segítség értékelek.. MIÉRT?? KA1 projekt eredmények és folyamatok mérése, értékelése szakképzésben Gabriella.Kovacs@inyk.bme.hu 2018.06.06 Mai előadás célja ITT és MOST! 1. Mérés/értékelés megítélésének

Részletesebben

S atisztika 1. előadás

S atisztika 1. előadás Statisztika 1. előadás A kutatás hatlépcsős folyamata 1. lépés: Problémameghatározás 2. lépés: A probléma megközelítésének kidolgozása 3. lépés: A kutatási terv meghatározása 4. lépés: Terepmunka vagy

Részletesebben

KÖFOP VEKOP A jó kormányzást megalapozó közszolgálat-fejlesztés

KÖFOP VEKOP A jó kormányzást megalapozó közszolgálat-fejlesztés KÖFOP-2.1.2-VEKOP-15-2016-00001 A jó kormányzást megalapozó közszolgálat-fejlesztés Az Okos város okos közigazgatás kutatóműhely zárórendezvénye Okos szolgáltatások teljesítményének mérése, elemzése és

Részletesebben

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.

Részletesebben

Információbiztonság fejlesztése önértékeléssel

Információbiztonság fejlesztése önértékeléssel Információbiztonság fejlesztése önértékeléssel Fábián Zoltán Dr. Horváth Zsolt, 2011 Kiindulás SZTE SZAKK információ információ adatvédelmi szabályozás napi gyakorlat információ Milyen az összhang? belső

Részletesebben

Beszerzési és elosztási logisztika. Előadó: Telek Péter egy. adj. 2008/09. tanév I. félév GT5SZV

Beszerzési és elosztási logisztika. Előadó: Telek Péter egy. adj. 2008/09. tanév I. félév GT5SZV Beszerzési és elosztási logisztika Előadó: Telek Péter egy. adj. 2008/09. tanév I. félév GT5SZV 3. Előadás A beszerzési logisztikai folyamat Design tervezés Szükséglet meghatározás Termelés tervezés Beszerzés

Részletesebben

ADATBÁNYÁSZAT AZ AUTÓIPARI TERMÉKEK FEJLESZTÉSÉBEN

ADATBÁNYÁSZAT AZ AUTÓIPARI TERMÉKEK FEJLESZTÉSÉBEN ADATBÁNYÁSZAT AZ AUTÓIPARI TERMÉKEK FEJLESZTÉSÉBEN Zámborszky Judit 2019.05.14. Adatbányászat az autóipari termékek fejlesztésében Industry 4.0 Ipar 4.0 Ipari forradalmak: 1.: Gépek használata (gőzgép)

Részletesebben

Szoftver-mérés. Szoftver metrikák. Szoftver mérés

Szoftver-mérés. Szoftver metrikák. Szoftver mérés Szoftver-mérés Szoftver metrikák Szoftver mérés Szoftver jellemz! megadása numerikus értékkel Technikák, termékek, folyamatok objektív összehasonlítása Mér! szoftverek, programok CASE eszközök Kevés szabványos

Részletesebben

Big Data az adattárházban

Big Data az adattárházban Big Data az adattárházban A párbaj folytatódik? Néhány fontos Big Data projekt Cég Téma Adat Újfajta Mennyiség Saját adat? Típus Google Influenza Google I big I Előjelzés előjelzés Farecast Xoom Chicagoi

Részletesebben

Nagyméretű adathalmazok kezelése (BMEVISZM144) Reinhardt Gábor április 5.

Nagyméretű adathalmazok kezelése (BMEVISZM144) Reinhardt Gábor április 5. Asszociációs szabályok Budapesti Műszaki- és Gazdaságtudományi Egyetem 2012. április 5. Tartalom 1 2 3 4 5 6 7 ismétlés A feladat Gyakran együtt vásárolt termékek meghatározása Tanultunk rá hatékony algoritmusokat

Részletesebben

Az értékelés során következtetést fogalmazhatunk meg a

Az értékelés során következtetést fogalmazhatunk meg a Az értékelés során következtetést fogalmazhatunk meg a a tanuló teljesítményére, a tanulási folyamatra, a célokra és követelményekre a szülők teljesítményére, a tanulási folyamatra, a célokra és követelményekre

Részletesebben

Mit mond a XXI. század emberének a statisztika?

Mit mond a XXI. század emberének a statisztika? Mit mond a XXI. század emberének a statisztika? Rudas Tamás Magyar Tudományos Akadémia Társadalomtudományi Kutatóközpont Eötvös Loránd Tudományegyetem Statisztika Tanszék Nehéz a jövőbe látni Változik

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben

Gáspár Bencéné Vér Katalin *

Gáspár Bencéné Vér Katalin * 109 Gáspár Bencéné Vér Katalin * ADATBÁNYÁSZAT A GAZDASÁGI ÉLETBEN Az adatbányászat egy döntéstámogatási módszer, olyan üzleti intelligencia megoldás, amely új üzleti lehetõségeket segít megtalálni és

Részletesebben

Dr. Kántor Béla

Dr. Kántor Béla Dr. Kántor Béla szükséges a könyvvizsgálói vélemény és jelentés alátámasztásához. jellegét tekintve kumulatív, és elsősorban a könyvvizsgálat során végrehajtott könyvvizsgálati eljárásokból származik.

Részletesebben

Az adatszolgáltatás technológiájának/algoritmusának vizsgálata, minőségi ajánlások

Az adatszolgáltatás technológiájának/algoritmusának vizsgálata, minőségi ajánlások Az adatszolgáltatás technológiájának/algoritmusának vizsgálata, minőségi ajánlások A dokumentum a TÁMOP 5.4.1. számú kiemelt projekt keretében, a Magyar Addiktológiai Társaság megbízásából készült. Készítette:

Részletesebben

Matematikai modellezés

Matematikai modellezés Matematikai modellezés Bevezető A diasorozat a Döntési modellek című könyvhöz készült. Készítette: Dr. Ábrahám István Döntési folyamatok matematikai modellezése Az emberi tevékenységben meghatározó szerepe

Részletesebben

Mérés és modellezés Méréstechnika VM, GM, MM 1

Mérés és modellezés Méréstechnika VM, GM, MM 1 Mérés és modellezés 2008.02.04. 1 Mérés és modellezés A mérnöki tevékenység alapeleme a mérés. A mérés célja valamely jelenség megismerése, vizsgálata. A mérés tervszerűen végzett tevékenység: azaz rögzíteni

Részletesebben

Nyilvántartási Rendszer

Nyilvántartási Rendszer Nyilvántartási Rendszer Veszprém Megyei Levéltár 2011.04.14. Készítette: Juszt Miklós Honnan indultunk? Rövid történeti áttekintés 2003 2007 2008-2011 Access alapú raktári topográfia Adatbázis optimalizálás,

Részletesebben

Tartalom. Konfiguráció menedzsment bevezetési tapasztalatok. Bevezetés. Tipikus konfigurációs adatbázis kialakítási projekt. Adatbázis szerkezet

Tartalom. Konfiguráció menedzsment bevezetési tapasztalatok. Bevezetés. Tipikus konfigurációs adatbázis kialakítási projekt. Adatbázis szerkezet Konfiguráció menedzsment bevezetési tapasztalatok Vinczellér Gábor AAM Technologies Kft. Tartalom 2 Bevezetés Tipikus konfigurációs adatbázis kialakítási projekt Adatbázis szerkezet Adatbázis feltöltés

Részletesebben

10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK

10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK MATEMATIK A 9. évfolyam 10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK KÉSZÍTETTE: CSÁKVÁRI ÁGNES Matematika A 9. évfolyam. 10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK Tanári útmutató 2 MODULLEÍRÁS A modul

Részletesebben

Bevezetés az SPSS program használatába

Bevezetés az SPSS program használatába Bevezetés az SPSS program használatába Statisztikai szoftver alkalmazás Géczi-Papp Renáta SPSS alapok Statistical Package for Social Sciences SPSS nézetek: Data View Variable View Output Viewer Sintax

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika

Részletesebben

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x

Részletesebben

Döntéselőkészítés. I. előadás. Döntéselőkészítés. Előadó: Dr. Égertné dr. Molnár Éva. Informatika Tanszék A 602 szoba

Döntéselőkészítés. I. előadás. Döntéselőkészítés. Előadó: Dr. Égertné dr. Molnár Éva. Informatika Tanszék A 602 szoba I. előadás Előadó: Dr. Égertné dr. Molnár Éva Informatika Tanszék A 602 szoba Tárggyal kapcsolatos anyagok megtalálhatók: http://www.sze.hu/~egertne Konzultációs idő: (páros tan. hét) csütörtök 10-11 30

Részletesebben

Kockázatkezelés és biztosítás 1. konzultáció 2. rész

Kockázatkezelés és biztosítás 1. konzultáció 2. rész Kockázatkezelés és biztosítás 1. konzultáció 2. rész Témák 1) A kockázatkezelés eszközei 2) A kockázatkezelés szakmai területei 3) A kockázatelemzés nem holisztikus technikái 4) Kockázatfinanszírozás 5)

Részletesebben

Gazdasági informatika alapjai

Gazdasági informatika alapjai PSZK Mesterképzési és Távoktatási Központ / H-1149 Budapest, Buzogány utca 10-12. / 1426 Budapest Pf.:35 II. évfolyam Név: Neptun kód: Kurzus: Tanár neve: HÁZI DOLGOZAT 2. Gazdasági informatika alapjai

Részletesebben

Adatmodellezés. 1. Fogalmi modell

Adatmodellezés. 1. Fogalmi modell Adatmodellezés MODELL: a bonyolult (és időben változó) valóság leegyszerűsített mása, egy adott vizsgálat céljából. A modellben többnyire a vizsgálat szempontjából releváns jellemzőket (tulajdonságokat)

Részletesebben

IT ügyfélszolgálat és incidenskezelés fejlesztése az MNB-nél

IT ügyfélszolgálat és incidenskezelés fejlesztése az MNB-nél IT ügyfélszolgálat és incidenskezelés fejlesztése az MNB-nél Molnár László MNB, ITIL Projektvezető Fábián János ICON Professional Services Vezérfonal Az MNB IT működése, a SIP kiváltó okai A projekt módszereinek

Részletesebben

Átlátni és rendszerezni Az adatbányászat, a CRM és a piackutatás kapcsolata

Átlátni és rendszerezni Az adatbányászat, a CRM és a piackutatás kapcsolata Átlátni és rendszerezni Az adatbányászat, a CRM és a piackutatás kapcsolata Aki mostanában konferenciákon, elõadásokon jár, vagy különbözõ marketinggel kapcsolatos szaklapokat olvas, nehezen kerülheti

Részletesebben

Szabálykezelés a gyakorlatban

Szabálykezelés a gyakorlatban Szabálykezelés a gyakorlatban ILOG-eszközökkel Ivicsics László vezető tanácsadó BCA Hungary 2008. június 25. Üzleti folyamatok és szabályok Üzleti folyamatok Munkautasítások Szabályzatok Példa: Hitelképesség

Részletesebben

Az ALTERA VAGYONKEZELŐ Nyrt. kockázatkezelési irányelvei

Az ALTERA VAGYONKEZELŐ Nyrt. kockázatkezelési irányelvei Az ALTERA VAGYONKEZELŐ Nyrt. kockázatkezelési irányelvei I. A dokumentum célja és alkalmazási területe A Kockázatkezelési Irányelvek az ALTERA Vagyonkezelő Nyilvánosan Működő Részvénytársaság (1068 Budapest,

Részletesebben

FİBB PONTOK PIACKUTATÁS (MARKETINGKUTATÁS) Kutatási terv október 20.

FİBB PONTOK PIACKUTATÁS (MARKETINGKUTATÁS) Kutatási terv október 20. FİBB PONTOK PIACKUTATÁS (MARKETINGKUTATÁS) 2010. október 20. A kutatási terv fogalmának, a különbözı kutatási módszerek osztályozása, a feltáró és a következtetı kutatási módszerek közötti különbségtétel

Részletesebben

Képesség. Beszámoló Verify képességtesztek eredményéről. Név Mr. Jelölt. Dátum.

Képesség. Beszámoló Verify képességtesztek eredményéről. Név Mr. Jelölt. Dátum. Képesség Beszámoló Verify képességtesztek Név Mr. Jelölt Dátum www.ceb.shl.com Beszámoló képességtesztek Ez a képességteszt-jelentés Mr. Jelölt Verify képességteszten szerzett pontszámát mutatja meg. Nem

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

HOGYAN JELEZHETŐ ELŐRE A

HOGYAN JELEZHETŐ ELŐRE A HOGYAN JELEZHETŐ ELŐRE A MUNKATÁRSAK BEVÁLÁSA? A BELSŐ ÉRTÉKELŐ KÖZPONT MÓDSZEREI ÉS S BEVÁLÁSVIZSG SVIZSGÁLATA Budapest, 2010.03.25. PSZE HR Szakmai nap Előadó: Besze Judit BÉK módszergazda. 1/28 BEVÁLÁS

Részletesebben

Betekintés a Könyvvizsgálati munkába. Könyvvizsgálói munka szakaszai, Könyvvizsgálói jelentés változás

Betekintés a Könyvvizsgálati munkába. Könyvvizsgálói munka szakaszai, Könyvvizsgálói jelentés változás Betekintés a Könyvvizsgálati munkába Könyvvizsgálói munka szakaszai, Könyvvizsgálói jelentés változás Könyvvizsgálati munka szakaszai: - megbízás elfogadása, - tervezés, - vizsgálat, - áttekintés, értékelés

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision

Részletesebben

Autóipari beágyazott rendszerek. Kockázatelemzés

Autóipari beágyazott rendszerek. Kockázatelemzés Autóipari beágyazott rendszerek Kockázatelemzés 1 Biztonságkritikus rendszer Beágyazott rendszer Aminek hibája Anyagi vagyont, vagy Emberéletet veszélyeztet Tipikus példák ABS, ESP, elektronikus szervokormány

Részletesebben

Palaczk Péter A marketing folyamatok adattárház alapú támogatása

Palaczk Péter A marketing folyamatok adattárház alapú támogatása Palaczk Péter A marketing folyamatok adattárház alapú támogatása A hatékony marketingtámogatás alapjai Infrastrukturális feltételek Működő vállalati adattárház Megbízható ügyféladatok Beüzemelt adatbányászati

Részletesebben

Gyors sikerek adatbányászati módszerekkel

Gyors sikerek adatbányászati módszerekkel Gyors sikerek adatbányászati módszerekkel Kezdő adatbányászati workshop Petrócziné Huczman Zsuzsanna 2015.10.13. Bemutatkozás BME, műszaki informatika szak, adatbányászati szakirány Citibank Data Explorer

Részletesebben

Az ISO 9001:2015 szabványban szereplő új fogalmak a tanúsító szemszögéből. Szabó T. Árpád

Az ISO 9001:2015 szabványban szereplő új fogalmak a tanúsító szemszögéből. Szabó T. Árpád Az ISO 9001:2015 szabványban szereplő új fogalmak a tanúsító szemszögéből. Szabó T. Árpád Bevezetés Az új fogalmak a TQM ből ismerősek? ISO 9001:2015 új fogalmainak az érdekelt felek általi értelmezése

Részletesebben