DW 5. előadás MD adatmodell műveletei



Hasonló dokumentumok
Adatelemzés és adatbányászat MSc

SQL OLAP 2. óra. Multi-dimenzionális adatmodell. A normalizált relációs modell bonyolult a felhasználók számára

Adatbázis-kezelés. 3. Ea: Viszonyított betűszámtan (2013) Relációs algebra alapok (átgondolt verzió) v: Szűcs Miklós - ME, ÁIT. 1.

Adatbázis Rendszerek

Adatbázis rendszerek 7. Matematikai rendszer amely foglal magában:

7. Gyakorlat A relációs adatmodell műveleti része

Relációs algebra 1.rész alapok

Vállalati információs rendszerek I, MIN5B6IN, 5 kredit, K. 4. A meghirdetés ideje (mintatanterv szerint vagy keresztfélében):

AB1 ZH mintafeladatok. 6. Minősítse az állításokat! I-igaz, H-hamis

Adatbázis alapú rendszerek

ADATBÁZIS-KEZELÉS. Relációalgebra, 5NF

Adatbázis-kezelés. alapfogalmak

Adatbázis rendszerek 2. előadás. Relációs algebra

ADATBÁZISOK ELMÉLETE 5. ELŐADÁS 3/22. Az F formula: ahol A, B attribútumok, c érték (konstans), θ {<, >, =,,, } Példa:

5.előadás: Adatbázisok-I. dr. Hajas Csilla (ELTE IK)

A RELÁCIÓS ADATMODELL MŰVELETI RÉSZE (RELÁCIÓS ALGEBRA ÉS KALKULUS)

Hogyan fogalmazzuk meg egyszerűen, egyértelműen a programozóknak, hogy milyen lekérdezésre, kimutatásra, jelentésre van szükségünk?

ABR ( Adatbázisrendszerek) 1. Előadás : Műveletek a relációs medellben

Adatbázis rendszerek Ea: Viszonyított betűszámtan. Relációs algebra alapok

ADATBÁZISOK gyakorlat: SQL 2. rész SELECT

ABR ( Adatbázisrendszerek) 2. Előadás : Műveletek a relációs modellben


Adatbázisrendszerek április 17.

Térbeli és időbeli elemzések multidimenzionális szemléletben

Adatbázis rendszerek Ea: Viszonyított betűszámtan. Relációs algebra alapok

BGF. 4. Mi tartozik az adatmodellek szerkezeti elemei

Országos Rendezési Tervkataszter

Microsoft Dynamics NAV ANYAGME RLEG. Felhaszna lo i ke ziko nyv

Lekérdezések I. Egyszerű választó lekérdezések

ADATBÁZIS RENDSZEREK. Attributum típusok, normalizálsá, relációs algebra. Krausz Nikol, Medve András, Molnár Bence

Adatmodellezés. 1. Fogalmi modell

ADATBÁZIS-KEZELÉS. Relációs modell

RELÁCIÓS ADATBÁZISSÉMÁK. Egyed-kapcsolat modellről átírás

Normálformák Normalizálás ADATBÁZISKEZELÉS ÉS KÖNYVTÁRI RENDSZERSZERVEZÉS 1 / 2

ADATBÁZIS-KEZELÉS FÉLÉVES FELADAT

Lekérdezések az SQL-ben 1.rész

Ellenőrző kérdések. 36. Ha t szintű indexet használunk, mennyi a keresési költség blokkműveletek számában mérve? (1 pont) log 2 (B(I (t) )) + t

modell, amiben csak bináris sok-egy kapcsolatok (link, memberowner,

Adatbázisok 1. Kósa Balázs gyakorlata alapján Készítette: Nagy Krisztián. 1. gyakorlat

Lekérdezések az SQL-ben 1.rész

Relációs adatmodell. Adatbázisok használata

NORMALIZÁLÁS. Funkcionális függés Redundancia 1NF, 2NF, 3NF

INFORMATIKA ÁGAZATI ALKALMAZÁSAI. Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP /1/A

Magas szintű adatmodellek Egyed/kapcsolat modell I.

DW 4. előadás MD modell

Van-e ingyen-ebéd? Avagy mire elég a nyílt forráskodú Pentaho? Fekszi Csaba Ügyvezető október 4.

Adatbázis, adatbázis-kezelő

Analitikus adatfeldolgozás. Adattárház Adatkocka Adatbányászat

Cellák. Sorok számozás Oszlop betű Cellák jelölése C5

Adatbázisok. 9. gyakorlat SQL: SELECT október október 26. Adatbázisok 1 / 14

Polár lekérdezés segédletek

Adatbázis rendszerek 1. 4.Gy: ER modell

GEIAL Kovács László. GEIAL Kovács László

Access alapok. Megnevezés Művelet Minta. Új adatbázis létrehozása. Új / Üres adatbázis.. Tábla létrehozása tervező nézetben.

Adatbázis Rendszerek II. 3. SQL alapok

Adatbázis rendszerek. 5. előadás Adatbázis tervezés. Koppányi Zoltán

ALAPOK. 0 és 255 közé eső számértékek tárolására. Számértékek, például távolságok, pontszámok, darabszámok.

Adatbáziskezelés 1 / 12

Adatbázis rendszerek. 5. előadás Adatbázis tervezés. Koppányi Zoltán

ADATBÁZIS RENDSZEREK. Attributum típusok, relációs algebra. Krausz Nikol, Medve András, Molnár Bence

Programozás I. Gyakorlás egydimenziós tömbökkel Többdimenziós tömbök Gyakorló feladatok V 1.0 ÓE-NIK-AII,

Struktúra nélküli adatszerkezetek

A relációs adatmodell

Koós Dorián 9.B INFORMATIKA

Diagram létrehozása. 1. ábra Minta a diagramkészítéshez

DOAS ig változások, összefoglaló

LOGISZTIKAI ADATBÁZIS RENDSZEREK JOIN, AGGREGÁCIÓ

Adatbázis-kezelés az Excel 2013-ban

AZ ELőADÁS CÉLJA. RDA logikai adatmodell. helyének bemutatása az SSADM módszertanban (340.LÉPÉS)

Számítógéppel segített folyamatmodellezés p. 1/20

Adat és folyamat modellek

Adatbázis rendszerek 2. előadás. Relációs algebra

Adatbázisok tavaszi félév Vizsgatételsor

LOGISZTIKAI ADATBÁZIS RENDSZEREK EXCEL ALAPOK

Párhuzamosítás adatbáziskezelő rendszerekben

SZÁMÍTÓGÉPES ADATFELDOLGOZÁS

Adatbázisok-1 előadás Előadó: dr. Hajas Csilla

Adatbázisok elmélete

Sor és oszlopkalkulus

Adatbázis-kezelés Access XP-vel. Tanmenet

QGIS Gyakorló. 1. kép. A vektor réteg (grassland.shp).

Álraszteres térstatisztikai műveletek a területi kutatásokban

SQL haladó. Külső összekapcsolások, Csoportosítás/Összesítés, Beszúrás/Törlés/Módosítás, Táblák létrehozása/kulcs megszorítások

Tájékoztató. Használható segédeszköz: -

Adatbázis tervezés normál formák segítségével

Mveletek a relációs modellben. A felhasználónak szinte állandó jelleggel szüksége van az adatbázisban eltárolt adatok egy részére.

Vállalkozás Statisztikai Adatbázis

CobraConto.Net v0.50 verzió

Adatbázis-lekérdezés. Az SQL nyelv. Makány György

Modellinformációk szabványos cseréje. Papp Ágnes, Debreceni Egyetem EFK

HBCSKódex. Felhasználói kézikönyv. HBCS Audit KFT 2015.

A sorozat. A feladatlapon szereplő kérdések megválaszolásával és feladatok megoldásával maximum 100 pont érhető el.

Kézikönyv. BAB űrlap

Táblázatos adatok használata

Függőségek felismerése és attribútum halmazok lezártja

Adatbázis rendszerek Definíciók:


Lekérdezések az SQL-ben 2.rész

Adatbázismodellek. 1. ábra Hierarchikus modell

a nyers adatokat relációs formátumúvá alakítja felkutatja és feloldja az adatelem meghatározásokban az esetleges pontatlanságot/bizonytalanságot

Átírás:

DW 5. előadás MD adatmodell műveletei

MD szemantikai séma modell hónap termék forgalom dátum kategória bolt munkahét Hogyan modellezzük egzaktabb módon? nincs egységes modell

Cabibbo- Torlone szemantikai modell A modell elemei: - dimenzió-sémák, - fogalom-sémák, - adatkocka-sémák, - adatbázis-sémák. Grafikus jelölésrendszert is alkalmaz Egyszerűsített megközelítés ER-jellegű leírás

Grafikus ábrázolás Cabibbo-Torlone modell dimenzió dimenzió-szint változó mező tulajdonság dimenzió hierarchia tény-dimenzió kapcsolat többértékű dimenzió kocka nem OO alapú

Cabibbo-Torlone modell munkaügy létszám betegállomány dátum nap negyedév selejt forgalom termék termék gyártó db db érték telep név név kategória

Cabibbo-Torlone modell univerzum : U fogalom-nevek halmaza: C = {c} U típusok halmaza : T U dimenzió-sémák halmaza: D = {d,r} dimenzió-séma: d = (L,<,P) L dimenzió szintek (L C) < : szint hierarchia (< L L) P: tulajdonság (P : L 2 (C T) ) dimenzió-bázisok : R r(d) = {h L(d) h : h < h } R = {r(d)}

Cabibbo-Torlone modell ténytábla-sémák halmaza: F = {f} ténytábla-séma: f = {(A 1 :I 1,..,A n :I n ), I 0 } f C A i C I i r(r) I 0 2 (C T) adatbázis-séma: DB = (C, T, D{d(L,<,P),R}, F{f(A:I):I 0 })

Minta séma felírása C = {alapfiz, beosztas, ear, ertekesites, ev, cím, osszdb, selejtdb, telephely, termek, } T = {int, char} D = {d termek, d datum,d telep, R} d termek = { {termek, kategoria}, {kategoria < termek}, {termek (ear,int), termek (nev,char), kategori (nev,char)} } VEZETO nev BEOSZTAS megn alapfiz TELEPHELY cim nev VAROS megn ERTEKESITES OSSZDB SELEJTDB MEGYE megn EV ev TERMEK ear nev KATEGORIA nev DATUM nap HO ho

R = {termek, datum, telephely} Minta séma felírása F = {ertekesites} ertekesites = { (termelte:telephely, termek:termek, datum:datum), {(osszdb,int) (selejtdb,int)} } VEZETO nev BEOSZTAS megn alapfiz TELEPHELY cim nev VAROS megn ERTEKESITES OSSZDB SELEJTDB MEGYE megn EV ev TERMEK ear nev KATEGORIA nev DATUM nap HO ho DB = {C,T,D,F}

Formális felírás előnyei: Cabibbo-Torlone modell - egyértelműbb jelentés, - könnyebben feldolgozható, - tömörebb leírás, - könnyebben konvertálható, - alapot adhat további egyértelmű bővítésekre. néhány további modell: - Li-Wang(1996), - Agrawal-Gupta-Sarawagi(1997), -ADAPT, -

MD műveletek Felhasználó igény: - ad-hoc lekérdezések a kocka különböző szeleteire, - táblázatos megjelenítés (többdimenziós eredmény), - áttekinthető megjelenítés. termelés alakulása a keleti régióra vonatkozóan az elmúlt három hónapra vonatkoztatva.. dátumok termékek 700 600 500 400 300 200 100 0 darab Autótípusok adatai átlag ár Fiat Opel Skoda

Itt sincs egységes modell MD műveletek gyakorlatban elterjedt műveletek: - szűrés, - aggregálás, - szintváltás, - összekapcsolás, - kibontás, telep termek dátum mintaként a relációs algebra jöhet szóba adatkockán értelmezett, adatkockát előállító operátorok

MD műveletek Szelekció (szűkítés, slice and dice) - szigma - változó szelekció f(v) (F) A feltételnek eleget tévő cellák maradnak meg, a többi cella NULL értékű lesz. - attributum szelekció f(d.a) (F) A feltételnek eleget tévő dimenzió értékek maradnak meg, a többi kikerül a kockából. selejtdb > osszdb*0.2 (ertekesites) selejtdb > osszdb*0.2 (ertekesites)

Szűkítés, slice and dice A vásárlások adatkockán több dimenziót is érintő feltételt adunk meg. Az alkalmazott szelekciós feltétel: a termék legyen labda és a dátum pedig a nyári hónapokat ölelje át.

MD műveletek Projekció (slice and dice) - pí - változó projekció v (F) A kijelölt változók maradnak meg a cellában. - attributum projekció D.a (F) A kijelölt attributumok maradnak meg a dimenziónál. selejtdb (ertekesites) selejtdb ( selejtdb > osszdb*0.2 (ertekesites))

Slicing Néha a szeletelés alatt egy dimenzió mentén egy érték kiválasztását értenek, így eggyel kevesebb számú dimenziós kockát létrehozva. (Attribútum szelekció egy értéket kiválasztva.) Például a termékek közül csak a labdát kiválasztva, de a dátum és boltok dimenziók változatlanok maradnak. Dicing A kockára vágás alatt néha az adatkockán több dimenziót is érintő szelekciót értenek. Tehát a hagyományos szelekció.

MD műveletek Dimenzió összevonása (roll up, drill up) - nű - attributum szintű D1.D2 (F) A megadott dimenzióból a megadott (durvább) dimenzióba való áttérés a dimenzió hierarchia mentén, vagy egy dimenzió attribútum kivételét a táblázatból az aktuális dimenzió szintjén maradva. aggregáltabb adatokra való áttérés megváltozik a szint a megadott dimenziónál durvább felbontást kapunk termek.kategoria (ertekesites)

Összevonás, drill up A vásárlások adatkockán eddig napi bontásban és boltonként láthattuk a forgalom adatokat, akkor az összevonás révén át lehet térni havi idő bontásra, ahol az adatkockában az adott hónap dimenzióértéknél az oda tartozó napi adatok összesített értéke fog megjelenni. Hasonlóan elérhető az is, hogy a vevő dimenzió tengely mentén kevesebb tulajdonság szerepeljen az egyes vevők adatai között.

MD műveletek Dimenzió kibontása (finomítás, drill down) - kappa - attributum szintű D (F) A megadott attributum részletező dimenziójára való áttérés a dimenzió hierarchia mentén, vagy egy újabb attribútumot hozunk be a táblázatba az aktuális dimenzió szintjén. részletezőbb adatokra való áttérés megváltozik a szint az aktuális dimenziónál finomabb felbontást kapunk varos (ertekesites)

Finomítás, drill down A vásárlások adatkockán az adatok most éppen havi bontásban szerepelnek, a finomítással elérhető többek között az, hogy: ne havi bontásban jelenjenek meg az adatok, hanem napi bontásban (egy finomabb dimenzió hierarchia szintre térünk át), a vevőknél ne csak a neve szerepeljen hanem az életkora is megjelenjen (a meglévő dimenzió hierarchia szinten maradunk, de egy újabb dimenzió tulajdonságot hozunk be az eredménybe).

Aggregáció (bevonás, fold) - fí MD műveletek - dimenzió szintű D, aggr (F) A megadott dimenziók maradnak meg, az összevont cellák tartalmából az aggr aggregáció alapján képződik az eredő cella. A dimenziók száma csökken, s a megszüntetett dimenzió értékei bekerülnek a ténycellába mezőként. Erre akkor kerülhet sor, ha valamely dimenzió átmenetileg érdektelenné válik, a tőle való függőségi viszonyt nem fogjuk vizsgálni a közeljövőben. összesítőbb adatokra való áttérés szűkül a dimenzió készlet, csökken a dimenziószám durvább felbontást kapunk termek, termelte, sum() (ertekesites)

Bevonás, fold Az adatkockában a dátum elemet kivesszük a dimenziók közül, s áttesszük a ténycella mezői közé. A művelet hatására: eggyel csökken a dimenziók száma, és eggyel nő a ténycella mezőinek a darabszáma. Eladás - érték dátum Eladás - érték - dátum bolt bolt vevő vevő

MD műveletek Kiterítés (kibontás, unfold) - delta - dimenzió szintű D (F) Behozza a kockába a megadott dimenziót (ha lehet). A ténystruktúra megadott mezője átmegy dimenzióba, így meghatározhatjuk a vizsgált tényadatnak az egyik korábbi mezőjétől való függését. részletezőbb adatokra való áttérés bővül a dimenzió készlet, növekszik a dimenziószám finomabb felbontást kapunk termek (ertekesites)

Kibontás, unfold Az adatkockában már lekérdezhető az eladási adatoknak a dátumtól való függése. Eladás - érték - dátum Eladás - érték dátum bolt bolt vevő vevő

MD műveletek Szorzás (összekapcsolás, natural join, drill across) - adatkocka szintű F 1 F 2 A megadott adatkockákból olyan eredő adatkocka készítése (legyenek közös dimenziók), melyre - dimenzióhalmaza az F 1 és F 2 dimenzió halmazának uniója, - váltózólistája a két lista összevonása, párosa, - változó értékei a megfelelő koordinátájú értékek párosa. ertekesites rendeles

MD műveletek F 1 F 2 d24 2 d26 a d23 1 2 d24 a D2 d22 3 D2 d23 b d21 5 d21 c d11 d12 d31 d32 D1 F 1 F 2 D3 (d11, d23,d31) = (1,null) (d11, d24,d31) = (2,a) (d11, d26,d31) = (null,null)

Összekapcsolás, drill across A vásárlás és reklamáció adatkockák összekapcsolása. Dátum Vevő Termék Érték Db Dátum Termék Hiba Érték... 10.02 45 786 155 2 10.12 625 77 144 10.13 67 678 65 1 10.13 678 76 12 10.16 87 78 83 3 10.16 78 99 1 Dátum Vevő Termék Eérték Db Hiba HÉrték 10.02 45 786 155 2 10.13 67 678 65 1 76 12 10.16 87 78 83 3 99 1 vásárlás + reklamáció reklamáció és vásárlás termék termék termék dátum dátum dátum

MD műveletek Dimenzió összevonás (cojoin) - khí χ d1,d2 (F) Két dimenzióból egyet állit elő, melyben minden értékpáros előfordul. A dimenziószám eggyel változik, a cellák száma változatlan. D1 (a,b,c) D2 (1, 2) => D12(a1,a2,b1,b2,c1,c2) Ilyen lesz az MDX-ben is, és a PE cojoint dimension is ilyen.

Kiterjesztés (extension) - alfa - változó szintű v (F) Új változó hozzáadása, melynek értéke a meglévő változókból származtatható. Pivotálás - tau MD műveletek - adatkocka szintű D1,D2,aggr (F) Áttérés aggregációk sorozatával kétdimenziós adatkockára (listára). A cellában szereplő értékekből oszlopok/sorok lesznek. selejtdb / osszdb (ertekesites) termek,datum (ertekesites)

Pivotálás A vásárlások adatkocka celláinak az egyes sorok felelnek meg. Az oszlopok a tény tagok, illetve a kapcsolódó dimenzió attribútumok. Dátum Vevő Termék EÉrték Db Hiba HÉrték 10.02 45 786 155 2 10.13 67 678 65 1 76 12 10.16 45 781 83 3 99 1 10.21 45 786 236 3 11.10 67 786 287 1 A tulajdonságként szereplő vevő- és termékkódok oszlopként, sorként fognak szerepelni a művelet után, azaz külön oszlopba vagy sorba kerülnek az egyes kódok. A cellába az adott kódokhoz tartozó összesített eladási érték (EÉrték) fog bekerülni. Vevő 45 67......... Termék 678 0 65......... 781 83 0......... 786 391 287............

MD műveletek Forgatás (rotation) - ró - dimenzió szintű d1,d2 (F) A megadott dimenziók helyet cserélnek egymással. (Egyes esetekben a pivotálás alatt is forgatást értenek.) részletezés szintje változatlan dimenziószám nem változik más elrendezést biztosít ábrázoláshoz fontos termek,bolt (ertekesites)

MD műveletek Rendezés (ordering) - omikron - dimenzió szintű o d,kif (F) A megadott dimenzió előfordulásainak rendezése. részletezés szintje változatlan dimenziószám nem változik más elrendezést biztosít ábrázoláshoz fontos o termek, nev (ertekesites)

MD műveletek Mintapéldák - Az x-nél olcsóbb termékekre vonatkozó adatok TERMEK.ear > x (ERTEKESITES) - Az x-nél rosszabb selejtarányú eladásra vonatkozó adatok: selejtdb/osszdb > x (ERTEKESITES) - Adatkocka a selejtarányok nélkül osszdb (ERTEKESITES) - Az x-nél nagyobb eladások ahol a terméknek csak a neve szerepel TERMEK.nev ( osszdb > x (ERTEKESITES))

Mintapéldák MD műveletek - Értékesítési adatok város szerinti bontásban TELEPHELY.varos (ERTEKESITES) -Az x-nél rosszabb selejtarányú eladásra vonatkozó adatok megye bontásban: VAROS.megye ( TELEPHELY.varos ( selejtdb/osszdb > x (ERTEKESITES))) - Áttérés hónap bontásról napi bontásra HO (C) ahol C = DATUM.ho (ERTEKESITES) - Értékesítési adatok termék és idő dimenzióban TERMEK, DATUM, Sum (ERTEKESITES)

Mintapéldák MD műveletek - Az x-nél rosszabb selejtarányú eladásra vonatkozó adatok megye és hónap bontásban: MEGYE, HONAP, Sum ( DATUM.ho ( VAROS.megye ( TELEPHELY.varos ( selejtdb/osszdb > x (ERTEKESITES)))) - Az értékesítési adatok összevonása egy KOLTSEG (ertek, TELEPHELY,HO) adatkockával: TELEPHELY, HONAP, Sum ( DATUM.ho (ERTEKESITES)) KOLTSEG - Havi költségadatok megjelenítése dollárban TELEPHELY, Sum ( ertek/ 225 dollar (KOLTSEG))