8. Előadás tartalma Funkcionális függőségek 8.1 Funkcionális függőségek és kulcsok 8.2 Relációk felbontása 1
Funkcionális függőségek Definíció: A funkcionális függőség egy n attribútumú R reláción a következő állítás: ha R két sora megegyezik az A 1, A 2,.. A m attribútumokon, akkor meg kell egyezniük egy másik attribútumon, a B-n is Ekvivalens definíció: Az R relációnak NINCS 2 sora, amelyik megegyezne az A 1, A 2,.. A m attribútumok mindegyikén A 1, A 2,...A m B Vagyis A 1, A 2,..., A m funkcionálisan meghatározza B-t 2
filmcím év Hossz műfaj stúdiónév színésznév Csillagok háborúja 1977 124 sci-fi Fox Carrie Fisher Csillagok háborúja 1977 124 sci-fi Fox Mark Hamill Csillagok háborúja 1977 124 sci-fi Fox Harrison Ford Elfújta a szél 1939 231 dráma MGM Vivien Leigh Wayne világa 1992 95 vígjáték Paramount Dana Carvez Wayne világa 1992 95 vígjáték Paramount Mike Meyers cím, év hossz cím, év műfaj cím, év stúdiónév cím, év hossz, műfaj, stúdiónév cím, év színésznév HAMIS állítás NEM ÉRVÉNYES funkcionális függőség 3
Relációk kulcsai R reláció {A 1, A 2,..., A m } attribútumai az R KULCSA, ha: 1) Ezen attribútumok funkcionálisan meghatározzák a reláció minden más attribútumát, vagyis NINCS az R-ben két olyan KÜLÖNBÖZŐ sor, amely mindegyik A 1, A 2,... A m attribútumon megegyezne. 2) Nincs olyan valódi részhalmaza {A 1, A 2, A m }-nek, amely funkcionálisan meghatározná az R összes többi attribútumát, azaz a kulcs MINIMÁLIS Függvény: ebben az esetben NINCS olyan művelet, hogy ha megadjuk a Csillagok Háborúja, 1977 párost, s KISZÁMÍTHATÓ a film hossza Ebben az esetben a függvény kiszámolása a relációból való VISSZAKERESÉST jelenti 4
Szuperkulcsok Definíció: Azon attribútumhalmazokat, amelyek tartalmaznak kulcsot szuperkulcsoknak nevezzük {cím, év, színésznév} kulcs {cím, év, színésznév, műfaj} szuperkulcs Relációk kulcsainak megtalálása Egyedhalmaz reláció kulcsa, egyedhalmaz kulcsa Kapcsolatok BINÁRIS kapcsolatokból keletkezett reláció kulcsa n:m kapcsolat, a kapcsolódó egyedhalmazok ÖSSZES kulcsattribútumai kulcsok lesznek 1:1 kapcsolat, Bármely összekapcsolt egyedhalmaz kulcsattribútumai lehetnek R attribútumai 1:n kapcsolat, akkor az n felén levő egyedhalmaz attribútumai a kulcsok 5
Szereplő(FilmCím, gyártév, SzínészNév) Gyártó(FilmCím, gyártév, stúdiónév) cím év név lakcím Filmek Szereplők Színészek hossz műfaj név cím Gyártó Stúdiók 6
3.5.2. feladat. Tekintsünk egy zárt konténerben található molekulák jelenlegi helyzetét leíró relációt. Az attribútumok a molekulaazonosító, a molekulák x, y és z koordinátái, és a sebességek az x, y és z irányokban. Milyen funkcionális függőségekre várhatjuk, hogy érvényesek? Melyek a kulcsok? MolekulaAktuálisHelyzet(molekulaAzonosító, x, y, z, v x, v y, v z ) molekulaazonosító x, y, z, v x, v y, v z???????? x, y, z molekulaazonosító, v x, v y, v z???????? v x, v y, v z molekulaazonosító, x, y, z???????? 7
Funkcionális függőségek típúsai: Teljes függőség: Ha X és Y attribútumok (X lehet attribútum halmaz is) egy relációban és Y funkcionálisan függ X-től, de nem függ funkcionálisan X egy valódi részhalmazától sem Parciális függőség: X és Y attribútum halmazok között parciális függőség áll fenn, ha a funkcionális függőség fennmarad akkor is, ha az X-ből eltávolítunk egy attribútumot Tranzitív függőség: Ha adottak az X, Y, Z attribútumok, vagy attribútum halmazok az R relációra és érvényes a X Y és Y Z, viszont X NEM függ funkcionálisan sem Y sem Z-től, akkor Z tranzitíven függ X-től, az Y-on keresztül. 8
Funkcionális függőségekre vonatkozó szabályok Reflexivitás: ha (Y X), akkor X Y, vagyis egy attribútumhalmaz funkcionálisan meghatározza saját magát és saját részhalmazait is. (triviális) Önmeghatározás (triviális): X X Bővítés: ha X Y, akkor XZ YZ Tranzitivitás: X Y és Y Z, akkor X Z Pszeudo-tranzitivitás: X Y és WY Z, akkor WX Z Egyesítés: ha X Y és X Z, akkor X YZ Szétvágás: ha X YZ, akkor X Y és X Z Társítás: Ha X Y és Z W, akkor XZ YW Általános összesítés: Ha X Y és Z W, akkor XU(Z\Y) YW 9
Bővítés: ha X Y, akkor XZ YZ Tranzitivitás: X Y és Y Z, akkor X Z Pszeudo-tranzitivitás: X Y és WY Z, akkor WX Z Bizonyítás: X Y, akkor WX WY (bővítés) És mivel WY Z, a tranzitivitás miatt WX Z Egyesítés: ha X Y és X Z, akkor X YZ Szétvágás: ha X YZ, akkor X Y és X Z Társítás: Ha X Y és Z W, akkor XZ YW Bizonyítás: X Y, akkor XZ YZ(bővítés), XZ Z és XZ Y (szétvágás); Z W, akkor XZ XW (bővítés), XZ X és XZ W (szétvágás) Egyesítük a pirossal megadott FF-ket XZ YW (egyesítés) qed. Általános összesítés: Ha X Y és Z W, akkor XU(Z\Y) YW 10
Triviális függőségek A 1 A 2...A n B 1 B 2...B m funkcionális függőség Triviális, ha a B-k az A-k egy részhalmazát alkotják cím, év cím Nem triviális, ha a B-k közül legalább egy nincs benne az A- kban. cím, év cím, műfaj Teljesen nem triviális, ha a B-k egyike sem egyezik meg az A-k valamelyikével cím, év hossz, műfaj 11
Attribútumhalmazok lezárásának kiszámítása {A1, A2,, An} egy attribútumhalmaz, S a funkcionális függőségek halmaza, ami ugyanarra az attribútumhalmazra érvényes {A1, A2,, An} + az attribútumhalmaz S szerinti lezártja Megengedjük a TRIVIÁLIS függőségeket. Lezárás Kibővítés Kiindulási attribútumhalmaz 12
Az attribútumhalmaz lezárásának kiszámítása algoritmus: 1. Legyen X attribútumhalmaz, amely végül maga a lezárt lesz. Legyen először X kezdőértéke {A1, A2,, An} 2. Ismételten keresünk olyan B1B2 Bm C funkcionális függőséget az S-ből, amelyre a teljes B1,B2,...,Bm benne van az X attribútumhalmazban, de a C nincs. Ekkor C-t hozzávesszük az X halmazhoz 3. A 2-es lépést mindaddig ismételjük, ameddig már nem tudunk több attribútumot hozzávenni X-hez. Mivel X csak növekedhet, maximálisan az összes attribútumot kaphatjuk meg. 4. Az az X halmaz, amelyet már nem tudunk tovább bővíteni lesz az {A1, A2,..., An} + -nak a helyes értéke. 13
3.28. példa: Legyen egy reláció, amelynek attribútumai R(A,B,C,D,E,F) S funkcionális függőségek halmaza: {(1)AB C, (2)BC AD, (3)D E, (4)CF B} Mi az {A,B} lezártja, azaz az {A,B} + 1. X={A,B} 2. Az 1-es függőségből X={A,B,C} 3. A 2-es függőségből BC D, vagyis X={A,B,C,D} 4. A 3-as függőségből X={A,B,C,D,E} 5. A 4-es függőség bal oldala NINCS benne az X-ben, vagyis tovább nem lehet bővíteni a halmazt {A,B} + ={A,B,C,D,E} 14
Tétel: Az A1A2...An B1B2...Bm funkcionális függőség akkor és csak akkor következik az S függőségi halmazból, ha B1,B2...Bm benne van az {A1,A2,...An} + -ban Lezárások és kulcsok Tétel: {A1,A2,...An} + akkor és csak akkor az összes attribútumokból álló halmaz, ha A1,A2,...An a szóban forgó reláció szuperkulcsa. Adott függőségek és levezetett függőségek. Tétel: Függőségek bármely olyan halmazát, amelyből a reláció összes függőségére tudunk következtetni, az adott reláció bázisának nevezzük. Ha a bázisban nem található a függőségek valódi részhalmaza, amelyből a teljes függőségi halmazt le lehetne vezetni, akkor a bázist minimálisnak nevezzük. 15
3.6.1. feladat. R(A,B,C,D) és AB C, C D és D A f.f. a)melyek azok a nem triviális függőségek, amelyek az adott függőségekből következnek Tranzitivitás (1 és 2) AB D, (2 és 3) C A b) Melyek az R összes kulcsai {A,B}, {B,C}, {B,D}, {A,B,C}, {A,B,D}, {B,C,D}, {A,B,C,D} c) Melyek az R összes kulcsai, amelyek nem szuperkulcsok {A,B}, {B,C}, {B,D} 16
3.28. példa: Legyen egy reláció, amelynek attribútumai R(A,B,C,D,E,F) S funkcionális függőségek halmaza: {(1)AB C, (2)BC AD, (3)D E, (4)CF B} kulcsok {A,B} + ={A,B,C,D,E}, vagyis {A,B,F} az egyik kulcs {B,C} + ={A,B,C,D}, vagyis {B,C,F} egy másik szuperkulcs {C,F} + ={C,F,B}(4)={A,B,C,D,F}(2)={A,B,C,D,E,F}(3) Mivel látjuk, hogy az F NEM szerepel egyik függőség JOBB oldalán sem, ezért minden szuperkulcsban és egyúttal minden kulcsban is benne kell legyen. Tétel: Azon attribútumok, amelyek az eredeti funkcionális függőségek JOBB oldalán NEM szerepelnek, benne kell legyenek a reláció összes kulcsában. 17
A funkcionális függőségek grafikus megjelenítései Grafikus diagram a funkcionális függőségek megjelenítésére: Az attribútumokat téglalapokban tároljuk, nyilakkal adjuk meg a függőségeket. A1 A2 A3 A4 A5 A6 A1,A2 A4 A1,A2 A5 A2 A3 A4 A6 A5 A6 Az elsődleges kulcs által alkotott függőségeket a téglalapok FELSŐ részére írjuk. Csak a bázist írtuk fel, a levezetett függőségeket NEM. 18
A funkcionális függőségek gráfszerű ábrázolása A4 A1 A2 A5 A3 Az előző bázis-ábrázolás gráfra átalakítva. Létezhetnek csomópontok a gráfban, amelyek minimálisan 2 kimenettel kell rendelkezzenek A6 19
Funkcionális függőségek minimális mátrixa A2 A4 A5 A1,A2 2 4 5 7 A1 1 A2 2 A3 3 1 A4 4 1 A5 5 1 A6 6 1 1 A1,A2 7 20
Relációs adatbázissémák tervezése Problémák akkor merülnek fel, amikor túl sok információt próbálunk egyetlen relációba tömöríteni. Ezt anomáliának nevezzük. 1. Redundancia. Az információk feleslegesen ismétlődhetnek több sorban. Az alábbi ábrán a filmek hossza és a műfaj jó példa erre. A többi információ vagy kulcs, vagy idegen kulcs vagy saját attribútum. filmcím év Hossz műfaj stúdiónév színésznév Csillagok háborúja 1977 124 sci-fi Fox Carrie Fisher Csillagok háborúja 1977 124 sci-fi Fox Mark Hamill Csillagok háborúja 1977 124 sci-fi Fox Harrison Ford Elfújta a szél 1939 231 dráma MGM Vivien Leigh Wayne világa 1992 95 vígjáték Paramount Dana Carvez Wayne világa 1992 95 vígjáték Paramount Mike Meyers 21
2. Módosítási problémák. Lehet, hogy megváltoztatjuk az egyik sorban tárolt információt, miközben ugyanaz az információ változatlan marad egy másik sorban. Példa: Csillagok háborúja 125 perces 3. Törlési problémák. Ha az értékek halmaza üres halmazzá válik, akkor ennek mellékhatásaként más információt is elveszthetünk. Péda: Színészek közül kitöröljük Vivien Leight, akkor az Elfújta a szél filmről levő összes információ törlődik 22
Relációk felbontása. Az anomáliák megszüntetésének az elfogadott útja a relációk felbontása (dekompozíciója). R felbontása egyrészt azt jelenti, hogy R attribútumait szétosztjuk úgy, hogy ezáltal két új reláció sémáját alakítjuk ki belőle. R sorait vetítjük. R reláció sémája {A1,A2, An}. R-et felbonthatjuk S és T két relációra, amelyek sémái {B1,B2,...Bm} és {C1,C2,...Ck} úgy, hogy: 1. {A1,A2, An}={B1,B2, Bm}U{C1,C2, Ck} 2. Az S reláció sorai az R-ben szereplő összes sornak a {B1,B2, Bm}-re vett vetületei 3. Hasonlóan a T reláció sorai az R aktuális előfordulásában szereplő sorok {C1,C2,...,Ck} attribútumok halmazára vett projekciói 23
filmcím év Hossz műfaj stúdiónév színésznév Csillagok háborúja 1977 124 sci-fi Fox Carrie Fisher Csillagok háborúja 1977 124 sci-fi Fox Mark Hamill Csillagok háborúja 1977 124 sci-fi Fox Harrison Ford Elfújta a szél 1939 231 dráma MGM Vivien Leigh Wayne világa 1992 95 vígjáték Paramount Dana Carvez Wayne világa 1992 95 vígjáték Paramount Mike Meyers cím, év hossz cím, év műfaj cím, év stúdiónév cím, év hossz, műfaj, stúdiónév cím, év színésznév HAMIS állítás NEM ÉRVÉNYES funkcionális függőség 24
Felbontjuk a Film relációt: Film1(cím, év, hossz, műfaj, stúdiónév) Film2(cím, év, színésznév) filmcím év Hossz műfaj stúdiónév Csillagok háborúja 1977 124 sci-fi Fox Elfújta a szél 1939 231 dráma MGM Wayne világa 1992 95 vígjáték Paramount filmcím év színésznév Csillagok háborúja 1977 Carrie Fisher Csillagok háborúja 1977 Mark Hamill Csillagok háborúja 1977 Harrison Ford Elfújta a szél 1939 Vivien Leigh Wayne világa 1992 Dana Carvez Wayne világa 1992 Mike Meyers 25
Cím Év Hossz műfaj stúdiónév stúdiócím Csillagok háborúja 1977 124 sci-fi Fox Hollywood Kutyahideg 2005 120 dráma Disney Buena Vista Wayne világa 1992 95 vígjáték Paramount Hollywod Cím év stúdiónév stúdiónév stúdiócím Tranzitivitás miatt következik Cím év stúdiócím 26
stúdiónév Fox Disney Paramount stúdiócím Hollywood Buena Vista Hollywood Cím Év Hossz műfaj stúdiónév Csillagok háborúja 1977 124 sci-fi Fox Kutyahideg 2005 120 dráma Disney Wayne világa 1992 95 vígjáték Paramount 27
Színészek Filmek színész stúdiója Szerződik gyártó stúdió gyárt Stúdiók A szerződik reláció kulcsát keressük. Szerzodik(szineszNev, gyartostud, szineszstud, filmcim, gyartev) Fennáll a következő funkcionális függőség: filmcim, gyartev gyartostud 28
Összefoglaló kérdések 1. Funkcionális függőségek. Definíciók. 2. A relációk kulcsai 3. Szuperkulcsok 4. Funkcionális függőségek tipúsai 5. Szabályok 6. Attribútumhalmazok lezártjának kiszámítási algoritmusa 7. 3.28. példa 8. Lezárások és kulcsok 9. Grafikus diagram. Gráf diagram. Mátrix diagram 10. Milyen anomáliák vannak, s ezek hogyan nyilvánulnak meg 29