Ismérvek között kapcsolatok szorosságáak vzsgálata 1. Egy ks smétlés: mérés skálák (Huyad-Vta: Statsztka I. 5-6. o) A külöböző smérveket, eltérő mérés sztekkel (skálákkal) ellemezhetük. a. évleges (omáls) mérés skála: az egységekhez redelhető smérvértékek (akár számok akár em) alapá csak azt tuduk megállapíta, hogy az egységek az adott smérv szempotából egyezőek-e vagy sem. Műveleteket em tuduk velük végez. Példa: lakhely típusa smérv smérvértéke: főváros, város, község. A mérés szt évleges, hsze ez alapá csak azt tuduk megállapíta, hogy egy egyed más típusú települése él-e mt egy másk egyé, de em modhatuk, hogy a város több vagy obb mt a község. Szté semm értelme em lee ezeket eloszta egymással vagy kvo őket egymásból, még akkor sem ha az smérvértékeket számmal elölék. b. Sorred (ordáls) skála: em csak az smérvértékek külöbsége hordoz formácót, haem azok sorrede s. Példa: érdemegyek (smérvértékek: 1,, 3, 4, 5). Tuduk, hogy ak ötöst kapott, az emcsak eltér attól, ak égyest kapott, haem obba s telesített. Tehát va értelme sorredbe helyez az egyedeket az érdemegy alapá. Ugyaakkor ylvávalóa sem a kvoásak, sem az osztásak em lee értelme: az egyes és a kettes között más a külöbség, mt a kettes és a hármas között. Az sem lee gaz, hogy ak kettest kapott az kétszer olya ó volt, mt ak egyest, vagy, hogy az egyes a ketteshez úgy aráylk, mt a kettes a égyeshez. c. ülöbség (tervallum) skála: az smérvértékek külöbségeek va értelme (va mértékegység s), ugyaakkor az aráyokat em tuduk értelmez. Eek oka, hogy a külöbség skálá mérhető smérvek esetébe a ulla pot ökéyese va kelölve. Példa: Celsus-féle hőmérséklet skála. 10 C és 0 C között a külöbség ugyaay mt 0 C és 30 C között. Ugyaakkor em modhatuk, hogy a 10 C kétszer melegebb, mt az 5 C, vagy, hogy a 0 C pot ayszor melegebb a 10 C-ál, mt a 10 C az 5 C-ál. elátható, hogy eek az az oka, hogy a Celsus-féle skála ulla pota (lletve a 100 C s) ökéyese került megállapításra: 0 C em elet a hőmérséklet háyát. d. Aráyskála: Az smérvértékek aráya s értelmezhetőek, a ulla pot em ökéyese va megállapítva. Példa: az smérv a hav övedelem. Ha valakek 00 ezer fort a hav övedelme, akkor arra yugodta modhatuk, hogy kétszer ay, mt a 100 ezer fortos övedelem és, hogy ez a két övedelem pot úgy aráylk egymáshoz, mt az 1 mlló fortos övedelem az 500 ezres övedelemhez. A ulla pot em ökéyes, hsze a ulla fort övedelem a övedelem háyát elöl. Az smérvek között kapcsolat szorosságát az smérvek mérés skáláától függőe a következő eszközökkel vzsgálhatuk: 1. Mdkét smérv mőség vagy terület (azaz omáls mérés sztű): asszocácó. Az egyk smérv terület vagy mőség (azaz omáls mérés sztű), a másk smérv (változó) pedg meység (azaz legalább külöbség skálá mért): vegyes kapcsolat 3. Mdkét smérv meység: korrelácó.
Asszocácó: Megfgyeltük, hogy egy három szíbe (pros, kék, zöld) gyártott termékből a férfak és a ők mey darabot vásároltak. (Azaz két mőség smérvük va: termék szíe, és a vásárló eme). Vao va-e kapcsolat a vásárló eme, és a választott szí között? pros kék zöld összese férfak 10 15 0 45 ők 0 10 5 35 összese 30 5 5 80 Az általáos elölésekkel: pros kék zöld összese férfak f 11 f 1 f 13 f 1. ők f 1 f f 3 f. összese f.1 f. f.3 A fet kotgecatáblába a sorok és az oszlopok utolsó adata peremgyakorságokak evezzük. A feladat megoldásához készítsük el a fet tábla egy olya verzóát, amelybe feltételeztük az smérvek függetleségét. Ha a két smérv függetlee, akkor a gyakorságok kszámíthatóak a peremgyakorságokból a következő módo: f *. f. f Azaz ha a szí és a vásárló eme függetleek leéek egymástól, akkor az f 11 gyakorság helyé a következő gyakorság szerepele: * f.1 f1. 4530 f11 16,875 80 Így elkészíthetük a kotgecatáblát a feltételezett gyakorságokkal: pros kék zöld összese férfak 16,875 14,065 14,065 45 ők 13,15 10,9375 10,9375 35 összese 30 5 5 80 A taköyv 16. oldalá látható kh-égyzet teststatsztkát a valós és a feltételezett valószíűségekből a következő módo számolhatuk k: r c * f f * f 1 1, ahol r a sorok, c pedg az oszlopok száma. Jele példába: (10 16,875) (15 14,065) (0 14,065) (0 13,15) (10 10,9375) 16,875 14, 065 14, 065 13,15 10,9375 (5 10,9375) 1, 751 10,9375 Az, hogy a fet statsztka ullától eltér, már elz, hogy a két smérv között va kapcsolat. Az asszocácó egyk gyakor mérőszámát, a Cramer-féle asszocácós együtthatót a következő módo számolhatuk k: C m(( r 1),( c 1))
Ahol a m((r-1),(c-1)) függvéy azt elet, hogy a sorok lletve az oszlopok számából vouk k egyet, és a ksebb értéket vegyük fgyelembe. Azaz, mvel ebbe a példába két sor és három oszlop volt (az összesítő oszlop és sor em számít!) Azaz: 1, 751 C 0,3917 m(( r 1),( c 1)) 801 A Cramer-féle mutató értéke 0 és 1 között értékeket vehet fel. Értéke 0 a két smérv függetlesége, 1 pedg a két smérv determsztkus kapcsolata eseté. A fet érték egy a közepesél gyegébb kapcsolatra utal a vásárló eme, és a választott szí között. Vegyes kapcsolat: Példa: egy vállalatál megfgyeltük a férfak és a ők keresetet (ezer fort/hó): Férfak: 10, 83, 65, 190, 30, 10, 130, 190 ők: 70, 65, 90, 100, 10, 130 Vao va-e összefüggés a kereset (meység smérv) és a em (mőség smérv) között? Az átlagbért és a szórást kszámoluk az egyes kategórákba, azaz a részsokaságokra (ezt em részletezem, a képletek smertek). Az egyes kategórákra (emekre) kszámolt átlagok a részátlagok. észítsük el a táblát a megoldáshoz: em Létszám Átlagbér (ezer ft/hó) (részátlagok, Y ) Szóráségyzet Szórás (ezer ft/hó) férf 8 141 858,5 53,46 ő 6 95,83 570,14 3,88 összese 14 Illetve számoluk k az átlagbért és a szórást az egész sokaságra (utóbb a teles szórás), azaz férfakra és őkre együttese: Y 11,7 ezer ft/hó, a teles szórás pedg 48,76 ezer ft/hó A taköyv 149-150. oldalá található meg a módszer részletes leírása. A léyeg, hogy a teles szóráségyezet (σ ) felotható két szóráségyzet összegére: Ahol σ a külső szórás és azt mutata meg, hogy a részátlagok átlagosa meyre térek el a főátlagtól, míg σ a belső szórás és azt mutata meg, hogy az egyes részsokaságokhoz tartozó megfgyelések (a ők lletve külö a férfak) meyre térek el átlagosa a saát részátlaguktól. Láthatuk, hogy ha a fet szóráségyzetekből (lletve a szórásokból) kettőt smerük, a harmadk már azokból kszámolható. A teles szóráségyzetet smerük, hsze az: 48, 76 377, A külső szóráségyzet a következő módo számolható k: M 1 8 (14111, 7) 6 (95,8311, 7) ( Y Y ) 499,6 14 1
Vagys a külső szóráségyzet em más, mt az egyes részátlagokak a sokaság egészéek átlagától vett égyzetes eltéréséek az egyes részsokaságokba tartozó egyedek számával súlyozott számta átlaga. A belső szóráségyzet tehát: 377, 499,6 1877, 6 Természetese k lehete számol a belső szóráségyzetet s: M 1 8858, 5 6570,14 1877,6, am egybe a számításak próbáa s. A 1 14 megoldásuk helyes. A vegyes kapcsolat szorosságáak leírásához a H mutatót haszáluk fel, am em más, mt az Y smérv (fzetés) szóráségyzetéek az X smérv (em) által magyarázott háyada. 499,6 H 1 0,1 377, Azaz ebbe a példába azt találuk, hogy a em a fzetésekbe megfgyelhető külöbségek 1%-át magyarázza. Ez gyege vegyes kapcsolatra utal. orrelácó: ét meység smérv között kapcsolat szorosságát mérhetük ezzel a mutatóval. Példa: a övedelem és a fogyasztás kapcsolatát elemeztük Egyé Fogyasztás Jövedelem (ezer ft) (ezer ft) 1 100 10 90 140 3 140 160 4 180 00 5 110 10 6 1 300 7 10 150 összese - - Vzsgáluk meg a két smérv között kapcsolat szorosságát! Az egyk kulcsfotosságú statsztka a kovaraca: Y Y X X dydx 1 1 cov( y, x), ahol dy Y Y, dx X X Ha a kovaraca értéke ulla, akkor a két változó között leárs kapcsolat cs. A kovaraca előele a kapcsolat ráyára utal. Poztív kovaraca eseté magasabb x értékekhez általába magasabb y értékeke társulak, míg egatív kovaraca eseté a kapcsolat ráya s egatív, azaz magasabb x értékekhez általába alacsoyabb y értékeke társulak. A kapcsolat szorosságáról azoba a kovaraca em ad táékoztatást.
A két smérv között kapcsolat szorosságáak mérésére a kovaracáál alkalmasabb mutató a korrelácós együttható. 1 cov( y, x) r( y, x) y x dy dx 1 dy dx dy dx 1 1 1 1 A korrelácós együttható -1 és 1 között értékeket vehet fel. Ha r=0, akkor a két változó között cs leárs kapcsolat. A korrelácós együttható előele, megőrzve a kovaraca előelét, a kapcsolat ráyára utal. Azaz poztív korrelácós együttható eseté magasabb x értékek általába magasabb y értékekkel párosulak, míg egatív együttható eseté magasabb x értékekhez általába alacsoy y értékek tartozak. Mél közelebb kerül az együttható értéke a 1-hez vagy -1-hez, aál erősebb a kapcsolat. Specáls eset ha r=1 vagy r=-1. Ekkor azt moduk, hogy x és y között determsztkus kapcsolat va, azaz ha smerük x értékét potosa (bzoytalaság, hba élkül) meg tuduk határoz y értékét s. Azaz y=a+b*x, ha r=1, és y=a-b*x, ha r=-1. Számoluk k a korrelácós együttható értékét! dy Egyé Fogyasztás övedelem (ezer ft) (ezer ft) dy dx dy dx dydx 1 100 10-36 -50 196 500 1800 90 140-46 -30 116 900 1380 3 140 160 4-10 16 100-40 4 180 00 44 30 1936 900 130 5 110 10-6 -50 676 500 1300 6 1 300 76 130 5776 16900 9880 7 10 150-16 -0 56 400 30 összese - - 0 0 107 400 15960 dx dydx 1 15960 cov( y, x) 80, azaz va kapcsolat a övedelem és a fogyasztás között, 7 ráya pedg poztív. dy dx 15960 1 (, ) 0,934 107400 dy dx 1 1 r y x A fet korrelácós együttható erős, poztív kapcsolatra utal a övedelem és a fogyasztás között. Magasabb övedelmekhez magasabb fogyasztás társul. A korrelácós együtthatóból számítható a determácós együttható (r ), amelyek értelmezése a H együtthatóhoz hasoló: megmutata, hogy x változó segítségével az y változó szóráségyzetéek mekkora háyadát magyaráztuk. r 0,934 0,87, azaz a övedelem a fogyasztás szóráségyzetéek 87,%-át magyarázza.