http://tatiztika.zoc.elte.hu/tartat Táraalomtatiztika, 2003/2004 I. élév. ovember 18. Mai tematika: Változók közötti kapcolat II. A nomináli / orináli eet: azociáció mérőzámok. 1 Bevezeté 1 Hibavalózínűég aránylago cökkenéének elve (PRE, proportional reuction o error) 1 Lamba tulajonágai 2 omináli változók egyéb azociáció mérőzámai 4 Orináli változók azociáció mérőzámai 5 Özeoglalá 9 Iroalom: Frankort-achmia 297-347. Lá még: Babbie 494-498. Változók közötti kapcolat II. A nomináli / orináli eet: azociáció mérőzámok. Bevezeté Az előző órán a változók közötti özeüggéeket kerezttábla é zázalékolá egítégével vizgáltuk. Ezen az órán a változók özeüggéét mérőzámok egítégével ogjuk leírni. Látni ogjuk, hogy ezeknek a mérőzámoknak az interpretációja egyzerűbb, e néha élrevezetőek (körülbelül olyan móon, mint a centráli tenecia é a zóróá mutatói zemben a gyakoriággal). A különböző méréi zintű változókra, különböző mérőzámokat haználunk, e (akárcak a centráli tenenciánál é a zóróánál) többéle mérőzám i haználható egy-egy méréizint eetén. Ma az nomináli/nomináli, illetve orináli/orináli kapcolatokról ogunk bezélni. Hibavalózínűég aránylago cökkenéének elve (PRE, proportional reuction o error) METÁLIS EGÉSZSÉG- AYAGI HELYZET PROBLÉMA MEGLÉTE Inkább rozabb Inkább jobb Özeen Igen 390 (97,5 %) 10 (2,5 %) 400 (100 %) em 40 (6,7 %) 560 (93,3 %) 600 (100 %) Özeen 430 (43 %) 570 (57 %) 1000 (100 %) 1. tábla Haználjuk az elmúlt órán előkerült problémát a mentáli egézég é a az anyagi helyzet özeüggéével kapcolatban (emlékezzünk rá, hogy a mentáli egézéget tekintjük üggetlen változónak, az anyagi helyzetet üggő változónak).
Mot játzuk el azt, hogy meg kell tippelnünk a vizgálatban zereplő emberekről, hogy inkább jobb, vagy inkább rozabb anyagi helyzetűek, e úgy hogy imerjük az anyagi helyzet zerinti elozlát (azaz, hogy 57 % jobb anyagi helyzetű, 43 % rozabb). Mi lenne a legjobb eljárá (képzelük el, hogy jönnek az emberek é a lehető legkeveebb hibával kell beorolnunk őket)? A legjobb eljárá, ha minenkire azt monjuk, hogy jobb anyagi helyzetű, így az ezer eetből éppen 430 eetben téveünk. Hogyan változik a helyzet, ha imerjük a enti táblát é megkérezhetjük a beorolá előtt, hogy van-e mentáli egézégproblémája? Ebben az eetben úgy javíthatunk az előbbi hibaarányon, ha a mentáli betetgéggel küzőket roz anyagi helyzetűnet oroljuk be, a mentáli problémáktól mente zemélyeket peig jó anyagi helyzetűnek. Ilyen móon a hibák zámát 50 eetre cökkentettük. Azaz az arány amellyel a jólá hibája cökken jellemzi a két változó kapcolatát. Az ilyen elven alapuló azociáció mérőzámokat a hibavalózínűég aránylago cökkenéének (PRE) elven alapuló mérőzámoknak nevezzük. Két nomináli változó özeüggéére lambát (λ) zámolunk: λ Ahol: E1 E E 1 2 E 1 E 2 a üggetlen változó igyelembevétele nélkül elkövetett beorolái hibák záma a üggetlen változó igyelembevétele eetén elkövetett beorolái hibák záma konkrét eetben: E λ E 1 430 50 430 1 2 E 0,884 Lamba tulajonágai Tegyük el mot az előbbi tábla kapcán, hogy a üggő változó a mentáli egézégi probléma megléte, a üggetlen változó peig az anyagi helyzet (azt eltételezzük monjuk, hogy valakinek elmegy az eze a gazagágtól). Ebben az eetben a lambát a következőképpen zámítjuk: λ E E 1 400 50 400 1 2 E 0,875
Tehát lamba értéke ügg attól, hogy melyik a üggő é melyik a üggetlen változó. Az ilyen azociáció mérőzámokat azimmetriku mérőzámoknak nevezzük. ézzük meg a enti tábla két változatát: METÁLIS EGÉSZSÉG- AYAGI HELYZET PROBLÉMA MEGLÉTE Inkább rozabb Inkább jobb Özeen Igen 200 (45,5 %) 240 (54,5 %) 440 (100 %) em 230 (41,1 %) 330 (58,9 %) 560 (100 %) Özeen 430 (43 %) 570 (57 %) 1000 (100 %) 2. tábla METÁLIS EGÉSZSÉG- AYAGI HELYZET PROBLÉMA MEGLÉTE Inkább rozabb Inkább jobb Özeen Igen 189 (43 %) 251 (57 %) 440 (100 %) em 241 (43 %) 319 (57 %) 560 (100 %) Özeen 430 (43 %) 570 (57 %) 1000 (100 %) 3. tábla Míg a 2. táblán (az elmúlt órán tanultak alapján) látunk özeüggét, a 3. tábla zerint a két változó teljeen üggetlen. Számoljuk ki a lambákat! A üggetlen változó imerete nélkül a beorolái hiba nagyága imét 430 eet. A üggetlen változó igyelembevételével azonban egyik eetben em cökken a hibák záma. E 1 E 2 430 λ E E E 1 430 430 430 1 2 0 Belátható, hogy a két változó üggetlenége eetén minen eetben 0 lez lamba értéke, vizont 0 érték eetén nem bizto, hogy a két vizgált változó üggetlen. Megjegyzé: e haználjuk, ha több, mint 5 % különbég van a üggetlen változó egye értékei zerinti elozláok között! Özeoglalva: λ tulajonágai - azimmetriku - értéke: 0-1 - üggetlenég eetén értéke 0 (e mákor i lehet)
omináli változók egyéb azociáció mérőzámai Két nomináli változó özeüggéének meghatározáára má mérőzámok i elhaználhatók. Ilyen mérőzám az eélyhányao é a Rogo hányao. Jelölé Képzeljünk el két kétértékű nomináli változót! em: éri/nő Magaág: magaabb, mint 180 cm / alaconyabb, mint 180 cm maga alacony orözeg nő 11 12 1+ éri 21 22 2+ ozlopözeg +1 +2 ++ tehát pl.: 11 maga nők záma +1 magaak záma az öze megigyeléünk záma ++ Ebben az eetben a Rogo hányao: 1+ + 1 Rogo 11 ++ / * Értelmezé: a képlet máoik tagja az 11 cellába eő eetek záma az aott margináli elozlá (a változók külön-külön vett elozláa) mellett, ha a két változó üggetlen. Azaz a üggetlenéghez képet milyen arányú az eltéré. Tulajonágai: - zimmetriku - minimáli é maximáli értéke a margináli elozlától ügg(: variációan nem üggetlen) - üggetlenég eetén minig 1, má eetben oha - a margináliok imeretében egyzerűen helyreállítható a tábla A enti jelöléel az eélyhányao (α): α 11 21 11 / / 12 22 21 12 22 Értelmezé: Két gyakoriág (vagy valózínűég) hányaoát eélynek nevezzük. A kiejezé értelmezééhez gonoljunk pélául a ogaái iroákra: mekkora az eélye annak, hogy a haramik utamban a Szélhámo nevű ló győz? 1:3, azaz egy a háromhoz, vagyi 4 eetből egyzer. Ekkor az eély 1/3. Két eély vizonyzáma az eélyhányao, azaz mennyivel nagyobb az egyik eemény eélye a máikhoz vizonyítva.
Tulajonágai: - zimmetriku - minimáli értéke: 0 - maximáli értéke: + - üggetlenég eetén é cak akkor értéke: 1 - logaritmuát véve az azono abzolútértékűek azono erőégű özeüggét jelölnek - a margináliok imeretében helyreállítható a tábla (bonyolult) (- variációan üggetlen: értéke nem ügg a marginálielozlától) Ellenőrző kéréek Melyik azociáció mérőzám mutatja a kapcolat irányát i? Gonoljuk meg, hogy miért nem lehet negatív lamba! Mik az előnyei é hátrányai az egye mérőzámoknak? Melyik azociáció mérőzám eetén kell megjelölnünk üggő, illetve üggetlen változót? Elgonolkotató Miért baj, ha nem állítható helyre az ereeti tábla az azociáció mérőzám é a margináliok imeretében? Gonoljuk meg, hogy miért nem ügg az eélyhányao értéke a változók külön-külön elozláától (azaz a marginálioktól)! Miért ügg a Rogo hányao a marginálioktól? Milyen eetekben lez lamba értéke 0? Orináli változók azociáció mérőzámai Tekintük meg a következő táblát (3. tábla). Milyen érzi magához a várot, ahol él? 3. tábla Total agyon Közel em Milyen érzi magához a kontinent? agyon Közel em 521 41 20 89,5% 123 50,4% 100 63,7% 744 75,7% 7,0% 106 43,4% 36 22,9% 183 18,6% 3,4 % 15 6,1% 21 13,4% 56 5,7% Özeen 582 100,0 % 244 157 983 A zázalékolá alapján mit gonolunk üggetlen változónak? Van-e özeüggé? Milyen méréi zintű változókat látunk? Hogyan lehetne a PRE elvét érvényeíteni?
Ezúttal pároával vizgáljuk az embereket. Próbáljuk megjóolni minen párra, hogy ebb, vagy kevébé érzi magához a kontinent a pár máik tagjához képet, ha imerjük, hogy a várot, ahol él közlebb érzi magához, mint a pár máik tagja. Imételjük meg az előbbi beorolát úgy, hogy imerjük mekkora azoknak a pároknak az aránya, akiknél igaz az, hogy amelyikük ebb érzi magát a vároához, az érzi ebb magát a kontinenhez i, illetve akiknél nem igaz ez. Hogyan járnánk el? Fejezzük ki a javulát! Hány olyan pár található a mintában akiknél igaz az, hogy amelyikük ebb érzi magát a vároához, az érzi ebb magát a kontinenhez i (azono orrenű párok)? Hogyan lehet ezt kizámolni? Vegyük orra a cellákat a jobb aló arokból. Minen cellába eő megigyeléünk zámát zorzzuk meg a tőle balra é elelé eő cellákba eő megigyeléek özegével. Imételjük meg minen lehetége cellára. Milyen érzi magához a várot, ahol él? Total agyon Közel em Milyen érzi magához a kontinent? agyon Közel em 521 41 20 89,5% 123 50,4% 100 63,7% 744 75,7% 7,0% 106 43,4% 36 22,9% 183 18,6% 3,4 % 15 6,1% 21 13,4% 56 5,7% Özeen 582 100,0 % 244 157 983 21*(521+41+123+106) + 15*(521+41) + 36*(521+123) + 106*521 103 451 Hány olyan pár található a mintában akiknél az igaz, hogy amelyikük ebb érzi magát a vároához, az távolabb érzi magát a kontinentől (orított orrenű párok)?
Hogyan lehet kizámolni? Vegyük orra a cellákat a bal aló arokból. Minen cellába eő megigyeléünk zámát zorzzuk meg a tőle jobbra é elelé eő cellákba eő megigyeléek özegével. Imételjük meg minen lehetége cellára. Milyen érzi magához a várot, ahol él? Total agyon Közel em Milyen érzi magához a kontinent? agyon Közel em 521 41 20 89,5% 123 50,4% 100 63,7% 744 75,7% 7,0% 106 43,4% 36 22,9% 183 18,6% 3,4 % 15 6,1% 21 13,4% 56 5,7% Özeen 582 100,0 % 244 157 983 100*(41+20+106+15) + 123*(41+20) + 36*(15+20) + 106*2029 083 Gammának nevezzük a következő azociáció mérőzámot: γ + Jelen eetben: γ + Gamma tulajonágai 103451 29083 0,561 103451 + 29083 - zimmetriku - értéke -1 é +1 között változhat - üggetlenég eetén értéke 0 - jelentée: az öze minkét változó zerint orbarenezhető pár közül mekkora arányban cökken a jólá hibája a véletlenhez ( (+)/2 ) képet. Egy máik lehetége azociáció mérőzám a Sommer éle. Ennek kizámítáához zámoljuk ki azokat a párokat, amelyek nem renzhetők orba a üggő változó zerint (ty). Hogyan zámoljuk? Válazuk ki a üggő változó legkiebb értékét, kereük meg ezen belül a üggetlen változó legkiebb értékéhez tartozó cellát. Az itt található eetek zámát zorozzuk meg a üggű változó azono értékéhez tartozó, a üggetlen változó nagyobb értékeihez kapcolható cellákba eő eetek zámának özegével. Imételjük meg aig, amíg lehetége.
Milyen érzi magához a várot, ahol él? Total agyon Közel em Milyen érzi magához a kontinent? agyon Közel em 521 41 20 89,5% 123 50,4% 100 63,7% 744 75,7% 7,0% 106 43,4% 36 22,9% 183 18,6% 3,4 % 15 6,1% 21 13,4% 56 5,7% Özeen 582 100,0 % 244 157 983 ty 21*(15+20)+15*20+36*(106+41)+106*41+100*(123+521)+123*521139 156 A Somer éle értéke a következő képlettel zámítható ki: + + ty A konkrét eetben: + 103451 29083 103451+ 29083 + 139156 0,274 A Sommer éle tulajonágai: - azimetriku - értéke -1 é +1 közé eik - üggetlenég eetén értéke 0 Említé zintjén még egy mérőzám: Spearman vagy rang korreláció. Képlete: r ( x i i 1 1 2 ( y ) i 1) 2 ahol x, y az orináli változók, az értékekhez hozzárenelve, hogy hanyaik helyen állnak az elmek záma
Spearman (rang) korreláció tulajonágai: - zimmetriku - értéke -1 é +1 közé eik - üggetlenég eetén értéke 0 Ellenőrző kéréek Melyik a nagyobb azono aatok eetén: a gamma vagy a Sommer? Milyen mérőzámot haználunk orináli méréi zintű változók eetén, ha nem tujuk, hogy melyik a üggő változó (nem jelölhető meg)? Elgonolkotató Mit jelent a Sommer éle? Ha eltérünk a üggetelenégtől hogyan változnak a mot tanult azociáció mérőzámok? Özeoglalá Fogalmak PRE (proportional reuction o error), hibavalózínűég aránylago cökkenéének elve Azociáció mérőzám Azimmetriku / zimmetriku azociáció mérőzám Azono / orított orrenű párok Azociáció mérőzámok é tulajonágaik omináli / nomináli Lamba (azimmetriku, 0 +1, nem érzékeny a üggetlenégre) Rogo hányao (zimmetriku, változó intervallumú) Eélyhányao (zimmetriku,0 +, variációan üggetlen) Orináli/orináli Gamma (zimmetriku, -1 +1) Somme éle (azimmetriku, -1 +1) Spearman (rang) korreláció (zimmetriku, -1 +1)
Péla A következőkben arra vagyunk kívánciak, hogy hogyan ügg öze az embereknek a nemzeti ientitáról alkotott képe az orzágukhoz űzőő kapcolatuk erőégével. Két orzág özehaonlítáára van lehetőég: Magyarorzág é agybritannia. Felaatok: 1. Jelöljünk meg üggő é üggetlen változót! Inokoljuk a válaztát! 2. Elemezzük a megelelő zázalékolá alapján az özeüggéeket! 3. Haználjunk azociáció mérőzámo(ka)t! Inokoljuk a válaztát! agybritannia: How cloe eel to: country * Important: Crotabulation a How cloe eel to: country Total Very cloe Cloe ot very cloe % within How cloe eel to: country % within How cloe eel to: country % within How cloe eel to: country a. ry GB % within How cloe eel to: country Important: Very Fairly ot very important important important Total 142 50 27 219 64,8% 22,8% 12,3% 31,9% 18,5% 13,0% 23,7% 203 134 93 430 47,2% 31,2% 21,6% 45,6% 49,4% 44,9% 46,6% 100 87 87 274 36,5% 31,8% 31,8% 22,5% 32,1% 42,0% 29,7% 445 271 207 923 48,2% 29,4% 22,4%
Magyarorzág How cloe eel to: country * Important: Crotabulation a How cloe eel to: country Total Very cloe Cloe ot very cloe % within How cloe eel to: country % within How cloe eel to: country % within How cloe eel to: country a. ry H % within How cloe eel to: country Important: Very Fairly ot very important important important Total 343 198 237 778 44,1% 25,4% 30,5% 86,2% 74,4% 75,5% 79,6% 43 59 62 164 26,2% 36,0% 37,8% 10,8% 22,2% 19,7% 16,8% 12 9 15 36 33,3% 25,0% 41,7% 3,0% 3,4% 4,8% 3,7% 398 266 314 978 40,7% 27,2% 32,1% Változók: Milyen érzi magát az orzághoz, ahol lakik? (How cloe eel to: country) agyon (very cloe) Közel (cloe) em (not very cloe) Mennyire onto a brittég/magyarág zempontjából az, hogy vki az orzágban zületett? (Important: agyon onto (very important) Elég onto (airly important) em onto (not very important)
Azociáció mérőzámok ereményei: agybritannia Orinal by Orinal Somer' a. ot auming the null hypothei. Symmetric Directional Meaure c How cloe eel to: country Depenent Important: born in (R country) Depenent b. Uing the aymptotic tanar error auming the null hypothei. c. ry GB Aymp. Approx. Value St. Error a Approx. T b Sig.,195,029 6,809,000,197,029 6,809,000,194,028 6,809,000 Orinal by Orinal Interval by Interval o Vali Cae Gamma Spearman Correlation Pearon' R a. ot auming the null hypothei. Symmetric Meaure Aymp. Approx. Value St. Error a Approx. T b Sig.,305,043 6,809,000,217,032 6,733,000 c,216,031 6,714,000 c 923 b. Uing the aymptotic tanar error auming the null hypothei. c. Bae on normal approximation.. ry GB
Magyarorzág: Orinal by Orinal Somer' a. ot auming the null hypothei. Symmetric Directional Meaure c How cloe eel to: country Depenent Important: born in (R country) Depenent b. Uing the aymptotic tanar error auming the null hypothei. c. ry H Aymp. Approx. Value St. Error a Approx. T b Sig.,104,027 3,786,000,079,021 3,786,000,154,040 3,786,000 Orinal by Orinal Interval by Interval o Vali Cae Gamma Spearman Correlation Pearon' R a. ot auming the null hypothei. Symmetric Meaure Aymp. Approx. Value St. Error a Approx. T b Sig.,228,058 3,786,000,118,031 3,720,000 c,108,032 3,382,001 c 978 b. Uing the aymptotic tanar error auming the null hypothei. c. Bae on normal approximation.. ry H