Khi-négyzet próbák Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet
Khi-négyzet próba Példa Az elleni oltóanyagok különböző típusainak hatását vizsgálták abból a szempontból, hogy a beoltottak milyen arányban betegedtek meg. Az eredmények az alábbi táblázatban láthatók. Kérdés: Mondhatjuk-e, hogy az egyes típusú oltóanyagok ugyanúgy hatnak, azaz, lényegében azonos-e a megbetegedettek aránya, vagy nem? 2012.11.07 Krisztina Boda Khí-négyzet próbák 2
Khi-négyzet próba Influenzában megbetegedett Példa Mondhatjuk-e, hogy az egyes típusú oltóanyagok ugyanúgy hatnak, azaz, lényegében azonos-e a megbetegedettek aránya, vagy nem? Nem betegedett meg influenzával Csak szezonális 43 237 280 Csak H1N1 52 198 250 Kombinált 25 245 270 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 3
Khi-négyzet próba függetlenségvizsgálatra A khi négyzet próbát két diszkrét változó közötti kapcsolat vizsgálatára használjuk. Azaz van-e kapcsolat a két változó (X és Y) között, vagy függetlenek egymástól. Legyenek az X és Y értékei x 1, x 2, x r, és y 1, y 2, y c az A 1, A 2, A r illetve B 1, B 2, B c kimenetelek esetén A megfigyelések száma: n 2012.11.07 Krisztina Boda Khí-négyzet próbák 4
Kontingencia táblázat Jelölje O ij A i és B j események együttes bekövetkezéseinek számát (megfigyelt gyakoriságok) B 1 B 2 B c Sor összeg A 1 O 11 O 12 O 1s O 1+ A 2 O 21 O 22 O 2s O 2+ A r O r1 O r2 O rs O r+ Oszlop összeg O +1 O 2+ O s+ n O i+ = s O ij j=1 i = 1, 2,, r A i esemény gyakorisága Krisztina Boda 2012.11.07 O +j = r O ij i=1 j = 1, 2,, s B j esemény gyakorisága
Várt gyakoriságok Feltéve, hogy a két változó független, a kontingencia táblázat oszlop illetve sorösszegeinek segítségével kiszámolhatók a várt gyakoriságok, minden cellához. sorösszeg oszlopösszeg várt gyakoriság = mintaelemszám B 1 B 2 B c Sor összeg A 1 O 1+ A 2 O 2+ E ij = O i+o +j n A r O r+ Oszlop összeg O +1 O 2+ O s+ n Krisztina Boda 2012.11.07
Várt gyakoriságok Feltéve, hogy a két változó független, a kontingencia táblázat oszlop illetve sorösszegeinek segítségével kiszámolhatók a várt gyakoriságok, minden cellához. sorösszeg oszlopösszeg várt gyakoriság = mintaelemszám E 11 = O 1+O +1 n B 1 B 2 B c Sor összeg A 1 E 11 O 1+ A 2 O 2+ A r O r+ Oszlop összeg O +1 O 2+ O s+ n Krisztina Boda 2012.11.07
Várt gyakoriságok Feltéve, hogy a két változó független, a kontingencia táblázat oszlop illetve sorösszegeinek segítségével kiszámolhatók a várt gyakoriságok, minden cellához. sorösszeg oszlopösszeg várt gyakoriság = mintaelemszám B 1 B 2 B c E 21 = O 2+O +1 n Sor összeg A 1 E 11 O 1+ A 2 E 21 O 2+ A r O r+ Oszlop összeg O +1 O 2+ O s+ n Krisztina 2012.11.07 Boda
Várt gyakoriságok Feltéve, hogy a két változó független, a kontingencia táblázat oszlop illetve sorösszegeinek segítségével kiszámolhatók a várt gyakoriságok, minden cellához. sorösszeg oszlopösszeg várt gyakoriság = mintaelemszám B 1 B 2 B c Sor összeg A 1 E 11 E 12 E 1s O 1+ A 2 E 21 E 22 E 2s O 2+ A r E r1 E r2 E rs O r+ Oszlop összeg O +1 O 2+ O s+ n Krisztina 2012.11.07 Boda
Khi-négyzet próba függetlenségvizsgálatra A khi négyzet próbát két diszkrét változó közötti kapcsolat vizsgálatára használjuk. Azaz van-e kapcsolat a két változó (X és Y) között, vagy függetlenek egymástól. A khi-négyzet próba alkalmazhatóságának feltételei az 5-nél kisebb várt gyakoriságot tartalmazó cellák száma legfeljebb az összes cella 20% -a. (Ehelyett gyakran használjuk, hogy minden cella várt gyakorisága legalább 5. Ez erősebb, de könnyebben ellenőrizhető feltétel.) Krisztina Boda 10
H 0 : a két változó független (P A i B j = P A i P(B j )) H 1 : a két változó között van kapcsolat Próbastatisztika: Khi-négyzet próba függetlenségvizsgálatra χ 2 = r i=1 c j=1 (O ij E ij ) 2 E ij Ha az előbbi feltételek teljesülnek, akkor a minta eloszlása r 1 c 1 szabadságfokú χ 2 eloszlással közelíthető (r és c a sorok és oszlopok száma a kontingencia táblázatban) Krisztina Boda 11
Khi-négyzet próba függetlenségvizsgálatra Döntés ha χ 2 < χ 2 table elfogadjuk a nullhipotézist, a két változó független ha χ 2 > χ 2 table, elvetjük a nullhipotézist, a két változó között van kapcsolat Krisztina Boda 2012.11.07 Khi-négyzet próbák 12
Khi-négyzet eloszlás n független standard normális eloszlású véletlen változó négyzeteinek összege khi-négyzet eloszlású n szabadságfokkal 0.30 0.25 0.20 0.15 0.10 0.05 df 2 df 3 df 5 df 10 0.00 0 5 10 15 20 25 2012.11.07 Krisztina Boda Khí-négyzet próbák 13
Khi-négyzet tábla α = 0.05 szabadságfok:10 kritikus érték: χ 2 table = 18.31 Krisztina Boda 2012.11.07 Khi-négyzet próbák 14
Khi-négyzet próba Példa Mondhatjuk-e, hogy az egyes típusú oltóanyagok ugyanúgy hatnak, azaz, lényegében azonos-e a megbetegedettek aránya, vagy nem? védőoltás típusa megbetegedés megjelenése Influenzában megbetegedett Influenzában nem betegedett meg Csak szezonális 43 237 280 Csak H1N1 52 198 250 Kombinált 25 245 270 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 15
Hipotézisek: H 0 : a vakcina típusa és a megbetegedése megjelenése független H 1 : a vakcina típusa és a megbetegedése megjelenése nem független Elsőfajú hiba α = 0.05 Khi-négyzet próba Példa Szabadsági fok df = r 1 c 1 = 3 1 2 1 = 2 1 = 2 Krisztina Boda 2012.11.07 Khi-négyzet próbák 16
Számoljuk ki a várt gyakoriságokat vártgyakoriság = Khi-négyzet próba Number getting Példa sorösszeg oszlopösszeg mintaelemszám Number not getting 280 120 Seasonal only 42 280 800 H1N1 only 250 Combined 270 120 680 800 Krisztina Boda 2012.11.07 Khi-négyzet próbák 17
Számoljuk ki a várt gyakoriságokat vártgyakoriság = Khi-négyzet próba Number getting Példa sorösszeg oszlopösszeg mintaelemszám Number not getting 280 680 800 Seasonal only 42 238 280 H1N1 only 250 Combined 270 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 18
Számoljuk ki a várt gyakoriságokat vártgyakoriság = Khi-négyzet próba Number getting Példa sorösszeg oszlopösszeg mintaelemszám Number not getting Seasonal only 42 238 280 250 120 H1N1 only 37.5 250 800 Combined 245 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 19
Számoljuk ki a várt gyakoriságokat vártgyakoriság = Khi-négyzet próba Number getting Példa sorösszeg oszlopösszeg mintaelemszám Number not getting 250 680 800 Seasonal only 42 238 280 H1N1 only 37.5 212.5 250 Combined 270 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 20
Számoljuk ki a várt gyakoriságokat vártgyakoriság = Khi-négyzet próba Number getting Példa sorösszeg oszlopösszeg mintaelemszám Number not getting Seasonal only 42 238 280 270 120 H1N1 only 37.5 212.5 250 800 Combined 40.5 270 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 21
Számoljuk ki a várt gyakoriságokat vártgyakoriság = Khi-négyzet próba Number getting Példa sorösszeg oszlopösszeg mintaelemszám Number not getting 270 680 Seasonal only 42 238 280 800 H1N1 only 37.5 212.5 250 Combined 40.5 229.5 270 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 22
Khi-négyzet próba Példa Számoljuk ki a várt gyakoriságokat vártgyakoriság = sorösszeg oszlopösszeg mintaelemszám Number getting Number not getting Seasonal only 42 238 280 H1N1 only 37.5 212.5 198 Combined 40.5 229.5 245 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 23
Khi-négyzet próba Minden cella esetén számoljuk ki (O ij E ij ) 2 megfigyelt gyakoriságok Number getting Number not getting Seasonal only 43 237 280 H1N1 only 52 198 198 Combined 25 245 245 120 680 800 várt gyakoriságok Példa E ij (43 42) 2 42 Number getting 0.0238 Number not getting Seasonal only 0.0238 0.0042 H1N1 only 5.6067 0.9894 Combined 5.9321 1.0468 Number getting Number not getting Seasonal only 42 238 280 H1N1 only 37.5 212.5 198 Combined 40.5 229.5 245 120 680 800 Krisztina Boda 2012.11.07 Khi-négyzet próbák 24
Khi-négyzet próba Minden cella esetén számoljuk ki (O ij E ij ) 2 megfigyelt gyakoriságok Number getting Number not getting Seasonal only 43 237 280 H1N1 only 52 198 198 Combined 25 245 245 120 680 800 várt gyakoriságok Példa E ij Number getting (237 238) 2 238 Number not getting 0.0042 Seasonal only 0.0238 0.0042 H1N1 only 5.6067 0.9894 Combined 5.9321 1.0468 Number getting Number not getting Seasonal only 42 238 280 H1N1 only 37.5 212.5 198 Combined 40.5 229.5 245 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 25
Minden cella esetén számoljuk ki (O ij E ij ) 2 megfigyelt gyakoriságok Khi-négyzet próba Példa E ij Number getting Number not getting Seasonal only 43 237 280 H1N1 only 52 198 198 Combined 25 245 245 120 680 800 várt gyakoriságok Number getting Number not getting Seasonal only 0.0238 0.0042 H1N1 only 5.6067 0.9894 Combined 5.9321 1.0468 (198 212. 5) 2 212. 5 0.9894 Number getting Number not getting Seasonal only 42 238 280 H1N1 only 37.5 212.5 198 Combined 40.5 229.5 245 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 26
Minden cella esetén számoljuk ki (O ij E ij ) 2 megfigyelt gyakoriságok Khi-négyzet próba Példa E ij Number getting Number not getting Seasonal only 43 237 280 H1N1 only 52 198 198 Combined 25 245 245 120 680 800 várt gyakoriságok Number getting Number not getting Seasonal only 42 238 280 H1N1 only 37.5 212.5 198 Combined 40.5 229.5 245 120 680 800 Number getting Number not getting Seasonal only 0.0238 0.0042 H1N1 only 5.6067 0.9894 Combined 5.9321 1.0468 (25 40. 5) 2 40. 5 5.9321 Krisztina 2012.11.07 Boda Khi-négyzet próbák 27
Minden cella esetén számoljuk ki (O ij E ij ) 2 megfigyelt gyakoriságok Khi-négyzet próba Példa E ij Number getting Number not getting Seasonal only 43 237 280 H1N1 only 52 198 198 Combined 25 245 245 120 680 800 várt gyakoriságok Number getting Number not getting Number getting Number not getting Seasonal only 0.0238 0.0042 H1N1 only 5.6067 0.9894 Combined 5.9321 1.0468 (245 229. 5) 2 229. 5 1.0468 Seasonal only 42 238 280 H1N1 only 37.5 212.5 198 Combined 40.5 229.5 245 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 28
Khi-négyzet próba Példa Számoljuk ki a próbastatisztikát Number getting Number not getting Seasonal only 0.0238 0.0042 H1N1 only 5.6067 0.9894 Combined 5.9321 1.0468 Adjuk össze a kiszámolt értékeket! r c χ 2 (O ij E ij ) 2 = = 0.0238 + 0.0042 + 5.6067 + 0.9894 + 5.9321 i=1 j=1 E ij + 1.0468 = 13. 6030 Krisztina 2012.11.07 Boda Khi-négyzet próbák 29
Adjuk meg a kritikus értéket (táblázatból) (α = 0.05, df = 2) χ 2 table = 5.99 Döntés: Elvetjük H 0, 13.6030 > 5.99 azaz χ 2 > χ 2 table a két változó nem független Khi-négyzet próba Példa a megbetegedések száma nem azonos a három csoportban Krisztina 2012.11.07 Boda Khi-négyzet próbák 30
Khi-négyzet próba Példa SPSS eredmények χ 2 = 13.603 p = 0.001 A feltételek teljesülnek 2012.11.07 Krisztina Boda Khi-négyzet próbák 31
Khi-négyzet próba Példa SPSS eredmények p = 0.001 < α = 0.05 elvetjük a nullhipotézist 2012.11.07 Krisztina Boda Khi-négyzet próbák 32
Speciális eset: 2 x 2-es táblázat Rizikófaktor YES NO 1.csoport a b a+b 2.csoport c d c+d a+c b+d n Próbastatisztika: χ 2 = n(a d b c) 2 a + b c + d a + c (b + d) 2012.11.07 Krisztina Boda Khi-négyzet próbák 33
Kezelés Khi-négyzet próba Példa Két különböző kezelés eredményét hasonlítjuk össze az alábbi táblázat szerint: Kimenetel Meghalt Él A 5 45 50 B 8 42 50 13 87 100 Krisztina Boda 2012.11.07 Khi-négyzet próbák 34
Khi-négyzet próba Példa H 0 : a kezelés kimenetele független a kezelés típusától a populációban (azaz azonos arányban halnak meg a két csoportban) H 1 : a kezelés kimenetele függ a kezelés típusától = 0.05 df = 1 χ 2 = n(a d b c) 2 = 100(5 42 8 45)2 a+b c+d a+c (b+d) 50 50 13 87 χ 2 table = 3.841 = 0.79 0.79 < 3.841 azaz χ 2 < χ 2 table Elfogadjuk a nullhipotézist, a két változó független 2012.11.07 Krisztina Boda Khi-négyzet próbák 35
SPSS output SPSS által számolt p érték 0.372, ez nagyobb, mint = 0.05, ennek alapján szintén elvetjük a nullhipotézist. Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Chi-Square Tests Asy mp. Sig. Value df (2-sided),796 b 1,372,354 1,552,802 1,370,788 1,375 100 a. Computed only for a 2x2 table Exact Sig. (2-sided) Exact Sig. (1-sided),554,277 b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 6,50. 2012.11.07 Khi-négyzet próbák 36 Krisztina Boda 36
Yates korrekció 2 x 2 es táblázat esetén a próbastatisztika értéke pontosabban számolható, ha az alábbi korrekciót alkalmazzuk. Yates korrekció csak akkor alkalmazható, ha a szabadságfok 1. Próbastatisztik a Yates korrekcióval: χ 2 = n( a d b c 1 2 n)2 a + b c + d a + c (b + d) 2012.11.07 Krisztina Boda Khi-négyzet próbák 37
Fisher féle egzakt teszt Fisher féle egzakt teszt a próbastatisztika kiszámítása helyett közvetlenül a p értéket számol. Habár a gyakorlatban akkor használjuk, ha a kis elemszámú minták van, de nagy elemszám esetén is pontos értéket ad. 2012.11.07 Krisztina Boda Khi-négyzet próbák 38
Fisher féle egzakt teszt Példa Adott a következő gyakorisági táblázat STDs HIV fertőzés yes no total yes 3 7 10 no 5 10 15 total 8 17 25 Van-e kapcsolat HIV fertőződés és STD között? (5%-os szinten). 2012.11.07 Krisztina Boda Khi-négyzet próbák 39
Fisher féle egzakt teszt Példa A megfigyelt táblázat valószínűsége adott marginálisok (sor ill. oszlopösszeg) esetén. p = a + c! b + d! a + b! c + d! n! a! b! c! d! 2012.11.07 Krisztina Boda Khi-négyzet próbák 40
megfigyelt gyakoriságok STDs HIV Infection yes no total yes 3 7 10 no 5 10 15 total 8 17 25 lehetséges átrendezések STDs Fisher féle egzakt teszt HIV Infection yes no total yes 2 8 10 no 6 9 15 total 8 17 25 Példa p obs = p = 10! 15! 8! 17! 3! 7! 5! 10! 25! = 0.3332 10! 15! 8! 17! 2! 8! 6! 9! 25! = 0.2082 STDs STDs HIV Infection yes no total yes 1 9 10 no 7 8 15 total 8 17 25 HIV Infection yes no total yes 0 10 10 no 8 7 15 total 8 17 25 p = p = 10! 15! 8! 17! 1! 9! 7! 8! 25! = 0.0595 10! 15! 8! 17! 0! 10! 8! 7! 25! = 0.6068 2012.11.07 Krisztina Boda Khi-négyzet próbák 41
megfigyelt gyakoriságok STDs HIV Infection yes no total yes 3 7 10 no 5 10 15 total 8 17 25 lehetséges átrendezések STDs STDs STDs Fisher féle egzakt teszt HIV Infection yes no total yes 2 8 10 no 6 9 15 total 8 17 25 HIV Infection yes no total yes 1 9 10 no 7 8 15 total 8 17 25 HIV Infection yes no total yes 0 10 10 no 8 7 15 total 8 17 25 Példa p obs = 0.3332 p = 0.2082 p = 0.0595 p = 0.0059 A Fisher féle p érték kiszámolásához az összes lehetséges átrendezés közül csak azokat kell figyelembe venni, amelyek legalább annyira eltérők, mint a megfigyelt táblázat (most mind) Fisher féle p érték = 0.3332 + 0.2082 + 0.0595 + 0.0059 = 0. 6068 Krisztina Boda 2012.11.07 Khi-négyzet próbák 42
Khi-négyzet próba illeszkedésvizsgálatra
Illeszkedésvizsgálat khi-négyzet próbával Az illeszkedésvizsgálat célja annak meghatározása, hogy a mintaelemek adott eloszlású populációból származnak-e. H 0 : X változó eloszlása az adott eloszlás H 1 : X változó eloszlása nem az adott eloszlás 2012.11.07 Khi-négyzet próbák 44 Krisztina Boda 44
Diszkrét változó. A változók eloszlása Folytonos változó Kockajáték közben felmerül a gyanú, hogy szabályos-e a kocka. Kísérletképpen 120-szor feldobjuk a kockát. Megfigyelt gyakoriságok Szeretnénk ellenőrizni, hogy egy folytonos változó (életkorok eloszlása) normális eloszlásból származik-e. Az életkorok eloszlása 30 25 20 25 18 21 17 20 19 15 10 5 0 1 2 3 4 5 6 Krisztina 2012.11.07 Boda Khi-négyzet próbák 45
Illeszkedésvizsgálat khi-négyzet próbával Tegyük fel, hogy adott n elemű minta. Készítsünk oszlopdiagramot vagy hisztogramot a változó típusának megfelelően. Mindkét esetében gyakoriságok sorozatát kapjuk: ezek a megfigyelt gyakoriságok. Jelölje O i, i = 1, 2,, r az i -edik kategóriába esés gyakoriságát (r a kategóriák száma). Jelölje p i, az i -edik kategóriába esés valószínűségét a populációban. (az adott eloszlás esetén). Ha ezek a valószínűségek ismertek, tiszta illeszkedésvizsgálatról beszélünk. Ha nem ismertek, akkor a mintából kell őket becsülni, ezért ekkor becsléses illeszkedésvizsgálatról beszélünk. Krisztina Boda Khi-négyzet próbák 46
Illeszkedésvizsgálat khi-négyzet próbával Ha H 0 igaz és n nagy, akkor a relatív gyakoriságok a p i k közelítései: p i = k i n k i = n p i megfigyelt gyakoriság várt gyakoriság Az alábbi próbastatisztika χ 2 eloszlású (r 1 s) szabadság fokkal (ahol s az eloszlás paramétereinek a száma χ 2 = r j=1 (O i E i ) 2 E i = r j=1 (k i n p i ) 2 n p i Krisztina 2012.11.07 Boda Khi-négyzet próbák 47
Illeszkedésvizsgálat Kockajáték közben felmerül a gyanú, hogy nem szabályos a kocka. Kísérletképpen 120 dobást végzünk. H 0 : a kocka szabályos, minden dobás egyformán valószínű, p i = 1 6. Várható gyakoriságok minden kimenetel esetén: n p i = 120 1 6 = 20 Példa 1. Krisztina Boda Khi-négyzet próbák 48
Lehetséges kimenetelek: Illeszkedésvizsgálat Példa 1. 1 2 3 4 5 6 Megfigyelt gyakoriságok: 25 18 21 17 20 19 Várt gyakoriságok: 20 20 20 20 20 20 χ 2 = 6 i=1 (k i 20) 2 = 20 (25 20) 2 +(18 20) 2 +(21 20) 2 +(17 20) 2 +(20 20) 2 +(19 20) 2 20 = 2 df = 6 1 = 5 χ 2 table = 11.07 2 < 11.07, így elfogadjuk a nullhipotézist, és a kockát szabályosnak tekintjük Krisztina Boda Khi-négyzet próbák 49
Illeszkedésvizsgálat Kockajáték közben felmerül a gyanú, hogy nem szabályos a kocka. Kísérletképpen 120 dobást végzünk. H 0 : a kocka szabályos, minden dobás egyformán valószínű, p i = 1 6. Várható gyakoriságok minden kimenetel esetén: n p i = 120 1 6 = 20 Példa 2. Krisztina Boda Khi-négyzet próbák 50
Lehetséges kimenetelek: Illeszkedésvizsgálat Példa 2. 1 2 3 4 5 6 Megfigyelt gyakoriságok: 5 18 21 17 20 36 Várt gyakoriságok: 20 20 20 20 20 20 χ 2 = 6 i=1 (k i 20) 2 = 20 (5 20) 2 +(18 20) 2 +(21 20) 2 +(17 20) 2 +(20 20) 2 +(36 20) 2 20 = 30 df = 6 1 = 5 χ 2 table = 11.07 30 > 11.07, így elvetjük a nullhipotézist, a kocka nem szabályos Krisztina Boda Khi-négyzet próbák 51
Illeszkedésvizsgálat Normalitásvizsgálat A következőkben az ún. becsléses illeszkedésvizsgálatra mutatunk be példát. Normalitás vizsgálat esetén általában nem ismerjük az eloszlás paramétereit, ezért azokat a mintából kell becsülni. Ezek segítségével fogjuk a p i -ket is megkapni. H 0 : a minta normális eloszlású populációból származik. 2012.11.07 Khi-négyzet próbák 52 Krisztina Boda 52
Frequency 30 Body height χ 2 = r j=1 (k i n p i ) 2 n p i 20 10 k i Std. Dev = 8.52 Mean = 170.4 np i 0 150.0 160.0 170.0 180.0 190.0 155.0 165.0 175.0 185.0 195.0 N = 87.00 Body height 2012.11.07 Khi-négyzet próbák 53 Krisztina Boda 53
Gauss-papír alkalmazás Van egy egyszerű grafikus módszer a normalitás vizsgálatra. A "Gauss-papír" speciális koordináta rendszer, amelyben az tengely beosztása a normális eloszlás inverzének megfelelően van feltüntetve százalékokban. A minta eloszlásfüggvényét ebbe a rendszerbe belerajzolva normalitás esetén közelítőleg egy egyenest kapunk http://www.hidrotanszek.hu/hallgato/adatfeldolgozas.pdf Krisztina 2012.11.07 Boda Khi-négyzet próbák 54
SPSS: Q-Q plot (quantile-quantile plot) Krisztina 2012.11.07 Boda Khi-négyzet próbák 55
Egymintás próba egy esemény valószínűségére Egy városi kórházban 2146 szülés között 515 szülést császármetszéssel végeztek (CS) 2001-ben. Hasonlítsuk ezt az arányt az országos 22%-hoz. Eltér-e a kórházban végzett császármetszések aránya az országostól? H 0 : p=22% H A : p 22% z p p(1 n p p) (515/ 2146) 0.22 0.22 0.78 2146 0.24 0.22 0.0089 1 2.234 2012.11.07 Khi-négyzet próbák 56 Krisztina Boda 56
Ismétlő kérdések és feladatok A függetlenségvizsgálat célja, nullhipotézise Gyakorisági táblázat Megfigyelt és várható gyakoriságok A khi-négyzet próba feltétele Szabadságfok számítása khi-négyzet próba végrehajtásakor A khi-négyzet próba végrehajtása, döntés táblázat alapján és p-érték alapján 2x2-es táblázatok kiértékelése khi-négyzet próbával 2012.11.07 Khi-négyzet próbák 57 Krisztina Boda 57
Feladatok Harminc egyetemista lány között 10, ugyanennyi fiú között csak fele ennyi aktív sportolót találtak. Mondhatjuk-e ennek alapján, hogy a lányok közt magasabb a sportolók aránya? (5%-os szinten. (alfa=0.05, 2tabla=3.84)). Mi itt a nullhipotézis? Az egyetemi előadások elnéptelenedésének egyik szomorú megfigyelője úgy látta, hogy a fiúk kevésbé járnak órákra, mint a lányok. 30 fiúból mindössze 10 járt rendszeresen előadásokra, míg 90 lány közül éppen a fele. Alátámasztják ezek az adatok a lányok szorgalmasabb óralátogatását? (alfa=0.05, 2tabla=3.84)) Mi itt a nullhipotézis? Két gyógyszert hasonlítottak össze mellékhatások szempontjából, 60 önkéntes pacienst véletlenszerűen soroltak be a két kezelés valamelyikébe. Független-e a mellékhatás attól, hogy melyik gyógyszerről van szó? Mellékhatás volt A 10 20 B 5 25 Mellékhatás nem volt Krisztina 2012.11.07 Boda Khi-négyzet próbák 58
Feladatok Fiúkat és lányokat kérdeztek arról, vajon szükséges-e a biostatisztika. Értelmezze az alábbi SPSS outputot! Nem Total Nem * A biostatisztika szükséges-e Crosstabulation Fiú Lány Count % within Nem Count % within Nem Count % within Nem A biostatisztika szükséges-e Igen Nem Total 72 7 79 91.1% 8.9% 100.0% 142 14 156 91.0% 9.0% 100.0% 214 21 235 91.1% 8.9% 100.0% 2012.11.07 Chi-Square Tests Asy mp. Sig. Value df (2-sided) Pearson Chi-Square.001 b 1.977 Continuity Correction a.000 1 1.000 Likelihood Ratio.001 1.977 Fisher's Exact Test Linear-by-Linear Association.001 1.977 N of Valid Cases 235 a. Computed only f or a 2x2 table Exact Sig. (2-sided) Exact Sig. (1-sided) 1.000.592 b. 0 cells (.0%) hav e expected count less than 5. The minimum expected count is 7.06. Khi-négyzet próbák 59 Krisztina Boda 59