Khi-négyzet próbák. Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet

Hasonló dokumentumok
Illeszkedésvizsgálat

BIOMATEMATIKA ELŐADÁS

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Dr. Szőke Szilvia Dr. Balogh Péter: Nemparaméteres eljárások

Elemi statisztika fizikusoknak

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A döntő feladatai. valós számok!

Elemi statisztika fizikusoknak

Statisztikai hipotézisvizsgálatok. Paraméteres statisztikai próbák

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Mágneses szuszceptibilitás vizsgálata

Sz ekelyhidi L aszl o Val osz ın us egsz am ıt as es matematikai statisztika *************** Budapest, 1998

Játékok (domináns stratégia, alkalmazása

Azonosító jel: Matematika emelt szint

A fiatalok pénzügyi kultúrája Számít-e a gazdasági oktatás?

Az aktiválódásoknak azonban itt még nincs vége, ugyanis az aktiválódások 30 évenként ismétlődnek!

Jelek tanulmányozása

Nem. Cumulative Percent 1,00 férfi ,9 25,9 25,9 2,00 nı ,1 73,1 99,0 99,00 adathiány 27 1,0 1,0 100,0 Total ,0 100,0

Kockázatkezelés és biztosítás

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉPSZINT Trigonometria

[GVMGS11MNC] Gazdaságstatisztika

MARKETINGKUTATÁS II. Oktatási segédanyag. Budapest, február

Conjoint-analízis példa (egyszerűsített)

2011. március 9. Dr. Vincze Szilvia

- mit, hogyan, miért?

Arany Dániel Matematikai Tanulóverseny 2011/2012-es tanév első (iskolai) forduló haladók I. kategória

1. forduló. MEGOLDÁSOK Pontszerző Matematikaverseny 2015/2016-os tanév

JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ. Gyógyszertári asszisztens szakképesítés

Reiz Beáta április

3. Egy szabályos dobókockát kétszer feldobva mennyi annak a valószínűsége, hogy a dobott számok különbségének abszolutértéke nagyobb mint 4?

Továbbra is terjed az influenza

MATLAB. 4. gyakorlat. Lineáris egyenletrendszerek, leképezések

A hasznos élettartamot befolyásoló egyes tényezők elemzése a Tedej Zrt. holstein-fríz állományánál

A Hozzárendelési feladat megoldása Magyar-módszerrel

B1: a tej pufferkapacitását B2: a tej fehérjéinek enzimatikus lebontását B3: a tej kalciumtartalmának meghatározását. B.Q1.A a víz ph-ja = [0,25 pont]

A táblázatkezelő felépítése

Csoportosított adatok megjelenítése sorhalmaz függvények használatával

Fa- és Acélszerkezetek I. 5. Előadás Stabilitás I. Dr. Szalai József Főiskolai adjunktus

FIT-jelentés :: Intézményi jelentés. Összefoglalás

statisztikai menürendszere Dr. Vargha András 2007

Statisztika március 11. A csoport Neptun kód

IKU WORLD KOCKA Játékszabály. IKU WORLD Gondolkodásfejlesztő Vállalkozás

Kombinatorika. 9. előadás. Farkas István. DE ATC Gazdaságelemzési és Statisztikai Tanszék. Kombinatorika p. 1/

FIT-jelentés :: Zoltánfy István Általános Iskola 6772 Deszk, Móra F. u. 2. OM azonosító: Telephely kódja: 005. Telephelyi jelentés

Statisztikai módszerek alkalmazása az orvostudományban. Szentesi Péter

Puskás Tivadar Távközlési Technikum

FIT-jelentés :: Intézményi jelentés. 8. évfolyam

Biostatisztika Bevezetés. Boda Krisztina előadása alapján ma Bari Ferenc SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

xdsl Optika Kábelnet Mért érték (2012. II. félév): SL24: 79,12% SL72: 98,78%

Egyszerű áramkörök vizsgálata

Feladatok diszkriminancia anaĺızisre

ÉVKÖZI MINTA AZ EGÉSZSÉGÜGYI BÉR- ÉS LÉTSZÁMSTATISZTIKÁBÓL. (2005. III. negyedév) Budapest, január

KOVÁCS BÉLA, MATEMATIKA I.

FIT-jelentés :: Bánki Donát Közlekedésgépészeti Szakközépiskola és Szakiskola 1138 Budapest, Váci út OM azonosító:

Illeszkedésvizsgálat χ 2 -próbával

ÉVKÖZI MINTA AZ EGÉSZSÉGÜGYI BÉR- ÉS LÉTSZÁMSTATISZTIKÁBÓL. (2004. I. negyedév) Budapest, július

Párhuzamos programozás

SZÁMÍTÓGÉPES NYELVI ADATBÁZISOK

MATEMATIKA HETI 3 ÓRA

Fazekas Mihály Fővárosi Gyakorló Általános Iskola és Gimnázium

JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ. Orvosi laboratóriumi technikai asszisztens szakképesítés Mikrobiológiai vizsgálatok modul. 1.

Kooperáció és intelligencia

1. Metrótörténet. A feladat folytatása a következő oldalon található. Informatika emelt szint. m2_blaha.jpg, m3_nagyvaradter.jpg és m4_furopajzs.jpg.

Jelentéskészítő TEK-IK () Válaszadók száma = 610

Dr. Schuster György február 21. Real-time operációs rendszerek RTOS

STATISZTIKA PRÓBAZH 2005

Érettségi feladatok Algoritmusok egydimenziós tömbökkel (vektorokkal) 1/6. Alapműveletek

Gépi forgácsoló Gépi forgácsoló

G Szabályfelismerés feladatcsomag

Kapcsolat vizsgálat II: kontingencia táblák jelentősége és használata az epidemiológiában, diagnosztikában: RR, OR. ROC analízis.

Mehet!...És működik! Non-szpot televíziós hirdetési megjelenések hatékonysági vizsgálata. Az r-time és a TNS Hoffmann által végzett kutatás

Emlékkonferencia Farkas Ferenc tiszteletére Tudomány napi konferencia, november 15. MAGYAR TUDOMÁNYOS AKADÉMIA

JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ. Ápoló szakképesítés Betegmegfigyelés/Monitorozás modul. 1. vizsgafeladat április 13.

Esettanulmányok és modellek 1 Termelésprogramozás az iparban

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK KÖZÉPSZINT Függvények

Vektorok összeadása, kivonása, szorzás számmal, koordináták, lineáris függetlenség

Kiskunmajsa Város Önkormányzatának partnertérképe

TRANZISZTOROS KAPCSOLÁSOK KÉZI SZÁMÍTÁSA

Feladatlap. I. forduló

Épületvillamosság laboratórium. Villámvédelemi felfogó-rendszer hatásosságának vizsgálata

BOLYAI MATEMATIKA CSAPATVERSENY FŐVÁROSI DÖNTŐ SZÓBELI (2005. NOVEMBER 26.) 5. osztály

Fordítóprogramok Készítette: Nagy Krisztián

FIT-jelentés :: 2014 Intézményi jelentés Összefoglalás Ady Endre-Bay Zoltán Középiskola és Kollégium

Matematikai háttér az EC8 Eurocode-hoz

WALTER-LIETH LIETH DIAGRAM

Programozás I gyakorlat

Házi dolgozat. Minta a házi dolgozat formai és tartalmi követelményeihez. Készítette: (név+osztály) Iskola: (az iskola teljes neve)

Sztochasztikus kapcsolatok

11. Matematikai statisztika

1., Egy területen véletlenszerűen kihelyezet kvadrátokban megszámlálták az Eringium maritimum (tengerparti ördögszekér) egyedeit.

Jelentés a kiértékelésről az előadóknak

1. Eset-kontroll vizsgálatok nem megfelelően kivitelezett kontroll szelektálása

A mérési eredmény hibája

Koordináta - geometria I.

A mérés célkitűzései: Kaloriméter segítségével az étolaj fajhőjének kísérleti meghatározása a Joule-féle hő segítségével.

EVALUAREA COMPETENȚELOR FUNDAMENTALE LA FINALUL CLASEI a II-a Model de test. MATEMATICĂ Şcoli cu predare în limbile minorităților naționale

Dr. Balogh Albert: A statisztikai adatfeldolgozás néhány érdekessége

Az abortusz a magyar közvéleményben

Osztályozó és Javító vizsga témakörei matematikából 9. osztály 2. félév

IV.5. GARÁZS 1. A feladatsor jellemzői

Átírás:

Khi-négyzet próbák Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet

Khi-négyzet próba Példa Az elleni oltóanyagok különböző típusainak hatását vizsgálták abból a szempontból, hogy a beoltottak milyen arányban betegedtek meg. Az eredmények az alábbi táblázatban láthatók. Kérdés: Mondhatjuk-e, hogy az egyes típusú oltóanyagok ugyanúgy hatnak, azaz, lényegében azonos-e a megbetegedettek aránya, vagy nem? 2012.11.07 Krisztina Boda Khí-négyzet próbák 2

Khi-négyzet próba Influenzában megbetegedett Példa Mondhatjuk-e, hogy az egyes típusú oltóanyagok ugyanúgy hatnak, azaz, lényegében azonos-e a megbetegedettek aránya, vagy nem? Nem betegedett meg influenzával Csak szezonális 43 237 280 Csak H1N1 52 198 250 Kombinált 25 245 270 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 3

Khi-négyzet próba függetlenségvizsgálatra A khi négyzet próbát két diszkrét változó közötti kapcsolat vizsgálatára használjuk. Azaz van-e kapcsolat a két változó (X és Y) között, vagy függetlenek egymástól. Legyenek az X és Y értékei x 1, x 2, x r, és y 1, y 2, y c az A 1, A 2, A r illetve B 1, B 2, B c kimenetelek esetén A megfigyelések száma: n 2012.11.07 Krisztina Boda Khí-négyzet próbák 4

Kontingencia táblázat Jelölje O ij A i és B j események együttes bekövetkezéseinek számát (megfigyelt gyakoriságok) B 1 B 2 B c Sor összeg A 1 O 11 O 12 O 1s O 1+ A 2 O 21 O 22 O 2s O 2+ A r O r1 O r2 O rs O r+ Oszlop összeg O +1 O 2+ O s+ n O i+ = s O ij j=1 i = 1, 2,, r A i esemény gyakorisága Krisztina Boda 2012.11.07 O +j = r O ij i=1 j = 1, 2,, s B j esemény gyakorisága

Várt gyakoriságok Feltéve, hogy a két változó független, a kontingencia táblázat oszlop illetve sorösszegeinek segítségével kiszámolhatók a várt gyakoriságok, minden cellához. sorösszeg oszlopösszeg várt gyakoriság = mintaelemszám B 1 B 2 B c Sor összeg A 1 O 1+ A 2 O 2+ E ij = O i+o +j n A r O r+ Oszlop összeg O +1 O 2+ O s+ n Krisztina Boda 2012.11.07

Várt gyakoriságok Feltéve, hogy a két változó független, a kontingencia táblázat oszlop illetve sorösszegeinek segítségével kiszámolhatók a várt gyakoriságok, minden cellához. sorösszeg oszlopösszeg várt gyakoriság = mintaelemszám E 11 = O 1+O +1 n B 1 B 2 B c Sor összeg A 1 E 11 O 1+ A 2 O 2+ A r O r+ Oszlop összeg O +1 O 2+ O s+ n Krisztina Boda 2012.11.07

Várt gyakoriságok Feltéve, hogy a két változó független, a kontingencia táblázat oszlop illetve sorösszegeinek segítségével kiszámolhatók a várt gyakoriságok, minden cellához. sorösszeg oszlopösszeg várt gyakoriság = mintaelemszám B 1 B 2 B c E 21 = O 2+O +1 n Sor összeg A 1 E 11 O 1+ A 2 E 21 O 2+ A r O r+ Oszlop összeg O +1 O 2+ O s+ n Krisztina 2012.11.07 Boda

Várt gyakoriságok Feltéve, hogy a két változó független, a kontingencia táblázat oszlop illetve sorösszegeinek segítségével kiszámolhatók a várt gyakoriságok, minden cellához. sorösszeg oszlopösszeg várt gyakoriság = mintaelemszám B 1 B 2 B c Sor összeg A 1 E 11 E 12 E 1s O 1+ A 2 E 21 E 22 E 2s O 2+ A r E r1 E r2 E rs O r+ Oszlop összeg O +1 O 2+ O s+ n Krisztina 2012.11.07 Boda

Khi-négyzet próba függetlenségvizsgálatra A khi négyzet próbát két diszkrét változó közötti kapcsolat vizsgálatára használjuk. Azaz van-e kapcsolat a két változó (X és Y) között, vagy függetlenek egymástól. A khi-négyzet próba alkalmazhatóságának feltételei az 5-nél kisebb várt gyakoriságot tartalmazó cellák száma legfeljebb az összes cella 20% -a. (Ehelyett gyakran használjuk, hogy minden cella várt gyakorisága legalább 5. Ez erősebb, de könnyebben ellenőrizhető feltétel.) Krisztina Boda 10

H 0 : a két változó független (P A i B j = P A i P(B j )) H 1 : a két változó között van kapcsolat Próbastatisztika: Khi-négyzet próba függetlenségvizsgálatra χ 2 = r i=1 c j=1 (O ij E ij ) 2 E ij Ha az előbbi feltételek teljesülnek, akkor a minta eloszlása r 1 c 1 szabadságfokú χ 2 eloszlással közelíthető (r és c a sorok és oszlopok száma a kontingencia táblázatban) Krisztina Boda 11

Khi-négyzet próba függetlenségvizsgálatra Döntés ha χ 2 < χ 2 table elfogadjuk a nullhipotézist, a két változó független ha χ 2 > χ 2 table, elvetjük a nullhipotézist, a két változó között van kapcsolat Krisztina Boda 2012.11.07 Khi-négyzet próbák 12

Khi-négyzet eloszlás n független standard normális eloszlású véletlen változó négyzeteinek összege khi-négyzet eloszlású n szabadságfokkal 0.30 0.25 0.20 0.15 0.10 0.05 df 2 df 3 df 5 df 10 0.00 0 5 10 15 20 25 2012.11.07 Krisztina Boda Khí-négyzet próbák 13

Khi-négyzet tábla α = 0.05 szabadságfok:10 kritikus érték: χ 2 table = 18.31 Krisztina Boda 2012.11.07 Khi-négyzet próbák 14

Khi-négyzet próba Példa Mondhatjuk-e, hogy az egyes típusú oltóanyagok ugyanúgy hatnak, azaz, lényegében azonos-e a megbetegedettek aránya, vagy nem? védőoltás típusa megbetegedés megjelenése Influenzában megbetegedett Influenzában nem betegedett meg Csak szezonális 43 237 280 Csak H1N1 52 198 250 Kombinált 25 245 270 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 15

Hipotézisek: H 0 : a vakcina típusa és a megbetegedése megjelenése független H 1 : a vakcina típusa és a megbetegedése megjelenése nem független Elsőfajú hiba α = 0.05 Khi-négyzet próba Példa Szabadsági fok df = r 1 c 1 = 3 1 2 1 = 2 1 = 2 Krisztina Boda 2012.11.07 Khi-négyzet próbák 16

Számoljuk ki a várt gyakoriságokat vártgyakoriság = Khi-négyzet próba Number getting Példa sorösszeg oszlopösszeg mintaelemszám Number not getting 280 120 Seasonal only 42 280 800 H1N1 only 250 Combined 270 120 680 800 Krisztina Boda 2012.11.07 Khi-négyzet próbák 17

Számoljuk ki a várt gyakoriságokat vártgyakoriság = Khi-négyzet próba Number getting Példa sorösszeg oszlopösszeg mintaelemszám Number not getting 280 680 800 Seasonal only 42 238 280 H1N1 only 250 Combined 270 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 18

Számoljuk ki a várt gyakoriságokat vártgyakoriság = Khi-négyzet próba Number getting Példa sorösszeg oszlopösszeg mintaelemszám Number not getting Seasonal only 42 238 280 250 120 H1N1 only 37.5 250 800 Combined 245 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 19

Számoljuk ki a várt gyakoriságokat vártgyakoriság = Khi-négyzet próba Number getting Példa sorösszeg oszlopösszeg mintaelemszám Number not getting 250 680 800 Seasonal only 42 238 280 H1N1 only 37.5 212.5 250 Combined 270 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 20

Számoljuk ki a várt gyakoriságokat vártgyakoriság = Khi-négyzet próba Number getting Példa sorösszeg oszlopösszeg mintaelemszám Number not getting Seasonal only 42 238 280 270 120 H1N1 only 37.5 212.5 250 800 Combined 40.5 270 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 21

Számoljuk ki a várt gyakoriságokat vártgyakoriság = Khi-négyzet próba Number getting Példa sorösszeg oszlopösszeg mintaelemszám Number not getting 270 680 Seasonal only 42 238 280 800 H1N1 only 37.5 212.5 250 Combined 40.5 229.5 270 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 22

Khi-négyzet próba Példa Számoljuk ki a várt gyakoriságokat vártgyakoriság = sorösszeg oszlopösszeg mintaelemszám Number getting Number not getting Seasonal only 42 238 280 H1N1 only 37.5 212.5 198 Combined 40.5 229.5 245 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 23

Khi-négyzet próba Minden cella esetén számoljuk ki (O ij E ij ) 2 megfigyelt gyakoriságok Number getting Number not getting Seasonal only 43 237 280 H1N1 only 52 198 198 Combined 25 245 245 120 680 800 várt gyakoriságok Példa E ij (43 42) 2 42 Number getting 0.0238 Number not getting Seasonal only 0.0238 0.0042 H1N1 only 5.6067 0.9894 Combined 5.9321 1.0468 Number getting Number not getting Seasonal only 42 238 280 H1N1 only 37.5 212.5 198 Combined 40.5 229.5 245 120 680 800 Krisztina Boda 2012.11.07 Khi-négyzet próbák 24

Khi-négyzet próba Minden cella esetén számoljuk ki (O ij E ij ) 2 megfigyelt gyakoriságok Number getting Number not getting Seasonal only 43 237 280 H1N1 only 52 198 198 Combined 25 245 245 120 680 800 várt gyakoriságok Példa E ij Number getting (237 238) 2 238 Number not getting 0.0042 Seasonal only 0.0238 0.0042 H1N1 only 5.6067 0.9894 Combined 5.9321 1.0468 Number getting Number not getting Seasonal only 42 238 280 H1N1 only 37.5 212.5 198 Combined 40.5 229.5 245 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 25

Minden cella esetén számoljuk ki (O ij E ij ) 2 megfigyelt gyakoriságok Khi-négyzet próba Példa E ij Number getting Number not getting Seasonal only 43 237 280 H1N1 only 52 198 198 Combined 25 245 245 120 680 800 várt gyakoriságok Number getting Number not getting Seasonal only 0.0238 0.0042 H1N1 only 5.6067 0.9894 Combined 5.9321 1.0468 (198 212. 5) 2 212. 5 0.9894 Number getting Number not getting Seasonal only 42 238 280 H1N1 only 37.5 212.5 198 Combined 40.5 229.5 245 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 26

Minden cella esetén számoljuk ki (O ij E ij ) 2 megfigyelt gyakoriságok Khi-négyzet próba Példa E ij Number getting Number not getting Seasonal only 43 237 280 H1N1 only 52 198 198 Combined 25 245 245 120 680 800 várt gyakoriságok Number getting Number not getting Seasonal only 42 238 280 H1N1 only 37.5 212.5 198 Combined 40.5 229.5 245 120 680 800 Number getting Number not getting Seasonal only 0.0238 0.0042 H1N1 only 5.6067 0.9894 Combined 5.9321 1.0468 (25 40. 5) 2 40. 5 5.9321 Krisztina 2012.11.07 Boda Khi-négyzet próbák 27

Minden cella esetén számoljuk ki (O ij E ij ) 2 megfigyelt gyakoriságok Khi-négyzet próba Példa E ij Number getting Number not getting Seasonal only 43 237 280 H1N1 only 52 198 198 Combined 25 245 245 120 680 800 várt gyakoriságok Number getting Number not getting Number getting Number not getting Seasonal only 0.0238 0.0042 H1N1 only 5.6067 0.9894 Combined 5.9321 1.0468 (245 229. 5) 2 229. 5 1.0468 Seasonal only 42 238 280 H1N1 only 37.5 212.5 198 Combined 40.5 229.5 245 120 680 800 Krisztina 2012.11.07 Boda Khi-négyzet próbák 28

Khi-négyzet próba Példa Számoljuk ki a próbastatisztikát Number getting Number not getting Seasonal only 0.0238 0.0042 H1N1 only 5.6067 0.9894 Combined 5.9321 1.0468 Adjuk össze a kiszámolt értékeket! r c χ 2 (O ij E ij ) 2 = = 0.0238 + 0.0042 + 5.6067 + 0.9894 + 5.9321 i=1 j=1 E ij + 1.0468 = 13. 6030 Krisztina 2012.11.07 Boda Khi-négyzet próbák 29

Adjuk meg a kritikus értéket (táblázatból) (α = 0.05, df = 2) χ 2 table = 5.99 Döntés: Elvetjük H 0, 13.6030 > 5.99 azaz χ 2 > χ 2 table a két változó nem független Khi-négyzet próba Példa a megbetegedések száma nem azonos a három csoportban Krisztina 2012.11.07 Boda Khi-négyzet próbák 30

Khi-négyzet próba Példa SPSS eredmények χ 2 = 13.603 p = 0.001 A feltételek teljesülnek 2012.11.07 Krisztina Boda Khi-négyzet próbák 31

Khi-négyzet próba Példa SPSS eredmények p = 0.001 < α = 0.05 elvetjük a nullhipotézist 2012.11.07 Krisztina Boda Khi-négyzet próbák 32

Speciális eset: 2 x 2-es táblázat Rizikófaktor YES NO 1.csoport a b a+b 2.csoport c d c+d a+c b+d n Próbastatisztika: χ 2 = n(a d b c) 2 a + b c + d a + c (b + d) 2012.11.07 Krisztina Boda Khi-négyzet próbák 33

Kezelés Khi-négyzet próba Példa Két különböző kezelés eredményét hasonlítjuk össze az alábbi táblázat szerint: Kimenetel Meghalt Él A 5 45 50 B 8 42 50 13 87 100 Krisztina Boda 2012.11.07 Khi-négyzet próbák 34

Khi-négyzet próba Példa H 0 : a kezelés kimenetele független a kezelés típusától a populációban (azaz azonos arányban halnak meg a két csoportban) H 1 : a kezelés kimenetele függ a kezelés típusától = 0.05 df = 1 χ 2 = n(a d b c) 2 = 100(5 42 8 45)2 a+b c+d a+c (b+d) 50 50 13 87 χ 2 table = 3.841 = 0.79 0.79 < 3.841 azaz χ 2 < χ 2 table Elfogadjuk a nullhipotézist, a két változó független 2012.11.07 Krisztina Boda Khi-négyzet próbák 35

SPSS output SPSS által számolt p érték 0.372, ez nagyobb, mint = 0.05, ennek alapján szintén elvetjük a nullhipotézist. Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Chi-Square Tests Asy mp. Sig. Value df (2-sided),796 b 1,372,354 1,552,802 1,370,788 1,375 100 a. Computed only for a 2x2 table Exact Sig. (2-sided) Exact Sig. (1-sided),554,277 b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 6,50. 2012.11.07 Khi-négyzet próbák 36 Krisztina Boda 36

Yates korrekció 2 x 2 es táblázat esetén a próbastatisztika értéke pontosabban számolható, ha az alábbi korrekciót alkalmazzuk. Yates korrekció csak akkor alkalmazható, ha a szabadságfok 1. Próbastatisztik a Yates korrekcióval: χ 2 = n( a d b c 1 2 n)2 a + b c + d a + c (b + d) 2012.11.07 Krisztina Boda Khi-négyzet próbák 37

Fisher féle egzakt teszt Fisher féle egzakt teszt a próbastatisztika kiszámítása helyett közvetlenül a p értéket számol. Habár a gyakorlatban akkor használjuk, ha a kis elemszámú minták van, de nagy elemszám esetén is pontos értéket ad. 2012.11.07 Krisztina Boda Khi-négyzet próbák 38

Fisher féle egzakt teszt Példa Adott a következő gyakorisági táblázat STDs HIV fertőzés yes no total yes 3 7 10 no 5 10 15 total 8 17 25 Van-e kapcsolat HIV fertőződés és STD között? (5%-os szinten). 2012.11.07 Krisztina Boda Khi-négyzet próbák 39

Fisher féle egzakt teszt Példa A megfigyelt táblázat valószínűsége adott marginálisok (sor ill. oszlopösszeg) esetén. p = a + c! b + d! a + b! c + d! n! a! b! c! d! 2012.11.07 Krisztina Boda Khi-négyzet próbák 40

megfigyelt gyakoriságok STDs HIV Infection yes no total yes 3 7 10 no 5 10 15 total 8 17 25 lehetséges átrendezések STDs Fisher féle egzakt teszt HIV Infection yes no total yes 2 8 10 no 6 9 15 total 8 17 25 Példa p obs = p = 10! 15! 8! 17! 3! 7! 5! 10! 25! = 0.3332 10! 15! 8! 17! 2! 8! 6! 9! 25! = 0.2082 STDs STDs HIV Infection yes no total yes 1 9 10 no 7 8 15 total 8 17 25 HIV Infection yes no total yes 0 10 10 no 8 7 15 total 8 17 25 p = p = 10! 15! 8! 17! 1! 9! 7! 8! 25! = 0.0595 10! 15! 8! 17! 0! 10! 8! 7! 25! = 0.6068 2012.11.07 Krisztina Boda Khi-négyzet próbák 41

megfigyelt gyakoriságok STDs HIV Infection yes no total yes 3 7 10 no 5 10 15 total 8 17 25 lehetséges átrendezések STDs STDs STDs Fisher féle egzakt teszt HIV Infection yes no total yes 2 8 10 no 6 9 15 total 8 17 25 HIV Infection yes no total yes 1 9 10 no 7 8 15 total 8 17 25 HIV Infection yes no total yes 0 10 10 no 8 7 15 total 8 17 25 Példa p obs = 0.3332 p = 0.2082 p = 0.0595 p = 0.0059 A Fisher féle p érték kiszámolásához az összes lehetséges átrendezés közül csak azokat kell figyelembe venni, amelyek legalább annyira eltérők, mint a megfigyelt táblázat (most mind) Fisher féle p érték = 0.3332 + 0.2082 + 0.0595 + 0.0059 = 0. 6068 Krisztina Boda 2012.11.07 Khi-négyzet próbák 42

Khi-négyzet próba illeszkedésvizsgálatra

Illeszkedésvizsgálat khi-négyzet próbával Az illeszkedésvizsgálat célja annak meghatározása, hogy a mintaelemek adott eloszlású populációból származnak-e. H 0 : X változó eloszlása az adott eloszlás H 1 : X változó eloszlása nem az adott eloszlás 2012.11.07 Khi-négyzet próbák 44 Krisztina Boda 44

Diszkrét változó. A változók eloszlása Folytonos változó Kockajáték közben felmerül a gyanú, hogy szabályos-e a kocka. Kísérletképpen 120-szor feldobjuk a kockát. Megfigyelt gyakoriságok Szeretnénk ellenőrizni, hogy egy folytonos változó (életkorok eloszlása) normális eloszlásból származik-e. Az életkorok eloszlása 30 25 20 25 18 21 17 20 19 15 10 5 0 1 2 3 4 5 6 Krisztina 2012.11.07 Boda Khi-négyzet próbák 45

Illeszkedésvizsgálat khi-négyzet próbával Tegyük fel, hogy adott n elemű minta. Készítsünk oszlopdiagramot vagy hisztogramot a változó típusának megfelelően. Mindkét esetében gyakoriságok sorozatát kapjuk: ezek a megfigyelt gyakoriságok. Jelölje O i, i = 1, 2,, r az i -edik kategóriába esés gyakoriságát (r a kategóriák száma). Jelölje p i, az i -edik kategóriába esés valószínűségét a populációban. (az adott eloszlás esetén). Ha ezek a valószínűségek ismertek, tiszta illeszkedésvizsgálatról beszélünk. Ha nem ismertek, akkor a mintából kell őket becsülni, ezért ekkor becsléses illeszkedésvizsgálatról beszélünk. Krisztina Boda Khi-négyzet próbák 46

Illeszkedésvizsgálat khi-négyzet próbával Ha H 0 igaz és n nagy, akkor a relatív gyakoriságok a p i k közelítései: p i = k i n k i = n p i megfigyelt gyakoriság várt gyakoriság Az alábbi próbastatisztika χ 2 eloszlású (r 1 s) szabadság fokkal (ahol s az eloszlás paramétereinek a száma χ 2 = r j=1 (O i E i ) 2 E i = r j=1 (k i n p i ) 2 n p i Krisztina 2012.11.07 Boda Khi-négyzet próbák 47

Illeszkedésvizsgálat Kockajáték közben felmerül a gyanú, hogy nem szabályos a kocka. Kísérletképpen 120 dobást végzünk. H 0 : a kocka szabályos, minden dobás egyformán valószínű, p i = 1 6. Várható gyakoriságok minden kimenetel esetén: n p i = 120 1 6 = 20 Példa 1. Krisztina Boda Khi-négyzet próbák 48

Lehetséges kimenetelek: Illeszkedésvizsgálat Példa 1. 1 2 3 4 5 6 Megfigyelt gyakoriságok: 25 18 21 17 20 19 Várt gyakoriságok: 20 20 20 20 20 20 χ 2 = 6 i=1 (k i 20) 2 = 20 (25 20) 2 +(18 20) 2 +(21 20) 2 +(17 20) 2 +(20 20) 2 +(19 20) 2 20 = 2 df = 6 1 = 5 χ 2 table = 11.07 2 < 11.07, így elfogadjuk a nullhipotézist, és a kockát szabályosnak tekintjük Krisztina Boda Khi-négyzet próbák 49

Illeszkedésvizsgálat Kockajáték közben felmerül a gyanú, hogy nem szabályos a kocka. Kísérletképpen 120 dobást végzünk. H 0 : a kocka szabályos, minden dobás egyformán valószínű, p i = 1 6. Várható gyakoriságok minden kimenetel esetén: n p i = 120 1 6 = 20 Példa 2. Krisztina Boda Khi-négyzet próbák 50

Lehetséges kimenetelek: Illeszkedésvizsgálat Példa 2. 1 2 3 4 5 6 Megfigyelt gyakoriságok: 5 18 21 17 20 36 Várt gyakoriságok: 20 20 20 20 20 20 χ 2 = 6 i=1 (k i 20) 2 = 20 (5 20) 2 +(18 20) 2 +(21 20) 2 +(17 20) 2 +(20 20) 2 +(36 20) 2 20 = 30 df = 6 1 = 5 χ 2 table = 11.07 30 > 11.07, így elvetjük a nullhipotézist, a kocka nem szabályos Krisztina Boda Khi-négyzet próbák 51

Illeszkedésvizsgálat Normalitásvizsgálat A következőkben az ún. becsléses illeszkedésvizsgálatra mutatunk be példát. Normalitás vizsgálat esetén általában nem ismerjük az eloszlás paramétereit, ezért azokat a mintából kell becsülni. Ezek segítségével fogjuk a p i -ket is megkapni. H 0 : a minta normális eloszlású populációból származik. 2012.11.07 Khi-négyzet próbák 52 Krisztina Boda 52

Frequency 30 Body height χ 2 = r j=1 (k i n p i ) 2 n p i 20 10 k i Std. Dev = 8.52 Mean = 170.4 np i 0 150.0 160.0 170.0 180.0 190.0 155.0 165.0 175.0 185.0 195.0 N = 87.00 Body height 2012.11.07 Khi-négyzet próbák 53 Krisztina Boda 53

Gauss-papír alkalmazás Van egy egyszerű grafikus módszer a normalitás vizsgálatra. A "Gauss-papír" speciális koordináta rendszer, amelyben az tengely beosztása a normális eloszlás inverzének megfelelően van feltüntetve százalékokban. A minta eloszlásfüggvényét ebbe a rendszerbe belerajzolva normalitás esetén közelítőleg egy egyenest kapunk http://www.hidrotanszek.hu/hallgato/adatfeldolgozas.pdf Krisztina 2012.11.07 Boda Khi-négyzet próbák 54

SPSS: Q-Q plot (quantile-quantile plot) Krisztina 2012.11.07 Boda Khi-négyzet próbák 55

Egymintás próba egy esemény valószínűségére Egy városi kórházban 2146 szülés között 515 szülést császármetszéssel végeztek (CS) 2001-ben. Hasonlítsuk ezt az arányt az országos 22%-hoz. Eltér-e a kórházban végzett császármetszések aránya az országostól? H 0 : p=22% H A : p 22% z p p(1 n p p) (515/ 2146) 0.22 0.22 0.78 2146 0.24 0.22 0.0089 1 2.234 2012.11.07 Khi-négyzet próbák 56 Krisztina Boda 56

Ismétlő kérdések és feladatok A függetlenségvizsgálat célja, nullhipotézise Gyakorisági táblázat Megfigyelt és várható gyakoriságok A khi-négyzet próba feltétele Szabadságfok számítása khi-négyzet próba végrehajtásakor A khi-négyzet próba végrehajtása, döntés táblázat alapján és p-érték alapján 2x2-es táblázatok kiértékelése khi-négyzet próbával 2012.11.07 Khi-négyzet próbák 57 Krisztina Boda 57

Feladatok Harminc egyetemista lány között 10, ugyanennyi fiú között csak fele ennyi aktív sportolót találtak. Mondhatjuk-e ennek alapján, hogy a lányok közt magasabb a sportolók aránya? (5%-os szinten. (alfa=0.05, 2tabla=3.84)). Mi itt a nullhipotézis? Az egyetemi előadások elnéptelenedésének egyik szomorú megfigyelője úgy látta, hogy a fiúk kevésbé járnak órákra, mint a lányok. 30 fiúból mindössze 10 járt rendszeresen előadásokra, míg 90 lány közül éppen a fele. Alátámasztják ezek az adatok a lányok szorgalmasabb óralátogatását? (alfa=0.05, 2tabla=3.84)) Mi itt a nullhipotézis? Két gyógyszert hasonlítottak össze mellékhatások szempontjából, 60 önkéntes pacienst véletlenszerűen soroltak be a két kezelés valamelyikébe. Független-e a mellékhatás attól, hogy melyik gyógyszerről van szó? Mellékhatás volt A 10 20 B 5 25 Mellékhatás nem volt Krisztina 2012.11.07 Boda Khi-négyzet próbák 58

Feladatok Fiúkat és lányokat kérdeztek arról, vajon szükséges-e a biostatisztika. Értelmezze az alábbi SPSS outputot! Nem Total Nem * A biostatisztika szükséges-e Crosstabulation Fiú Lány Count % within Nem Count % within Nem Count % within Nem A biostatisztika szükséges-e Igen Nem Total 72 7 79 91.1% 8.9% 100.0% 142 14 156 91.0% 9.0% 100.0% 214 21 235 91.1% 8.9% 100.0% 2012.11.07 Chi-Square Tests Asy mp. Sig. Value df (2-sided) Pearson Chi-Square.001 b 1.977 Continuity Correction a.000 1 1.000 Likelihood Ratio.001 1.977 Fisher's Exact Test Linear-by-Linear Association.001 1.977 N of Valid Cases 235 a. Computed only f or a 2x2 table Exact Sig. (2-sided) Exact Sig. (1-sided) 1.000.592 b. 0 cells (.0%) hav e expected count less than 5. The minimum expected count is 7.06. Khi-négyzet próbák 59 Krisztina Boda 59