Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Hasonló dokumentumok
Korreláció és lineáris regresszió

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Az első számjegyek Benford törvénye

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Normális eloszlás paramétereire vonatkozó próbák

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

V. Gyakorisági táblázatok elemzése

Bevezetés a hipotézisvizsgálatokba

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Biostatisztika Összefoglalás

Hipotézis vizsgálatok

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

Biomatematika 13. Varianciaanaĺızis (ANOVA)

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Nemparaméteres próbák

Hipotézis vizsgálatok

Adatok statisztikai értékelésének főbb lehetőségei

Biostatisztika Összefoglalás

Statisztikai módszerek 7. gyakorlat

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Függetlenségvizsgálat, Illeszkedésvizsgálat

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

A khi-négyzet próba és alkalmazásai: illeszkedésés függetlenségvizsgálat. khi-(χ 2 )-négyzet próba

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

1., Egy területen véletlenszerűen kihelyezet kvadrátokban megszámlálták az Eringium maritimum (tengerparti ördögszekér) egyedeit.

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biostatisztika VIII. Mátyus László. 19 October

Regresszió és ANOVA. Freedman: fejezet. Freedman: fejezet. Freedman: fejezet

[Biomatematika 2] Orvosi biometria

A konfidencia intervallum képlete: x± t( α /2, df )

11.Négymezős táblázatok. Egyezés mérése: kappa statisztika Kockázat becslés: esélyhányados (OR) Kockázat becslés: relatív kockázat (RR)

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Többváltozós lineáris regressziós modell feltételeinek

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Eloszlás-független módszerek 13. elıadás ( lecke)

kritikus érték(ek) (critical value).

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Sztochasztikus kapcsolatok

Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika c. művei alapján

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

egyetemi jegyzet Meskó Balázs

Nemparametrikus tesztek december 3.

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Statisztikai módszerek 7. gyakorlat

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

Kettőnél több csoport vizsgálata. Makara B. Gábor

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Normális eloszlás tesztje

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Varianciaanalízis 4/24/12

13. Túlélési analízis. SURVIVAL ANALYSIS Nyári Tibor Ph.D., Boda Krisztina Ph.D.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

Kutatásmódszertan és prezentációkészítés

Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT

Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Statisztika elméleti összefoglaló

LOGIT-REGRESSZIÓ a függő változó: névleges vagy sorrendi skála

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Kapcsolat vizsgálat II: kontingencia táblák jelentősége és használata az epidemiológiában, diagnosztikában: RR, OR.

Kapcsolat vizsgálat : kontingencia táblák jelentősége és használata az epidemiológiában, diagnosztikában: RR, OR.

A valószínűségszámítás elemei

Statisztikai alapfogalmak a klinikai kutatásban. Molnár Zsolt PTE, AITI

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

Dr. Szőke Szilvia Dr. Balogh Péter: Nemparaméteres eljárások

Hipotézisvizsgálat R-ben

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

[Biomatematika 2] Orvosi biometria

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

y ij = µ + α i + e ij

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Kapcsolat vizsgálat II: kontingencia táblák jelentősége és használata az epidemiológiában, diagnosztikában: RR, OR. ROC analízis.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Feltesszük, hogy a mintaelemek között nincs két azonos. ha X n a rendezett mintában az R n -ik. ha n 1 n 2

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

A telefonnal való ellátottság kapcsolata a rádió és televízió műsorszórás használatával a 14 éves és idősebb lakosság körében

Átírás:

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi fizika és statisztika I. előadás 2016.11.09 Orvosi fizika és statisztika I. előadás 2016.11.09 1

Főbb pontok Két diszkrét változó függetlenségének vizsgálata Khi-négyzet próba függetlenségvizsgálatra Khi-négyzet próba függetlenségvizsgálatra Yates korrekcióval Fisher-féle egzakt teszt függetlenségvizsgálatra Khi-négyzet próba illeszkedésvizsgálatra Orvosi fizika és statisztika I. előadás 2016.11.09 2

Bevezetés Klinikai kutatások során gyakran felmerülő kérdés, hogy két diszkrét változó között van-e kapcsolat. Példák: Az influenzás megbetegedések aránya függ-e az oltóanyag típusától? A betegség kimenetele függ-e a kezelés típusától? Van-e kapcsolat a HIV fertőződések és a STD (szexuálisan terjedő betegségek) között? Orvosi fizika és statisztika I. előadás 2016.11.09 3

Kontingencia táblázat Egy olyan táblázat, mely a megfigyelt gyakoriságokat tartalmazza, a két változó alapján csoportosítva. Az egyik változó kimenetelei kerülnek a sorokba, a másik váltózóé pedig az oszlopokba. B 1 B 2... B c Sorösszeg A 1 O 11 O 12... O 1c O 1+ A 2 O 21 O 22... O 2c O 2+............ A r O r1 O r2... O rc O r+ Oszlopösszeg O +1 O +2... O +c n Legyenek a két diszkrét változó (X, Y ) értékei: x 1, x 2,... x r és y 1, y 2,... y c az A 1, A 2,... A r illetve B 1, B 2,... B c kimenetelek esetén. n a megfigyelések száma O i+ = O +j = c j=1 r i=1 O ij az A i, i = 1, 2,..., r esemény gyakorisága (sorösszegek) O ij az B j, j = 1, 2,..., c események gyakorisága (oszlopösszegek) Orvosi fizika és statisztika I. előadás 2016.11.09 4

Várt gyakoriságok A relatív gyakorisági eloszlását a sorösszegeknek marginális eloszlásnak hívjuk. Tegyük fel, hogy a két változó független, ekkor az eloszlások minden oszlop esetén azonosak. Minden oszlopra a marginális eloszlást feltételezve, kapjuk a várt gyakoriságokat: E ij = O i+ O +j n várt gyakoriság = sorösszeg oszlopösszeg elemszám Orvosi fizika és statisztika I. előadás 2016.11.09 5

Várt gyakoriságok várt gyakoriság = sorösszeg oszlopösszeg elemszám B 1 B 2... B c Sorösszeg A 1 E 11 E 12... E 1c O 1+ A 2 E 21 E 22... E 2c O 2+............ A r E r1 E r2... E rc O r+ Oszlopösszeg O +1 O +2... O +c n Orvosi fizika és statisztika I. előadás 2016.11.09 6

Főbb pontok Két diszkrét változó függetlenségének vizsgálata Khi-négyzet próba függetlenségvizsgálatra Khi-négyzet próba függetlenségvizsgálatra Yates korrekcióval Fisher-féle egzakt teszt függetlenségvizsgálatra Khi-négyzet próba illeszkedésvizsgálatra Orvosi fizika és statisztika I. előadás 2016.11.09 7

Khi-négyzet próba függetlenségvizsgálatra Célja: Annak a vizsgálata, hogy populációban van-e két diszkrét változó közötti kapcsolat. Feltétele: A várt gyakoriságok legfeljebb 20%-a kisebb 5-nél. (Kis táblázat esetén ez azt jelenti, hogy a várt gyakoriságok mindegyike legalább 5.) Orvosi fizika és statisztika I. előadás 2016.11.09 8

Khi-négyzet próba függetlenségvizsgálatra Hipotézisek: H0 : a két változó független. P(A i B j ) = P(A i ) P(B j ) H1 : a két változó között van összefüggés. Próbastatisztika: χ 2 = r i=1 j=1 c (O ij E ij ) 2 Ha két változó független, a próbastatisztika χ 2 eloszlást követ (r 1)(c 1) szabadsági fokkal E ij Orvosi fizika és statisztika I. előadás 2016.11.09 9

Khi-négyzet eloszlás Ha X 1, X 2... X m független, standard normális eloszlású véletlen változók, akkor X1 2 + X 2 2 +... X m 2 = m khi-négyzet (χ 2 ) eloszlást követ m szabadsági fokkal. i=1 X 2 i 0.0 0.1 0.2 0.3 df=2 df=3 df=5 df=10 0 20 Orvosi fizika és statisztika I. előadás 2016.11.09 10

Khi-négyzet eloszlás 0.0 0.1 1 α α 0 5 10 15 elfogadási tartomány kritikus érték elvetési tartomány Orvosi fizika és statisztika I. előadás 2016.11.09 11

Khi-négyzet próba függetlenségvizsgálatra Döntés próbastatisztika alapján: Ha χ 2 < χ 2 table, a null-hipotézist elfogadjuk Ha χ 2 > χ 2 table, a null-hipotézist elvetjük. Döntés p-érték alapján Ha p > α, a null-hipotézist elfogadjuk Ha p < α, a null-hipotézist elvetjük. 0.0 0.1 0.2 p value χ 2 A nullhipotézist elfogadjuk 2 χ table α 0.0 0.1 0.2 A nullhipotézist elvetjük α 2 χ table χ 2 p value 0 5 10 15 0 5 10 15 Orvosi fizika és statisztika I. előadás 2016.11.09 12

Khi-négyzet próba függetlenségvizsgálatra -Példa 1 Van e kapcsolat az influenzás megbetegedések száma és a vakcina típusa között? Influenzás Nem lett influenzás Total Csak szezonális 43 (15.36%) 237 (84.64%) 280 (100%) Csak H1N1 52 (20.80%) 198 (79.20%) 250 (100%) Kombinált 25 (9.26%) 245 (90.74%) 270 (100 %) Total 120 680 800 0 20 40 60 80 100 120 nem influenzás influenzás Orvosi fizikacsak és statisztika szezonális I. Csak előadás H1N12016.11.09 Kombinált 13

Khi-négyzet próba függetlenségvizsgálatra -Példa 1 Számoljuk ki a várt gyakoriságokat várt gyakoriság = sorösszeg oszlopösszeg elemszám Influenzás Nem lett influenzás Total Csak szezonális Csak H1N1 Kombinált 280 120 = 42 800 250 120 = 37.5 800 270 120 = 40.5 800 280 680 = 238 800 280 250 680 = 212.5 800 250 270 680 = 229.5 800 270 Total 120 680 800 Orvosi fizika és statisztika I. előadás 2016.11.09 14

Khi-négyzet próba függetlenségvizsgálatra -Példa 1 Minden cella esetén számoljuk ki a reziduálok négyzetét: (O ij E ij ) 2 megfigyelt gyakoriságok: E ij Influenzás Nem lett influenzás Total Csak szezonális 43 237 280 Csak H1N1 52 198 250 Kombinált 25 245 270 Total 120 680 800 reziduálok négyzete: Influenzás Nem lett influenzás várt gyakoriságok: Csak szezonális Csak H1N1 Kombinált (43 42) 2 = 0.0238 42 (52 37.5) 2 = 5.6067 37.5 (25 40.5) 2 = 5.9321 40.5 (237 238) 2 = 0.0042 238 (198 212.5) 2 = 0.9894 212.5 (245 229.5) 2 = 1.0468 229.5 Influenzás Nem lett influenzás Total Csak szezonális 42 238 280 Csak H1N1 37.5 212.5 250 Kombinált 40.5 229.5 270 Total 120 680 800 Adjuk össze a reziduálok négyzeteit, hogy megkapjuk a próbastatisztikát: χ 2 = r c (O ij E ij ) 2 E ij = 0.0238+0.0042+5.6067+0.9894+5.9321+ i=1 j=1 1.0468 = 13.6030 Orvosi fizika és statisztika I. előadás 2016.11.09 15

Khi-négyzet próba függetlenségvizsgálatra -Példa 1 Adjuk meg a kritikus értéket: α = 0.05, df = (3 1) (2 1) = 2 χ 2 kritikus értékei df 0.25 0.20 0.15 0.10 0.05 0.025 0.02 0.01 0.005 0.0025 0.001 1 1.32 1.64 2.07 2.71 3.84 5.02 5.41 6.63 7.88 9.14 10.83 2 2.77 3.22 3.79 4.61 5.99 7.38 7.82 9.21 10.60 11.98 13.82 3 4.11 4.64 5.32 6.25 7.81 9.35 9.84 11.34 12.84 14.32 16.27 χ 2 table = 5.99 Döntés próbastatisztika alapján: 13.60 > 5.99 (χ 2 > χ 2 table) H 0 -t elvetjük, a influenzás megbetegedések aránya függ a vakcina típusától. Orvosi fizika és statisztika I. előadás 2016.11.09 16

Khi-négyzet próba függetlenségvizsgálatra -Példa 1 R-rel számolva: > chi=matrix(c(43,52,25,237,198,245),ncol=2,byrow=false);ch [,1] [,2] [1,] 43 237 [2,] 52 198 [3,] 25 245 > chisq.test(chi) Pearson s Chi-squared test data: chi X-squared = 13.603, df = 2, p-value = 0.001112 p = 0.001112 < 0.05, H 0 -t elvetjük. Orvosi fizika és statisztika I. előadás 2016.11.09 17

Khi-négyzet próba speciális eset: két dichotóm változó B 1 B 2 Sorösszeg A 1 O 11 = a O 12 = b O 1+ = a + b A 2 O 21 = c O 22 = d O 2+ = c + d Oszlopösszeg O +1 = a + c O +2 = b + d n = a + b + c + d A próbastatisztika képlete: χ 2 = r c i=1 j=1 (O ij E ij ) 2 E ij = n(ad bc) 2 (a + b)(c + d)(a + c)(b + d) Orvosi fizika és statisztika I. előadás 2016.11.09 18

Khi-négyzet próba függetlenségvizsgálatra -Példa 2 Van-e kapcsolat a betegség kimenetele és a kezelés típusa között. megfigyelt gyakoriságok: Beteg Meggyógyult Sorösszeg A kezelés 5 45 50 B kezelés 8 42 50 Oszlopösszeg 13 87 100 várt gyakoriságok: Beteg Meggyógyult Sorösszeg A kezelés 6.5 43.5 50 0 20 40 60 80 100 120 gyógyult beteg B kezelés 6.5 43.5 50 A kezelés B kezelés Oszlopösszeg 13 87 100 Teljesül a χ 2 próba feltétele. Orvosi fizika és statisztika I. előadás 2016.11.09 19

Khi-négyzet próba függetlenségvizsgálatra Példa 2 H 0 : A kimenetel és a kezelés típusa független H 1 : Van összefüggés a kimenetel és a kezelés típusa között Próbastatisztika: χ 2 = n(ad bc) 2 100 (5 42 8 45)2 = (a + b)(c + d)(a + c)(b + d) 50 50 13 87 Kritikus érték: χ 2 table = 3.84 df = (2 1)(2 1) = 1 χ 2 kritikus értékek = 0.79 df 0.25 0.20 0.15 0.10 0.05 0.025 0.02 0.01 0.005 0.0025 0.001 1 1.32 1.64 2.07 2.71 3.84 5.02 5.41 6.63 7.88 9.14 10.83 2 2.77 3.22 3.79 4.61 5.99 7.38 7.82 9.21 10.60 11.98 13.82 3 4.11 4.64 5.32 6.25 7.81 9.35 9.84 11.34 12.84 14.32 16.27 Döntés: χ 2 < χ 2 table, H 0-t elfogadjuk. A betegség kimenetele független a kezelés típusától. Orvosi fizika és statisztika I. előadás 2016.11.09 20

Főbb pontok Két diszkrét változó függetlenségének vizsgálata Khi-négyzet próba függetlenségvizsgálatra Khi-négyzet próba függetlenségvizsgálatra Yates korrekcióval Fisher-féle egzakt teszt függetlenségvizsgálatra Khi-négyzet próba illeszkedésvizsgálatra Orvosi fizika és statisztika I. előadás 2016.11.09 21

Khi-négyzet próba függetlenségvizsgálatra Yates korrekcióval Abban az esetben, a szabadsági fok 1 (2 2-es táblázat), a khinégyzet próba próbastatisztikája pontosabban számolható, ha különböző korrekciókat alkalmazunk. Az egyik leggyakrabban alkalmazott korrekció,a Yates-féle folytonossági korrekció Ezt a korrekció csak két dichotóm változó közötti kapcsolat elemzése esetén használható. Próbastatisztika Yates-féle korrekcióval: χ 2 = r c i=1 j=1 ( O ij E ij 1 2 )2 E ij = n( ad bc 1 2 n)2 (a + b)(c + d)(a + c)(b + d) Orvosi fizika és statisztika I. előadás 2016.11.09 22

Khi-négyzet próba függetlenségvizsgálatra Yates korrekcióval Példa 2 Van-e kapcsolat a betegség kimenetele és a kezelés típusa között. megfigyelt gyakoriságok: Beteg Meggyógyult Sorösszeg A kezelés 5 45 50 B kezelés 8 42 50 Oszlopösszeg 13 87 100 várt gyakoriságok: Beteg Meggyógyult Sorösszeg A kezelés 6.5 43.5 50 0 20 40 60 80 100 120 gyógyult beteg B kezelés 6.5 43.5 50 A kezelés B kezelés Oszlopösszeg 13 87 100 Teljesül a χ 2 próba feltétele. Orvosi fizika és statisztika I. előadás 2016.11.09 23

Khi-négyzet próba függetlenségvizsgálatra -Példa 2 Yates korrekcióval H 0 : A kimenetel és a kezelés típusa független H 1 : Van összefüggés a kimenetel és a kezelés típusa között Próbastatisztika: χ 2 = n( ad bc 1 2 n)2 (a + b)(c + d)(a + c)(b + d) = 100 ( 5 42 8 45 1 2 )2 100 50 50 13 87 Kritikus érték: χ 2 table = 3.84 df = (2 1)(2 1) = 1 χ 2 kritikus értékei = 0.354 df 0.25 0.20 0.15 0.10 0.05 0.025 0.02 0.01 0.005 0.0025 0.001 1 1.32 1.64 2.07 2.71 3.84 5.02 5.41 6.63 7.88 9.14 10.83 2 2.77 3.22 3.79 4.61 5.99 7.38 7.82 9.21 10.60 11.98 13.82 3 4.11 4.64 5.32 6.25 7.81 9.35 9.84 11.34 12.84 14.32 16.27 Döntés: χ 2 < χ 2 table, H 0-t elfogadjuk. Orvosi fizika és statisztika I. előadás 2016.11.09 24

Khi-négyzet próba függetlenségvizsgálatra -Példa 2 Yates korrekcióval R-rel számolva: > t2=matrix(c(5,8,45,42),ncol=2);t [,1] [,2] [1,] 3 7 [2,] 5 10 > chisq.test(t2) Pearson s Chi-squared test with Yates continuity correction data: t2 X-squared = 0.3537, df = 1, p-value = 0.552 p = 0.552 > 0.05, H 0 -t elfogadjuk. Orvosi fizika és statisztika I. előadás 2016.11.09 25

Főbb pontok Két diszkrét változó függetlenségének vizsgálata Khi-négyzet próba függetlenségvizsgálatra Khi-négyzet próba függetlenségvizsgálatra Yates korrekcióval Fisher-féle egzakt teszt függetlenségvizsgálatra Khi-négyzet próba illeszkedésvizsgálatra Orvosi fizika és statisztika I. előadás 2016.11.09 26

Fisher-féle egzakt teszt Fisher-féle egzakt tesztet egy populáción belül két diszkrét változó közötti összefüggés vizsgálatára használjuk Habár gyakorlatban csak kis mintaelemszám esetén használjuk, bármekkora minta esetén is pontos értéket ad Hipotézisek: H0 : a két változó független. H1 : a két változó között van kapcsolat NINCS próbastatisztika, közvetlenül p-értéket számolunk p-érték képlete: p = p i p i a megfigyelt és azon átrendezett gyakorisági táblázatok valószínűsége, melyek legalább annyira eltérők, mint a megfigyelt táblázat. (a + c)!(b + d)!(a + b)!(c + d)! 2 2 táblázat estén a képlete = n!a!b!c!d! Orvosi fizika és statisztika I. előadás 2016.11.09 27

Fisher-féle egzakt teszt Példa 3 Van-e kapcsolat a HIV fertőződések és a STD (szexuális úton terjedő betegségek) között? Megfigyelt gyakoriságok: HIV fertőzött Nem HIV fertőzött Total STD 3 7 10 Nem STD 5 10 15 Total 8 17 25 Várt gyakoriságok: HIV fertőzött Nem HIV fertőzött Total STD 3.2 6.8 10 Nem STD 4.8 10.2 15 0 20 40 60 80 100 120 HIV fertozött STD Nem HIV fertozött Nem STD Total 8 17 25 A χ 2 próba feltétele NEM teljesül Fisher-féle egzakt teszt H 0 : Nincs kapcsolat a HIV fertőződések és a STD között. H 1 : Van kapcsolat a HIV fertőződések és a STD között. Orvosi fizika és statisztika I. előadás 2016.11.09 28

Fisher-féle egzakt teszt Példa 3 megfigyelt gyakoriságok: HIV fertőzött Nem HIV fertőzött Total STD 3 7 10 Nem STD 5 10 15 Total 8 17 25 p 1 = 10! 15! 8! 17! 3! 7! 5! 10! 25! = 0.3332 lehetséges átrendezések: HIV fertőzött Nem HIV fertőzött Total STD 2 8 10 Nem STD 6 9 15 Total 8 17 25 p 2 = 10! 15! 8! 17! 2! 8! 6! 9! 25! = 0.2082 HIV fertőzött Nem HIV fertőzött Total STD 1 9 10 Nem STD 7 8 15 Total 8 17 25 p 3 = 10! 15! 8! 17! 1! 9! 7! 8! 25! = 0.0595 HIV fertőzött Nem HIV fertőzött Total STD 0 10 10 Nem STD 8 7 15 Total 8 17 25 p 4 = 10! 15! 8! 17! 0! 10! 8! 7! 25! = 0.0595 Orvosi fizika és statisztika I. előadás 2016.11.09 29

Fisher-féle egzakt teszt Példa 3 Fisher-féle p-érték: p = 0.3332 + 0.2082 + 0.0595 + 0.0059 = 0.60685 H 0 -t elfogadjuk, mert p > α. Nincs kapcsolat a HIV fertőződések és a STD között. Orvosi fizika és statisztika I. előadás 2016.11.09 30

Fisher-féle egzakt teszt Példa 3 R-rel számolva: > t=matrix(c(3,5,7,10),ncol=2);t [,1] [,2] [1,] 3 7 [2,] 5 10 > chisq.test(t) Pearson s Chi-squared test with Yates continuity correction data: t X-squared = 0, df = 1, p-value = 0.9999 Warning message: In chisq.test(t) : Chi-squared approximation may be incorrect > fisher.test(t,alternative="less") Fisher s Exact Test for Count Data data: t p-value = 0.6069 alternative hypothesis: true odds ratio is less than 1 95 percent confidence interval: 0.00000 4.86495 sample estimates: odds ratio 0.8624169 p = 0.552 > 0.05, H 0-t elfogadjuk. Orvosi fizika és statisztika I. előadás 2016.11.09 31

Főbb pontok Két diszkrét változó függetlenségének vizsgálata Khi-négyzet próba függetlenségvizsgálatra Khi-négyzet próba függetlenségvizsgálatra Yates korrekcióval Fisher-féle egzakt teszt függetlenségvizsgálatra Khi-négyzet próba illeszkedésvizsgálatra Orvosi fizika és statisztika I. előadás 2016.11.09 32

Khi-négyzet próba illeszkedésvizsgálatra Az illeszkedésvizsgálat célja annak a meghatározása, hogy a mintaelemek adott eloszlású populációból származnak-e. H 0 : az X változó eloszlása az adott eloszlás H 1 : az X változó eloszlása nem az adott eloszlás megfigyelt és várt gyakorisági táblázat: A 1 A 2... A c Total Megfigyelt gyakoriságok: O 1 O 2... O c n Várt gyakoriságok: E 1 E 2... E c n Próbastatisztika: χ 2 = (O i E i ) 2 E i df = c 1 (a lehetséges kimenetelek száma-1) χ 2 < χ 2 table, elfogadjuk a null-hipotézist χ 2 > χ 2 table, elvetjük a null-hipotézist Orvosi fizika és statisztika I. előadás 2016.11.09 33

Khi-négyzet próba illeszkedésvizsgálatra -Példa 4 Szeretnénk tesztelni, hogy a dobókockánk szabályos-e. dobtunk a dobókockával. 120-szor 1 2 3 4 5 6 Total Megfigyelt gyakoriságok: 25 18 21 17 20 19 120 Várt gyakoriságok: 20 20 20 20 20 20 120 H 0 : A kocka szabályos minden kimenetel valószínűsége p i = 1 6 H 1 : A kocka nem szabályos legalább egy kimenetel valószínűsége eltér 1 6 -tól. Orvosi fizika és statisztika I. előadás 2016.11.09 34

Khi-négyzet próba illeszkedésvizsgálatra -Példa 4 Próbastatisztika: 6 χ 2 (k i 20) 2 = = 20 i=1 (25 20) 2 + (18 20) 2 + (21 20) 2 + (17 20) 2 + (20 20) 2 + (19 20) 2 = 2 20 df = 6 1 = 5 Kritikus érték (táblázatból): χ 2 table = 11.07 Döntés: χ 2 < χ 2 table 2 < 11.07, H 0 -t elfogadjuk, nincs elegendő bizonyítékunk arra, hogy azt állítsuk, hogy a kocka nem szabályos. Orvosi fizika és statisztika I. előadás 2016.11.09 35

Khi-négyzet próba illeszkedésvizsgálatra -Példa 5 Szeretnénk tesztelni, hogy a dobókockánk szabályos-e. dobtunk a dobókockával. 120-szor 1 2 3 4 5 6 Total Megfigyelt gyakoriságok 5 18 21 17 20 39 120 Várt gyakoriságok 20 20 20 20 20 20 120 H 0 : A kocka szabályos minden kimenetel valószínűsége p i = 1 6 H 1 : A kocka nem szabályos legalább egy kimenetel valószínűsége eltér 1 6 -tól. Orvosi fizika és statisztika I. előadás 2016.11.09 36

Khi-négyzet próba illeszkedésvizsgálatra -Példa 5 Próbastatisztika: 6 χ 2 (k i 20) 2 = = 20 i=1 (5 20) 2 + (18 20) 2 + (21 20) 2 + (17 20) 2 + (20 20) 2 + (39 20) 2 df = 6 1 = 5 Kritikus érték (táblázatból): χ 2 table = 11.07 Döntés: χ 2 > χ 2 table 30 > 11.07, H 0 -t elvetjük, a kocka nem szabályos. 20 = 30 Orvosi fizika és statisztika I. előadás 2016.11.09 37

Khi-négyzet próba illeszkedésvizsgálatra -Példa 6 Egy adott betegségben szenvedő 200 beteget egy bizonyos szerrel kezeltünk (ami nem közvetlenül kapcsolódik a betegségéhez). A betegség esetén a gyógyulási arány 50%. Szeretnénk vizsgálni, hogy a gyógyult és nem gyógyult betegek aránya azonos-e. Vagyis a kezelés befolyásolja-e a betegségből való felgyógyulást. Gyógyult Nem gyógyult Total Megfigyelt gyakoriságok 150 50 200 Várt gyakoriságok 100 100 200 H 0 : A kezelés nincs hatással a gyógyulásra p i = 1 2 H 1 : A kezelés hatással van a gyógyulásra legalább az egyik valószínűség eltér 1 2 től. Orvosi fizika és statisztika I. előadás 2016.11.09 38

Khi-négyzet próba illeszkedésvizsgálatra -Példa 6 Próbastatisztika: 2 χ 2 (k i 100) 2 = 100 i=1 = (150 100)2 + (50 100) 2 100 = 50 df = 2 1 = 1 Kritikus érték (táblázatból): χ 2 table = 3.841 p < 0.05 Döntés: p < 0.05 (vagy χ 2 > χ 2 table, 50 > 3.841), H 0 -elvetjük, a kezelésnek van hatása a betegségből való felgyógyulásra. Orvosi fizika és statisztika I. előadás 2016.11.09 39

Ismétlő kérdések A függetlenségvizsgálat célja, null hipotézise Gyakorisági táblázat Megfigyelt és várható gyakoriságok A khi-négyzet próba feltétele Szabadságfok számítása khi-négyzet próba végrehajtásakor A khi-négyzet próba végrehajtása, döntés táblázat alapján és p-érték alapján 2x2-es táblázatok kiértékelése khi-négyzet próbával Fisher-féle egzakt teszt Az illeszkedésvizsgálat célja, nullhipotézise Orvosi fizika és statisztika I. előadás 2016.11.09 40

Köszönöm a figyelmet!! Orvosi fizika és statisztika I. előadás 2016.11.09 41