V. Gyakorisági táblázatok elemzése

Hasonló dokumentumok
Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Az első számjegyek Benford törvénye

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

IV. Változók és csoportok összehasonlítása

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Varianciaanalízis 4/24/12

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Vargha András Károli Gáspár Református Egyetem Budapest

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Biostatisztika Összefoglalás

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

Statisztikai módszerek 7. gyakorlat

Függetlenségvizsgálat, Illeszkedésvizsgálat

Hipotézis vizsgálatok

Biostatisztika Összefoglalás

Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika c. művei alapján

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Nemparametrikus tesztek december 3.

Nemparaméteres próbák

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Hipotézis vizsgálatok

Statisztika Elıadások letölthetık a címrıl

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

A khi-négyzet próba és alkalmazásai: illeszkedésés függetlenségvizsgálat. khi-(χ 2 )-négyzet próba

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Adatok statisztikai értékelésének főbb lehetőségei

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

Eloszlás-független módszerek 13. elıadás ( lecke)

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

BIOMATEMATIKA ELŐADÁS

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Centura Szövegértés Teszt

[Biomatematika 2] Orvosi biometria

y ij = µ + α i + e ij

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Többváltozós lineáris regressziós modell feltételeinek

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

[Biomatematika 2] Orvosi biometria

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

egyetemi jegyzet Meskó Balázs

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Statisztikai módszerek 7. gyakorlat

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Normális eloszlás paramétereire vonatkozó próbák

Korreláció és lineáris regresszió

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Kutatásmódszertan és prezentációkészítés

Korreláció és Regresszió

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Bevezetés a hipotézisvizsgálatokba

Kettőnél több csoport vizsgálata. Makara B. Gábor

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

3/29/12. Biomatematika 2. előadás. Biostatisztika = Biometria = Orvosi statisztika. Néhány egyszerű definíció:

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Biostatisztika VIII. Mátyus László. 19 October

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

kritikus érték(ek) (critical value).

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Tárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102

11.Négymezős táblázatok. Egyezés mérése: kappa statisztika Kockázat becslés: esélyhányados (OR) Kockázat becslés: relatív kockázat (RR)

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

A TÁRKI ADATFELVÉTELEINEK DOKUMENTUMAI. Omnibusz 2003/08. A kutatás dokumentációja. Teljes kötet

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

Fábián Zoltán: Szavazói táborok társadalmi, gazdasági beágyazottsága - Statisztikai melléklet

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

Átírás:

V. Gyakorisági táblázatok elemzése

Tartalom Diszkrét változók és eloszlásuk Gyakorisági táblázatok Populációk összehasonlítása diszkrét változók segítségével Diszkrét változók kapcsolatvizsgálata

Példák diszkrét változóra Személy neme (x 1 = férfi, x 2 = nő) Iskolázottsági szint (x 1 = Alsófok, x 2 = Középfok, x 3 = Felsőfok) 5-fokú skálaváltozók Diagnózis (x 1 = Neurózis, x 2 = Szkizofrénia,...)

60 NEM 50 40 30 20 P erc ent 10 0 férfi nõ NEM

40 ISK 30 20 10 P erc ent 0 7 8 9 10 11 12 13 14 15 16 17 18 ISK

50 ISKKOD 40 30 20 P erc ent 10 0 7-11 12-15 16-20 ISKKOD

Az iskolai végzettség eloszlása Alsófok Középfok Felsőfok 29% 40% 31%

Másik példa diszkrét eloszlásra érték 0 1 2 3 arány 0,20 0,35 0,40 0,05

Kiemelt fontosságú diszkrét változók Változó típusa Kvantitatív Kvalitatív Arány Intervallum Ordinális Nominális

0 Statisztikai problématípusok diszkrét változók esetén

1 1. Egy diszkrét változó eloszlásával kapcsolatos kérdések vizsgálata (Eloszlásvizsgálatok) Igaz-e, hogy a pszichológusok között több az extravertált, mint az introvertált? A Koronás, a Kádár és a Kossuth címer kedveltsége ugyanolyan mértékű-e?

2 2a. Populációk összehasonlítása egy diszkrét változó segítségével (Homogenitásvizsgálatok független mintákkal) Igaz-e, hogy a nők között több neurotikus van, mint a férfiak között? Ugyanolyan-e Bp.-en a Koronás, a Kádár- és a Kossuth-címer kedveltsége, mint vidéken?

3 2b. Helyzetek összehasonlítása egy diszkrét változó segítségével (Homogenitásvizsgálatok összetartozó mintákkal) Változik-e a dohányosok aránya egy előadássorozat hatására különböző időpontokban?

4 3. Két diszkrét változó kapcsolatának vizsgálata (Kapcsolatvizsgálatok) Függ-e a pártpreferencia az iskolázottságtól? Milyen szoros kapcsolatban van a fenti két változó egymással?

5 Problématípusok rendszere Statisztikai probléma típusa Eloszlásvizsgálat Homogenitásvizsgálat Kapcsolatvizsgálat Független minták Összetartozó minták

6 A khi-négyzet-próba alapötlete A mintabeli kapott és a nullhipotézis (H 0 ) igaz volta esetén várt gyakoriságok összehasonlítása és a köztük lévő különbségekből egy 2 próbastatisztika kiszámítása. 2 g i 1 (kapott i várt várt i i ) 2

7 Két populáció összehasonlítása egy diszkrét változó segítségével Kérdés: Budapestiek és vidékiek között van-e különbség a címerpreferencia tekintetében? Nullhipotézis: A két populációban a címerválasztási arányok ugyananazok.

8 Kétszempontos gyakorisági táblázat Koronás Kádár Kossuth Össz. Bpest 116 15 32 n 1 =163 Vidék 592 94 90 n 2 =776 Össz.: 708 109 122 N =939

9 Kétszempontos gyakorisági táblázat (sorösszegek szerinti százalékok) Koronás Kádár Kossuth Össz. Bpest 71,2% 9,2% 19,6% 100% Vidék 76,3% 12,1% 11,6% 100%

0 Általános khi-négyzet-próba H 0 igaz volta esetén a (kapott 2 ij várt várt i, j próbastatisztika 2 -eloszlást követ (szabadságfok: f = (sorok-1) (oszlopok-1)). 2 < 2 : H 0,05 0-t 5%-os szinten nem utasítjuk el. 2 2 0,05 : H 0 -t 5%-os szinten elutasítjuk. ij ij ) 2

1 A címeres példa eredménye Sorok száma: g = 2 Oszlopok száma: h = 3 Szabadságfok: f = (2-1) (3-1) = 1 2 = 2 Kritikus értékek: - 2 0,05 = 5,991-2 0,01 = 9,210 Kiszámított khi-négyzet-érték: 2 = 8,144 p-érték: p = 0,0170 * Döntés: H 0 -t 5%-os szinten elutasítjuk (p < 0,05)

2 A khi-négyzet-próba lényege Minél nagyobb az eltérés a kapott és a várt gyakoriságok között, annál valószínűbb, hogy H 0 nem igaz. Az eltérés egyik mértéke a 2 próbastatisztika. Ha igaz H 0, ez a mennyiség közelítőleg 2 -eloszlású. Ha 2 elég nagy, akkor H 0 -t elutasítjuk.

3 A 2 -próba alkalmazási feltétele A várt gyakoriságok ne legyenek kb. 5- nél kisebbek. Engedmény: elég, ha 80%-ra teljesül. Például egy 2x2-es táblázatban 4 cella van, ezért ezekre mind teljesülnie kell. GYAK

4 Mit tehetünk, ha az alkalmazási feltétel nem teljesül? Kis gyakoriságú sorok vagy oszlopok összevonása. Nagyobb minta választása. 2x2-es táblázat esetén a Fisher-egzaktpróba alkalmazása a 2x2-es 2 helyett.

5 Példa oszlopok összevonására h6 változó értékei Isk. szint 0 1 2 3 4 Össz. Alsófok 3 2 16 10 24 55 Középfok 0 2 10 13 20 45 Felsőfok 0 4 17 5 16 42 Össz. 3 8 43 28 60 142 GYAK

6 Két diszkrét változó kapcsolatának 15 éves lányok vizsgálata Könnyen teremt baráti kapcsolatokat Dohányzik Igen Nem Összesen Igen 105 17 122 Nem 469 340 809 Összesen 574 357 931 Kapcsolatvizsgálat homogenitásvizsgálat

7 Sorösszegek szerinti százalékok táblázata 15 éves Könnyen teremt baráti lányok kapcsolatokat Dohányzik Igen Nem Összesen Igen 86,1 13,9 100 Nem 58,0 42,0 100 Összesen 61,7 38,3 100

8 A pártpreferencia függése az életkortól és a nemtől A pártpreferencia nem függ a kortól, ha a pártpreferencia eloszlása különböző életkori szinteken ugyanaz. A pártpreferencia nem függ a nemtől, ha a pártpreferencia eloszlása férfiaknál és nőknél ugyanaz.

9 Két változó (X és Y) függetlensége X független Y-tól, ha Y eloszlása ugyanaz X minden értéke mellett; Y független X-től, ha X eloszlása ugyanaz Y minden értéke mellett; A függetlenség kölcsönös

0 Iskolázottság és szimpátia Függ-e az iskolai végzettségtől ennek a személynek a kedveltsége?

1 Eloszlás a 3 iskolázottsági szinten 50 40 százalék 30 20 10 0 Neg+ Neg 0 Poz Poz+ alsófok középfok felsőfok

2 Nem és szimpátia Összefügg-e a nemmel ennek a személynek a kedveltsége?

3 Az eloszlás férfiaknál és nőknél 50 40 százalék 30 20 10 0 Neg+ Neg 0 Poz Poz+ férfi nő

4 A kapcsolat szorosságának mérése diszkrét változók esetén Cramér-féle V kontingencia-együttható: V 2 N (min( g, h) 1) Ha X és Y független, V = 0. 0 V 1. Dichotóm változók esetén V φ kontingencia e.h. GYAK