Kutatásmódszertan és prezentációkészítés



Hasonló dokumentumok
Kutatásmódszertan és prezentációkészítés

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

[Biomatematika 2] Orvosi biometria

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Hipotézis vizsgálatok

Bevezetés a hipotézisvizsgálatokba

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Adatok statisztikai értékelésének főbb lehetőségei

[Biomatematika 2] Orvosi biometria

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Hipotézis vizsgálatok

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

y ij = µ + α i + e ij

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Biostatisztika Összefoglalás

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Statisztika elméleti összefoglaló

Biomatematika 13. Varianciaanaĺızis (ANOVA)

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

6. Előadás. Vereb György, DE OEC BSI, október 12.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biostatisztika Összefoglalás

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kettőnél több csoport vizsgálata. Makara B. Gábor

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Az első számjegyek Benford törvénye

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Statisztika Elıadások letölthetık a címrıl

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Nemparametrikus tesztek december 3.

Elemszám becslés. Kaszaki József Ph.D. SZTE ÁOK Sebészeti Műtéttani Intézet

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

V. Gyakorisági táblázatok elemzése

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

KÖVETKEZTETŐ STATISZTIKA

Szerzők: Kmetty Zoltán Lektor: Fokasz Nikosz TÁMOP A/1-11/ INFORMÁCIÓ - TUDÁS ÉRVÉNYESÜLÉS

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Statisztikai módszerek 7. gyakorlat

Eloszlás-független módszerek 13. elıadás ( lecke)

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Nem-paraméteres és paraméteres módszerek. Kontingencia tábla, rangtranszformálás, párosított minták, két független minta

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Biostatisztika VIII. Mátyus László. 19 October

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Korreláció és lineáris regresszió

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

A Statisztika alapjai

A leíró statisztikák

A konfidencia intervallum képlete: x± t( α /2, df )

Matematikai geodéziai számítások 6.

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Nemparaméteres próbák

Centura Szövegértés Teszt

Függetlenségvizsgálat, Illeszkedésvizsgálat

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Számítógépes döntéstámogatás OPTIMALIZÁLÁSI FELADATOK A SOLVER HASZNÁLATA

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

egyetemi jegyzet Meskó Balázs

FIT-jelentés :: Dunabogdányi Általános Iskola és Alapfokú Művészeti Iskola 2023 Dunabogdány, Hegyalja utca OM azonosító:

Matematikai geodéziai számítások 6.

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

FIT-jelentés :: Intézményi jelentés. 8. évfolyam

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Módszertani dilemmák a statisztikában 40 éve alakult a Jövőkutatási Bizottság

FIT-jelentés :: Csillaghegyi Általános Iskola 1038 Budapest, Dózsa György u. 42. OM azonosító: Intézményi jelentés. 8.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Varianciaanalízis 4/24/12

A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra

FIT-jelentés :: Budapest XXII. Kerületi Kempelen Farkas Gimnázium 1223 Budapest, Közgazdász utca OM azonosító: Intézményi jelentés

Több valószínűségi változó együttes eloszlása, korreláció

Átírás:

Kutatásmódszertan és prezentációkészítés 8. rész: Statisztikai eszköztár: Alapfokú statisztikai ismeretek Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz

Nyolcadik rész Statisztikai eszköztár: Alapfokú statisztikai ismeretek

Tartalomjegyzék Bevezetés Következtetési statisztika Mintavételi hiba becslése binomiális változó esetében I Mintavételi hiba becslése binomiális változó esetében II Mintavételi hiba becslése binomiális változó esetében III Intervallum becslés átlagok esetében Mérési szintek I Mérési szintek II Hipotézisvizsgálat I Hipotézisvizsgálat II Hipotézisvizsgálat III Kereszttábla elemzés I Kereszttábla elemzés II Kereszttábla elemzés III Kereszttábla elemzés IV Kereszttábla elemzés V Statisztikai próbák Felhasznált irodalom

Bevezetés A társadalomtudomány és határterületei már a kezdetektől fogva komoly matematikai, statisztikai módszereket használtak fel elemzéseikben. Ez elsősorban a demográfiára volt igaz, de a 19 századtól elejétől - és még inkább a közepétől - a szociológiában is egyre hangsúlyosabbá váltak a komoly statisztikai eszköztárt felvonultató elemzések. A statisztikának két (egymástól nem élesen elkülönülő) ága is megjelenik a társadalomtudományokban. Az egyik a leíró statisztika, ezzel a 10 egységben foglalkozunk bővebben. Ebben az egységben a következtetési statisztikára koncentrálunk. A társadalomtudományokban ritkán van arra lehetőségünk, hogy egy adott kérdés kapcsán mindenkit megkérdezzünk. Ilyen ritka lehetőség a népszámlálás, ez azonban tíz évente csak egyszer van, és a vizsgált adatok köre is viszonylag szűk. A kutatási kérdések megválaszolására mintákat szoktak venni a sokaságból, és a kutatásba bekerültek véleménye alapján próbálnak becslést mondani a teljes sokaság véleményével kapcsolatban.

Következtetési statisztika A következtetési statisztika abban segít bennünket, hogy a minták eredményeiből a teljes sokaságra tudjunk valamilyen becslést megfogalmazni. Miért is van erre szükség? Ha mintákkal dolgozunk, akkor a becslésünknek, van valamekkora bizonytalansága. Ha az összefüggés statisztikailag is fennáll, akkor beszélhetünk szignifikáns összefüggésről. Megkérdezünk 1000 embert a pártpreferenciájáról, és azt kapjuk, hogy X párt támogatottsága 30 százalék. Azonban, ha másik 1000 embert kérdeztünk volna meg, akkor az eredményünk feltehetően nem pont 30 százalék lenne, hanem esetleg 29 százalék, vagy 31 százalék. Ezt a pontatlanságot nevezzük mintavételi hibának. Célunk az, hogy megadjuk azt az intervallumot, amibe a becslésünk nagy valószínűséggel beleesik.

Mintavételi hiba becslése binomiális változó esetében I Az előbbi példában szerepelő esetben, ahol az adott változó két értéket vehet fel (ezeket binomiális eloszlású változóknak nevezzük) viszonylag egyszerű képlettel ki tudjuk számolni a becslésünk intervallumát: P: probability - az adott érték százalékos megoszlása N: Esetszám α: A megbízhatósági szinthez tartozó korrekciós tényező

Mintavételi hiba becslése binomiális változó esetében II Az egyenletből, a P (P=0.3), és az N (N=1000) már ismert, azonban az α-ról még nem beszéltünk. A becsléseinkhez nem csak konfidencia intervallum tartozik, hanem egy megbízhatósági szint azt is jeleznünk kell, hogy a becslésünk, milyen megbízhatóság mellett érvényes. A korrekciós tényezőt a standard normális eloszlásból lehet kiszámolni A szociológiában leggyakrabban 95 százalékos megbízhatósági szinttel dolgoznak a kutatók, ehhez az α értéke 1.96. (standard normális eloszlású változó esetében +1.96 érték felett található a sokaság felső 2.5 százaléka, -1.96 érték alatt pedig a sokaság alsó 2.5 százaléka) Tehát az egyenletünkből így már minden tag ismert, ki tudjuk számolni a konfidencia intervallumot aminek az értéke jelen esetben 1.86%. Ez a gyakorlatban a következő következtetéshez vezet: X párt támogatottsága 95 százalékos megbízhatósági szint mellett 30%+-1.86%, tehát 28.14% és 31.86% között van. Ez praktikusan azt jelenti, hogy ha 100 mintát vennénk, abból 95 esetben, ebbe az intervallumba lenne az eredményünk.

Mintavételi hiba becslése binomiális változó esetében III A becslés pontosság mind a három benne lévő paramétertől függ. A P értéke minél közelebb van 0.5-höz, a becslésünknek annál nagyobb a mintavételi hibája. 1000 fős minta esetén, ha P értéke 0.5, és a megbízhatósági szint 95%, akkor a becslési hibánk +-3.1%. Ezt nevezik maximális mintavételi hibának egy sokaságban. A mintavételi hiba csökkentésének legjobb módja az esetszám növelése. Azonban, mivel az N gyök alatt szerepel a kifejezésben, ezért a csökkenés nem lineáris, hanem gyökös, tehát egy bizonyos szint után már nem érdemes tovább emelni a mintaméretet, mert a becslési hibánk, csak kis arányban fog csökkeni. Az α értéke pedig a megbízhatósági szint növelésével emelkedik, tehát nagyobb lesz a becslésünk konfidencia intervalluma. Ez logikus is, ha belegondolunk abba, hogy ha 99 százalékos valószínűség mellett akarunk valamit kijelenteni, akkor szélesebb intervallumot kell megadni, hogy a becslésünk biztos a tartományon belül maradjon.

Intervallum becslés átlagok esetében A becslési hibát, nem csak kétértékű változók esetén lehet kiszámolni. Ebben az egységben, az átlagokra vonatkozó becslési hibát is bemutatjuk: Az S.H. a standard hiba rövidítése. A szigma pedig az elméleti szórásé (l. unit 10). Az N-t már ismerjük a korábbi részből, az esetszám rövidítése, ami ebben az esetben is gyök alatt szerepel. Ahhoz, hogy egy átlag esetén kiszámoljuk, a becslés konfidencia intervallumát, a standard hibát korrigálni kell az α tényezővel, ebben az esetben is.

Mérési szintek I Felmerülhet az olvasóban, hogy mikor kell az egyes képletetek használni. Ahhoz, hogy ezt megértsük, röviden ki kell térnünk a változók mérési szintjére. Mérési szintekből négy fajtát különböztetünk meg. Nominális: A változó attribútumai között nem lehet sorrendiséget felállítani Nem, kedvenc szín, vallás, politikai preferencia Ordinális: A változó attribútumai között lehet sorrendet felállítani, de az attribútumok közötti távolság nem állandó, és matematikailag nem kiszámolható Iskolai végzettség, Likert skálás kérdések, településtípus Intervallum: A változó attribútumai között lehet sorrendet felállítani, és az attribútumok közötti távolság is állandó, de a változó valós nulla pontja, nem a matematika nulla pontban van. Utóbbiból következik, hogy nem lehet arányokat számolni az adott változóval. IQ, Celsius fok Arányskála: A változó attribútumai között lehet sorrendet felállítani, és az attribútumok közötti távolság is állandó, és a változónak létezik abszolút nulla pontja, lehet arányok számolni kor, jövedelem

Mérési szintek II Az első két szintet nevezik, alacsony, vagy kategoriális mérési szintnek, a második kettőt pedig magas vagy folytonos mérési szintnek. A változók mérési szintje megszabja, hogy milyen statisztikai műveleteke lehet velük végezni. Egy alacsony mérési szintű változó esetén nincs értelme átlagot számolni, mivel annak semmilyen tartalmi jelentősége nincsen. Magas mérési szinten pedig általában nem érdemes százalékos megoszlásokat vizsgálni, mivel mindegyik kategóriába csak 1-2 eset van, ezért ennek sincs tartalmi haszna. Az első képlet alacsony mérési szintű változók esetében használatos (annak egy speciális esete az, amikor két értéke van egy változónak). A második képlet, pedig magas mérési szintű változóknak esetében adja meg, a várható érték (ami az átlag torzítatlan becslése) konfidencia intervallum becslését.

Hipotézisvizsgálat I Az itt bemutatott formulák egy változó esetében adnak becslési a mintavételi hibára. Azonban a mintavételi hiba problémája, előkerül abban az esetben is, ha két változó közötti kapcsolatot szeretnénk megvizsgálni. Mielőtt ennek a módját bemutatnánk, röviden kitérünk a statisztikai hipotézisvizsgálat kérdéskörére. Ahogy az eddigi tananyagból is kiderült, a mintákból adott becsléseink csak bizonyos megbízhatósági szint mellett érvényesek. Amikor kettő vagy több változó összefüggését szeretnénk elemezni, akkor azt vizsgáljuk, hogy a mintákban látható összefüggés, vajon kiterjeszthető-e a teljes sokaságra is. Ehhez minden esetben meg kell fogalmaznunk egy nullhipotézist (H0), aminek a helyességéről dönteni szeretnénk a statisztikai vizsgálat során. Ezt a következő példával szemléltetjük. Egy bírósági tárgyaláson azt vizsgálják, hogy a vádlott bűnöse vagy sem. A nullhipotézisünk az lesz, hogy a vádlott ártatlan.

Hipotézisvizsgálat II A H0 hipotézis igaz: a vádlott ártatlan A H0 hipotézis igaz: a vádlott bűnös Elfogadjuk a H0 hipotézist Jó döntés Rossz döntés: másodfajú hiba Elvetjük a H0 hipotézsit Rossz döntés: Elsőfajú hiba Jó döntés

Hipotézisvizsgálat III Ha a vádlott nem bűnös, és mi is ezt a következtetést vonjuk le, akkor jól döntöttünk. Ugyanez igaz, ha a vádlott nem bűnös, és mi is ezt gondoljuk. Ha a vádlott nem bűnös, mi viszont elítéljük, akkor követjük el az elsőfajú hibát. Ebben az esetben egy ártatlan embert börtönzünk be. Ha a vádlott bűnös, mi viszont azt mondjuk, hogy nem bűnös, akkor a másodfajú hibát követjük el, egy bűnözőt elengedünk. Az adott kutatási problémától függ, hogy az első vagy a másodfajú hiba elkövetése a nagyobb probléma. A H0 hipotézissel szemben fogalmazzák meg a H1 hipotézist, amit alternatív hipotézisnek is szoktak nevezni. A H0 és a H1 hipotéziseknek egymást kizáróknak kell lennie. A továbbiakban bemutatott statisztikai próbák azt vizsgálják, hogy igaz-e a H0 hipotézisünk. Ezt a következő módon tudjuk megtenni. Az adott statisztikai próbához meghatározhatunk egy elfogadási tartományt. Ha a teszt statisztika értéke az elfogadási tartományba kerül, akkor nem tudjuk elvetni a nullhipotézisünket. Ha a teszt statisztika az elutasítási tartományba kerül, akkor el kell vetnünk a hullhipotézist, és ebből következően el kell fogadnunk az alternatív hipotézist. Az az értéket, ami az elfogadási és elutasítási tartományt elválasztja, kritikus értéknek nevezzük.

Kereszttábla elemzés I A változók közötti összefüggések vizsgálatakor több szempontot is kell mérlegelnünk ahhoz, hogy kiválasszuk a megfelelő statisztikai eljárást. Egyrészről meg kell vizsgálnunk a változók mérési szintjét, másrészről döntenünk kell arról is, hogy az adott statisztika alkalmazási feltételei közül melyik teljesül. Ebben az egységben azt az esetet vizsgáljuk, amikor két alacsony mérési szintű változó közötti kapcsolat meglétét teszteljük. Ebben az esetben a kereszttábla elemzés módszerét kell használnunk, a változók közötti összefüggés meglétét, pedig Khi 2 próbával tesztelhetjük. A nullhipotézisünk mindig a következő: H0: A változók függetlenek egymástól H1: A változók összefüggenek egymással

Kereszttábla elemzés II Azt vizsgáljuk a példánkban, hogy a mikulás alkalmaz-e bármiféle diszkriminációt a virgácsok kiosztásánál. A következő kereszttábla esetszámokat tartalmaz. 100 főt vizsgáltunk (60 kisfiú, és 40 kislány), akiktől megkérdeztük, hogy kaptak-e virgácsot. Kisfiú Kislány Összesen Kap virgácsot 40 20 60 Nem kap virgácsot 20 20 40 Összesen 60 40 100 Ezt a táblát nevezzük gyakorlati, vagy megfigyelt táblának. A függetlenség megvizsgálásához, ki kell számolnunk egy olyan kereszttáblát, amiben az esetek úgy oszlanak meg, mintha a két változó teljesen független lenne egymástól. Ezt nevezzük függetlenségi, vagy elméleti táblának. Az egyes cellákban lévő esetszámokat úgy tudjuk kiszámolni, hogy az adott cellához tartozó sorösszeget (sor marginális) megszorozzuk az oszlopösszeggel (oszlop marginális), és elosztjuk a teljes esetszámmal. Ez matematikailag a következő formulát követi: ahol i a sor index, j az oszlop index, E i+ az i sorhoz tartozó oszlop marginális, az E +j, pedig a j oszlophoz tartozó sor marginális.

Kereszttábla elemzés III Az adatok alapján az elméleti táblánk a következőképp néz ki: Kisfiú Kislány Összesen Kap virgácsot 36 24 60 Nem kap virgácsot 24 16 40 Összesen 60 40 100 Ahogy leolvasható, az oszlop- és sor marginálisok állandóak, viszont a cellák értékei megváltoztak. Ha a két változó független lenne egymástól (tehát, ha nem diszkriminálna a mikulás), akkor ezek az értékek lennének a kereszttáblában. Látható, hogy a két tábla esetszámai nem egyeznek meg egymással, a kutatót viszont az érdekli, hogy a függetlenség a teljes sokságra igaz-e vagy sem.

Kereszttábla elemzés IV A függetlenség megvizsgálásához kereszttábla esetében a Khi 2 próbát tudjuk alkalmazni: O ij : Megfigyelt táblában a cella értékek E ij : Elméleti táblában a cella értékek A példánkban a következő az eredmény: Khi 2 =16/36+16/24+16/24+16/16=2.77 Tehát a teszt statisztika értéke 2.77. Azt kell eldöntetnünk, hogy ez az érték az elfogadási, vagy az elutasítási tartományba esik. Ehhez meg kell határozunk még a khi2 statisztika szabadságfokát, ami az adott statisztikai modellen belül a variációs lehetőségeket mutatja be. A kereszttábla elemzésnél ez arra utal, hogy ha ismertek a marginálisok, hány cellát kell ahhoz kitöltenünk, hogy utána a többi cellát már automatikusan meg tudjuk határozni.

Kereszttábla elemzés V Szabadsági fok kiszámolása kereszttábla elemzésnél: sz.f. (degrees of freedom d.f.): (r-1)*(c-1), ahol r a sorok száma, c pedig az oszlopok száma A mi példánkban a szabadságfok 1 lesz. A khi2 eloszlás tábláját használva (http://en.wikipedia.org/wiki/chi-squared_distribution) megállapíthatjuk, hogy 1-es szabadságfok, és 95 százalékos megbízhatóság mellett (0.05 szignifikancia szint mellett), a kritikus érték 3.84. Mivel a teszt statisztika értéke 3.84 alatt van, ezért az elfogadási tartományba esik, tehát nem tudjuk elvetni azt a nullhipotézist, hogy a változók függetlenek egymástól, tehát a 100 fős kutatásunk alapján nem jelenthetjük ki, hogy diszkriminál a télapó. Gyakorlásként érdemes megvizsgálni, hogyan alakult volna az összefüggés, ha 1000 főt kérdeztünk volna meg, és a válaszok megoszlása ugyanaz lett volna, mint a példánkban.

Statisztikai próbák A következő táblázat összefoglal néhány alapvető statisztikai próbát: Modell Két alacsony mérési szintű változó függetlensége Átlagos összehasonlítása két csoportban Legalább három alacsony mérési szintű változó Átlagok összehasonlítása több csoportban Két magas mérési szintű változó függetlensége Egy magas mérési szintű függő változó modellezése több magas mérési szintű függő változóval Egy binomiális (kétértékű) függő változó modellezése több magas mérési szintű függő változóval Egy alacsony mérési szintű függő változó modellezése több vegyes mérési szintű változóval Módszer Khi-négyzet T próba, illetve a T próba robusztusabb változatai Loglineáris modellek Variancia analízis (ANOVA) Korreláció Lineráis regresszió Logisztikus regresszió Általános lineáris modellek

Felhasznált irodalom: Obádovics Gyula: Matematika, Scolar, 2012 Obádovics Gyula: Valószínűségszámítás és matematikai statisztika, Budapest Scolar, 2009 Hunyadi László Vita László: Statisztika Közgazdászoknak, KSH 2006, ISBN:963-215-742-7