Khi-négyzet eloszlás. Statisztika II., 3. alkalom



Hasonló dokumentumok
V. Gyakorisági táblázatok elemzése

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Az első számjegyek Benford törvénye

Függetlenségvizsgálat, Illeszkedésvizsgálat

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biostatisztika VIII. Mátyus László. 19 October

A khi-négyzet próba és alkalmazásai: illeszkedésés függetlenségvizsgálat. khi-(χ 2 )-négyzet próba

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Eloszlás-független módszerek 13. elıadás ( lecke)

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Statisztika elméleti összefoglaló

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Korreláció és lineáris regresszió

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Statisztikai módszerek 7. gyakorlat

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Sztochasztikus kapcsolatok

Biostatisztika Összefoglalás

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Biostatisztika Összefoglalás

Regressziós vizsgálatok

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Varianciaanalízis 4/24/12

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

[Biomatematika 2] Orvosi biometria

Adatok statisztikai értékelésének főbb lehetőségei

Nemparaméteres próbák

Nemparametrikus tesztek december 3.

Valószínűségi változók. Várható érték és szórás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

(Independence, dependence, random variables)

[Biomatematika 2] Orvosi biometria

Matematikai statisztika c. tárgy oktatásának célja és tematikája

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Valószínűségszámítás összefoglaló

Segítség az outputok értelmezéséhez

Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika c. művei alapján

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

GRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens

Korrelációs kapcsolatok elemzése

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

KÖVETKEZTETŐ STATISZTIKA

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

BIOMATEMATIKA ELŐADÁS

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)


Biomatematika 13. Varianciaanaĺızis (ANOVA)

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Kvantitatív statisztikai módszerek

Normális eloszlás tesztje

[Biomatematika 2] Orvosi biometria

Hipotézis vizsgálatok

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Matematikai geodéziai számítások 10.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

A valószínűségszámítás elemei

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Statisztikai módszerek 7. gyakorlat

Kutatásmódszertan és prezentációkészítés

Tárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102

Többváltozós lineáris regressziós modell feltételeinek

Korreláció és Regresszió

Hipotézis vizsgálatok

6. Előadás. Vereb György, DE OEC BSI, október 12.

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Abszolút folytonos valószín ségi változó (4. el adás)

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Centura Szövegértés Teszt

y ij = µ + α i + e ij

STATISZTIKA. ( x) 2. Eloszlásf. 9. gyakorlat. Konfidencia intervallumok. átlag. 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% (cm)

egyetemi jegyzet Meskó Balázs

Kutatásmódszertan és prezentációkészítés

Statisztikai becslés

Átírás:

Khi-négyzet eloszlás Statisztika II., 3. alkalom

A khi négyzet eloszlást (Pearson) leggyakrabban kategorikus adatok elemzésére használjuk. N darab standard normális eloszlású változó négyzetes összegeként kapjuk a khi-négyzet eloszlást. Jelölése:.

Általános képlete: ( O i Ei E ) i i A nominális változó K darab lehetséges értéke esetén a szabadságfok f=k-1 Illeszkedés vizsgálat (egy minta): H0: változó tapasztalati eloszlása megfelel egy feltételezett eloszlásnak. Példa (Varga, 000) Koronás Kádár Rákosi Kossuth Összesen címer címer címer címer Oi 80 48 1 36 376 Ei 94 94 94 94 376 H0: A négy címerfajtát az emberek egyenlő mértékben kedvelik. f=4-1=3 ( O E) i E (80 94) (48 94) (1 94) 94 (36 94) 497.87 A kritikus érték még 0.01-nél is csak 11.3, így 99%-os valószínűséggel, a négy címerfajtát nem egyelő mértékben kedvelik.

Két változó kapcsolata: Kategorikus esetben a függetlenség és homogenitásvizsgálat a khi-négyzet eloszlás segítségével történik. A próba szabadságfoka f=(k-1)(g-1), ahol K és G a két változó lehetséges értékeinek száma. Függetlenségvizsgálat: H0: Az oszlopoknak megfelelő gyakoriságok függetlenek a sorok gyakoriságaitól Homogenitásvizsgálat: H0: Az oszlopoknak és soroknak megfelelő gyakoriságok függnek egymástól. Ehhez először a várt gyakoriságok kiszámítása szükséges. (Megfigyelt gyakoriságok) Y1 Y Össz. X1 O11 O1 O1+ X O1 O O+ Össz. O+1 O+ N P( A B) P( A) P( B) (Várt gyakoriságok) Y1 X1 E11=O1+*O+1/N E1= O1+*O+/N X E1= O+*O+1/N E= O+*O+/N Y1

(függetlenségvizsgálat) Nyugtató hatása enyhe depresszióra (Megfigyelt gyakoriságok) Depressziós Nem depressziós Össz. Nyugtató 335 76 411 Placebó 30 105 407 Össz. 637 181 818 H0: A gyógyulás szempontjából mindegy, hogy placebót kap a depressziós vagy nyugtatót. Nyugtató hatása enyhe depresszióra (Várt gyakoriságok) Depressziós Nem depressziós Nyugtató 637*411/818=30.1 181*411/818=90.9 Placebó 637*407/818=316.9 181*407/818=90.1 (335 30.1) 30.1 (30 316.9) 316.9 (76 90.9) 90.9 (105 90.1) 90.1 6.3 df=(-1)(-1)=1 p=0.0118

(homogenitásvizsgálat) A homogentásvizsgálat formailag ugyanúgy történik, mint a függetlenségvizsgálat. Fontos különbség, hogy a kérdés nem az, hogy az egyik változó hatással van-e a másikra, hanem az, hogy a két változó hatással van-e egymásra. Példák: Az, hogy mennyire ért egyet a bálnák megmentéséért folytatott küzdelemmel (abszolút, inkább igen, közepesen, inkább nem, egyáltalán nem) összefügg-e azzal, hogy mennyire ért egyet az esőerők megmentésével (abszolút, inkább igen, közepesen, inkább nem, egyáltalán nem)? A tréning hangulatával való elégedettség összefügg-e a tréning hatékonyságával való elégedettséggel? A kedvenc sport és a kedvenc nyaralási helyszín összefügg-e?

Homogenitásvizsgálat versus függetlenségvizsgálat A következő mintavételi eljárásokat különböztethetjük meg: Poisson Multinomiális Prospektive Retrospektive Random kísérlet Függetlenségvizsgálat csak a Poisson és a multinomiális esetben elképzelhető, homogenitásvizsgálat minden esetben.

ból származtatható asszociációs mérőszámok A khi-négyzet próba teszteli két változó függetlenségét (vagy egyik függését a másiktól). Ha az érték nulla, függetlenek, de a kapcsolat erősségének a statisztika értéke nem jó mutatója, mert függvénye a mintanagyságnak, a szabadsági foknak, így egyéb mérőszámokat használunk az asszociáció erősségének kifejezésére. Az ideális mutató a korrelációhoz hasonlóan nulla és egy közötti értékeket vehetne fel. N A (phi) együttható értéke függetlenség esetén nulla. x-es kontingencia táblázat esetén maximális értéke egy, ennél nagyobb táblázat esetén értéke túllépheti az egyet. C N A Pearson féle kontingencia (C) együttható értéke szintén nulla függetlenség esetén. Nulla és egy közötti balról zárt intervallumbeli értékeket vehet fel (egynél kisebb). V N( k 1) A Cramer féle V együttható függetlenség esetén a nulla értéket veszi fel, értékei 0 és 1 közt mozognak, mindkét szélsőértéket felvehetik. k a képletben a kisebb a két változó lehetséges értékek száma közül.