Normális eloszlás paramétereire vonatkozó próbák

Hasonló dokumentumok
Valószín ségszámítás és statisztika

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Hipotézis vizsgálatok

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

A konfidencia intervallum képlete: x± t( α /2, df )

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Statisztika Elıadások letölthetık a címrıl

Hipotézis vizsgálatok

Abszolút folytonos valószín ségi változó (4. el adás)

Bevezetés a hipotézisvizsgálatokba

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

egyetemi jegyzet Meskó Balázs

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Biometria gyakorló feladatok BsC hallgatók számára

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

1. Két pályázat esetén a nyerési esélyeket vizsgálják. Mintát véve mindkét pályázat esetén az egyik. (b) Mit nevezünk másodfajú hibának?

Baran Ágnes. Gyakorlat MATLAB. Baran Ágnes Gyakorlat 1 / 70

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Nemparaméteres próbák

Korreláció és lineáris regresszió

[Biomatematika 2] Orvosi biometria

Matematikai statisztika szorgalmi feladatok

Kísérlettervezés alapfogalmak

Biostatisztika Összefoglalás

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Valószín ségszámítás és statisztika Gyakorlat (Statisztika alapjai)

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Valószín ségszámítás és statisztika

Valószín ségszámítás és statisztika Gyakorlat (Kétmintás próbák)

Hipotézisvizsgálat R-ben

2. A ξ valószín ségi változó s r ségfüggvénye a következ : c f(x) =

Adatok statisztikai értékelésének főbb lehetőségei

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Biostatisztika Összefoglalás

Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József

Matematikai statisztikai elemzések 4.

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

Matematikai statisztikai elemzések 4.

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Kísérlettervezés alapfogalmak

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Statisztikai módszerek 7. gyakorlat

Statisztika elméleti összefoglaló

Dr. Karácsony Zsolt. Miskolci Egyetem november

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Gyakorló feladatok statisztikai programcsomagokhoz

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

Normális eloszlás tesztje

Varianciaanalízis 4/24/12

H0 hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik)

Az első számjegyek Benford törvénye

3. Egy szabályos dobókockával háromszor dobunk egymás után. Legyen A az az esemény, hogy

A valószínűségszámítás elemei

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

kritikus érték(ek) (critical value).

Biostatisztika. Sz cs Gábor. 2018/19 tavaszi félév. Szegedi Tudományegyetem, Bolyai Intézet

Matematikai statisztika feladatsor

Nemparametrikus tesztek december 3.

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Függetlenségvizsgálat, Illeszkedésvizsgálat

Illeszkedésvizsgálati módszerek összehasonlítása

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

Gyakorló feladatok_alapok

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Többváltozós lineáris regressziós modell feltételeinek

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Átírás:

Normális eloszlás paramétereire vonatkozó próbák Az alábbi próbák akkor használhatók, ha a meggyelések függetlenek, és feltételezhetjük, hogy normális eloszlásúak a meggyelések függetlenek, véges szórású eloszlásból származnak, és a minta mérete, azaz n "elég nagy", például n 100 (az átlag a centrális határeloszlástétel alapján közel normális eloszlású)

Normális eloszlás paramétereire vonatkozó próbák Az alábbi próbák akkor használhatók, ha a meggyelések függetlenek, és feltételezhetjük, hogy normális eloszlásúak a meggyelések függetlenek, véges szórású eloszlásból származnak, és a minta mérete, azaz n "elég nagy", például n 100 (az átlag a centrális határeloszlástétel alapján közel normális eloszlású) z-próba (vagy u-próba): várható értékre vonatkozó hipotézis esetén, ha a σ szórás ismert

Normális eloszlás paramétereire vonatkozó próbák Az alábbi próbák akkor használhatók, ha a meggyelések függetlenek, és feltételezhetjük, hogy normális eloszlásúak a meggyelések függetlenek, véges szórású eloszlásból származnak, és a minta mérete, azaz n "elég nagy", például n 100 (az átlag a centrális határeloszlástétel alapján közel normális eloszlású) z-próba (vagy u-próba): várható értékre vonatkozó hipotézis esetén, ha a σ szórás ismert t-próba (vagy Student-próba): várható értékre vonatkozó hipotézis esetén, ha a σ szórás nem ismert (csak az sn tapasztalati szórás) F -próba: szórásra vonatkozó hipotézis esetén Kapcsolat a kondenciaintervallummal: egymintás próbánál akkor fogadjuk el a nullhipotézist α terjedelem mellett, ha a benne megadott érték (várható érték vagy szórás) az 1 α megbízhatósági szint kondenciaintervallumba esik.

FisherBartlett-tétel Valójában az eloszlás valódi szórása a legtöbb esetben nem ismert. A σ szórást az sn korrigált tapasztalati szórással helyettesítjük. Kérdés, hogyan változik így az eloszlás. Tétel (FisherBartlett) Tegyük fel, hogy X 1, X 2,..., X n független m várható érték, σ szórású, normális eloszlású valószín ségi változók. Ekkor 1 X N ( m, σ2 n 2 X és s n függetlenek; ), azaz (X m) n/σ eloszlása standard normális; 3 (n 1)sn 2 /σ 2 eloszlása n 1 szabadsági fokú χ 2 -eloszlás; 4 (X m) n/s n eloszlása n 1 szabadsági fokú t-eloszlás. Itt sn = 1 n ) (X j X ) n 2 = n (( 1 1 n 1 n j=1 n j=1 X 2 j ) X 2 ).

Egymintás egyoldali z-próba (one-sample one-sided z test) A próba a normális eloszlás várható értékére vonatkozik ismert szórás mellett. Torzítatlan, konzisztens, leger sebb próba egyoldali esetben (a NeymanPearsonlemma alapján bizonyítható). X 1, X 2,..., X n N(m, σ 2 ), ahol m ismeretlen paraméter, σ > 0 ismert. Próbastatisztika (eloszlása standard normális H 0 mellett, ezt beláttuk): z = X m 0 σ n. Egyoldali ellenhipotézis (one-sided): H 0 : m m 0 ; H 1 : m > m 0. Ha z > Φ 1 (1 α), akkor elvetjük a nullhipotézist, különben elfogadjuk. A p-érték ilyenkor 1 Φ(z). p < 0, 05: a várható érték szignikánsan több m 0 -nál. p 0, 05: a várható érték nem több szignikánsan m 0 -nál.

Az egyoldali z-próba kritikus értéke Az α = 0, 05 terjedelm egyoldali z-próba kritikus értéke: Φ 1 (1 α) = Φ 1 (0, 95) = 1, 645.

Példa: egymintás egyoldali z-próba Feltételezés: a testmagasság normális eloszlású. Az európai férak átlagos testmagassága 177, 6 cm. Megmértük 90 holland fér testmagasságát, a magasságok átlaga 181,7 cm lett. A szórást 8,5 cm-nek feltételezve mondhatjuk-e, hogy a holland férak testmagassága szignikánsan több az európai átlagnál?

Példa: egymintás egyoldali z-próba Feltételezés: a testmagasság normális eloszlású. Az európai férak átlagos testmagassága 177, 6 cm. Megmértük 90 holland fér testmagasságát, a magasságok átlaga 181,7 cm lett. A szórást 8,5 cm-nek feltételezve mondhatjuk-e, hogy a holland férak testmagassága szignikánsan több az európai átlagnál? H 0 : m 177, 6; H 1 : m > 177, 6. z = X m 0 σ n = 181, 7 177, 6 90 = 4, 57. 8, 5 α = 0, 05 terjedelem mellett Φ 1 (1 α) = 1, 645, így z > Φ 1 (1 α). p-érték: 1 Φ(4, 57) < 0, 0001 < 0, 05. Elutasítjuk a nullhipotézist. Az adatok alapján a holland férak testmagasságának várható értéke szignikánsan több 177,6 cm-nél, vagyis az európai átlagnál.

Egymintás kétoldali z-próba A próba a normális eloszlás várható értékére vonatkozik ismert szórás mellett. Nem leger sebb (nincs leger sebb próba ebben a feladatban). X 1, X 2,..., X n N(m, σ 2 ), ahol m ismeretlen paraméter, σ > 0 ismert. Próbastatisztika (eloszlása standard normális H 0 mellett): z = X m 0 σ n. Kétoldali ellenhipotézis (two-sided): H 0 : m = m 0 ; H 1 : m m 0. Ha z > Φ 1 (1 α/2), akkor elvetjük a nullhipotézist, különben elfogadjuk. A p-érték ilyenkor 2 2Φ( z ). Φ a standard normális eloszlásfüggvény: Φ(t) = t 1 2π e x2 /2 dx. p < 0, 05: a várható érték szignikánsan eltér m 0 -tól. p 0, 05: nincs szignikáns eltérés m 0 -tól.

A kétoldali z-próba kritikus értéke Az α = 0, 05 terjedelm kétoldali z-próba kritikus értéke: Φ 1 (1 α/2) = Φ 1 (0, 975) = 1, 96.

Példa: egymintás z-próba Egy gyárban a min ségellen rzésnél azt feltételezik, hogy egy bizonyos típusú kalapács fejének a tömegét mérve a mérési eredmények független normális eloszlású valószín ségi változók m várható értékkel és σ = 3 gramm szórással. A termékkatalógus szerint egy adott típusú kalapács fejének 364 g tömeg nek kell lennie. A fenti eljárással megmérték 20 kalapács fejének tömegét. Az átlag 367,2 gramm lett. Ez alapján állítható-e, hogy a kalapácsok fejének tömege szigni- kánsan eltér az el írt 364 grammtól?

Példa: egymintás z-próba Egy gyárban a min ségellen rzésnél azt feltételezik, hogy egy bizonyos típusú kalapács fejének a tömegét mérve a mérési eredmények független normális eloszlású valószín ségi változók m várható értékkel és σ = 3 gramm szórással. A termékkatalógus szerint egy adott típusú kalapács fejének 364 g tömeg nek kell lennie. A fenti eljárással megmérték 20 kalapács fejének tömegét. Az átlag 367,2 gramm lett. Ez alapján állítható-e, hogy a kalapácsok fejének tömege szigni- kánsan eltér az el írt 364 grammtól? H 0 : m = 364; H 1 : m 364. z = X m 0 σ n = 367, 2 364 20 = 4, 77. 3 α = 0, 05 terjedelem mellett Φ 1 (1 α/2) = 1, 96. p = 1, 84 10 6 < 0, 05. z < Φ 1 (1 α/2), elutasítjuk a nullhipotézist. A kalapácsok fejének tömegének várható értéke a minta alapján szignikánsan eltér az el írt 364 grammtól.

t-eloszlás egyoldali kritikus értékei Az f = 9 szabadsági fokú α = 0, 05 terjedelm egyoldali t-próba kritikus értéke: t 9,0,05 = 1, 83.

Egymintás egyoldali t-próba (one-sample one-sided t-test) A normális eloszlás várható értékére, ismeretlen szórás esetén leger sebb próba. X 1, X 2,..., X n N(m, σ 2 ), ahol m, σ ismeretlen paraméterek. Próbastatisztika, aminek eloszlása t-eloszlás H 0 mellett a FisherBartlett-tétel szerint: t = X m 0 sn n. Egyoldali ellenhipotézis (one-sided): H 0 : m m 0 ; H 1 : m > m 0. Ha t > t n 1,α, azaz p < α, elutasítjuk a nullhipotézist; ilyenkor a várható érték szignikánsan több m 0 -nál. Ha t t n 1,α, azaz p α, elfogadjuk a nullhipotézist, a várható érték nem több szignikánsan m 0 -nál az adatok alapján. A kritikus érték: t n 1,α az f = n 1 szabadsági fokú (degree of freedom) t-eloszlás 1 α-kvantilise, vagyis az f = n 1 szabadsági fokú egyoldali t-próba kritikus értéke α terjedelem (level of signicance) mellett.

Egymintás t-próba, fordított irányú ellenhipotézis A normális eloszlás várható értékére vonatkozik ismeretlen szórás esetén. X 1, X 2,..., X n N(m, σ 2 ), ahol m, σ ismeretlen paraméterek. Próbastatisztika (eloszlása t-eloszlás H 0 mellett): t = X m 0 s n n. Egyoldali ellenhipotézis: H 0 : m m 0 ; H 1 : m < m 0. Ha t < t n 1,α, akkor elvetjük a nullhipotézist, különben elfogadjuk. A kritikus érték: t n 1,α az f = n 1 szabadsági fokú t-eloszlás α-kvantilise, vagyis az a szám, melyre az alábbi teljesül: ( Z 0 α = P(Y t n 1,α ) = P t n 1,α ), Z1 2 +... + Z n 1 2 ahol Z 0, Z 1,..., Z n 1 független standard normális eloszlásúak. p < 0, 05: a várható érték szignikánsan kisebb m 0 -nál.

Példa: egymintás egyoldali t-próba Egy adott helyen vett tíz mintából megmértük az ivóvíz keménységét. Az alábbi eredmények adódtak (mg/l CaO): 351 370 352 340 362 363 366 355 374 347 Állíthatjuk-e az adatok alapján, hogy az ivóvíz keménységének várható értéke szignikánsan meghaladja a 350 mg/l egészségügyi határértéket?

Példa: egymintás egyoldali t-próba Egy adott helyen vett tíz mintából megmértük az ivóvíz keménységét. Az alábbi eredmények adódtak (mg/l CaO): 351 370 352 340 362 363 366 355 374 347 Állíthatjuk-e az adatok alapján, hogy az ivóvíz keménységének várható értéke szignikánsan meghaladja a 350 mg/l egészségügyi határértéket? n = 10; X = 358; s n = 10, 77 Feltételezzük, hogy a mérési eredmények normális eloszlásúak, az egymintás egyoldali t-próbát alkalmazzuk: H 0 : m 50; H 1 : m > 50. t = X m 0 s n n = 358 350 10 = 2, 35. 10, 77 Az f = n 1 = 9 szabadsági fokú egyoldali t-próba kritikus értéke α = 0, 05 szignikanciaszint (terjedelem) mellett t 9;0,05 = 1, 833.

Példa: egymintás egyoldali t-próba Egy adott helyen vett tíz mintából megmértük az ivóvíz keménységét. Az alábbi eredmények adódtak (mg/l CaO): 351 370 352 340 362 363 366 355 374 347 Állíthatjuk-e az adatok alapján, hogy az ivóvíz keménységének várható értéke szignikánsan meghaladja a 350 mg/l egészségügyi határértéket? n = 10; X = 358; s n = 10, 77 Feltételezzük, hogy a mérési eredmények normális eloszlásúak, az egymintás egyoldali t-próbát alkalmazzuk: H 0 : m 50; H 1 : m > 50. t = X m 0 s n n = 358 350 10 = 2, 35. 10, 77 Az f = n 1 = 9 szabadsági fokú egyoldali t-próba kritikus értéke α = 0, 05 szignikanciaszint (terjedelem) mellett t 9;0,05 = 1, 833. Mivel t > t 9;0,05, elutasítjuk a nullhipotézist, a vízkeménység szignikánsan meghaladja 350 mg/l határértéket. A p-érték: p = 0, 0217 < 0, 05.

Hipotézisvizsgálat: példa az R szoftverben Tíz mintából mértük meg a víz keménységét. Nullhipotézis (null hypothesis, H 0 ): m 350 Ellenhipotézis (alternative hypothesis, H 1 ): m > 350 > viz<-c(348, 367, 349, 337, 359, 360, 363, 352, 371, 344) > t.test(viz, mu=350, alternative="greater")

Hipotézisvizsgálat: példa az R szoftverben Tíz mintából mértük meg a víz keménységét. Nullhipotézis (null hypothesis, H 0 ): m 350 Ellenhipotézis (alternative hypothesis, H 1 ): m > 350 > viz<-c(348, 367, 349, 337, 359, 360, 363, 352, 371, 344) > t.test(viz, mu=350, alternative="greater") One Sample t-test data: viz t = 2.3489, df = 9, p-value = 0.02169 alternative hypothesis: true mean is greater than 350 95 percent confidence interval: 351.7566 Inf mean of x : 358 Most p = 0.02169 < 0, 05 = α, elutasítjuk a nullhipotézist.

Egymintás kétoldali t-próba (one-sample two-sided t-test) A normális eloszlás várható értékére, ismeretlen szórás esetén. leger sebb (nincs ilyen). X 1, X 2,..., X n N(m, σ 2 ), ahol m, σ ismeretlen paraméterek. Próbastatisztika (eloszlása t-eloszlás/student-eloszlás H 0 mellett): Nem t = X m 0 s n n. Kétoldali ellenhipotézis (two-sided): H 0 : m = m 0 ; H 1 : m m 0. Ha t > t n 1,α, azaz p < α, akkor elutasítjuk a nullhipotézist, a várható érték szignikánsan eltér m 0 -tól. Ha t t n 1,α, azaz p α, akkor elfogadjuk H 0 -t, a várható érték nem tér el szignikánsan m 0 -tól. A kritikus érték: t n 1,α az f = n 1 szabadsági fokú (degree of freedom) t-eloszlás 1 α/2-kvantilise, vagyis az f = n 1 szabadsági fokú (degree of freedom) kétoldali t-próba kritikus értéke α terjedelem (level of signicance) mellett.

Kétoldali t-próba kritikus értékei Az f = 29 szabadsági fokú α = 0, 05 terjedelm kétoldali t-próba kritikus értéke: t 29;0,05 = 2, 04.

Példa: Egymintás kétoldali t-próba Egy gyógyszer hatóanyagtartalma a csomagolás szerint 10 mg. Harminc tabletta hatóanyag-tartalmát megmérve a mérések átlaga 9, 8, korrigált tapasztalati szórása 0, 62 lett. A szignikanciaszintet α = 0, 05-nek választva az adatok alapján szignikánsan eltér-e a hatóanyag-tartalom várható értéke a 10 mg-tól?

Példa: Egymintás kétoldali t-próba Egy gyógyszer hatóanyagtartalma a csomagolás szerint 10 mg. Harminc tabletta hatóanyag-tartalmát megmérve a mérések átlaga 9, 8, korrigált tapasztalati szórása 0, 62 lett. A szignikanciaszintet α = 0, 05-nek választva az adatok alapján szignikánsan eltér-e a hatóanyag-tartalom várható értéke a 10 mg-tól? n = 30; X = 9, 8; s n = 0, 62 Egymintás kétoldali t-próbát végezhetünk, normális eloszlást feltételezve. H 0 : m = 10; H 1 : m 10; α = 0, 05; f = n 1 = 29. t = X m 0 s n n = 9, 8 10 0, 62 30 = 1, 77. A kritikus érték: t 29,0,05 = 2, 045 t = 1, 77 2, 045, nincs szignikáns eltérés. p-érték: p = 0, 0867 0, 05.

Kétmintás, egyoldali, párosítatlan Student-féle t-próba A várható érték összehasonlítására azonos szórás esetén (two-sample one-sided unpaired Student t-test). X 1,..., X n1, Y 1,..., Y n2 független normális eloszlású azonos szórású valószín ségi változók: X i N(m 1, σ 2 ), Y i N(m 2, σ 2 ), ahol m 1, m 2, σ ismeretlen paraméterek. Egyoldali ellenhipotézis: H 0 : m 1 m 2 ; H 1 : m 1 > m 2.

Kétmintás, egyoldali, párosítatlan Student-féle t-próba A várható érték összehasonlítására azonos szórás esetén (two-sample one-sided unpaired Student t-test). X 1,..., X n1, Y 1,..., Y n2 független normális eloszlású azonos szórású valószín ségi változók: X i N(m 1, σ 2 ), Y i N(m 2, σ 2 ), ahol m 1, m 2, σ ismeretlen paraméterek. Egyoldali ellenhipotézis: H 0 : m 1 m 2 ; H 1 : m 1 > m 2. Próbastatisztika (eloszlása t-eloszlás m 1 = m 2 mellett): X Y t = (n1 1)sn 2 1 (X ) + (n 2 1)sn 2 2 (Y ) n 1 n 2 (n 1 + n 2 2). n 1 + n 2 Ha t > t n1+n2 2, 1 α, akkor elvetjük a nullhipotézist, különben elfogadjuk. A t n1+n2 2, 1 α kritikus érték az f = n 1 + n 2 2 szabadsági fokú egyoldali t-próba kritikus értéke α terjedelem mellett (a megfelel eloszlás 1 α-kvantilise). Ha p < α: elvetjük H 0 -t, az els várható érték szignikánsan nagyobb a másodiknál.

Kétmintás t-próba: példa Két különböz márkájú vaj tömegét mértük meg, az X típusúét tízszer, az Y típusúét nyolcszor. Az Az átlagok és korrigált tapasztalati szórások (kg-ban): X = 0, 217, s n (X ) = 0, 027, Y = 0, 203, s n (Y ) = 0, 03. Állíthatjuk-e α = 0, 05 szignikanciaszint mellett, hogy az X típusú vajak tömege szignikánsan több az Y típusú vajénál?

Kétmintás t-próba: példa Két különböz márkájú vaj tömegét mértük meg, az X típusúét tízszer, az Y típusúét nyolcszor. Az Az átlagok és korrigált tapasztalati szórások (kg-ban): X = 0, 217, s n (X ) = 0, 027, Y = 0, 203, s n (Y ) = 0, 03. Állíthatjuk-e α = 0, 05 szignikanciaszint mellett, hogy az X típusú vajak tömege szignikánsan több az Y típusú vajénál? t = Behelyettesítve: X Y (n1 1)sn 2 1 (X ) + (n 2 1)sn 2 2 (Y ) n 1 n 2 (n 1 + n 2 2). n 1 + n 2 t = 0, 217 0, 203 80 16 9 0, 0272 + 7 0, 03 = 1, 04. 2 18

Kétmintás t-próba: példa Két különböz márkájú vaj tömegét mértük meg, az X típusúét tízszer, az Y típusúét nyolcszor. Az Az átlagok és korrigált tapasztalati szórások (kg-ban): X = 0, 217, s n (X ) = 0, 027, Y = 0, 203, s n (Y ) = 0, 03. Állíthatjuk-e α = 0, 05 szignikanciaszint mellett, hogy az X típusú vajak tömege szignikánsan több az Y típusú vajénál? H 0 : m 1 m 2, H 1 : m 1 > m 2 A próbastatisztika értéke: t = 1, 04. Az f = n 1 + n 2 2 = 10 + 8 2 = 16 szabadsági fokú egyoldali t-próba kritikus értéke α = 0, 05 szignikanciaszint (terjedelem) mellett: t 16,0,95 = 1, 746.

Kétmintás t-próba: példa Két különböz márkájú vaj tömegét mértük meg, az X típusúét tízszer, az Y típusúét nyolcszor. Az Az átlagok és korrigált tapasztalati szórások (kg-ban): X = 0, 217, s n (X ) = 0, 027, Y = 0, 203, s n (Y ) = 0, 03. Állíthatjuk-e α = 0, 05 szignikanciaszint mellett, hogy az X típusú vajak tömege szignikánsan több az Y típusú vajénál? H 0 : m 1 m 2, H 1 : m 1 > m 2 A próbastatisztika értéke: t = 1, 04. Az f = n 1 + n 2 2 = 10 + 8 2 = 16 szabadsági fokú egyoldali t-próba kritikus értéke α = 0, 05 szignikanciaszint (terjedelem) mellett: t 16,0,95 = 1, 746. Itt t = 1, 04 < 1, 746 = t 16,0,95, ezért elfogadjuk H 0 -t. Az X típusú vaj tömege nem haladja meg szignikánsan az Y típusúét. p-érték: 0,149>0,05

Kétmintás t-próba: ugyanez a példa Excelben

Kétmintás t-próba: példa Kétféle joghurt cukortartalmát szeretnénk összehasonlítani. Az els b l n 1 = 20, a másodikból n 2 = 12 dobozban mértük meg a cukortartalmat (grammban). Az átlagok és korrigált tapasztalati szórások grammban számolva (X 1,..., X 20 az els minta, Y 1,..., Y 12 a második): X = 18, 4, s n (X ) = 1, 2, Y = 19, 9, s n (Y ) = 1, 3. Állíthatjuk-e α = 0, 05 szignikanciaszint mellett, hogy a kétféle joghurtban szignikánsan eltér a cukortartalom?

Kétmintás, kétoldali, párosítatlan Student-féle t-próba A várható érték összehasonlítására azonos szórás esetén (two-sample two-sided unpaired Student t-test). X 1,..., X n1, Y 1,..., Y n2 független normális eloszlású azonos szórású valószín ségi változók: X i N(m 1, σ 2 ), Y i N(m 2, σ 2 ), ahol m 1, m 2, σ ismeretlen paraméterek. Kétoldali ellenhipotézis: H 0 : m 1 = m 2 ; H 1 : m 1 m 2.

Kétmintás, kétoldali, párosítatlan Student-féle t-próba A várható érték összehasonlítására azonos szórás esetén (two-sample two-sided unpaired Student t-test). X 1,..., X n1, Y 1,..., Y n2 független normális eloszlású azonos szórású valószín ségi változók: X i N(m 1, σ 2 ), Y i N(m 2, σ 2 ), ahol m 1, m 2, σ ismeretlen paraméterek. Kétoldali ellenhipotézis: H 0 : m 1 = m 2 ; H 1 : m 1 m 2. Próbastatisztika (eloszlása t-eloszlás H 0 mellett): X Y t = (n1 1)sn 2 1 (X ) + (n 2 1)sn 2 2 (Y ) n 1 n 2 (n 1 + n 2 2). n 1 + n 2 Ha t > t n1+n 2 2,1 α, akkor elutasítjuk a nullhipotézist, különben elfogadjuk. A t n1+n 2 2,1 α kritikus érték az f = n 1 + n 2 2 szabadsági fokú kétoldali t-próba kritikus értéke α terjedelem mellett (a megfelel eloszlás 1 α/2-kvantilise). Ha p < α: elvetjük H 0 -t, az várható értékek szignikánsan eltérnek egymástól.

Kétmintás t-próba: példa Kétféle joghurt cukortartalmát szeretnénk összehasonlítani. Az els b l n 1 = 20, a másodikból n 2 = 12 dobozban mértük meg a cukortartalmat (grammban). Az átlagok és korrigált tapasztalati szórások grammban számolva (X 1,..., X 20 az els minta, Y 1,..., Y 12 a második): X = 18, 4, sn (X ) = 1, 2, Y = 19, 9, sn (Y ) = 1, 3. Állíthatjuk-e α = 0, 05 szignikanciaszint mellett, hogy a kétféle joghurtban szignikánsan eltér a cukortartalom? Feltételezzük, hogy a minták függetlenek, normális eloszlásúak, azonos szórásúak.

Kétmintás t-próba: példa Kétféle joghurt cukortartalmát szeretnénk összehasonlítani. Az els b l n 1 = 20, a másodikból n 2 = 12 dobozban mértük meg a cukortartalmat (grammban). Az átlagok és korrigált tapasztalati szórások grammban számolva (X 1,..., X 20 az els minta, Y 1,..., Y 12 a második): X = 18, 4, s n (X ) = 1, 2, Y = 19, 9, s n (Y ) = 1, 3. Állíthatjuk-e α = 0, 05 szignikanciaszint mellett, hogy a kétféle joghurtban szignikánsan eltér a cukortartalom? Feltételezzük, hogy a minták függetlenek, normális eloszlásúak, azonos szórásúak. t = Behelyettesítve: X Y (n1 1)sn 2 1 (X ) + (n 2 1)sn 2 2 (Y ) n 1 n 2 (n 1 + n 2 2). n 1 + n 2 t = 18, 4 19, 9 20 12 30 19 1, 22 + 11 1, 3 = 3, 3. 2 32

Kétmintás t-próba: példa Kétféle joghurt cukortartalmát szeretnénk összehasonlítani. Az els b l n 1 = 20, a másodikból n 2 = 12 dobozban mértük meg a cukortartalmat (grammban). Az átlagok és korrigált tapasztalati szórások grammban számolva (X 1,..., X 20 az els minta, Y 1,..., Y 12 a második): X = 18, 4, s n (X ) = 1, 2, Y = 19, 9, s n (Y ) = 1, 3. Állíthatjuk-e α = 0, 05 szignikanciaszint mellett, hogy a kétféle joghurtban szignikánsan eltér a cukortartalom? Feltételezzük, hogy a minták függetlenek, normális eloszlásúak, azonos szórásúak. H 0 : m 1 = m 2, H 1 : m 1 m 2 A próbastatisztika értéke: t = 3, 3. Az f = n 1 + n 2 2 = 20 + 12 2 = 30 szabadsági fokú kétoldali t-próba kritikus értéke α = 0, 05 szignikanciaszint (terjedelem) mellett: t 16,0,95 = 2, 042.

Kétmintás t-próba: példa Kétféle joghurt cukortartalmát szeretnénk összehasonlítani. Az els b l n 1 = 20, a másodikból n 2 = 12 dobozban mértük meg a cukortartalmat (grammban). Az átlagok és korrigált tapasztalati szórások grammban számolva (X 1,..., X 20 az els minta, Y 1,..., Y 12 a második): X = 18, 4, s n (X ) = 1, 2, Y = 19, 9, s n (Y ) = 1, 3. Állíthatjuk-e α = 0, 05 szignikanciaszint mellett, hogy a kétféle joghurtban szignikánsan eltér a cukortartalom? Feltételezzük, hogy a minták függetlenek, normális eloszlásúak, azonos szórásúak. H 0 : m 1 = m 2, H 1 : m 1 m 2 A próbastatisztika értéke: t = 3, 3. Az f = n 1 + n 2 2 = 20 + 12 2 = 30 szabadsági fokú kétoldali t-próba kritikus értéke α = 0, 05 szignikanciaszint (terjedelem) mellett: t 16,0,95 = 2, 042. Itt t = 3, 3 > 2, 042 = t 30,0,975, ezért elutasítjuk H 0 -t. cukortartalma szignikánsan különböz A kétféle joghurt

Kétmintás t-próba: példa Kétféle joghurt cukortartalmát szeretnénk összehasonlítani. Az els b l n 1 = 20, a másodikból n 2 = 12 dobozban mértük meg a cukortartalmat (grammban). Az átlagok és korrigált tapasztalati szórások grammban számolva (X 1,..., X 20 az els minta, Y 1,..., Y 12 a második): X = 18, 4, s n (X ) = 1, 2, Y = 19, 9, s n (Y ) = 1, 3. Állíthatjuk-e α = 0, 05 szignikanciaszint mellett, hogy a kétféle joghurtban szignikánsan eltér a cukortartalom? Feltételezzük, hogy a minták függetlenek, normális eloszlásúak, azonos szórásúak. H 0 : m 1 = m 2, H 1 : m 1 m 2 A próbastatisztika értéke: t = 3, 3. Az f = n 1 + n 2 2 = 20 + 12 2 = 30 szabadsági fokú kétoldali t-próba kritikus értéke α = 0, 05 szignikanciaszint (terjedelem) mellett: t 16,0,95 = 2, 042. Itt t = 3, 3 > 2, 042 = t 30,0,975, ezért elutasítjuk H 0 -t. A kétféle joghurt cukortartalma szignikánsan különböz ha a szórások azonosak, és a próba alkalmazható (ezt eddig feltettük).

Normális eloszlásra vonatkozó kétmintás próbák Az alábbiakat kell ellen rizni kétmintás próbáknál: A minta normális eloszlású, vagy a mintaelemszám elég nagy (a centrális határeloszlástétel alapján az átlag közel normális eloszlású).

Normális eloszlásra vonatkozó kétmintás próbák Az alábbiakat kell ellen rizni kétmintás próbáknál: A minta normális eloszlású, vagy a mintaelemszám elég nagy (a centrális határeloszlástétel alapján az átlag közel normális eloszlású). Kétmintás esetben: a két minta egymástól független (unpaired eset). Ha a két minta természetes módon párosítható, párosított (paired) próba alkalmazható. Példa: megmérjük húsz ember vérnyomását egy adott napon reggel és este. Igaz-e, hogy a reggeli érték jelent sen eltér az estit l? Ha a szórásokról feltételezhetjük, hogy megegyeznek: a Student-féle t- próba alkalmazható. Ha a szórásokról nem tételezhetjük fel, hogy megegyeznek: a Welch-féle t-próba alkalmazható.

Példa: párosított t-próba 1991 és 2010 között feljegyezték az éves csapadékösszeget Budapesten, illetve Szegeden. Az átlag Budapesten 533 mm, a korrigált tapasztalati szórás 139, Szegeden az átlag 540 mm, a korrigált tapasztalati szórás 143 lett (forrás: OMSZ). Állíthatjuk-e, hogy Szegeden szignikánsan nagyobb a csapadékmennyiség várható értéke? év 1991 1992 1993 1994 1995... átlag sn Budapest 594 364 505 481 575... 533 139 Szeged 617 457 408 399 562... 540 143

Példa: párosított t-próba 1991 és 2010 között feljegyezték az éves csapadékösszeget Budapesten, illetve Szegeden. Az átlag Budapesten 533 mm, a korrigált tapasztalati szórás 139, Szegeden az átlag 540 mm, a korrigált tapasztalati szórás 143 lett (forrás: OMSZ). Állíthatjuk-e, hogy Szegeden szignikánsan nagyobb a csapadékmennyiség várható értéke? év 1991 1992 1993 1994 1995... átlag sn Budapest 594 364 505 481 575... 533 139 Szeged 617 457 408 399 562... 540 143 A két adatsor nem független, mert egy éven belül a két város id járása nem független (az egyes minták sem teljesen függetlenek, és nem biztos, hogy normális eloszlásúak). Ezért párosított (paired) t-próba alkalmazható, egyoldali nullhipotézissel. H 0 : m 1 m 2, H 1 : m 1 < m 2, ahol m 1 a budapesti, m 2 a szegedi csapadékmennyiség várható értéke.

Példa: párosított t-próba 1991 és 2010 között feljegyezték az éves csapadékösszeget Budapesten, illetve Szegeden. Az átlag Budapesten 533 mm, a korrigált tapasztalati szórás 139, Szegeden az átlag 540 mm, a korrigált tapasztalati szórás 143 lett (forrás: OMSZ). Állíthatjuk-e, hogy Szegeden szignikánsan nagyobb a csapadékmennyiség várható értéke? év 1991 1992 1993 1994 1995... átlag sn Budapest 594 364 505 481 575... 533 139 Szeged 617 457 408 399 562... 540 143 A két adatsor nem független, mert egy éven belül a két város id járása nem független (az egyes minták sem teljesen függetlenek, és nem biztos, hogy normális eloszlásúak). Ezért párosított (paired) t-próba alkalmazható, egyoldali nullhipotézissel. H 0 : m 1 m 2, H 1 : m 1 < m 2, ahol m 1 a budapesti, m 2 a szegedi csapadékmennyiség várható értéke. A próbát elvégezve a p-értékre 0, 366 adódott.

Példa: párosított t-próba 1991 és 2010 között feljegyezték az éves csapadékösszeget Budapesten, illetve Szegeden. Az átlag Budapesten 533 mm, a korrigált tapasztalati szórás 139, Szegeden az átlag 540 mm, a korrigált tapasztalati szórás 143 lett (forrás: OMSZ). Állíthatjuk-e, hogy Szegeden szignikánsan nagyobb a csapadékmennyiség várható értéke? év 1991 1992 1993 1994 1995... átlag sn Budapest 594 364 505 481 575... 533 139 Szeged 617 457 408 399 562... 540 143 A két adatsor nem független, mert egy éven belül a két város id járása nem független (az egyes minták sem teljesen függetlenek, és nem biztos, hogy normális eloszlásúak). Ezért párosított (paired) t-próba alkalmazható, egyoldali nullhipotézissel. H 0 : m 1 m 2, H 1 : m 1 < m 2, ahol m 1 a budapesti, m 2 a szegedi csapadékmennyiség várható értéke. A próbát elvégezve a p-értékre 0, 366 adódott. Elfogadjuk a nullhipotézist, az adatok alapján Szegeden nem több szignikánsan a csapadékmennyiség várható értéke, mint Budapesten.

Welsh-féle t-próba A várható érték összehasonlítására párosítatlan esetben (two-sample two-sided unpaired Welch t-test). Legyenek X 1,..., X n1, Y 1,..., Y n2 független normális eloszlású valószín ségi változók: X i N(m 1, σ2 2), Y i N(m 2, σ2 2 ), ahol m 1, m 2, σ 1, σ 2 ismeretlen paraméterek. Kétoldali ellenhipotézis: H 0 : m 1 = m 2 ; H 1 : m 1 m 2. Próbastatisztika: t = X Y s 2 n 1 (X ) n 1. + s 2 n 2 (Y ) n 2 Ha t > t f,1 α, akkor elvetjük a nullhipotézist, különben elfogadjuk. A t f,1 α kritikus érték az f szabadsági fokú kétoldali t-próba kritikus értéke α terjedelem mellett (a megfelel eloszlás 1 α/2-kvantilise). Szabadsági fok: f s 2 n 1 (X ) n 1 s 4 n 1 (X ) n 2 1 (n1 1) + + s 2 n 2 (Y ) n 2. s 4 n 2 (Y ) n2 2(n2 1) Ha p < α: elvetjük H 0 -t, az várható értékek szignikánsan eltérnek egymástól.

F -próba Független normális eloszlású minták szórásának összehasonlítására. Legyenek most X 1, X 2,..., X n1, Y 1,..., Y n2 független normális eloszlású valószín ségi változók, ahol X i N(m 1, σ 2 1 ), Y i N(m 2, σ 2 2 ). Itt m 1, m 2, σ 1, σ 2 ismeretlen paraméterek. Kétoldali ellenhipotézis: H 0 : σ 1 = σ 2 ; H 1 : σ 1 σ 2. Próbastatisztika (eloszlása F -eloszlás H 0 mellett): F = s 2 n 1. sn 2 2 Ha F > F n1 1,n 2 1 vagy 1/F > F n2 1,n 1 1, akkor elvetjük a nullhipotézist, különben elfogadjuk, ahol F f1,f 2 az f 1, f 2 szabadsági fokú az F -eloszlás 1 α/2- kvantilise. p < 0, 05: a szórások szignikánsan eltérnek.

Az F -próba kritikus értéke Az F -próba kritikus értéke: F 19,11 = 3, 24, ez az eloszlás 1 α/2 = 0, 975-kvantilise

Kétmintás F -próba: példa Kétféle joghurt cukortartalmát szeretnénk összehasonlítani. Az els b l n 1 = 20, a másodikból n 2 = 12 dobozban mértük meg a cukortartalmat (grammban). Az átlagok és korrigált tapasztalati szórások (X 1,..., X 20 az els minta, Y 1,..., Y 12 a második): X = 18, 4, s n (X ) = 1, 2, Y = 19, 9, s n (Y ) = 1, 3. Állíthatjuk-e α = 0, 05 szignikanciaszint mellett, hogy a kétféle joghurtban szigni- kánsan eltér a cukortartalom szórása? Feltételezzük, hogy a minták függetlenek, normális eloszlásúak.

Kétmintás F -próba: példa Kétféle joghurt cukortartalmát szeretnénk összehasonlítani. Az els b l n 1 = 20, a másodikból n 2 = 12 dobozban mértük meg a cukortartalmat (grammban). Az átlagok és korrigált tapasztalati szórások (X 1,..., X 20 az els minta, Y 1,..., Y 12 a második): X = 18, 4, s n (X ) = 1, 2, Y = 19, 9, s n (Y ) = 1, 3. Állíthatjuk-e α = 0, 05 szignikanciaszint mellett, hogy a kétféle joghurtban szigni- kánsan eltér a cukortartalom szórása? Feltételezzük, hogy a minták függetlenek, normális eloszlásúak. H 0 : σ 1 = σ 2, H 1 : σ 1 σ 2 A próbastatisztika értéke: F = s 2 n 1 s = 1,22 = 0, 85, és 1 n 2 1,3 2 F = 1,32 = 1, 17. 1,2 2 2 Az (f 1, f 2 ) = (n 1 1, n 2 1) = (19, 11) szabadsági fokú F -próba kritikus értéke α = 0, 05 esetén: 3, 24, míg az (f 2, f 1 ) = (n 2 1, n 1 1) = (11, 19) szabadsági fok esetén 2, 76.

Kétmintás F -próba: példa Kétféle joghurt cukortartalmát szeretnénk összehasonlítani. Az els b l n 1 = 20, a másodikból n 2 = 12 dobozban mértük meg a cukortartalmat (grammban). Az átlagok és korrigált tapasztalati szórások (X 1,..., X 20 az els minta, Y 1,..., Y 12 a második): X = 18, 4, s n (X ) = 1, 2, Y = 19, 9, s n (Y ) = 1, 3. Állíthatjuk-e α = 0, 05 szignikanciaszint mellett, hogy a kétféle joghurtban szigni- kánsan eltér a cukortartalom szórása? Feltételezzük, hogy a minták függetlenek, normális eloszlásúak. H 0 : σ 1 = σ 2, H 1 : σ 1 σ 2 A próbastatisztika értéke: F = s 2 n 1 s = 1,22 = 0, 85, és 1 n 2 1,3 2 F = 1,32 = 1, 17. 1,2 2 2 Az (f 1, f 2 ) = (n 1 1, n 2 1) = (19, 11) szabadsági fokú F -próba kritikus értéke α = 0, 05 esetén: 3, 24, míg az (f 2, f 1 ) = (n 2 1, n 1 1) = (11, 19) szabadsági fok esetén 2, 76. Mivel F < 3, 24 és 1/F < 2, 76, elfogadjuk a nullhipotézist, a szórások nem térnek el szignikánsan, és a kétmintás t-próba valóban alkalmazható.

χ 2 -próba: illeszkedésvizsgálat Legyen A 1, A 2,..., A r teljes eseményrendszer, p 1, p 2,..., p r pedig olyan nemnegatív számok, melyek összege 1. H 0 : P(A k ) = p k minden k = 1, 2,..., r-re. H 1 : P(A k ) p k valamelyik k = 1, 2,..., r-re. n független meggyelést végzünk. N k : hányszor következett be A k. Ha van k, hogy N k < 4: néhány osztályt össze kell vonnunk, hogy a próbát alkalmazhassuk (vagyis A j és A k helyett A j A k -t és p j + p k -t tekintjük). Próbastatisztika: χ 2 = r k=1 (N k n p k ) 2 n p k.

χ 2 -próba Adott (A k ) r k=1 teljes eseményrendszer, és (p k) r k=1 számok: r k=1 p k = 1. H 0 : P(A k ) = p k minden k = 1, 2,..., r-re. Próbastatisztika (feltéve, hogy N k 4 minden k-ra): χ 2 = r k=1 H 1 : a nullhipotézis nem igaz (N k n p k ) 2 n p k.

χ 2 -próba Adott (A k ) r k=1 teljes eseményrendszer, és (p k) r k=1 számok: r k=1 p k = 1. H 0 : P(A k ) = p k minden k = 1, 2,..., r-re. Próbastatisztika (feltéve, hogy N k 4 minden k-ra): χ 2 = r k=1 H 1 : a nullhipotézis nem igaz (N k n p k ) 2 n p k. Legyen c krit az f = r 1 szabadsági fokú χ 2 -próba kritikus értéke α szignikanciaszint mellett. χ 2 > c krit vagy p < α: elutasítjuk H 0 -t, az eloszlás szignikánsan eltér (p k )-tól. χ 2 c krit vagy p α: elfogadjuk H 0 -t, az eloszlás nem tér el szignikánsan (p k )-tól.

χ 2 -próba Adott (A k ) r k=1 teljes eseményrendszer, és (p k) r k=1 számok: r k=1 p k = 1. H 0 : P(A k ) = p k minden k = 1, 2,..., r-re. Próbastatisztika (feltéve, hogy N i 4 minden k-ra): χ 2 = r k=1 H 1 : a nullhipotézis nem igaz (N k n p k ) 2 n p k. Legyen c krit az f = r 1 szabadsági fokú χ 2 -próba kritikus értéke α terjedelem (szignikanciaszint) mellett. Ez az f = r 1 szabadsági fokú χ 2 -eloszlás 1 α-kvantilise, vagyis P(Z 2 1 +... + Z 2 f < c krit ) = 1 α, ahol Z 1,..., Z f független standard normális eloszlású valószín ségi változók.

χ 2 -próba kritikus értéke Az f = 5 szabadsági fokú χ 2 -eloszlás s r ségfüggvénye. Az α = 0, 05 szignikanciaszint próba kritikus értéke: c krit = 11, 1.

χ 2 -próba: példa Dobókockával dobunk százszor. A terjedelmet α = 0, 05-nek választva elfogadhatóe, hogy szabályos a dobókocka?

χ 2 -próba: példa Dobókockával dobunk százszor. A terjedelmet α = 0, 05-nek választva elfogadhatóe, hogy szabályos a dobókocka? érték 1 2 3 4 5 6 gyakoriság 21 11 20 22 11 15

χ 2 -próba: példa Dobókockával dobunk százszor. A terjedelmet α = 0, 05-nek választva elfogadhatóe, hogy szabályos a dobókocka? érték 1 2 3 4 5 6 gyakoriság 21 11 20 22 11 15 Minden szám legalább négyszer el fordult, alkalmazhatjuk a χ 2 -próbát. dobunk, r = 6, p k = 1/6, k = 1, 2,..., 6. A i : i-t H 0 : P(A k ) = 1/6 minden k-ra; H 1 : P(A k ) 1/6 valamelyik k-ra

χ 2 -próba: példa Dobókockával dobunk százszor. A terjedelmet α = 0, 05-nek választva elfogadhatóe, hogy szabályos a dobókocka? érték 1 2 3 4 5 6 gyakoriság 21 11 20 22 11 15 Minden szám legalább négyszer el fordult, alkalmazhatjuk a χ 2 -próbát. dobunk, r = 6, p k = 1/6, k = 1, 2,..., 6. A i : i-t H 0 : P(A k ) = 1/6 minden k-ra; H 1 : P(A k ) 1/6 valamelyik k-ra χ 2 = r k=1 (N k n p k ) 2 (21 100 1/6)2 (11 100 1/6)2 = + n p k 100 1/6 100 1/6 (15 100 1/6)2 +... + = 7, 52. 100 1/6

χ 2 -próba: példa Dobókockával dobunk százszor. A terjedelmet α = 0, 05-nek választva elfogadhatóe, hogy szabályos a dobókocka? érték 1 2 3 4 5 6 gyakoriság 21 11 20 22 11 15

χ 2 -próba: példa Dobókockával dobunk százszor. A terjedelmet α = 0, 05-nek választva elfogadhatóe, hogy szabályos a dobókocka? érték 1 2 3 4 5 6 gyakoriság 21 11 20 22 11 15 H 0 : P(A k ) = 1/6 minden k-ra; H 1 : P(A k ) 1/6 valamelyik k-ra χ 2 = 7, 52; f = r 1 = 5; α = 0, 05; c krit = 11, 1

χ 2 -próba: példa Dobókockával dobunk százszor. A terjedelmet α = 0, 05-nek választva elfogadhatóe, hogy szabályos a dobókocka? érték 1 2 3 4 5 6 gyakoriság 21 11 20 22 11 15 H 0 : P(A k ) = 1/6 minden k-ra; H 1 : P(A k ) 1/6 valamelyik k-ra χ 2 = 7, 52; f = r 1 = 5; α = 0, 05; c krit = 11, 1 χ 2 = 7, 52 < c krit = 11, 1, illetve a p-értékre 0, 1847 > 0, 05. Elfogadjuk H 0 -t, elfogadható, hogy a dobókocka szabályos, nincs szignikáns eltérés az egyenletes eloszlástól.

χ 2 -próba: példa Dobókockával dobunk ezerszer. A terjedelmet α = 0, 05-nek választva elfogadhatóe, hogy szabályos a dobókocka?

χ 2 -próba: példa Ha ezerszer dobunk, és az alábbi eredmények adódnak: érték 1 2 3 4 5 6 gyakoriság 191 154 140 184 156 175 H 0 : P(A k ) = 1/6 minden k-ra; H 1 : P(A k ) 1/6 valamelyik k-ra χ 2 = 11, 68; f = r 1 = 5; α = 0, 05; c krit = 11, 1

χ 2 -próba: példa Ha ezerszer dobunk, és az alábbi eredmények adódnak: érték 1 2 3 4 5 6 gyakoriság 191 154 140 184 156 175 H 0 : P(A k ) = 1/6 minden k-ra; H 1 : P(A k ) 1/6 valamelyik k-ra χ 2 = 11, 68; f = r 1 = 5; α = 0, 05; c krit = 11, 1 χ 2 = 11, 68 > c krit = 11, 1, illetve a p-értékre 0, 039 < 0, 05. Elutasítjuk H 0 -t, nem fogadható el, hogy a dobókocka szabályos, a minta alapján az eloszlás szignikánsan eltér az egyenletes eloszlástól.