Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.



Hasonló dokumentumok
Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Statisztika 1. zárthelyi dolgozat március 18.

6. feladatsor. Statisztika december 6. és 8.

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Statisztika 1. zárthelyi dolgozat március 21.

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

BIOMATEMATIKA ELŐADÁS

A matematikai statisztika elemei

Statisztika. Földtudomány szak, geológus szakirány, 2015/2016. tanév tavaszi

Statisztikai hipotézisvizsgálatok

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk;

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

ezek alapján kívánunk dönteni. Ez formálisan azt jelenti, hogy ellenőrizni akarjuk,

Normális eloszlás paramétereire vonatkozó próbák

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Matematikai statisztika gyakorlat 2018/2019 II. félév

Statisztika elméleti összefoglaló

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Bevezetés a hipotézisvizsgálatokba

Valószín ségszámítás és statisztika

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Matematika B4 I. gyakorlat

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

Hipotézis vizsgálatok

Kutatói pályára felkészítı modul

1. A radioaktivitás statisztikus jellege

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

æ MATEMATIKAI STATISZTIKA Dr. Bolla Marianna, Matematika Intézet, Sztochasztika Tanszék

Matematikai statisztika

Statisztika Elıadások letölthetık a címrıl

Leíró és matematikai statisztika gyakorlat 2018/2019 II. félév

7. el adás Becslések és minta elemszámok fejezet Áttekintés

Statisztika (jegyzet)

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

kritikus érték(ek) (critical value).

Nemparaméteres próbák

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Komputer statisztika

A statisztika részei. Példa:

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

kismintás esetekben vagy olyanokban, melyeknél a tanulóalgoritmust tesztadatokon szeretnénk

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

18. Valószín ségszámítás. (Valószín ségeloszlások, függetlenség. Valószín ségi változók várható

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

VÉLETLENÍTETT ALGORITMUSOK. 1.ea.

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Kidolgozott feladatok a nemparaméteres statisztika témaköréből

Bootstrap (Efron, 1979)

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

Kétoldali hibás Monte Carlo algoritmus: mindkét válasz esetén hibázhat az algoritmus, de adott alsó korlát a hibázás valószínűségére.

[Biomatematika 2] Orvosi biometria

Matematikai statisztika

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Az első számjegyek Benford törvénye

3.1. A Poisson-eloszlás

10.M ALGEBRA < <

Nevezetes sorozat-határértékek

Hipotézis-ellenırzés (Statisztikai próbák)

Statisztika gyakorlat Geológus szakirány

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Áringadozások elıadás Kvantitatív pénzügyek szakirány 2012/13 2. félév

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

Tartalom. Kezdeti szimulációs technikák. Tipikus kérdések. A bootstrap módszer. Bevezetés A független, azonos eloszlású eset:

PÉLDATÁR A SZÁMÍTÓGÉPES TESZTHEZ. Írta Dr. Huzsvai László

Mo= argmax f(x), ha X abszolút folytonos; Mo= argmax P (X = x i ), ha X diszkrét.

Hipotézis vizsgálatok

véletlen : statisztikai törvényeknek engedelmeskedik (Mi az ami közös a népszavazásban, a betegségek gyógyulásában és a fiz. kém. laborban?

Megállapítható változók elemzése Függetlenségvizsgálat, illeszkedésvizsgálat, homogenitásvizsgálat

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Innen. 2. Az. s n = 1 + q + q q n 1 = 1 qn. és q n 0 akkor és csak akkor, ha q < 1. a a n végtelen sor konvergenciáján nem változtat az, ha

2. Hatványsorok. A végtelen soroknál tanultuk, hogy az. végtelen sort adja: 1 + x + x x n +...

Valószín ségszámítás és statisztika gyakorlat Programtervez informatikus szak, esti képzés

A függvénysorozatok olyanok, mint a valós számsorozatok, csak éppen a tagjai nem valós számok,

Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X = 1) = p Ind(p) P(X = 0) = 1 p. Leíró és matematikai statisztika

ANALÍZIS I. TÉTELBIZONYÍTÁSOK ÍRÁSBELI VIZSGÁRA

ALGEBRA. egyenlet megoldásait, ha tudjuk, hogy egész számok, továbbá p + q = 198.

egyetemi jegyzet Meskó Balázs

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya

(d) x 6 3x 2 2 = 0, (e) x + x 2 = 1 x, (f) 2x x 1 = 8, 2(x 1) a 1

1 k < n(1 + log n) C 1n log n, d n. (1 1 r k + 1 ) = 1. = 0 és lim. lim n. f(n) < C 3

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Gyakorló feladatok II.

Statisztikai módszerek 7. gyakorlat

NUMERIKUS SOROK II. Ebben a részben kizárólag a konvergencia vizsgálatával foglalkozunk.

Villamos gépek tantárgy tételei

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

Átírás:

Itervallum Paraméteres Hipotézisek Nemparaméteres Statisztika Hipotézisvizsgálat Székely Balázs 2010. december 2.

Itervallum Paraméteres Hipotézisek Nemparaméteres Előadás vázlat 1 Itervallumbecslések Általáosa Példa 2 Paraméteres próbák Kiidulási példa Várható érték tesztelése, ha a szórás ismert Várható érték tesztelése, ha a szórás ismeretle 3 Hipotézisek fajtái Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák 4 Nemparaméteres próbák Khi égyzet eloszlás Illeszkedés vizsgálat Homogeitás vizsgálat Függetleség vizsgálat

Itervallum Paraméteres Hipotézisek Nemparaméteres Általáosa Példa Itervallumbecslések Egy érték helyett egy itervallumot aduk a paraméter becslésére. Az itervallumbecslés a hipotézisvizsgálat alapja.

Itervallum Paraméteres Hipotézisek Nemparaméteres Általáosa Példa Itervallumbecslések Adott P θ, θ Θ eloszlás család. Adott egy X = (X 1, X 2,...,X ) függetle mita a P θ eloszlásból. Adott a paraméter egy függvéye ψ(θ). Defiíció A (T 1 (X), T 2 (X)) statisztika párral defiiált itervallum legalább 1 ε szitű kofidecia itervvalum a ψ(θ) paraméterre, ha P θ (T 1 (X) < ψ(θ) < T 2 (X)) 1 ε θ Θ, ahol ε > 0 kicsi szám. 1 ε eve kofideciaszit. Ha a P θ -k folytoos eloszások, akkor lehet potosa 1 ε szitű kofideciaitervallumról beszéli: P θ (T 1 (X) < ψ(θ) < T 2 (X)) = 1 ε θ Θ,

Itervallum Paraméteres Hipotézisek Nemparaméteres Általáosa Példa Kofideciaitervallum jeletése Legye most ψ(θ) = θ, tehát a paraméterre kostruáluk egy 95% szitű kofideciaitervallumot: P θ (T 1 (X) < θ < T 2 (X)) = 0, 95 θ Θ, Vegyük agyo sok, modjuk M darab, elemű mitát. Midegyikhez készítsük el a (T 1 (x), T 2 (x)) itervallumot. Ez M darab itervallum. Fotos téy 95%-os kofideciaszit jeletése: az adatsorok 95%-ba (0, 95 M esetbe) θ (T 1 (x), T 2 (x)) viszot az adatsorok 5%-ba θ / (T 1 (x), T 2 (x)).

Itervallum Paraméteres Hipotézisek Nemparaméteres Általáosa Példa Kofideciaitervallum Példa Adott egy 30 elemű mita N(m, 20) eloszlásból: 281, 308, 300, 285, 294, 272, 302, 301, 306, 297, 279, 286, 302, 316, 286, 296, 293, 291, 297, 301, 311, 293, 286, 286, 297, 305, 278, 300, 301, 300. Szerkesszük az ismeretle várható értékre 95% szitű kofideciaitervallumot.

Itervallum Paraméteres Hipotézisek Nemparaméteres Általáosa Példa Kofideciaitervallum A ormális eloszlás várható értékére ismert szórás eseté Legye X 1,...,X N(m, σ 0 ) függetle mita. σ 0 ismert, m ismeretle. Az ismeretle várható értékre szereték 1 ε szitű kofideciaitervallumot szerkesztei. Tudjuk, hogy X torzítatla, kozisztes becslése a várható értékek, m-ek. Mivel a ormális eloszlás szimmetrikus a várható értékre, ezért az itervallumot ) (X r ε, X + r ε alakba keressük. Az 1 ε szit azt jeleti, hogy P m (X r ε < m < X + r ε ) = 1 ε. Alakítsjuk az eseméyt: P m (X ( r ε < m < X + r ε ) = P m ( r ε < X m < r ε ) = P rε m σ 0 < X m σ 0 < r ε ) σ0 = X m σ 0 = X 1 + +X m σ 0 = (X 1 + +X ) m σ0 N(0, 1) ( =Φ rε ) ( σ 0 Φ rε ) ( σ 0 = 2Φ rε ) σ 0 1 = 1 ε Φ ( r ε σ 0 ) = 1 ε 2. Így u ε/2 := Φ 1 ( 1 ε 2 1 ε szitű kofidecia itervallum: ). rε = u ε/2σ 0, tehát az ( ) X u ε/2σ 0, X + u ε/2σ 0

Itervallum Paraméteres Hipotézisek Nemparaméteres Általáosa Példa Kofideciaitervallum Példa Adott egy 30 elemű mita N(m, 20) eloszlásból: 281, 308, 300, 285, 294, 272, 302, 301, 306, 297, 279, 286, 302, 316, 286, 296, 293, 291, 297, 301, 311, 293, 286, 286, 297, 305, 278, 300, 301, 300. Szerkesszük az ismeretle ( várható értékre 95% szitű ) kofideciaitervallumot. X u ε/2σ 0, X + u ε/2σ 0 = 30, ε = 0, 05, σ 0 = 20 X = 295, r ε = σ 0 Φ 1 ( 1 2) ε = 20 30 Φ 1 (0, 975) 7, 16 Tehát: (x 30 r 0,05, x 30 + r 0,05 ) = (295 7, 16, 295 + 7, 16) = (287, 84, 302, 16). A kofideciaitervallum jeletése: a 30 hosszú adatsorok 95%-ába az igazi paraméter beleesik a kofideciaitervallumba, 5%-ába pedig em.

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle Előadás vázlat 1 Itervallumbecslések Általáosa Példa 2 Paraméteres próbák Kiidulási példa Várható érték tesztelése, ha a szórás ismert Várható érték tesztelése, ha a szórás ismeretle 3 Hipotézisek fajtái Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák 4 Nemparaméteres próbák Khi égyzet eloszlás Illeszkedés vizsgálat Homogeitás vizsgálat Függetleség vizsgálat

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle Feladat kitűzése, hipotézisek kostruálása Kiidulási példa Egy fejlesztő azt állítja, hogy új, eergiatakarékos, akkumulátoros fűyírót kostruált, amelyek 5 óráig (300 perc) képesek futi. Eek elleőrzésére 30 tesztet végeztük a futási idők hosszúságára (percbe): 281, 308, 300, 285, 294, 272, 302, 301, 306, 297, 279, 286, 302, 316, 286, 296, 293, 291, 297, 301, 311, 293, 286, 286, 297, 305, 278, 300, 301, 300. Azt feltételezzük, hogy a futási idők ormális eloszlásúak valamilye, ismeretle várható értékkel. Az egyszerűség kedvéért tegyük fel, hogy a szórás ismert, σ 0 = 20 perc. A fejlesztő állítása: a ormális eloszlás várható értéke 300. Azt a hipotézist szereték teszteli, hogy az igazi várható érték, m 300-zal egyelő: H 0 : m = m 0, ahol m 0 := 300. Ha H 0 em igaz, akkor az alteratív hipotézis (vagy más éve ellehipotézis) igaz: H 1 : m m 0 H 0 és H 1 lefedik az összes lehetséges esetet.

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle Dötések, dötések értelmezése Kiidulási példa, kokréta A 30 elemes mita alapjá kell döteük, hogy H 0 igaz, vagy H 1. A dötésél a cél: Ha H 0 -t elutasítjuk, akkor aak jó oka legye. Következésképpe, aak va bizoyító ereje, ha H 0 -t elutasítjuk, és H 1 -et fogadjuk el.

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle Kiidulási példa Legye X 1, X 2,...,X egy függetle mita N(m,σ 0 ) eloszlásból, ahol σ 0 ismert, és m ismeretle paraméter. Miket az m paraméter igazi értéke érdekel. Legye x 1, x 2,..., x a mita megvalósulása. Jelölés: X = (X 1, X 2,...,X ), x = (x 1, x 2,...,x ). Kiválasztuk egy m 0 értéket, és veszük egy elemű mita megvalósulását, x-et az N(m,σ 0 ) eloszlásból. Azt szereték eldötei az x megvalósulás alapjá, hogy az igazi paraméter, m amelyikből a mita geerálódott megegyezik-e m 0 -al az általuk adott értékkel.

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle Dötések, dötések értelmezése Kiidulási példa, kokréta A 30 elemes mita alapjá kell döteük, hogy H 0 igaz, vagy H 1. A dötésél a cél: Ha H 0 -t elutasítjuk, akkor aak jó oka legye. Következésképpe, aak va bizoyító ereje, ha H 0 -t elutasítjuk, és H 1 -et fogadjuk el.

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle Dötés Módszer: 1. lépés: Vegyük egy torzítatla, és kozisztes becslését az m paraméterek. Az x mitaátlag egy ilye becslés. 2. lépés: Kostruáljuk eköré egy 95% szitű kofideciaitervallumot: (x u 95%, x + u 95% ). Ha m 0 (x u 95%, x + u 95% ), akkor elfogadjuk H 0 -t 95%-os szite. Ha m 0 / (x u 95%, x + u 95% ), akkor mit dötsük? Tudjuk, hogy a kofideciaitervallum olya, hogy az x miták 95%-ba az igazi paraméter beleesik, és 5%-ba, pedig em. Ezért két opciók va m 0 /... értelmezésére: 1 Az x miták 5%-ba azért az igazi paraméter em esik bele a kof. itervallumba elképzelhető, hogy m 0 az igazi paraméter, de véletleül em esett bele. 2 m 0 em az igazi paraméter, következésképpe H 0 em igaz. Mivel 1. ige valószíűtle, csak az esetek 5%-ba fordul elő, ezért a 2. potot vesszük következtetések. Tehát: Ha m 0 / (x u 95%, x + u 95% ), akkor elvetjük H 0 -t 95%-os szite.

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle Dötések értelmezése, dötési hibák Eze dötési eljárás alapjá, ha H 0 -t elutasítjuk, akkor aak jó oka va. Következésképpe, aak va bizoyító ereje, ha H 0 -t elutasítjuk, azaz H 1 -et fogadjuk el. Így ha valamit bizoyítai szereték, akkor azt az állítást H 1 -be kell tei. H 0 elfogadásáak ics bizoyító ereje. Lehet, hogy csak azért fogadtuk el H 0 -t, mert ics elég adat. Két hibázás lehet: 1 H 0 teljesül, de elvetjük, ez az elsőfajú hiba, eek valószíűsége ε = 1 (szigifikacia szit). 95%-os szigifikacia szit eseté 5%. 2 H 0 em teljesül, de elfogadjuk, ez a másodfajú hiba.

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle Feladat kitűzése, hipotézisek kostruálása Kiidulási példa megoldása Egy fejlesztő azt állítja, hogy új, eergiatakarékos, akkumulátoros fűyírót kostruált, amelyek 5 óráig (300 perc) képesek futi. Eek elleőrzésére 30 tesztet végeztük a futási idők hosszúságára (percbe): 281, 308, 300, 285, 294, 272, 302, 301, 306, 297, 279, 286, 302, 316, 286, 296, 293, 291, 297, 301, 311, 293, 286, 286, 297, 305, 278, 300, 301, 300. Azt feltételezzük, hogy a futási idők ormális eloszlásúak valamilye, ismeretle várható értékkel. Az egyszerűség kedvéért tegyük fel, hogy a szórás ismert, σ 0 = 20 perc. A fejlesztő állítása: a ormális eloszlás várható értéke 300. Azt a hipotézist szereték teszteli, hogy az igazi várható érték, m 300-zal egyelő: H 0 : m = m 0, ahol m 0 := 300. Ha H 0 em igaz, akkor az alteratív hipotézis (vagy más éve ellehipotézis) igaz: H 1 : m m 0 H 0 és H 1 lefedik az összes lehetséges esetet.

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle A példa megoldása Hipotézisek H 0 : m = m 0, ahol m 0 := 300. H 1 : m m 0 Kofideciaitervallum szerkesztése. Tegyük fel, hogy H 0 teljesül, ekkor X 1,..., X eloszlása N(m 0,σ 0 ). A kofideciaszit 1 ε. = 30, σ 0 = 20, 1 ε = 0, 95 ε = 0, 05. Korábbról tudjuk, hogy a ormális eloszlásra szerkesztett kofideciaitervallum sugara r := σ 0 Φ 1 ( 1 ε 2 ) = 20 30 Φ 1 (0, 975) 7, 16. A megadott adatok átlaga 295. Tehát a kofideciaitervallum: (x 30 r, x 30 + r) = (295 7, 16, 295 + 7, 16) = (287, 84, 302, 16). Eek eleme m 0 = 300, így H 0 -t em tudjuk elutasítai, azaz el kell fogadi a fejlesztő állítását.

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle Formalizálva, teszt statisztikával Legye X 1, X 2,...,X egy függetle mita N(m, σ 0 ) eloszlásból, ahol σ 0 ismert, és m ismeretle paraméter. m 0 adott paraméter. A hipotézisek: H 0 : m = m 0 H 1 : m m 0 Ha H 0 teljesül, azaz X 1, X 2,..., X egy függetle mita N(m 0, σ 0 ) eloszlásból. Ekkor H 0 -t elfogadjuk ( 1 ε szite m 0 X σ 0 Φ ( 1 1 2) ε, X + σ 0 Φ ( ) ) 1 1 ε 2 Φ ( 1 1 2) ε < X m 0 σ 0 < Φ ( ) 1 1 ε 2 X m 0 σ 0 eve: teszt statisztika. Ha H 0 teljesül, akkor X m 0, tehát X m 0 σ 0 értéke 0-hoz közeli. Ha H 0 em teljesül, azaz m m 0, akkor X m m 0 tehát, X m 0 σ 0 értéke -ehz, vagy -hez tart, ha ő. Így egy fix -re akkor utasítjuk el H 0 -t, ha X m 0 σ 0 a teszt statisztika értéke túl agy abszolút értékbe. A határ pot Φ ( 1 1 2) ε.

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle Várható érték tesztelése, ha a szórás ismeretle Legye X 1, X 2,...,X egy függetle mita N(m, σ) eloszlásból, ahol σ és m ismeretle paraméterek. Miket az m paraméter igazi értéke érdekel. Azt szereték teszteli, hogy m az megegyezik-e egy adott m 0 értékkel. A hipotézisek: H 0 : m = m 0 H 1 : m m 0 Ismert szórás eseté X m 0 σ 0 a teszt statisztika. Most a szórás ismeretle. Becsüljük a szórást, vegyük egy torzítatla, kozisztes becslését a szórásak: s = 1 1 i=1 (X i X ) 2. Tekitsük a X m 0 s statisztikát. Ez lesz a teszt statisztika. Ha H 0 teljesül, akkor X m 0, tehát X m 0 s értéke 0-hoz közeli. Ha H 0 em teljesül, azaz m m 0, akkor X m m 0, tehát X m 0 s értéke végtelehez tart, ha ő. Így egy fix -re akkor utasítjuk el H 0 -t, ha X m 0 s a teszt statisztika értéke túl agy abszolút értékbe. Mi az elutasítás határa, a kritikus érték?

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle Várható érték tesztelése, ha a szórás ismeretle t eloszlások Tekitsük a X m 0 s statisztikát. Ez lesz a teszt statisztika. Mi az elutasítás határa, a kritikus érték? Állítás Ha X 1,..., X függetle, azoos, N(m 0, σ) eloszlású (m 0!), akkor X m 0 eloszlásáak eve: s t eloszlás 1 szabadsági fokkal. Mide t eloszlás szimmetrikus. Az eloszlásfüggvéyére, ) X T : x P( m 0 s < x =: T (x) függvéyre táblázat va. 1 ε szigifikacia szitre a kritikus érték, κ kiszámolása: P( κ < X m 0 s < κ) = 1 ε. Tehát a b.o. = T 1 (κ) T 1 ( κ) =, mivel a t eloszlás szimmetrikus, = T 1 (κ) (1 T 1 (κ)) = 2T 1 (κ) 1 = 1 ε. Átredezve: T 1 (κ) = 1 ε/2. κ = T 1 1 (1 ε/2). ÁBRA! Így H 0 -t elfogadjuk 1 ε szite κ < X m 0 s < κ

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle Táblázat t eloszlások farok valószíűségére

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle Példa 6 darab csapágy belső gyűrűjéek átmérőjét mérjük az A és a B mérőműszere. A következő mérési eredméyeket kapjuk: csapágy 1. 2. 3. 4. 5. 6. A műszer 6,0 10,1 8,0 13,0 12,0 9,2 B műszer 6,2 9,9 8,0 12,9 11,7 9,0 (Az adatokat ormális eloszlásból származóak feltételezzük.) Teszteljük, mutat-e a két műszere mért érték 95%-os szite szigifikás eltérést. A külöbségek: -0,2; 0,2; 0; 0,1; 0,3; 0,2. A feladat szerit az szigifikás, ha eltérek. Tehát az eltérést kell a H 1 -be raki. Tehát tegyük fel, hogy a külöbségek N(m, σ) eloszlásból vett függetle miták, ahol σ ismeretle. Így a hipotézisek: H 0 : m = 0 H 1 : m 0

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle Példa (x 1 ;... ; x 6 ) = (-0,2; 0,2; 0; 0,1; 0,3; 0,2). A teszt statisztika t 5 = 6 X 6 0 (m 0 = 0) s 6 x 6 = 0, 1, s6 = 0, 1789. Tehát t 5 = 1, 369. Ezt kell összehasolítai a 95%-os szigifikacia szithez tartozó κ kritikus értékkel: H 0 -t elfogadjuk t 5 < κ. 95% szigifikacia szit eseté ε = 0, 05. Korábbi dia: a kritikus érték κ = T 1 1 5 (1 ε/2) = T5 (0, 975). Így az 5 szabadságfokú t eloszlás 0,025 valószíűségű farkát keressük. A táblázatból T 1 5 (0, 975) = 2, 571. Mivel t 5 = 1, 369 < 2, 571 = κ, ezért em tudjuk elutasítai H 0 -t, azaz em tudjuk bizoyítai, hogy az A és a B gépek külöböző potossággal működéek.

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle Táblázat t eloszlások farok valószíűségére

Itervallum Paraméteres Hipotézisek Nemparaméteres Kiidulás σ ismert σ ismeretle Példa (x 1 ;... ; x 6 ) = (-0,2; 0,2; 0; 0,1; 0,3; 0,2). A teszt statisztika t 5 = 6 X 6 0 (m 0 = 0) s 6 x 6 = 0, 1, s6 = 0, 1789. Tehát t 5 = 1, 369. Ezt kell összehasolítai a 95%-os szigifikacia szithez tartozó κ kritikus értékkel: H 0 -t elfogadjuk t 5 < κ. 95% szigifikacia szit eseté ε = 0, 05. Korábbi dia: a kritikus érték T 1 1 5 (1 ε/2) = T5 (0, 975). Így az 5 szabadságfokú t eloszlás 0,025 valószíűségű farkát keressük. A táblázatból T 1 5 (0, 975) = 2, 571. Mivel t 5 = 1, 369 < 2, 571 = κ, ezért em tudjuk elutasítai H 0 -t, azaz em tudjuk bizoyítai, hogy az A és a B gépek külöböző potossággal működéek.

Itervallum Paraméteres Hipotézisek Nemparaméteres Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák Előadás vázlat 1 Itervallumbecslések Általáosa Példa 2 Paraméteres próbák Kiidulási példa Várható érték tesztelése, ha a szórás ismert Várható érték tesztelése, ha a szórás ismeretle 3 Hipotézisek fajtái Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák 4 Nemparaméteres próbák Khi égyzet eloszlás Illeszkedés vizsgálat Homogeitás vizsgálat Függetleség vizsgálat

Itervallum Paraméteres Hipotézisek Nemparaméteres Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák Egyoldali és kétoldali ellehipotézis 1. példa. 6 darab csapágy belső gyűrűjéek átmérőjét mérjük az A és a B mérőműszere. A következő mérési eredméyeket kapjuk: csapágy 1. 2. 3. 4. 5. 6. A műszer 6,0 10,1 8,0 13,0 12,0 9,2 B műszer 6,2 9,9 8,0 12,9 11,7 9,0 (Az adatokat ormális eloszlásból származóak feltételezzük.) Teszteljük, mutat-e a két műszere mért érték 95%-os szite szigifikás eltérést. 2. példa. Az alábbi két mita 5 autó fogyasztási adatait tartalmazza. Az első sorba a szerviz előtti, a második sorba a szerviz utái értékek találhatók. szerviz előtt 7,9 8,1 8,8 7,2 6,0 szerviz utá 7,5 7,5 8,1 7,2 5,7 Dötsük 95%-os szigifikacia szite, hogy a szerviz csökketette-e a fogyasztást.

Itervallum Paraméteres Hipotézisek Nemparaméteres Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák Kétoldali ellehipotézis 1. példa. 6 darab csapágy belső gyűrűjéek átmérőjét mérjük az A és a B mérőműszere. A következő mérési eredméyeket kapjuk: csapágy 1. 2. 3. 4. 5. 6. A műszer 6,0 10,1 8,0 13,0 12,0 9,2 B műszer 6,2 9,9 8,0 12,9 11,7 9,0 (Az adatokat ormális eloszlásból származóak feltételezzük.) Teszteljük, mutat-e a két műszere mért érték 95%-os szite szigifikás eltérést. Mérések külöbségéről feltételezzük, hogy N(m, σ) eloszlású, ahol m és σ ismeretleek. A hipotézisek: H 0 : m = 0 H 1 : m 0. κ κ Dötés: H 0 -t elfogadjuk t 5 < κ, azaz H 1 -t elfogadjuk κ < t 5 vagy t 5 < κ. kritikus elfogadás kritikus

Itervallum Paraméteres Hipotézisek Nemparaméteres Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák Egyoldali ellehipotézis 2. példa. Az alábbi két mita 5 autó fogyasztási adatait tartalmazza. Az első sorba a szerviz előtti, a második sorba a szerviz utái értékek találhatók. szerviz előtt 7,9 8,1 8,8 7,2 6,0 szerviz utá 7,5 7,5 8,1 7,2 5,7 Dötsük 95%-os szigifikacia szite, hogy a szerviz csökketette-e a fogyasztást. Mérések külöbségéről (utá előtt), -0,4-0,6-0,7 0-0,3 feltételezzük, hogy N(m, σ) eloszlású, ahol m és σ ismeretleek. A hipotézisek: H 0 : m 0 H 1 : m < 0. Szigifikás: a fogyasztás csökket. Dötés: H 0 -t elfogadjuk κ < t 4, kritikus azaz H 1 -t elfogadjuk t 4 < κ. κ elfogadás

Itervallum Paraméteres Hipotézisek Nemparaméteres Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák Egyoldali ellehipotézis A 2. példa megoldása Mivel a szórás ismeretle, t-próbát kell alkalmazi. A próbastatisztika értéke t 4 = 5 x 5 s 5 = 5 0, 4 = 3, 27. 0, 075 A 4 szabdságfokú t eloszlás 95%-os szigifikacia értékhez (= ε = 0, 05 farok valószíűséghez) tartozó kritikus értéke κ = 2, 132. dh Tehát t 4 = 3, 27 < 2, 132 = κ. Így elutasítjuk H 0 -t, azaz a szerviz javított a fogyasztáso. Figyeljük meg, hogy 97,5%-os szite is szigifikás a szerviz hatása, viszot 99%-os szite már em.

Itervallum Paraméteres Hipotézisek Nemparaméteres Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák Egyoldali ellehipotézis A 2. példa megoldása

Itervallum Paraméteres Hipotézisek Nemparaméteres Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák Egyoldali ellehipotézis A 2. példa megoldása Mivel a szórás ismeretle, t-próbát kell alkalmazi. A próbastatisztika értéke t 4 = 5 x 5 s 5 = 5 0, 4 = 3, 27. 0, 075 A 4 szabadságfokú t eloszlás 95%-os szigifikacia értékhez (= ε = 0, 05 farok valószíűséghez) tartozó kritikus értéke κ = 2, 132. κ kritikus elfogadás Tehát t 4 = 3, 27 < 2, 132 = κ. Így elutasítjuk H 0 -t, azaz a szerviz javított a fogyasztáso. Figyeljük meg, hogy 97,5%-os szite is szigifikás a szerviz hatása, viszot 99%-os szite már em.

Itervallum Paraméteres Hipotézisek Nemparaméteres Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák Egyoldali ellehipotézis A 2. példa megoldása, 97,5%, 99% szigifikacia szitek t 4 = 3, 27

Itervallum Paraméteres Hipotézisek Nemparaméteres Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák Egymitás és kétmitás próbák A példa. Az alábbi két mita 5 autó fogyasztási adatait tartalmazza. Az első sorba a szerviz előtti, a második sorba a szervíz utái értékek találhatók. szerviz előtt 7,9 8,1 8,8 7,2 6,0 szerviz utá 7,5 7,5 8,1 7,2 5,7 Dötsük 95%-os szigifikacia szite, hogy a szerviz csökketette-e a fogyasztást. B példa. Az alábbi két mita két külöböző gyáregységbe tapasztalt selejt-aráyra voatkozik (ezrelékbe). Állítható-e 95%-os szigifikacia szite, hogy az A gyáregység jobba dolgozott? A 11,9 12,1 12,8 12,2 12,5 11,9 12,5 11,8 12,4 12,9 B 12,1 12,0 12,9 12,2 12,7 12,6 12,6 12,8 12,0 13,1

Itervallum Paraméteres Hipotézisek Nemparaméteres Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák Egymitás próbák A példa. Az alábbi két mita 5 autó fogyasztási adatait tartalmazza. Az első sorba a szerviz előtti, a második sorba a szervíz utái értékek találhatók. szerviz előtt 7,9 8,1 8,8 7,2 6,0 szerviz utá 7,5 7,5 8,1 7,2 5,7 Dötsük 95%-os szigifikacia szite, hogy a szerviz csökketette-e a fogyasztást. Egymitás, hisze egy miták va a külöbségekre, -0,4-0,6-0,7 0-0,3 N(m, σ) eloszlásból.

Itervallum Paraméteres Hipotézisek Nemparaméteres Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák Kétmitás próbák B példa. Az alábbi két mita két külöböző gyáregységbe tapasztalt selejt-aráyra voatkozik (ezrelékbe). Állítható-e 95%-os szigifikacia szite, hogy az A gyáregység jobba dolgozott? A 11,9 12,1 12,8 12,2 12,5 11,9 12,5 11,8 12,4 12,9 B 12,1 12,0 12,9 12,2 12,7 12,6 12,6 12,8 12,0 13,1 Az első mita: X 1, X 2,..., X 1 az N(m 1,σ 1 ) eloszlásból. A második mita: Y 1, Y 2,..., Y 2 az N(m 2,σ 2 ) eloszlásból. m 1, m 2, σ 1, σ 2 ismeretle paraméterek. Tegyük fel, hogy σ 1 = σ 2 és X i -k függetleek Y j -ktől. A hipotézisek kétoldali ellehipotézis eseté: H 0 : m 1 = m 2 H 1 : m 1 m 2 A hipotézisek egyoldali ellehipotézis eseté (ez kell a B-be): H 0 : m 1 m 2 H 1 : m 1 < m 2 (A-ba kevesebb a selejt)

Itervallum Paraméteres Hipotézisek Nemparaméteres Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák Kétmitás próbák Feltettük, hogy a két mita függetle és a szórásuk ugyaaz. A teszt statisztika X 1 Y 2 t 1 + 2 2 = 1 2 ( 1 + 2 2) ( 1 1)sX 2 + ( 2 1)sY 2 1 + 2 Állítás Ha H 0 teljesül, azaz X i -k és Y j -k ugyaabból az N(m,σ) eloszlásból valók (m = m 1 = m 2 ), akkor t 1 + 2 2 t eloszlású 1 + 2 + 2 szabadsági fokkal.

Itervallum Paraméteres Hipotézisek Nemparaméteres Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák Kétmitás próbák, egy- és kétoldali ellehipotézissel t 1 + 2 2 = q ( 1 1)s 2 X X 1 Y 2 + ( 2 1)s 2 Y r 1 2 ( 1 + 2 2) 1 + 2 Kétoldali ellehipotézis eseté: Ha H 0 teljesül (m 1 = m 2 ), akkor X 1 Y 2, tehát t 1 + 2 2 értéke 0-hoz közeli. Ha H 0 em teljesül, azaz m 1 m 2, akkor X 1 Y 2 tehát, t 1 + 2 2 értéke végtelehez tart, ha ő. Így egy fix -re akkor utasítjuk el H 0 -t, ha t 1 + 2 2 a teszt statisztika értéke túl agy abszolút értékbe. Tehát: H 0 -t elfogadjuk t 1 + 2 2 < κ Egyoldali ellehipotézis eseté: Ha H 0 teljesül (m 1 m 2 ), akkor X 1 Y 2, tehát t 1 + 2 2 értéke > κ. Ha H 0 em teljesül, azaz m 1 < m 2, akkor X 1 Y 2 tehát, t 1 + 2 2 értéke -hez tart, ha ő. Így egy fix -re akkor utasítjuk el H 0 -t, ha t 1 + 2 2 a teszt statisztika értéke túl kicsi, azaz < κ. Tehát H 0 -t elfogadjuk κ < t 1 + 2 2

Itervallum Paraméteres Hipotézisek Nemparaméteres Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák Kétmitás próba egyoldali ellehipotézissel A B példa megoldása B példa. Az alábbi két mita két külöböző gyáregységbe tapasztalt selejt-aráyra voatkozik (ezrelékbe). Állítható-e 95%-os szigifikacia szite, hogy az A gyáregység jobba dolgozott? A 11,9 12,1 12,8 12,2 12,5 11,9 12,5 11,8 12,4 12,9 B 12,1 12,0 12,9 12,2 12,7 12,6 12,6 12,8 12,0 13,1 Az első mita: X 1, X 2,...,X 10 az N(m 1, σ 1 ) eloszlásból. A második mita: Y 1, Y 2,..., Y 10 az N(m 2, σ 2 ) eloszlásból. A hipotézisek: H 0 : m 1 m 2 H 1 : m 1 < m 2 (A-ba kevesebb a selejt) Kétmitás t próba kell. Feltehető-e, hogy a szórások egyezőek? Ugyais ez feltétele a t-próbáak. Erre F-próbát végzük, az jö ki, elfogadható, hogy a szórások megegyezek. t 18 = X 1 Y 2 (1 1)sX 2+( 2 1)sY 2 1 2 ( 1 + 2 2) 1 + 2 = X 10 Y 10 9(s 2 X +s 2 Y ) 90 = 1, 13 A kritikus érték 95%-os szigifikacia szithez(= 0,05 elsőfajú hibavalószíűséghez) 18 szabadságfokhoz κ = 1, 734. Mivel κ = 1, 734 < t 18 = 1, 13, ezért H 0 -t em tudjuk elveti.

Itervallum Paraméteres Hipotézisek Nemparaméteres Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák Egyoldali ellehipotézis A 2. példa megoldása, 97,5%, 99% szigifikacia szitek

Itervallum Paraméteres Hipotézisek Nemparaméteres Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák Kétmitás próbák egyoldali ellehipotézissel A B példa megoldása B példa. Az alábbi két mita két külöböző gyáregységbe tapasztalt selejt-aráyra voatkozik (ezrelékbe). Állítható-e 95%-os szigifikacia szite, hogy az A gyáregység jobba dolgozott? A 11,9 12,1 12,8 12,2 12,5 11,9 12,5 11,8 12,4 12,9 B 12,1 12,0 12,9 12,2 12,7 12,6 12,6 12,8 12,0 13,1 Az első mita: X 1, X 2,...,X 10 az N(m 1, σ 1 ) eloszlásból. A második mita: Y 1, Y 2,..., Y 10 az N(m 2, σ 2 ) eloszlásból. A hipotézisek: H 0 : m 1 m 2 H 1 : m 1 < m 2 (A-ba kevesebb a selejt) Kétmitás t próba kell. Feltehető-e, hogy a szórások egyezőek? Ugyais ez feltétele a t-próbáak. Erre F-próbát végzük, az jö ki, elfogadható, hogy a szórások megegyezek. t 18 = X 1 Y 2 (1 1)sX 2+( 2 1)sY 2 1 2 ( 1 + 2 2) 1 + 2 = X 10 Y 10 9(s 2 X +s 2 Y ) 90 = 1, 13 A kritikus érték 95%-os szigifikacia szithez(= 0,05 elsőfajú hibavalószíűséghez) 18 szabadságfokhoz κ = 1, 734. Mivel κ = 1, 734 < t 18 = 1, 13, ezért H 0 -t em tudjuk elveti.

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Előadás vázlat 1 Itervallumbecslések Általáosa Példa 2 Paraméteres próbák Kiidulási példa Várható érték tesztelése, ha a szórás ismert Várható érték tesztelése, ha a szórás ismeretle 3 Hipotézisek fajtái Egy- és kétoldali ellehipotézis Egymitás és kétmitás próbák 4 Nemparaméteres próbák Khi égyzet eloszlás Illeszkedés vizsgálat Homogeitás vizsgálat Függetleség vizsgálat

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Nemparaméteres próbák 3 fajta feladatot olduk meg: Illeszkedés vizsgálat: egy X 1,...,X mitát veszük egy eloszlásból, amely em ismert számukra. Igaz-e, hogy a mita egy általuk adott eloszlásból geerálódott? (Modjuk Expoeciális 2,3 paraméterrel.) Homogeitás vizsgálat: két miták va egy-egy eloszlásból: X 1,..., X és Y 1,..., Y m. Igaz-e, hogy a két eloszlás megegyezik? Függetleség vizsgálat: adott egy kétdimeziós mita (X 1, Y 1 ),...,(X, Y ) egy kétdimeziós véges értékű valószíűségi változóból. Igaz-e, hogy a margiálisok, X és Y függetleek?

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Khi égyzet eloszlás Adott egy véges diszkrét eloszlás p 1, p 2...,p r az {1, 2,...,r} értékeke. Adott egy X 1, X 2,... függetle mita ebből az eloszlásból. Mideek az alapja a következő: Tétel Legye N () i = #{j : 1 j, X j = i} = háyszor fordult elő az i érték az első kísérletbe. (Ugye r i=1 N() i =.) Ekkor ( ) r N () 2 i p i χ 2 r 1 p i i=1 amit. χ 2 k k szabadságfokú khi-égyzet eloszlás. χ 2 r 1 eloszlása megegyezik X 2 1 + X 2 2 + + X 2 r 1 eloszlásával, ahol X 1, X 2,..., X r 1 függetle stadard ormális, N(0, 1), eloszlásúak.

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Khi égyzet eloszlás, táblázat

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Khi égyzet eloszlás Biom(; p i ), így EN () i = p, Var(N () ) i ) = p i (1 p i ).,..., N() r Poliomialis(; p 1, p 2...,p r ) N () ( i N () 1, N() 2 A tétel bizoyítása r = 2-re: Legye r = 2, azaz az eloszlásuk p 1 = p és p 2 = 1 p. Ekkor N () 1 p 2 p + N () 2 (1 p) 2 (1 p) összeget vizsgáljuk. Hozzuk közös evezőre, és haszáljuk, hogy N () 2 = N () (1 p) = N () 2 1 (1 p) p(1 p) = (1 p) N () 1 p 2+p N () 1 p 2 p(1 p) = ( ) 2 N () 1 p p(1 p) 1 : 2+p N () 1 p N () 2 1 +p) p(1 p) A de Moivre-Laplace tétel szerit (= cetrális-határeloszlás N tétel spec. esete): () 1 p X,, p(1 p) ahol X N(0, 1). Ezért a égyzet eloszlása X 2 = χ 2 2 1.

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Illeszkedésvizsgálat Példa ε = 0, 05 elsőfajú hibavalószíűség mellet dötsük arról a hipotézisről, hogy az alábbi megfigyelés-sorozat szabályos kockával dobva adódott. értékek 1 2 3 4 5 6 gyakoriságok 24 21 19 12 13 11 H 0 : mide oldal valószíűsége 1 6 H 1 : em mide oldal valószíűsége 1 6

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Illeszkedésvizsgálat Adott egy r 2 pozitív egész. A háttérbe adott egy π = (π 1,π 2,...,π r ) eloszlás, amit mi em ismerük. Nevezzük ezt igazi eloszlásak. Ekkor veszük egy függetle mitát ebből az eloszlásból: X 1, X 2,..., X. Megaduk egy p = (p 1, p 2,..., p r ) eloszlást. Azt szereték teszteli, hogy az igazi eloszlás megegyezik-e az általuk adottal. Így a hipotézisek: H 0 : π = p H 1 : π p Tesztelés: a teszt statisztika χ 2 r 1 := r (N i p i ) 2 i=1 p i. Miért? Ha H 0 teljesül, akkor N i p i mide i-re. Ezért a számlálók 0-hoz közeliek, így χ 2 r 1 0-hoz közeli. Ha H 0 em teljesül, akkor valamelyik i-re N i π i p i, így (N i p i ) 2 p i tart -hez, tehát χ 2 r 1 tart -hez, ha Tehát fix -re: H 0 -t elfogadjuk χ 2 r 1 < κ.

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Illeszkedésvizsgálat Tehát fix -re: H 0 -t elfogadjuk χ 2 r 1 < κ. Potosabba: 1 ε szite elfogadjuk H 0 -t, ha κ-ra teljesül: P ( χ 2 r 1 < κ) = 1 ε. Ehhez szükség va χ 2 r 1 = r (N i p i ) 2 i=1 p i eloszlására, ha H 0 teljesül, azaz X 1,...,X a p 1,..., p r eloszlásból vett függetle mita. A feti tétel szerit, ha H 0 teljesül, azaz π = p, azaz X 1,...,X a p 1,...,p r eloszlásból vett függetle mita, akkor r (N i p i ) 2 i=1 p i aszimptotikusa χ 2 r 1 eloszlású. Így ahogy CHT-t alkalmazó közelítésekél, fix -re is tekitsük a r i=1 (N i p i ) 2 p i valváltozót χ 2 r 1 eloszlásúak.

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Illeszkedés vizsgálat, a példa megoldása ε = 0, 05 elsőfajú hibavalószíűség mellet dötsük arról a hipotézisről, hogy az alábbi megfigyelés-sorozat szabályos kockával dobva adódott. értékek 1 2 3 4 5 6 gyakoriságok 24 21 19 12 13 11 H 0 : mide oldal valószíűsége 1 6 (π 1,...,π 6 ) = ( 1 6,..., 1 6 ) H 1 : H 0 em teljesül (π 1,...,π 6 ) ( 1 6,..., 1 6 ) A teszt statisztika értéke χ 2 5 = χ2 6 1 = 6 i=1 (N i p i ) 2 p i = 442 +26 2 +14 2 +28 2 +22 2 +34 2 600 = 8, 72. Az 5 szabadságfokú χ 2 eloszláshoz és 0, 95 szigifikacia szithez tartozó kritikus érték κ = 11, 07. Mivel χ 2 5 < κ ezért em tudjuk elutasítai H 0-t, így a mita tekithető szabályos kockából származóak.

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Khi égyzet eloszlás, táblázat

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Illeszkedés vizsgálat, a példa megoldása ε = 0, 05 elsőfajú hibavalószíűség mellet dötsük arról a hipotézisről, hogy az alábbi megfigyelés-sorozat szabályos kockával dobva adódott. értékek 1 2 3 4 5 6 gyakoriságok 24 21 19 12 13 11 H 0 : mide oldal valószíűsége 1 6 (π 1,...,π 6 ) = ( 1 6,..., 1 6 ) H 1 : H 0 em teljesül (π 1,...,π 6 ) ( 1 6,..., 1 6 ) A teszt statisztika értéke χ 2 5 = χ2 6 1 = 6 i=1 (N i p i ) 2 p i = 442 +26 2 +14 2 +28 2 +22 2 +34 2 600 = 8, 72. Az 5 szabadságfokú χ 2 eloszláshoz és 0, 95 szigifikacia szithez tartozó kritikus érték κ = 11, 07. Mivel χ 2 5 < κ ezért em tudjuk elutasítai H 0-t, így a mita tekithető szabályos kockából származóak.

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Illeszkedés vizsgálat, másik példa Megoldás élkül Amikor az embereket megkérdezik, hogy mekkora a tömegük, gyakra modaak a valóságosál kisebb értékeket. Szereték eldötei az alábbi adathalmazról, hogy igazi mérésből származik, vagy az emberek megkérdezéséből yerték. Azt a téyt fogjuk haszáli, hogy mérés eseté az utolsó számjegyek eloszlásáak egyeletesek kell leie a {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} halmazo. Dötsük 0, 95 szite arról a hipotézisről, hogy mérésből származak az adatok. utosló számjegy 0 1 2 3 4 5 6 7 8 9 mérések száma 35 4 4 3 4 24 2 4 8 2

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Homogeitás vizsgálat, példa Két dobókockával dobva az alábbi gyakoriságokat figyeltük meg: értékek 1 2 3 4 5 6 I. kocka 27 24 26 23 18 32 II. kocka 18 12 15 21 14 20 α = 0, 05 elsőfajú hibavalószíűség mellet dötsük arról, hogy tekithető-e a két eloszlás azoosak. H 0 : a két eloszlás azoos H 1 : a két eloszlás külöböző

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Homogeitás vizsgálat Adott két háttér eloszlás az {1, 2,...,r} halmazo: p = (p 1, p 2,...,p r ) és q = (q 1, q 2,..., q r ). Ezek em ismertek. A p eloszlásból veszük egy mitát: X 1, X 2,...,X A q eloszlásból veszük egy mitát: Y 1, Y 2,..., Y m H 0 : q = p H 1 : q p Legye N i = #{j : 1 j, X j = i} = kísérletből az i értékek száma az első mitába. Legye M i = #{j : 1 j, Y j = i} = kísérletből az i értékek száma az első mitába. ( ) 2 Ni r M i m A teszt statisztika T = m. (H 0 melletti eloszlása N i + M i i=1 ismert.) Ha H 0 teljesül, akkor mide j-re N j p j = p j és M j m mp j m = p j, tehát a számlálók 0-hoz közeliek, így az egész szumma 0-hoz közeli. Ha H 1 teljesül, akkor valamely j-re az egyik tört -hez tart. Így fix -re akkor fogadjuk el H 1 -t, ha T elég agy, κ < T.

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Homogeitás vizsgálat Állítás Ha X 1, X 2,...,X és Y 1, Y 2,...,Y m két függetle mita ugyaabból az eloszlásból az {1, 2,..., r} értékeke, akkor ( ) 2 Ni r M i m m χ 2 r 1, ha. N i + M i i=1 Fix eseté úgy vesszük, hogy m r i=1 χ 2 r 1. Tehát a dötés: H 0 -t 1 ε szigifikacia szite elfogadjuk m r i=1 Ni M i m 2 Ni M 2 i m N i +M i N i +M i < κ, ahol P(χ 2 r 1 < κ) = 1 ε. eloszlása

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Homogeitás vizsgálat, példa megoldása Két dobókockával dobva az alábbi gyakoriságokat figyeltük meg: értékek 1 2 3 4 5 6 I. kocka 27 24 26 23 18 32 II. kocka 18 12 15 21 14 20 α = 0, 05 elsőfajú hibavalószíűség mellet dötsük arról, hogy tekithető-e a két eloszlás azoosak. H 0 : a két eloszlás azoos H 1 : a két eloszlás külöböző Ni M i m 2 χ 2 5 = m r i=1 N i +M i = 2, 2 0,95 szigifikacia szithez és 5 szabadsági fokhoz tartozó kritikus érték κ = 11, 07 Mivel χ 2 5 < κ, H 0-t em tudjuk elveti, tehát elfogadjuk, hogy a két dobókocka azoosak tekithető.

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Khi égyzet eloszlás, táblázat

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Homogeitás vizsgálat, példa megoldása Két dobókockával dobva az alábbi gyakoriságokat figyeltük meg: értékek 1 2 3 4 5 6 I. kocka 27 24 26 23 18 32 II. kocka 18 12 15 21 14 20 α = 0, 05 elsőfajú hibavalószíűség mellet dötsük arról, hogy tekithető-e a két eloszlás azoosak. H 0 : a két eloszlás azoos H 1 : a két eloszlás külöböző Ni M i m 2 χ 2 5 = m r i=1 N i +M i = 2, 2 0,95 szigifikacia szithez és 5 szabadsági fokhoz tartozó kritikus érték κ = 11, 07 Mivel χ 2 5 < κ, H 0-t em tudjuk elveti, tehát elfogadjuk, hogy a két dobókocka azoosak tekithető.

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Függetleség vizsgálat, Példa Az alábbi három táblázat három a TV-be külöböző itezitással reklámozott fogkrém fogyasztására voatkozó adatokat tartalmaz a TV-ézés idejéek függvéyébe: Fogkrém fajtája A B C TV ézés hetete 1 óra reklám 5 perc reklám 0 perc reklám < 5 óra 80 60 60 5 15 óra 70 70 60 > 15 óra 90 65 45 Va-e összefüggés a kedvelt fogkrém márkája és a TV ézés időtartama között? A cellákba az eladott meyiség áll az adott kategóriából. H 0 : a reklám időtartama és a TV ézés függetleek H 1 : va közöttük összefüggés

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Függetleség vizsgálat Adott egy kétdimeziós véges értékű valváltozó, (X, Y). X értékei {1, 2,...,r}, Y értékei {1, 2,...,s}. Teszteli szereték, hogy X függetle-e Y -tól. Ehhez veszük egy elemű mitát: (X 1, Y 1 ), (X 2, Y 2 )...,(X, Y ). 1 2 j s sor 1 N 11 N 12 N 1j N 1s N 1 2 N 21 N 22 N 2j N 2s N 2. i N i1 N i2 N ij N is N i. r N r1 N r2 N rj N rs N r oszlop N 1 N 2 N j N s r s i=1 j=1 N ij =. A teszt statisztika: χ 2 (r 1)(s 1) = r s i=1 j=1 ( Nij N i N i N j ) 2 N j

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Függetleség vizsgálat A teszt statisztika: χ 2 (r 1)(s 1) = r s i=1 j=1 ( Nij N i N i N j ) N 2 j Ha H 0 teljesül, azaz X és Y függetleek, akkor P(X = i, Y = j) = P(X = i)p(y = j). Továbbá tudjuk, hogy ekkor N ij P(X = i, Y = j), N i P(X = i), és N j P(Y = j). Tehát a szummába felsorolt törtek 0-hoz tartaak. Így H 0 -t elfogadjuk, ha χ 2 (r 1)(s 1) 0-hoz közeli. Ha H 1 teljesül, akkor valamilye (i, j) párra N ij N i N j c 0, így -es szorzó miatt χ 2 (r 1)(s 1), ha. Fix -re, H 0 -t elfogadjuk, ha χ 2 (r 1)(s 1) elég kicsi, azaz ha < κ, valamilye kappára. χ 2 (r 1)(s 1)

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Függetleség vizsgálat χ 2 (r 1)(s 1) = r s i=1 j=1 ( Nij N i N i N j ) N 2 j, ha tart végtelehez, akkor χ 2 eloszlású (r 1)(s 1) szabadságfokkal. Azaz ha H 0 teljesül, a határeloszlás ismert. (aszimptotikusa...) Dötés: H 0 -t elfogadjuk 1 ε szite χ 2 (r 1)(s 1) < κ, ahol κ az (r 1)(s 1) szabadságfokú χ 2 eloszlás ε valószíűséghez tartozó farok eloszlása, azaz P(χ 2 (r 1)(s 1) > κ) = ε (ez ugye azt jeleti, hogy P(χ 2 (r 1)(s 1) < κ) = 1 ε)

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Függetleség vizsgálat, a példa megoldása Az alábbi három táblázat három a TV-be külöböző itezitással reklámozott fogkrém fogyasztására voatkozó adatokat tartalmaz a TV-ézés idejéek függvéyébe: Fogkrém fajtája A B C TV ézés hetete 1 óra reklám 5 perc reklám 0 perc reklám < 5 óra 80 60 60 5 15 óra 70 70 60 > 15 óra 90 65 45 Va-e összefüggés a kedvelt fogkrém márkája és a TV ézés időtartama között? Dötsük 0,95%-os szite. r = s = 3 χ 2 4 = r i=1 s j=1 Nij N i N i N j «2 N j = 6 A 4 szabadságfokú 0,05 farokvalószíűséghez tartozó érték a χ 2 eloszlásba κ = 9.488. Mivel χ 2 4 < κ, elfogadjuk H 0-t.

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Khi égyzet eloszlás, táblázat

Itervallum Paraméteres Hipotézisek Nemparaméteres χ 2 Illeszkedés Homogeitás Függetleség Függetleség vizsgálat, a példa megoldása Az alábbi három táblázat három a TV-be külöböző itezitással reklámozott fogkrém fogyasztására voatkozó adatokat tartalmaz a TV-ézés idejéek függvéyébe: Fogkrém fajtája A B C TV ézés hetete 1 óra reklám 5 perc reklám 0 perc reklám < 5 óra 80 60 60 5 15 óra 70 70 60 > 15 óra 90 65 45 Va-e összefüggés a kedvelt fogkrém márkája és a TV ézés időtartama között? Dötsük 0,95%-os szite. r = s = 3 χ 2 4 = r i=1 s j=1 Nij N i N i N j «2 N j = 6 A 4 szabadságfokú 0,05 farokvalószíűséghez tartozó érték a χ 2 eloszlásba κ = 9.488. Mivel χ 2 4 < κ, elfogadjuk H 0-t.