Matematikai statisztikai elemzések 4.

Hasonló dokumentumok
Matematikai statisztikai elemzések 4.

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

egyetemi jegyzet Meskó Balázs

Matematika III. 2. Eseményalgebra Prof. Dr. Závoti, József

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

[Biomatematika 2] Orvosi biometria

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Hipotézis vizsgálatok

Hipotézis vizsgálatok

Bevezetés a hipotézisvizsgálatokba

Matematikai statisztikai elemzések 3.

Statisztika Elıadások letölthetık a címrıl

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

Normális eloszlás paramétereire vonatkozó próbák

Matematika III. 4. A valószínűségi változó és jellemzői Prof. Dr. Závoti, József

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Statisztika elméleti összefoglaló

Matematikai statisztikai elemzések 6.

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Matematikai statisztika c. tárgy oktatásának célja és tematikája

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

Matematikai geodéziai számítások 10.

Matematika III. 5. Nevezetes valószínűség-eloszlások Prof. Dr. Závoti, József

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Biometria gyakorló feladatok BsC hallgatók számára

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 4. MA3-4 modul. A valószínűségi változó és jellemzői

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

A konfidencia intervallum képlete: x± t( α /2, df )

Adatok statisztikai értékelésének főbb lehetőségei

Matematikai statisztikai elemzések 6.

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Matematikai statisztikai elemzések 5.

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

y ij = µ + α i + e ij

Statisztikai módszerek 7. gyakorlat

NEVEZETES FOLYTONOS ELOSZLÁSOK

6. Előadás. Vereb György, DE OEC BSI, október 12.

Matematika III. 8. A szórás és a szóródás egyéb mérőszámai Prof. Dr. Závoti, József

Matematikai statisztikai elemzések 2.

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

Kísérlettervezés alapfogalmak

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

Hipotézisvizsgálat R-ben

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Többváltozós lineáris regressziós modell feltételeinek

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Nemparaméteres próbák

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

KÖVETKEZTETŐ STATISZTIKA

Dr. Karácsony Zsolt. Miskolci Egyetem november

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

A Statisztika alapjai

Matematikai statisztikai elemzések 1.

Normális eloszlás tesztje

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Matematikai geodéziai számítások 6.

Statisztikai becslés

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biostatisztika Összefoglalás

Biostatisztika Összefoglalás

Kettőnél több csoport vizsgálata. Makara B. Gábor

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Biostatisztika VIII. Mátyus László. 19 October

Matematikai geodéziai számítások 5.

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 6. MA3-6 modul. A statisztika alapfogalmai

H0 hipotézis: μ1 = μ2 = μ3 = μ (a különböző talpú cipők eladási ára megegyezik)

Gyakorló feladatok_alapok

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

BIOMATEMATIKA ELŐADÁS

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Kutatásmódszertan és prezentációkészítés

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Átírás:

Matematikai statisztikai elemzések 4. Hipotézisvizsgálat: alapfogalmak, egymintás és kétmintás próbák. Prof. Dr. Závoti, József

Matematikai statisztikai elemzések 4.: Hipotézisvizsgálat: alapfogalmak, Prof. Dr. Závoti, József Lektor: Bischof, Annamária Ez a modul a TÁMOP - 4.1.2-08/1/A-2009-0027 Tananyagfejlesztéssel a GEO-ért projekt keretében készült. A projektet az Európai Unió és a Magyar Állam 44 706 488 Ft összegben támogatta. v 1.0 Publication date 2010 Szerzői jog 2010 Nyugat-magyarországi Egyetem Geoinformatikai Kar Kivonat Ez a modul a hipotézisvizsgálat alapfogalmaival és fő feladataival ismerteti meg az Olvasót. Fontos megismerni a hipotézisvizsgálat célját, alkalmazási lehetőségeit. Ismertetjük a hipotézisvizsgálat elvét, lépéseit. A gyakorlatban leggyakrabban előforduló esetekre részletes megoldással számpéldákat adunk. A nemparaméteres próbák közül az illeszkedésvizsgálat, de különösen a függetlenségvizsgálat számos alkalmazásra találhat a gyakorlatban. Jelen szellemi terméket a szerzői jogról szóló 1999. évi LXXVI. törvény védi. Egészének vagy részeinek másolása, felhasználás kizárólag a szerző írásos engedélyével lehetséges.

Tartalom 4. Hipotézisvizsgálat: alapfogalmak,... 1 1. 4.1 Bevezetés... 1 2. 4.2 A statisztikai próbákról általánosan... 1 3. 4.3 Egymintás próbák... 5 3.1. 4.3.1 Hipotézisvizsgálat a várható értékre (ismert szórású normális eloszlásból származó minta)... 5 3.2. 4.3.2 Hipotézisvizsgálat a várható értékre (ismeretlen szórású normális eloszlásból származó kis minta)... 6 3.3. 4.3.3 Hipotézisvizsgálat a várható értékre (ismeretlen szórású normális eloszlásból származó nagy minta)... 7 3.4. 4.3.4 Hipotézisvizsgálat a szórásra (kétoldali próba)... 9 3.5. 4.3.5 Hipotézisvizsgálat a szórásra (egyoldali próba)... 10 3.6. 4.3.6 Sokasági arányszámra vonatkozó próba... 10 4. 4.4 Kétmintás próbák... 11 5. 4.5 Nemparaméteres próbák... 13 5.1. 4.5.1 Illeszkedésvizsgálat... 13 5.2. 4.5.2 Függetlenségvizsgálat (kontingenciavizsgálat)... 15 6. 4.6 Összefoglalás... 17 iii

A táblázatok listája 1.... 4 2.... 5 4.... 16 5.... 16 iv

4. fejezet - Hipotézisvizsgálat: alapfogalmak, egymintás és kétmintás próbák. 1. 4.1 Bevezetés Jelen modul a Matematikai és statisztikai elemzések tárgy negyedik fejezete, modulja. Az itt következő ismeretek megértéséhez javasoljuk, hogy olvassa el a Tárgy korábbi moduljainál írottakat. Amennyiben ez még nem lenne elég a megértéshez, akkor forduljon a szerzőhöz segítségért. Jelen modul célja, hogy a hipotézisvizsgálat alapfogalmainak elsajátítása és példákon keresztül a legfontosabb feladattípusok tárgyalásának megismerése. Az általános alapelvek megismerése lehetővé teszi, hogy az olvasó a megszerzett ismeretekkel a modulban nem tárgyalt eseteket is kezelni tudjon. Az egymintás és kétmintás próbákat részletesen tárgyaljuk a különböző előfordulási eseteknek megfelelően. Nagy hangsúlyt kap a nemparaméteres próbák közül az illeszkedés- és a függetlenségvizsgálat ismertetése. 2. 4.2 A statisztikai próbákról általánosan Gyakran szükségünk lehet arra, hogy egy valószínűségi változó eloszlásának paraméterével kapcsolatos hipotézisről (feltételezésről) eldöntsük, hogy elfogadjuk-e vagy sem. Ekkor a paraméter értékét a 3. modulban leírt módon mintából becsüljük, majd összehasonlítjuk ezt az értéket a feltételezéssel, és ezután döntünk. Ha a becslés közel van a feltételezett értékhez, akkor a hipotézist elfogadjuk, ha nincs, akkor elutasítjuk. Most megfogalmazzuk a hipotézis eldöntésének fő mozzanatait. Tegyük fel, hogy egy η valószínűségi változó eloszlását meghatározó a paraméterre felállított hipotézist szeretnénk eldönteni. Legyen ez a hipotézis az, hogy az a paraméter a 0 értéket vesz fel. Például: Elfogadhatjuk-e, hogy egy gépen készült csavarok hosszának várható értéke 10 mm? Elfogadhatjuk-e, hogy egy lámpatípus élettartamának várható értéke 30000 óra, szórása 50 óra? Elfogadhatjuk-e, hogy egy gyár termékét a vásárlók 80 százaléka részesíti előnyben? A megoldás általános menete: 1. Rögzítjük a nullhipotézist: H 0: a=a 0 Ez az a feltételezés, amelyről döntést szeretnénk hozni. 1. Megfogalmazzuk az ellenhipotézist (alternatív hipotézist). Itt általában a saját érdekünket szoktuk szem előtt tartani. Emiatt az első példában akkor is elutasítjuk a hipotézist, ha a értéke kisebb, és akkor is, ha nagyobb a 0 -nál, hiszen nekünk pontos csavarméret kell. Az is baj, ha rövidebb és az is, ha hosszabb mm-nél egy csavar. A második példában pedig csak akkor utasítjuk el a várható értékre vonatkozó hipotézist, ha a értéke kisebb, mint a 0, hiszen ha nagyobb, és mi vagyunk a vásárlók, akkor jól járunk. Az η valószínűségi változóra mintát veszünk, majd ebből megbecsüljük az a paraméter értékét. Ha a becslés a nullhipotézistől érdekeinket figyelembe véve túl messze van, akkor azt mondjuk, hogy az ún. elutasítási tartományba esik. Az elutasítási tartománynak a valós számok halmazára vonatkozó komplementerét elfogadási tartománynak nevezzük. Feladatunk lesz majd az elutasítási illetve elfogadási tartomány meghatározása. 1

Az első példabeli próbát kétoldali, a másodikbelit egyoldali próbának hívjuk, aszerint, hogy az elutasítási tartomány hol helyezkedik el. Ha a 0 bal oldalán, akkor baloldali próbáról, ha a jobb oldalán, akkor jobboldali próbáról, ha mindkét oldalán, akkor kétoldali próbáról beszélünk. Ellenhipotézisek: Próba Ellenhipotézis Baloldali H 1: a<a 0 Jobboldali H 1: a>a 0 Kétoldali H 1: a a 0 2

1. ábra 3

1. A mintából számított becslés értéke jelentősen eltérhet a becsülendő paraméter pontos értékétől (lásd Becsléselmélet 3. modul). Így előfordulhat, hogy igaz hipotézist visszautasítunk, mert a becslés az elutasítási tartományba esik. Ekkor ún. elsőfajú hibát követünk el, melynek valószínűségét α-val jelöljük. Az α értéket szignifikanciaszintnek (szignifikáns=jelentős) nevezzük és általában a 0.01, 0.05, 0.1 értékek közül választjuk. Ez azt jelenti, hogy ha pl. α=0.05, akkor 100 esetből, amikor a nullhipotézis igaz, kb. ötször fogjuk visszautasítani. Előfordulhat az is, hogy a nullhipotézis nem igaz és a becslés mégis az elfogadási tartományba esik. Így szintén hibát követünk el, mert hibás nullhipotézist fogadunk el. Ezt a hibát másodfajú hibának nevezzük és valószínűségét β-val jelöljük. A másodfajú hibát csak úgy tudjuk kiszámítani, ha felteszünk egy másik hipotézist, és ezt elfogadva határozzuk meg a fenti valószínűséget. 1. Kiszámítjuk az a paraméter becslésére használt statisztika értékét egy n nagyságú véletlen mintából (próbastatisztika). 2. Az α értékétől függően az ellenhipotézist figyelembe véve megállapítjuk a kritikus értéket, mely alapján meghatározható az elfogadási és az elutasítási tartomány. Ehhez szükségünk van az a paraméter becslésére használt statisztika eloszlásának ismeretére. 2. ábra a,b Ha az eloszlást ismerjük, akkor úgy jelöljük ki az elutasítási tartományt, hogy a tartományon a sűrűségfüggvény alatti terület α legyen. Így elértük, hogy az elsőfajú hiba valóban α (lásd a 2.a,b ábrát). 1. Ha a statisztika értéke az elutasítási zónába esik, akkor elutasítjuk, ha nem, akkor elfogadjuk a nullhipotézist, majd gyakorlati következtetést vonunk le az eredményből. Megjegyzések: 1. Az első és másodfajú hiba egymás ellen dolgozik: Ha α csökkentésével az elsőfajú hibát csökkentjük, úgy a másodfajú hiba növekedni fog, és fordítva. Láthatjuk azt is, hogy biztos döntéseket nem tudunk hozni. Csak azt tudjuk garantálni, hogy nagy valószínűséggel jó döntést hozunk. 2. Megadhatunk olyan nullhipotézist is, melyben egyenlőség helyett egyenlőtlenség áll. A második példában lehetne a nullhipotézis az, hogy az élettartam várható értéke nagyobb 30000 óránál. Ekkor az ellenhipotézis nyilván az, hogy az élettartam várható értéke kisebb, mint 30000 óra. A következő táblázatban a lehetséges null- és ellenhipotézisek szerepelnek. 1. táblázat - nullhipotézis ellenhipotézis 4

A fenti két hipotézis az elutasítási tartományok megegyezése miatt helyettesíthető a következő módon (itt már a nullhipotézisben egyenlőség szerepel): 2. táblázat - nullhipotézis ellenhipotézis (baloldali próba) 3. 4.3 Egymintás próbák (jobboldali próba) 3.1. 4.3.1 Hipotézisvizsgálat a várható értékre (ismert szórású normális eloszlásból származó minta) Példa Tekintsük a következő feladatot: Táramérlegen négy ismételt tömegméréssel határoztuk meg egy tárgy tömegét. Az n=4 mérésből álló minta számtani középértéke:. Korábbi mérésekből tudjuk, hogy a mérés varianciája: Ebből a szórás:. El kell döntenünk, hihető-e, hogy a várható érték (a tárgy valódi tömege) μ 0=5g! Megoldás: 1. Nullhipotézis:. 2. Itt nyilván kétoldali próbát kell használnunk. A túl alacsony, és a túl magas mért érték egyaránt rossz. Ezért az ellenhipotézis: 1. Legyen a szignifikanciaszint: 2. A μ paraméter becslésére z-próbát használunk. 1. A kritikus értékek (azaz az elutasítási és elfogadási tartomány határainak) meghatározása: 5

Az elfogadási tartomány így a intervallum. 1. Döntés: 1,96-1,96 2,5 H 0 H 1 H 1 3. ábra A 3. ábráról leolvasható, hogy a 2,5 érték nem esik bele az elfogadási tartományba, így a nullhipotézist elutasítjuk. Azaz a tárgy valódi tömege nem 5g. 3.2. 4.3.2 Hipotézisvizsgálat a várható értékre (ismeretlen szórású normális eloszlásból származó kis minta) Példa Egy alkatrész átmérőjének várható értékére elfogadható-e a μ 0=2 hipotézis 0.9 biztonsági szinten, ha n=10 alkatrészt megvizsgálva a következő értékeket kapjuk: 1.99; 2; 1.98; 1.95; 1.95; 2.02; 2.05; 2.04; 2.03; 2.01 Az átmérő eloszlására normális eloszlást feltételezünk. Megoldás: 1. Nullhipotézis: 2. Ellenhipotézis: 3. Szignifikanciaszint: 6

4. A próbastatisztika: Hipotézisvizsgálat: alapfogalmak, A várható értékre vonatkozó hipotézisek eldöntésére, amenyiben ismeretlen szórású kis minta áll rendelkezésünkre, t-próbát alkalmazunk. Ehhez szükséges s kiszámolása: Fontos: a korrigált tapasztalati szórással számolunk, mivel az ad torzítatlan becslést. Innen 1. Kritikus értékek meghatározása: 1. Döntés: 4. ábra Az elfogadási tartomány a elfogadjuk. Azaz az alkatrész átmérője 2. intervallum. A 0,18 érték ebbe beleesik, tehát a nullhipotézist 3.3. 4.3.3 Hipotézisvizsgálat a várható értékre (ismeretlen szórású normális eloszlásból származó nagy minta) 7

Példa Hipotézisvizsgálat: alapfogalmak, Adott technológiai folyamattal gyártott kompakt fénycsövek szabvány szerinti élettartama 12 ezer óra, szórása 3 ezer óra. Módosították a gyártástechnológiát a fénycsövek élettartamának növelése érdekében. Az új technológiával előállított fénycsövek közül véletlenszerűen kiválasztott n=100 db fénycső átlagos élettartama 15 ezer óra, szórása 3.2 ezer óra. (az újfajta képcsövek elméleti szórása nem ismert) Ellenőrizze 5%-os szignifikancia szinten azt az állítást, hogy az új technológiával gyártott fénycsövek átlagos élettartama eltér-e a régi szabványtól! Jelölések: n=100 s=3,2 ezer Megoldás: 1. Nullhipotézis:, azaz nem tér el a régi szabványtól 2. Ellenhipotézis: 3. Szignifikanciaszint: 4. A próbastatisztika: A várható értékre vonatkozó hipotézisek eldöntésére, amenyiben ismeretlen szórású nagy minta áll rendelkezésünkre, aszimptotikus z-próbát alkalmazunk. 1. Kritikus értékek meghatározása: 1. Döntés: 5. ábra 8

Az elfogadási tartomány a intervallum. A 9,375 érték ebbe nem esik bele, tehát a nullhipotézist elutasítjuk. Azaz a fénycsövek élettartama eltér a régiekétől. 3.4. 4.3.4 Hipotézisvizsgálat a szórásra (kétoldali próba) Példa Tekintsük ismét a 4.3.3-ban leírt feladatot! Feladatunk most legyen az, hogy 5%-os szignifikancia szinten ellenőrizzük, hogy az új technológiával gyártott fénycsövek szórása eltér-e a régi szabványtól! Megoldás: 1. Nullhipotézis:, azaz nem tér el a régi szórástól 2. Ellenhipotézis: 3. Szignifikanciaszint: 4. A próbastatisztika: A szórásra vonatkozó hipotézisek eldöntésére -próbát alkalmazunk. 1. Kritikus értékek meghatározása: alsó határ: felső határ: 1. Döntés: 6. ábra Az elfogadási tartomány a intervallum. A 112,64 érték ebbe beleesik, tehát a nullhipotézist elfogadjuk. Azaz a fénycsövek szórása nem tér el a régiekétől. 9

3.5. 4.3.5 Hipotézisvizsgálat a szórásra (egyoldali próba) Példa Normális eloszlásból vett n=11 elemű minta szórásnégyzete. Ellenőrizzük -os szignifikanciaszinten, hogy elfogadható-e az az állítás, mely szerint a sokaság varianciája nem nagyobb, mint 14,0! Ellenhipotézisünk legyen az, hogy a variancia nagyobb, mint 14,0! Megoldás: 1. Nullhipotézis: 2. Ellenhipotézis: jobboldali próba 3. Szignifikanciaszint: 4. A próbastatisztika: Ismét -próbát alkalmazunk, de most jobboldali kritikus tartománnyal. 1. Kritikus érték meghatározása: 1. Döntés: 7. ábra Az elfogadási tartomány a intervallum. A 11,14 érték ebbe beleesik, tehát a nullhipotézist elfogadjuk. Azaz a sokaság varianciája nem nagyobb, mint 14. 3.6. 4.3.6 Sokasági arányszámra vonatkozó próba Példa 10

Egy cég azt állítja, hogy a vásárlók 40%-a rendszeresen az ő terméküket vásárolja. Megkérdeztünk 80 embert. Közülük 22 vásárolja ezen cég termékét. Ez alapján elfogadhatjuk-e a cég állítását? Jelölések: n=80 k=22 Megoldás: 1. Nullhipotézis: azaz elfogadjuk a cég állítását 2. Ellenhipotézis: 3. Szignifikanciaszint: 4. A próbastatisztika: Ismét aszimptotikus z-próbát alkalmazunk,mivel nagy mintáról van szó. 1. Kritikus érték meghatározása: 1. Döntés: 8. ábra Az elfogadási tartomány a intervallum. A -2,28 érték ebbe nem esik bele, tehát a nullhipotézist elutasítjuk. Azaz nem igaz, hogy a cég termékét a vevők 40%-a vásárolja. 4. 4.4 Kétmintás próbák 11

1. Annak eldöntésére, hogy két valószínűségi változó szórása megegyezik-e, az F próbát használjuk. Ebben az esetben a nullhipotézis az, hogy. 1. Ha arról szeretnénk döntést hozni, hogy megegyezik-e két populáció átlaga, azt kell megvizsgálnunk, hogy a két átlag különbségéről feltételezhető-e, hogy nulla. (Lásd a kidolgozott feladatokat.) A használható próbastatisztikák eloszlását megadtuk az előző fejezetben. 2. Hasonlóképpen ha két esemény valószínűségének egyenlőségéről szeretnénk döntést hozni, akkor a nullhipotézis az lesz, hogy a két esemény valószínűségének különbsége nulla. Példa Ismeretlen, de különböző szórású eloszlásokból származó kis minta! Egy gépről két különböző napon lekerülő alkatrészekből mintát vettek. Az alkatrészek tömegére a következőket kapták: Különböző-e a két napon gyártott alkatrészek tömegének várható értéke 5%-os szignifikanciaszinten? Megoldás: 1. Nullhipotézis: 2. Ellenhipotézis: 3. Szignifikanciaszint: 4. A próbastatisztika: t-próbát alkalmazunk, mivel kis mintáról van szó. 1. Kritikus érték meghatározása: 1. Döntés: 12

9. ábra Az elfogadási tartomány a intervallum. A 18,257 érték ebbe nem esik bele, tehát a nullhipotézist elutasítjuk. Azaz különböző a két napon gyártott alkatrészek tömegének várható értéke 5%-os szignifikanciaszinten. 5. 4.5 Nemparaméteres próbák 5.1. 4.5.1 Illeszkedésvizsgálat Általában joggal kérdezhetjük, hogy honnét tudjuk megállapítani, hogy egy erdő fáinak magasságát normális eloszlású valószínűségi változó írja le. Vagy általánosan: honnét tudjuk megállapítani, hogy egy valószínűségi változó milyen eloszlású? Ennek eldöntésére is próbát kell végeznünk. Úgy járunk el, hogy a kísérletileg tapasztalt eloszlást összehasonlítjuk a várt eloszlással. Tegyük fel, hogy az események teljes eseményrendszert alkotnak. Végezzünk el N darab kísérletet egymástól függetlenül. 1 Jelölje E i az A i esemény feltételezett gyakoriságát az N kísérletben (azaz a p in szorzatot, ahol p i az A i esemény feltételezett valószínűsége), F i pedig a szorzatot, ahol az A i esemény tényleges valószínűsége. Legyen az a valószínűségi változó, amely egy N kísérletből álló kísérletsorozathoz az A i esemény kísérletsorozatbeli gyakoriságát rendeli hozzá. Felállítunk egy nullhipotézist az egyes események gyakoriságára: Az ellenhipotézis: Ha a nullhipotézis teljesül, akkor bizonyítható, hogy a.. valószínűségi változó szabadságfokú χ 2 eloszlású. Ha ezen valószínűségi változó felvett értéke "túl nagy", akkor a hipotézist elutasítjuk (azaz egyoldali próbát végzünk). 1 Tegyük fel továbbá, hogy az N kísérletben az Ai események gyakorisága legalább 5. Ellenkező esetben összevonunk eseményeket. 13

Válasszuk α-nak a szignifikanciaszintet. Tegyük fel, hogy az esetén az értékeket veszik fel. Kiszámítjuk a valószínűségi változók egy adott kísérletsorozat próbastatisztikát és ha az nagyobb, mint a esetben pedig elfogadjuk. kritikus érték, akkor a nullhipotézist elutasítjuk, ellenkező Megjegyzés: Ha a feltételezett eloszlás paramétereit is az adatokból számítjuk ki, akkor az ( )-es szabadságfokot a számított adatok számával csökkenteni kell. Például ha gyakorisági táblázatból határozzuk meg a közelítő normális eloszlás várható értékét és szórását, akkor a szabadságfok n-3 lesz. A könnyebb megértés kedvéért mutatunk két kidolgozott feladatot. Példa: Százszor feldobunk egy pénzérmét. írást és fejet kapunk. Döntsük el, hogy szabályos-e az érme! Megoldás: Legyen A 1 a fejdobást és A 2 az írásdobást jelentő esemény. Szabályos érme esetén egyenletes eloszlást feltételezhetünk. Emiatt E 1=E 2=50. A nullhipotézis:, az ellenhipotézis:. Esetünkben. Számítsuk ki a próbastatisztikát! Válasszuk a szignifikanciaszintet. A táblázatból kikeressük a 0.05 szignifikanciaszinthez és az 1 szabadságfokhoz tartozó kritikus értéket. Ez 3.84. Mivel a számított érték ennél nagyobb a nullhipotézist elutasítjuk. Példa: Azt a hipotézist szeretnénk ellenőrizni, hogy egy gépsoron készült acélrudak hosszúságait leíró változó normális eloszlású 300 cm várható értékkel és szórással. valószínűségi Megoldás: Megmérjük 100 acélrúd hosszát. Minden adatból kivonjuk a várható értéket (300 cm) és ezt osztjuk a szórással (0.5 cm), azaz standardizáljuk az adatokat. Következő lépésként felosztjuk a számegyenest például hat részre az osztópontokkal. Ezeket az intervallumokat jelölje balról jobbra haladva rendre A 1,...,A 6. Megvizsgáljuk, hogy a kapott standardizált adatokból mennyi esik az egyes intervallumokba. Két intervallum határára eső értékeket az alacsonyabb osztályba soroljuk. Legyenek 14

ezek pl. rendre,,,,,. A standard normális eloszlás eloszlásfüggvényének értékeit felhasználva (lásd az erre vonatkozó táblázatot) megállapítjuk, hogy standard normális eloszlás esetén hány mérésnek kellene az egyes intervallumokba esni. Pl. esetén:. Mivel a minta elemű, az -be mérést várunk. esetén:. Tehát -be 15 mérést várunk. Az és értékekre kapott adatokat a következő táblázat foglalja össze. 16 15 19 19 15 16 3. táblázat 10 10 20 22 14 24 Kiszámítjuk a próbastatisztikát Megválasztjuk a szignifikanciaszintet:. Kikeressük a táblázatból az ehhez a szignifikanciaszinthez és 5 szabadságfokhoz tartozó kritikus értéket. Ez. Azaz a nullhipotézis elfogadható. 5.2. 4.5.2 Függetlenségvizsgálat (kontingenciavizsgálat) A valószínűségszámításból tudjuk, hogy ha két esemény független, akkor szorzatuk valószínűsége könnyen meghatározható a két esemény valószínűségének ismeretében (lásd a függetlenség definícióját). Legyen adott az A és B esemény, melyek valószínűségét nem ismerjük. Milyen módszerrel dönthető el a két eseményről, hogy függetlenek, vagy sem? Logikusnak tűnik a következő módszer: Elvégzünk n kísérletet. Jelölje g A, g B, és g AB rendre az A, B és AB események relatív gyakoriságát a kísérletsorozatban. Függetlenség esetén a közelítő egyenlőséget várjuk. Ha a g Ag B érték túlságosan eltér a g AB értéktől, akkor pedig arra gyanakszunk, hogy az A és B események nem függetlenek. Általánosabban a következő próbát kell elvégeznünk: Tegyük fel, hogy az és a események egyaránt teljes eseményrendszert alkotnak. Arról szeretnénk döntést hozni, igaz-e, hogy minden és minden esetén az A i és B j események függetlenek. Végezzünk el N darab kísérletet.. Az valószínűségi változó rendelje egy N kísérletből álló kísérletsorozathoz az A ib j esemény kísérletsorozatbeli gyakoriságát. Legyen a nullhipotézis és esetén, az ellenhipotézis és. Ha a nullhipotézis teljesül, akkor bizonyítható, hogy a 15

valószínűségi változó (k-1)(l-1) szabadságfokú eloszlású. azt a valószínűségi változót jelenti, mely egy N kísérletből álló kísérletsorozathoz a függetlenség esetén) rendeli. értéket (ennyi a várt gyakorisága az A ib j eseménynek Rögzítsük az szignifikanciaszintet! Tegyük fel, hogy egy N elemű kísérletsorozatban az valószínűségi változó O ij, a valószínűségi változó pedig E ij értéket vesz fel. Kiszámítjuk a próbastatisztikát: Ha a próbastatisztika értéke nagyobb elfogadjuk (egyoldali próba). -nál, akkor a nullhipotézist elutasítjuk, ha kisebb akkor Példa: A próba elvégzését egy példával szemléltetjük. Legyen két gyár. és., melyek csavarokat gyártanak. A csavarok minősége négyféle lehet,, és selejt. Döntsük el, hogy a csavarok minősége függ-e attól, hogy melyik gyárban készültek! Vegyünk az gyárból a -esből elemű mintát. A lehetséges eredményeket a következő táblázat szemlélteti. ( jelöli a táblázat i-edik sorának j-edik elemét. ) 4. táblázat - A B C selejt I. 15 20 21 11 67 II. 18 35 5 5 63 33 55 26 16 130 Számítsuk ki, hogy pl. az első sor első eleme helyén függetlenség esetén milyen értéket várunk!. Hasonlóan eljárva a többi rubrikában a következő értékeket kapjuk: 5. táblázat - A B C selejt 16

I. 17 28.3 13.4 8.2 II. 16 26.7 12.6 7.8 Hipotézisvizsgálat: alapfogalmak, A nullhipotézis az, hogy a termékek minősége nem függ a gyártól, az ellenhipotézis pedig az, hogy függ. (A null- és ellenhipotézis matematikai formába öntése már e fejezet bevezetőjében megtörtént.) Kiszámítjuk a próbastatisztikát, melynek értéke esetünkben 16.35. Az szignifikancia szinthez és (2-1)(4-1)=3 szabadságfokhoz tartozó kritikus érték 7.81. Eszerint a nullhipotézist el kell utasítanunk. A termékek minősége függ a gyártól. Megjegyzés: 2 2-es táblázat esetén a fenti próbastatisztika helyett a próbastatisztika használható. Az eredeti próbastatisztika ílymódon való átalakítását YATE-féle korrekciónak hívjuk. 6. 4.6 Összefoglalás 1. Egy töltőgép bizonyos típusú mosóport dobozokba adagol. Hosszú hónapok tapasztalata alapján megállapították, hogy a dobozok töltési tömegének szórása 8 gramm. A töltési tömeg normális eloszlása feltételezhető. Két egymást követő napon 40-40 dobozt vizsgáltak meg. A mintában az átlagos töltési tömegek: 1 nap: 595.5 gramm, 2. nap: 603.7 gramm. Állapítsa meg van-e szignifikáns különbség a két napon töltött dobozok átlagos töltési tömege között! (α = 0.05) 1. Egy motorkerékpárokat gyártó cég a gumiabroncsok tartósságát új adalékanyaggal kívánja növelni. Az új gumiabroncs tesztelésére 10 motorkerékpárra elől a régi, hátul az új abroncsot szerelték fel, s 1000 km megtétele után mérték a kopást. Az eredmények a következők: Abronc s Motorkerékpár 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Régi 0.25 0.50 0.14 0.33 0.25 0.30 0.24 0.29 0.42 0.48 Új 0.10 0.11 0.20 0.14 0.11 0.15 0.12 0.16 0.20 0.19 Ellenőrizze legfeljebb 5%-os szignifikanciaszinten azt a hipotézist, hogy az új abroncs tartósabb! 1. Egy vizsgálatot két mérési módszerrel (A és B) lehet elvégezni. Az A elemzéssel 12, a B elemzéssel 8 mintát vizsgáltak meg. A tapasztalati szórásnégyzet az első esetben volt., a második esetben Állapítsa meg hipotézis vizsgálattal, van-e a két módszer között különbség! 17

1. Valamely budapesti töltőállomáson a 8 óra és a 18 óra között, egy óra alatt a benzinkúthoz érkező gépkocsik számát feljegyezték. Óra gépkocsik száma (db) 8-9 80 9-10 44 10-11 24 11-12 32 12-13 56 13-14 12 14-15 22 15-16 28 16-17 36 17-18 66 Összesen: 400 Ellenőrizze annak a feltevésnek a helyességét, hogy a gépkocsik időbeni érkezése egyenletes eloszlást követ! (α = 0.05) 1. Egy csokoládékeverő gépről azt feltételezik, hogy 3 : 2 : 1 arányban kever a kakaóporhoz földimogyorót, mandulát és pisztáciát. Egy mintában 311 földimogyorót, 195 mandulát és 94 pisztáciát találtak. α = 0.05 szignifikancia szinten döntsük el, hogy a feltételezés megfelel-e a tapasztalatoknak! 2. Bizonyos anyaghibák számára nézve a következő adataink vannak: 0 1 2 3 4 327 340 160 53 20 Döntse el 0,99 biztonsággal, hogy tekinthető-e az anyaghibák száma λ=1 paraméterű Poisson-eloszlásnak? Irodalomjegyzék Hunyadi-Vita: Statisztika közgazdászoknak, KSH, Budapest, 2002 Keresztély-Sugár-Szarvas : Statisztika példatár közgazdászoknak, BKE, Nemzeti Tankönyvkiadó, 2005 Korpás A. : Általános statisztika I-II., Nemzeti Tankönyvkiadó, Budapest, 1996 Csanády V., Horváth R., Szalay L. : Matematikai statisztika, EFE Matematikai Intézet, Sopron, 1995 Závoti-Polgárné-Bischof : Statisztikai képletgyűjtemény és táblázatok, NYME Kiadó, Sopron, 2009 18

Csernyák L. : Valószínűségszámítás, Nemzeti Tankönyvkiadó, Budapest, 1990 Obádovics J. Gy.: Valószínűségszámítás és matematikai statisztika, Scolars Kiadó, Budapest, 2003 Reimann J., Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1991 Solt Gy. : Valószínűségszámítás, Műszaki Könyvkiadó, Budapest, 1971 Denkinger G. : Valószínűségszámítás, Nemzeti Tankönyvkiadó, Budapest, 1978 19