Matematikai statisztikai elemzések 3.

Hasonló dokumentumok
Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 6. MA3-6 modul. A statisztika alapfogalmai

Matematika III. 5. Nevezetes valószínűség-eloszlások Prof. Dr. Závoti, József

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Matematika III. 2. Eseményalgebra Prof. Dr. Závoti, József

KÖVETKEZTETŐ STATISZTIKA

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Matematikai statisztikai elemzések 6.

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 4. MA3-4 modul. A valószínűségi változó és jellemzői

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Matematika III. 4. A valószínűségi változó és jellemzői Prof. Dr. Závoti, József

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 1. MA3-1 modul. Kombinatorika

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

egyetemi jegyzet Meskó Balázs

Matematikai statisztikai elemzések 6.

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

A Statisztika alapjai

Matematikai geodéziai számítások 6.

Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József

Matematikai statisztikai elemzések 2.

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Matematikai statisztikai elemzések 5.

[Biomatematika 2] Orvosi biometria

Kísérlettervezés alapfogalmak

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Matematikai statisztikai elemzések 4.

Matematikai statisztikai elemzések 1.

Biomatematika 2 Orvosi biometria

Matematikai geodéziai számítások 5.

[Biomatematika 2] Orvosi biometria

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 2. MA3-2 modul. Eseményalgebra

Matematikai statisztikai elemzések 4.

Kutatásmódszertan és prezentációkészítés

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A maximum likelihood becslésről

Matematika III. 8. A szórás és a szóródás egyéb mérőszámai Prof. Dr. Závoti, József

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Matematikai geodéziai számítások 10.

Matematikai geodéziai számítások 6.

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Matematikai geodéziai számítások 5.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

6. Előadás. Vereb György, DE OEC BSI, október 12.

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Statisztika elméleti összefoglaló

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Matematikai statisztikai elemzések 2.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Normális eloszlás tesztje

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Bevezetés a hipotézisvizsgálatokba

Kísérlettervezés alapfogalmak

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Valószínűségszámítás összefoglaló

A valószínűségszámítás elemei

Statisztikai becslés

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 7. MA3-7 modul. Helyzetmutatók, átlagok, kvantilisek

Matematikai statisztikai elemzések 1.

Matematikai statisztikai elemzések 7.

A leíró statisztikák

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biostatisztika VIII. Mátyus László. 19 October

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Matematikai geodéziai számítások 7.

1. Példa. A gamma függvény és a Fubini-tétel.

Matematikai geodéziai számítások 9.

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 3. MA3-3 modul. A valószínűségszámítás elemei

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Matematikai geodéziai számítások 8.

A mérési eredmény megadása

Segítség az outputok értelmezéséhez

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Készítette: Fegyverneki Sándor

Valószínűségi változók. Várható érték és szórás

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Dr. Karácsony Zsolt. Miskolci Egyetem november

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Átírás:

Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematikai statisztikai elemzek 3. MSTE3 modul Becslelmélet: alapfogalmak, nevezetes statisztikák, intervallum-becsl SZÉKESFEHÉRVÁR 2010

Jelen szellemi terméket a szerzői jogról szóló 1999. évi LXXVI. törvény védi. Egzének vagy rzeinek másolása, felhasználás kizárólag a szerző írásos engedélyével lehetséges. Ez a modul a TÁMOP - 4.1.2-08/1/A-2009-0027 Tananyagfejlesztsel a GEO-ért projekt keretében kzült. A projektet az Európai Unió a Magyar Állam 44 706 488 Ft összegben támogatta. Lektor: Bischof Annamária Projektvezető: Dr. hc. Dr. Szepes András A projekt szakmai vezetője: Dr. Mélykúti Gábor dékán Copyright Nyugat-magyarországi Egyetem Geoinformatikai Kar 2010

Tartalom 3. Becslelmélet: alapfogalmak, nevezetes statisztikák, intervallum-becsl... 1 3.1 Bevezet... 1 3.2 Becslelméleti alapfogalmak... 1 3.2.1 A statisztikai minta fogalma... 1 3.2.2 Statisztikák... 1 3.2.3 A statisztikai becslek követelményei... 3 3.3 Becsli módszerek... 4 3.3.1 Maximum likelihood módszer, azaz a legnagyobb valószínűség elve... 4 3.3.2 Normális eloszlás esetén... 4 3.3.3 Laplace eloszlás esetén... 5 3.4 Konfidencia intervallum becsle:... 6 3.4.1 Konfidencia intervallum egy esemény valószínűségére... 6 3.4.2 Konfidencia intervallum a várható értékre... 8 3.4.3 Konfidencia intervallum két valószínűségi változó várható értékének különbségére... 13 3.4.4 Konfidencia intervallum egy normális eloszlású valószínűségi változó szórásnégyzetére... 16 3.4.5 Konfidenciaintervallum két normális eloszlású valószínűségi változó szórásnégyzetének hányadosára... 17 3.5 Összefoglalás... 19

3. fejezet - Becslelmélet: alapfogalmak, nevezetes statisztikák, intervallumbecsl 3.1 Bevezet Jelen modul a Matematikai statisztikai elemzek tárgy harmadik fejezete, modulja. Az itt következő ismeretek megértéhez javasoljuk, hogy olvassa el a Tárgy korábbi moduljainál írottakat. Amennyiben ez még nem lenne elég a megérthez, akkor forduljon a szerzőhöz segítségért. Jelen modul célja, hogy az Olvasó megismerkedjen a statisztikai becsl alapfogalmaival, képessé váljon a különböző statisztikai paraméterek becslének elvégzére. A becslelmélet alapfogalmainak elsajátítása, elveinek megadása után sorra vesszük a legfontosabb statisztikai paraméterek konfidencia-intervallumokba szorításának módszereit. Aki ezeket az eseteket tanulmányozza, az elvet megérti, az könnyűszerrel megoldhat olyan feladatokat is, amelyeket itt nem tárgyalunk. Külön felhívjuk a figyelmet a maximum-likelihood elv bevezetére, amely a statisztikai instrumentumok egyik leghatásosabb lehetősége. 3.2 Becslelméleti alapfogalmak A matematikai statisztika egyik fő területe a becslelmélet: A valószínűségi eloszlások jellemző mennyiségeinek meghatározását paraméterbecslnek nevezzük. Példa: a mintában található selejtarány alapján következtetünk az egz sokaságban valószínűsíthető selejtszámra. Konfidencia intervallum becsle: Mivel a becslsel kapott érték általában nem azonos a keresett elméleti értékkel, ezért műszaki biztonsági okokból szükséges, hogy alsó felső határt adjunk meg a becsült paraméterre. 3.2.1 A statisztikai minta fogalma Definíció: A statisztikai minta valamely valószínűségi változóra vonatkozó véges számú független kísérlet vagy megfigyel eredménye, azaz véges sok azonos eloszlású valószínűségi változó. Jelöl: Tekintsük a valószínűségi változót, ekkor a -re vonatkozó n elemű minta 1, 2,..., n Az n számú kísérlet elvégze során a i mintaelem egy-egy konkrét számértéket vesz fel: 1 = x1, 2 = x2,..., n = xn A statisztikai minta reprezentatív, ha a mintaelemek eloszlása megegyezik a vizsgált valószínűségi változó eloszlásával, hiszen mindegyik kísérletnél magát a valószínűségi változót figyeljük meg. A statisztikai minta elemei független valószínűségi változók, mivel a kísérleteket egymástól függetlenül végezzük. 3.2.2 Statisztikák A mintaelemekből tapasztalati jellemzőket, u.n. statisztikákat konstruálunk.

Matematikai statisztikai elemzek 3. 2010 Definíció: A statisztika a mintaelemek valamely függvénye: A statisztika maga is valószínűségi változó, eloszlásának meghatározása fontos feladat. A valószínűségszámítás tárgyalása során láttuk, hogy a valószínűségi változók eloszlása néhány számadattal (várható érték, szórás,...) kielégítően jellemezhető. A várható érték az eloszlás súlypontjáról, a szórás a változó értékeinek szétszórtságáról ad felvilágosítást. Ezekre az elméleti jellemzőkre a mintaelemekből igyekszünk következtetni úgy, hogy a 1, 2,...,n mintából különböző függvényeket képezünk. Valamely n = n(1,2,...,n) függvény minden konkrét minta esetén egyetlen számadatba tömöríti a mintaelemekben rejlő információt. Milyen függvényt konstruáljunk a mintaelemekből, hogy minél jobb közelítét kapjuk az elméleti várható értéknek, az elméleti szórásnak egyéb paramétereknek? 1. Mintaközép Tétel: Ha a valószínűségi változó várható értéke μ, szórása σ, akkor a mintaközépre Bizonyítás: 1. Rendezett minta: A véletlen, az zlel sorrendjében kapott mintaelemeket rendezzük nagyság szerint. Jelölje a nagyság szerint a legkisebbet, a megmaradók közül a legkisebbet, stb. Ekkor A rendezett mintaelemek már nem függetlenek nem is azonos eloszlásúak. 1. Mintaterjedelem: 1. Medián: Ha a mintanagyság páratlan, akkor a középső mintaelem a medián - páros mintanagyság esetén a két középső átlaga. MSTE3-2

Prof. Dr. Závoti József Becslelmélet: alapfogalmak, nevezetes statisztikák, intervallum-becsl 1. Tapasztalati (empirikus) szórásnégyzet: A mintaközéptől vett eltérek négyzetének átlaga: 1. Korrigált tapasztalati szórásnégyzet: 1. Variációs tényező (relatív szórás): 3.2.3 A statisztikai becslek követelményei 1. Torzítatlan becsl: Ha a valószínűségi változó elméleti jellemzője az a paraméter, az kívánjuk becsülni, akkor elvárjuk, hogy az statisztikai mintából statisztika értékei az 'a' szám körül ingadozzanak, azaz várható értéke a legyen: Példa: Az s2 tapasztalati szórás nem torzítatlan becsle a σ2 elméleti szórásnak. Bizonyítás: 1. Konzisztens becsl: A minta elemszámának növelével az statisztika egyre jobban közelítse meg az 'a' paramétert: 1. Elégséges becsl: MSTE3-3

Matematikai statisztikai elemzek 3. Az 2010 statisztika tartalmazza az 'a' paraméterre vonatkozó összes információt. 1. Efficiens becsl: A legkisebb szórású torzítatlan becsl. 3.3 Becsli módszerek Alapvető probléma, hogy egy adott valószínűségi eloszláshoz, hogyan található jó becsl. Létezik-e olyan általános matematikai elv, amely megadja, hogy milyen statisztikát számítsunk ahhoz, hogy a keresett paraméterek jó becslét kapjuk? 3.3.1 Maximum likelihood módszer, azaz a legnagyobb valószínűség elve Legyen együttes sűrűségfüggvénye: valószínűségi vektor változó - ahol, mintaelemeinek a becsli tartomány. A fenti összefügg alapján a likelihood függvényre az alábbi kifejezt kapjuk: A likelihood becsl a parciális deriváltak nullával való egyenlőségének szükségességéből adódik:, Elméleti gyakorlati szempontból két fontos esetet tárgyalunk: 3.3.2 Normális eloszlás esetén Az együttes sűrűségfüggvény:, - ahol σ a szórás, a várható érték. A likelihood függvény: A szélsőérték létezének szükséges feltétele alapján: MSTE3-4

Prof. Dr. Závoti József Becslelmélet: alapfogalmak, nevezetes statisztikák, intervallum-becsl,, A fentiekből az ismeretlen paraméterek becslére az alábbi összefüggek adódnak:, Tehát a hagyományos becsli eljárás normális eloszlás esetén a várható értéket a számtani középpel, a szórásnégyzetet a tapasztalati (empirikus) szórásnégyzettel becsüli. 3.3.3 Laplace eloszlás esetén A kétoldalú exponenciális eloszlás, azaz a Laplace eloszlás sűrűségfüggvénye: Az együttes sűrűségfüggvény: A Likelihood függvény a következő: A szélsőérték létezének szükséges feltétele alapján:,, ahol n+ n- a pozitív negatív deriváltak száma. A fenti egyenletekből az ismeretlen paraméterek becslére az alábbi összefüggeket kapjuk:, MSTE3-5

Matematikai statisztikai elemzek 3. 2010 Tehát Laplace eloszlás esetén a várható érték becslére a medián, a szórás becslére a legkisebb abszolút eltér (LAD) adódik. 3.4 Konfidencia intervallum becsle: Legyen η egy populációt leíró valószínűségi változó. Eloszlásának egy ismeretlen paramétere a, továbbá tegyük fel, hogy ismerjük az a paraméter egy torzítatlan becslére szolgáló sűrűségfüggvényét. Jelölje ezt f(x). statisztika Ekkor találhatunk olyan c1 c2 valós számokat (c1 < c2), melyekre. Ezek alapján ami azt jelenti, hogy a valószínűségi változó értéke Ennek megfelelően, ha tekintjük valószínűséggel esik a intervallumba. egy adott n elemű minta esetén felvett xn értéke körüli intervallumot, akkor ez az intervallum csülendő paramétert. Ezt az intervallumot a becsülendő paraméter hívjuk. valószínűséggel tartalmazza az értéket, azaz a be- konfidenciaszinthez tartozó konfidenciaintervallumának A konfidenciaszint értékét növelve a konfidencia intervallum hossza is növekszik. Ez azzal a veszéllyel járhat, hogy nem kapunk elég információt a becsülendő paraméter értékéről. Ha kicsire választjuk a konfidenciaszintet, akkor bár a konfidenciaintervallum kicsi lehet, de a paraméter beleesi valószínűsége is kicsi, így ez sem hordoz nagy információt. Általában a 0,95 körüli érték használatos. Összefoglalva: intervallumbecsl során a minta alapján egy olyan intervallumot határozunk meg, amely az előre megadott valószínűséggel vezzük konfidencia intervallumnak. tartalmazza a becsülni kívánt jellemzőt. Ezt az intervallumot ne- 3.4.1 Konfidencia intervallum egy esemény valószínűségére Legyen A egy η valószínűségi változóval kapcsolatos Vegyünk η-ra vonatkozóan Adjunk meg p értékére elemű mintákat. konfidenciaszinthez tartozó konfidencia-intervallumot! A p valószínűség becslére használjuk a Ha MSTE3-6 valószínűségű esemény. relatív gyakoriság statisztikát. a mintán ga értéket vesz fel, akkor a p valószínűségre adódó konfidenciaintervallum:

Prof. Dr. Závoti József Becslelmélet: alapfogalmak, nevezetes statisztikák, intervallum-becsl. A becslőfüggvény:, ahol k= a kedvező esetek száma n= az összes eset száma Mivel n rögzített, k pedig binomiális eloszlást követ, ezért is binomiális eloszlású lesz. Ekkor, ahol q=1-p. Tekintve, hogy σ2 ismeretlen, ezért az formulával becsüljük. Ahhoz, hogy a binomiális eloszlást normális eloszlással tudjuk közelíteni, a következő feltételnek kell teljesülnie: Ekkor változó standard normális eloszlású. Így a keresett konfidencia intervallum:, melyre Bizonyítás: A konfidencia intervallumba foglalás alapelve alapján írhatjuk: MSTE3-7

Matematikai statisztikai elemzek 3. 2010 Az egyenlőtlenségeket a gyökös kifejezsel végigszorozva: Az egyenlőtlenségeket p paraméterre rendezve: Vagy ami ugyanaz: Megjegyz: z szimmetrikus eloszlású, vagyis Példa: Tekintsünk 5000 db televíziókzüléket, amelyből 80 db rossz. Adjunk intervallumbecslt annak a valószínűségére, hogy egy televízió rossz, ha α=0,05! Tehát a keresett konfidenciaintervallum:, vagyis 3.4.2 Konfidencia intervallum a várható értékre A várható értékre vonatkozó konfidenciaintervallum meghatározása során három esetet kell megvizsgálnunk: σ ismert σ ismeretlen n 30 (nagy minta) σ ismeretlen n 30 (kis minta) ahol σ a sokasági szórás. MSTE3-8

Prof. Dr. Závoti József Becslelmélet: alapfogalmak, nevezetes statisztikák, intervallum-becsl 1. A σ szórás ismert Ezen konfidenciaintervallum meghatározását felhasználjuk a korábbi definíciók jelölek jelentének elmélyítére. Legyen η tetszőleges valószínűségi változó μ várható értékkel σ szórással. Tegyük fel, hogy σ ismert, μ-re akarunk egy konfidenciaintervallumot meghatározni. A várható értékre torzítatlan becsl az mintaközép. Vegyünk η-ra n 30 elemű mintákat! Milyen eloszlású az statisztika? normális eloszlású μ várható értékkel Megmutatható, hogy Most meg kell határoznunk egy Az intervallumot, melyre szórással.. standardizálásával a következő egyenlőséget nyerjük:. A normális eloszlás sűrűségfüggvényének szimmetriája miatt, így a z-eloszlás táblázatából kapjuk meg őket. Ezek szerint. A c1 c2 értékeket kifejezve. Ebből körüli intervallumra áttérve kapjuk a egyenlőséget. MSTE3-9

Matematikai statisztikai elemzek 3. Innét leolvasható, hogy a becsülendő paraméter az intervallumban van 2010 valószínűségi változó adott mintán felvett értéke körüli valószínűséggel. Ezt az intervallumot hívjuk a normális eloszlás várható értékére vonatkozó konfidencia intervallumnak. Feltétel: normális eloszlásból származó minta. Mivel σ ismert, ezért a becslőfüggvény standard normális eloszlású lesz, tehát: Ekkor az megbízhatósági szinthez tartozó konfidencia intervallum: melyre Bizonyítás: A konfidencia intervallumba foglalás alapelve alapján írhatjuk: Az egyenlőtlenségeket a gyökös kifejezsel végigszorozva: Az egyenlőtlenségeket paraméterre rendezve: Vagy ami ugyanaz: Példa: MSTE3-10

Prof. Dr. Závoti József Becslelmélet: alapfogalmak, nevezetes statisztikák, intervallum-becsl Tekintsük a következő mintát: Adjon intervallumbecslt a várható értékre, ha α=0,01! Megoldás: Tehát a keresett intervallum: 1. A σ szórás ismeretlen, n 30 (nagy minta) A gyakorlatban többször fordul elő az az eset, amikor az η valószínűségi változó szórását nem ismerjük. Ebben az esetben bizonyítható, hogy az valószínűségi változó n-1 szabadságfokú t-eloszlást követ. Az s a mintából számított korrigált tapasztalati szórás. Ekkor a c1 c2 értékeket a következő módon kapjuk: Az adott konfidenciaszinthez a t táblázatból kikereshetjük a értékeket. (A t eloszlás sűrűségfüggvénye páros!) Emiatt Azaz MSTE3-11

Matematikai statisztikai elemzek 3. Innét leolvasható, hogy a becsülendő μ paraméter az körüli intervallumban van 2010 valószínűségi változó adott mintán felvett értéke valószínűséggel. 1. A σ szórás ismeretlen, n < 30 (kis minta) Mivel σ nem ismert, ezért s2 tel becsüljük. Így a normális eloszlás helyett kénytelenek vagyunk a t (Student) eloszlású változót használni, ν=n-1 szabadságfokkal. Ekkor: Ekkor az 1-α megbízhatósági szinthez tartozó konfidencia intervallum: Bizonyítás: Megjegyz: t szimmetrikus eloszlású, vagyis Példa: Adott: Adjon intervallumbecslt a várható értékre, ha MSTE3-12

Prof. Dr. Závoti József Becslelmélet: alapfogalmak, nevezetes statisztikák, intervallum-becsl Megoldás: A keresett intervallum: 3.4.3 Konfidencia intervallum két valószínűségi változó várható értékének különbségére Adott az η1 η2 valószínűségi változó. Tegyük fel, hogy ismerjük η1 valószínűségi változóra vegyünk valószínűségi változó várható értéke. eleműt. Legyen μ1 μ2 a két Adjuk meg az (azaz konfidenciaszinthez tartozó konfidenciaintervallumot a várható értékek különbségére -re)! Torzítatlan becslre az értéke elemű mintát, az η2-re értékét. Az statisztika használható. Ha ill. valószínűségi változó mintán felvett, akkor a nyert konfidenciaintervallum:. Az eddigiekben csak egyetlen sokasági jellemzőt becsültünk minta alapján, a továbbiakban áttérünk arra az esetre, amikor két sokasági jellemzőt hasonlítunk össze. Kiindulásként feltesszük, hogy adott két sokaság, amelyeket ugyanazon ismérv szerint vizsgálunk. Elsőként a két sokasági várható érték becslével ismerkedünk meg rzletesebben. Itt is több esetet tárgyalunk: 1. Ismert σ1 σ2 Mivel ismertek a minták szórásai, ezért a MSTE3-13

Matematikai statisztikai elemzek 3. 2010 változó standard normális eloszlást követ. Ekkor az megbízhatósági szinthez tartozó konfidencia intervallum: Bizonyítás: A megfelelő műveletek elvégze után kapjuk a megoldást. 1. σ1 σ2 nem ismert, de σ1 = σ2 Amennyiben nem ismert, úgy egy-egy mintából az becsüljük őket. Jelölje korrigált szórásnégyzetekkel az átlagkülönbség szórására adott közelítt υ az eloszlásának szabadságfokát. Ekkor a következő konfidenciaintervallumot kapjuk:. A második esetben a sokasági szórásokat nem ismerjük. Külön-külön ugyan becsülhetők az egyes mintákból, de ekkor nem tudjuk meghatározni az intervallumbecslhez szükséges változó eloszlását, így ez az eset kezelhetetlen. Ezért csak azt az esetet tárgyaljuk, amikor feltételezhető, hogy a két szórásnégyzet megegyezik. Ekkor a közös szórásnégyzet az alábbi formulával becsülhető: ahol a mintákból számított korrigált szórásnégyzetek. Szükségünk van még a mintaátlagok különbségének szórásnégyzetére, ami a következőképpen becsülhető: ebből a becsült standard hiba Ezekből következik, hogy a MSTE3-14

Prof. Dr. Závoti József változó Ekkor az Becslelmélet: alapfogalmak, nevezetes statisztikák, intervallum-becsl szabadságfokú t eloszlást követ. megbízhatósági szinthez tartozó konfidencia intervallum: Bizonyítás: A megfelelő műveletek elvégze kapjuk a megoldást. Példa: Adott: Adjon intervallumbecslt a két várható érték különbségére, ha! Megoldás: Tehát a keresett intervallum: MSTE3-15

Matematikai statisztikai elemzek 3. 2010 3.4.4 Konfidencia intervallum egy normális eloszlású valószínűségi változó szórásnégyzetére Adott egy η normális eloszlású valószínűségi változó, melynek ismeretlen szórása σ. Vegyünk az η valószínűségi változóra n elemű mintákat. Adjuk meg σ2 értékére az használjuk az Ha konfidenciaszinthez tartozó konfidencia-intervallumot! σ2 becslére statisztikát. mintán felvett értéke, akkor a keresett konfidenciaintervallum: Ezt csak normális eloszlású sokaságokra alkalmazzuk, ha a sokaság eloszlása nem normális, akkor az alábbiakban bemutatásra kerülő intervallumbecsl nem alkalmazható. Ha a sokaság normális eloszlású, akkor belátható, hogy a változó szabadságfokú χ2 (Khi - négyzet) eloszlást követ. Ekkor az megbízhatósági szinthez tartozó konfidenciaintervallum: Bizonyítás: Megjegyz: a χ2 eloszlás nem szimmetrikus. Példa: Egy gyárban kzülő konzervek közül egy 100 elemű mintát választva a konzervek tömegeire a következő értékeket kapjuk: MSTE3-16

Prof. Dr. Závoti József Becslelmélet: alapfogalmak, nevezetes statisztikák, intervallum-becsl Tömeg (g) Darabszám - 240 8 240-245 22 245-250 32 250-255 28 255-260 10 Összesen: 100 Adjunk intervallumbecslt a tömeg szórásnégyzetére, ha s=5,5 ; α=0,05 n=100! Tehát a keresett intervallum: 3.4.5 Konfidenciaintervallum két normális eloszlású valószínűségi változó szórásnégyzetének hányadosára Adott az η1 η2 normális eloszlású valószínűségi változó. Ismeretlen szórásnégyzetük legyen rendre. Az első valószínűségi változóra vegyünk n1, a másodikra n2 elemű mintát. Adjuk meg értékére az Használjuk becslére az Ha Adott: mintán felvett értéke konfidenciaszinthez tartozó konfidenciaintervallumot! statisztikát. mintán felvett értéke, akkor a keresett konfidenciaintervallum: MSTE3-17

Matematikai statisztikai elemzek 3. 2010 Bizonyítható, hogy az változó Fisher eloszlást követ Ekkor az szabadságfokkal. megbízhatósági szinthez tartozó konfidencia intervallum: Bizonyítás: Példa: Adott: Adjon intervallumbecslt a szórásnégyzetek hányadosára, ha! Megoldás: MSTE3-18

Prof. Dr. Závoti József Becslelmélet: alapfogalmak, nevezetes statisztikák, intervallum-becsl Tehát a keresett intervallum: 3.5 Összefoglalás Példa: Egy adott életkorban a fácántyúkok tömegét írja le az, a fácánkakasokét a normális eloszlású valószínűségi változó. A fácántyúkokból, a kakasokból 8 elemű mintát veszünk, majd ezekből becsüljük a valószínűségi változók várható értékét szórását. A következőket kapjuk: a. Számítsuk ki a 0,99 konfidenciaszinthez tartozó konfidenciaintervallum határait a tyúkok tömegét leíró valószínűségi változó várható értékére! b. Számítsuk ki a 0,95 konfidenciaszinthez tartozó konfidenciaintervallum határait a kakasok tömegét leíró valószínűségi változó szórásnégyzetére! i. Számítsuk ki a 0,9 konfidenciaszinthez tartozó konfidenciaintervallum határait a tyúkok kakasok tömegét leíró valószínűségi változók várható értékének különbségére! a. Számítsuk ki a 0,95 konfidenciaszinthez tartozó konfidenciaintervallum határait a tyúkok kakasok tömegét leíró valószínűségi változók szórásnégyzetének hányadosára! Megoldás: a. Meg kell határoznunk a értéket. Ez a t eloszlás táblázatából kiolvasható: 3,25. Így a konfidenciaintervallum: [1,0095; 1,1784], Azaz. a. A értékeket táblázatból kikeressük. A dencia intervallumot kapjuk. egyenlőség figyelembevételével a konfi- i. Itt meg kell vizsgálnunk először, hogy feltehetjük-e, hogy a két valószínűségi változó szórásnégyzete megegyezik. Ezt a feladatot emiatt csak a következő fejezet után tudjuk megoldani. Ott vissza fogunk rá térni. a. Az F eloszlás táblázatából kiolvasható:. MSTE3-19

Matematikai statisztikai elemzek 3. Így 2010. Eszerint a keresett konfidenciaintervallum: Irodalomjegyzék Hunyadi - Vita : Statisztika közgazdászoknak, KSH, Budapest, 2002 Keresztély,Sugár,Szarvas: Statisztika példatár közgazdászoknak, BKE, Nemzeti Tankönyvkiadó, 2005 Korpás A. : Általános statisztika I-II., Nemzeti Tankönyvkiadó, Budapest, 1996 Csanády V., Horváth R., Szalay L.: Matematikai statisztika, EFE Matematikai Intézet, Sopron, 1995 Závoti, Polgárné, Bischof : Statisztikai képletgyűjtemény táblázatok, NYME Kiadó, Sopron, 2009 Csernyák L. : Valószínűségszámítás, Nemzeti Tankönyvkiadó, Budapest, 1990 Obádovics J. Gy.: Valószínűségszámítás matematikai statisztika, Scolars Kiadó, Budapest, 2003 Reimann J.,- Tóth J. : Valószínűségszámítás matematikai statisztika, Tankönyvkiadó, Budapest, 1991 Solt Gy. : Valószínűségszámítás, Műszaki Könyvkiadó, Budapest, 1971 Denkinger G. : Valószínűségszámítás, Nemzeti Tankönyvkiadó, Budapest, 1978 MSTE3-20