Dr. Karácsony Zsolt. Miskolci Egyetem november

Hasonló dokumentumok
egyetemi jegyzet Meskó Balázs

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika elméleti összefoglaló

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika Elıadások letölthetık a címrıl

A Statisztika alapjai

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Valószínűségi változók. Várható érték és szórás

[Biomatematika 2] Orvosi biometria

Készítette: Fegyverneki Sándor

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Matematikai statisztika szorgalmi feladatok

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Bevezetés a hipotézisvizsgálatokba

Abszolút folytonos valószín ségi változó (4. el adás)

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

A valószínűségszámítás elemei

Normális eloszlás paramétereire vonatkozó próbák

A következő feladat célja az, hogy egyszerű módon konstruáljunk Poisson folyamatokat.

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

KÖVETKEZTETŐ STATISZTIKA

1. Példa. A gamma függvény és a Fubini-tétel.

Többváltozós lineáris regressziós modell feltételeinek

[Biomatematika 2] Orvosi biometria

A maximum likelihood becslésről

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Valószín ségszámítás és statisztika

Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

3. Lineáris differenciálegyenletek

Matematikai statisztika Tómács Tibor

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Gyak. vez.: Palincza Richárd ( Gyakorlatok ideje/helye: CS , QBF10

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

Hipotézis vizsgálatok

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Számítógépes döntéstámogatás. Statisztikai elemzés

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Biomatematika 2 Orvosi biometria

0,1 P(X=1) = p p p(1-p) Egy p vszgő esemény bekövetkezik-e.

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

A mérési eredmény megadása

Valószínűségszámítás összefoglaló

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Valószín ségszámítás és statisztika

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

A konfidencia intervallum képlete: x± t( α /2, df )

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Bevezetés. 1. előadás, február 11. Módszerek. Tematika

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Hipotézis vizsgálatok

Kísérlettervezés alapfogalmak

A Matematikai Statisztika Alapjai

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

LINEÁRIS MODELLBEN május. 1. Lineáris modell, legkisebb négyzetek elve

Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg

Normális eloszlás tesztje

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Matematikai statisztikai elemzések 3.

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Matematikai geodéziai számítások 10.

Biometria. Gergó Lajos 2012.

Nemparaméteres próbák

Biostatisztika Összefoglalás

Alapfogalmak, valós számok Sorozatok, határérték Függvények határértéke, folytonosság A differenciálszámítás Függvénydiszkusszió Otthoni munka

Matematikai statisztikai elemzések 4.

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Matematika III. 5. Nevezetes valószínűség-eloszlások Prof. Dr. Závoti, József

Statisztikai módszerek a skálafüggetlen hálózatok

Matematikai statisztikai elemzések 4.

Matematikai statisztika feladatsor

Adatok statisztikai értékelésének főbb lehetőségei

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

Átírás:

Valószínűségszámítás és Matematikai statisztika Dr. Karácsony Zsolt Miskolci Egyetem, Alkalmazott Matematikai Tanszék 2013-2014 tanév 1. félév Miskolci Egyetem 2013. november 11-18 - 25. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 1/62

Tartalom 1 10. előadás 2 11. előadás 3 12. előadás Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 2/62

Tartalom 1 10. előadás 2 11. előadás 3 12. előadás Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 3/62

10. előadás Statisztika Alapfeladat Következtetés tapasztalati adatokból események ismeretlen valószínűségére vagy valószínűségi változók ismeretlen eloszlásfüggvényére és ezek paramétereire. (Vincze, 1975) Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 4/62

10. előadás Minta, mintavétel Bevezetés A valószínűség-számítás tárgyalása során feltételeztük, hogy a háttérben egy (Ω, A, P) valószínűségi mező áll, az X vagy ξ valószínűségi változó Ω-n értelmezett, X eloszlásfüggvénye F és F ismert. A statisztikai megfigyeléseket éppen azért végezzük, hogy az F eloszlásfüggvényt megismerjük. Legyen Θ egy nemüres halmaz, minden θ Θ legyen (Ω, A, P θ ) valószínűségi mező. Az (Ω, A, P θ ), θ Θ összeséget statisztikai mintának nevezzük. Θ-t paramétertérnek, elemeit pedig paramétereknek nevezzük. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 5/62

10. előadás Minta, mintavétel Az X 1, X 2,..., X n független, azonos eloszlású valószínűségi változókat mintának nevezzük. Rögzített ω Ω esetén az x 1 = X 1 (ω), x 2 = X 2 (ω),..., x n = X n (ω) szám n-est minta realizációjának nevezzük. Empírikus eloszlásfüggvény Próbáljuk meg rekonstruálni a minta alapján az F eloszlásfüggvényt! Legyen ω Ω rögzített, jelölje X 1 (ω) X 2 (ω)... X n (ω) az X 1 (ω), X 2 (ω),..., X n (ω) minta realizáció elemeinek nagyság szerint növekvő permutációja. Az X 1 X 2... X n valószínűségi változókat rendezett mintának nevezzük. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 6/62

10. előadás Empírikus eloszlásfüggvény Legyen X 1, X 2,..., X n rendezett minta. Az Fn (x) = 0, ha x X 1, k n, ha X k x X k+1, k = 1, 2,..., n 1 1, ha x > X n. függvényt empírikus eloszlásfüggvénynek nevezzük. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 7/62

10. előadás Empírikus eloszlásfüggvénynekk Tétel Rögzített x R esetén az alábbiak teljesülnek: a.) nf n (x) binomiális eloszlású; b.) F n (x) várható értéke F (x); c.) F n (x) szórása 0-hoz tart, ha n ; d.) F n (x) F (x) sztochasztikusan, ha n. Tétel Bármely rögzített x R esetén lim F n n (x) = F (x) majdnem biztosan; lim F n n (x + 0) = F (x + 0) majdnem biztosan. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 8/62

10. előadás A matematikai statisztika alaptétele Glivenko-tétele Ha az X 1, X 2,..., X n független minta, akkor sup Fn (x) F (x) 0, x R ha n teljesül 1 valószínűséggel. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 9/62

10. előadás Statisztikák Sokféle statisztika használatos, ki kell emelni ezek közül is a hisztogramokat. Tekintsünk egy X 1, X 2,..., X n mintát! Osszuk fel a számegyenest y 0 < y 1 <... < y r osztópontokkal. Tegyük fel, hogy minden mintaelem beleesik az (y 0, y r ) intervallumba. Jelölje ν i az [y i 1, y i ) intervallumba eső elemek számát. (i = 1, 2,..., r) Rajzoljunk az [y i 1, y i ) intervallum felé ν i -vel arányos területű téglalapot.(i = 1, 2,..., r) Így megkapjuk a hisztogramot. Ha a téglalapok összterülete n, akkor a gyakorisági-hisztogramhoz jutunk. Ha a téglalapok öszterülete 1, akkor a sűrűség-hisztogramhoz jutunk. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 10/62

10. előadás Statisztikák A gyakorisági-hisztogram az az f n valós függvény, melyre { νi y f n (x) = i y i 1, ha x [y i 1, y i ], i = 1, 2,..., n 0, ha x / [y 0, y r ]. Megjegyzés Sűrűség-hisztogram esetén az i-dik téglalap magassága: ν i n(y i y i 1 ). Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 11/62

10. előadás Statisztikák Legyen x 1, x 2,..., x n minta X -re. Az X = 1 n (x 1 + x 2 +... + x n ) valószínűségi változót empírikus középnek nevezzük. Legyen x 1, x 2,..., x n minta X -re. Az s 2 n = 1 n n (x i X ) 2 i=1 mennyiséget empírikus szórásnégyzetnek nevezzük. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 12/62

10. előadás Statisztikák Legyen x 1, x 2,..., x n minta X -re. Az s 2 n = 1 n 1 n (x i X ) 2 mennyiséget korrigált empírikus szórásnégyzetnek nevezzük. i=1 Megjegyzés Az empírikus szórásnégyzet segítségével következtethetünk az X ismeretlen szórásnégyzetére. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 13/62

10. előadás Steiner-formula Tétel (Steiner-formula) Tetszőleges a R esetén ns 2 n = n (x i a) 2 n(x a) 2. i=1 Bizonyítás n nsn 2 = [(x i a) (X a)] 2 = i=1 n (x i a) 2 2 i=1 n (x i a) 2 n(x a) 2. n n (x i a)(x a) + (X a) 2 = i=1 i=1 i=1 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 14/62

10. előadás Steiner-formula Megjegyzés Számolhatjuk ki az sn 2 a = m-et írunk. várható értékét, ha a Steiner formulába Tétel Legyen E(X ) = m, D 2 (X ) = σ 2. Ekkor E(s 2 n ) = σ 2. Bizonyítás [ ] E(sn 2 1 n ) = E (x i m) 2 n (X m)2 = n 1 n 1 i=1 1 n E(x i m) 2 n n 1 n 1 E(X m)2. i=1 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 15/62

10. előadás Steiner-formula Bizonyítás Mivel E(x i m) 2 = σ 2, illetve E(X m) 2 = E ( x 1 +...+x n nm) 2 n = 1 nσ 2, ezért n 2 E(s 2 n ) = n n 1 σ2 n σ 2 n 1 n = σ2, tehát a korrigált empírikus szórásnégyzet várható értéke éppen az elméleti szórásnégyzet. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 16/62

10. előadás Statisztikák Legyen x 1, x 2,..., x n minta X -re. A k-dik tapasztalati momentum 1 n alatt a következő kifejezést értjük: xi k. n Legyen x 1, x 2,..., x n minta X -re. A minta terjedelme alatt a xn x1 mennyiséget értjük. Legyen x 1, x 2,..., x n minta X -re. A szórási együttható alatt a sn X mennyiséget értjük. i=1 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 17/62

10. előadás Statisztikák Legyen x 1, x 2,..., x n minta X -re. A minta mediánja alatt a { x m+1, ha n = 2m + 1, med(x) = xm+x m+1 2, ha n = 2m mennyiséget értjük. Legyen x 1, x 2,..., x n minta X -re. A minta medián abszolút eltérése alatt a mennyiséget értjük. MAD(x) = med( x i med(x) ) Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 18/62

10. előadás Kvantilis Adott az F eloszlásfüggvény és a p valószínűség. Az x p p-kvantilis, ha p = F (x p ). Ha p = 0.5, akkor mediánnak, még p = 0.25 és 0.75 esetén alsó illetve felső kvartilisnek nevezzük. Egy sokaság p tapasztalati kvartilise x p = (1 q)xa + qx B, A = [np]; B = [np] + 1; q = {np}. Példa Ha p = 0.21, n = 40, akkor x p = (1 0.4)x 8 + 0.4x 9. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 19/62

10. előadás Becslési módszerek Bevezetés A becsléselméletben gyakran feltételezzük, hogy a megfigyelt mennyiségek független valószínűségi változók, közös F θ0 eloszlással, amely egy meghatározott {F θ θ Θ} eloszláshalmazba tartozik. Θ általában R k egy részhalmaza. Megpróbáljuk θ 0 értékét a megfigyelések alapján meghatározni. Legyen adott az X 1, X 2,..., X n minta, melynek sűrűségfüggvénye f és ez a Θ paramétertől függ. Tehát adott a {f (., θ) θ Θ R k }. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 20/62

10. előadás Becslési módszerek Pontbecslésnek nevezzük a mintaelemek mérhető függvényét, ahol a becslés és a paraméter koordinátáinak a száma megegyezik, azaz Θ n (X 1, X 2,..., X n ) Θ. Intervallumbecslésnek nevezzük a Γ tartományt 1 α megbízhatósági szinttel, ha Γ Θ és P(θ Γ) = 1 α. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 21/62

10. előadás Pontbecslés Legyen adott az x 1, x 2,..., x n minta f (x 1, x 2,..., x n ; Θ) sűrűségfüggvénnyel. A Θ n (x 1, x 2,..., x n ) (röviden Θ n ) a Θ paraméter torzítatlan becslése, ha E( Θ n ) = Θ. Θ n a Θ paraméter aszimptotikusan torzítatlan becslése, ha Megjegyzés lim E( Θ n ) = Θ. n Az átlag a várható érték torzítatlan becslése. A korrigált tapasztalati szórásnégyzet torzítatlan becslése a szórásnégyzetnek. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 22/62

10. előadás Pontbecslés Adott a Θ n és a Θ n torzítatlan becslés. A Θ n hatásosabb a Θ n becslésnél, ha D 2 ( Θ n ) D 2 ( Θ n ). A Θ n (x 1, x2,..., x n ) sorozat konzisztens becsléssorozata a Θ paraméterre, ha ( ) lim P Θ n Θ > ε = 0, n minden ε > 0 esetén. A Θ n (x 1, x2,..., x n ) sorozat erősen konzisztens becsléssorozata a Θ paraméterre, ha n esetén E( Θ n ) = Θ, és lim n D2 ( Θ n ) = 0. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 23/62

10. előadás Likelihood-becslés Tekintsünk egy X -re adott x 1, x 2,..., x n mintát. Az L(x 1, x 2,..., x n ; θ) = n f (x i, θ) i=1 függvényt az x 1, x 2,..., x n mintához tartozó likelihood-függvénynek nevezzük. A Θ statisztikát a Θ paraméter maximum likelihood-becslésének nevezzük, ha Θ globális maximumhelye a likelihood-függvénynek, azaz L(x 1, x 2,..., x n ; Θ(x 1, x 2,..., x n )) L(x 1, x 2,..., x n, θ) minden θ Θ esetén. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 24/62

10. előadás Likelihood-becslés Példa: λ paraméterű Poisson-eloszlás Legyen adott az x 1, x 2,..., x n minta. Az általánosított sűrűségfüggvényhez használjuk az f (k, λ) = λk k! e λ. logl(x 1, x 2,..., x n ; λ) = logλ meghatározni a maximumát. n x i i=1 n logx i! nλ, ennek kell i=1 A számítások elvégzése után kapjuk, hogy 1 λ ahonnan λ n = x. Még ellenőrizni kell, hogy 2 logl(x xi 2 1, x 2,..., x n, λ) = 1 n λ 2 i=1 x i < 0. n x i n = 0, i=1 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 25/62

10. előadás Likelihood-becslés Példa: λ paraméterű exponenciális-eloszlás f (x, λ) = λe λx logl(x 1, x 2,..., x n, λ) = nlogλ λ n n λ x i = 0 λ = 1 x. i=1 n i=1 x i Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 26/62

10. előadás Momentumok módszere Ha egy valószínűségi változónak létezik a várható értéke, akkor a nagy számok törvénye alapján, ha x 1, x 2,... független, vele azonos eloszlású valószínűségi változók sorozata, akkor a részletösszegek átlaga tart a várható értékhez. Továbbá tudjuk, hogy ha általában nem is, de elég gyenge feltételek mellett a momentumok meghatározzák az eloszlást. µ k = E(x k ) és m k = xk 1 +xk 2 +...+xk n n és µ k = m k. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 27/62

Köszönöm a figyelmet! Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 28/62

Tartalom 1 10. előadás 2 11. előadás 3 12. előadás Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 29/62

11. előadás Intervallum becslés Bevezetés Az eddigiek során arra törekedtünk, hogy megfigyeléseink alapján egyetlen értékkel becsüljük az ismeretlen paramétert. Ebben a szakaszban a feladat megadni egy Γ Θ tartományt, amelyre P(θ Γ) = 1 α. Legyen a Θ R, az x 1, x 2,..., x n minta. A Θ n (x 1, x 2,..., x n ) Θ Θ n (x 1, x 2,..., x n ) 1 α megbízhatóságú konfidencia intervallum a Θ paraméterre, ha P Θ ( Θ n Θ Θ n ) = 1 α. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 30/62

11. előadás Intervallum becslés 1. Tekintsünk egy x 1, x 2,..., x n mintát az m ismeretlen várható értékű és σ 2 ismert szórásnégyzetű normális eloszlásra. (X N (m, σ 2 )) Tudjuk, hogy X N (m, σ2 n ), így n(x m) σ standard normális eloszlású. Ezért egy adott 1 ε megbízhatósági szinthez válasszunk olyan u R-t, hogy n(x m) P m ( u σ u) = 1 ε, Φ(u) = 1 ε 2, ahonnan P m (X u ε σ 2 n < m < X + u ε σ 2 n ) = 1 ε. Tehát az m-re kapott 1 ε megbízhatósági szintű konfidencia intervallum: ( ) σ σ X u ε ; X + u ε 2 n 2 n Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 31/62

11. előadás Intervallum becslés 2. Szerkesszünk konfidencia intervallumot a σ 2 szórásnégyzetre, ha az m várható érték ismert. Felhasználjuk, hogy n (x i m) 2 i=1 statisztika χ 2 eloszlású n szabadsági fokkal, így ( ) 1 n i m) χ 2 ε i=1(x 2 ; 1 n χ 2 (x i m) 2. ε i=1 σ 2 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 32/62

11. előadás Intervallum becslés 3. Adjunk meg konfidencia intervallumot m-re, ha σ 2 is ismeretlen! Mivel n(x m) s n t-eloszlású n 1 szabadsági fokkal, így n(x m) P( t ε < 2 sn < t ε ) = 1 ε, 2 ahonnan a konfidencia intervallum: ( X t ε 2 s n n ; X + t ε 2 sn ) n Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 33/62

11. előadás Intervallum becslés 4. Szerkesszünk konfidencia intervallumot egy A esemény ismeretlen P(A) = p valószínűségére az A eseményre végzett n számú független kísérlet alapján. A Csebisev-egyenlőtlenségből kapjuk, hogy ( P X p ) p(1 p) < ε > 1 1 n ε 2, valamint felhasználva, hogy p(1 p) 1 4 kapjuk, hogy ( ) X P p 1 < ε > 1 1 4n ε 2. Így a kapott intervallum ( X ε 1 2 n ; X + ε 1 ) 2 n Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 34/62

11. előadás Hipotézisvizsgálat A vizsgálandó feltételezést nullhipotézisnek nevezzük (jele: H 0 ), ezzel ellentétes álĺıtás az alternatív hipotézis (jele: H 1 ). Azt az eljárást, amelynek során a minta segítségével döntünk a hipotézisről, statisztikai próbának nevezzük. Ha az eloszlás jellege ismert és a nullhipotézisünk az eloszlás valamely paraméterére vonatkozik, akkor paraméteres próbáról beszélünk. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 35/62

11. előadás Hipotézisvizsgálat Ha Θ 0 egy pontból álló halmaz, a nullhipotézis egyszerű, ellenkedző esetben összetett. A H 0 : Θ = Θ 0 nullhipotézis és H 1 : Θ > Θ 0 (H 1 : Θ < Θ 0 ) ellenhipotézis esetén egyoldali nullhipotézisről illetve egyoldali próbáról beszélünk. A H 0 : Θ = Θ 0 nullhipotézis és H 1 : Θ Θ 0 alakú hipotézis esetén kétoldali próbáról beszélünk. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 36/62

11. előadás Hipotézisvizsgálat Bontsuk fel a teret C 0 és C 1 diszjunkt halmazokra. Ha a minta x 1, x 2,..., x n realizációja a C 0 halmaz eleme, akkor elfogadjuk a nullhipotézist, ha x 1, x 2,..., x n a C 1 eleme, akkor H 1 alternatív hipotézist fogadjuk el. A C 0 halmazt elfogadási tartománynak, a C 1 halmazt kritikus tartománynak nevezzük. A P θ (C 1 ) α, θ Θ 0 realizációt teljesítő α számot a próba terjedelmének (kritikus tartomány) nevezzük. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 37/62

11. előadás Hipotézisvizsgálat Ha adott C 1 tartomány esetén elfogadjuk vagy elvetjük a hipotézist a paraméterre vagy az F alakjára, akkor azt statisztikai próbának nevezzük. Egy próbát α-szintűnek nevezünk, ha P((x 1, x 2,..., x n ) C 1 H 0 ) α. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 38/62

11. előadás Hipotézisvizsgálat Ha H 0 igaz és ennek ellenére elvetjük, akkor azt mondjuk, hogy elsőfajú hibát követünk el. Megjegyzés Az elsőfajú hiba elkövetésének valószínűsége P((x 1, x 2,..., x n ) C 1 H 0 ) = α. Tehát a próba szintjével együtt az elsőfajú hiba elkövetésének a valószínűségét is rögzítjük. Ha a H 1 hipotézis az igaz és mégis elfogadjuk H 0 -t, akkor azt mondjuk, hogy másodfajú hibát követünk el. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 39/62

11. előadás Hipotézisvizsgálat Jelölje H 0 azt, hogy Θ a valódi paraméter. Rögzített C 1 kritikus tartomány esetén a γ(h θ ) = P((x 1, x 2,..., x n ) C 1 H 0 ), θ Θ valószínűséget a próba erőfüggvényének nevezzük. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 40/62

11. előadás Próbák U-próba (1 mintás eset) Az U-próba segítségével ismert szórású, normális eloszlású valószínűségi változó várható értékére vonatkozó hipotézisről dönthetünk. E(X ) = m ismeretlen Hipotézis: D(X ) = σ 0 ismert paraméter. H 0 : E(X ) = m 0 H 1 : E(X ) = m 1 m 0. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 41/62

11. előadás Próbák U-próba (1 mintás eset) Ha a nullhipotézisünk igaz, akkor a próbastatisztika U = X m 0 n σ 0 standard normális eloszlású valószínűségi változó. Ha tehát igaz a nullhipotézis, akkor az U statisztika konkrét értéke 1 α valószínűséggel ( u α, u α ) intervallumba esik. 2 2 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 42/62

11. előadás Próbák U-próba (1 mintás eset) Így az elfogadási tartomány: C 0 = Kritikus tartomány: C 1 = { (x 1, x 2,..., x n ) : { (x 1, x 2,..., x n ) : X m 0 σ 0 X m 0 σ 0 } n < u α 2 } n u α 2 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 43/62

11. előadás Próbák U-próba (2 mintás eset) Két független, ismert szórású, normális eloszlású valószínűségi változó várható értékeinek azonosságáról dönthetünk. (X N (m 1, σ 2 1 ); Y N (m 2, σ 2 2 ); n 1 illetve n 2 elemű mintát tekintve.) Hipotézis: H 0 : m 1 = m 2 ; U-próbastatisztika: H 1 := m 1 m 2. U = X Y. σ 2 1 n 1 + σ2 2 n 2 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 44/62

11. előadás Próbák t-próba (1 mintás eset) Legyen X N (m, σ 2 ), ahol m és σ 2 is ismeretlenek. Tekintsünk egy x 1, x 2,..., x n n elemű mintát. A hipotézisünk a várható értékre vonatkozik: H 0 : m = m 0 ; H 1 := m m 0. Ismert, hogy az X m s n valószínűségi változó (n 1) n szabadságfokú t- eloszlású. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 45/62

11. előadás Próbák t-próba (1 mintás eset) Tehát, ha a nullhipotézis igaz, akkor a t = X m s n n próbastatisztika (n 1) paraméterű t eloszlású. A kritikus tartomány: { ( α )} C 1 = (x 1, x 2,..., x n ) : t t n 1 2 Az elfogadási tartomány: { ( α )} C 0 = (x 1, x 2,..., x n ) : t < t n 1 2 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 46/62

11. előadás Próbák t-próba (2 mintás eset) Legyen X és Y független, normális eloszlású valószínűségi változó. (E(x) = m 1 ; D(X ) = σ 1 ; E(Y ) = m 2 ; D(Y ) = σ 2 ahol m 1, m 2, σ 1, σ 2 ismeretlenek.) Az X valószínűségi változó n 1, még az Y n 2 elemű egymástól független minták. A hipotézis a várható értékek azonosságára vonatkozik: A próba szintje 1 α. H 0 : m 1 = m 2 ; H 1 := m 1 m 2. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 47/62

11. előadás Próbák t-próba (2 mintás eset) A nullhipotézisről fennál, hogy X Y n t = 1 n 2 (n 1 + n 2 2) (n 1 1)sn 2 1 + (n 2 1)sn 2 n 1 + n 2 2 statisztika n 1 + n 2 2 paraméterű t-eloszlású. A { ( α )} C 1 = (x 1, x 2,..., x n1, y 1, y 2,..., y n2 ) : t t n1 +n 2 2 2 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 48/62

11. előadás Próbák F-próba Két független, normális eloszlású valószínűségi változó szórásainak egyenlőségét ellenőrzi az F -próba. X N (m 1, σ 2 1 ), n 1 elemű minta; Y N (m 2, σ 2 2 ), n 2 elemű minta; A próba szintje: 1 α. H 0 : σ 2 1 = σ 2 2; H 1 := σ 2 1 σ 2 2. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 49/62

11. előadás Próbák F-próba Felhasználva, hogy n 1 1 s 2 σ1 2 1 és n 2 1 σ2 2 s 2 2 χ 2 eloszlásúak (n 1 1) illetve (n 2 1) paraméterekkel és függetlenek, kapjuk, hogy a nullhipotézisre fennáll az F = s 2 1 s2 2 próbastatisztika F -eloszlású (n 1 1, n 2 1) paraméterekkel. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 50/62

11. előadás Próbák χ 2 -próba A χ 2 -próba segítségével normális eloszlású valószínűségi változók ismeretlen szórásnégyzetéről dönthetünk. Legyen X N (m, σ 2 ) eloszlású, ahol m és σ is ismeretlen paraméterek. A hipotézis: A próba szintje: 1 α. H 0 : σ = σ 0 ; H 1 := σ σ 0. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 51/62

11. előadás Próbák χ 2 -próba Tudjuk, hogy (n 1)s 2 χ 2 -eloszlású (n 1) paraméterrel. Ha a σ 2 nullhipotézis igaz, akkor h = (n 1)s 2 próbastatisztika χ 2 eloszlású. σ 2 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 52/62

Köszönöm a figyelmet! Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 53/62

Tartalom 1 10. előadás 2 11. előadás 3 12. előadás Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 54/62

12. előadás Regressziós egyenesek Beveztés Adott 2 mérési adatsor, amelyek alapján elkészíthető a regressziós egyenes. Adott (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ). Keressük az y = bx + a egyenest, melyre Q(a, b) = n (y i bx i a) 2 min. i=1 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 55/62

12. előadás Regressziós egyenesek Vezessük be a következő jelöléseket: n i=1 X = x n i i=1 ; Y = y i n n Q x = n xi 2 nx 2 ; Q y = i=1 Q xy = n i=1 n x i y i nx Y. i=1 Ekkor a regressziós egyenes egyenlete: b = Q xy Q x ; a = Y bx. y 2 i ny 2 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 56/62

12. előadás Regressziós egyenesek Általánosan y = b 0 + b 1 x 1 +... + b n x n. Vezessük be a β = (b 0, b 1,..., b n ) jelölést. A β becslését szeretnénk meghatározni. Ez az X X β = X y egyenletrendszer megoldásával adódik. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 57/62

12. előadás Regressziós egyenesek Az X X β = X y egyenletrendszert normál-egyenletrendszernek nevezzük. Megjegyzés X X egy pozitív definit mátrix, ezért β = (X X ) 1 X y. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 58/62

12. előadás Regressziós egyenesek Példa Adottak a következő (1,2); (2,4); (3,5); (4,8) pontok. Határozzuk meg az y = a + bx alakú regressziós egyenest! (Megoldás: y=0+1.9x) Példa Tekintsük a ξ valószínűségi változót, melyről tudjuk a következőket: 1 38; 2 53; 3 61; 4 48. 95%-os szinten ellenőrizzük, hogy a minta egyenletes eloszlású-e? Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 59/62

12. előadás Cramer-Rao egyenlőtlenség Tétel Legyen az (Ω, A, P θ ), θ Θ statisztikai mezőn a T statisztika g(θ) torzítatlan becslése, ahol g egy adott függvény Θ-n és legyen E(T ) 2 lokálisan korlátos függvény Θ-n. Ekkor g folytonosan differenciálható Θ-n, I (θ) 0 minden θ Θ esetén és D 2 (T ) (g (θ)) 2 I (θ), ahol I (θ) a Fisher-féle információmennyiség. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 60/62

12. előadás Rao-Blackwell tétel Legyen (Ω, A, P θ ), θ Θ statisztikai mező. A T : Ω R k statisztikát elégségesnek nevezzük, ha a P θ (A T = t), A A, t R k feltételes valószínűségeknek megadható θ-tól független közös értéke. Rao-Blackwell tétel Legyen T elégséges statisztika az (Ω, A, P θ ) statisztikai mezőn és legyen ĝ(θ) a g(θ) véges szórású, torzítatlan becslése. Ekkor a h(t) = E(ĝ(θ) T = t) függvényre fennállnak az alábbiak h csak t-től függ és nem függ θ-tól; h(t ) torzítatlan becslése g(θ)-nak; D 2 (h(t )) D 2 (ĝ(θ)). Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 61/62

Köszönöm a figyelmet! Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 62/62