Dr. Karácsony Zsolt. Miskolci Egyetem november

Valószínűségszámítás és Matematikai statisztika Dr. Karácsony Zsolt Miskolci Egyetem, Alkalmazott Matematikai Tanszék 2013-2014 tanév 1. félév Miskolci Egyetem 2013. november 11-18 - 25. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 1/62

Tartalom 1 10. előadás 2 11. előadás 3 12. előadás Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 2/62

10. előadás Statisztika Alapfeladat Következtetés tapasztalati adatokból események ismeretlen valószínűségére vagy valószínűségi változók ismeretlen eloszlásfüggvényére és ezek paramétereire. (Vincze, 1975) Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 4/62

10. előadás Minta, mintavétel Bevezetés A valószínűség-számítás tárgyalása során feltételeztük, hogy a háttérben egy (Ω, A, P) valószínűségi mező áll, az X vagy ξ valószínűségi változó Ω-n értelmezett, X eloszlásfüggvénye F és F ismert. A statisztikai megfigyeléseket éppen azért végezzük, hogy az F eloszlásfüggvényt megismerjük. Legyen Θ egy nemüres halmaz, minden θ Θ legyen (Ω, A, P θ ) valószínűségi mező. Az (Ω, A, P θ ), θ Θ összeséget statisztikai mintának nevezzük. Θ-t paramétertérnek, elemeit pedig paramétereknek nevezzük. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 5/62

10. előadás Minta, mintavétel Az X 1, X 2,..., X n független, azonos eloszlású valószínűségi változókat mintának nevezzük. Rögzített ω Ω esetén az x 1 = X 1 (ω), x 2 = X 2 (ω),..., x n = X n (ω) szám n-est minta realizációjának nevezzük. Empírikus eloszlásfüggvény Próbáljuk meg rekonstruálni a minta alapján az F eloszlásfüggvényt! Legyen ω Ω rögzített, jelölje X 1 (ω) X 2 (ω)... X n (ω) az X 1 (ω), X 2 (ω),..., X n (ω) minta realizáció elemeinek nagyság szerint növekvő permutációja. Az X 1 X 2... X n valószínűségi változókat rendezett mintának nevezzük. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 6/62

10. előadás Empírikus eloszlásfüggvény Legyen X 1, X 2,..., X n rendezett minta. Az Fn (x) = 0, ha x X 1, k n, ha X k x X k+1, k = 1, 2,..., n 1 1, ha x > X n. függvényt empírikus eloszlásfüggvénynek nevezzük. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 7/62

10. előadás Empírikus eloszlásfüggvénynekk Tétel Rögzített x R esetén az alábbiak teljesülnek: a.) nf n (x) binomiális eloszlású; b.) F n (x) várható értéke F (x); c.) F n (x) szórása 0-hoz tart, ha n ; d.) F n (x) F (x) sztochasztikusan, ha n. Tétel Bármely rögzített x R esetén lim F n n (x) = F (x) majdnem biztosan; lim F n n (x + 0) = F (x + 0) majdnem biztosan. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 8/62

10. előadás A matematikai statisztika alaptétele Glivenko-tétele Ha az X 1, X 2,..., X n független minta, akkor sup Fn (x) F (x) 0, x R ha n teljesül 1 valószínűséggel. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 9/62

10. előadás Statisztikák Sokféle statisztika használatos, ki kell emelni ezek közül is a hisztogramokat. Tekintsünk egy X 1, X 2,..., X n mintát! Osszuk fel a számegyenest y 0 < y 1 <... < y r osztópontokkal. Tegyük fel, hogy minden mintaelem beleesik az (y 0, y r ) intervallumba. Jelölje ν i az [y i 1, y i ) intervallumba eső elemek számát. (i = 1, 2,..., r) Rajzoljunk az [y i 1, y i ) intervallum felé ν i -vel arányos területű téglalapot.(i = 1, 2,..., r) Így megkapjuk a hisztogramot. Ha a téglalapok összterülete n, akkor a gyakorisági-hisztogramhoz jutunk. Ha a téglalapok öszterülete 1, akkor a sűrűség-hisztogramhoz jutunk. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 10/62

10. előadás Statisztikák A gyakorisági-hisztogram az az f n valós függvény, melyre { νi y f n (x) = i y i 1, ha x [y i 1, y i ], i = 1, 2,..., n 0, ha x / [y 0, y r ]. Megjegyzés Sűrűség-hisztogram esetén az i-dik téglalap magassága: ν i n(y i y i 1 ). Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 11/62

10. előadás Statisztikák Legyen x 1, x 2,..., x n minta X -re. Az X = 1 n (x 1 + x 2 +... + x n ) valószínűségi változót empírikus középnek nevezzük. Legyen x 1, x 2,..., x n minta X -re. Az s 2 n = 1 n n (x i X ) 2 i=1 mennyiséget empírikus szórásnégyzetnek nevezzük. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 12/62

10. előadás Statisztikák Legyen x 1, x 2,..., x n minta X -re. Az s 2 n = 1 n 1 n (x i X ) 2 mennyiséget korrigált empírikus szórásnégyzetnek nevezzük. i=1 Megjegyzés Az empírikus szórásnégyzet segítségével következtethetünk az X ismeretlen szórásnégyzetére. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 13/62

10. előadás Steiner-formula Tétel (Steiner-formula) Tetszőleges a R esetén ns 2 n = n (x i a) 2 n(x a) 2. i=1 Bizonyítás n nsn 2 = [(x i a) (X a)] 2 = i=1 n (x i a) 2 2 i=1 n (x i a) 2 n(x a) 2. n n (x i a)(x a) + (X a) 2 = i=1 i=1 i=1 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 14/62

10. előadás Steiner-formula Megjegyzés Számolhatjuk ki az sn 2 a = m-et írunk. várható értékét, ha a Steiner formulába Tétel Legyen E(X ) = m, D 2 (X ) = σ 2. Ekkor E(s 2 n ) = σ 2. Bizonyítás [ ] E(sn 2 1 n ) = E (x i m) 2 n (X m)2 = n 1 n 1 i=1 1 n E(x i m) 2 n n 1 n 1 E(X m)2. i=1 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 15/62

10. előadás Steiner-formula Bizonyítás Mivel E(x i m) 2 = σ 2, illetve E(X m) 2 = E ( x 1 +...+x n nm) 2 n = 1 nσ 2, ezért n 2 E(s 2 n ) = n n 1 σ2 n σ 2 n 1 n = σ2, tehát a korrigált empírikus szórásnégyzet várható értéke éppen az elméleti szórásnégyzet. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 16/62

10. előadás Statisztikák Legyen x 1, x 2,..., x n minta X -re. A k-dik tapasztalati momentum 1 n alatt a következő kifejezést értjük: xi k. n Legyen x 1, x 2,..., x n minta X -re. A minta terjedelme alatt a xn x1 mennyiséget értjük. Legyen x 1, x 2,..., x n minta X -re. A szórási együttható alatt a sn X mennyiséget értjük. i=1 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 17/62

10. előadás Statisztikák Legyen x 1, x 2,..., x n minta X -re. A minta mediánja alatt a { x m+1, ha n = 2m + 1, med(x) = xm+x m+1 2, ha n = 2m mennyiséget értjük. Legyen x 1, x 2,..., x n minta X -re. A minta medián abszolút eltérése alatt a mennyiséget értjük. MAD(x) = med( x i med(x) ) Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 18/62

10. előadás Kvantilis Adott az F eloszlásfüggvény és a p valószínűség. Az x p p-kvantilis, ha p = F (x p ). Ha p = 0.5, akkor mediánnak, még p = 0.25 és 0.75 esetén alsó illetve felső kvartilisnek nevezzük. Egy sokaság p tapasztalati kvartilise x p = (1 q)xa + qx B, A = [np]; B = [np] + 1; q = {np}. Példa Ha p = 0.21, n = 40, akkor x p = (1 0.4)x 8 + 0.4x 9. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 19/62

10. előadás Becslési módszerek Bevezetés A becsléselméletben gyakran feltételezzük, hogy a megfigyelt mennyiségek független valószínűségi változók, közös F θ0 eloszlással, amely egy meghatározott {F θ θ Θ} eloszláshalmazba tartozik. Θ általában R k egy részhalmaza. Megpróbáljuk θ 0 értékét a megfigyelések alapján meghatározni. Legyen adott az X 1, X 2,..., X n minta, melynek sűrűségfüggvénye f és ez a Θ paramétertől függ. Tehát adott a {f (., θ) θ Θ R k }. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 20/62

10. előadás Becslési módszerek Pontbecslésnek nevezzük a mintaelemek mérhető függvényét, ahol a becslés és a paraméter koordinátáinak a száma megegyezik, azaz Θ n (X 1, X 2,..., X n ) Θ. Intervallumbecslésnek nevezzük a Γ tartományt 1 α megbízhatósági szinttel, ha Γ Θ és P(θ Γ) = 1 α. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 21/62

10. előadás Pontbecslés Legyen adott az x 1, x 2,..., x n minta f (x 1, x 2,..., x n ; Θ) sűrűségfüggvénnyel. A Θ n (x 1, x 2,..., x n ) (röviden Θ n ) a Θ paraméter torzítatlan becslése, ha E( Θ n ) = Θ. Θ n a Θ paraméter aszimptotikusan torzítatlan becslése, ha Megjegyzés lim E( Θ n ) = Θ. n Az átlag a várható érték torzítatlan becslése. A korrigált tapasztalati szórásnégyzet torzítatlan becslése a szórásnégyzetnek. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 22/62

10. előadás Pontbecslés Adott a Θ n és a Θ n torzítatlan becslés. A Θ n hatásosabb a Θ n becslésnél, ha D 2 ( Θ n ) D 2 ( Θ n ). A Θ n (x 1, x2,..., x n ) sorozat konzisztens becsléssorozata a Θ paraméterre, ha ( ) lim P Θ n Θ > ε = 0, n minden ε > 0 esetén. A Θ n (x 1, x2,..., x n ) sorozat erősen konzisztens becsléssorozata a Θ paraméterre, ha n esetén E( Θ n ) = Θ, és lim n D2 ( Θ n ) = 0. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 23/62

10. előadás Likelihood-becslés Tekintsünk egy X -re adott x 1, x 2,..., x n mintát. Az L(x 1, x 2,..., x n ; θ) = n f (x i, θ) i=1 függvényt az x 1, x 2,..., x n mintához tartozó likelihood-függvénynek nevezzük. A Θ statisztikát a Θ paraméter maximum likelihood-becslésének nevezzük, ha Θ globális maximumhelye a likelihood-függvénynek, azaz L(x 1, x 2,..., x n ; Θ(x 1, x 2,..., x n )) L(x 1, x 2,..., x n, θ) minden θ Θ esetén. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 24/62

10. előadás Likelihood-becslés Példa: λ paraméterű Poisson-eloszlás Legyen adott az x 1, x 2,..., x n minta. Az általánosított sűrűségfüggvényhez használjuk az f (k, λ) = λk k! e λ. logl(x 1, x 2,..., x n ; λ) = logλ meghatározni a maximumát. n x i i=1 n logx i! nλ, ennek kell i=1 A számítások elvégzése után kapjuk, hogy 1 λ ahonnan λ n = x. Még ellenőrizni kell, hogy 2 logl(x xi 2 1, x 2,..., x n, λ) = 1 n λ 2 i=1 x i < 0. n x i n = 0, i=1 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 25/62

10. előadás Likelihood-becslés Példa: λ paraméterű exponenciális-eloszlás f (x, λ) = λe λx logl(x 1, x 2,..., x n, λ) = nlogλ λ n n λ x i = 0 λ = 1 x. i=1 n i=1 x i Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 26/62

10. előadás Momentumok módszere Ha egy valószínűségi változónak létezik a várható értéke, akkor a nagy számok törvénye alapján, ha x 1, x 2,... független, vele azonos eloszlású valószínűségi változók sorozata, akkor a részletösszegek átlaga tart a várható értékhez. Továbbá tudjuk, hogy ha általában nem is, de elég gyenge feltételek mellett a momentumok meghatározzák az eloszlást. µ k = E(x k ) és m k = xk 1 +xk 2 +...+xk n n és µ k = m k. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 27/62

Köszönöm a figyelmet! Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 28/62

11. előadás Intervallum becslés Bevezetés Az eddigiek során arra törekedtünk, hogy megfigyeléseink alapján egyetlen értékkel becsüljük az ismeretlen paramétert. Ebben a szakaszban a feladat megadni egy Γ Θ tartományt, amelyre P(θ Γ) = 1 α. Legyen a Θ R, az x 1, x 2,..., x n minta. A Θ n (x 1, x 2,..., x n ) Θ Θ n (x 1, x 2,..., x n ) 1 α megbízhatóságú konfidencia intervallum a Θ paraméterre, ha P Θ ( Θ n Θ Θ n ) = 1 α. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 30/62

11. előadás Intervallum becslés 1. Tekintsünk egy x 1, x 2,..., x n mintát az m ismeretlen várható értékű és σ 2 ismert szórásnégyzetű normális eloszlásra. (X N (m, σ 2 )) Tudjuk, hogy X N (m, σ2 n ), így n(x m) σ standard normális eloszlású. Ezért egy adott 1 ε megbízhatósági szinthez válasszunk olyan u R-t, hogy n(x m) P m ( u σ u) = 1 ε, Φ(u) = 1 ε 2, ahonnan P m (X u ε σ 2 n < m < X + u ε σ 2 n ) = 1 ε. Tehát az m-re kapott 1 ε megbízhatósági szintű konfidencia intervallum: ( ) σ σ X u ε ; X + u ε 2 n 2 n Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 31/62

11. előadás Intervallum becslés 2. Szerkesszünk konfidencia intervallumot a σ 2 szórásnégyzetre, ha az m várható érték ismert. Felhasználjuk, hogy n (x i m) 2 i=1 statisztika χ 2 eloszlású n szabadsági fokkal, így ( ) 1 n i m) χ 2 ε i=1(x 2 ; 1 n χ 2 (x i m) 2. ε i=1 σ 2 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 32/62

11. előadás Intervallum becslés 3. Adjunk meg konfidencia intervallumot m-re, ha σ 2 is ismeretlen! Mivel n(x m) s n t-eloszlású n 1 szabadsági fokkal, így n(x m) P( t ε < 2 sn < t ε ) = 1 ε, 2 ahonnan a konfidencia intervallum: ( X t ε 2 s n n ; X + t ε 2 sn ) n Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 33/62

11. előadás Intervallum becslés 4. Szerkesszünk konfidencia intervallumot egy A esemény ismeretlen P(A) = p valószínűségére az A eseményre végzett n számú független kísérlet alapján. A Csebisev-egyenlőtlenségből kapjuk, hogy ( P X p ) p(1 p) < ε > 1 1 n ε 2, valamint felhasználva, hogy p(1 p) 1 4 kapjuk, hogy ( ) X P p 1 < ε > 1 1 4n ε 2. Így a kapott intervallum ( X ε 1 2 n ; X + ε 1 ) 2 n Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 34/62

11. előadás Hipotézisvizsgálat A vizsgálandó feltételezést nullhipotézisnek nevezzük (jele: H 0 ), ezzel ellentétes álĺıtás az alternatív hipotézis (jele: H 1 ). Azt az eljárást, amelynek során a minta segítségével döntünk a hipotézisről, statisztikai próbának nevezzük. Ha az eloszlás jellege ismert és a nullhipotézisünk az eloszlás valamely paraméterére vonatkozik, akkor paraméteres próbáról beszélünk. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 35/62

11. előadás Hipotézisvizsgálat Ha Θ 0 egy pontból álló halmaz, a nullhipotézis egyszerű, ellenkedző esetben összetett. A H 0 : Θ = Θ 0 nullhipotézis és H 1 : Θ > Θ 0 (H 1 : Θ < Θ 0 ) ellenhipotézis esetén egyoldali nullhipotézisről illetve egyoldali próbáról beszélünk. A H 0 : Θ = Θ 0 nullhipotézis és H 1 : Θ Θ 0 alakú hipotézis esetén kétoldali próbáról beszélünk. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 36/62

11. előadás Hipotézisvizsgálat Bontsuk fel a teret C 0 és C 1 diszjunkt halmazokra. Ha a minta x 1, x 2,..., x n realizációja a C 0 halmaz eleme, akkor elfogadjuk a nullhipotézist, ha x 1, x 2,..., x n a C 1 eleme, akkor H 1 alternatív hipotézist fogadjuk el. A C 0 halmazt elfogadási tartománynak, a C 1 halmazt kritikus tartománynak nevezzük. A P θ (C 1 ) α, θ Θ 0 realizációt teljesítő α számot a próba terjedelmének (kritikus tartomány) nevezzük. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 37/62

11. előadás Hipotézisvizsgálat Ha adott C 1 tartomány esetén elfogadjuk vagy elvetjük a hipotézist a paraméterre vagy az F alakjára, akkor azt statisztikai próbának nevezzük. Egy próbát α-szintűnek nevezünk, ha P((x 1, x 2,..., x n ) C 1 H 0 ) α. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 38/62

11. előadás Hipotézisvizsgálat Ha H 0 igaz és ennek ellenére elvetjük, akkor azt mondjuk, hogy elsőfajú hibát követünk el. Megjegyzés Az elsőfajú hiba elkövetésének valószínűsége P((x 1, x 2,..., x n ) C 1 H 0 ) = α. Tehát a próba szintjével együtt az elsőfajú hiba elkövetésének a valószínűségét is rögzítjük. Ha a H 1 hipotézis az igaz és mégis elfogadjuk H 0 -t, akkor azt mondjuk, hogy másodfajú hibát követünk el. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 39/62

11. előadás Hipotézisvizsgálat Jelölje H 0 azt, hogy Θ a valódi paraméter. Rögzített C 1 kritikus tartomány esetén a γ(h θ ) = P((x 1, x 2,..., x n ) C 1 H 0 ), θ Θ valószínűséget a próba erőfüggvényének nevezzük. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 40/62

11. előadás Próbák U-próba (1 mintás eset) Az U-próba segítségével ismert szórású, normális eloszlású valószínűségi változó várható értékére vonatkozó hipotézisről dönthetünk. E(X ) = m ismeretlen Hipotézis: D(X ) = σ 0 ismert paraméter. H 0 : E(X ) = m 0 H 1 : E(X ) = m 1 m 0. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 41/62

11. előadás Próbák U-próba (1 mintás eset) Ha a nullhipotézisünk igaz, akkor a próbastatisztika U = X m 0 n σ 0 standard normális eloszlású valószínűségi változó. Ha tehát igaz a nullhipotézis, akkor az U statisztika konkrét értéke 1 α valószínűséggel ( u α, u α ) intervallumba esik. 2 2 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 42/62

11. előadás Próbák U-próba (1 mintás eset) Így az elfogadási tartomány: C 0 = Kritikus tartomány: C 1 = { (x 1, x 2,..., x n ) : { (x 1, x 2,..., x n ) : X m 0 σ 0 X m 0 σ 0 } n < u α 2 } n u α 2 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 43/62

11. előadás Próbák U-próba (2 mintás eset) Két független, ismert szórású, normális eloszlású valószínűségi változó várható értékeinek azonosságáról dönthetünk. (X N (m 1, σ 2 1 ); Y N (m 2, σ 2 2 ); n 1 illetve n 2 elemű mintát tekintve.) Hipotézis: H 0 : m 1 = m 2 ; U-próbastatisztika: H 1 := m 1 m 2. U = X Y. σ 2 1 n 1 + σ2 2 n 2 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 44/62

11. előadás Próbák t-próba (1 mintás eset) Legyen X N (m, σ 2 ), ahol m és σ 2 is ismeretlenek. Tekintsünk egy x 1, x 2,..., x n n elemű mintát. A hipotézisünk a várható értékre vonatkozik: H 0 : m = m 0 ; H 1 := m m 0. Ismert, hogy az X m s n valószínűségi változó (n 1) n szabadságfokú t- eloszlású. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 45/62

11. előadás Próbák t-próba (1 mintás eset) Tehát, ha a nullhipotézis igaz, akkor a t = X m s n n próbastatisztika (n 1) paraméterű t eloszlású. A kritikus tartomány: { ( α )} C 1 = (x 1, x 2,..., x n ) : t t n 1 2 Az elfogadási tartomány: { ( α )} C 0 = (x 1, x 2,..., x n ) : t < t n 1 2 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 46/62

11. előadás Próbák t-próba (2 mintás eset) Legyen X és Y független, normális eloszlású valószínűségi változó. (E(x) = m 1 ; D(X ) = σ 1 ; E(Y ) = m 2 ; D(Y ) = σ 2 ahol m 1, m 2, σ 1, σ 2 ismeretlenek.) Az X valószínűségi változó n 1, még az Y n 2 elemű egymástól független minták. A hipotézis a várható értékek azonosságára vonatkozik: A próba szintje 1 α. H 0 : m 1 = m 2 ; H 1 := m 1 m 2. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 47/62

11. előadás Próbák t-próba (2 mintás eset) A nullhipotézisről fennál, hogy X Y n t = 1 n 2 (n 1 + n 2 2) (n 1 1)sn 2 1 + (n 2 1)sn 2 n 1 + n 2 2 statisztika n 1 + n 2 2 paraméterű t-eloszlású. A { ( α )} C 1 = (x 1, x 2,..., x n1, y 1, y 2,..., y n2 ) : t t n1 +n 2 2 2 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 48/62

11. előadás Próbák F-próba Két független, normális eloszlású valószínűségi változó szórásainak egyenlőségét ellenőrzi az F -próba. X N (m 1, σ 2 1 ), n 1 elemű minta; Y N (m 2, σ 2 2 ), n 2 elemű minta; A próba szintje: 1 α. H 0 : σ 2 1 = σ 2 2; H 1 := σ 2 1 σ 2 2. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 49/62

11. előadás Próbák F-próba Felhasználva, hogy n 1 1 s 2 σ1 2 1 és n 2 1 σ2 2 s 2 2 χ 2 eloszlásúak (n 1 1) illetve (n 2 1) paraméterekkel és függetlenek, kapjuk, hogy a nullhipotézisre fennáll az F = s 2 1 s2 2 próbastatisztika F -eloszlású (n 1 1, n 2 1) paraméterekkel. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 50/62

11. előadás Próbák χ 2 -próba A χ 2 -próba segítségével normális eloszlású valószínűségi változók ismeretlen szórásnégyzetéről dönthetünk. Legyen X N (m, σ 2 ) eloszlású, ahol m és σ is ismeretlen paraméterek. A hipotézis: A próba szintje: 1 α. H 0 : σ = σ 0 ; H 1 := σ σ 0. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 51/62

11. előadás Próbák χ 2 -próba Tudjuk, hogy (n 1)s 2 χ 2 -eloszlású (n 1) paraméterrel. Ha a σ 2 nullhipotézis igaz, akkor h = (n 1)s 2 próbastatisztika χ 2 eloszlású. σ 2 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 52/62

12. előadás Regressziós egyenesek Beveztés Adott 2 mérési adatsor, amelyek alapján elkészíthető a regressziós egyenes. Adott (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ). Keressük az y = bx + a egyenest, melyre Q(a, b) = n (y i bx i a) 2 min. i=1 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 55/62

12. előadás Regressziós egyenesek Vezessük be a következő jelöléseket: n i=1 X = x n i i=1 ; Y = y i n n Q x = n xi 2 nx 2 ; Q y = i=1 Q xy = n i=1 n x i y i nx Y. i=1 Ekkor a regressziós egyenes egyenlete: b = Q xy Q x ; a = Y bx. y 2 i ny 2 Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 56/62

12. előadás Regressziós egyenesek Általánosan y = b 0 + b 1 x 1 +... + b n x n. Vezessük be a β = (b 0, b 1,..., b n ) jelölést. A β becslését szeretnénk meghatározni. Ez az X X β = X y egyenletrendszer megoldásával adódik. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 57/62

12. előadás Regressziós egyenesek Az X X β = X y egyenletrendszert normál-egyenletrendszernek nevezzük. Megjegyzés X X egy pozitív definit mátrix, ezért β = (X X ) 1 X y. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 58/62

12. előadás Regressziós egyenesek Példa Adottak a következő (1,2); (2,4); (3,5); (4,8) pontok. Határozzuk meg az y = a + bx alakú regressziós egyenest! (Megoldás: y=0+1.9x) Példa Tekintsük a ξ valószínűségi változót, melyről tudjuk a következőket: 1 38; 2 53; 3 61; 4 48. 95%-os szinten ellenőrizzük, hogy a minta egyenletes eloszlású-e? Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 59/62

12. előadás Cramer-Rao egyenlőtlenség Tétel Legyen az (Ω, A, P θ ), θ Θ statisztikai mezőn a T statisztika g(θ) torzítatlan becslése, ahol g egy adott függvény Θ-n és legyen E(T ) 2 lokálisan korlátos függvény Θ-n. Ekkor g folytonosan differenciálható Θ-n, I (θ) 0 minden θ Θ esetén és D 2 (T ) (g (θ)) 2 I (θ), ahol I (θ) a Fisher-féle információmennyiség. Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 60/62

12. előadás Rao-Blackwell tétel Legyen (Ω, A, P θ ), θ Θ statisztikai mező. A T : Ω R k statisztikát elégségesnek nevezzük, ha a P θ (A T = t), A A, t R k feltételes valószínűségeknek megadható θ-tól független közös értéke. Rao-Blackwell tétel Legyen T elégséges statisztika az (Ω, A, P θ ) statisztikai mezőn és legyen ĝ(θ) a g(θ) véges szórású, torzítatlan becslése. Ekkor a h(t) = E(ĝ(θ) T = t) függvényre fennállnak az alábbiak h csak t-től függ és nem függ θ-tól; h(t ) torzítatlan becslése g(θ)-nak; D 2 (h(t )) D 2 (ĝ(θ)). Dr. Karácsony Zsolt Valószínűségszámítás és Matematikai statisztika 61/62