A matematikai statisztika elemei Mikó Teréz, dr. Szalkai Istvá szalkai@almos.ui-pao.hu Pao Egyetem, Veszprém 2014. március 23.
2
Tartalomjegyzék Tartalomjegyzék 3 Bevezetés................................ 3 Alapfogalmak.............................. 3 Itervallumbecslések.......................... 5 A valószí½uség becslése...................... 6 A várható érték becslése ismert szórás eseté.......... 7 A várható érték becslése ismeretle szórás eseté........ 8 A szórás becslése......................... 9 Összefoglaló képletgy½ujteméy..................... 11 Megbízhatósági itervallumok.................. 11 Táblázatok............................... 12 ### Stat-itervC.tex, 2014.03.23., 17:10 Bevezetés Nem elméleti vizsgálatok (fejtegetések), haem a téyleges mért értékek kiértékelése következik. Alapfogalmak 0.1. De íció. Statisztikai mita: egy meyiség ( v.v.) többszöri mérésekor kapott eredméyek. A papíro X 1 ; :::; X (1) 3
4 TARTALOMJEGYZÉK valós számok, elméletileg pedig X 1 ; :::; X valószí½uségi változók. A feti mita szabadsági foka s : 1. (2) 0.2. De íció. (i) Empirikus (tapasztalati, gör.) várható érték: : X 1 + ::: + X a szokásos "számtai közép". (ii) Empirikus (tapasztalati) szóráségyzet: (3) 2 : 1 X i1 X i 2 X 1 2 + ::: + X 2 (4) (iii) Korrigált (javított) empirikus (tapasztalati) szóráségyzet: ( ) 2 : 1 2 X 2 1 + ::: + X 2 1 (5) 0.3. Tétel. Az empirikus szóráségyzet egyszer½ubbe is kiszámolható: 2 2 2 X 2 1 + ::: + X 2 (ld. a (3) képletet), és e feledjük: a korrigált empirikus szóráségyzet (5) alapjá ( ) 2 : 1 2. (7) 2 (6) 0.4. Példa. 12 mérést végeztük: fx 1 ; :::; X 12 g f20:0; 20:2; 20:4; 20:7; 20:7; 21:0; 21:1; 21:3; 21:4; 21:4; 21:4; 21:5g, tehát 12 és s 1. Az empirikus (tapasztalati) várható érték: 20:0 + 20:2 + 20:4 + 20:7 + 20:7 + 21:0 + 21:1 + 21:3 + 21:4 + 21:4 + 21:4 + 21:5 12 20:925,
TARTALOMJEGYZÉK 5 a tapasztalati égyzetes várható érték: 2 20:02 + 20:2 2 + 20:4 2 + 20:7 2 + 20:7 2 + 21:0 2 + 21:1 2 + 21:3 2 + 21:4 2 + 21:4 2 + 21:4 2 + 21:5 2 12 438:100 833, a tapasztalati szóráségyzet és szórás (6) szerit: 2 2 2 438:101 20:925 2 0:2454, q 2 2 p 0:245 4 0:4954, a korrigált (tapasztalati) szóráségyzet és szórás (5) szerit ( ) 2 1 2 2 12 11 (438:101 20:9252 ) 0:2677, r 1 2 2 p 0:2677 0:5174. Itervallumbecslések Általáos probléma: 0.5. Probléma. A kapott statisztikai mita alapjá adjuk meg a valós számok egy olya [a; b] itervallumát, amelybe a vizsgált jeleség egy bizoyos mér½oszáma (pl. valószí½uség, várható érték, szórás, stb.) egy adott valószí½uséggel beleesik: P (a < < b) 1 " (8) ahol 0 < " < 1 adott (tetsz½oleges) szám. 0.6. De íció. A feti [a; b] itervallumot megbízhatósági (ko decia) itervallumak evezzük, az " számot hiba- vagy t½uréshatárak, az 1 " meyiséget pedig megbízhatósági szitek. 0.7. Megjegyzés. Általába a mita elemszámáak () övelésével az [a; b] itervallum csökke, míg a hibahatár (") csökketésekor az [a; b] itervallum övekszik. Speciális eseteket és példákat az alábbi alfejezetekbe látuk.
6 TARTALOMJEGYZÉK A valószí½uség becslése 0.8. Probléma. Egy A eseméy (kísérlet) p P (A) valószí½uségére keresük adott " > 0 mellett megbízhatósági itervallumot: P (a < p < b) 1 " (9) 0.9. Tétel. Ha akkor függetle kísérletb½ol k esetbe következett be az A eseméy, és elég agy 1), akkor a keresett itervallum: k k [a; b] ; + (10) ahol u " p s k 1 és az u " szám kielégíti a " (u " ) 1 2 egyel½oséget (visszakereshet½o a táblázatból). k (11) (12) 0.10. Példa. Egy mitába 30 mukadarabból 10 db volt selejtes. Adjuk meg a selejt p valószí½uségéek 95% -os megbízhatósági itervallumát! " Megoldás: Tehát " 0:05, u " -t az (u " ) 1 0:975 összefüggés 2 (ld.(12)) és a táblázat alapjá határozhatjuk meg: u " 1:96. (10) és (11) alapjá s p 1:96 10 30 30 1 10 0:168 690, 30 a 10 0:168 690 0:164 643, 30 b 10 + 0:168 690 0:502 023, 30 tehát a 0.9. Tétel alapjá P (0:164 < p < 0:502) 0:95, (13) vagyis 95% biztosággal modhatjuk, hogy a selejt aráya (valószí½usége, p) 0:164 és 0:502 közés esik. 1 ) legye legalább 30, de ikább > 200 a taácsos!
TARTALOMJEGYZÉK 7 0.11. Megjegyzés. (i) A feti példába (a mérések száma) elég kicsi, továbbá a hibahatár (") is elég sz½uk (kicsi), ez magyarázza a kapott [a; b] [0:164 ; 0:502] itervallum aráylag agy méretét! (ii) A(z) (12) egyel½oség potosa azt jeleti, hogy az 2 N (0; 1) stadard ormális eloszlásra teljesül az P ( u " < < u " ) 1 " (14) egyel½oség. (iii) A(z) alapul. 0.9. Tétel a agy számokra voatkozó Moivre-Laplace tétele A várható érték becslése ismert szórás eseté 0.12. Probléma. Adott " hibahatárhoz adjuk meg [a; b] ko decia itervallumot várható értékére, m re, HA -r½ol tudjuk, hogy ormális eloszlású ÉS adott szórása, vagyis P (a m b) 1 ". (15) 0.13. Tétel. A keresett itervallum [a; b] u " p ; + u " p (16) ahol az u " valós szám kielégíti a(z) (12) egyel½oséget (visszakereshet½o a táblázatból). 0.14. Példa. Egy vegyület 1kg meyiségébe az oxigétartalom () ormális eloszlást követ, szórását tudjuk: 3g. 12 mérést végeztük: fx 1 ; :::; X 12 g f20:0; 20:2; 20:4; 20:7; 20:7; 21:0; 21:1; 21:3; 21:4; 21:4; 21:4; 21:5g. Adjuk meg egy olya itervallumot, amelybe az oxigétartalom 95% eséllyel beleesik. Megoldás: Az ismert adatok: 12, D () 3, m M ()?, " 5% 0:05. Mivel ormális eloszlású és szórását ismerjük, ezért a(z) 0.13. Tétel (16) képletét alkalmazzuk. A táblázatból (12) szerit olya u " u 0:05 valós számot kell (vissza)keresük, 0:05 amelyre (u 0:05 ) 1 0:975 ahoa u 2 0:05 1:96. Továbbá, (3) szerit
8 TARTALOMJEGYZÉK 20:0 + 20:2 + 20:4 + 20:7 + 20:7 + 21:0 + 21:1 + 21:3 + 21:4 + 21:4 + 21:4 + 21:5 12 20:925, p p 3 0:866 025, 12 (16) alapjá a 20:925 1:96 0:866 025 19:227 591 és b 20:925 + 1:96 0:866 025 22:622 409. Tehát a 12 mérés és a 0.13. Tétel alapjá m M () értékére kaptuk, hogy vagyis szavakba: P (19:228 < m < 22:622) > 1 " 0:95, (17) " A 12 mérés és az ismert iformációk ( ormális és D () 0:3) alapjá 95% biztosággal állíthatjuk, hogy az oxigétartalom (M ()): 19:228 és 22:622 közé esik! " A várható érték becslése ismeretle szórás eseté 0.15. Probléma. Adott " hibahatárhoz adjuk meg [a; b] ko decia itervallumot várható értékére, m re, HA -r½ol tudjuk, hogy ormális eloszlású ÉS szórása ismeretle, a(z) (15) összefüggés mitájára. 0.16. Tétel. A keresett itervallum [a; b] t " p ; + t " p (18) ahol t " értékét az 1 -szabadságfokú Studet eloszlás (más éve: t- eloszlás) táblázatából keressük ki. 0.17. Példa. Egy bizoyos típusú TV készülék fogyasztása () ormális eloszlást követ, szórását em tudjuk, 12 mérést végeztük: X 1 ; :::; X 12 20:0, 20:2, 20:4, 20:7, 20:7, 21:0, 21:1, 21:3, 21:4, 21:4, 21:4, 21:5. Adjuk meg egy olya itervallumot, amelybe a fogyasztás 95% eséllyel beleesik. Megoldás: Az ismert adatok: 12, a szabadsági fok s 1 11, m M ()?, " 5% 0:05. Mivel ormális eloszlású és szórását em ismerjük, ezért a(z) 0.16. Tétel (18) képletét alkalmazzuk. A táblázat szerit az " 0:05 és az s 11 értékekhez t 0:05 2:201 tartozik.
TARTALOMJEGYZÉK 9, 2 és értékét az 0.4. Példába már kiszámoltuk, így p 0:5174 p 12 0:1494, és végül (18) alapjá a 20:925 2:201 0:1494 20:5962, b 20:925 + 2:201 0:1494 21:2538. Tehát a 12 mérés és a 0.16. Tétel alapjá m M () értékére kaptuk, hogy vagyis szavakba: P (20:596 < m < 21:254) > 1 " 0:95, (19) " A 12 mérés és az ismert iformáció ( ormális) alapjá 95% biztosággal állíthatjuk, hogy a fogyasztás (M ()) 20:596 és 21:254 közé esik! " A szórás becslése 0.18. Probléma. Adott " hibahatárhoz adjuk meg [a; b] ko decia itervallumot szóráségyzetére illetve szórására, HA -r½ol csak ayit tuduk, hogy ormális eloszlású, a(z) (15) összefüggés mitájára. 0.19. Tétel. A szóráségyzet keresett itervalluma " # a 2 ; b 2 ( ) 2 ( ) 2 ; 2 "2 2 1 "2 (20) míg a szórás itervalluma [a; b] " p "2 ; p # 1 "2 (21) ahol 2 "2 és 2 1 "2 értékeit az 1 -szabadságfokú 2 -eloszlás táblázatából keressük ki. 0.20. Példa. A csimpázkölykök testsúlya ormális eloszlású, legutóbbi mérésél a következ½o mitát kaptuk: X 1 ; :::; X 12 20:0, 20:2, 20:4, 20:7, 20:7, 21:0, 21:1, 21:3, 21:4, 21:4, 21:4, 21:5. Adjuk meg egy olya itervallumot, amelybe a testsúly szórása 95% eséllyel beleesik.
10 TARTALOMJEGYZÉK Megoldás: Az ismert adatok: 12, a szabadsági fok s 1 11, " 5% 0:05. Mivel ormális eloszlású és szórását becsüljük, ezért a(z) 0.19. Tétel (20) és (21) képleteit alkalmazzuk. A 2 táblázat szerit az "2 0:025, 1 "2 0:975 és s 11 adatokhoz a 2 "2 2 0:025 21:920 és 2 1 "2 2 0:975 3:816 (22) értékek tartozak, továbbá 0:025 p 21:920 4:6819 és 0:975 p 3:816 1:953 5. (23), 2 és értékét az 0.4. Példába már kiszámoltuk, így a 2 ( ) 2 2 "2 12 0:2677 21:920 0:1466, b 2 ( ) 2 2 1 "2 12 0:2677 3:816 0:8418, továbbá a p 0:1466 0:3829 és b p 0:8418 0:9175, tehát (20) alapjá P 0:1466 < D 2 () < 0:8418 > 1 " 0:95 (24) és (21) alapjá P (0:3829 < D () < 0:9175) > 1 " 0:95, (25) vagyis szavakba: " A 12 mérés és az ismert iformáció ( ormális) alapjá 95% biztosággal állíthatjuk, hogy a testsúlyok szóráségyzete (D 2 ()) 0:1466 és 0:8418 közé esik, míg szórása (D ()) 0:3829 és 0:9175 közé esik! "
TARTALOMJEGYZÉK 11 Összefoglaló képletgy½ujteméy A vizsgá kizárólag az alábbi oldalt és a táblázatokat lehet (kiyomtatva) haszáli: Megbízhatósági itervallumok Valószí½uség: k ; k + ahol u " p s k 1 k és (u " ) 1 " 2 Várható érték (szórás ismert): u " p ; + u " p Várható érték (szórás ismeretle): t " p ; + t " p ahol t " a Studet táblázatból (s 1 szabadságfokú), Szórás " p "2 ; p # 1 "2 ahol 2 "2 és 2 1 "2 a 2 -táblázatból (s 1 szabadságfokú).
12 TARTALOMJEGYZÉK Táblázatok
TARTALOMJEGYZÉK 13
14 TARTALOMJEGYZÉK eof