Valószí ségszámítás és statisztika oktatási segédayag Kupá Pál
Tartalomjegyzék fejezet Valószí ségszámítási alapfogalmak 5 Eseméyek 5 M veletek eseméyekkel 5 2 A valószí ség fogalma 7 3 Valószí ségi változók 9 4 Nevezetes eloszlások 0 4 Diszkrét eloszlások 0 4 Biomiális eloszlás 0 42 Hipergeometrikus eloszlás 43 Poisso eloszlás 2 44 Geometriai eloszlás 3 42 Folytoos eloszlások 4 42 Egyeletes eloszlás 4 422 Normális eloszlás 4 423 t-eloszlás 5 424 χ 2 khi-égyzet) eloszlás 6 2 fejezet Bevezetés a statisztikába 7 2 Statisztikai mita, gyakoriság 7 22 A mita számszer jellemz i 8 23 Statisztikai becslések 2 23 Potbecslés 2 232 Itervallumbecslés 22 232 A várható érték becslése 22 24 Statisztikai hipotézisek vizsgálata 26 24 Egymitás u-próba 26 242 Egymitás t-próba 28 243 χ 2 -próba szórásvizsgálatra 28 3
TARTALOMJEGYZÉK 4 244 Kétmitás u-próba 29 245 Kétmitás t-próba 30 246 F-próba 30 25 Korreláció és regresszióaalízis 33 Irodalomjegyzék 36
FEJEZET Valószí ségszámítási alapfogalmak Eseméyek Modell: determiisztikus vagy sztochasztikus Kísérlet eredméye=elemi eseméy, jel ω, ω 2, Az elemi eseméyek halmazát jel Ω = {ω, ω 2, } = {ω i }, i I Eseméyek P Ω) -ba: biztos eseméy=midig bekövetkezik - azoosítjuk Ω-val lehetetle eseméy=soha em következik be - jel A P Ω) elletét eseméye=akkor következik be mikor A em - jel A Példa ) Kocka dobás: Ω = {ω, ω 2,, ω 6 } ahol ω i = a kocka i potot mutat elemi eseméy A =páros szám={ω 2, ω 4, ω 6 } A = páratlaszám = {ω, ω 3, ω 5 } Az egyszer ség kedvéért az elemi eseméyeket {, 2,, 6} = Ω alakba is felírhatjuk 2) Két kocka dobása: a kockákat külöböz ek tekitjük például piros, illetve kék szí ek) tehát az elemi eseméyek redezett párost alkotak:, ), 2), 6) Ω : 2, ) 2, 2) 2, 6) 6, ) 6, 2) 6, 6) A =a két kocka azoos potszámot mutat={, ), 2, 2),, 6, 6)} B =a kockák összege 0={4, 6), 6, 4), 5, 5), 5, 6), 6, 5), 6, 6)} 3) Pézérme dobása: Ω = { fej, írás } 4) Két érme dobása: Ω = { fej fej, fej írás, írás fej, írás írás } A =az érmék azoos jelt mutatak={ fej fej, írás írás } M veletek eseméyekkel A, B P Ω) 5
ESEMÉNYEK 6 eseméyek összeadása: A + B = A B - az az eseméy amely akkor következik be ha az A vagy a B bekövetkezik eseméyek szorzása: A B = A B - az az eseméy amely akkor következik be ha az A és a B bekövetkezik elletétes eseméy: A akkor következik be ha A em következik be eseméyek külöbsége A B = A B 2 Tétel A P Ω) halmaz a,,, m veletre ézve Boole algebrát képez, vagyis az alábbi tulajdoságok érvéyesülek: asszociativitás: A B C) = A B) C, A B C) = A B) C kommutativitás: A B = B A, A B = B A elyelési tulajdoság: A A B) = A, A A B) = A disztributivitás: A B C) = A B) A C), A B C) = A B) A C), komplemeter képzés: A A = Ω, A A = 3 Defiíció A P Ω),,,, Ω, ) struktúrát eseméytérek evezzük Az említett m veletekre az alábbi tulajdoságok is érvéyesülek: de Morga azoosságok: A B = A B, A B = A B, idempotecia: A A = A, A A = A, Ω =, = Ω, A = A 4 Defiíció Az A, B P Ω) eseméyeket egymást kizáróak evezzük ha egy-id be em következhetek be: A B = 5 Defiíció Az {A, A 2, } redszer az A P Ω) eseméy egy felbotását partícióját) képezi ha A i A j =, i j, A i = A i I Ha a Ω tér felbotását végeztük akkor azt modjuk, hogy {A, A 2, } egy teljes eseméy-redszer
2 A VALÓSZÍN SÉG FOGALMA 7 6 Defiíció Az A P Ω) algebrát alkot ha A A A A A, B A A B A Az Ω, A) párost eseméy-mez ek evezzük véges vagy végtele) 2 A valószí ség fogalma Feltételezzük, hogy Ω véges és az ω i elemi eseméyek el fordulásáak esélye azoos!) 7 Defiíció Az A P Ω) eseméy klasszikus értelembe vett valószí ségé az alábbi törtet értjük: 8 Példa P A) = A ak kedvező esetek száma összes eset ) Dobókocka A=a kocka 2 potot mutat 2-es), P A) = B=páros 6 szám, P B) = 3 6 2) Két dobókocka A=a két kocka 2, 6)-ost mutat, P A) = B=midkét 36 kocka azoos számot mutat, P B) = 6 C=a kockák összege 36 0, P C) = 6 3) Domió játék 36 egyformát emeljük ki 7 28 6, 6) 6, 5) 6, ) 6, 0) 5, 5) 5, 0), ), 0) 0, 0) Aak a valószí sége, hogy 9 Példa Osztozkodási feladat) Feltételezve, hogy egy játék megyeréséhez 0 csatát kell megyerie az A, illetve B játékosokak, hogya kell elosztai a yereméyt ha 8 7 állásál az A játékos javára) a játék félbemarad? Bizoyítás Figyelembe véve, hogy maximum 4 további csata eldöti a játék meetét a yereméyt a hátramaradt csaták yerési esély aráyába osztjuk el A lehetséges kimeetelek a következ k:
2 A VALÓSZÍN SÉG FOGALMA 8 A yer aaaa aaab aaba abaa baaa aabb abab baab abba baba bbaa B yer bbbb bbba bbab babb abbb ahol például babb azt jeleti, hogy az els, a harmadik és a egyedik csatát a B játékos yerte, a másodikat pedig az A játékos Természetese a fölösleges csatákat em szokták lejátszai Tehát aak a valószí sége, hogy A yer =, 6 míg B yerési esélye = 5 A yereméyt ugyaebbe az aráyba kell elosztai a 6 két játékos között A valószí ség axiomatikus értelmezése 0 Defiíció Valószí ségek evezük egy P : A [0, ] leképezést melyre az alábbi tulajdoságok érvéyesülek: P A) 0; P Ω) = biztos eseméy valószí sége =); P A B) = P A) + P B), ha A B = A Ω, A, P ) hármast valószí ségi-mez ek evezzük Tétel Tulajdoságok ) P ) = 0 2) P A ) = P A) 3) P B A) = P B) P A B) 4) A B P A) P B) 5) P A B) = P A) + P B) P A B) 6) P A B) P A) + P B) 2 Példa Domió játék Mi aak a valószí sége, hogy a következ kogurációt folytassuk? 3, 4) 4, 0) 0, 0) 0, 3) 3, 2) 3, 4) 4, 0) 0, 0) 3, 4) 4, 0) 0, 0) 0, 3) 3 Defiíció Feltételes valószí ség P B) 0): P A B) = P A B) P A)
3 VALÓSZÍN SÉGI VÁLTOZÓK 9 Teljes valószí ség és Bayes képlet: Ha A i az Ω egy teljes felbotását jeleti és B Ω Szorzási képlet: P B) = P A ) P A B) + P A 2 ) P A2 B) + P A B) = P A) P A B) 4 Defiíció Az A és B eseméyek függetleek ha P A B) = P B) 5 Tétel Ha A és B függetleek akkor P A B) = P A) P B) Ω, ω i 3 Valószí ségi változók X : ω i x Diszkrét vv X Ω) = {x, x 2,, x } lehetséges értékek P X = x i ) = p i X vv eloszlása eloszlása: X : x x 2 x p p 2 p ) 6 Példa Dobókocka X : 2 6 6 6 6 ) 7 Defiíció Eloszlásfüggvéy: F : R R 3) F x) = P X < x) Tulajdoságok: F ) = 0; F ) = F szakadásos lépcs s) F mooto övekv
8 Példa X : 9 Tétel 4 NEVEZETES ELOSZLÁSOK 0 0 2 3 2 6 0, x, ] ), x, 0] 3 akkor F x) = 5, x 0, 2] 6, x 2, ) P a X < b) = F b) F a) Bizoyítás A = X < a, B = X < b P a X < b) = P A B) = P B A) = P B) P A B) = P B) P A) = F b) F a) 20 Példa Mote Carlo rulett 0-36 0=zöld, páratla,3,,35)= piros, páros 2,4,,36)= fekete Ha eurót teszük fel pirosra és piros jö ki yerük egy eurót, külöbe elveszítjük az eurót Az általuk yert összeg egy X vv Adjuk meg a vv eloszlását, az eloszláfggv, ábrázolás Várható érték, szórás Mi törtéik akkor ha a 0-ra egy fél eurót visszakapuk a másik fél a baké)? 2 Példa 2 kocka összege egy S vv Adjuk meg az S eloszlását, várható értékét, szórását! Ha X, Y vv a két kocka által mutatott potok, milye összefüggés va az S és az X, Y, illetve a várható értékek és szórások között? 22 Példa Játék 2 kocka Ha az összeg 2 vagy 2 kapok 8 lejt, ha az összeg 7 a leggyakoribb) kapok 2 lejt Ezekívül zetek lejt A yert összeg egy X vv Adjuk meg a vv eloszlását, az eloszláfggv, ábrázolás Várható érték, szórás Korrekt játék? 4 Nevezetes eloszlások 4 Diszkrét eloszlások 4 Biomiális eloszlás Ha egy kísérlet folyamá egy A eseméy valószí sége p = P A) em módosul, akkor aak a valószí sége, hogy kísérletb l az A eseméy k-szor el forduljo: 4) b, k; p) = C k p k q k), ahol q = p Az eloszlás jól modellezhet egy urával amelybe N golyó va ezek közül N egy szí piros) N N ) más szí fehér)) és amelyb l - visszatevéssel -
4 NEVEZETES ELOSZLÁSOK kiemelük -szer egy-egy golyót Ha A-val jelöljük a kiemelt golyó piros eseméyt amiek a valószí sége N := p, akkor aak valószí sége, hogy az kiemelt N golyóból k-szor piros forduljo és k)-szor fehér) a 4) képlettel kapjuk meg 23 Példa Egy dobozba 7 piros és 3 fehér golyó va 2 alkalommal visszatevéssel) kiemelük egy-egy golyót Mi a valószí sége aak, hogy a piros golyó 8 -szor szerepelje? A=a golyó piros p = 7, b 2, 8; p) = 7 ) 8 3 4 0 C8 2 0 0) = 023 24 Példa Egy dobókockát 0 -szer dobuk fel Mi a valószí sége, hogy legalább 8-szor lesz páros szám? A=páros szám p =, b 0, 8; p)+b 0, 9; p)+b 0, 0; p) = 8 2+ 2 C8 0 2) 2) C0 9 9 2) 2) + C 0 ) 0 ) 0 0 2 2 = 00547 25 Defiíció Egy X vv biomiális eloszlást követ ha eloszlása ) k 42) X : Cp k k q k) k=0,, 26 Tétel A 42) biomiális eloszlást követ X vv várható értéke, szóráségyzete: MX) = p, D 2 X) = pq 27 Példa Egy dobókockát 4-szer dobuk fel Jel X-el a páros számok megjeleéséek a vv Adjuk meg az X eloszlását Mi a valószí sége aak, hogy legfeljebb 3-ast dobuk? A = páros szám P A) = X : 2 C4 0 ) 0 ) 4 C ) ) 3 2 2 4 C 2 ) 2 2 2 4 2 2 0 2 3 4 P "legfeljebb 3") = P X = 0) X = ) X = 2) X = 3)) = P X = 0)+ P X = ) + P X = 2) + P X = 3) = P X = 4) = 5 6 42 Hipergeometrikus eloszlás Az eloszlás jól szemléltethet az urás modellel: Egy urába va N golyó amib l N piros Az urából kiemelük golyót visszatevés élkül Aak a valószí sége, hogy a kiemelt golyókból potosa k golyó lesz piros: ) 2 4 6 ) 43) P, k) = Ck N C k C N N N
4 NEVEZETES ELOSZLÁSOK 2 A feti képletbe feltételezzük, hogy a létezési feltételek teljesülek: N, stb 28 Példa Egy urába 5 piros és 3 fehér golyó va Visszatevés élkül kiemelük 6 golyót Mi a valószí sége, hogy a kiemelt golyókból potosa 4 piros? P 6, 4) = C4 5 C2 3 = 05357 C8 6 29 Defiíció Egy X vv hipergeometrikus eloszlást követ ha eloszlása 44) X : k C k N C k N N C N k=0,, 30 Tétel A 44) hipergeometrikus eloszlást követ X vv várható értéke, szóráségyzete: MX) = p, D 2 X) = pq ), N ahol p = N N, q = p 3 Példa Adjuk meg az X vv ha X a 6/49 Lottó yer számaiak a valószí ségi változója Mi a valószí sége, hogy legalább 5-ös találatuk legye? Számítsuk ki az átlagot, illetve a szórást! ) 0 2 3 4 5 6 X : C 0 6 C6 43 C 6 49 C 6 C5 43 C 6 49 C 2 6 C4 43 C 6 49 C 3 6 C3 43 C 6 49 0324 5420 398386 P legalább 5 találat") = P "potosa 5 találat")+p "potosa 6 találat") = + = 852 5420 398386 0 5 = 6, p = 6 MX) = 6 6 = 073, átlagba 073 találatuk lesz! 49 49 D 2 X) = 6 6 43 49 49 5 48) = 057 DX) = 076 43 Poisso eloszlás 32 Defiíció Egy X vv λ > 0 paraméter Poisso eloszlást követ ha eloszlása: ) 45) X : k λ k k! e λ k=0,,2, 33 Tétel A 45) Poisso eloszlást követ X vv várható értéke, szóráségyzete: M X) = λ, D 2 X) = λ
4 NEVEZETES ELOSZLÁSOK 3 A Poisso eloszlás a biomiális eloszlás határesetekét is értelmezhet : és λ = p álladó, ugyais ) k λ λ k = ) lim b, k, p) = lim C k p k p) k! = lim k! k)! = λk k! lim! λ ) λ k)! k ) λ k) = λk k! e λ 34 Példa A λ = paraméter Poisso eloszlása k = 2-re P X = 2) = 3 3) 2 e 3 = 00398 és az X eloszlása: 2! ) 0 2 3 X : 0765 02388 00398 λ3 3! e λ 44 Geometriai eloszlás Aak a valószí sége, hogy egy A eseméy csak) a k-ik kísérletél következze be: ahol p = P A), q = p P = pq k, 35 Példa Mi a valószí sége, hogy egy pézérme feldobásáál csak az 5 -ik dobásál legye fej? P = ) 4 2 2 = 32 36 Defiíció Egy X vv geometriai eloszlást követ ha eloszlása: ) k 46) X : pq k k=,2, 37 Tétel A 46) geometriai eloszlást követ X vv várható értéke, szóráségyzete: MX) = p, D2 X) = p p 2 38 Példa Jel X-el azt a vv ami az érme csak) a k-ik dobásáál mutat fejet Adjuk meg az X eloszlását és várható értékét ) 2 3 4 5 X :, és M X) = 2 2 4 8 6 32
42 Folytoos eloszlások 42 Egyeletes eloszlás 4 NEVEZETES ELOSZLÁSOK 4 39 Defiíció Egy X vv egyeletes eloszlást követ ha s r ségfüggvéye: { x [a, b] b a) 47) f x) = 0 külöbe 40 Tétel A 47) egyeletes eloszlást követ X vv várható értéke, szóráségyzete: M X) = a + b 2, D2 X) = b a)2 2 422 Normális eloszlás Az Euler-féle gamma fggv 4 Defiíció Euler-féle gamma fggv evezzük az alábbi fggv-t: Γ p) = ˆ p =, 2 a gamma függvéy értéke Γ ) = Γ 2) = ˆ 0 ˆ e x dx = e x 0 = 0 x p e x dx, p > 0 ˆ xe x dx = x e x) ) dx = x e x 0 + ˆ e x dx =, 0 illetve további p pozitív egészekre: Γ p + ) = ˆ 0 ˆ x p e x dx = x p e x) dx = x p e x) 0 0 ˆ + p x p e x dx = pγ p) vagyis 0 0 0 48) Γ p + ) = pγ p) A 48)-b l következik, hogy Γ p + ) = p p ) Γ ), és 49) Γ p + ) = p!,
4 NEVEZETES ELOSZLÁSOK 5 vagyis a Γ függvéy általáosítása a faktoriális függvéyek 42 Tétel Euler-féle tükrözési képlet 40) Γ x) Γ x) = π si πx Az el bbi tételb l x = -re következik, hogy 2 ) 4) Γ = π 2 43 Defiíció Gauss-féle itegrál I = ˆ 0 e x2 dx A Gauss itegrál kifejezhet a gamma függvéy segítségével: ) ˆ Γ = x 2 e x dx = π, 2 0 ahoa x = t 2 változócserével következik dx = 2t dt és ˆ t 2 ) 2 e t 2 2t dt = π vagyis 0 ˆ 0 e t2 dt = π 2 44 Defiíció Egy X vv m, σ m R, σ R +) paraméter ormális eloszlást követ ha s r ségfüggvéye: f x) = σ 2π e 2 x m σ ) 2, x R Az m és σ jeletése: M X) = m várható érték, D X) = σ a szórás 423 t-eloszlás 45 Defiíció Egy X vv t Studet) ν-szabadságfokú eloszlást követ ha s r ségfüggvéye: f x) = Γ ) ν+ 2 Γ ) ν 2 νπ ) + x 2 ν+, x R 2 ν Ha ν az eloszlás közelíti a stadard ormális eloszlást
424 χ 2 khi-égyzet) eloszlás 4 NEVEZETES ELOSZLÁSOK 6 46 Defiíció Egy X vv ν-szabadságfokú χ 2 eloszlást követ ha s r ségfüggvéye: f x) = x ν 2 2 e x 2 2 ν 2 Γ ), x R ν 2
2 FEJEZET Bevezetés a statisztikába 2 Statisztikai mita, gyakoriság Alapsokaság =a statisztikai meggyelés tárgyát képez egyedek összessége, halmaza Statisztikai mita=az alapsokaságból kiválasztott egyedekhez tartozó adatok A mita kiválasztásáál gyeli kell, hogy a mita reprezetatív legye, vagyis az adott sokaságot jellemezze Egy X,, X mita elemei is valószí ségi változók mert értékük jel x,, x ) a mitázási techikától vagyis a véletlet l függ Ezeket a változókat függetleek és azoos eloszlásúak tekitjük A bel lük képzett valószí ségi változók statisztikai függvéyekek vagy egyszer e statisztikák ak evezzük Mivel ezeket tapasztalati úto szerezzük empirikus vagy tapasztatlati statisztikákak evezzük 7
22 A MINTA SZÁMSZER JELLEMZŽI 8 22 A mita számszer jellemz i Jelöljük X, X 2, X egy mita elemeit Mitaátlagak mitaközép, empirikus várható érték) evezzük az alábbi mér számot 22) X = X + + X i= = X i Ha X -el toljuk el az X mitát akkor eek a várható értéke ulla Xi X ) = 0 i= Az átláthatóság érdekébe gyakra csoportosítjuk az adatokat például övekv sorredbe), vagy osztályokba redezzük 47 Példa Az X : 6, 2, 7, 2, 5, 3, 7, 3, 4, 6, 4, 5, 4, 8, 4, 5, 6, 7, 5, 9, 5, 3, 5, 6, 6, 7, 6, 7, 5, 7, 3, 8, 2, 8, 5, 6, 8, 3, 6, 5 mita átlaga X = 6 + 2 + + 2)/40 = 5325 A mita átláthatóbb ha övekv sorredbe redezzük X : 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, illetve csoportosítjuk X i 2 3 4 5 6 7 8 9 f i 3 5 4 9 8 6 4, ahol f i az X i gyakorisága Az alábbi ábrá látható a megfelel empirikus eloszlás és az eloszlásfüggvéy ABRA eloszlasfggveps Az adatokat gyakra osztályokra botjuk osztály oszt közép X i gyakoriság f i rel gyak g i kumulált rel gyak i g i 2 4 3 2 2/40 2/40 5 6 55 7 7/40 29/40 7 9 8 /40 Az osztályok száma általába= -hez közeli érték, de szükség szerit változtatható az osztályok száma, hossza Csoportosított adatok eseté az átlag: 222) X = f X + + f k X k k i= = f ix i f + + f k 48 Példa Az el bbi mitát véve alapul a mitaátlag X = 3 2+5 3+4 4+9 5+8 6+6 7+4 8+ 9 3+5+4+9+8+6+4+ = 5 325, vagy az osztály csoportosítást véve alapul X = 3 2+55 7+8 40 = 5 437 5 Habár az utolsó eredméy em egyezik meg potosa az el bbivel, az osztályokra
22 A MINTA SZÁMSZER JELLEMZŽI 9 való csoportosítás haszos mert megköyíti az adatok feldolgozását f leg agy számú mita eseté A mitára egy másik jellemz adat a módusz, vagyis a leggyakrabba el forduló adat Az el bbi példába Mod = 5 mivel eek a legagyobb a gyakorisága= 9 Egy másik szám amivel jellemezhet a mita a mediá, illetve általáosítása a kvartilisek, kvatilisek A mediá a mita közepét jelöli, vagyis ha X X a redezett mita, akkor 223) Me = { Xm+ ha = 2m + Xm +X m+ ha = 2m 2 Az els, második és harmadik kvartilis a mita egyedét, felét, háromegyedét jelöli A második kvartilis megegyezik a mediáal A p-kvatilisek a kvartilisek általáosításai 49 Példa Az adott mita mediája Me = 5, és az els, második, harmadik kvartilise egyel redre 4, 5, 7-el A mitaterjedelem a mita legagyobb és legkisebb érték közötti külöbség 224) R = X X Az említett mér számoko kívül szóródási mutatókat is számítuk A tapasztalati szóráségyzet s 2, a mitaelemek mitaközépt l való eltérései égyzetéek átlaga, azaz 225) s 2 X X ) 2 + + X X ) 2 i= Xi X ) 2 = = Kis miták esetébe a korrigált tapasztalati szóráségyzetet s 2 haszáljuk: 226) s 2 X X ) 2 + + X X ) 2 i= Xi X ) 2 = = A tapasztalati s, illetve korrigált szórás s 227) s = s 2 = 228) s = s 2 = i= i= Xi X ) 2, Xi X ) 2
A 227),228)-b l következik, hogy 22 A MINTA SZÁMSZER JELLEMZŽI 20 s s = vagyis agy értékre a két szórás megegyezik Csoportosított adatok eseté a szórásokat a 229) 220) s = s = k k i= f i i= f i Xi X ) 2 Xi X ) 2 képletekkel számítjuk ki ahol k a csoportosítás utá létrejött osztályok számát jelöli Az Excelbe a következ függvéyekkel számítjuk ki az ismertetett paramétereket: ÁTLAG), MÓDUSZ), MEDIÁN), SZÓRÁSP), SZÓRÁS)
23 STATISZTIKAI BECSLÉSEK 2 23 Statisztikai becslések A mitavételezés els dleges célja, hogy iformációkat szolgáltasso az alapsokaság jellemz ire, például a várható értékre, szórásra 23 Potbecslés Egy becslés akkor tekithet jóak ha eleget tesz legalább az egyikek az alábbi követelméyekek: torzítatla, hatásos, kozisztes, elégséges 50 Tétel A mitaátlag torzítatla becslést ad az X alapsokaság várható értékére, vagyis 23) M X ) = M X) Bizoyítás A várható érték additivitását és homogeitását felhaszálva következik, hogy M X ) ) X + + X = M = M X + + X ) = M X ) + + M X )) = M X) + + M X)) = M X) = M X) 5 Tétel Az empirikus korrigált szóráségyzet torzítatla becslést ad az X alapsokaság D 2 X) szóráségyzetére, vagyis M s 2) = D 2 X) s 2 = Bizoyítás i= Xi X ) 2 Xi 2 + i= = i= X 2 2X X = i= ) Xi 2 + X 2 2X i X = Xi 2 + i= Xi 2 + X 2 2X 2 = i= X 2 2X i= Xi 2 X 2 i= X i = Figyelembe véve, hogy M X ) = M X), M X i ) = M X) következik M s 2) = ) M Xi 2 X 2 = ) M X 2 i M Xi ) 2) M X 2) M X ) ) 2 = i= i= D 2 X i ) D 2 X ) = D2 X) 2 D2 X) = D2 X), i= i=
23 STATISZTIKAI BECSLÉSEK 22 tehát a s 2 torzított becslést ad, viszot becslése torzítatla M s 2 ) = D 2 X) s2 =: s 2 a korrigált empirikus szórás 52 Tétel Az empirikus korrigált szóráségyzet kozisztes becslést ad az X alapsokaság D 2 X) szóráségyzetére, vagyis lim D2 s 2) = 0 232 Itervallumbecslés Az el bbi fejezett l eltér e ebbe a fejezetbe egy szimmetrikus) kodecia megbízhatósági) itervallumot állapítuk meg amely agy valószí séggel tartalmazza az alapsokaság jellemz jét Az említett agy valószí séget p) -vel jelöljük, kodecia megbízhatósági) szit ek evezzük és a leggyakrabba 099, 095 vagy 090 értékeket veszi fel A megfelel p értéket 00, 005, 0) tévedési vagy szigikaciaszit ek evezzük Egy X valószí ségi változó m,σ paraméter, ormális eloszlás úak evezzük jele X N m, σ)) ha s r ségfüggvéye: f x) = σ x m) 2 2π e 2σ 2, x R ABRA ormeloszlaseps Az X változót stadard ormális eloszlásúak evezzük ha X N 0, ) Aak a valószí ségét, hogy az X kisebb legye egy adott x értékél az F eloszlásfüggvéyel fejezzük ki: P X < x) = F x) = σ 2π ABRA ormeloszlasfggveps 232 A várható érték becslése ˆ x e t m)2 2σ 2 dt 53 Tétel Ha X,, X N m, σ) ormális eloszlású változók akkor X = X ) + + X σ N m, Bizoyítás M X ) ) X + + X = M = D 2 X ) ) = D 2 X + + X M X i ) = m = m i= = 2 i= D 2 X i ) = 2 σ2 = σ2,
23 STATISZTIKAI BECSLÉSEK 23 ahoa D X ) = σ 2 = σ 54 Következméy Az 232) u = X m σ változó stadard ormális eloszlású u N 0, ) Ajálott a stadard eloszlás el yeit szimmetria, egyszer bb képlet, táblázatba megadott értékek) kihaszáli ezért a 232) stadardizálással bármely N m, σ) ormális eloszlás visszavezethetük a N 0, ) stadard ormális eloszlásra Mivel u N 0, ) a kodecia-itervallumot a 0-ra szimmetrikusa [ u p, u p ] fogjuk meghatározi 233) P u p X m σ < u p ) = p Következik, hogy tehát ahoa Φ u p ) Φ u p ) = p, 2Φ u p ) = p, 234) Φ u p ) = p 2, ahol Φ a stadard eloszlás eloszlásfüggvéye Az 234) képletb l kiszámítható u p értéke 235) u p = Φ p ), 2 amiek segítségével megszerkesztjük a kodecia-itervallumot u p X m σ < u p A m veletek elvégzése utá kapjuk az m várható értékre igaz a alábbi egyel tleség X u p σ < m X + u p σ
23 STATISZTIKAI BECSLÉSEK 24 Tehát az m kodecia-itervallumakét haszáljuk a ] σ σ 236) X u p, X + u p, ami azt jeleti hogy az alapsokaság m várható értéke p valószí séggel esik ebbe az itervallumba Az Excelbe a ϕ ormális s r ség eloszlást, illetve Φ eloszlásfüggvéyt a NORMELOSZL) függvéyel számítjuk ki Az eloszlásfüggvéy iverzét a INVERZNORM) függvéyel számítjuk ki 55 Példa Az el bbi példa adataira határozzuk meg a kodecia-itervallumot 95%-os megbízhatósági szite ha az alapsokaság szórása ismert σ = 83 Az u p = ) = 96, tehát a kodecia-itervallum 5325 96 83 40, 5325 + 96 83 Φ 005 2 = 47579, 5892], vagyis 95%-os valószí séggel az alapsokaság várható értéke ebbe az itervallumba található Nagyobb valószí ség eseté az itervallum b vül Például 99%-os megbízhatósági szite u p = 25758 és az itervallum 45797, 60703] Ha az alapsokaság szórása ismeretle akkor σ helyett az s mita korrigált szórást helyettesítve az u 232) kifejezésbe a 237) t = X m s valószí ségi változót kapjuk, amely egy szabadságfokú t Studet) eloszlású valószí ségi változó A 233) hasolóa, a t-eloszlás táblázatából kikeressük azt a t p értéket amelyre P t p X m s t p ) = P t t p ) = p, vagyis aak a valószí sége, hogy t értéke a [ t p, t p ] itervallumba esse egyel p)-vel, ami ekvivales azzal, hogy aak a valószí sége, hogy az alapsokaság m várható értéke a 40 ] 238) [X t p s, X + t p s ], kodecia itervallumba esse egyel p)-vel
23 STATISZTIKAI BECSLÉSEK 25 Ha az el bbi példába a szórás ismeretle akkor helyette haszáljuk a korrigált szórást s = 832, a t-eloszlás táblázatából p = 095 és df = 39 szabadságfokak megfelel a t p = 20227 érték, tehát a kodecia-itervallum [ 5325 20227 832, 5325 + 20227 832 ] = [4739 4, 590 6] 40 40 A t-eloszlásfüggvéyt az Excelbe a TELOSZLÁS) függvéyel, az iverzét INVERZT)-vel számítjuk ki
24 STATISZTIKAI HIPOTÉZISEK VIZSGÁLATA 26 24 Statisztikai hipotézisek vizsgálata A statisztikai vizsgálatok sorá hipotéziseket feltételezéseket) teszük az alapsokaság bizoyos jellemz ire várható érték, szórás, eloszlás, függetleség, stb) A vizsgálat egy alap- vagy ullhipotézis jel H 0 ) és egy ellehipotézis jel H) felállításából áll majd ezek helyességéek elle rzéséb l Például, ha egy X alapsokaságra szereték leelle rizi, hogy a várható értéke M X) = m egyel e egy m 0 értékkel akkor a ullhipotézis 24) H 0 : M X) = m 0 A vele szembe felállítadó ellehipotézis kétféle lehet: kétoldali vagy egyoldali A kétoldali ellehipotézis 242) H : M X) m 0 míg az egyoldali 243) H : M X) < m 0 vagy H : M X) > m 0 Alapszabálykét, ha elfogadjuk a ullhipotézist elvetjük az ellehipotézist és fordítva, ha elvetjük a ullhipotézist elfogadjuk az ellehipotézist Az eljárást amellyel a ullhipotézist elfogadjuk vagy elvetjük statisztikai próbáak evezzük A dötést statisztikai függvéyek segítségével hozzuk meg amit a mitából számítuk ki bizoyos p megbízhatóság szit mellett Eek elleére, a dötés eredméye, mivel valószí ségi értékek alapjá hozzuk, lehet hibás is Els fajú hibát követük el ha elvetjük az igaz H 0 hipotézist Másodfajú hibát követük el ha elfogadjuk a hibás H 0 hipotézist A hibás dötés valószí sége az els - és másodfajú hiba valószí ségeiek összegéb l adódik P hiba) = P els fajú hiba) + P másodfajú hiba) Az alábbi táblázat a helyes és hibás dötéseket szemlélteti H 0 igaz H 0 hamis H 0 elfogadása helyes dötés másodfajú hiba H 0 elvetése els fajú hiba helyes dötés 24 Egymitás u-próba Feltételezzük, hogy adott egy X N m, σ) ormális eloszlású valószí ségi változó amelyek m várható értékét em, de σ
24 STATISZTIKAI HIPOTÉZISEK VIZSGÁLATA 27 szórását ismerjük Vizsgáli szereték, hogy a várható érték M X) = m megegyezike egy m 0 értékkel Eek érdekébe egy X, X 2,, X elem mitát veszük amelyek X átlaga csak közelítei fogja m értékét Ha a ullhipotézis H 0 : M X) = m 0 igaz a kétoldali ellehipotézissel szembe akkor a H : M X) m 0 244) u = X m 0 σ próbafüggvéy stadard ormális eloszlású u N 0, ), és p valószí séggel esik a [ u p, u p ] kodecia-itervallumba, ahol u p a táblázatból kiolvasott, p szitek megfelel érték Tehát a H 0 ullhipotézist elfogadjuk ha 245) u u p, vagyis az u bee va az elfogadási tartomáyba Ebbe az esetbe azt modjuk, hogy az alapsokaság várható értéke és az m 0 feltételezett érték külöbsége em szigikás A ullhipotézist elvetjük az ellehipotézist elfogadjuk) ha 246) u > u p, vagyis ha az u a kritikus tartomáyba va Ebbe az esetbe az alapsokaság várható értéke és az m 0 feltételezett érték között szigikás eltérés va 56 Példa Egy gépet 55 cm pálcikák vágására állították be A beállítás elle rzésére egy 40 elem mitát veszek: 6, 2, 7, 2, 5, 3, 7, 3, 4, 6, 4, 5, 4, 8, 4, 5, 6, 7, 5, 9, 5, 3, 5, 6, 6, 7, 6, 7, 5, 7, 3, 8, 2, 8, 5, 6, 8, 3, 6, 5 p = 5%-os tévedési szite, kell-e állítai a gépe ha a pálcikák hosszáak szórása ismert σ = A pálcikák hossza ormális eloszlást követ amiek szórása ismert A várható értékre a hipotézisek H 0 : M X) = 55 H : M X) 55
24 STATISZTIKAI HIPOTÉZISEK VIZSGÁLATA 28 A mita átlaga X = 5325, tehát a 244) képletb l u = 5325 55 40 = 06 8, és a táblázatból u p=005 = 96 Mivel u u p a ullhipotézist elfogadjuk, vagyis 095 valószí séggel az alapsokaságba a pálcikák hossza em tér el szigikása az 55 értékt l, a gép jól m ködik 242 Egymitás t-próba A legtöbbször a ormális eloszlású alapsokaság szórását em ismerjük Ebbe az esetbe a Studet-féle eloszlást haszáljuk A ullhipotézis elle rzésére a H 0 : M X) = m 0 247) t = X m 0 s próbastatisztikát haszáljuk, ahol a mitaszám, X a mitaátlag és s a mita korrigált szórása Az u próbához hasolóa a ullhipotézist p szigikacia szite fogadjuk el ha 248) t t p ahol t p értékét a Studet-féle táblázatból határozzuk meg szabadságfok és p szigikaciáak megfelel e 57 Példa Ha az el bbi példába a pálcikák szórása ismeretle akkor t = 5325 55 832 40 = 0604 4, és a p = 005 szigikacia szitek, illetve df = 39 szabadságfokak megfelel a t p = 20227 érték Mivel t t p következik, hogy 095 megbízhatósági szite a ullhipotézist elfogadjuk Az alábbi ábrá látszik, hogy a t számított érték bee va a megbízhatósági tartomáyba ABRA megbizhattartomeps Az Excelbe lásd ZPRÓBA), TPRÓBA) 243 χ 2 -próba szórásvizsgálatra A hipotézis vizsgálatot szórásra is elvégezhetjük Feltételezzük, hogy X N m, σ) egy ormális eloszlású valószí ségi változó és vizsgáli szereték, hogy a szórás értéke D 2 X) = σ megegyezik-e egy σ 0 értékkel, vagyis származhat-e egy adott mita σ 0 szórású alapsokaságból? A ull-illetve
24 STATISZTIKAI HIPOTÉZISEK VIZSGÁLATA 29 ellehipotézisek H 0 : σ = σ 0 H : σ σ 0 kétoldali ellehipotézis H : σ < σ 0 vagy σ > σ 0 egyoldali ellehipotézis A kiválasztott elem mitába kiszámítjuk az s 2 korrigált szóráségyzetet és a χ 2 próbastatisztikát 249) χ 2 ) s 2 =, σ0 2 majd összehasolítjuk a táblázatbeli χ 2 khi-égyzet) értékkel Ha χ 2 bee va a megbízhatósági tartomáyba 240) χ 2 < χ 2 akkor a ullhipotézist elfogadjuk 58 Példa Az adott mita származhat-e egy alapsokaságból amelyek szórása kisebb mit 5? A mita agysága = 40, és a korrigált szórás s = 83, tehát χ 2 = 39 832 5 2 = 58 048, míg a táblázatbeli érték χ 2 = 5457, tehát a 240) em teljesül, a ullhipotézist elvetjük 95%-os megbízhatóság mellett 244 Kétmitás u-próba Legye X N m X, σ X ) és Y N m Y, σ Y ) két függetle, ormális eloszlású valószí ségi változó, amelyekek ismerjük a σ X, illetve σ Y szórásait Legye X, X 2, és Y, Y 2, a változók egy X, illetve Y elem mita Vizsgáli kell, hogy a két sokaság várható értéke megegyezik-e Ha 24) H 0 : M X) = M Y ) ullhipotézis teljesül a 242) 243) H : M X) M Y ) ellehipotézissel szembe, akkor az H : M X) < M Y ) vagy M X) > M Y ) 244) u = X Y σ 2 X X + σ2 Y Y
24 STATISZTIKAI HIPOTÉZISEK VIZSGÁLATA 30 próbastatisztika N 0, ) eloszlású, ahol X, Y az adott miták átlagai Az egymitás próbához hasolóa, a számított u változó p valószí séggel esik a [ u p, u p ] kodecia-itervallumba, ahol u p a táblázatból kiolvasott, p szitek megfelel érték Tehát a H 0 ullhipotézist elfogadjuk ha 245) u u p és ebbe az esetbe azt állítjuk, hogy a két mita várható értékei között ics szigikás eltérés 245 Kétmitás t-próba Az el bbi alpothoz hasolóa az X N m X, σ X ) és Y N m Y, σ Y ) miták várható értékéek a vizsgálatát végezzük ha a miták szórásai ismeretleek de feltehet e azoosak Ebbe az esetbe a 24) ullhipotézis helyességét a 246) t = X Y s X + Y X + Y 2 szabadságfokú Studet-eloszlású próbastatisztikával végezzük, ahol S a két mita alapjá becsült közös szórás 247) S 2 = X ) s 2 X + Y ) s 2 Y, X + Y 2 és s X, s Y a két mita korrigált szórása A H 0 242) ullhipotézist elfogadjuk ha t a [ t p, t p ] megbízhatósági itervallumba esik, vagyis t t p A kétmitás t-próba csak azoos szórású mitára alkalmazzuk, eek elle rzésére viszot az F-próbát Fisher) haszáljuk 246 F-próba Az F-próbával két X N m X, σ X ) és Y N m Y, σ Y ) függetle változó szórásaiak D X) = σ X, illetve D Y ) = σ Y összehasolítását végezzük A ullhipotézis 248) H 0 : σ X = σ Y és a megfelel egyoldali, illetve kétoldali hipotézisek
24 STATISZTIKAI HIPOTÉZISEK VIZSGÁLATA 3 249) 2420) H : σ X σ Y H : σ X < σ Y vagy σ X > σ Y Jelöljük S 2, illetve s 2 -el a két alapsokaságból kiválasztott mita korrigált szóráségyzeteiek maximumát, illetve miimumát 242) S 2 = max ) s 2 X, s 2 Y, s 2 = mi ) s 2 X, s 2 Y és jelöljük DF, illetve df -el a megfelel miták szabadságfokát Képezzük a 2422) F = S2 s 2 statisztikát amely DF, df ) szabadságfokú F-eloszlást követ A Fisher táblázatból kikeressük a F p p-szigikacia szitek megfelel értéket és ha 2423) F F p, akkor a H 0 hipotézist p szigikacia szite elfogadjuk, vagyis a szórások közötti eltérés a véletleek tulajdoítható A kétmitás próbáak az alkalmazásához szükséges a szórások egyel sége amit az F-próbával vizsgáluk) Ha ez em teljesül akkor a Welch próbát alkalmazzuk 59 Példa Két terület ph értékét mérve az alábbi mitákat kapták X i 63 62 60 63 67 64 67 66 Y j 62 6 62 60 64 64 63 67 60 62 Állítható-e, hogy a két terület talaj ph várható értéke megegyezik 95% megbízhatósági szite? Bizoyítás A két mita átlagai X = 64, Y = 625 és korrigált szórásai s X = 02507, s Y = 022 Az alapsokaság várható értékére a ull-hipotézisek H 0 : M X) = M Y ) és kétoldali ellehipotézis H : M X) M Y )
24 STATISZTIKAI HIPOTÉZISEK VIZSGÁLATA 32 Mivel az alapsokaság szórásait em ismerjük a kétmitás t-próbát haszáljuk, de ehhez a szórások egyel ségét kell leelle rizi F-próbával H 0 : D X) = D Y ) H : D X) D Y ) A 242) képletb l S 2 = 02507 2 = 0062 85, s 2 = 022 2 = 00 498 6, és DF = X = 7, df = Y = 9, majd 2422)-b l F 0062 85 = = 260 5 A 7, 9) 00 498 6 szabadságfok és p = 005 -ek megfelel kétoldali Fisher táblázatbeli érték F p = 497 Mivel F < F p a szórások egyel ségére voatkozó ullhipotézist elfogadjuk σ X = σ Y ) A továbbiakba a t-próbát haszálva vizsgáljuk, hogy a két várható érték egyel -e A 247) képletb l S 2 = 8 ) 025072 + 0 ) 022 2 = 00528, 8 + 0 2 majd 246)-b l t 64 625 = = 376 2 00528 + 8 0 A t-eloszlás táblázatba 8 + 0 2 szabadságfok és p = 005 szigikacia szitek t p = 22 érték felel meg ahoa t < t p, tehát a ullhipotézist megtartjuk, vagyis a két talaj ph várható értéke egyel ek tekithet az adott szigikacia szite a külöbség a véletleek tulajdoítható)
25 KORRELÁCIÓ ÉS REGRESSZIÓANALÍZIS 33 25 Korreláció és regresszióaalízis A korreláció-aalízis két változó X és Y kapcsolatáak szorosságát vizsgálja A regresszióaalízis a változók közötti összefüggést függvéyszer e írja le A leíró függvéyt regressziós függvéyek evezzük A változók közötti szorosságot a korrelációs együtthatóval mérjük ρ = M X M X)) Y M Y ))) D2 X) D 2 Y ) amely és közötti értékeket vesz fel = ρ M XY ) M X) M Y ) D X) D Y ) Ha X és Y függetleek akkor ρ = 0 fordítva viszot em igaz Ha ρ = 0 akkor azt modjuk, hogy X és Y korrelálatlaok Az X és Y között aál szorosabb a kapcsolat miél közelebb va ρ abszolút értéke -hez X és Y között Y = ax + b lieáris kapcsolat va ρ = Legye X, X 2,, X és Y, Y 2,, Y két elem mita a két alapsokaságból Az r tapasztalati korrelációs együttható i= Xi X ) Y i Y ) 25) r = Yi Y ) = 2 i= Xi X ) 2 i= 252) = i= X iy i i= X i i= X2 i i= X i) 2 i= Y i ) i= Y i 2 ) i= Y i) 2 Statisztikai próbával kell eldötei, hogy az alapsokaságok amelyb l az X és Y miták származak korreláltak-e vagy sem Jelöljük ρ-val az alapsokaságok korrelációs együtthatóját Ekkor a ull, illetve ellehipotézis: H 0 : ρ = 0 H : ρ 0 a próba statisztika pedig 253) t ρ = r, r 2 2
25 KORRELÁCIÓ ÉS REGRESSZIÓANALÍZIS 34 amely df = 2 szabadságfokú t eloszlást követ Ha egy adott p megbízhatósági szitek a t ρ bee va az elfogadási tartomáyba t p, t p ), akkor a ullhipotézist elfogadjuk, külöbe elvetjük Ha a korrelációs együttható 0 és X, Y ormális eloszlásúak, akkor függetleek is, külöbe csak korrelálatlaok Ha X ás Y között lieáris kapcsolat va akkor Y = ax + b és a mitákat felhaszálva becslést kell adi az a és b paraméterekre Az egyik módszer az úgy evezett legkisebb égyzetek módszere A módszer abba áll, hogy az y = ax + b egyees és a mitába szerepl potok közötti függ leges távolságok égyzeteiek összege miimális legye ABRA lmeps Matematikailag a 254) F a, b) = Y i ax i + b)) 2 mi i= kétváltozós függvéy meghatározását jeleti A stacioárius potok { F a = 0 F b = 0, amiek megoldása a következ lieáris egyeletredszerhez vezet { i= 2 y i ax i b) X i ) = 0 i= 2 Y i ax i b) ) = 0, amely átredezve az alábbi ormálegyeletredszert eredméyezi { b + a i 255) X i = i Y i b i X i + a i X2 i = i X, iy i amiek megoldása 256) b = i= X i= iy i X i i= Y i i= X2 i i= X i) 2, a = Y bx 60 Példa Hat páciesél az alábbi vércukorszitet mérték: X i pácies kora 43 2 25 42 57 59 Y i vércukorszit 99 65 79 75 87 8
25 KORRELÁCIÓ ÉS REGRESSZIÓANALÍZIS 35 Számítsuk ki a miták korrelációs együtthatóját, majd taulmáyozzuk, hogy létezik-e összefüggés a kor és a vércukorszit között X = X i = 43+59 = 4667, Y = 8, D 2 X) = 6 D 2 Y ) = 09333, Xi X)Y i Y ) DX) DY ) = 05298 Xi X) 2 = 2068056, r = Egy 095 = p megbízhatósági szite a kor és a vércukorszit kapcsolatáak a feltárásához felállítjuk a ull, illetve ellehipotézist: H 0 : ρ = 0, H : ρ 0, 05298 majd a 253) képlettel kiszámítjuk a t ρ próbastatisztikát: t ρ = = 05298 2 6 2 2494 Mivel p = 095 szite t p = 27764 df = 6 2 = 4) a t ρ t p, t p ) t ρ bee va az elfogadási tartomáyba), tehát a ullhipotézist ics okuk elveti, vagyis a kor és a vércukorszit korrelálatla változók
Irodalomjegyzék [] Balogh Gábor, Visual Basic és Excel programozás, Computerbooks Kiadó, Budapest, 200 [2] Bara S, et al, Bevezetés a matematikai statisztikába, Debrecei Egyetem Kiadó, Debrece, 2005 [3] Baráth Cs, Ittzés A, Ugrósdy Gy: Biometria, Mez gazda Kiadó, Budapest, 996 [4] Bálit Gy, Statisztika: elmélet és gyakorlat, Scietia Kiadó, Kolozsvár, 2009 [5] Ciucu G, Craiu V, S cuiu I, Probleme de statistic matematic, Editura Tehic, Bucure³ti, 974 [6] Cseke V, A valószí ségszámítás és gyakorlati alkalmazásai, Dacia Köyvkiadó, Kolozsvár, 982 [7] Dekiger G, Valószí ségszámítás, Taköyvkiadó, Budapest, 978 [8] Dekiger G, Valószí ségszámítási gyakorlatok, Taköyvkiadó, Budapest, 977 [9] Jáosa A, Adatelemzés számítógéppel, Perfekt Kiadó, 2005 [0] Kelly, J, Microsoft Excel: utilizare, Teora, Bucuresti, 2000 [] Korpás Attiláé szerk), Általáos statisztika I-II, Nemzeti Taköyvkiadó, Budapest, 996 [2] Köves P, Páriczky G, Általáos statisztika, Közgazdasági és Jogi Köyvkiadó, Budapest, 975 [3] Maczel J, szerk), Statisztikai módszerek alkalmazása a mez gazdaságba, Mez gazdasági Kiadó, Budapest, 983 [4] Nash JC, Teachig statistics with Excel ad other spreadsheets, Computatioal Statistics ad Data Aalysis, 2008 [5] Obádovics Gy, Valószí ségszámítás és matematikai statisztika, Scolar Kiadó, Budapest, 200 [6] Perczelé Zalai M, Biometria a kertészetbe, Kertészeti Egyetem, Budapest, 996 [7] Podmaiczky L, Illés BCs, A számítógépes tervezés lehet ségei a mez gazdaságba, Pao Agrártudomáyi Egyetem, Gödöll, 997 [8] Sachs, L, Agewadte statistik, 4kiad, Spriger Verlag, Berli-Heidelberg-New York, 974 [9] Váradi Zs, Az Excel fortélyai em csak haladókak, M szaki Köyvkiadó, Budapest, 997 36