Matematikai statisztika 008. május 8.
ii
Tartalomjegyzék. A statisztika alapfogalmai.. Alapstatisztikák.................................. Feladatok................................... 6. Véletle a statisztikába.. Véletle meyiségek............................... Nevezetes eloszlások............................. 3.3. Feladatok................................... 6 3. Becslés 3.. Potbecslés.................................. 3.. Itervallum becslés.............................. 6 3.3. Feladatok................................... 30 4. Hipotézis vizsgálat 35 4.. Aráy illetve valószí½uség próbája, (;c) terv................ 36 4.. Átlag és szórás próbái ormális eloszlás eseté............... 39 4.3. Nem paraméteres próbák........................... 43 4.3.. Illeszkedés vizsgálat.......................... 43 4.3.. Függetleség vizsgálat próbával................. 45 4.3.3. Homogeitás vizsgálat Wilcoxo próbával............. 46 4.4. Feladatok................................... 47 5. Regresszió aalízis 55 5.. Többváltozós lieáris regresszió....................... 56 6. Szórásaalízis 59 6.. Egyszer½u osztályozás............................. 60 A. Táblázatok 63 B. Képletek 73 iii
iv TARTALOMJEGYZÉK
. fejezet A statisztika alapfogalmai Statisztikai feladatak azt evezzük, amikor egy alapsokaság (véges vagy végtele halmaz) valamely jellemz½ojére kíváuk következteti egy mita (az alapsokaság egy véges részhalmaza) elemeib½ol. Az ilye feladatokba megfogalmazható kérdések, és az alkalmazható módszerek alapvet½oe függeek az alapsokaság, és így a mita elemiek mibelétét½ol, meg gyelhet½o adattípusától. Ezek az adattípusok a meg gyelés egy adott szempotja, ismérve szerit a következ½ok lehetek:. Nomiális Amikor két elemr½ol csupá azoosságuk illetve külöböz½oségük döthet½o el.. Ordiális Amikor két elemr½ol emcsak külöböz½oségük, de a köztük lév½o sorred is eldöthet½o, de a külöböz½oségek mértéke em összehasolítható. 3. Itervallum Amikor a külöböz½o elemek sorrediségé kív½ul a külöböz½oségük mértéke, mit az adatok külöbsége megadható, de aráyuk em értelmezhet½o. 4. Aráy típus (meyiségi adattípus) Amikor egy elem meg gyeléséek eredméye egy meyiségi adat, tehát egy valós szám. Természetese az egyes adattípusok a feti sorredbe azt megel½oz½o típuskét is haszálhatók. Egy elemmel kapcsolatos meg gyelés eredméye a feti típusok tetsz½oleges együttese is lehet, és így egy mita kapcsá adataik egy olya táblázatba redszerezhet½ok, melyek sorai az esetek, egy mita elemmmel kapcsolatos meg gyelt ismérvek adatai, oszlopai pedig a váltzók, az ismérvek adatai az egyes esetekbe. Következtetéseiket egy ilye adathalmazból yerhet½o, általába meyiségi típusú eredméy, úgyevezett statisztika segítségével hozzuk meg.
. FEJEZET. A STATISZTIKA ALAPFOGALMAI.. Alapstatisztikák Statisztikai feladatokba sokszor az alapsokaság valamely meyiségi jellemz½ojére kell következtetük, amiek ésszer½u módja, ha a mita hasoló jellemz½ojével, tehát egy statisztika értékéek kiszámításával válaszoluk. Természetese, ha másik mitát választuk, következtetésük is más lesz, ezért ezt az eljárást, a bizoytalaságot is kifejez½o becslés kifejezéssel evezzük meg. Az alábbiakba felsoroluk éháy gyakra haszált jellemz½ot és a megfelel½o becslését, feltütetve a szükséges adattípust. Az alapsokaság illetve a mita elemeiek egy adott ismérv szeriti értékeit jelölje a továbbiakba X ; X ; ; X N illetve x ; x ; ; x. Oridális adattípus eseté az értékeket övekv½o sorrebe redezve kapjuk: X X X N illetve x x x.. Aráy (omiális adattípus) Ha az N elem½u alapsokaság elemei között M számú redelkezik egy adott tulajdosággal, akkor a p = M aráy becslése egy elem½u mitából bp = k ; ha a mita N elemei közül k számú redelkezik az adott tulajdosággal. Jelölése:. Középértékek p = M N bp = k. (omiális) értékkel re- (a) Módusz (omiális adattípus) Ha az alapsokaság elemei közül a legtöbb az M O delkezik, és a mitába ez az érték m o, akkor az M O m o becslést haszáljuk. Természetese az is el½ofordulhat, hogy több ugyailye gyakori érték va akár az alapsokaságba, akár a mitába, ilyekor többes módusz ról beszélük. (b) Mediá (ordiális adattípus) Páratla elemszámú alapsokaság illetve mita eseté a ragsorba középs½o elem jellemz½ojéek M E = X N+ illetve m e = x + értéke. Páros elemszám eseté a két középs½o jellemz½ojéek értéke közötti érték, ami meyiségi adattípus eseté a M E = számtai közép. Tehát X N + X N + illetve M E m e m e = x + x +
.. ALAPSTATISZTIKÁK 3 (c) Átlag (meyiségi adattípus) Az alapsokaság m = N P N X i átlagáak becslése az x = P x i (mita-) átlag statisztika, tehát m x. (d) Mértai közép (pozitív s meyiségi adattípus) r NQ Q Az alapsokaság = N X i mértai közepéek becslése az ex = (mita-) mértai közép statisztika, tehát 3. Szóródás mértékei ex. (a) Terjedelem (itervallum adattípus) A legagyobb és legkisebb érték külöbsége, azaz T = X N X illetve t = x x, x i tehát T t. (b) Átlagos abszolut eltérés (meyiségi adattípus) Az átlagtól való eltérések abszolut értékéek átlaga = N NX jx i mj illetve d = X jx i xj, tehát d. (c) Átlagos égyzetes eltérés, szóráségyzet illetev szórás (meyiségi adattípus) Az átlagtól való égyzetes eltérések átlaga = N NX (X i m) illetve s = X (x i x), és az eredeti mértékegység elyeréséhez gyököt vova: v v u = t NX u (X i m) illetve s = t X (x i x), N tehát s Kézirat, módosítva: 008. május 8.
4. FEJEZET. A STATISZTIKA ALAPFOGALMAI Megjegyzések:. Ha az alapsokaság N elemszáma agy, illetve végtele, a jellemz½ok egy u. s½ur½uségfüggvéyel adhatók meg. Például az alapsokaság átlagáak és szórásáak értéke, ha az alapsokaság jellemz½ojéek eloszlása az f : R! R 0 + s½ur½uségfüggvéyel adható meg: m = Z + s Z + xf(x)dx = (x m) f(x)dx ahol Z + f(x)dx =.. A mita jellemz½oit a megkülöböztetés hagsúlyozása érdekébe esetekét a mita, illetve empírikus jelz½okkel említjük majd. 3. A mediá fogalmáak természetes kiterjesztése a p-kvatilis, ami a mita eseté ahol q p = ( w) x i + w x i+ 0 < p < i = [( + ) p] w = ( + ) p i x 0 = x x + = x tehát sorredbe az ( + ) p-edik érték, ha ez egész, illetve lieáris iterpoláció eredméye. Ezzel teljesül m e = q 0:5, továbbá q 0:5, q 0:75 az u. alsó és fels½o kvartilisek. 4. Köye elle½orízhet½ok a mitából számolt statisztikákra az alábbi összefüggések: X jx i s = X x i x 0 d s m e j X jx i cj c R X (x i x) X (x i c) c R 5. Sok esetbe a mitából redelkezésre állak sorrebe az egyes értékek, és el½ofordulásuk x < x < < x k f ; f ; ; f k N mitabeli gyakorisága. Ekkor a mita elemszáma, az empírikus átlag és szóráségyzet statisztikák: = kx f i x = kx f i x i s = kx f i x i x. (.)
.. ALAPSTATISZTIKÁK 5 6. Nagy elemszámú, meyiségi adatokat tartalmazó mita eseté szokás a mita elemeit csoportokba, egymást követ½o osztályokba sorolva megadi. Ekkor az osztályok középpotjaival, és x < x < < x k f ; f ; ; f k N elemszámaival = P k f i, és (.) további képletei jó közelítéskét haszálhatók. Ha a legagyobb elemszámú osztály az i-edik, melyek határai a < b, a módusz jó közeltésekét haszáljuk ahol Ha m o = a + k k + k h, k = f i f i k = f i f i+ h = b a. Xi f = f j j= és ix f j > és az i-edik osztály határai a < b, akkor a mediá jó közelítése lesz Hasolóa kaphatjuk a kvatilisek közelítését, ahol most m e = a + j= f h. f i q p = a + p f h, f i Xi f = f j p j= teljesül az i-edik osztályra. és ix f j > p j= 7. Az u. rétegezett mitavétel eseté a mita elemei több csoportba sorolva állak redelkezésre. Ha eze mita csoportok x ; x ; ; x x ; x ; ; x. x k ; x k ; ; x kk Kézirat, módosítva: 008. május 8.
6. FEJEZET. A STATISZTIKA ALAPFOGALMAI akkor = P k i; és az egyes csoportok x i = i X i j= x ij s i = X i x ij x i i = ; ; ; k i j= statisztikáiból kapjuk a teljes mitára voatkozó x = kx i x i s = (SS B + SS W ) statisztikák értékét, ahol jelölje az alábbi égyzetösszegeket: SS M = x SS B = SS W = SS T = kx i (x i x) kx i s i = kx X i x ij. j= kx X i (x ij x i ) Az SS W u. bels½o vagy csoporto belüli égyzetösszeg, az SS M átlaghoz tartozó, és az SS B u. csoportok közötti vagy küls½o égyzetösszegekre teljesül, hogy az u. teljes égyzetösszeg felírható vagy másképp.. Feladatok SS T SS M = j= SS T = SS M + SS B + SS W, kx X i (x ij x i ) = SS B + SS W. j=.. Feladat. Egy egyetem hallgatóiból kiválasztottak közül 30 f½o az A-kar, 35 a B-kar, a C-kar és 33 a D-kar hallgatója. Becsüljük a hallagtók százalékos megoszlását az egyes karok között, melyik a legagyobb létszámú kar? Megoldás. A (omiális adatokból álló) mita, és számolt aráyok: x f p = f p 00% 30 A 30 = 0:5 5% 0 35 B 35 = 0:9 9% 0 C = 0:8 8% 0 33 P D 33 = 0:8 8% 0 = 30 + 35 + + 33 = 0 :00 00%
.. FELADATOK 7 Tehát a hallagtók becsült megoszlása szakokét 5%, 9%, 8% és 8%, legagyobb létszámúak a B-kart becsüljük, mivel a mita módusza m o = B... Feladat. Egy égy évfolyamos középiskola taulóiból válsztott mitából 3 tauló els½o, 34 tauló második, tauló harmadik és 33 tauló egyedik osztályos. Melyik az iskola legépesebb évfolyama, becsüljük továbbá a kvartiliseket! Megoldás. A (ordiális adatokból álló) mita, és a kommulált gyakoriságokkal kiegészített táblázat: x f P f 3 3 34 65 3 87 4 P 33 0 = 30 + 35 + + 33 = 0 Tehát legépesebbek a második évfolyamot becsüljük, mivel m o =, a kvartilisek pedig: q 0:5 = mert (0 + ) 0:5 = 30: 5 m e = mert (0 + ) 0:5 = 60: 5 q 0:75 = 4 mert (0 + ) 0:75 = 90: 75.3. Feladat. Egy cég éves yereség adatai a 000 évt½ol kezd½od½o égy év sorá az alábbiak voltak: :04 :05 :54 :0 eft Számítsuk ki az évi yereség adatok és az évekéti relatív övekedés átlagát, szórását, átlagos abszolut eltérését, terjedelmét és mediáját! Meyi az évi átlagos övekedés értéke? Megoldás. A yereség és százalékba kifejezett övekedési (aráy vagy meyiségi típusú) adatokból álló mita (ami most azoos az alapsokasággal) az alábbi táblázatba redezhet½o, kiegészítve a számoláshoz szükséges adatokkal: Év x y x y 000 :04 : 048 6 :05 :04 00 :05 00 = 7: 90 : 6: 57 :04 :54 :05 00 :54 00 = 4: 434 4 : 33 7 9: 664 :05 :0 :54 003 P :0 00 = 4: 07 8 : 44 4 6: 588 :54 4:484 6: 47 5: 043 7 98: 83 Kézirat, módosítva: 008. május 8.
8. FEJEZET. A STATISZTIKA ALAPFOGALMAI Tehát a yereség adatok kért statisztikái ( = 4) x = 4:484 r 5: 043 7 = : eft s x = : 4 4 = 0:065 eft :05 + :54 m e = = : 9 5 eft x 4 x = :0 :04 = 0:77 eft j:04 : j + j:05 : j + j:54 : j + j:0 : j d x = = 4 = 0:057 eft, a övekedés adatokból kapjuk továbbá ( = 3) r 6: 47 98: 83 y = = 5: 47 % s y = 5: 47 3 3 = : 74 % m e = 4: 434 4 % y3 y = 7: 90 4: 07 8 = 3: 84 % d y = j7: 90 5: 47j + j4: 434 4 5: 47j + j4: 07 8 5: 47j 3 = : 6 %. Az átlagos övekedés (az az álladó éves övekedési mérték, ami ugyailye 003 évi eredméyhez vezet) mértékét a övekedési háyadosok ^ 00 + y 00 = 3p :0790 :044344 :04078 = : 054 6 mértai közepéb½ol kapjuk, tehát az átlagos övekedés mértéke: (: 054 6 ) 00 = 5:46%..4. Feladat. Egy dolgozatot egy 40 f½os taulócsoport a következ½o eredméyel írta meg. 0 tauló tauló.5 potot, 5 tauló 5.5 potot, 0 tauló.5 potot, és 5 tauló 7.5 potot ért el. Adjuk meg az eredméyek statisztikai jellemz½oit! Megoldás. Redszerezzük adataikat a következ½o táblázatba: x f P f x f x f :5 0 0 :5 0 = 5:0 :5 0 = 6: 5 5:5 5 5 5:5 5 = 8: 5 5:5 5 = 453: 75 :5 0 35 :5 0 = 5:0 :5 0 = 56: 5 7:5 P 5 40 7:5 5 = 87: 5 7:5 5 = 53: 3 = 40 30:0 360: Tehát az átlag és szórás értéke x = 30:0 40 = 8:0 s = r 360: 40 8:0 = 5:,
.. FELADATOK 9 az átlagos abszolut eltérés és terjedelem 0 j:5 8:0j + 5 j5:5 8:0j + 0 j:5 8:0j + 5 j7:5 8:0j d = 40 x 40 x = 7:5 :5 = 5, a módusz és a kvartilisek m o = 5:5 q 0:5 = 0:75 :5 + 0:5 5:5 = 3: 5 mert 0:5 4 = 0: 5 m e = 5:5 mert 0:5 4 = 0: 5 q 0:75 = :5 mert 0:75 4 = 30: 75 = 4: 63.5. Feladat. Egy országúti sebességmérés alakalmával, a megegedett sebességet túllép½ok közül 0 gépjárm½u 5 km/óra sebességél kevésbé, 5 gépjárm½u 5 és 0 km/óra közötti, és 0 gépjárm½u 0 és 5 km/óra 0 km/óra közötti, 5 gépjárm½u 5 km/óra sebességél agyobb mértékbe tért el a megegedett½ol, és a legagyobb túllépés mértéke 0 km/óra volt. Adjuk meg a sebesség túllépés mértékéek statisztikai jellemz½oit! Megoldás. Az osztályközökkel adott mitát kiegészítve a középpotokkal, adataiat a következ½o táblázatba redezhetjük: P Osztály határok x f f x f x f 0 5 :5 0 0 :5 0 = 5:0 :5 0 = 6: 5 5 0 7:5 5 5 7:5 5 = : 5 7:5 5 = 843: 75 0 5 :5 0 35 :5 0 = 5:0 :5 0 = 56: 5 5 P 0 7:5 5 40 7:5 5 = 87: 5 7:5 5 = 53: 3 = 40 350:0 4000: Tehát az átlag és szórás értéke x = 350:0 r 4000: = 8: 75 km/óra s = 8:75 40 40 = 4: 84 5 km/óra az átlagos abszolut eltérés és terjedelem, valamit a módusz és a kvartilisek: 0 j:5 8: 75j + 5 j5:5 8: 75j + 0 j:5 8: 75j + 5 j7:5 8: 75j d = = 4: 8 5 km/óra 40 x 40 x = 0 0 = 0 km/óra, m o = 5 + 5 5 = 7:5 km/óra 5 + 5 q 0:5 = 5 + 0:5 5 m e = 5 + 0:5 5 q 0:75 = 0 + 5:75 0 5 = 5: km/óra mert 0:5 4 = 0: 5 5 = 8:5 km/óra mert 0:5 4 = 0: 5 5 = :9 km/óra mert 0:75 4 = 30: 75 Kézirat, módosítva: 008. május 8.
0. FEJEZET. A STATISZTIKA ALAPFOGALMAI
. fejezet Véletle a statisztikába Már említettük a statsztikai következtetések bizoytalaságát, melyek forrása a mitavétel esetlegessége, hacsak em az egész alapsokaság alkotja a mitát. A mitavétel ömagába is kérdéseket vet fel, ugyais ehéz aak kritériumát megadi, hogy a mita valóba olya-e mide szempotból, mit az alapsokaság. Az ilye, u. reprezetatív mita egy véletle kísérlet eredméyéek tekithet½o, amivel éppe azt fogadjuk el, hogy az egyik mita semmivel sem valószí½ubb mit bármelyik másik, ezért aztá jellemz½oik is azoos tulajdoságokat mutatak. Tehát a mita egy véletle kísérlet eredméye, és az abból számolt statisztikák pedig mit véletle meyiségek értelmezhet½ok. Ezért szükségük lesz a valószí½uségszámítás éháy ezzel kapcsolatos fogalmára, melyeket a következ½okbe tekitük át a teljesség, és még kevésbé a matematikai potosság igéye élkül... Véletle meyiségek Egy véletle meyiségr½ol, vagy valószí½uségi változóról akkor beszélük, ha az fx ; x ; g R véges sok vagy megszámlálhatóa végtele sok lehetséges értékhez adottak a p ; p ; [0; ] u. diszkrét valószí½uségeloszlás valószí½uségei, azaz P i p i =, és P ( A) = X p i A R x i A ami a A eseméy bekövetkezésével kapcsolatos bizoyosságuk mértékét, az eseméy valószí½uségét adja meg mit egy [0; ]-beli meyiség. Speciálisa P ( = x i ) = p i i = ; ;.
. FEJEZET. VÉLETLEN A STATISZTIKÁBAN Ha a lehetséges értékek az egész számegyeest, vagy aak egy itervallumát kitöltik, eloszlása egy f : R! R + 0 u. valószí½uségi s½ur½uségfüggvéyel jellemzhet½o, azaz R + f(x)dx = ; és ekkor Z P ( A) = f(x)dx A R. Ez utóbbi esetbe folytoos eloszlásról beszélük, és haszáljuk az F (x) = Z x A f(t)dt x R mooto em csökke½o u. eloszlásfüggvéyt, melyre ekkor teljesül az f s½ur½uségfüggvéy x R folytoossági helyei: F 0 (x) = f(x). Továbbá, ha az I R itervallum végpotjai a és b, akkor P ( I) = F (b) F (a) és ez a = eseté F ( ) = 0; illetve b = + esetbe F (+) = helyettesítésével is érvéyes marad. Valószí½uségi változók legfotosabb jellemz½oje a véletle igadozás cetruma, az E() = X i x i p i illetve E() = Z + x f(x)dx várható érték, és az igadozás mértéke, a emegatív q D() = E ( E()) = p E( ) E () szórás, ahol Z + E( ) = X x i p i illetve E( ) = x f(x)dx i feltételezve az itt szerepl½o végtele sorok és improprius itegrálok abszolut kovergeciáját. Vegyük észre, hogy egy alapsokaság átlaga és szórása egy véletle meyiség várható értékéek és szórásáak tekithet½o, és például agy elemszámú alapsokaság eseté módusza az f s½ur½uségfüggvéy maximum helye, mediája pedig az F (x) = egyelet megoldása. Tehát egy alapsokaság meyiségi jellemz½oi azoosíthatók egy valószí½uségi változó megfelel½o jellemz½ojével, paraméterével. A várható érték és szórás éháy fotos tulajdosága a következ½o. Ha ; véletle meyiségek, és a; b R, akkor E(a + b ) = a E() + b E() D(a + b) = jaj D() D () = E( ) E ()
.. NEVEZETES ELOSZLÁSOK 3 és ha még és függetleek, azaz P ( A; B) = P ( A) P ( B) A; B R akkor teljesül D( + ) = p D () + D ()... Nevezetes eloszlások A továbbiakba felsoroluk éhéy evezetes véletle kísérletet, és megadjuk az ezzel kapcsolatos véletle meyiség eloszlását és jellemz½oit.. Egy meyiség véletle választása véges sok egyformá valószí½u lehet½oség közül. Legyeek x ; x ; ; x R és P ( = x i ) = i = ; ; ;. Ekkor a diszkrét egyeletes eloszlású valószí½uségi változó várható értéke és szórása v E() = x = X u x i D() = s = t X x i x. Tehát az empírikus átlag illetve szórás statisztika egy ilye eloszlás várható értéke és szórása.. Mitavétel. Legye az N elemszámú halmaz elemei közül M számú megjelölt (hibás, jó, stb.). Válasszuk találomra számút, és jelölje a válsztottak között a megjelöltek számát. Ekkor a lehetséges értékek és ha a mitavétel 0; ; ; ; (a) visszatevés élkül törtéik, akkor M k N P ( = k) = N M k k = 0; ; ; ; ami az u. hipergeometrikus eloszlás, melyek várható értéke és szórása s E() = p D() = p q N Kézirat, módosítva: 008. május 8.
4. FEJEZET. VÉLETLEN A STATISZTIKÁBAN ahol p = M N illetve q = p a megjelölt illetve a em megjelölt válsztásáak esélye. (b) visszatevéssel törtéik, akkor P ( = k) = p k q k k k = 0; ; ; ; ami az u. biomiális eloszlás, melyek várható értéke és szórása E() = p D() = p p q. Megjegyzés: Köye belátható, hogy elég agy M < N eseté, a kétféle mitavétel hasoló eloszláshoz vezet, ami a paraméterek közel azoosságába is megmutatkozik. Az is megmutatható, hogy a biomiális eloszlás tagjai! és p = álladó eseté kovergesek, és lim! k p k q ezért értelmezhet½o a következ½o véletle kísérlet. 3. Véletele eseméyszám meg gyelése. k = k k! e k = 0; ; ; Egy eseméy bekövetkezései számáak, a valószí½uségi változóak a lehetséges értékei 0; ; ;, a megfelel½o valószí½uségek pedig P ( = k) = k k! e k = 0; ; ; ami az u. Poisso eloszlás, melyek várható értéke és szórása E() = D() = p. 4. Véletle szám választása az [a; b] R itervallumból. A véletle szám folytoos eloszlású 8 < 0 ha x < a f(x) = ha a x b b a : 0 ha b < x 8 < F (x) = : 0 ha x a x a ha a < x b b a ha b < x s½ur½uség és eloszlásfüggvéyel. Ez az u. folytoos egyeletes eloszlás, melyek várható értéke és szórása E() = a + b D() = b a p 3.
.. NEVEZETES ELOSZLÁSOK 5 5. Véletle id½otartam. Ha a véletle id½otartam, egy id½oegység alatt átlagosa számúszor bekövetkez½o ok miatt ér véget, s½ur½uség és eloszlásfüggvéye 0 ha x 0 0 ha x 0 f(x) = e x F (x) = ha 0 < x e x ha 0 < x. Ez az u. expoeciális eloszlás, melyek várható értéke és szórása E() = D() =. Megjegyzés: A paraméter½u expoeciális eloszlású valószí½uségi változó 0 < c pozitív számszorosa, theát c is expoeciális eloszlású c paraméterrel. 6. Sok véletle érték összege, mérési eredméy. Ha sok véletle meyiség összege, mit például egy mérés véletle hibával terhelt eredméye, eloszlása az u. ormális eloszlás, melyek s½ur½uség és eloszlásfüggvéye f(x) = x m x m ' F (x) = x R, ahol '(x) = p Z x e x (x) = p e t dt x R az u. stadard ormális eloszlás s½ur½uség és eloszlásfüggvéye. Az eloszlás paraméterei E() = m D() =, amiek jelölése: N (m; ). Megjegyzések: (a) Az m; paraméter½u ormális eloszlású valószí½uségi változó a + b traszformáltja, ahol 0 6= a; b R, szité ormális eloszlású a m + b; jaj paraméterekkel. (b) Függetle ormális eloszlású valószí½uségi változók összege is ormális eloszlású, tehát ha N (m ; ) és N (m ; ) függetleek, akkor q + N m + m ; +. (c) A ormális eloszlás eloszlásfüggvéyéek számítása a függvéy táblázatával törtéhet, melyek pozítív helye vett értékeit megtaláljuk a függelékbe. Negatív helye a szimmetria tulajdoságból következ½o összefüggést haszálhatjuk. ( x) = (x) Kézirat, módosítva: 008. május 8.
6. FEJEZET. VÉLETLEN A STATISZTIKÁBAN (d) Megmutatható, hogy sok függetle azoos eloszlású valószí½uségi változó összegéek eloszlása közelít½oe ormális eloszlású lesz. Ezért haszálhatjuk a ormális eloszlást sok véletle hiba összegz½odésekét yerhet½o mérési eredméyek modellezésére. (e) A biomiális eloszlás is közelíthet½o ormális eloszlással, ugyais egy ilye változó 0 illetve értéket felvev½o -számú véletle meyiség összege. Ez a közelítés akkor kielégít½o, ha mifp; qg > 0 teljesül a visszatevés élküli mitavétel eseté. Természetese ez érvéyes a hipergeometriai eloszlásra, ameyibe az közelíthet½o a biimiális eloszlással (M; N! ), és a Poisso eloszlásra ( > 0), mivel az a biomiális eloszlás határeloszlása..3. Feladatok.. Feladat. Számítsuk ki a evezetes eloszlások várható értékét, szórását, móduszát, és a folytoos eloszlások kvartiliseit!.. Feladat. Számítsuk ki a véges sokaságból vett mita átlagáak várható értékét és szórását! Számítsuk ki továbbá az empírikus szóráségyzet várható értékét! Megoldás. Legyeek az alapsokaság elemei X ; X ; X N R és jelölje m = N v NX u X k = t N v NX u (X k m) = t N NX Xk m k= k= k= az alapsokaság átlagát és szórását. Tekitsük a mitavétel x ; x ; x eredméyeit, mit véletle meyiségeket, melyek közös eloszlása diszkrét egyeletes eloszlás X ; X ; X N lehetséges értékekkel, és így v E(x i ) = m = NX u X k D(x i ) = = t NX (X k m) N N E(x i ) = N ezért k= k= NX Xk = + m i = ; ; ;, k= E(x) = X E(x i ) = m.
.3. FELADATOK 7 Ha a mitavétel visszatevéssel törtéik, ezek a véletle meyiségek függetleek, így v D(x) = ux t D (x i ) = p. mivel tehát Ha a mitavétel visszatevés élkül törtéik, akkor # " X E(x ) = E(x i ) + X E(x i x j ) = i6=j = + m + ( ) m = N = + m N + ( )m = E(x i x j ) = N(N ) X X k X l = k6=l = N N m N(N ) D(x) = Számoljuk most az s N(N ) NX Xk = k= + m N s = NX X k (N m X k ) = k= X x i x + m N N N m + m N = m N m = p r N. empírikus szóráségyzet várható értékét a visszatevéses mitavétel eseté: E(s ) = + m + m = és visszatevés élküli esetbe E(s ) = + m + m N = N N mivel E(x ) = D (x) + E (x). Kézirat, módosítva: 008. május 8.
8. FEJEZET. VÉLETLEN A STATISZTIKÁBAN Megjegyzések:. Tehát a mitavétel módjától em függ az átlag statisztika várható értéke, és az empírikus szóráségyzet várható értéke is léyegébe azoosak tekithet½o. A külöbség csupá az átlag statisztika szórásába jeleik meg az N = N N u. korrekciós téyez½obe, ami a mita elemszámáál jóval agyobb, illetve végtele alapsokaság eseté elhayagolható.. Végtele, illetve agy méret½u alapsokaság eseté az m és paraméterek egy alkalmas s½ur½uségfüggvéyel m = Z + xf(x)dx = Z + x f(x)dx m adottak, és eredméyeik a visszatevéses esetek megfelel½oe érvéyesek..3. Feladat. Egy bizoyos típusú gépkocsi els½o üzembe helyezése utá átlagosa (várhatóa) 5000km megtétele utá hibásodik meg. Ha a hibátlaul megtett út hossza expoeciális eloszlású, adjuk meg azt az úthosszt, melyek hibátla megtétele 90%-os valószí½uség½u? Megoldás. : megtett út a meghibásodásig, expoeciális eloszlású, l =? 0:9 = P ( > l) = F (l) = e E() = 5000 =! = 5000 l 5000! l = 5000 l(0:9) = 580: 4 km.4. Feladat. Egy tatárgy órái a taulók átlagosa (várhatóa) 5 percig tudak - gyeli. Ha ez az id½otartam expoeciális eloszlású, meyi az az id½otartam (felezési id½o), mely alatt a taulók fele már em képes gyeli?.5. Feladat. Ha egy m; paraméter½u ormális eloszlású meyiség, adjuk meg a valószí½uségeket! P (j mj k ) k = ; ; 3.6. Feladat. Adjuk meg m = 0 = paraméter½u ormális eloszlás q 0:05 és q 0:95 kvatiliseit! Megoldás. N (0; ) q0:05 0 q 0:05 =? 0:05 = P ( < q 0:05 ) = :645 = q 0:05 0! q 0:05 = 0 :645 = 6:7
.3. FELADATOK 9 q0:95 0 q 0:95 =? 0:95 = P ( < q 0:95 ) = :645 = q 0:95 0! q 0:95 = 0 + :645 = 3:9.7. Feladat. Adjuk meg az m; paraméter½u ormális eloszlás q 0:05 és q 0:975 kvatiliseit!.8. Feladat. Az kg-os csomagolású liszt tömege ormális eloszlású véletle meyiség m = 0:95 kg; = 0:0 kg paraméterekkel.. Meyi aak valószí½usége, hogy egy megvásárolt zacskó tömege 0:90 kg-ál kevesebb?. Ha három zacskót vásároluk, milye határok között va az össztömeg 95%-os valószí½uséggel? Megoldás.. : egy zacskó tömege, N (0:95; 0:0) eloszlású v.v., 0:9 0:95 P ( < 0:9) = = (:5) = 0:9938 0:0. = + + 3 : három zacskó tömege, N 3 0:95; p 3 0:0 eloszlású v.v. (lásd: 6b megjegyzés), d d =? 0:95 = P (3 0:95 d < < 3 0:95 + d) = p 3 0:0 d 0:975 = p 3 0:0 :96 = Tehát a 95%-os valószí½uség½u határok: d p 3 0:0! d = p 3 0:0 :96 = 6: 789 6 0 3 0:95 6: 789 6 0 = : 78 3 0:95 + 6: 789 6 0 = : 97 9.9. Feladat. Egy 000 darabos termékhalmazba 50 hibás darab va. 00 elem½u mitát véve, milye határok között lesz a hibás termékek száma 90%-os valószí½uséggel, ha a mitát. visszatevéssel vettük?. visszatevés élkül vettük? Kézirat, módosítva: 008. május 8.
0. FEJEZET. VÉLETLEN A STATISZTIKÁBAN Megoldás. : a hibásak száma a mitába,. = 00; p = 50 = = 0:5; biomiális eloszlású v.v., E() = 00 = 5; D() = q 000 4 4 00 3 = 5 4 4 p 3, közel N 5; 5 p 3 eloszlású (lásd: 6e megjegyzés), d =? 0:9 = P (5 d < < 5 + d) = 0:95 = Tehát a 90%-os valószí½uség½u határok: 5! d p 3 5! d p 3 :645 = p d! d = :645 5 3 = 7: 3 3 p 5 5 7: 3 = 7: 877 8 5 + 7: 3 = 3: 3 3.0. Feladat. Egy bizoyos típusú biztosítás kár-eseméyeiek átlagos (várható-) száma havota 0. Meyi aak valószí½usége, hogy egy adott hóapba 00 alatt marad az ilye eseméyek száma?
3. fejezet Becslés Potbecslések azt az eljárást evezzük, amikor az alapsokaság valamely meyiségi jellemz½ojéek értékére következtetük a mitából számolt alkalmas statisztika értékével. Ha a meg gyelt mitát egy véletle kísérlet eredméyéek tekitjük, akkor a jellemz½o, továbbiakba paraméter becsült értéke, a mitából számolt statisztika, tehát egy véletle meyiség értéke lesz. Így haszálhatjuk a becslés jellemzésére a valószí½uségi változókkal kapcsolatos fogalmakat. A # paraméter t statisztikával törté½o becslését jelöljük a továbbiakba # t, és ezt a becslést torzítatlaak modjuk, ha E(t) = #, azaz a becslés eredméyekét kapott érték éppe a a becsüli kívát paraméter körül igadozó véletle meyiség. Egy ilye torzítatla becslés fotos jellemz½oje a becslés D(t) = q E (t stadard hibája, azaz a véletle becsült értékek a becsült paramétert½ol való eltéréséek mértéke. Ha ez a stadard hiba a mita méretéek övelésével tetsz½olegese csökkethet½o, azaz D(t)! 0 akkor a becslét kozisztesek evezzük. #) 3.. Potbecslés A továbbiakba áttekitjük a már említettek közül a leggyakrabba haszált becsléseket, és azok tulajdoságait, felhaszálva a evezetes véletle kísérletek kapcsá megismert összefüggéseket.
3. FEJEZET. BECSLÉS. Aráy illeteve valószí½uség paraméter becslése. Ha az N elem½u alapsokaság elemei között M számú redelkezik egy adott tulajdosággal, akkor a p = M N (q = p) aráy becslése egy elem½u mitából bp = k ; ha a mita elemei közül k számú redelkezik az adott tulajdosággal. Vizsgáljuk a p bp becslés tulajdoságait. E(bp) = E(k) = p = p Tehát a becslés torzítatla, és stadard hibája, illetve aak becslése, ha a mitavétel (a) visszatevés élkül törtét, akkor a k véletle meyiség hipergeometrikus eloszlású, és D(bp) = D(k) = s D(bp) p k s pq k N N = p spq r p, N N p. (b) visszatevéssel (vagy agy ill. végtele alapsokaságból) törtét, akkor a k véletle meyiség biomiális eloszlású, és: D(bp) = D(k) = p p pq = p p( p) s D(bp) p k k p. Ha a mitavétel rétegezette törtét, vagyis az N i elemszámú csoportba M i számú redelkezik az adott tulajdosággal, és ie választott i elem½u mitába k i számú az ilye tulajdoságúak száma i = ; ; r, az egyes csopotoko belüli aráyok besclése és a besclések stadard hibája: p i = M i N i bp i = k i i s D (bp i ) = p p i q i i s i p N i i k i i k i i i N i
3.. PONTBECSLÉS 3 A teljes sokaságra voatkozó aráy becslése, és a becslés jellemz½oi ekkor ahol p = M N bp = X i bp i v ux D(bp) = t r i p i q i i M = v p ux t r v p ux t r i i rx M i N = i k i i i rx N i E(bp) = p i N i k i i i N i i = N i N i N i v p ux t r i i = rx i. Ha a mitavétel agy elmszámú rétegekb½ol, illetve visszatevéssel törtét, és az egyes rétegek i aráya ismert (mert pl. a mitavétel aráyosa törtét, azaz i = i h i ), a feti képletek az téyez½o elhagyásával érvéyesek. i N i Midegyik esetbe teljesül a mita elemszámok (mide határo túli) övelése eseté D(bp)! 0, tehát a becslés kozisztes, és megadható a stadard hiba (véletlet½ol em függ½o) korlátja, ezért tervezhet½o az a mita elemszám, ami biztosítja, a stadard hiba el½oírta kis értékét.. Átlag illetve várható érték és szórás paraméterek becslése. Az alapsokaság m átlaga, vagyis a várható érték és a szórás paraméterek szokásos becslése egy -elem½u mitából m x = v X u x i s = t X (x i x), és a. példa szerit teljesül E(x) = m tehát a várható érték becslése torzítatla. Az átlag stadard hibája, illetve aak becslése, ha a mitavétel Kézirat, módosítva: 008. május 8.
4 3. FEJEZET. BECSLÉS (a) visszatevés élkül törtét D(x) = p r N p s r N (b) visszatevéssel (vagy agy ill. végtele alapsokaságból) vett mita eseté Midkét esetbe teljesül D(x) = p s p. D(x)!! 0, tehát a várható érték becslése kozisztes, de a mita mérete most em tervezhet½o, hacsak em ismert az alapsokaság szórása. A. feladat eredméye szerit midkét esetbe (illetve jó közelítéssel) E(s ) = tehát a s becslés torzított, amit korrigálhatuk a s = X (x i x) u. korrigált empírikus szóráségyzet alkalmazásával, amit az átlag statisztika stadard hibája D(x) s p r N illetve D(x) s p becsléséél is célszer½u haszáli (els½osorba kis, < 0 mita elemszám eseté). Ha a mitavétel rétegezette törtét, vagyis az alapsokaság N i elemszámú csoportjai, és az oa vett i elem½u miták fx ; X ; ; X N g 3 x ; x ; ; x fx ; X ; ; X N g 3 x ; x ; ; x. fx r ; X r ; ; X rnr g 3 x r ; x r ; ; x rr és jelölje v N i X u m i = X ij i = t XN i (X ij m i ) N i N = j= rx N i = rx i j= i = N i N
3.. PONTBECSLÉS 5 akkor az egyes csoportok paraméteriek becslése: m i x i = i X i j= x ij i s i = X i i j= és a várható értékek becsléséek stadard hibái x ij x i vagy i s i = i i s i i = ; ; ; r D (x i ) = i p i r i N i s i p i r i N i amivel kapjuk a teljes sokaság várható értékéek torzítatla becslését, és a becslés stadard hibáját: m = rx i m i x = v D (x) = p ux t r i i i rx i x i és E(x) = m v i ux p t r N i i s i i i N i illetve a korrigált empírikus szóráségyzetekkel (kis elemszámú miták eseté) v D (x) p ux t r i s i i i. N i Ha a mitavétel agy elmszámú rétegekb½ol, illetve visszatevéssel törtét, és az egyes csoportok i aráya ismert (mert pl. a mitavétel aráyosa törtét, azaz i = i h i ), a feti képletek az téyez½o elhagyásával érvéyesek. i N i Most is teljesül a mita elemszámok (mide határo túli) övelése eseté D(x)! 0, tehát a becslés kozisztes, de a stadard hiba (véletlet½ol em függ½o) korlátja em adható meg el½ore, ezért most sem tervezhet½o az a mita elemszám, ami biztosítja, a stadard hiba el½oírta kis értékét. Megjegyzés: A rétegezett mitavételb½ol kapott várható érték becslés stadard hibája általába kisebb lesz, mit hasoló méret½u egyszer½u mitavétel eseté. Ha például agy elemszámú a sokaság, és a mitavétel aráyos volt, a stadard hiba és becslése v v ux p t r i 0 i i p ux t r i 0 i s i Kézirat, módosítva: 008. május 8.
6 3. FEJEZET. BECSLÉS míg egyszer½u mitavétel eseté p p s Pk P i j= (x ij x) vagy a már korábba bevezetett SS B és SS W égyzetösszegekkel p r SSB + SS p W = p s Pk i (x i x) + P k ( i ) s i ami a csoportok közötti SS B égyzetösszeg miatt agyobb becsült hibát eredméyez. Midez a teljes sokaságra is érvéyes, és a külöbség akkor lesz számottev½o, ha az egyes rétegek i szórása léyegese kisebb mit az egész sokaság szórása (mert a réteg-átlagok külöböz½oek). 3.. Itervallum becslés Egy # paraméter ( )-szit½u itervallum becslése olya t < t statisztika pár megadását jeleti, amivel teljesül: P (t # t ) = amit legtöbbször # t d módo jelölük majd, ahol t = t +t a becsl½o itervallum közepe, és d = t t a becslés hibája. A t = illetve t = + formális választással yerhetjük az u. fels½o # t illetve alsó # t becsléseket az ( )-szithez, amivel P (# t ) = illetve P (t #) =. Egy ilye itervallum becslés megadása akkor haszos, ha ( ) (ko decia-) szitje legalább 0:9 (90%); 0:95 (95%) vagy még agyobb, és potosságáak mértéke, a d hiba elég kicsi. Mit azt a kokrét esetekbe láti fogjuk, e két cél elérése általába csak a másik rovására javítható. A t < t statisztika pár megadás többféleképpe törtéhet, de általába olyaokat foguk keresi egy -kritikus értékhez, hogy teljesüljö P (# < t ) = P (t < #) = amib½ol a em kívát határ elhagyásával yerhetjük az -szit½u # t alsó illetve a # t fels½o becslést.. Aráy, illetve valószí½uség itervallum becslése. Egy sokaságba bizoyos (megjelölt) egyedek ismeretle aráyát jelölje p, és becsüljük ezt egy -elem½u mitába talált k-számú megjelölt ismeretébe. Ha a mitavétel visszatevéssel törtét (vagy a sokaság elemszáma elég agy), a k véletle meyiség biomiális eloszlású, és ha még is elég agy ( p > 0), eloszlása közelít½oe ormális lesz, tehát u = k p p N (0; ) pq
3.. INTERVALLUM BECSLÉS 7 azaz u eloszlása az u. stadard ormális eloszlás, melyek várható értéke E(u) = 0 és szórása D(u) =. Válasszuk a 0 < << valószí½uséghez táblázatból az u kritikus értéket úgy, hogy ha u N (0; ), akkor P (juj > u ) =. Ekkor k p P p u = pq amit alakítva kapjuk: ahol P (p p p ) = s p ; = k + u u k p k + u 4 és ha itt még u elhayagolható (ami a szokásos >> 00 esetekbe, és -höz általába közeli u érték miatt midig megtehet½o), akkor kapjuk a s p k u k k p ( )-szit½u itervallum becslést. Megjegyzések: (a) Ha p = k u p q k k < 0 akkor a p statisztika értékét 0-ak, és ha p = k + u p q k k > akkor p értékét -ek választjuk. (b) Vegyük észre, hogy az itervallum k közepe a már megismert potbecslés, a q hiba pedig a becsült p k k stadard hiba és az u táblázati érték szorzata. Továbbá a hiba (a mitától em függ½o) fels½o korlátja s u p k k u p, ezért a mita mérete tervezhet½o, azaz adott potossághoz megadható értéke. Az is látható, hogy a hiba az ( ) szittel együtt csökkethet½o, és fordítva, a szit övelése agyobb hibát eredméyez. Rögzített szit mellett pedig, övelésével, tetsz½olegese kicsi lesz a hiba mértéke. (c) Ha a mitavétel visszatevés élkül törtét az N elem½u alapsokaságból, eredméyüket a stadard hibáak megfelel½o módosítással haszálhatjuk: s p k u k k p. N Kézirat, módosítva: 008. május 8.
8 3. FEJEZET. BECSLÉS (d) Az u kritikus érték szimmetrikus választása miatt, a p illetve p statisztikák egyikéek elhagyásával yerhetjük az -szit½u fels½o illetve alsó becsléseket. p p p p. Átlag, illetve várható érték itervallum becslése. Egy ormális eloszlású sokaság átlagos (várható-) értékét jelölje az ismeretle m paraméter, és tegyük fel, hogy a 0 szórás ismert. Egy -elem½u (az ilyekor végtele alapsokaságból visszatevéssel vagy élkül vett) mita elemeit jelölje x ; x ; ; x melyek ekkor függetle, N (m; 0 ) eloszlású véletle meyiségek, ezért x = X x i N m; 0 p tehát x m 0 p N (0; ). Válasszuk a 0 < << valószí½uséghez táblázatból az u kritikus értéket úgy, hogy ha u N (0; ), akkor P (juj > u ) =. Ekkor x mp P u =, amit alakítva P 0 x u 0 p m x + u 0 p = tehát kapjuk az m x u 0 p P (x i x) becsléssel kapott x m p s ) szabadsági fokú T (vagy Studet) elos- ( ) szit½u itervallum becslést. q Ha a szórás em ismert, az s = véletle meyiség eloszlása az u. ( zlás, amiek jelölése: x m s p T Válasszuk a 0 < << valószí½uséghez táblázatból a t kritikus értéket úgy, hogy ha t T, akkor P (jtj > t ) =. Ekkor hasolóa kapjuk az ( ) szit½u itervallum becslést. m x t s p
3.. INTERVALLUM BECSLÉS 9 Megjegyzések: (a) Vegyük észre, hogy a kapott itervallum becslések középpotjai most is a korábba tárgyalt becslések, a potatlaság mértéke pedig a becslés stadard hibájáak és egy táblázati értékek a szorzata. A hiba most csak az ismert 0 s szórás eseté tervezhet½o el½ore, mivel a másik esetbe t p értéke mellett függ a meg gyelt mitától is, ami el½ore em ismerhet½o. Az természetese midkét esetbe teljesül, hogy a potatlaság mértéke övelésével tetsz½olegese kicsivé tehet½o. (b) Ha a mita elemszáma elég agy ( > 5; 0; 30; 60; 0; ), az alapsokaság ormális eloszlásáak feltételezése elhagyható, mivel az itt szerepl½o x és s statisztikák a P x i és P x i összegekkel fejezhet½ok ki, és ezek ilyekor jó közelítéssel ormális eloszlásúak tekithet½ok az alapsokaság eloszlásától függetleül. (c) Ha az elég agy elemszámú mitavétel visszatevés élkül törtét az N elemszámú sokaságból, a kapott eredméyek a stadard hibáak megfelel½oe módosulak, tehát m x u 0 p r N illetve m x t s p r N. (d) Az szit½u féloldali itervallum becslések most is az egyik, em kívát korlát elhagyásával yerhet½ok. (e) A fetiekhez hasoló módo készíthetük ko decia itervallumot további y ; y ; ; y k P meg gyelési eredméyek y = k k j= y j átlagára. Ismert 0 szórás eseté ugyais x y q N (0; ) 0 + k amib½ol kapjuk P x u 0 r + k y x u 0 r + k! = tehát az ( )-szit½u határok illetve az ismeretle szórás eseté y x u 0 r + k, y x t s 0 r + k. Kézirat, módosítva: 008. május 8.
30 3. FEJEZET. BECSLÉS 3. A szórás ko decia itervalluma. Haszáljuk az el½oz½o pot jelöléseit, amikor a szórás ismeretle paraméter. Ekkor = s ( ) eloszlása az u. ( ) szabadsági fokú eloszlás, jelölése. Válasszuk a 0 < << valószí½uséghez táblázatból a értékekett úgy, hogy ha, akkor P > Ekkor kapjuk P s ( ) = tehát a szóráségyzet illetve szórás (! s ; s < = és P > ) szit½u itervallum becslései s s! s ; s, amib½ol a megfelel½o szit½u féloldali határok yerhet½ok. 3.3. Feladatok kritikus 3.. Feladat. Egy 500 darabos termékhalmazba ismeretle számú hibás termék va. Becsüljük a hibásak számát, ha 00 elem½u mitát véve, 5 hibásat találtuk! Adjuk 90% biztosággal fels½o korlátot a hibásak számára! Háy elem½u mitára lee szükség a selejtaráy 0:05 hibával törté½o 90%-os szit½u iervallum becsléséhez? Adjuk meg a megoldást visszatevéssel és visszatevés élkül vett mita eseté! Megoldás. Ha a mitavétel visszatevéssel törtét. A hibásak aráya p = M ; ahol M a hibás darabok ismeretle száma. A p aráy becsült 500 értéke, és a becslés stadard hibája az N = 500 elem½u alapsokaságból (visszatevéssel) vett = 00 elem½u mita eseté, amikor is a mitába k = 5 hibás va: p = M 500 k = 5 k 00 = 0:5 D p p 0:5 0:75 = 4: 330 0, 00 00 tehát M becsült értéke, és a becslés stadard hibája k M 5 D 500 500 4: 330 0 = : 65. 00 Táblázatból u 0: = :8; amivel a p valószí½uség 80%-os szit½u kétoldali határai M 500 5 :8 4: 330 0 00 =
3.3. FELADATOK 3 tehát 90%-os szit mellett 5 M 500 + :8 4: 330 0 = 5: 76 53. 00 A selejtaráy 90%-os szit½u becsléséek hibája kisebb mit u 0: p = :645 p tehát keressük azt a legkisebb egész számot, amire :645 p 0:05 amiek megoldása = 7. Ha a mitavétel visszatevés élkül törtét. A hibásak aráya p = M ; ahol M a hibás darabok ismeretle száma. A p aráy becsült 500 értéke, és a becslés stadard hibája az N = 500 elem½u alapsokaságból (visszatevés élkül) vett = 00 elem½u mita eseté, amikor is a mitába k = 5 hibás va: p = M 500 k = 5 s k 00 = 0:5 D p 99 0:5 0:75 = 3: 876 90, 00 00 499 tehát M becsült értéke, és a becslés stadard hibája k M 5 D 500 500 3: 876 9 0 = 9: 385. 00 Táblázatból u 0: = :8; amivel a p valószí½uség 80%-os szit½u kétoldali határai M 500 5 :8 3: 876 9 0 00 tehát 90%-os szit mellett 5 M 500 + :8 3: 876 9 0 = 49: 85 50. 00 A selejtaráy 90%-os szit½u becsléséek hibája kisebb mit r u 0: p N = :645 r p 500 tehát keressük azt a legkisebb egész számot, amire r :645 p 500 0:05 amiek megoldása = 76. Kézirat, módosítva: 008. május 8.
3 3. FEJEZET. BECSLÉS 3.. Feladat. Egy 500 darabos termékhalmazba ismeretle számú hibás termék va. Becsüljük a hibásak számát, ha 00 elem½u mitát véve, 5 hibásat találtuk! Adjuk 90% biztosággal fels½o korlátot a hibásak számára! Megoldás. Jelölje a mita statisztikát, N = 500; M =?; = 00, ahol M az ismeretle paraméter. A valószí½uség becsült értéke, és a becslés stadard hibája: s M 500 5 00 = 0:5 D p 0:5 0:75 00 00 99 = 3: 876 9 0, 499 tehát M becsült értéke, és a becslés stadard hibája M 5 D 500 500 3: 876 9 0 = 9: 385. 00 Táblázatból u 0: = :8; amivel a valószí½uség 80%-os szit½u kétoldali határai tehát 90%-os szit mellett M 500 5 :8 3: 876 9 0 00 M 5 + :8 9: 385 = 49: 85 50. 3.3. Feladat. Háy embert kell egy közvéleméy kutató cégek megkérdezie, hogy egy ismeretle aráyt 0.0 potossággal tudjaak megadi 95%-os szit mellett? 3.4. Feladat. Egy mérési eljárás legagyobb véletle hibája = 0:03, = 3 mérés eredméyéb½ol x = :3. a) Becsüljük 90%-os biztosággal a mért meyiség értékét! b) Legfeljebb meyi lehet (ugyaeze meyiség eseté) egy mérés eredméye 95%-os biztosággal? c) Háy méresre va szükség, hogy a 95%-os szit½u itervallum becslés potossága 0:005 legye? Megoldás. Feltehetjük, hogy a mérések eredméye N (m; 0 ) eloszlású, ahol m az ismeretle várható érték paraméter, és a "3 szabály" szerit ismertek vehetjük a szórás 0 = jj = 0:0 értékét (lásd:.5 feladat), tehát 3 m x = :3 D( ) = 0 p = 0:0 p 3 = 5: 773 5 0 3.
3.3. FELADATOK 33 a) Táblázatból u 0: = :645, amivel kapjuk a 90%-os határokat: m :3 :645 5: 773 5 0 3 = % : 39 & :. b) Jelölje egy további mérés eredméyét, akkor u 0: = :645 táblázati értékkel kapjuk a 90%-os r :3 :645 0:0 3 + kétoldali határokat, amib½ol a keresett 95%-os fels½o határ. :3 + :645 0:0 r 3 + = : 49 c) u 0:05 = :96 amivel a kétoldali itervallum becslés potosságára :96 0:0 p = 0:005! = 5: 366 6, tehát = 6 mérés szükséges 3.5. Feladat. = 40 fel½ott fér súlyát megmérve, kaptuk x = 78:5 kg s (x) = :0 kg. a) Adjuk meg az átlagos (várható) súly 90%-os határait! b) Legalább háy kg lesz egy gépkocsi terhelése, ha 5 fér foglal bee helyet, 90%-os szit mellett? c) Milye határok között va a súly szórása 90%-os szit mellett? Megoldás. Feltehetjük a súly adatok N (m; ) eloszlását (már a mita mérete miatt is), ahol m a várható érték, a szórás paraméter. a) Az átlagsúly, azaz várható érték határai a t 0: = : 684 táblázati értékkel (szabadsági fok: 3940) m 78:5 : 684 :0 % 8: 45 p = 40 & 75: 05. Kézirat, módosítva: 008. május 8.
34 3. FEJEZET. BECSLÉS b) Jelölje ; ; 3 ; 4 a további (gépkocsiba szálló) fér ak súlyát, akkor t 0: = : 303 táblázati értékkel (szabadsági fok: 3940) a 80%-os kétoldali határok r 78:5 : 303 :0 40 + 4 amib½ol kapjuk a 90%-os alsó határt az összegre: r! + + 3 + 4 = 4 4 78:5 : 303 :0 40 + = 80: kg. 4 c) A 3940 eloszlás táblázatából 0:95 = 6:5 0:05 = 55:76 amivel kapjuk a szórás 90%-os ko decia határait: r r! 39 39 :0 55:76 ; :0 = (0:044; 4:576). 6:5
4. fejezet Hipotézis vizsgálat Hipotézis vizsgálatak azt evezzük, amikor az alapsokaság valamely "mi½oségi" jellemz½ojére, tehát egy tulajdoság meglétére illetve hiáyára kell következtetük a meg gyelt mita segítségével. Egy ilye tulajdoság általába mit egy feltételezés, az u. ullhipotézis (jelölése: H 0 ), és vele együtt aak tagadása, az u. alteratív hipotézis (jelölése: H ), fogalmazható meg. Egy H 0 hipotézisr½ol, vagyis a megfelel½o tulajdoság meglétér½ol úgy dötük, hogy kijelöljük a meg gyelhet½o miták egy alkalmas K részhalmazát, az u. kritikus tartomáyt, és ha a meg gyelt x mitára teljesül: x K =) H 0 -t elutasítjuk, azaz a H alteratív hipotézist fogadjuk el; x = K =) H 0 -t elfogadjuk; Ezt az eljárást statisztikai próbáak evezzük. Egy ilye eljárás, potosabba a K kritikus tartomáy megválasztása akkor tekithet½o "ésszer½uek", ha a véletle kísérlet eredméyéek tekitett mita H 0 teljesülése eseté csak kicsiy ( 0:05) valószí½uséggel esik a kritikus tartomáyba, azaz P H0 (x K) =. Dötésüket x K eseté az idokolja, hogy kis valószí½uség½u eseméy bekövetkezésébe kételkedük, az x = K esetbe pedig ics okuk ilye kételyre. Következtetésük hibás lesz, ha H 0 eseté x K, ez az els½ofajú hiba, amiek valószí½usége éppe a kritikus tartomáy = P H0 (x K) terjedelme, ami egy adott érték. H eseté x = K, ez a másodfajú hiba, amiek valószí½usége függ az alteratív hipotézist½ol. = P H (x = K) 35
36 4. FEJEZET. HIPOTÉZIS VIZSGÁLAT A kétféle hiba valószí½usége kifejezhet½o a próba E = P (x K) J = E = P (x = K) er½ofüggvéyével és jelleggörbéjével, mely utóbbi a ull-hipotézis elfogadásáak valószí½usége. Az er½ofüggvéy lesz½ukítése a ull-hipotézisre, az álladó terjedelem, és az alteratív hipotézisre E jh0 = E jh = az alteratívától függ½o érték lesz. Amit azt kokrét esetekbe elle½orízhetjük, a kétféle hiba valószí½usége csak egymás rovására javítható, ezért a próbák sorá az alábbi eljárást célszer½u követi: utasítsuk el H 0 -t a lehet½o legkisebb terjedelm½u kritikus tartomáyal (javasolt: 0:05), mert ekkor ez a dötési hiba valószí½usége; fogadjuk el H 0 -t a lehet½o legagyobb terjedelm½u kritikus tartomáyal (javasolt: 0:), mert ekkor em ez, haem egy adott alteratívához tartozó, és reméyeik szerit ilyekor kicsiy a dötési hiba valószí½usége. Egy kritikus tartomáy kijelölése általába statisztikák segítségével törtéik, és erre, a már megismert itervallum becslések is alkalmasak. Ha adott a # paraméter ( )- szit½u itervallum becslése # (t ; t ), és vizsgáluk kell a H 0 : # = # 0 hipotézist, ahol # 0 egy adott érték, akkor -terjedelm½u kritikus tartomáy lesz: K = fx j # 0 < t (x) vagy t (x) < # 0 g. 4.. Aráy illetve valószí½uség próbája, (;c) terv Tömeggyártás mi½oségelle½orzéséek alapvet½o feladata, hogy a termékhalmazból választott -elem½u mita alapjá eldöted½o, em tartalmaz-e a termékhalmaz a megegedettél több hibás darabot, vagyis az ismeretle p selejtháyad meghaladja-e az el½oirás szeriti p 0 értéket. Ha a mitát egy véletle kísérlet eredméyéek tekitjük, a p = M N paraméter aak valószí½usége, hogy egy találomra választott termék hibás, ahol N a termékhalmaz elemszáma, M a hibásak ismeretle száma. Midezek ismeretébe megadható aak valószí½usége, hogy a mitába k számú hibás terméket találuk:
4.. ARÁNY ILLETVE VALÓSZÍN ½USÉG PRÓBÁJA, (N;C) TERV 37. Ha a mitavétel visszatevés élkül törtét L(k; p) = pn k N pn k N k = 0; ; ; : : :. Ha a mitavétel visszatevéssel, illetve agyo agy elemszámú sokaságból törtét L(k; p) = p k ( p) k k = 0; ; ; : : : k 3. Az utóbbi esetbe közelít½o formulát haszálhatuk, ha a agy elemszámú mita eseté (a) p lehetséges értéke kicsi (p < 0), a Poisso eloszlással törté½o közelítést L(k; p) (p)k e p k = 0; ; ; : : : k! tehát a mitába lév½o hibásak k száma = p paraméter½u Poisso eloszlású véletle meyiségek tekithet½o. (b) p értéke agy is lehet (p > 0), a ormális eloszlással törté½o közelítést L(k; p) k +! p p k! p p p( p) p( p) p p( p) ' tehát a mitába lév½o hibásak k száma N meyiségek tekithet½o.! k p p p( p) k = 0; ; ; : : : : p; p p( p) eloszlású véletle Vizsgáljuk el½oször azt az egyszer½u esetet, amikor p két lehetséges értéket vehet fel, tehát H 0 : p = p 0 ; H : p = p, és teljesül 0 < p 0 < p < : Itt p 0 a már korábba említett el½oírt érték, és a ála agyobb p érték jeleti azt az alteratívát, amely eseté em szereték hibás dötést hozi. Keressük terjedelm½u kritikus tartomáyt K c = fk j k > c; k = ; ; : : :g alakba, ahol c egy alkalmasa választott egész szám. Mivel egy adott értékhez em feltétleül található olya c szám, melyre X = P H0 (k K c ) = L(k; p 0 ) k=c+ teljesül, keressük azt a legkisebb c N számot, amivel X L(k; p 0 ) vagy másképp írva J (p 0 ) = k=c+ cx L(k; p 0 ), k=0 Kézirat, módosítva: 008. május 8.
38 4. FEJEZET. HIPOTÉZIS VIZSGÁLAT és ekkor a másodfajú hiba értéke = J (p ) = cx L(k; p ): Ha a továbbiakba tetsz½oleges p ]0; [ értéket megegdük, a próba jelleggörbéje, ami aak valószí½usége, hogy a H 0 hipotézist elfogadjuk cx J (p) = L(k; p) p ]0; [: k=0 Köye elle½orizhet½o, hogy ez p-ek mooto csökke½o függvéye, lim 0 J (p) = és lim J (p) = 0; tehát p 0 -ál kisebb p eseté még -ál is kisebb els½ofajú hibával, p - él agyobb p eseté pedig -ál kisebb másodfajú hibával döthetük tévese. Igaz ugya, hogy p 0 és p között a dötési hiba valószí½usége agy, de ha a valóba veszélyes alteratíva értéke p -él kezd½odik, akkor az ilye fajta rossz dötés még em jelet megegedhetetle kockázatot. Ha értékét is el½oírjuk, a mita elemszáma tervezhet½o, vagyis adott hibavalószí½uségekhez megadható a mita elemszáma, és a kritikus tartomáyt kijelöl½o c szám. Ezt evezzük az ; -hibákhoz tartozó (; c)-tervek. Azt a legkisebb egészet kell választai, melyre egyszerre teljesülek cx L(k; p 0 ) ; k=0 k=0 cx L(k; p ) : k=0 Egy lehetséges algoritmus meghatározására, ha egy kezd½o = 0 értékb½ol iduluk, és. eseté meghatározzuk azt a legkisebb c egészt, melyre cx L(k; p 0 ) :. Ha k=0 cx L(k; p ) k=0 teljesül, megva a keresett ; ha em, akkor az. lépésél. Midez a 3.b) esetbe egyszer½ubbe alakul, ugyais az! cx c p 0 L(k; p 0 ) p = p0 ( p k=0 0 )! cx c p L(k; p ) p =. p ( p ) k=0 + értékével folytatjuk
4.. ÁTLAG ÉS SZÓRÁS PRÓBÁI NORMÁLIS ELOSZLÁS ESETÉN 39 egyeletredszert kell megoldauk, majd a kapott gyökök egészre kerekített értékeit haszálhatjuk. 4.. Átlag és szórás próbái ormális eloszlás eseté Sok véletle meyiség véletle hatások ered½ojéek tekithet½o, mit például egy mérés eredméye, ezért ormális eloszlású lesz. Jelölje az ilyekor végtele, vagy agyo agy elmeszámú alapsokaság átlagát és szórását, vagyis a meg gyelt véletle meyiségek közös várható értékét és szórását, az m és paraméter. Ezekkel a paraméterekkel kapcsolatos feltételezéseket vizsgáluk az alábbiakba.. (Egymitás) u-próba. Legye az x = (x ; x ; ; x ) mita egy N (; 0 ) eloszlású véletle meyiség ismételt meg gyeléséek eredméye, ahol 0 adott, a várható érték paraméter ismeretle. Vizsgáljuk a H 0 : m = m 0 hipotézist a H : m 6= m 0 alteratívával szembe, ahol m 0 adott (hipotetikus) érték. A ormális eloszlás tulajdoságaiból következik, hogy H 0 esté x N m 0 ; 0 p ) x m 0 p N (0; ). 0 Válasszuk a 0 < << értékhez táblázatból u értékét úgy, hogy u N (0; ) eseté P (juj > u ) = ; akkor x m 0 p P H0 0 > u =, tehát kaptuk a K = x j x m 0 0 p > u -terjedelm½u, kétoldali kritikus tartomáyt. Hasolóa yerhet½ok K + = x j x m 0 p > u 0 K = x j x m 0 p < u 0 ugyacsak -terjedelm½u, féloldali kritikus tartomáyok. Adjuk meg a megfelel½o er½ofüggvéyeket a külöböz½o próbák összehasolításához, tehát x m 0 p E = P (K) = P 0 u = = P u + m 0 mp x mp u + m 0 mp = 0 0 0 = u + m 0 mp + u + m 0 mp, 0 0 Kézirat, módosítva: 008. május 8.
40 4. FEJEZET. HIPOTÉZIS VIZSGÁLAT illetve hasolóa yerhet½ok E + = u + m 0 m 0 E = u + m 0 m 0 p p Egyszer½ue elle½orízhet½o, hogy E az m paraméter m 0 -ra szimmetrikus függvéye, és E < E + ha m 0 < m E > > E + ha m 0 > m E < E ha m 0 > m E > > E ha m 0 < m. Tehát a H + : m 0 < m illetve H : m 0 > m alteratív hipotézisek eseté er½osebb próbákat kapuk a K + illetve K kritikus tartomáyok alkalmazásával. Teljesülek továbbá. és lim E = m! lim E + = m!+ lim E = m! lim! ha m 6= m 0 lim =! ha m > m 0 lim! = ha m < m 0 ami azt jeleti, hogy a másodfajú hiba adott alteratíva eseté tetsz½olegese kicsivé tehet½o a mita elemszámáak övelésével.. Egymitás T -próba. Legye az x = (x ; x ; ; x ) mita egy N (; ) eloszlású véletle meyiség ismételt meg gyeléséek eredméye, ahol a várható érték és szórás paraméter ismeretle. Vizsgáljuk a H 0 : m = m 0 hipotézist a H : m 6= m 0 alteratívával szembe, ahol m 0 adott (hipotetikus) érték. Ekkor H 0 esté x m 0 s p T. Válasszuk a 0 < << értékhez táblázatból t értékét úgy, hogy t T eseté P (jtj > t ) = ; akkor x m 0 p P H0 s > t =, tehát kaptuk a K = x j x m 0 s p > t