Statisztika (jegyzet)

Hasonló dokumentumok
Statisztika 1. zárthelyi dolgozat március 21.

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Statisztika 1. zárthelyi dolgozat március 18.

BIOMATEMATIKA ELŐADÁS

Mo= argmax f(x), ha X abszolút folytonos; Mo= argmax P (X = x i ), ha X diszkrét.

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

Statisztika. Földtudomány szak, geológus szakirány, 2015/2016. tanév tavaszi

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

A matematikai statisztika elemei

18. Valószín ségszámítás. (Valószín ségeloszlások, függetlenség. Valószín ségi változók várható

Matematikai statisztika gyakorlat 2018/2019 II. félév

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Matematika B4 I. gyakorlat

Valószín ségszámítás (jegyzet)

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

Statisztika gyakorlat Geológus szakirány

Matematikai statisztika gyakorlat Programtervez informatikus alapszak, A szakirány 2018/2019 tavaszi félév Megoldások, végeredmények

Segédanyag a Leíró és matematikai statisztika tantárgyhoz március 28.

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Kalkulus II., második házi feladat

Valószín ségszámítás és statisztika gyakorlat Programtervez informatikus szak, esti képzés

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

6. feladatsor. Statisztika december 6. és 8.

Abszolút folytonos valószín ségi változó (4. el adás)

Matematikai statisztika

æ MATEMATIKAI STATISZTIKA Dr. Bolla Marianna, Matematika Intézet, Sztochasztika Tanszék

2. Hatványsorok. A végtelen soroknál tanultuk, hogy az. végtelen sort adja: 1 + x + x x n +...

Leíró és matematikai statisztika gyakorlat 2018/2019 II. félév

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Sorozatok október 15. Határozza meg a következ sorozatok határértékeit!

Áringadozások elıadás Kvantitatív pénzügyek szakirány 2012/13 2. félév

Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X = 1) = p Ind(p) P(X = 0) = 1 p. Leíró és matematikai statisztika

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

VII. A határozatlan esetek kiküszöbölése

ELTE TTK Budapest, január

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

megoldásvázlatok Kalkulus gyakorlat Fizika BSc I/1, 1. feladatsor 1. Rajzoljuk le a számegyenesen az alábbi halmazokat!

Valószín ségszámítás 2.

Komputer statisztika

Segédanyag a Leíró és matematikai statisztika tantárgyhoz március 1.

Valószín ségszámítás és statisztika

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk;

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

kismintás esetekben vagy olyanokban, melyeknél a tanulóalgoritmust tesztadatokon szeretnénk

V. Deriválható függvények

Statisztika október 27.

véletlen : statisztikai törvényeknek engedelmeskedik (Mi az ami közös a népszavazásban, a betegségek gyógyulásában és a fiz. kém. laborban?

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

min{k R K fels korlátja H-nak} a A : a ξ : ξ fels korlát A legkisebb fels korlát is:

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

3.1. A Poisson-eloszlás

Matematikai statisztika szorgalmi feladatok

ezek alapján kívánunk dönteni. Ez formálisan azt jelenti, hogy ellenőrizni akarjuk,

Statisztika Elıadások letölthetık a címrıl

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő.

A tárgy címe: ANALÍZIS 1 A-B-C (2+2). 1. gyakorlat

Statisztikai hipotézisvizsgálatok

Normális eloszlás paramétereire vonatkozó próbák

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

egyetemi jegyzet Meskó Balázs

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Hipotézis-ellenırzés (Statisztikai próbák)

1. Adatok közelítése. Bevezetés. 1-1 A közelítő függvény

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Játékszabályok. a keresett valószín ség:

Valószín ségszámítás és statisztika

Eötvös Loránd Tudományegyetem Informatikai Kar. Analízis 1. Írásbeli beugró kérdések. Készítette: Szántó Ádám Tavaszi félév

Bootstrap (Efron, 1979)

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Valószín ségszámítás és statisztika

Statisztikai programcsomagok

Statisztika elméleti összefoglaló

Komplex számok (el adásvázlat, február 12.) Maróti Miklós

Rudas Tamás: A hibahatár a becsült mennyiség függvényében a mért pártpreferenciák téves értelmezésének egyik forrása

1. Példa. A gamma függvény és a Fubini-tétel.

Matematika I. 9. előadás

Feladatok megoldása. Diszkrét matematika I. Beadandó feladatok. Bujtás Ferenc (CZU7KZ) December 14, feladat: (A B A A \ C = B)

NUMERIKUS SOROK II. Ebben a részben kizárólag a konvergencia vizsgálatával foglalkozunk.

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz


1 k < n(1 + log n) C 1n log n, d n. (1 1 r k + 1 ) = 1. = 0 és lim. lim n. f(n) < C 3

Dr. Karácsony Zsolt. Miskolci Egyetem november

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

Integrálszámítás (Gyakorló feladatok)

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

4. Test feletti egyhatározatlanú polinomok. Klasszikus algebra előadás NE KEVERJÜK A POLINOMOT A POLINOMFÜGGVÉNNYEL!!!

(d) x 6 3x 2 2 = 0, (e) x + x 2 = 1 x, (f) 2x x 1 = 8, 2(x 1) a 1

A függvénysorozatok olyanok, mint a valós számsorozatok, csak éppen a tagjai nem valós számok,

Matematikai statisztika

Valószín ségszámítás 1. Csiszár Vill

Analízis feladatgy jtemény II.

A maximum likelihood becslésről

2. fejezet. Számsorozatok, számsorok

Tudjuk, hogy az optimumot az ún. regressziós görbe szolgáltatja, melynek egyenlete:

Autoregressziós folyamatok

Átírás:

Statisztika (jegyzet) Csiszár Vill 009. május 6.. Statisztikai mez A statisztika egyik ága a leíró statisztika. Ekkor a meggyelt adatokat áttekithet formába ábrázoljuk, pl. hisztogrammal (oszlopdiagrammal), kördiagrammal, egyéb grakookkal. Másrészt az adatokból kiszámítuk éháy fotos, jellemz értéket, pl. az átlagot (mitaközepet), tapasztalati szórást, széls értékeket. A matematikai statisztika alapfeladata: egy véletle jeleség mechaizmusát (pl. az t leíró valószí ségi változó eloszlását) em ismerjük, de meggyeléseket végezve, a meggyelésekb l szereték rá következteti. A következ témakörökkel foguk foglalkozi: Becsléselmélet: A valószí ségi változó valamilye jellemz jét szereték a mitából megbecsüli, illetve a becslés hibáját meghatározi. Miél potosabb, megbízhatóbb becslést keresük. Példák:. Egy mukáltatót egy titkár által gépelt szövegekbe el forduló hibák száma érdekli. Pl. a hibák átlagos száma és a hibaszám szórása. A mukáltató 30 darab, közel azoos hosszúságú, a titkár által legépelt szövegbe megszámolja a hibákat. Ésszer feltei, hogy a hibák száma Poisso eloszlású, de az eloszlás paramétere (λ) ismeretle. A meggyelések alapjá szerete következteti λ-ra, ebb l a várható érték és a szórás már kiszámolható. Másrészt, a várható értéket és a szórást becsülheti a Poisso feltételezés élkül is.. Egy foalgyárba a foalszakadásokat vizsgálják. Aak a valószí ségét szereték megbecsüli, hogy a foal egy 8 órás m szak alatt egyszer sem szakad el. Eek érdekébe 0 foalszál midegyikér l feljegyzik, hogy meyi id múlva szakad el. Ésszer feltei, hogy a foalak élettartama expoeciális eloszlású (örökifjú tulajdoságú), de λ ismeretle. 3. Egy kosarazó 0-szer kosárra dob. Betalál pot, em talál be 0 pot. Kapott potszám egy dobásból: Id(p), ahol a találat valószí sége p ismeretle, ezt szereték megbecsüli. 4. Hétf t l pétekig apota megézzük egy város áramfogyasztását. Ez feltehet leg ormális eloszlású, de m, σ ismeretle. 5. Hétf t l pétekig megmérjük, hogy meyit kell vári a buszra. Feltehet, hogy ez egyeletes eloszlású [0, b] itervallumo, ahol b ismeretle. Hipotézisvizsgálat: A jeleséggel kapcsolatba va egy el zetes feltételezésük, amelyet teszteli szereték. Ha a meggyeléseik összeegyeztethet k a feltevéssel, elfogadjuk azt, ha viszot elletmodaak eki, akkor elutasítjuk a feltevést. Jó dötési eljárást keresük. Példák: egészségügybe: gyógyszerek hatásosságáak bizoyítása; ipar: selejtaráy elle rzése: le kell-e a gépsort cseréli? irodalomtudomáy: szövegr l el kell dötei, hogy ugyaaz írta-e ket; szociológia: pártok épszer sége: va-e szigikás külöbség? szociológia: pártpreferecia és iskolázottság között va-e összefüggés?

.. Deíció. Az (Ω, A, P) hármast statisztikai mez ek hívjuk, ahol Ω emüres halmaz (eseméytér), A σ-agebra (eseméyek családja), P pedig a szóbajöhet valószí ségi mértékek családja. Azaz ahol P ϑ valószí ségi mértékek. P {P ϑ ϑ Θ}, A Θ halmazt paramétertérek evezzük. Legtöbbször Θ véges dimeziós euklideszi tér részhalmaza, ekkor azt modjuk, hogy paraméteres a feladat (pl.:.-5. paraméteres feladatok). Θ lehet eél jóval "agyobb", pl.: ha P az összes lehetséges valószí ségi mérték, ekkor emparaméteres a feladat... Deíció. Egy X (X,..., X ) : Ω X R valószí ségi változót ( elem ) mitáak evezük, ahol X a mitatér, pedig a mita agysága vagy elemszáma. Az X i koordiáták a mita elemei. Mi (majdem) midig olya mitákkal foguk foglalkozi, amikor ugyaazt a véletle jeleséget, egymástól függetleül, -szer gyeljük meg..3. Deíció. X függetle elem mita, ha X i -k az összes P ϑ szerit függetleek. X azoos eloszlású mita, ha X i -k az összes P ϑ szerit azoos eloszlásúak. A mita eloszlásfüggvéyeiek családja {F ;ϑ ϑ Θ}, ahol F ;ϑ (x,..., x ) P ϑ (X < x,..., X < x ). Ha X elem, függetle, azoos eloszlású mita, akkor F ;ϑ (x,..., x ) F ;ϑ (x i ), ahol F ;ϑ az X i koordiáták közös eloszlásfüggvéye. Emlékezzük rá, hogy az eloszlásfüggvéy helyett diszkrét esetbe a p ;ϑ (x,..., x ) P ϑ (X x, X x,..., X x ) valószí ségeket, abszolút folytoos esetbe pedig az i f ;ϑ (x,..., x ) s r ségfüggvéyt is haszálhatjuk. Függetle elem mita eseté ezek is szorzatra bomlaak... Példa. (titkár ) A mita: X (X,..., X 30 ) : Ω N 30 0, ahol X i az i. szövegbe talált hibák száma. X függetle, azoos eloszlású mita, a mitaelemek szóbajöhet eloszlásai: X i P oisso(ϑ), a paramétertér Θ (0, ) R, azaz egyparaméteres feladatról va szó. A valószí ségeket részletese kiírva p 30;ϑ (x, x,..., x 30 ) 30 i p ;ϑ (x i ) 30 i ϑxi ϑ e x i! ϑ xi e 30ϑ xi!..4. Deíció. Az mitatére megadott T : X R k függvéyt, illetve magát a T T (X) valószí ségi változót (k-dimeziós) statisztikáak evezzük... Példa. Néháy gyakra haszált statisztika (X midehol elem mita): ) T (X) X X i az X mita mitaátlaga. ) T (X) S X i (X i X) az X mita tapasztalati szóráségyzete. i 3) T (X) (X (), X () (pl. T (, 4,, 3) (,, 3, 4)). 4) T (X) X () X () 5) T (X) X (),..., X () X () + ) az X mita redezett mitája, ahol X () X () X () az X mita mitaterjedelme. ha páratla + X () az X mita tapasztalati mediája. + ha páros

.5. Deíció. Az (X,..., X ) mita tapasztalati eloszlása az a véletle diszkrét eloszlás, melyek lehetséges értéki az X i értékek, az értékekhez tartozó valószí ségek pedig a meggyelt relatív gyakoriságok. Azaz jelölje x < x < < x m a meggyelt (külöböz ) értékeket (m ), ekkor az x j -hez tartozó valószí ség: {i X i x j } I(X i x j ), ahol I(X i x j ), ha X i x j, és I(X i x j ) 0, ha X i x j. Az X mita tapasztalati eloszlásfüggvéye a tapasztalati eloszláshoz tartozó eloszlásfüggvéy: ˆF (x) I(X i < x), x R. Hogy éz ez ki? 4 3 X () () X () 4 X,3 i X () i 0 ha x X (), k ˆF (x) ha X() k < x X () k+, ha X () < x... Tétel. (Gliveko: A statisztika alaptétele.) Legyeek X,..., X függetle, azoos F eloszlásfüggvéy valószí ségi változók. Ekkor az ˆF tapasztalati eloszlásfüggvéy valószí séggel egyeletese tart F -hez, azaz P ( lim ˆF (x) F (x) 0). sup x R A tétel jeletése az, hogy ha elég sok meggyelést végzük, akkor tetsz leges potossággal visszakapjuk a valódi eloszlást. Azt köy beláti, hogy mide rögzített x R-re P ( lim ˆF (x) F (x) 0), hisze ez éppe a agy számok er s törvéye az I(X i < x) valószí ségi változókra. Megjegyezzük még, hogy a sup x R ˆF (x) F (x) maximális eltérés agységredje /... Feladat. Az -5 példákra adjuk meg a mitateret, a paraméterteret, és a mita eloszlásaiak családját! Mo: az X mita midegyik példába függetle, azoos eloszlású. ) X i az i. foalszál élettartama. X R 0 +, X i Exp(ϑ), Θ (0, ), 3. X i az i. dobás potszáma. X {0, } 0, X i Id(ϑ), Θ [0, ], 0 f 0;ϑ (x,..., x 0 ) f ;ϑ (x i ) p 0;ϑ (x,..., x 0 ) 0 i 4. X i az i. ap fogyasztása. X R 5 +, X i N(ϑ, ϑ ), Θ R R +, f 5;ϑ (x,..., x 5 ) i p ;ϑ (x i ) 0 i 5 f ;ϑ (x i ) i 0 i ϑe ϑxi ϑ 0 e ϑ x i. ϑ xi ( ϑ) xi ϑ x i ( ϑ) 0 x i. 3 5 e (x i ϑ ) πϑ i ϑ.

5. X i az i. apo a várakozási id. X R 5 +, X i E(0, ϑ), Θ (0, ), f 5;ϑ (x,..., x 5 ) 5 f ;ϑ (x i ) i 5 i ϑ I(0 x i ϑ) ϑ 5 I(x() 0 és x (5) 5 ϑ)... Feladat. Végezzük el 8-szor a következ kísérletet: addig dobuk egy érmével, amíg fejet em kapuk. Jelölje X i, hogy az i. kísérletbe háyszor kellett dobi. Az X mita egy kokrét realizációjára adjuk meg a tapasztalati eloszlásfüggvéyt, és számítsuk ki az. Példába szerepl statisztikákat! 3 3 5 Mo: Ha például a mita a következ : x x x 3 x 4 x 5 x 6 x 7 x 8 A tapasztalati eloszlás: érték 3 4 5 valószí ség 8 3 8 8 0 8 mitaátlag: 9/8.38 tapasztalati szóráségyzet: 95/64.48 mitaterjedelem: 4 tapasztalati mediá: x (8), x (8) 3,4,5 x (8) 6,7 x (8) 8.3. Feladat. Legye X függetle, azoos eloszlású mita, a koordiáták közös eloszlásfüggvéye F. Számoljuk ki ˆF (x) várható értékét és szóráségyzetét! Mo: ˆF (x) Bi(, F (x)). Így E( ˆF (x)) F (x) és D( ˆF (x)) F (x)( F (x))/.. Elégségesség Az X mita iformációt tartalmaz arról, hogy melyik ϑ Θ az igazi paraméter. A P ϑ (X x) valószí ség függ ϑ-tól (bizoyos ϑ-kra agy a valószí sége, hogy ezt a mitát kapjuk, másokra kisebb). A T (X) statisztika is hordoz iformációt, hisze a P ϑ (T (X) t) valószí ség is függ ϑ-tól. Az eredeti mita általába több iformációt tartalmaz a paraméterr l, mit a bel le kiszámolt statisztika. Pl. ha diszkrét mitát veszük, akkor a P ϑ (X x) valószí ségek sokfélesége hordozza a ϑ-ra voatkozó iformációt. A T (X)-be rejl iformáció pedig a P ϑ (T (X) t) valószí ségek sokféleségéb l származik. A {T (X) t} eseméy felbomlik {X x} eseméyekre, olya x-ekre, melyekre T (x) t. Az X-be tartalmazott plusziformáció tehát a P ϑ (X x T (X) t) valószí ségek sokféleségéb l adódik, olya x-ekre, melyekre T (x) t. Ha a P ϑ (X x T (X) t) feltételes valószí ségek már em függek ϑ-tól, akkor, mivel P ϑ (X x) P (X x T (X) T (x))p ϑ (T (X) T (x)), a mita em tartalmaz több iformációt, mit a statisztika... Deíció. Legye X (X,..., X ) diszkrét mita az (Ω, A, P) statisztikai mez. Azt modjuk, hogy a T (X) statisztika elégséges a ϑ paraméterre, ha mide x, t párra a P ϑ (X x T (X) t) valószí ség em függ ϑ-tól... Példa. Legye X i Id(p), ahol 0 p ismeretle paraméter. Pl. 00 kockadobás midegyikér l feljegyezzük, hogy hatos-e. Belátjuk, hogy i X i elégséges statisztika p-re, azaz em kell a 4

dobásokról egyesével feljegyezi, hogy melyik volt hatos, melyik em, haem elég feljegyezi, hogy összese háy hatos volt. Ezzel em veszítük iformációt p-r l. A deíció alapjá számoluk: 0 ha x i t P p (X x X i t) i t t {}}{{}}{ ) p xi ( p) x i ( ) pt ( p) t p t ( p) t i pxi ( p) xi ( t Azaz a kapott feltételes valószí ség téyleg em függ p-t l. t }{{} biom; Id ( t) ha i x i t.. Tétel. (Neyma faktorizációs tétele) Legye X diszkrét eloszlású mita. A T (X) statisztika akkor és csak akkor elégséges, ha találhatók olya h és g ϑ függvéyek, melyekre P ϑ (X x) h(x) g ϑ (T (x)). Bizoyítás. : Tegyük fel, hogy T (X) elégséges statisztika. Ekkor P ϑ (X x) P ϑ (X x T (X) T (x)) P ϑ (T (X) T (x)) h(x) g ϑ (T (x)), felhaszálva, hogy az els téyez em függ ϑ-tól. : Most tudjuk, hogy P ϑ (X x) h(x) g ϑ (T (x)), meg kell mutati, hogy T (X) elégséges statisztika. P ϑ (X x T (X) t) P ϑ(x x, T (X) t) P ϑ (T (X) t) h(x) g ϑ (t) P ϑ (X y) y:t (y)t i h(x) g ϑ (t) h(y) g ϑ (T (y)) y:t (y)t h(x), ha T (x) t, h(y) y:t (y)t egyébkét pedig a feltételes valószí ség ulla. A tételek az a jelet sége, hogy módszert ad arra, hogya lehet elégséges statisztikát találi... Példa. Legye X,..., X P oisso(λ), keressük elégséges statisztikát λ-ra! p ;λ (x) P λ (X x) e λ λxi x i! e λ e λ λ x i }{{}, i azaz a mitaelemek összege elégséges statisztika. λ x i i x i! i x i! }{{} h(x) g λ ( xi ) }{{} :T (x) Abszolút folytoos mitára az el z deíció em m ködik, mivel sok T statisztikára a {T (X) t} eseméy mide t-re 0 valószí ség, így a feltételes valószí ség em értelmes. Neyma faktorizációs tétele viszot egy olya állítást fogalmaz meg, ami abszolút folytoos esetbe is értelmes, ha a valószí ség helyett s r ségfüggvéyt íruk... Deíció. Legye X abszolút folytoos mita, s r ségfüggvéyeiek családja legye f ;ϑ (x). A T (X) statisztika elégséges a ϑ paraméterre, ha létezik a s r ségfüggvéyek f ;ϑ (x) h(x) g ϑ (T (x)) alakú faktorizációja..3. Példa. Legye X i E(0, b), b a paraméter. Próbáljuk faktorizáli! f ;b (x) f ;b (x i ) b I(0 x i b) I(x () 0) }{{} b I(x() b), i i }{{} h(x) g b (x () ) tehát X () elégséges statisztika. 5

Mj.: Nyilvá, ha T elégséges, akkor aak egy kölcsööse egyértelm S függvéye is az, s t mide olya S statisztika elégséges, amelyb l T kiszámolható. A gyakorlatba miél egyszer bb, úgyevezett miimális elégséges statisztikát keresük. Eek a fogalomak adható precíz matematikai deíció, de ezzel most em foglalkozuk... Feladat. Keressük elégséges statisztikát a paraméter(ek)re a következ mitákból: ) X i Geo(p) ) X i Bi(m, p) m ismert 3) X i Exp(λ) 4) X i N(m, σ) 5) X i E( a, a) Mo: ) X i elégséges: p ;p (x) ( p) xi p ( p) x i p. ) X i elégséges: 3) X i elégséges: p ;p (x) i x i i ( ) m p xi ( p) m xi p ( ) x i ( p) m xi m. f ;λ (x) λe λxi λ e λ x i. i 4) Ha (m, σ) ismeretle, akkor ( X i, X i ) elégséges: f ;m,σ (x) (x πσ e i m) i σ ( ) e σ (xi m) πσ Ha σ ismert, akkor X i elégséges: ( ) f ;m (x) e σ x i e σ (m m x i). πσ Ha m ismert, akkor (X i m) elégséges. 5) max X i elégséges: f ;a (x) i i x i ( ) e σ ( x i m x i+m ). πσ I( a < x < +a) a (a) I( x i < a i,..., ) (a) I( x () < a). 3. Becslések és jóságuk Legye X,..., X (függetle, azoos eloszlású) mita az F ϑ eloszlásfüggvéy eloszlásból. Szereték a paraméter ψ(ϑ) függvéyét becsüli (gyakra magát a paramétert kell becsüli, de em midig). Nem remélhetjük, hogy a potos értéket eltaláljuk, de azt ige, hogy jól meg tudjuk közelítei. 3.. Deíció. A ψ(ϑ) meyiség becslése valamely T (X) statisztika. Azért vezettük be egy új elevezést a T (X) statisztikára, mert most úgy godoluk rá, mit a ψ(ϑ) meyiséget jól közelít becslésre. Mit várhatuk el a T (X) becslést l? ) A T (X) becslés agyjából ψ(ϑ) körül igadozzék. ) A T (X) miél kevésbé igadozzék ψ(ϑ) körül, azaz a becslés legye miél potosabb. 3) Tegyük fel, hogy mide mitaelemszámra va egy T becslésük. Megkövetelhetjük a T (X,..., X ) ψ(ϑ) sztochasztikus kovergeciát. 6

3.. Deíció. A T (X) becslés torzítatla ψ(ϑ)-ra, ha E ϑ (T (X)) ψ(ϑ) ϑ Θ. Általába a T (X) becslés torzítása a b T (ϑ) E ϑ (T (X)) ψ(ϑ) függvéy. 3.. Példa. Legye X,..., X F ϑ és ψ(ϑ) E ϑ (X i ). Ekkor X torzítatla becslés, mivel E ϑ (X) E ϑ ( X i ) i E ϑ (X i ) ψ(ϑ). }{{} ψ(ϑ) Ez alkalmazható például a Poisso vagy az idikátor eloszlás paraméteréek becslésére. i 3.. Példa. Idikátor eloszlású mitáál keressük torzítatla becslést ψ(p) p -re! Belátható, hogy X em torzítatla, s t, /p-t em lehet torzítatlaul becsüli. Belátjuk ugyais, hogy ψ(p)-t akkor és csak akkor lehet elem idikátor-mitából torzítatlaul becsüli, ha ψ(p) p-ek legfeljebb -edfokú poliomja. Legye ugyais T tetsz leges becslés. E p (T (X,..., X )) T (x,..., x ) p xi ( p) x i, x {0,} ez pedig legfeljebb -edfokú poliomja p-ek. Másrészt p k egy torzítatla becslése: I(X ) I(X ) I(X k ) (k ). 3.3. Deíció. T (X,..., X ) aszimptotikusa torzítatla becsléssorozat ψ(ϑ)-ra, ha ϑ Θ-ra E ϑ (T (X,..., X )) ψ(ϑ) ( ). A gyakorlatba, ha elég agy a mita, akkor általába egy aszimptotikusa torzítatla becslés is megfelel. 3.4. Deíció. Legyeek T, T torzítatlaok ψ(ϑ)-ra. Ekkor azt modjuk, hogy T hatásosabb T -él, ha D ϑ (T ) D ϑ (T ) mide ϑ Θ-ra. A T (torzítatla) becslés hatásos, ha mide torzítatla becslésél hatásosabb. Mj: Két becslés em biztos, hogy összehasolítható hatásosság szempotjából, hisze lehet, hogy bizoyos ϑ-kra D ϑ (T ) < D ϑ (T ), másokra viszot D ϑ (T ) > D ϑ (T ). Mj: Nem torzítatla becslések eseté az átlagos égyzetes veszteséget, azaz az E ϑ [(T ψ(ϑ)) ] meyiséget akarhatjuk miimalizáli. 3.. Tétel. Ha T és T is hatásos, akkor valószí séggel megegyezek, azaz P ϑ (T T ) mide ϑ Θ eseté. Bizoyítás. A torzítatlaság miatt E ϑ (T ) E ϑ (T ) ψ(ϑ), és mivel midkét becslés hatásos, D ϑ (T ) D ϑ (T ) mide θ-ra. Legye most T T + T. Egyrészt T is torzítatla, hisze E ϑ (T ) ψ(ϑ), másrészt T hatásossága miatt D ϑ(t ) D ϑ(t ) 4 azaz D ϑ (T ) cov ϑ (T, T ). Átosztva kapjuk, hogy ( D ϑ (T ) + D ϑ(t ) + cov ϑ (T, T ) ) D ϑ(t ) + cov ϑ(t, T ), cov ϑ(t, T ) D ϑ (T )D ϑ (T ) R ϑ(t, T ), azaz az ismert tétel szerit T at + b teljesül valószí séggel. A várható értékek és szórások egyezése miatt azoba a és b 0 lehet csak. 7

3.. Tétel. Legye X (X,..., X ) függetle, azoos eloszlású mita. Legye ψ(ϑ) E ϑ (X i ), továbbá tegyük fel, hogy Dϑ (X i) < mide ϑ-ra. Ekkor X hatásosabb becslése ψ(ϑ)-ak mide i c ix i alakú torzítatla becslésél. Bizoyítás. Vegyük el ször észre, hogy i c ix i akkor és csak akkor torzítatla, ha i c i. Számítsuk ki a szóráségyzeteket! Azt kell tehát beláti, hogy Dϑ(X) D ϑ (X i), D ϑ( c i X i ) Dϑ(c i X i ) ( c i )Dϑ(X i ). i A számtai és égyzetes közép közötti egyel tleségb l c i. c i ci, azaz c i. 3.3. Példa. Legye X i E(0, b), és vizsgáljuk a következ két becslést b-re: T + X(), T X. T yilvá torzítatla, és T is az: legye ugyais X i b Y i, ahol Y i E(0, ), ekkor X () elég az E(0, ) eloszlással foglalkozi. Y () t, tehát + 0 E(Y () ) 0 eloszlásfüggvéye: P (Y () t t dt + +. < t) t, Y () b Y (), tehát s r ségfüggvéye: Ebb l E b (T ) b. Melyik becslés a hatásosabb? Másrészt D b(t ) 4 D b (X i) 4 b b 3. D (Y () ) 0 ( ) t t dt ( ) + + + Továbbá Db (X() ) b Db () (Y ), azaz ( + Db(T ) ) D b(x () ) Kaptuk tehát, hogy T hatásosabb T -él (mide -re). ( + ) ( + ) ( + ) ( + ) b ( + ). ( + ) ( + ). 3.5. Deíció. A T (X,..., X ) becsléssorozat kozisztes ψ(ϑ)-ra, ha T ψ(ϑ) sztochasztikusa ( ), azaz P ϑ ( T ψ(ϑ) > ε) 0 ϑ Θ. 8

3.4. Példa. a) A mitaátlag kozisztes becslés a várható értékre: X E ϑ (X i ) sztochasztikusa (ez a agy számok gyege törvéye). b) Ha E ϑ (T ) ψ(ϑ) (azaz T torzítatla becslés, de az is elég lee, hogy aszimptotikusa torzítatla) és D ϑ (T ) 0 ( ), akkor T kozisztes, mivel c) Legye X i E(0, ϑ), és T + P ϑ ( T ψ(ϑ) > ε) Cseb D ϑ (T ) ε 0. X(). Ez a fetiek szerit kozisztes becsléssorozat, hisze D ϑ( + X () ϑ ) 0. ( + ) 4. Fisher-iformáció 4.. Deíció. Legye az X (X,..., X ) mita eloszlásfüggvéyeiek családja F ;ϑ. Ekkor az L (x; ϑ) likelihood függvéyt a következ képpe deiáljuk: abszolút folytoos mita eseté L (x; ϑ) f ;ϑ (x), diszkrét mita eseté L (x; ϑ) p ;ϑ (x). 4.. Deíció. Az elem, F ;ϑ eloszlásfüggvéy mita Fisher-iformációja az érték, ha a derivált létezik, és ez a meyiség véges. I (ϑ) E ϑ ([ ϑ l L (X; ϑ)] ) 4.. Tétel. (*) Legyeek X,..., X függetle, azoos eloszlású mitaelemek, és jelölje egy mitaelem likelihood függvéyét L (x i ; ϑ). Tegyük fel, hogy I (ϑ) <, továbbá hogy Ekkor I (ϑ) I (ϑ). E ϑ ( ϑ l L (X ; ϑ)) 0. Bizoyítás. A feltétel miatt I (ϑ) D ϑ ( ϑ l L (X ; ϑ)), továbbá Ebb l következik, hogy E ϑ ( ϑ l L (X; ϑ)) E ϑ ( ϑ l L (X i ; ϑ)) I (ϑ) D ϑ( ϑ l L (X; ϑ)) D ϑ( i i ϑ l L (X i ; ϑ)) E ϑ ( ϑ l L (X i ; ϑ)) 0. }{{} 0 i Dϑ( ϑ l L (X i ; ϑ) ) I (ϑ). }{{} I (ϑ) i Mj: A feltétel gyakra teljesül, mivel ez egy bederiválhatóság álruhába bújtatva. Tegyük fel modjuk, hogy a mita abszolút folytoos. Tudjuk, hogy + f ;ϑ (x) dx ϑ + f ;ϑ (x) dx 0. Ha a deriválás és itegrálás felcserélhet, azaz be lehet deriváli, akkor kapjuk, hogy 0 + + ϑ f ;ϑ(x) dx ϑ f + ;ϑ(x) f ;ϑ (x) f ;ϑ(x) dx ϑ l f ;ϑ(x) f ;ϑ (x) dx E ϑ ( ϑ l f ;ϑ(x )). 9

Diszkrét esetbe, hasolóa, a tétel feltétele azzal ekvivales, hogy p ;ϑ (x ) ϑ ϑ p ;ϑ(x ). x x Ez biztosa teljesül, ha a valószí ségi változó értékkészlete véges. 4.. Példa. Legye X i Id(p). Ekkor L (x, p) p x ( p) x (x {0, }), amib l p l L (x, p) x p x p. Elle rizzük a (*) Tétel feltételét! ( ) E p p l L (X i, p) Tehát az egyelem mita Fisher-iformációja: ( ) I (p) Dp p l L (X i, p) Dp és I (p) I (p) p( p). 4.. Példa. Legye X i N(ϑ, σ 0 ), ahol σ 0 ismert. Ekkor p p p p 0. L (x, ϑ) e (x ϑ) πσ 0 ( ) Xi p( p) σ 0. p( p), Logaritmust véve l L (x, ϑ) l Elle rizzük a (*) Tétel feltételét! [ E ϑ ( ] ϑ l L (X i, ϑ) πσ 0 (x ϑ) σ0. [ ] (Xi ϑ) E ϑ σ0 0. Ebb l I (ϑ) D ϑ ( ) Xi ϑ σ 0 D ϑ (X i) σ 4 0 σ0, és I (ϑ) σ0. Mj: Nézheték azt is, hogy a mita meyi iformációt tartalmaz a paraméter valamely ψ(ϑ) függvéyére, illetve meyi iformációt tartalmaz egy paramétervektorra ézve. Ezekkel most em foglalkozuk. Bizoyítás élkül megjegyezzük a következ t. Legye X mita, a bee rejl iformáció I X (ϑ). Továbbá legye T T (X) egy statisztika, a bee rejl iformációt jelölje I T (ϑ). Belátható, hogy (bizoyos regularitási feltételek mellett) I T (ϑ) I X (ϑ), és egyel ség akkor és csak akkor va, ha T elégséges statisztika. Például a következ regularitási feltételeket szokták tei: ) L (x, ϑ) folytoosa diereciálható ϑ szerit, ) > I (ϑ) > 0, és I (ϑ) folytoos ϑ-ba. Ha ezek teljesülek, akkor mide szép és jó, pl. ekkor teljesül a (*) tétel bederiválhatósági feltétele. A következ tétel arról szól, hogy egy torzítatla becslés em lehet tetsz legese potos, a szóráségyzetre adható egy alsó korlát, mely a mitába található iformáció meyiségt l függ (azoba ez az alsó korlát általába em éles). 0

4.. Tétel. (Cramér-Rao egyel tleség) Legye X (X,..., X ) mita, és tegyük fel, hogy teljesülek a (*) tétel feltételei. Legye még T (X) olya torzítatla becslése ψ(ϑ)-ak, melyre Dϑ (T ) < mide ϑ-ra. Feltesszük még a következ bederiválhatósági feltételt: ( ψ (ϑ) E ϑ T (X) ) ϑ l L (X; ϑ). Ekkor D ϑ (T ) (ψ (ϑ)) I (ϑ) teljesül mide ϑ-ra. Bizoyítás. Az ötlet: tudjuk, hogy mide S-re cov ϑ (T, S) D ϑ(t )D ϑ(s) D ϑ(t ) cov ϑ(t, S) D ϑ (S). Ez olya S választással ad haszálható korlátot, melyre cov ϑ (T, S) E ϑ (T S) E ϑ (T )E ϑ (S) E ϑ (T S) ψ(ϑ)e ϑ (S) em függ T -t l. Legye S ϑ l L (X; ϑ), ez a feltétel szerit jó lesz. Egyrészt E ϑ (S) 0 (ez volt a (*) Tétel egyik feltétele), tehát cov ϑ (T, S) E ϑ (T S) ψ (ϑ), másrészt D ϑ (S) I (ϑ). Mj: Nézzük a feltételt! ψ(ϑ) E ϑ (T ) T (x)f ;ϑ (x) dx. Bederiválhatóság eseté ebb l ψ (ϑ) T (x) ( ϑ f ;ϑ(x) dx E ϑ T (X) ) ϑ l L (X; ϑ). Az alsó korlát, azaz a (ψ (ϑ)) meyiség eve iformációs határ. Ha Dϑ I (ϑ) (T ) (ψ (ϑ)) I (ϑ) teljesül mide ϑ-ra, akkor azt modjuk, hogy a T becslés eléri az iformációs határt. Nyilvá, ha a T torzítatla becslés eléri az iformációs határt, akkor hatásos. Speciálisa, ha magát a paramétert akarjuk becsüli, akkor ψ(ϑ) ϑ, azaz az iformációs határ /I (ϑ). 4.. Feladat. Legye X i N(ϑ, σ 0 ), ϑ-ra keressük hatásos becslést! Az iformációs határ /I (ϑ) σ 0/, ugyaakkor D ϑ (X) σ 0/, ezért X hatásos becslés ϑ-ra. 4.. Feladat. Legye X i Id(p), p-re keressük hatásos becslést! Az iformációs határ /I (p) p( p)/, ugyaakkor D p(x) p( p)/, ezért X hatásos becslés p-re. 4.3. Feladat. Legye X i Exp(λ), ψ(λ) λ-t szereték becsüli. Tudjuk, hogy X torzítatla becslés. Szóráségyzete Dλ(X) λ λ. A Fisher-iformáció: [ ] E λ λ l f ;λ(x i ) [ ] [ ] E λ λ (l λ λx i) E λ λ X i 0. ( Ebb l I (λ) Dλ λ X i) D λ (X i ) λ, I (λ) λ. Most ψ(λ) /λ, ψ (λ) /λ. Az iformációs határ tehát ( ) λ λ λ. Kaptuk, hogy X hatásos becslés /λ-ra.

4.4. Feladat. Legye X i Poisso(λ). Mutassuk meg, hogy X hatásos becslés λ-ra! 4.5. Feladat. Legye X i E(0, ϑ). Most em teljesülek a regularitási feltételek, rögzített x mellett f ;ϑ (x) em { folytoosa deriválható ϑ szerit. f ;ϑ (x) ϑ ha 0 x ϑ 0 egyébkét [ ( ) ] [ ( I (ϑ) E ϑ ϑ l L (X ; ϑ) E ϑ ϑ l ) ] ( ) ϑ ϑ ϑ, felhaszálva, hogy valószí séggel X < ϑ, azaz valószí séggel L (X ; ϑ) deriválható. Ugyaakkor [ ( I (ϑ) E ϑ ϑ l ( ) ) ] ( ϑ ) ϑ ϑ I (ϑ). x rögzített, ϑ a változó ϑ rögzített, x a változó f ;ϑ (x) itt em deriválható ϑ f ;ϑ (x) 0 x ϑ 5. Becslési módszerek 5.. Blackwellizálás El ször ézzük egy kis ismétlést! Ha X, Y diszkrét valószí ségi változók, akkor X feltételes várható értéke az Y y feltétel mellett E(X Y y) x x P (X x Y y) V (y). Az X feltételes várható értéke az Y változóra ézve pedig E(X Y ) V (Y ). Ez tehát em egy szám, haem egy valószí ségi változó. Bizoyítás élkül eleveítsük fel a következ tulajdoságokat: ) E(c Y ) c ) E(X + X Y ) E(X Y ) + E(X Y ) 3) E(cX Y ) ce(x Y ) 4) X X E(X Y ) E(X Y ). Ezeke kívül szükségük lesz még éháy tulajdoságra: 5) Teljes várható érték tétele: E (E(X Y )) E(V (Y )) y V (y) P (Y y) x P (X x Y y) P (Y y) y x x P (X x Y y) P (Y y) x P (X x) E(X). x y x }{{} P (Xx) teljes valószí ség tétele 5) Kiemelés: E(XW (Y ) Y ) W (Y )E(X Y ), magyarázat: Y rögzítése mellett W (Y ) kostas, azaz kiemelhet a várható értékb l 6) Teljes szóráségyzet tétele: E ( (X E(X Y )) Y ). Bizoyítás: D (X) E ( D (X Y ) ) + D (E(X Y )), ahol D (X Y ) D (X Y ) E ( X XE(X Y ) + E(X Y ) Y ) E(X Y ) E (XE(X Y ) Y ) + E ( E(X Y ) Y ) E(X Y ) E(X Y )E(X Y ) + E(X Y ) E(X Y ) E(X Y ).

Várható értéket véve: E ( D (X Y ) ) E ( E(X Y ) ) E ( E(X Y ) ) E(X ) E(X) [ E ( E(X Y ) ) E(X) ]. }{{}}{{}}{{} E(X ) D (X) D (E(X Y )) Következméykét kapjuk, hogy D (E(X Y )) D (X). 5.. Példa. Dobjuk fel egy szabályos kockát -szer. Legye X a hatosok száma, Y a páratlaok száma. Az {Y y} feltétel mellett X eloszlása Bi( y, /3). Tehát E(X Y ) ( Y )/3. Erre Másrészt Végül E(E(X Y )) E(( Y )/3) E(Y ) 3 6, E(X) 6. D (X Y ) ( Y ) 3 3 ( Y ), E(D (X Y )) 9 9. D (X) 5 36, D (E(X Y )) 36. 5.. Tétel. (Rao-Blackwell tétel) Legye X diszkrét mita, S torzítatla becslése ψ(ϑ)-ak, T pedig elégséges statisztika ϑ-ra. Ekkor U E(S T ) is torzítatla becslés ψ(ϑ)-ra, és hatásosabb S-él. Bizoyítás. A feltételes várható érték tulajdoságaiból rögtö kötetkezik: E ϑ (U) E ϑ (E ϑ (S T )) E ϑ (S) ψ(ϑ), D ϑ(u) D ϑ (E ϑ (S T )) D ϑ(s). Mj: Azt, hogy T elégséges statisztika, ott haszáltuk fel, hogy az E(S T ) várható érték em függ ϑ-tól, azaz a mitából kiszámolható meyiség. Az eljárásak léyege tehát az, hogy egy akármilye torzítatla becslés hatásosságát javíthatjuk azzal, ha egy elégséges statisztikára vett feltételes várható értékét képezzük. Eek az eljárásak elevezése blackwellizálás. A tételb l következik, hogy ha va hatásos becslés, akkor az tetsz leges elégséges statisztikáak függvéye. 5.. Példa. Legye X i Geo(p), p-t szereték becsüli. Elégséges statisztika: T X i. egyszer torzítatla becslés: S I(X ). Blackwellizáljuk, azaz számoljuk ki az U E(S T ) V (T ) becslést! V (l) E p (S T l) 0 P p (S 0 T l) + P p (S T l) P p (X i i i X i l) i Egy P p (X, i X i l) P ( i X. i l) A számláló P p (X, X l) P p (X, X i l ) P p (X )P p ( X i l ). A evez él pedig azt haszáljuk, hogy i X i NegBi(, p). Tehát V (l) P p(x )P p ( i X i l ) P ( i X p( ) l p ( p) l ) i l) p ( p) l l. Azaz U V ( i X i) lesz az S blackwellizáltja (megmutatható, hogy ez hatásos becslés). i X i ( l i 3

5.. Feladat. Legye X i P oisso(λ), keressük jó torzítatla becslést ψ(λ) e λ -ra blackwellizálással! Els ötlet: e X, de belátható, hogy ez em torzítatla. Vegyük észre, hogy e λ P λ (X 0), azaz S I(X 0) jó lesz. Továbbá T i X i elégséges. E λ (S T l) P λ (X 0 i X i l) e λ e ( )λ (( )λ) l l! e λ (λ)l l! ( ) l. Felhaszáltuk, hogy i X i Poisso(λ) és i X i Poisso(( )λ). Azaz a megjavított becslés: V ( ) X i ( ) }{{} e X. 5.. Feladat. Legye X i Id(p), keressük jó torzítatla becslést ψ(p) p -re blackwellizálással! Els ötlet: X, de ez em torzítatla. S I(X, X ), T i X i, E p (S T l) P p (X, X X i l) p p ( ) l p l ( p) l(l ) ) pl ( p) l ( ), azaz a megjavított becslés V 5.. Tapasztalati becslés Xi i Xi. A tapasztalati becslés azt jeleti, hogy az elméleti eloszlás valamely jellemz jét a tapasztalati eloszlás megfelel jellemz jével becsüljük. Ezek a becslések általába kozisztesek, mivel a tapasztalati eloszlásfüggvéy tart az elméletihez. A következ táblázatba tapasztalati becslésre látuk éháy példát. Jellemz Elméleti eloszlásé Tapasztalati eloszlásé várható érték E(X) i X i X szóráségyzet D (X) i (X i X) S terjedelem sup{ x F (x) < } if{ x F (x) > 0 } X () ( l X () eloszlásfüggvéy F (x) P (X < x) i I(X i < x) ˆF (x) 5.3. Maximum likelihood becslés 5.. Deíció. Legye X,..., X mita F ϑ eloszlásból, ϑ Θ. Ekkor a ϑ maximum likelihood (ML) becslése ˆϑ, ha L (X; ˆϑ) max{l (X; ϑ) : ϑ Θ}. Lehet, hogy ilye em létezik, vagy em egyértelm. Ha L (X; ϑ) "elég sima", akkor a következ t szokás csiáli: ϑ l L (X; ϑ) 0 likelihood egyelet megoldását keressük. 5.3. Példa. X i Exp(λ). L (X; λ) i λ e λ X i, l L λe λxi (X; λ) l λ λ X i, λ l L (X; λ) λ X i, ez akkor 0, ha λ Xi X, azaz ˆλ X. 5.4. Példa. X i Egyeletes(ϑ, ϑ + ). L (X; ϑ) I(ϑ X i ϑ +, i) ( ) () I(ϑ X, X () ϑ + ). Eek a függvéyek a maximumhelye em egyértelm, mide ˆϑ [ ] X (), X () érték ML becslés. 4

5.. Tétel. Ha létezik ML becslés, akkor az megadható a T elégséges statisztika függvéyekét. Bizoyítás. A faktorizációs tétel alapjá L (X; ϑ) h(x) g ϑ (T (X)), ahol h(x) em játszik szerepet a ϑ szeriti maximumhely keresésébe. Azaz a maximumhelyek halmaza csak T (X)-t l függ. 5.3. Tétel. Legye X,..., X mita az F ϑ eloszlásból, ϑ ML becslése pedig ˆϑ. Ekkor ψ( ˆϑ) ML becslés ψ(ϑ)-ra. Bizoyítás. Legye L (x; ψ) sup { L (x; ϑ) ψ(ϑ) ψ } az idukált likelihood függvéy. Deíció szerit ψ(ϑ) ML becslése L (x; ψ) maximumhelye ψ-be. L (x; ψ) L (x; ˆϑ) és L (x; ψ( ˆϑ)) L (x; ˆϑ). Tehát L (x; ψ( ˆϑ)) { } max ψ L (x; ψ) A ML becslés általába em torzítatla. Azoba a következ tétel szerit bizoyos er s feltételek mellett a ML becslések jó aszimptotikus tulajdoságai vaak. Ez az egyik oka aak, hogy ez a módszer a legelterjedtebb a gyakorlatba. 5.4. Tétel. Bizoyos (er s) regularitási feltételek mellett elég agy -re a ˆϑ ML becslés létezik, kozisztes, a) aszimptotikusa ormális eloszlású: ( ˆϑ ϑ) N(m(ϑ), σ(ϑ)) eloszlásba ( ). b) aszimptotikusa torzítatla: m(ϑ) 0. c) aszimptotikusa optimális: σ (ϑ) I. (ϑ) 5.5. Példa. X ( i E(a, ) b), adjuk meg a paraméterek ML becslését! L (X; a, b) I(a X i b i), azaz a legkisebb olya [a, b] itervallumot keressük, amely b a midegyik meggyelést tartalmazza. Azaz â X (), ˆb X (). 5.6. Példa. X i N(m, σ), adjuk meg a paraméterek ML becslését! ( ) L (X; m, σ) e (X i m) σ i πσ π σ (Xi m) e σ, ( ) (Xi m) l L (X; m, σ) l l σ. π σ A likelihood egyelet most két egyeletb l áll: m l L (Xi m) (X; m, σ) σ 0, σ l L (X; m, σ) σ (X i m) σ 3 0 () Xi m ˆm Xi X (Xi m) σ σ (Xi m) () 5.4. Mometumok módszere ˆσ (Xi X) S Ezt a módszert akkor szokás alkalmazi, ha sok ismeretle paraméter va, és a ML becslést ehéz kiszámítai. Az eljárás a következ. Eljárás ) Az eloszlás l. (elméleti) mometuma: µ l E ϑ (Xi l) Felíruk ayi mometumot, ameyi meghatározza az eloszlást. ) Kifejezzük az ismeretle paramétereket a mometumok segítségével. 3) E ϑ (Xi l) helyébe Xi l -et íruk (ezek a tapasztalati mometumok). i 5.7. Példa. Legye X i E(a, b). µ E a,b (X i ) a + b, µ E a,b (Xi ) D a,b (X i) + E a,b (X i ) (b a) + ( a + b ) 5

(b a) µ µ b a (µ µ ) b µ + 3(µ µ ) a µ 3(µ µ ) â X 3( X i X ) X 3S, ˆb X + 3( X i X )X + 3S. 5.8. Példa. Legye X i E( a, a). µ E a (X i ) 0 µ E a (X i ) a 3 a 3µ â 3 Xi. 5.5. Itervallum becslések Eddig úgyevezett potbecslésekkel foglalkoztuk, azaz a paramétert (vagy aak függvéyét) egyetle értékkel becsültük meg. A potbecslés bizoytalaságát a becslés szórásával fejezhetjük ki. Ha például a becslésr l belátható, hogy aszimptotikusa ormális eloszlású, akkor az igazi paraméter kb. 95% valószí séggel a potbecslés körüli szórás sugarú itervallumba va. A becslésbe rejl bizoytalaságot kifejezhetjük úgy is, hogy a paramétert em egy értékkel, haem egy itervallummal becsüljük. 5.. Deíció. Legye X (X,..., X ) mita F ϑ eloszlásból, ahol ϑ valós paraméter. Azt modjuk, hogy a (T (X), T (X)) itervallum legalább α megbízhatósági szit kodecia-itervallum ϑ-ra (rövide KI( α), ha P ϑ (T (X) < ϑ < T (X)) α ϑ. Mj: A KI potos megbízhatósági szitje if { P ϑ(ϑ (T, T )) }. ϑ Θ 5.5. Tétel. Ha (T, T ) KI( α) ϑ-ra, akkor (S, S ) KI( α) ψ(ϑ)-ra, ahol S if { ψ(ϑ) ϑ (T, T ) } S sup { ψ(ϑ) ϑ (T, T ) }. Az egyik legfotosabb (és legszebb) eset a ormális eloszlás várható értékére KI kostruálása, ismert vagy ismeretle szórás mellett. Nézzük meg ezeket! 5.9. Példa. Legye X i N(µ, σ), ahol σ ismert, µ ismeretle. Adjuk µ-re KI( α)-t! σ Kiiduláskét vegyük észre, hogy X N(µ, ), azaz X µ N(0, ). Ezért σ ( ) X µ P σ < u α α, ahol u α az az érték, melyre Φ(u α ) α, ezt táblázatból ézhetjük ki. u α u α Ebb l megkaphatjuk a KI alsó és fels határát: α α α Azaz kaptuk, hogy σ X µ < u α σ u α X µ < T X σ u α, X σ u α T X + σ u α. < µ < X + σ u α. 6

Ha a σ szórás em ismert, akkor ehezebb dolguk va. A megoldáshoz meg kell ismerük két új eloszlást, a χ -eloszlást és a t-eloszlást. 5.3. Deíció. Legyeek X i N(0, ) függetleek, és Y Xi. Az Y valószí ségi változó eloszlását szabadságfokú khi-égyzet eloszlásak evezzük, jelölés: Y χ. Továbbá Y eloszlását szabadságfokú khi eloszlásak evezzük, jelölés: Y χ. Köy láti, hogy ha Y χ, akkor E(Y ) és D (Y ). A khi-égyzet eloszlás s r ségfüggvéye is kiszámolható, erre azoba em lesz szükségük. Csak megjegyezzük, hogy -re a s r ségfüggvéy πx e x/, -re pedig az Exp(/) eloszlást kapjuk. Ha 3, akkor a s r ségfüggvéy egy darabig mooto, majd mooto csökke. 5.4. Deíció. Legye X N(0, ), Y χ függetleek. Legye Z X. Ekkor a Z valószí ségi Y változó eloszlását szabadságfokú t eloszlásak, vagy szabadságfokú Studet eloszlásak evezzük, jelölés: Z t. A t eloszlás s r ségfüggvéye is kiszámítható, de potos alakjára em lesz szükségük. Köye látszik, hogy a s r ségfüggvéy szimmetrikus, azaz E(Z) 0 ( > ). Megmutatható, hogy D (Z) ( > ). A t eloszlás eseté a stadard ormálishoz tart, de vastagabb a farka (s r ségfüggvéye agy x-re kb. c x (+) ). α vsz t (α) 5.6. Tétel (Fisher-Bartlett). Legye X i N(µ, σ). Ekkor X és S függetleek, és S σ χ. Mj: Legye X i N(µ, σ), és Y i (X i µ)/σ. Ekkor S σ (Y i Y ). Mivel az (Y i Y ) i valószí ségi változók em függetleek, csökke a szabadsági fok. Mj: A mitaátlag és a tapasztalati szóráségyzet függetlesége karakterizálja a ormális eloszlást. i 5.0. Példa. Legye X i N(µ, σ), és most µ, σ ismeretleek. Adjuk µ-re KI( α)-t! Legye S (Xi X) a korrigált tapasztalati szórás. Ekkor a Fisher-Bartlett tétel szerit Azaz ebb l a KI X µ S X µ N(0, ) σ t S. χ σ ( X µ P < t ( α ) ) α, S T X S t ( α ) T X + S t ( α ). 5.. Példa. Legye X i Id(p). Adjuk p-re hozzávet leges ((aszimptotikus) KI( α)-t! ) Kiiduláskét vegyük észre, hogy X jó becslés p-re, és X N p,, ha elég agy. p( p) ( X p N(0, ) P ) X p < u α α. p( p) p( p) 7

A zárójelbe álló egyel tleséget kell most p-re átredezi. Más módszer: a evez be lév p helyébe X-et íruk, és a egyel tleséget redezzük át. X( X) X p < u α 5.3. Feladat. Legye X i Exp(λ). Adjuk hozzávet leges KI( α)-t λ-ra! 5.4. Feladat. Egy cukorgyárba kockacukrokat gyártaak. Tegyük fel, hogy a cukrok milliméterbe kifejezett élhosszúsága közelít leg ormális eloszlású. 6 darab cukor élhosszúságát megmérve, a következ adatokat kaptuk: 0.0 8.94 9.6 0.00 0.4 0.33 0.68 9.5 0.3 0.6 0.3 0.74 9.98 0.3 9.88 9.89 Az adatok átlaga 0.06, tapasztalati szórása 0.46. (a) Adjuk az élhossz m várható értékére KI(0.95)-t, ha tudjuk, hogy a szórás σ 0.5. (b) Adjuk KI-t m-re, ha a szórás ismeretle! (c) Ismert és ismeretle szórás mellett is adjuk KI(0.9)-t m 3 -re, azaz egy átlagos kockacukor térfogatára (ami em egyel a kockacukrok átlagos térfogatával)! 6. Statisztikai próbák és jóságuk A statisztikai próba olya eljárás, mellyel eldötjük, hogy a meggyeléseik alapjá egy el zetes feltételezésük (hipotézisük) tartható-e, vagy a meggyelések elletmodaak a feltételezések. Nézzük egy példát! Tegyük fel, hogy egy gyárba mi ségelle rzést végzük, azaz megvizsgáljuk, hogy a gyártott termékek mi sége megfelel -e. El zetes feltételezésük szerit a gyártási folyamat redbe va, azaz a termékek legfeljebb 5%-a selejtes. A feltételezés elle rzéséhez 5 véletleszer e választott terméket megvizsgáluk, és ha legfeljebb 3 selejtes va köztük, akkor a feltételezést elfogadjuk. Ellekez esetbe a feltételezést elvetjük. Kérdés, hogy jó-e ez az eljárás? Mivel dötésük egy véletleszer e választott mitára épül, teljes bizoyossággal em tudjuk eldötei, hogy a feltételezésük helyes-e. Kétféle hibát követhetük el: Ha igaz a feltételezés, mégis elutasítjuk, akkor els fajú hibát vétük, Ha em igaz a feltételezés, mégis elfogadjuk, akkor másodfajú hibát vétük. Mekkora eze hibák valószí sége? Kiszámításához az egyszer ség kedvéért tegyük fel, hogy a mitát visszatevéssel vesszük. Továbbá jelölje p a selejtaráyt. El ször tegyük fel, hogy a feltételezés igaz, azaz p 0.05. P p (els fajú hiba) P p ( 4 selejt) 5 k4 ( ) 5 p k ( p) 5 k. k Ez a valószí ség akkor a legagyobb, ha p 0.05, így az els fajú hiba valószí sége legfeljebb α sup P p ( 4 selejt) P 0.05 ( 4 selejt) 0.034. p 0.05 Most tegyük fel, hogy a feltételezés hamis, azaz p > 0.05. A másodfajú hiba valószí sége P p ( 3 selejt) 3 k0 ( ) 5 p k ( p) 5 k, k például ha a selejtaráy p 0., akkor 0.763 valószí séggel fogjuk a feltételezést tévese elfogadi. Deiáljuk most formálisa az alapfogalmakat! 8

6.. Deíció. Legye (Ω, A, P) paraméteres statisztikai mez, tehát P {P ϑ : ϑ Θ}, ahol Θ a paramétertér. Hipotézisek: ullhipotézis: H 0 : ϑ Θ 0 ellehipotézis: H : ϑ Θ, ahol Θ Θ 0 Θ a paramétertér diszjukt felbotása (Θ 0 Θ ). Mita: X (X,..., X ) vektorváltozó (legtöbbször függetle, azoos eloszlású), lehetséges értékeiek halmaza az X mitatér. Statisztikai próba: elfogadási tartomáy: X e kritikus (elutasítási) tartomáy: X k, ahol X X e X k a mitatér diszjukt felbotása (X e X k ). Ha X X e, akkor H 0 -t elfogadjuk, ha X X k, akkor H 0 -t elutasítjuk. Az bevezet példába Θ [0, ], Θ 0 [0, 0.05], Θ (0.05, ]. A mita: X (X,..., X 5 ), ahol X i, ha az i-edik kiválasztott termék selejtes, X i 0, ha az i-edik kiválasztott termék hibátla. Azaz X {0, } 5. A próbát meghatározó tartomáyok: X e {x X : 5 i x i 3}, X k {x X : 5 i x i 4}. Nagyo fotos, hogy a két hipotézis szerepe általába em egyeragú. Az alapfeltevést csak agyo idokolt esetbe szereték elutasítai, ezért az els fajú hiba súlyosabbak számít, mit a másodfajú. Az els fajú hiba maximális valószí ségét szokás megadi, emellett természetese a másodfajú hiba esélyéek miimalizására törekszük. Ebb l kifolyólag a dötések értelmezése is külöböz : H 0 -t elfogadjuk: em jeleti azt, hogy igaz, csak azt, hogy ics okuk elutasítai. H 0 -t elutasítjuk: komoly bizoyítékot találtuk arra, hogy H 0 em igaz. Például egy új gyógyszer vizsgálatál a gyögyszer hatásosságára keresük bizoyítékot, ezért a hipotézisek: H 0 : a gyógyszer em hatásos, H : a gyógyszer hatásos. Folytassuk a deíciókat! 6.. Deíció. Els fajú hiba: H 0 igaz, mégis elutasítjuk. Eek valószí sége: P ϑ (X X k ) ϑ Θ 0. A próba terjedelme: α sup ϑ Θ 0 P ϑ (X X k ). Másodfajú hiba: H 0 hamis, mégis elfogadjuk. Eek valószí sége: P ϑ (X X e ) ϑ Θ. A próba er függvéye: β(ϑ) P ϑ (X X e ) P ϑ (X X k ) ϑ Θ. Másképp β(ϑ ) a próba ereje a H : ϑ ϑ ellehipotézissel szembe. Ha egy próbasorozatot vizsgáluk, azaz mide mitaelemszámra va egy (X e, X k ) tartomáyokkal deiált próbák, akkor ezt jelölhetjük a terjedelembe és az er függvéybe is: α helyett α -t, β helyett β -t írhatuk. 6.. Példa. Legye X E( t, + t) egyetle meggyelés, ahol t > 0 ismeretle. H 0 : t 0 (egyszer hipotézis Θ 0 egyelem halmaz em kell sup a terjedelembe) H : t > 0 (összetett hipotézis Θ többelem halmaz). A próba: X e (0., 0.85), (X R). α P 0 (X X k ) P 0 (X X e ) P 0 (0. < X < 0.85) 0.75 0.5. er függvéy: β(t) P t (X X k ) P t (0. < X < 0.85) 0.75 +3t. 9

β(t) 4 kis t-re kicsi a próba ereje t agy t-re agy Mikor jó a próba? ) Torzítatla: a próba ereje legalább akkora, mit a terjedelme: β(ϑ) α ϑ Θ. ) Er s: Az (X e, X k ) próba egyeletese er sebb, mit a (X e, X k ) próba, ha β(ϑ) P ϑ (X X k ) β (ϑ) P ϑ (X X k ) ϑ Θ. 3) Kozisztes: Az (Xe, Xk ) legfeljebb α terjedelm kozisztes próbasorozat, ha (terjedelem) α α és β (ϑ) ϑ Θ. 6.3. Deíció. A (X e, X k ) próba egyeletese leger sebb, ha mide más, legfeljebb ekkora terjedelm próbáál egyeletese er sebb. Az egyeletese leger sebb próba olyasmi a hipotézisvizsgálatba, mit a hatásos becslés a becsléselméletbe. Ilye próbát általába em köy kostruáli. Arra az esetre viszot tuduk egyeletese leger sebb próbát adi, ha két egyszer hipotézis között kell dötei. Ehhez szükségük lesz a véletleített próba fogalmára. Eddigi próbák másképp megfogalmazva: Legye Ψ : X {0, } egy függvéy. Ha x X -et gyeljük meg, akkor Ψ(x) valószí séggel utasítjuk el H 0 -t. Ekkor: X e { x Ψ(x) 0 } X k { x Ψ(x) } 6.4. Deíció. Véletleített próba: Legye Ψ : X [0, ] egy függvéy (eek eve próbafüggvéy). Ha x X -et gyeljük meg, akkor Ψ(x) valószí séggel utasítjuk el H 0 -t. Számítsuk ki véletleített próba eseté a hibavalószí ségeket (modjuk diszkrét esetet véve)! P ϑ (H 0 -t elutasítjuk) x Ψ(x)P ϑ (X x) E ϑ (Ψ(X)). Így α sup ϑ Θ0 E ϑ (Ψ(X)), és β(ϑ) E ϑ (Ψ(X)) (ϑ Θ ). 6.. Tétel. (Neyma-Pearso lemma) Legye H 0 és H két egyszer hipotézis: H 0 : ϑ ϑ 0, vagy másképp: a mita likelihood-függvéye L (0; x) H : ϑ ϑ, vagy másképp: a mita likelihood-függvéye L (; x), ha L(,x) L > c (0;x) ahol X egy elem mita. Tekitsük a következ próbafüggvéyt: Ψ(x) γ ha L(,x) L (0;x) c. Ekkor 0 ha L(,x) L < c (0;x) ) Mide 0 < α eseté létezik c és γ, hogy a Ψ próba terjedelme potosa α ) A Ψ próba egyeletese leger sebb az összes α terjedelm próba között (és léyegébe egyértelm ). Bizoyítás. ) Legye Y L(;X) L (0;X). Ekkor a próba terjedelme α P 0 (Y > c) + γ P 0 (Y c) P 0 (Y c) + γ P 0 (Y c), 0

azaz α P 0 (Y c) γ P 0 (Y c). Ha va olya c 0, melyre P 0 (Y c 0 ) α akkor a c c 0, γ 0 választás jó lesz. Ha em létezik ilye c 0, akkor is va olya c 0, melyre P 0 (Y < c 0 ) α < P 0 (Y c 0 ). Ekkor legye c c 0, γ P 0(Y c 0 ) ( α) (0 < γ ). P 0 (Y c 0 ) ) Legye Ψ egy másik próba próbafüggvéye. A feltevés szerit E 0 (Ψ (X)) α E 0 (Ψ(X)). Azt kell beláti, hogy az er kre E (Ψ (X)) E (Ψ(X)) áll fe. Tegyük fel, hogy a mita abszolút folytoos eloszlású, ekkor L (; x) f ; (x), ahol f ; (x) a mita együttes s r ségfüggvéye a H mellett, hasolóa L (0; x) f ;0 (x), ahol f ;0 (x) a mita együttes s r ségfüggvéye a H 0 mellett. Megmutatjuk, hogy R (Ψ(x) Ψ (x)) (f ; (x) c f ;0 (x)) dx 0. () Ugyais, ha f ; (x) c f ;0 (x) 0, akkor az itegradus ulla. Ha f ; (x) c f ;0 (x) > 0, akkor Ψ(x), viszot Ψ (x), így Ψ(x) Ψ (x) 0, tehát az itegradus 0. Ha f ; (x) c f ;0 (x) < 0, akkor Ψ(x) 0, így Ψ(x) Ψ (x) 0, tehát az itegradus megit 0. Az () itegrált szétbotva, 0 Ψf ; Ψ f ; c Ψf ;0 +c Ψ f ;0 E (Ψ(X)) E (Ψ (X)) c E 0 (Ψ(X))+c E 0 (Ψ (X)). Átredezve kapjuk, hogy E (Ψ(X)) E (Ψ (X)) c [E 0 (Ψ(X)) E 0 (Ψ (X))] 0. A próba eve: likelihood-háyados próba. Véletleítésre általába csak diszkrét miták eseté va szükség, hogy a teljes terjedelmet ki tudjuk haszáli, és egyúttal öveljük az er t. Eek ikább elméleti, mit gyakorlati jelet sége va. Megmutatható, hogy (függetle, azoos elem mitákra) a próba kozisztes, mivel β c, ahol c a két likelihood függvéyt l függ (egyél kisebb) kostas. 6.. Példa. Egy érmével kétszer dobuk. H 0 : P (fej), H : P (fej) 6. A mitatér: X {F F, F I, IF, II}, és a rövidség kedvéért jelölje a likelihoodokat L és L 0. A likelihoodok, illetve likelihoodháyadosok táblázata: F F F I IF II L 36 L 0 4 L L 0 9 5 36 4 5 9 Legye el ször α 0.5. A Neyma-Pearso lemma alapjá olya γ, c párt keresük, melyre a Ψ(x) ha L L 0 > c γ ha L L 0 c próba terjedelme α, azaz 0.5 α P 0 ( L L 0 > c) + γ P 0 ( L L 0 c). A terjedelmet úgy 0 ha L L 0 < c szedjük össze, hogy a legagyobb likelihood-háyadostól, 5/9-t l iduluk. Látszik, hogy c ( 5 9, 5 9 ) jó lesz, és véletleítésre ics szükség (γ 0), tehát II eseté H 0 -t elutasítjuk, mide más esetbe H 0 -t elfogadjuk. Ha most α 0.3, akkor tovább kell mei. Ha 5 9 < c < 5 9, akkor az els fajú hiba 0.5 < 0.3 ha viszot 9 < c < 5 9, akkor az els fajú hiba 0.5 + 0.5 > 0.3. Tehát c 5 9, és a megoldadó egyelet: 0.5 + γ 0.5 0.3, amib l γ 0.. Tehát II eseté H 0 -t elutasítjuk, F F eseté H 0 -t elfogadjuk, IF vagy F I eseté véletleítük: H 0 -t 0.9 valószí séggel elfogadjuk, 0. valószí séggel elvetjük. Mekkora a próba ereje? ( ) ( ) L L β P > c + γ P c 5 0 + 0. L 0 L 0 36 36 6 36 0.7. 5 36 4 5 9 5 36 4 5 9

6.3. Példa. Egy urába 7 db golyóból k piros, 7 k zöld. H 0 : k 3, H : k 4. Három golyót kihúzuk visszatevés élkül, jelölje X a pirosak számát a kihúzottak között (X {0,,, 3}). Adjuk meg az α 0. terjedelm likelihood-háyados próbát! ( 3 4 ) ( 4 3 ) L 0 (x) x)( 3 x ( 7, L (x) x)( 3 x ( 7. 3) 3) Ezért a táblázat: L 35 4 L 0 35 L L 0 4 0 3 35 8 35 3 8 4 35 35 35 35 3 4 Mivel /35 < 0., de /35+/35 > 0., így c 3. Továbbá a 0. 35 +γ 35 egyeletb l γ 0.5. Tehát ha legfeljebb egy piros golyót húzuk, akkor elfogadjuk a ullhipotézist, ha három piros golyót húzuk, akkor elvetjük a ullhipotézist, ha pedig két piros golyót húzuk, akkor véletleítük: / valószí séggel elvetjük, / valószí séggel elfogadjuk a ullhipotézist. A próba másodfajú hibája: β P (H 0 -t elfogadjuk) 35 + 35 + 8 35 35. 6.4. Példa. Legye X Exp(λ) egy villaykörte élettartama (évekbe kifejezve). H 0 : λ, H : λ 3. Adjuk meg az α /8 terjedelm likelihood-háyados próbát! Most X (0, ). A s r ségfüggvéyek és háyadosuk: L 0 (x) e x, L (x) 3 e 3 x, L (x) L 0 (x) 3 e x x 3 3 e x 6. Mivel a mita folytoos eloszlású, véletleítésre em lesz szükség. Kell tehát: α 8 P 0 ( ) ( 3 e X 6 > c P 0 X > 6 l 3c ) ( F 0 6 l 3c ) ( 3 3c 3 l e. 3c) Ebb l pedig c 4 3. Megkaptuk tehát c-t, de igazából em ez a fotos, haem az, hogy mikor utasítjuk el a ullhipotézist. A számítás másképp: α ( ) 8 P 0 3 e X 6 > c P 0 (X > d) F 0 (d) e d, amib l d 6 l 4.6. Tehát akkor utasítjuk el a ullhipotézist, ha a villaykörte tovább él, mit 4.6 év. Mj.: a kapott próba egyeletese leger sebb a H 0 : λ, H : λ < hipotézisvizsgálati feladatra, mivel mide H : λ λ (< ) egyszer ellehipotézisre ugyaez a próba a leger sebb. 6.. Feladat. Legye öt elem miták λ paraméter Poisso eloszlásból. H 0 : λ, H : λ. Adjuk meg az α 0.05 terjedelm likelihood-háyados próbát! 6.. Feladat. Legye elem miták az N(m, ) ormális eloszlásból. H 0 : m 0, H : m. Adjuk meg az α 0.05 terjedelm likelihood-háyados próbát! 7. A ormális eloszlás paramétereire voatkozó próbák Az egyik leggyakrabba el forduló eloszlás a ormális eloszlás, melyet a várható értéke és a szórása jellemez. Ezekre a paraméterekre három típusú próbát tauluk. Ezek a típusok:. A várható értékre voatkozó próba, ha a szórás ismert u-próba.

. A várható értékre voatkozó próba, ha a szórás ismeretle t-próba. 3. A szórásra voatkozó próba, ha a várható érték ismeretle (vagy akár ismert) F -próba. A próbák eze belül még külöbözhetek aszerit, hogy egymitásak vagy kétmitásak, illetve az ellehipotézis jellege szerit (egyoldali vagy kétoldali ellehipotézis). Ezek a próbák egyeletese leger sebbek a legfeljebb ekkora terjedelm torzítatla próbák között. Egymitás u-próba Legye X,..., X N(m, σ) ahol σ ismert, m ismeretle. A hipotézisek: a) H 0 : m m 0 H : m m 0 b) H 0 : m m 0 H : m > m 0 c) H 0 : m m 0 H : m < m 0 () A próbastatisztika: u X m 0 H0 N(0, ). σ Ezért ha a kívát terjedelem α, akkor a kritikus tartomáy: a) X k { u > u α } b) X k {u > u α } c) X k {u < u α } (3) ahol az u δ kritikus érték olya, hogy Φ(u δ ) δ, ezt a Φ(x) függvéy táblázatából keressük ki. Mj.: ()-be az a) esetbe kétoldali, a b) és c) esetekbe egyoldali ellehipotézisr l beszélük. Hogy éz ki a próba er függvéye (kétoldali ellehipotézisre)? Vezessük be a (m) : m m0 σ jelölést. β (m) P m ( u > u α ) P m P m ( u α < X m σ ( X m 0 + m m 0 σ σ < u α > u α ) ( P m u α < X m 0 σ ) P m ( u α (m) < X m σ < u α ) < u α (m) Φ(u α (m)) + Φ( u α (m)) Φ( u α + (m)) + Φ( u α (m)), ahol felhaszáltuk, hogy X m σ N(0, ). Az er függvéy kapott képletéb l leolvasható, hogy ) β (m) folytoos ) β (m) < β (m) (m m 0 ) és β (m) (a próba kozisztes) 3) β (m) > α (m m 0 ) (er agyobb mit a terjedelem - a próba torzítatla) 4) lim β (m) m ± 7.. Példa. Legye X,..., X 6 N(m, ) mita, melyre X 0,. Hipotéziseik: H 0 : m 0, H : m 0. α 0, terjedelem mellett szereték dötei. Egymitás u-próbát kell végezi, a kritikus érték: ) 0.95 α Φ(u α ) tábl. u α.65. A próbastatisztika: u 0, 0 6 0.4. Mivel 0.4.65, elfogadjuk H 0-t. Keressük most meg a legagyobb terjedelmet, ami mellett még elfogadjuk H 0 -t! u α 0.4 Φ(u α ) 0.66 α α 0.34 α 0.68. 3

Kétmitás u-próba Legyeek X,..., X N(m, σ ) és Y,..., Y N(m, σ ) függetle miták, ahol σ, σ ismert, m, m ismeretleek. A hipotézisek: A próbastatisztika: a) H 0 : m m H : m m b) H 0 : m m H : m > m c) H 0 : m m H : m < m (4) u X Y σ + σ H 0 N(0, ). Tehát a kritikus tartomáyok ugyaazok, mit egymitás esetbe, azaz (3) adja meg ket. Egymitás t-próba Legye X,..., X N(m, σ) ahol m, σ ismeretle. A hipotézisek: ugyaazok, mit az egymitás u-próbáál (). A próbastatisztika: t X m 0 S ahol S (Xi X). Jelölje a szbadsági fokot f, tehát f. A kritikus tartomáy: H0 t, a) X k { t > t f ( α )} b) X k {t > t f (α)} c) X k {t < t f (α)} (5) ahol a t f (δ) kritikus érték olya, hogy F (t f (δ)) δ, ha F jelöli az f szabadsági fokú t-eloszlás eloszlásfüggvéyét. A t f ( α )-t és a t f (α)-t a t-próba kritikus értékei cím táblázatból keressük ki, az oszlopok fölött kell gyeli arra, hogy egyoldali vagy kétoldali próbák va. Kétmitás t-próba Legyeek X,..., X N(m, σ) és Y,..., Y N(m, σ) függetle miták, ahol m, m és σ ismeretleek. A hipotézisek: ugyaazok, mit a kétmitás u-próbáál (4). A próbastatisztika: t X Y ( )S + ( )S Jelölje a szbadsági fokot f, tehát f +. A kritikus tartomáy ugyaaz, mit az egymitás esetbe (5). ( + ) + H 0 t+. Vezessük le, hogya jö ki a kétmitás t-próbáál a próbastatisztika. Egyrészt m m eseté X Y N(0, σ / + σ / ), azaz σ (X Y ) + N(0, ). Másrészt teljesül, hogy [ ] σ ( )S + ( )S χ +, 4

mivel a tagok külö-külö χ illetve χ eloszlásúak, és függetleek. Mivel pedig az el z két képletbe felírt valószí ségi változók függetleek is, háyadosuk a szabadsági fok gyökével beszorozva valóba t eloszlású lesz. Mj.: Ha a két mita szórása szigikása külöbözik, akkor a feti próbát kissé módosítai kell, ezt vagy szité t-próbáak, vagy Welch-próbáak hívják. A módosítás abból áll, hogy most a próbastatisztika t X Y S + S H 0 tf, ahol az f szabadsági fok f (g + g ) g + g és g i S i / i. Ha f em egész, akkor kerekítjük. A szórásra voatkozó próbához szükségük lesz az F eloszlásra. 7.. Deíció. Ha X f szabadsági fokú, Y pedig f szabadsági fokú, egymástól függetle, χ eloszlású valószí ségi változók, akkor a Z X/f Y/f valószí ségi válozó (f, f ) szabadsági fokú F -eloszlású, jel. F f,f. Itt f a számláló szabadsági foka, f a evez szabadsági foka. (E(Z), f f.) Kétmitás F -próba Legyeek X,..., X N(m, σ ) és Y,..., Y N(m, σ ) függetle miták, ahol m, m és σ, σ ismeretleek. A hipotézisek: A próbastatisztika: a) H 0 : σ σ H : σ σ b) H 0 : σ σ H : σ > σ c) H 0 : σ σ H : σ < σ F S H S 0 F,. Jelölje a szbadsági fokokat f és f. A kritikus tartomáy: a)x k {F < F f,f ( α ) vagy F > F f,f ( α )} b)x k {F > F f,f (α)} c)x k {F < F f,f ( α)}, (6) ahol az F f,f (δ) kritikus érték olya, hogy G(F f,f (δ)) δ, ha G jelöli az (f, f ) szabadsági fokú F -eloszlás eloszlásfüggvéyét. A kritikus értékeket az F -próba kritikus értékei cím táblázatból keressük ki. A próbastatisztika H 0 melletti eloszlása: F S S ( ( ( )S σ ( )S A próba praktikusabb formája kétoldali ellehipotézisre: F < F f,f ( α/) σ ) ) F,. F f,f ( α/) < F F f,f, ezért F f,f (α/) F f,f ( α/). Így a kritikus tartomáy ekvivales alakja: { } X k F > F f,f (α/) vagy F > F f,f (α/). 5

A gyakorlatba haszált α-kra a kritikus érték -él agyobb, ezért elég F és /F közül a agyobbikat összehasolítai a megfelel kritikus { értékkel. } A próba tehát: az F S max statisztikát hasolítjuk össze vagy az F, (α/) vagy az S, S S F, (α/) kritikus értékekkel. Legye X,..., X N(m, σ) ahol m, σ ismeretle. A hipotézisek: A próbastatisztika: Jelölje a szabadsági fokot f. A kritikus tartomáy: Egymitás F -próba (vagy χ -próba) a) H 0 : σ σ 0 H : σ σ 0 b) H 0 : σ σ 0 H : σ > σ 0 c) H 0 : σ σ 0 H : σ < σ 0 χ ( ) S σ0 H 0 χ. a)x k {χ < χ f ( α ) vagy χ > χ f ( α )} b)x k {χ > χ f (α)} c)x k {χ < χ f ( α)}, ahol a χ f (δ) kritikus érték olya, hogy G(χ f (δ)) δ, ha G jelöli az f szabadsági fokú χ -eloszlás eloszlásfüggvéyét. A kritikus értékeket a χ -próba kritikus értékei cím táblázatból keressük ki. Ehelyett végezhetük az F S σ0 H 0 F, statisztikára F -próbát, azaz ekkor a kritikus tartomáyt (6) adja meg (az F, eloszlás a χ eloszlás átskálázott változata). 7.. Példa. Kétféle altató (A és B) hatásosságát tesztelték 0 betege. Az alábbi táblázat azt mutatja, hogy az altató meyivel övelte meg a betegek éjszakai alvásidejét (órába mérve). Beteg sorszáma A altató B altató külöbség.9 0.7. 0.8.6.4 3. 0..3 4 0...3 5 0. 0. 0 6 4.4 3.4 7 5.5 3.7.8 8.6 0.8 0.8 9 4.6 0 4.6 0 3.4. Vajo va-e szigikás külöbség a két gyógyszer hatásossága között ( α 0.0 terjedelem mellett)? Hipotézisek: H 0 : m m, H : m m. A két mita azoba em függetle, mert ugyaazoko a betegeke próbálták ki mid a két gyógyszert. Vegyük ezért az A B külöbséget, és teszteljük egymitás t-próbával a H 0 : m 0, H : m 0 hipotéziseket! S.3, X.58, t X m0 S 4.06. A kritikus érték: t9 (0.005) 3.35, így, mivel 4.06 > 3.35, a ullhipotézist elvetjük, azaz a két gyógyszer hatásossága között szigikás külöbség va. Tegyük most fel, hogy a két gyógyszert más-más 0 betege tesztelték (de továbbra is a feti táblázat adatait haszáljuk). Ekkor a két mita függetle, kétmitás t-próba végezhet. X.33, Y 0.75, S A 4, S B 3.8. A kétféle gyógyszer hatásáak szórásai feltételezhet e egyel ek, de elle rizhetjük 6