Mo= argmax f(x), ha X abszolút folytonos; Mo= argmax P (X = x i ), ha X diszkrét.

Hasonló dokumentumok
Segédanyag a Leíró és matematikai statisztika tantárgyhoz március 28.

Statisztika gyakorlat Geológus szakirány

Segédanyag a Leíró és matematikai statisztika tantárgyhoz március 1.

Matematikai statisztika

Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X = 1) = p Ind(p) P(X = 0) = 1 p. Leíró és matematikai statisztika

Matematikai statisztika gyakorlat 2018/2019 II. félév

Statisztika 1. zárthelyi dolgozat március 21.

Statisztika 1. zárthelyi dolgozat március 18.

Statisztika (jegyzet)

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Statisztika. Földtudomány szak, geológus szakirány, 2015/2016. tanév tavaszi

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Leíró és matematikai statisztika gyakorlat 2018/2019 II. félév

BIOMATEMATIKA ELŐADÁS

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

Valószín ségszámítás és statisztika gyakorlat Programtervez informatikus szak, esti képzés

Matematikai statisztika gyakorlat Programtervez informatikus alapszak, A szakirány 2018/2019 tavaszi félév Megoldások, végeredmények

18. Valószín ségszámítás. (Valószín ségeloszlások, függetlenség. Valószín ségi változók várható

A matematikai statisztika elemei

6. feladatsor. Statisztika december 6. és 8.

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Statisztikai programcsomagok

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Sorozatok október 15. Határozza meg a következ sorozatok határértékeit!

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

Áringadozások elıadás Kvantitatív pénzügyek szakirány 2012/13 2. félév

2. Hatványsorok. A végtelen soroknál tanultuk, hogy az. végtelen sort adja: 1 + x + x x n +...

Abszolút folytonos valószín ségi változó (4. el adás)

Matematika B4 I. gyakorlat

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

kismintás esetekben vagy olyanokban, melyeknél a tanulóalgoritmust tesztadatokon szeretnénk

æ MATEMATIKAI STATISZTIKA Dr. Bolla Marianna, Matematika Intézet, Sztochasztika Tanszék

Matematikai statisztika

1. Példa. A gamma függvény és a Fubini-tétel.

Statisztika elméleti összefoglaló

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

3.1. A Poisson-eloszlás

Valószín ségszámítás és statisztika

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

Játékszabályok. a keresett valószín ség:

Valószín ségszámítás és statisztika

Komputer statisztika

Statisztika október 27.

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

A tárgy címe: ANALÍZIS 1 A-B-C (2+2). 1. gyakorlat

Dr. Karácsony Zsolt. Miskolci Egyetem november

A függvénysorozatok olyanok, mint a valós számsorozatok, csak éppen a tagjai nem valós számok,

Kutatói pályára felkészítı modul

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

ezek alapján kívánunk dönteni. Ez formálisan azt jelenti, hogy ellenőrizni akarjuk,

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

ELTE TTK Budapest, január

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya

min{k R K fels korlátja H-nak} a A : a ξ : ξ fels korlát A legkisebb fels korlát is:

Valószín ségszámítás (jegyzet)

Nemparaméteres próbák

Idősorok elemzése [leíró statisztikai eszközök] I

Normális eloszlás paramétereire vonatkozó próbák

Hipotézis-ellenırzés (Statisztikai próbák)

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk;

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Statisztika Elıadások letölthetık a címrıl

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Tudjuk, hogy az optimumot az ún. regressziós görbe szolgáltatja, melynek egyenlete:

egyetemi jegyzet Meskó Balázs

Matematikai statisztika szorgalmi feladatok

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

0,1 P(X=1) = p p p(1-p) Egy p vszgő esemény bekövetkezik-e.

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

A statisztika részei. Példa:

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

véletlen : statisztikai törvényeknek engedelmeskedik (Mi az ami közös a népszavazásban, a betegségek gyógyulásában és a fiz. kém. laborban?

Statisztikai hipotézisvizsgálatok

Feladatok megoldása. Diszkrét matematika I. Beadandó feladatok. Bujtás Ferenc (CZU7KZ) December 14, feladat: (A B A A \ C = B)

Bootstrap (Efron, 1979)

Komplex számok (el adásvázlat, február 12.) Maróti Miklós

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Tartalom. Kezdeti szimulációs technikák. Tipikus kérdések. A bootstrap módszer. Bevezetés A független, azonos eloszlású eset:

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Eötvös Loránd Tudományegyetem Informatikai Kar. Analízis 1. Írásbeli beugró kérdések. Készítette: Szántó Ádám Tavaszi félév


1. A radioaktivitás statisztikus jellege

= dx 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

A peremeloszlások. Valószínőségszámítás elıadás III. alk. matematikus szak. Példa. Valószínőségi vektorváltozók eloszlásfüggvénye.

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Átírás:

Segédayag a Matematikai statisztika tatárgyhoz 09 április 0 Leíró statisztika A statisztikai elemzések egyik legfotosabb eszközei a viszoyszámok A viszoyszám két statisztikai adat háyadosa Jelölések: V = A B, ahol V : viszoyszám; A: a viszoyítás tárgya; B: a viszoyítás alapja A viszoyszámok fajtái: Megoszlási: a sokaság egy részét a sokaság egészéhez viszoyítjuk Koordiációs: a sokaság egy részéek a sokaság egy másik részéhez való viszoyítása Diamikus: két id pot vagy id szak adatáak háyadosa Itezitási: külöböz fajta adatok viszoyítása egymáshoz; gyakra a mértékegységük is eltér Ha egy teljes sokaságra és aak m részére redelkezésre áll a viszoyszám alapja és részei, akkor a viszoyszámokat ki tudjuk számoli a teljes sokaságra (jel V, ezt összetett viszoyszámak hívják) és aak részeire is (jel V,, V m ) Ekkor a teljes sokaságra számolt viszoyszám kiszámítási lehet ségei: V = A i = B i B i V i B i }} súlyozott számtai átlag = A i A i V i }} súlyozott harmoikus átlag A leíró statisztikai szakirodalomba az i idexeket pogyola módo le szokták hagyi: A BV A V = = = B B Deíció z-kvatilis: A V q(z) = q z = ifx : F (x) z}, és ameyibe F ivertálható, akkor q z = F (z)-re egyszer södik (0 < z < ) Fotos speciális kvatilisek: kvartilisek: Q := q alsó kvartilis Q = Me := q mediá (középs mitaelem) Q 3 := q 3 fels kvartilis Deíció Módusz: abszolút folytoos eloszlás eseté a s r ségfüggvéy maximumhelye(i), diszkrét eloszlás eseté pedig az eloszlás maximumhelye(i) Tehát Mo= argmax f(x), ha X abszolút folytoos; x R Mo= argmax P (X = x i ), ha X diszkrét x,x, Nem biztos, hogy létezik, és ha létezik, akkor se biztos, hogy egyértelm skew(x) = E(X EX)3 (DX) 3 skew(x)=0 az eloszlás szimmetrikus skew(x)>0 az eloszlás balra ferdült skew(x)<0 az eloszlás jobbra ferdült Deíció Ferdeség (skewess): Értelmezése: a a kurt(x) = E(X EX) (DX) 3 kurt(x)=0 az eloszlás csúcsossága a stadard ormáliséval megegyez kurt(x)<0 az eloszlás laposabb a st orm-ál kurt(x)>0 az eloszlás csúcsosabb a st orm-ál Deíció Csúcsosság (kurtosis): Értelmezés: V V V Mita: X,, X valószí ségi változó sorozat, jel X = (X,, X ) T A továbbiakba feltesszük, hogy függetleek és azoos eloszlásúak ezt rövide iid mitáak hívjuk (idepedet, idetically distributed) Az elméleti értékeket agy, a kokrét, realizált mitából számolt értékeket midig kis bet fogja jelöli, azaz mita eseté x,, x Statisztika: a mita valamely függvéye: T : X Becslés: a mita eloszlásáak ismeretle paraméterét közelíti a mita segítségével Megj: Mide becslés statisztika Néháy léyeges statisztika: Redezett mita: X X em csökke sorredbe tesszük a mitaelemeket Terjedelem: R = X X (R=rage) Mitaátlag: X = X i Tapasztalati szórás: S = (X i X) Értelmezése: az átlagtól való átlagos eltérés abszolút mértékegységbe Korrigált tapasztalati szórás : S = (X i X) Szórási együttható: V = S X Értelmezése: az átlagtól való átlagos eltérés százalékba Megj: relatív szórásak is hívják Tapasztalati eloszlásfüggvéy : F (x) = I(X i<x)

ha X i < x ahol I(X i < x) = karakterisztikus függvéy 0 ha X i x Tapasztalati z-kvatilis : Realizált mitából sokféleképpe számolható, iterpolációs módszer: ) Sorszám megállapítása: ( + )z = e + t (e: egészrész, t: törtrész) ) q z = x e + t(x e+ x e) Értelmezése: a mitaelemek z-ed része legfeljebb a q z értéket veszi fel, ( z)- ed része pedig legalább q z Iterkvartilis terjedelem: IQR = Q 3 Q Tapasztalati módusz : a legtöbbször el forduló érték Értelmezése: a mita tipikus, leggyakrabba el forduló értéke Tapasztalati ferdeség : Tapasztalati csúcsosság : (X i X) 3 S 3 (X i X) S Tétel (Gliveko-Catelli) A tapasztalati eloszlásfüggvéy valószí séggel ( egyeletese tart ) a valódi eloszlásfüggvéyhez, formálisa P lim F (x) F (x) = 0 = sup x R Boxplot ábra: (ez fekv, de lehet álló is) ahol a bet k a következ értékeket jeletik: 3 Középértékek kiszámítása Átlag (számtai vagy mértai amelyikek értelme va) Helyzeti középértékek: módusz és mediá Szóródási mutatók kiszámítása Terjedelem és iterkvartilis terjedelem Szórás és relatív szórás Alakmutatók kiszámítása Ferdeség Csúcsosság Ábrák készítése: S r séghisztogram Boxplot ábra Nevezetes diszkrét eloszlások: Eloszlás eve Jelölése Eloszlása EX D X Karakterisztikus (idikátorvált) Id(p) P (X = ) = p mmmmmm P (X = 0) = p p p( p) Geometriai Geo(p) P (X = k) = p( p) k p m p p (Pascal) k =,, Hipergeometriai Hipgeo(N,M,) P (X = k) = (M k )( N M k ) ( ) ( ) ( N m M M N N M N N ) k = 0,,, Biomiális Bi(, p) ( P (X = k) = p k) ( p) k mm p p( p) k = 0,,, ( ) Negatív biomiális k =, +, NegBi(, p) k P (X = k) = p ( p) k ( p) p p Poisso Poi(λ) P (X = k) = λk k! e λ mm k = 0,, λ λ Nevezetes abszolút folytoos eloszlások: A = maxx, Q, 5 IQR}; B = Q ; C = Me; D = Q 3 ; E = mix, Q 3 +, 5 IQR}; F : kies értékek, azokat tütetjük fel potokkét, amik A- vagy E- kívülre esek Az adatelemzés lépései: Adathibák keresése, irreális adatok, értékek törlése; esetleg korrigálása Alkalmas osztályközös gyakorisági sor készítése Eloszlás eve Jelölése Eloszlásfüggvéy S r ségfüggvéy EX D X 0 ha x a x a ha a < x b b a a+b (b a) Egyeletes E(a, b) ha a < x b b a 0 külöbe ha b < x Expoeciális Exp(λ) e λx ha x 0 0 külöbe Stadard orm N(0, ) Φ(x) = Normális N(m, σ ) További evezetes abszolút folytoos eloszlások: λe λx ha x 0 0 külöbe λ λ π e x x R 0 πσ e (x m) σ x R m σ

Eloszlás eve Cauchy Cauchy(a, b) a R, b > 0 Jelölése Eloszlásfüggvéy S r ségfüggvéy EX D X Pareto P areto(α, β) α, β > 0 ( ) π arctg x a b + ( ) β α ha x β x 0 ha x < β [ πb α β +( x a ( β x b ) ] x R ) α+ ha x β 0 ha x < β αβ α A Pareto-eloszlásak akkor va véges várható értéke a képletek megfelel e, ha α >, szóráségyzete pedig akkor, ha α > β α (α ) (α ) Gamma Γ(α, λ) α, λ > 0 Béta Beta(α, β) α, β > 0 Jelölése Eloszlásfüggvéy S r ségfüggvéy EX D X χ k k N k/ Γ(k/) xk/ e x/ x R k k Eloszlás eve Khíégyzet Logormális LN(m, σ ) mm m R, σ > 0 Γ(α) λα e λx x α ha x 0 0 ha x < 0 Γ(α+β) Γ(α)Γ(β) xα ( x) β x [0; ] 0 külöbe (log x m) x πσ e σ ha x 0 0 ha x < 0 α λ α α+β e m+σ / α λ αβ (α+β) (α+β+) (e σ )e m+σ L(ϑ; x) = P ϑ (X = x) = P ϑ (X i = x i ), ha az eloszlás diszkrét Deíció Elégséges statisztika Legye (Ω, A, P) statisztikai mez, X mita, B A A T statisztikát elégséges statisztikáak evezzük, ha a P ϑ (X B T (X)) feltételes eloszlásak létezik ϑ-tól em függ változata Megjegyzés Ez egy elég absztrakt fogalom Elégséges statisztikát a Neyma-féle faktorizációs tétel segítségével (kicsit lejjebb) tuduk keresi és arra lesz jó, hogy segítségével bizoyos szempotból optimális becslést találjuk Megjegyzés az elégséges statisztika mide léyeges iformációt tartalmaz az ismeretle ϑ paraméterre voatkozóa Tétel Neyma-féle faktorizációs tétel "Szép" statisztikai mez a T statisztika akkor és csak akkor elégséges, ha létezek olya g ϑ emegatív és h függvéyek, hogy L(ϑ; x) = g ϑ (T (x)) h(x) ϑ Θ és λ-mm x X eseté Állítás A T (X) = X redezett mita elégséges statisztika Matematikai statisztika becsléselmélet Most belekezdük a matematikai statisztikába, a korábbi mita fogalma egy fokkal absztraktabb formába fog visszaköszöi Deíció Statisztikai mez (Ω, A, P) hármas, ahol P pedig eloszlások egy családja és mide P P-re (Ω, A, P ) valószí ségi mez P-t gyakra paramérese adjuk meg: P = P ϑ : ϑ Θ}, ahol Θ R p összefügg és yílt halmaz, amit paramétertérek hívuk Deíció Mita X : (Ω, A) X leképezés, ahol X eve: mitatér Feladat: aak a meghatározása, hogy a P eloszláscsalád melyik tagja írja le legjobba a valóságot, a vizsgált jeleséget Eek érdekébe veszük mitát Er feszítéseik jelet s része arra fog iráyuli, hogy a valamilye szempotból "legjobb" P -t vagy paraméteres esetbe ezzel ekvivales módo, a "legjobb" ϑ paramétert megtaláljuk Jelölés A továbbiakba a valószí ség, s r ségfüggvéy, várható érték és szórás(mátrix) alsó idexbe lév ϑ arra fog utali, hogy egy paraméteres statisztikai mez va a feladat hátterébe és ϑ-val jelöljük az ismeretle, de érdekl désük középpotjába lév paramétert Deíció Likelihood függvéy: L(ϑ; x) = f ϑ (x) = Legye X = (X,, X ) iid mita f ϑ (x i ), ha az eloszlás folytoos Legye g : Θ R k függvéy Céluk az X mita alapjá g(ϑ) becslése Deíció Torzítatla becslés ha E ϑ T (X) = g(ϑ) ϑ Θ-ra Deíció Torzítás (bias) T(X) statisztika torzítatla becslése g(ϑ)-ak, b T (ϑ) = E ϑ T (X) g(ϑ) Deíció Legyeek T (X) és T (X) torzítatla becslései g(ϑ)-ak Ekkor azt modjuk, hogy T (X) hatásosabb T (X)-él, ha D ϑ (T (X)) D ϑ (T (X)) mide ϑ Θ eseté Deíció Hatásos becslés A T (X) torzítatla becslést hatásosak evezzük, ha mide torzítatla becslésél hatásosabb Tétel A hatásos becslés egyértelm sége Ha T (X) és T (X) hatásos becslései g(ϑ)-ak, akkor mide paraméterértékre valószí séggel megegyezek, azaz P ϑ (T (X) = T (X)) = ϑ Θ eseté Megjegyzés Egy becslésr l em egyszer beláti, hogy hatásos Hatásos becslés kereséséek alapja a kés bb tárgyaladó Blackwell-Rao tétel Deíció Aszimptotikus torzítatlaság A T (X) becsléssorozat ( =,, ) aszimptotikusa torzítatla becslése a g(ϑ)-ak, ha E ϑ T (X) g(ϑ) ϑ Θ eseté Deíció Gyege kozisztecia A T (X) becsléssorozat ( =,, ) gyegé kozisztes becslése a g(ϑ)-ak, ha T (X) g(ϑ) ϑ Θ eseté p 3

A T (X) becsléssorozat ( =,, ) er se kozisztes becslése a g(ϑ)-ak, ha T (X) vsz g(ϑ) ϑ Θ eseté Deíció Er s kozisztecia Állítás A tapasztalati eloszlásfüggvéy torzítatla és er se kozisztes becslése az eloszlásfüggvéyek A mitaátlag torzítatla és er se kozisztes becslése a várható értékek A tapasztalati szóráségyzet torzított, de aszimptotikusa torzítatla és er se kozisztes becslése a szóráségyzetek A tapasztalati szóráségyzet torzítatla és er se kozisztes becslése a korrigált szóráségyzetek A s r ségfüggvéy becslése em triviális probléma, két módszer erre: Hisztogram (s r séghisztogram) Parze-Roseblatt becslés A s r ségfüggvéy becslése magfüggvéy segítségével elem mitából: Parze-Roseblatt becslés: f (x) = h k ( x X i h ), ahol h alkalmas 0-hoz tartó sorozat Ez felel meg a mitapot körüli itervallum hossza feléek Tétel A Parze-Roseblatt becslés koziszteciája Alkalmas feltételek eseté h -re és a k magfüggvéyre, az f (x) Parze-Roseblatt becslés aszimptotikusa torzítatla és er se kozisztes becslése a valódi s r ségfüggvéyek Most egy kis emlékeztet következik arról, mi az a feltételes várható érték és hogya kell kiszámítai (blackwellizáláshoz szükséges) Az E(X Y )-ra úgy godoluk, mit egy valószí ségi változóra, kokrétabba az Y valószí ségi változó egy mérhet h(y ) függvéyére; és ha Y egy adott értéket vesz fel, azaz ha E(X Y = y), akkor mit kokrét számra Számítása diszkrét esetbe: E(g(X) Y ) = g(x i )P (X = x i Y = j), ami azt jeleti, hogy el ször i j=y kiszámoljuk a végtele összeget a feltételbe lév Y valószí ségi változó egy kokrét j értéke eseté, majd a j helyére visszaírjuk az Y -t abszolút folytoos eloszlások eseté: E(g(X) Y ) = g(x)f X Y (x y)dx ahol f X Y (x y) = y=y fx,y (x,y) f Y (y) ha f Y (y) > 0 0 külöbe Állítás Teljes valószí ség tétele folytoos esetbe a feltételes s r ségfüggvéy Legye A tetsz leges eseméy, Y abszolút folytoos valószí ségi változó Ekkor P (A) = P (A Y = y)f Y (y) dy Deíció Teljes statisztika A T statisztika teljes, ha tetsz leges h mérhet függvéyére E ϑ (h(t )) = 0 ϑ-ra h(t ) = 0 P-majdem mideütt Tétel Blackwell-Rao tétel Tegyük fel, hogy T statisztika torzítatla becslése g(ϑ)-ak és S elégséges statisztika Ekkor E(T S) feltételes várható érték torzítatla becslése g(ϑ)-ak és Dϑ (E(T S)) D ϑ (T ) mide ϑ-ra Ha S még teljes is, akkor E(T S) hatásos becslés Tehát a Blackwell-Rao tétel értelmébe az alábbi lépéseket követve tuduk hatásos becslést kapi (az eljárás eve blackwellizálás): az adott statisztikai mez keresük egy S teljes elégséges statisztikát; keresük egy, a beüket érdekl g(ϑ)-t torzítatlaul becsül T statisztikát; 3 kiszámoljuk az E(T S) feltételes várható értéket ami az S függvéye, és ez lesz a hatásos becslés Paraméterbecslési módszerek Maximum likelihood módszer (ML-módszer): Azt a paraméterértéket keressük, ahol a likelihood fv a legagyobb értéket veszi fel: max L(ϑ, x) j xi j ) egyel vé tesszük az elméleti mometumokkal (M i := Ameyibe a függvéy deriválható ϑ szerit, akkor a maximumot kereshetjük a szokásos módo, az els és második deriváltak segítségével, azoba a feladatukat jelet se megehezíti, hogy olya -szeres szorzatot kellee deriváli, amelyikek mide tagjába ott va az a változó, ami szerit deriváluk kellee Ezért likelihood függvéy helyett a log-likelihood függvéy maximumhelyét keressük Mometum módszer: A mitából számítható tapasztalati mometumokat (m i := E ϑ X i ), az els t l kezdve, mégpedig ayit, ameyi paraméter va Tehát p darab ismeretle paraméter eseté a következ p ismeretlees egyeletredszert oldjuk meg: M = m M p = m p Megjegyzés: m = x Fisher-tétel: Ha ϑ ML-becslése ˆϑ, akkor tetsz leges g függvéy eseté g(ϑ) MLbecslése g( ˆϑ) ϑ

Ebbe a részbe tegyük fel, hogy a paramétertér dimeziós Deíció Fisher-iformáció Tegyük fel, hogy a log-likelihood függvéy ϑ szerit deriválható ( Ekkor az X elem mitába lév Fisher-iformáció: I X (ϑ) I (ϑ) = E ϑ [ ϑ l(ϑ; X)] ) Megj: I X (ϑ) azt az (absztrakt) iformációmeyiséget méri, amelyet az X mita a paraméterre voatkozóa magába hordoz A Fisher-iformáció kiszámítása bizoyos, úgyevezett regularitási feltételek eseté egyszer bbé válik Deíció regularitási feltétel E ϑ ( ϑ l(ϑ, X)) = 0 Állítás E ϑ ( ϑ l(ϑ, X)) = 0 ϑ f ϑ (x) dx = deriváli" az itegráljel mögé x X x X ϑ f ϑ (x) dx, azaz "be lehet Állítás Ha teljesül az regularitási feltétel, akkor a Fisher-iformációt kiszámolhatjuk az alábbi módo: I (ϑ) = I (ϑ) = D ϑ ϑl(ϑ, X ) Tétel Cramér-Rao egyel tleség Tegyük fel, hogy T (X) statisztika torzítatla becslése g(ϑ)-ak és teljesül az regularitási feltétel Ekkor mide ϑ Θ-ra Dϑ (T (X)) (g (ϑ)) I (ϑ) }} iformációs határ Megjegyzés Ha mide ϑ-ra egyel ség teljesül a Cramér-Rao egyel tleségbe, akkor T hatásos becslés Eek az egyel tleségek a vizsgálata tehát lehet séget ad arra, hogy blackwellizálás élkül hatásos becslést találjuk Megjegyzés El fordulhat, hogy a statisztika szóráségyzete agyobb az iformációs határál, viszot a statisztika hatásos Példa erre iid expoeciális mitáál az statisztika X i Deíció χ -eloszlás: Az X val változó szabadságfokú χ -eloszlású (jel: X χ ), ha X = U + + U, ahol U i N(0, ) i-re és függetleek egymástól Deíció t-eloszlás: Az X valószí ségi változó szabadságfokú Studet-féle t-eloszlást követ (jel: X t ), ha X =, ahol Z N(0, ) és Y χ függetleek egymástól Z Y Deíció F-eloszlás: Az X valószí ségi változó m és szabadságfokú F- eloszlást követ (jel: X F m, ), ha X = Ym m Z, ahol Y m χ m és Z χ függetleek egymástól Mostatól α egy 0-hoz közeli pozitív szám lesz (például 0, 05 = 5%), és vezessük be a következ jelöléseket az eloszlások kvatiliseire: u α : N(0, ) eloszlás ( α)-kvatilise, azaz u α = Φ ( α) z α := u α (sok köyvbe ezt haszálják) t,α : szabadságfokú t-eloszlás ( α)-kvatilise χ,α : szabadságfokú χ -eloszlás α-kvatilise Fm, α : m, szabadságfokú F-eloszlás α-kvatilise Deíció Kodecia itervallum: Adott α-hoz legalább ( α) valószí séggel tartalmazza az adott paramétert (vagy aak egy függvéyét): P ϑ (T (X) < ˆϑ ) < T (X) α Gyakra keresük szimmetrikus kodecia itervallumot, ilyekor T = T =:, és az itervallum ˆϑ ± alakba írható Deíció Legye X,, X mita egy ϑ ismeretle paraméter eloszláscsaládból A T (X) statisztikát pivotal statisztikáak hívjuk, ha eloszlása em függ a ϑ paramétert l Például ha va egy N(m, σ ) eloszlású miták, akkor a T (X) = X m statisztika pivotal, ugyais stadard ormális eloszlású, tehát eloszlása em függ a paraméterekt l A pivotal statisztikák egyik f hasza, hogy segítségükkel sok esetbe kodeciaitervallumot lehet készítei Erre példa a következ éháy agyo fotos kodeciaitervallum Állítás Legye X,, X N(m, σ ) iid mita Ekkor m-re kodecia itervallum ha σ ismert, akkor x ± u α σ ha σ ismeretle, akkor x ± t, α σ -re kodecia itervallum: [ s ( ) (s ) ; ( ) (s χ ), α χ, α Hipotézisvizsgálat Hipotézis valami állítás, amiek igazságát vizsgáli szereték Paramétertér: Θ = Θ 0 Θ "valóság" Mitatér: X = X e X k "látszat" - MINTÁBÓL X k : kritikus tartomáy - azo X meggyelések halmaza, amikre elutasítjuk a ullhipotézist X e : elfogadási tartomáy - azo X meggyelések halmaza, amikre elfogadjuk a ullhipotézist Hipotézisvizsgálati feladat: H 0 : ϑ Θ 0 ullhipotézis ] σ 5

H : ϑ Θ ellehipotézis Tehát ha X X e, akkor elfogadjuk H 0 -t; ha X X k, akkor pedig elutasítjuk H 0 -t Ameyibe a Θ 0 halmaz egyelem, akkor azt modjuk, hogy H 0 egyszer H -re ugyaígy Az X mitatér felosztását általába egy statisztika (eve: próbastatisztika) segítségével végezzük el: legye T: X R, X k = x X : T(x) > c} c eve: kritikus érték X e = x X : T(x) c} Dötés H 0 -t "Valóság" elfogadjuk (X e ) elutasítjuk (X k ) H 0 teljesül (Θ 0 ) helyes dötés els fajú hiba H 0 em teljesül (Θ ) másodfajú hiba helyes dötés P(els fajú hiba)=α(ϑ)=p ϑ (X k ), ahol ϑ Θ 0 P(másodfajú hiba)=β(ϑ)=p ϑ (X e ), ahol ϑ Θ Er függvéy: ψ: Θ R, ψ(ϑ) = P ϑ (X k ) Terjedelem: α = sup α(ϑ): ϑ Θ 0 } Azt modjuk, hogy az -es próba er sebb a -es próbáál, ha α = α és ψ (ϑ) ψ (ϑ) ϑ Θ Próbafüggvéy: ϕ: X [0,] eyi valószí séggel vetem el a H 0 -t a mita alapjá x X k ϕ(x) = x X e ϕ(x) = 0 p-érték: az az α terjedelem, ami eseté a próbastatisztika értéke egyel a kritikus értékkel : T(x)= c α A p-érték a legkisebb terjedelem, amire még elutasítjuk a H 0 -t Ha egy próbát számítógép segítségével végzük el, redszerit a p-érték révé tuduk dötei: ha (p-érték)< α, akkor elvetjük H 0 -t Ha mid H 0, mid H egyszer, akkor adott α terjedelemhez lehet leger sebb próbát találi, ezt pedig úgy hívják, hogy valószí ség-háyados próba A hipotéziseket folytoos esetre írom fel Diszkrétre a s r ségfüggvéy helyett a kokrét eloszlást kell íri H 0 : f = f 0 H : f = f A valószí ség-háyados próba kritikus tartomáya: X k = x : f(x) f > c 0(x) α } Tehát azokat az x-eket, amire az f(x) f 0(x) agy, bepakoljuk a kritikus tartomáyba egésze addig, míg az adott α terjedelmet el em érjük Diszkrét esetbe ehhez általába véletleítésre va szükség, azaz bizoyos x-ek eseté em vagy 0, haem egy, e két szám közé es (jelöljük p α -val) valószí séggel vetjük el a ullhipotézist Most éháy evezetes próbát mutatuk be a ormális eloszlás várható értékére, illetve szórására Az α végig a próba terjedelmét jelöli, ami el re adott I Próbák ormális eloszlás várható értékére ) Egymitás próbák a) Egymitás u-próba X,, X N(m, σ ), ahol σ ismert, m paraméter a) H 0 : m = m 0 b) H 0 : m = m 0 c) H 0 : m = m 0 H : m m 0 H : m > m 0 H : m < m 0 A próbastatisztika: T(X)=u = X m0 H 0 eseté N(0, ) A kritikus tartomáyok: a) X k = x : u > u α/ } b) X k = x : u > u α } c) X k = x : u < u α } b) Egymitás t-próba X,, X N(m, σ ), ahol σ, m paraméter a) H 0 : m = m 0 b) H 0 : m = m 0 c) H 0 : m = m 0 H : m m 0 H : m > m 0 H : m < m 0 A próbastatisztika: T(X)=t = X m0 s A kritikus tartomáyok: a) X k = x : t > t,α/ } b) X k = x : t > t,α } c) X k = x : t < t,α } ) Kétmitás próbák σ H 0 eseté t X,, X N(m, σ ) Y,, Y m N(m, σ ) Az elvégzed próbák H 0 : m = m ullhipotézis eseté: a két mita a két mita függetle em függetle σ és σ ismert a) kétmitás u-próba egymitás u-próba a külöbségekre el zetes F-próba σ és σ ismeretle σ = σ σ σ egymitás t-próba b) kétmitás t-próba c) Welch-próba a külöbségekre a) kétmitás u-próba m, m paraméterek, σ, σ ismert H 0 : m = m és H : ami a szövegköryezetbe értelmes H 0 eseté N(0,) A próbastatisztika: u = X Y σ + σ m 6

b) kétmitás t-próba m, m, σ = σ paraméterek H 0 : m = m és H : ami a szövegköryezetbe értelmes A próbastatisztika: t = m X Y c) Welch-próba m, m, σ σ paraméterek +m A próbastatisztika: t = X Y (s ) + (s ) m ( )(s ) +(m )(s ) +m H 0 : m = m és H : ami a szövegköryezetbe értelmes H 0 eseté t f, ahol f = c + ( c) m c = (s ), ha s (s ) + (s ) > s m II Próbák ormális eloszlás szórására ) Egymitás próba: χ -próba X,, X N(m, σ ), ahol m és σ ismeretle paraméterek H 0 : σ = σ 0 és H 0 : σ σ 0 H 0 eseté χ H 0 eseté t +m A próbastatisztika: h = ( )(S ) σ 0 } Kritikus tartomáy: X k = x : h < χ,α/ vagy h > χ, α/ Az ellehipotézis lehet egyoldali is, ilyekor a kritikus tartomáy értelemszer e módosul ) Kétmitás próba: F -próba X,, X N(m, σ ) Y,, Y m N(m, σ ) m, m, σ, σ paraméterek H 0 : σ = σ és H : ami a szövegköryezetbe értelmes A próbastatisztika: F = (S ) H 0 eseté (S F,m ) χ -próbák a) Diszkrét illeszkedésvizsgálat Feladat: adott egy X = (X,, X ) elem mita, és azt akarjuk eldötei, hogy a mita egy általuk "remélt" eloszlásból származik-e Diszkrét illeszkedésvizsgálatál feltesszük, hogy a mitaelemek r külöböz értéket vehetek fel: P(X i = x j ) = p j j =,, r Jelöljük N j -vel a gyakoriságokat, azaz azt, hogy az elem mitába háy darab x j szerepel Osztályok r Összese Valószí ségek p p p r Gyakoriságok N N N r H 0 : a valószí ségek: p=(p,, p r ) H : em ezek a valószí ségek A próbastatisztika: T = r (N i p i) p i H 0 eseté χ r A kritikus tartomáy: X k = x : T (x) > χ r, α} eloszlásba, ha Becsléses illeszkedésvizsgálat : csak ayit "sejtük", hogy a mita valamilye eloszlású, viszot a paramétereir l ics sejtésük Ilyekor ameyibe MLmódszerrel becsüljük meg az s darab ismeretle paramétert, akkor a próbastatisztika: T H 0 eseté χ r s eloszlásba, ha Nagyo fotos: a próba csak akkor hajtható végre, ameyibe az egyes osztályokba eleged számú gyakoriság szerepel Nem egyértelm, milye határvoalat húzzuk meg Hüvelykujjszabálykét azt lehet modai, hogy legalább -6 gyakoriság szerepelje a cellákba és p i legalább legye mide osztályra Ameyibe kevés gyakoriság va a cellákba, akkor az éritett osztályokat össze kell voi Illeszkedésvizsgálat "szemmel": Q-Q plot és P-P plot Jelölje F az illesztett eloszlás eloszlásfüggvéyét, x k pedig a k redezett mitaelemet Q-Q plot: az illesztett eloszlás kvatiliseit vetjük ( össze ) a ) tapasztalati kvatilisekkel, azaz a következ potokat ábrázoljuk: (F k +, x k, ahol k =,, P-P plot: az illesztett eloszlás valószí ségeit vetjük ( össze a tapasztalati valószí - k ségekkel, azaz a következ potokat ábrázoljuk: +, F (x k ), ) ahol k =,, Midkét ábráál be szokták húzi a 5 fokos egyeest és miél jobba rásimulak a potok az egyeesre, aál jobbak tekithet az illeszkedés b) Diszkrét homogeitávizsgálat Feladat: va két függetle mita, midkett egy közös szempot szerit r osztály egyikébe sorolva Azt kell eldötei, hogy a két mita azoos eloszlásúak tekithet -e Osztályok r Összese mita Valószí ségek p p p r Gyakoriságok N N N r mita Valószí ségek q q q r Gyakoriságok M M M r m H 0 : a valószí ségek: (p,, p r ) = (q,, q r ) H : em ezek a valószí ségek A próbastat: T,m = r ( N i M i m ) N i+m i H 0 eseté χ r A kritikus tartomáy: X k = x : T,m (x) > χ r, α} c) Függetleségvizsgálat eloszlásba, ha 7

Feladat: va egy mita, két szempot szerit csoportosítva hogy a két szempot függetle-e egymástól p i,j =P(egy meggyelés az (i,j) osztályba kerül) N i,j =eyi meggyelés kerül az (i,j) osztályba A mitavétel eredméye: szempot j s Összese N N j N s N szempot i N i N ij N is N i r N r N rj N rs N r Összese N N j N s ahol N i = s és N j = r N ij j= N ij Azt kell eldötei, Megoldás: â = (xi x)(y i y) (xi x), ˆb = y âx Reziduumok: ˆε i = y i âx i ˆb (,, ) Reziduális égyzetösszeg: RNÖ= ˆε i = (y i y) (xi x)(y i y) (xi x) ˆσ = RNÖ Tapasztalati korrelációs együttható: R = (xi x)(y i y) (xi x) (y Eek égyzetét, i y) R -et, determiációs együtthatóak hívjuk, és ezzel mérjük a modell jóságát Az R mutatja meg, hogy százalékba a modell az Y változékoyságából meyit magyaráz meg Értéke 0 és között lehet, ha 0-hoz közeli, akkor a modell gyegé teljesít, ha -hez, akkor jól H 0 : a szempotok függetleek, azaz p i,j = p i p j i, j-re H : em azok ( ) r s N A próbastatisztika: T = i,j H N i N j 0 eseté χ (r )(s ) eloszlásba, j= ha A kritikus tartomáy: X k = x : T (x) > χ (r )(s ), α } Ha r = s =, akkor a próbastatisztika T = (NN NN) N N N N -re egyszer södik, az aszimptotikus eloszlás pedig szabadságfokú χ Regressziószámítás Feladat: Y valószí ségi változót szereték közelítei X val változó lieáris függvéye segítségével: E[Y (ax + b)] mi a,b Megoldása: a opt = Cov(X,Y ) D (X) b opt = EY a opt EX Feladat (lieáris regresszió): Adottak (x, y ),, (x, y ) potok, ezekre szereték egyeest illesztei (eve: regressziós egyees) legkisebb égyzetek módszerével A modell: Y i = ax i + b + ε i, ahol Eε i = 0 és D ε i = σ < (i =,, ) 8