Statisztika gyakorlat Geológus szakirány

Hasonló dokumentumok
Mo= argmax f(x), ha X abszolút folytonos; Mo= argmax P (X = x i ), ha X diszkrét.

Segédanyag a Leíró és matematikai statisztika tantárgyhoz március 28.

Matematikai statisztika

Statisztika 1. zárthelyi dolgozat március 21.

Statisztika 1. zárthelyi dolgozat március 18.

Segédanyag a Leíró és matematikai statisztika tantárgyhoz március 1.

Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X = 1) = p Ind(p) P(X = 0) = 1 p. Leíró és matematikai statisztika

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Statisztika. Földtudomány szak, geológus szakirány, 2015/2016. tanév tavaszi

Valószín ségszámítás és statisztika gyakorlat Programtervez informatikus szak, esti képzés

Matematikai statisztika gyakorlat 2018/2019 II. félév

BIOMATEMATIKA ELŐADÁS

Matematika B4 I. gyakorlat

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

A matematikai statisztika elemei

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Leíró és matematikai statisztika gyakorlat 2018/2019 II. félév

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.

Leíró és matematikai statisztika gyakorlat Matematikai elemz szakirány 2016/2017 tavaszi félév

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

6. feladatsor. Statisztika december 6. és 8.

Leíró és matematikai statisztika gyakorlat Matematikai elemz szakirány 2015/2016 tavaszi félév

Statisztika (jegyzet)

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

kismintás esetekben vagy olyanokban, melyeknél a tanulóalgoritmust tesztadatokon szeretnénk

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya

18. Valószín ségszámítás. (Valószín ségeloszlások, függetlenség. Valószín ségi változók várható

Hipotézis-ellenırzés (Statisztikai próbák)

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk;

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika október 27.

Matematikai statisztika gyakorlat Programtervez informatikus alapszak, A szakirány 2018/2019 tavaszi félév Megoldások, végeredmények

Játékszabályok. a keresett valószín ség:

Sorozatok október 15. Határozza meg a következ sorozatok határértékeit!

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

Matematikai statisztika

Valószín ségszámítás és statisztika

Áringadozások elıadás Kvantitatív pénzügyek szakirány 2012/13 2. félév

æ MATEMATIKAI STATISZTIKA Dr. Bolla Marianna, Matematika Intézet, Sztochasztika Tanszék

Kutatói pályára felkészítı modul

Statisztikai hipotézisvizsgálatok

Statisztikai programcsomagok

Statisztika Elıadások letölthetık a címrıl

Normális eloszlás paramétereire vonatkozó próbák

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Valószín ségszámítás 2 gyakorlat Alkalmazott matematikus szakirány

Valószín ségszámítás és statisztika

A statisztika részei. Példa:

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

Debreceni Egyetem, Közgazdaság- és Gazdaságtudományi Kar. Feladatok a Gazdasági matematika I. tárgy gyakorlataihoz. Halmazelmélet

Valószín ségszámítás és statisztika gyakorlat Programtervez informatikus szak, esti képzés

Tudjuk, hogy az optimumot az ún. regressziós görbe szolgáltatja, melynek egyenlete:

Komplex számok (el adásvázlat, február 12.) Maróti Miklós

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

Tartalom. Kezdeti szimulációs technikák. Tipikus kérdések. A bootstrap módszer. Bevezetés A független, azonos eloszlású eset:

Autoregressziós folyamatok

A tárgy címe: ANALÍZIS 1 A-B-C (2+2). 1. gyakorlat

Komputer statisztika

2. Hatványsorok. A végtelen soroknál tanultuk, hogy az. végtelen sort adja: 1 + x + x x n +...

VII. A határozatlan esetek kiküszöbölése

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Valószín ségszámítás és statisztika gyakorlat programtervez informatikus szak

Statisztika elméleti összefoglaló

ÖSSZEFÜGGÉSVIZSGÁLAT, PARAMÉTERBECSLÉS

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

véletlen : statisztikai törvényeknek engedelmeskedik (Mi az ami közös a népszavazásban, a betegségek gyógyulásában és a fiz. kém. laborban?

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Nemparaméteres próbák

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Rudas Tamás: A hibahatár a becsült mennyiség függvényében a mért pártpreferenciák téves értelmezésének egyik forrása

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Bootstrap (Efron, 1979)

Feladatok és megoldások a 11. heti gyakorlathoz

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

V. Deriválható függvények

Kalkulus II., második házi feladat

egyetemi jegyzet Meskó Balázs

Cserjésné Sutyák Ágnes *, Szilágyiné Biró Andrea ** ismerete mellett több kísérleti és empirikus képletet fel-

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Abszolút folytonos valószín ségi változó (4. el adás)

3.4. gyakorlat. Matematika B1X február 1819.

Matematikai statisztika szorgalmi feladatok

Bevezetés a hipotézisvizsgálatokba

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

Valószín ségszámítás (jegyzet)

Valószín ségszámítás és statisztika Gyakorlat (Kétmintás próbák)

1. A radioaktivitás statisztikus jellege

Eötvös Loránd Tudományegyetem Informatikai Kar. Analízis 1. Írásbeli beugró kérdések. Készítette: Szántó Ádám Tavaszi félév

Átírás:

Statisztika gyakorlat Geológus szakiráy Játékszabályok Az óráko részt kell vei, maximum 3-szor lehet hiáyozi. Az aláírás megszerzéséek lehetséges módjai: vagy ZH írásával vagy egy el re kihirdetett házi feladat beadásával A ZH-ról b vebbe: utolsó gyakorlato lesz legalább 50%-ot kell eléri A4-es lapra KÉZZEL írott "puska" és számológép haszálható pótlási lehet ség: vizsgaid szak. heté A házi feladatról b vebbe: A statisztikai számításokat R-be (esetleg Excelbe) kell elkészítei; az elemzéseket, értelmezéseket pedig Word-be (vagy Latexbe) kell értelmes, kerek magyar modatokba leíri. Védés: el re egyeztetett id potba kötetle, körülbelül 5 perces beszélgetés. Az értitett hallgatókkal az id potot az utolsó gyakorlat el tt/utá egyeztetjük. A házi feladat öálló muka legye! Ameyibe bebizoyosodik, hogy a házi feladatot em Te írtad, vagy agyo hasolít (modatok, bekezdések azoosak, ugyaazokat a rossz következtetéseket vood le, ugyaazokat számolod ki rosszul) egy másik hallgatótársadéra, akkor pótzh-t kell írod. R-hez ajálott szoftver: RStudio Ifók a gyakvezet r l Név Varga László Taszék Valószí ségelméleti és Statisztika Taszék (ELTE TTK) Szoba D 3-309 E-mail vargal4@cs.elte.hu Holap www.cs.elte.hu/~vargal4 Ajálott irodalom Solymosi Norbert: Bevezetés az R-yelv és köryezet haszálatába; elérési hely: http://cra.r-project.org/doc/cotrib/ Solymosi-Rjegyzet.pdf Móri-Szeidl-Zempléi: Matematikai statisztikai feladatok Pröhle-Zempléi: Többdimeziós statisztika számítógépes módszerei; elérési hely: http://www.cs.elte.hu/~zemplei/tobbdim_stat.pdf.) Legye X N(, 2 2 ). Számítsuk ki a P ( X + < 3) meyiséget! Becsüljük szimulációval is! 2.) Legyeek X,..., X függetle a.) N(0, 3 2 ) eloszlásúak, b.) Geo ( 0) eloszlásúak. Vizsgáljuk meg számítógépes szimulációval, hová tart a X + +X meyiség, ha miél agyobb -re számítjuk ki ezt az átlagot! 3.) Legye X N( 3, 4 2 ). Számítsuk ki a P (2X + 2 > 6) meyiséget! Becsüljük szimulációval is! 4.) Legyeek X i N(0, 5 2 ) (i =,..., 9) függetleek. Számítsuk ki a P (X < 9) meyiséget! Becsüljük szimulációval is! Deíció. z-kvatilis: q z = if{x : F (x) z}, és ameyibe F ivertálható, akkor q z = F (z)-re egyszer södik (0 < z < ) Fotos speciális kvatilisek: kvartilisek: Q := q 4 Q 2 = Me := q 2 Q 3 := q 3 4 alsó kvartilis mediá (középs mitaelem) fels kvartilis Deíció. Ferdeség (skewess): skew(x) = E(X EX)3 (DX) 3 Értelmezése: ha skew(x)=0, akkor az eloszlás szimmetrikus; skew(x)>0, akkor az eloszlás balra ferdült; skew(x)<0, akkor az eloszlás jobbra ferdült. Deíció. Csúcsosság (kurtosis): kurt(x) = E(X EX)4 (DX) 4 3 Értelmezése: ha kurt(x)=0, akkor az eloszlás csúcsossága a stadard ormáliséval megegyez ; kurt(x)<0, akkor az eloszlás laposabb a stadard ormálisál; kurt(x)>0, akkor az eloszlás csúcsosabb a stadard ormálisál.

Mita: X,..., X valószí ségi változó sorozat. (Jel. X = X,..., X ) A továbbiakba feltesszük, hogy függetleek és azoos eloszlásúak. Magyarosa rövidítve FAE mita, de gyakrabba haszálják az agol i.i.d. mita rövidítést (idepedet, idetically distributed). Az elméleti értékeket agy, a kokrét, realizált mitából számolt értékeket midig kis bet fogja jelöli, azaz mita eseté x,..., x. Statisztika: a mita valamely függvéye: T : X... Becslés: a mita eloszlásáak ismeretle paraméterét közelíti a mita segítségével. Megj.: Mide becslés statisztika. Néháy léyeges statisztika: Redezett mita: X... X em csökke sorredbe tesszük a mitaelemeket Terjedelem: R = X X (R=rage) X i Mitaátlag: X = Tapasztalati szórás: S = (X i X) 2 Értelmezése: az átlagtól való átlagos eltérés abszolút mértékegységbe Korrigált tapasztalati szórás: S = (X i X) 2 Szórási együttható: V = S X Értelmezése: az átlagtól való átlagos eltérés százalékba Megj.: relatív szórásak is hívják I(X i <x) Tapasztalati eloszlásfüggvéy: { F (x) = ha X i < x ahol I(X i < x) = karakterisztikus függvéy 0 ha X i x Tapasztalati z-kvatilis: Realizált mitából sokféleképpe számolható, iterpolációs módszer:.) Sorszám megállapítása: ( + )z = e + t (e:egészrész, t:törtrész) 2.) q z = x e + t(x e+ x e) Értelmezése: a mitaelemek z-ed része q z -él kisebb, ( z)-ed része q z -él agyobb Iterkvatilis terjedelem: IQR = Q 3 Q Tapasztalati módusz: a legtöbbször el forduló értékek közül a legkisebb. Értelmezése: a mita tipikus, leggyakrabba el forduló értéke. (X i X) 3 Tapasztalati ferdeség: S 3 (X i X) 4 Tapasztalati csúcsosság: S 4 Tétel. (Gliveko-Catelli) A tapasztalati eloszlásfüggvéy valószí séggel ( egyeletese tart) a valódi eloszlásfüggvéyhez, formálisa P lim F (x) F (x) = 0 =. sup x R Osztályközös gyakorisági sor készítése: jelölje a mita elemszámát. Az osztályközök meghatározása em egyértelm, általáos hüvelykujjszabálykét az osztályok k száma legye k = mi{k : 2 k > }. Ha azoos hosszúságú (h) osztályközöket akaruk létrehozi, akkor h = xmax x mi k. Boxplot ábra: (ez fekv, de lehet álló is) ahol a bet k a következ értékeket jeletik: A = max{x, Q, 5 IQR}; B = Q ; C = Me; D = Q 3 ; E = mi{x, Q 3 +, 5 IQR}; F : kies értékek, azokat tütetjük fel potokkét, amik A- vagy E- kívülre esek. Feladatok 5.) Egy osztályba a diákok magassága (cm): 3 2

80 63 500 57 65 65 74 9 72 65-68 86 a.) Nézzük át agy voalakba az adatokat, reálisak-e! Próbáljuk javítai az esetleges adathibákat! b.) Rajzold fel a tapasztalati eloszlásfüggvéyt! Meyi a tapasztalati eloszlásfüggvéy értéke a 80 helye? c.) Elemezd a diákok testmagasságát átlag; korrigált tapasztalati szórás; szórási együttható; kvartilisek; terjedelem; iterkvartilis terjedelem; tapasztalati ferdeség; tapasztalati csúcsosság segítségével! Értelmezd is az eredméyeket! d.) Készíts boxplot ábrát! e.) Készíts alkalmas osztályközös gyakorisági sort, majd abból hisztogramot! 6.) 203 yará az alábbi maximum h mérsékleteket mérték egy települése ( C): júius 25 25 28 29 26 23 2 22 25 25 25 25 29 3 3 32 33 30 28 25 26 24 22 2 25 29 33 3 32 33 július 34 32 32 35 36 32 3 32 35 35 32 29 28 25 27 27 28 30 28 27 29 32 32 34 35 3 33 3 30 30 30 augusztus 30 3 32 33 35 32 3 32 28 27 25 27 28 3 30 30 32 30 28 28 27 25 28 29 26 22 23 2 24 23 25 a.) Készíts számítógép segítségével tapasztalati eloszlásfüggvéyt! b.) Elemezd együtt a yári maximális h mérséklet értékeket átlag; korrigált tapasztalati szórás; szórási együttható; kvartilisek; terjedelem; iterkvartilis terjedelem; tapasztalati ferdeség; tapasztalati csúcsosság segítségével! Értelmezd is az eredméyeket! c.) Készíts boxplot ábrát! d.) Készíts alkalmas osztályközös gyakorisági sort, majd abból hisztogramot! Deíció. Torzítatla becslés: T(X) statisztika torzítatla becslése θ- ak, ha E θ T (X) = θ θ-ra. Deíció. Legyeek T (X) és T 2 (X) torzítatla becslései θ-ak. Ekkor azt modjuk, hogy T (X) hatásosabb T 2 (X)-él, ha Dθ 2(T (X)) Dθ 2(T 2(X)) mide θ Θ eseté. Deíció. Hatásos becslés. A T (X) tozítatla becslést hatásosak evezzük, ha mide torzítatla becslésél hatásosabb. Deíció. Kozisztecia: A T (X) becsléssorozat ( =, 2,...) kozisztes becslése a θ paraméterek, ha T (X) sztochasztikusa a θ paraméterhez tart θ eseté. Deíció. Likelihood függvéy: Legye X = (X,..., X ) i.i.d. mita L(θ, x) = f θ (x) = f θ (x i ), ha az eloszlás folytoos L(θ, x) = P θ (X = x) = P θ (X i = x i ), ha az eloszlás diszkrét. Deíció. Log-likelihood függvéy: l(θ, x) = log(l(θ, x)). Paraméterbecslési módszerek Maximum likelihood módszer (ML-módszer): Azt a paraméterértéket keressük, ahol a likelihood függvéy a legagyobb értéket veszi fel: max L(θ, x) θ Ameyibe a függvéy deriválható θ szerit, akkor a maximumot kereshetjük a szokásos módo, az els és második deriváltak segítségével, azoba a feladatukat jelet se megehezíti, hogy olya -szeres 3

szorzatot kellee deriváli, amelyikek mide tagjába ott va az a változó, ami szerit deriváluk kellee. Ezért likelihood függvéy helyett a log-likelihood függvéy maximumhelyét keressük. Ha θ dimeziós, akkor az els red feltétel: θ l(θ, x) = 0 ˆθ másodred feltétel: θ 2 l(θ, x) < 0 Ha θ p dimeziós, akkor θ = (θ,..., θ p ), az els red feltétel: θi l(θ, x) = 0 ˆθ i (i =,..., p) ˆθ = (ˆθ,..., ˆθ p ) másodred feltétel: H(θ,..., θ p ) = ( θi θj l(θ, x) ) i,j=,...,p Hessemátrix egatív deit a θ = ˆθ helye Mometum módszer: A mitából számítható tapasztalati mome- j tumokat (m i := xi j ) egyel vé tesszük az elméleti mometumokkal (M i := E θ X i ), az els t l kezdve, mégpedig ayit, ameyi paraméter va. Tehát p darab ismeretle paraméter eseté a következ p ismeretlees egyeletredszert oldjuk meg: M = m. M p = m p Megjegyzés: m = x Fisher-tétel: Ha θ ML-becslése ˆθ, akkor tetsz leges g függvéy eseté g(θ) ML-becslése g(ˆθ). Feladatok 7.) Legye X,..., X függetle, azoos abszolút folytoos eloszlású valószí ségi változók sorozata. Adjuk meg mi(x,..., X ), illetve max(x,..., X ) eloszlás- és s r ségfüggvéyét! A miimumál külö is vizsgáljuk meg azt az esetet, ha az X i változók expoeciális eloszlásúak! 8.) Adjuk torzítatla becslést a val.szám. vizsga bukási aráyára, ha 300- ból 00-a buktak meg. Mekkora a becslésük szórása? (Adjuk rá fels becslést.) 9.) Legye X,..., X i.i.d. mita ismeretle eloszlásból. a.) Torzítatla becslés-e a várható értékre ézve az átlag? b.) Torzítatla becslés-e a szóráségyzetre ézve a tapasztalati szóráségyzet? Ameyibe em az, hogya tudák torzítatlaá tei? 0.) -elem λ-paraméter expoeciális mita eseté adjuk torzítatla becslést e 3λ -ra és λ-ra! Vizsgáljuk meg szimulációval is!.) -elem λ-paraméter Poisso mita eseté adjuk torzítatla becslést e λ -ra és λ 2 -re! Vizsgáljuk meg szimulációval is! 2.) Adjuk meg torzítatla becslést a [0,θ] itervallumo egyeletes eloszlás paraméterére a.) a mitaátlag b.) a maximum segítségével. Melyik a hatásosabb a kett közül? Kozisztes-e a két becslés? Vizsgáljuk meg szimulációval is! 3.) Mutassuk meg, hogy expoeciális eloszlású mita eseté T (X) = mi(x,..., X ) statisztika torzítatla a várható értékre. Mekkora a szórása? Kozisztes a becslés? 4.) Legye X,..., X i.i.d. mita valamely véges szórású eloszlásból, és tekitsük a T(X)= a X +... + a X alakú lieáris becsléseket, ahol a,..., a R. Feltéve, hogy T(X) a várható érték torzítatla becslése, mely a,..., a számokra lesz miimális a D 2 (T (X))? 5.) Határozzuk meg az ismeretle paraméter(ek) ML becslését, ha a mita a.) Pascal (=Geom(p) ); b.) Bi(m, p), ahol m ismert, p paraméter; c.) E(a, b) eloszlású, ahol a < b, midkett paraméter; d.) Exp(λ); e.) Poi(λ). 6.) Tegyük fel, hogy a mita kétparaméteres eloszláscsaládból származik, a paraméterek a és b. { Ea,b X = m Ekkor mutassuk meg, hogy az E a,b X 2 egyeletredszer megoldása megegyezik az = m { 2 Ea,b X = m Da,b 2 X = egyeletredszer megoldásával. s2 7.) Becsüld a paramétert mometum-módszerrel az alábbi esetekbe: a.) Exp(λ); b.) Poi(λ); c.) E(a, b); d.) E( a, a). 4

Deíció. χ 2 -eloszlás: Az X valószí ségi változó szabadságfokú χ 2 - eloszlást követ (jel.: X χ 2 ), ha X = U 2 +... + U 2, ahol U i N(0, ) mide i-re és függetleek egymástól. Deíció. t-eloszlás: Az X valószí ségi változó szabadságfokú Studet-féle t-eloszlást követ (jel.: X t ), ha X = Z Y, ahol Z N(0, ) és Y χ 2 függetleek egymástól. Mostatól α egy 0-hoz közeli pozitív szám lesz (például 0.05 = 5%), és vezessük be a következ jelöléseket: u α : N(0, ) eloszlás ( α)-kvatilise, azaz u α = Φ ( α) z α := u α (sok köyvbe ezt haszálják) t,α : szabadságfokú t-eloszlás ( α)-kvatilise χ 2,α: szabadságfokú χ 2 -eloszlás α-kvatilise Hipotézis valami állítás, amiek igazságát vizsgáli szereték Paramétertér: Θ = Θ 0 Θ "valóság" Mitatér: X = X e X k "látszat" - MINTÁBÓL X k : kritikus tartomáy - azo X meggyelések halmaza, amikre elutasítjuk a ullhipotézist X e : elfogadási tartomáy - azo X meggyelések halmaza, amikre elfogadjuk a ullhipotézist Hipotézisvizsgálati feladat: H 0 : ϑ Θ 0 ullhipotézis H : ϑ Θ ellehipotézis Tehát ha X X e, akkor elfogadjuk H 0 -t; ha X X k, akkor pedig elutasítjuk H 0 -t. Ameyibe a Θ 0 halmaz egyelem, akkor azt modjuk, hogy H 0 egyszer. H -re ugyaígy. Az X mitatér felosztását általába egy statisztika (eve: próbastatisztika) segítségével végezzük el: legye T: X R, X k = {x X : T(x) > c} c eve: kritikus érték X e = {x X : T(x) c} dötés H 0 -t "valóság" elfogadjuk (X e ) elutasítjuk (X k ) H 0 teljesül (Θ 0 ) helyes dötés els fajú hiba H 0 em teljesül (Θ ) másodfajú hiba helyes dötés P(els fajú hiba)=α(ϑ)=p ϑ (X k ), ahol ϑ Θ 0 P(másodfajú hiba)=β(ϑ)=p ϑ (X e ), ahol ϑ Θ Er függvéy: ψ: Θ R, ψ(ϑ) = P ϑ (X k ) Terjedelem: α = sup {α(ϑ): ϑ Θ 0 } p-érték: az az α terjedelem, ami eseté a próbastatisztika értéke egyel a kritikus értékkel : T(x)= c α. A p-érték a legkisebb terjedelem, amire még elutasítjuk a H 0 -t. Ha egy próbát számítógép segítségével végzük el, redszerit a p-érték révé tuduk dötei: ha (p-érték)< α, akkor elvetjük H 0 -t. Néháy kokrét próba az α végig a próba terjedelmét jelöli, ami el re adott.) Egymitás próbák a.) Egymitás u-próba X,..., X N(m, σ 2 ), ahol σ ismert, m paraméter a.) H 0 : m = m 0 b.) H 0 : m = m 0 c.) H 0 : m = m 0 H : m m 0 H : m > m 0 H : m < m 0 A próbastatisztika: T(X)=u = X m 0 σ A kritikus tartomáyok: a.) X k = {x : u > u α/2 } b.) X k = {x : u > u α } c.) X k = {x : u < u α } H 0 eseté N(0, ) b.) Egymitás t-próba X,..., X N(m, σ 2 ), ahol σ, m paraméter a.) H 0 : m = m 0 b.) H 0 : m = m 0 c.) H 0 : m = m 0 H : m m 0 H : m > m 0 H : m < m 0 A próbastatisztika: T(X)=t = X m 0 s A kritikus tartomáyok: a.) X k = {x : t > t,α/2 } b.) X k = {x : t > t,α } c.) X k = {x : t < t,α } 2.) Kétmitás próbák X,..., X N(m, σ 2 ) Y,..., Y m N(m 2, σ 2 2 ) H 0 eseté t 5

Az elvégzed próbák H 0 : m = m 2 ullhipotézis eseté: a két mita a két mita függetle em függetle σ és σ 2 ismert b.) kétmitás u-próba egymitás u-próba a külöbségekre el zetes F-próba σ és σ 2 ismeretle σ = σ 2 σ σ 2 egymitás t-próba c.) kétmitás t-próba d.) Welch-próba a külöbségekre a.) F-próba m, m 2, σ, σ 2 paraméterek H 0 : σ = σ 2 és H : ami a szövegköryezetbe értelmes (s )2 H 0 eseté F (s A próbastatisztika: F =,m ha s 2 )2 > s 2 (s 2 )2 F m, ha s 2 > s (s )2 H 0 eseté b.) kétmitás u-próba m, m 2 paraméterek, σ, σ 2 ismert H 0 : m = m 2 és H : ami a szövegköryezetbe értelmes A próbastatisztika: u = X Y σ 2 + σ2 2 m H 0 eseté N(0,) c.) kétmitás t-próba m, m 2, σ = σ 2 paraméterek H 0 : m = m 2 és H : ami a szövegköryezetbe értelmes A próbastatisztika: t = m X Y +m ( )(s )2 +(m )(s 2 )2 +m 2 d.) Welch-próba m, m 2, σ σ 2 paraméterek H 0 : m = m 2 és H : ami a szövegköryezetbe értelmes A próbastatisztika: t = X Y (s )2 + (s 2 )2 m f = c = c2 + ( c)2 m (s )2, ha s (s )2 + (s 2 )2 > s 2 m H 0 eseté t f, ahol H 0 eseté t +m 2 Feladatok 8.) Valaki azt állítja, hogy a klíma változik, és ezt azzal véli bizoyítottak, hogy az elmúlt 0 évbe 2-szer is volt jéges, pedig korábba az egyes évekre a jéges valószí sége a hivatalos adatok alapjá csupá p=0. volt. Írjuk fel a hipotéziseket, a próbát és állapítsuk meg az els fajú hiba valószí ségét, valamit az er függvéyt a p=0.2 potba! 9.) Az alábbi mita 4 év október 8-á Budapeste mért api középh mérséklet adatait tartalmazza. Elle rizzük a H 0 : m =5 hipotézist α =0.05 els fajú hibavalószí ség mellett értelmes alteratív hipotézissel szembe. Középh m. (C fok) adatok: 4,8 2,2 6,8, a.) A korábbi tapasztalatok alapjá tekitsük az értékek szórását 2-ek. Adjuk meg a p-értéket is. b.) Ne haszáljuk a szórásra voatkozóa el zetes iformációt. 20.) Tegyük fel, hogy az emberi magasság ormális eloszlású. a.) Végezzük statisztikai próbát arra voatkozóa, hogy a gyakorlato lév láyok átlagmagassága 70 cm! b.) Végezzük statisztikai próbát arra voatkozóa, hogy a gyakorlato lév úk átlagmagassága 80 cm! 2.) A Deziformatikai Kar III. évfolyamá 0-e írtak statisztika zárthelyit. 2 feladatsor volt, midkett be 30 potot lehetett eléri. Tegyük fel, hogy az elért potszámok ormális eloszlásúak. A potszámokat tartalmazza az alábbi táblázat:. feladatsor 2 8 4 0 2. feladatsor 5 4 9 6 a.) Vajo az els feladatsor ehezebb volt? b.) Meyibe változik a helyzet, ha em 0 diákról, haem csak 5-r l va szó, és a 2. feladatsor a pótzh eredméye? 22.) Tegyük fel, hogy az emberi magasság ormális eloszlású. Végezzük statisztikai próbát arra voatkozóa, hogy a gyakorlato lév úk magasabbake a láyokál! 23.) Az alábbi két mita 0 egyforma képesség ek feltételezett sportoló súlylökésbe elért eredméyeit tartalmazza. A sportolók két ötf s csoportba készültek az edz táborba. Edzéstervük ugyaaz volt, de az els csoportba készül k mide reggel fejekét 0 tojást és 25 túró rudit ettek meg. A második csoportba készül kek reggel és este - kg szaloát és - kg madártejet kellett megei. 2 hét felkészülés utá értékelték az eredméyeket. Tételezzük fel, hogy ormális eloszlásból származak a miták és a terjedelem 5%. 6

. csoport 5,8 5,2 6,3 7, 6, 2. csoport 9,0 2, 7,2 4,7 2,0 a.) Melyik diéta volt jobb, ha a dobások szórását 2-ek tekitjük? b.) Állíthatjuk-e, hogy a második csoportba agyobb változékoyságot mutat a sportolók teljesítméye? c.) Ha em ismerjük a szórást, akkor tekithetjük-e valamelyik diétát jobbak? χ 2 -próbák a.) Diszkrét illeszkedésvizsgálat Feladat: adott egy X = (X,..., X ) elem mita, és azt akarjuk eldötei, hogy a mita egy általuk "remélt" eloszlásból származik-e. Diszkrét illeszkedésvizsgálatál feltesszük, hogy a mitaelemek r külöböz értéket vehetek fel: P(X i = x j ) = p j j =,..., r. Jelöljük N j -vel a gyakoriságokat, azaz azt, hogy az elem mitába háy darab x j szerepel. Osztályok 2... r Összese Valószí ségek p p 2... p r Gyakoriságok N N 2... N r H 0 : a valószí ségek: p=(p,..., p r ) H : em ezek a valószí ségek A próbastatisztika: T = r H 0 eseté eloszlásba, ha (N i p i ) 2 p i χ 2 r A kritikus tartomáy: X k = {x : T (x) > χ 2 r, α } Becsléses illeszkedésvizsgálat: csak ayit "sejtük", hogy a mita valamilye eloszlású, viszot a paramétereir l ics sejtésük. Ilyekor ameyibe ML-módszerrel becsüljük meg az s darab ismeretle paramétert, akkor H a próbastatisztika: T 0 eseté χ 2 r s eloszlásba, ha. Illeszkedésvizsgálat "szemmel": Q-Q plot és P-P plot Jelölje F az illesztett eloszlás eloszlásfüggvéyét, x k pedig a k. redezett mitaelemet. Q-Q plot: az illesztett eloszlás kvatiliseit vetjük össze ( a tapasztalati ( ) ) kvatilisekkel, azaz a következ potokat ábrázoljuk: F k +, x k, ahol k =,...,. P-P plot: az illesztett eloszlás valószí ségeit vetjük össze ( a tapasztalati valószí ségekkel, azaz a következ potokat ábrázoljuk: k +, F (x k ), ) ahol k =,...,. Midkét ábráál be szokták húzi a 45 fokos egyeest és miél jobba rásimulak a potok az egyeesre, aál jobbak tekithet az illeszkedés. 24.) Redelkezésükre áll a következ mita: 0,55; 0,59; 0,34; 0,69; 0,95; 0,34; 0,53; 0,54; 0,03; 0,; 0,5; 0,67; 0,48; 0,09; 0,55; 0,02; 0,37; 0,76; 0,83; 0,92. A megoldás sorá alkalmazzuk diszkretizálást, azaz képezzük alkalmas gyakorisági sort az adatokból. a.) Elfogadhatjuk-e azt a hipotézist, hogy a mita (0,2) itervallumo egyeletes eloszlású? Vizsgáljuk meg Q-Q plot-tal is! b.) Elfogadhatjuk-e azt a hipotézist, hogy a mita egyeletes eloszlású? Vizsgáljuk meg Q-Q plot-tal is! c.) Elfogadhatjuk-e azt a hipotézist, hogy a mita expoeciális eloszlású? Vizsgáljuk meg Q-Q plot-tal is! 25.) Az Iformatikai Kar III. évfolyamá 300-a taulak. Megszámolták, hogy a legutóbbi vizsgaid szakba háyszor buktak az egyes hallgatók. Az eredméyeket tartalmazza az alábbi táblázat. Bukások száma 0 2 3 4 Hallgatók száma 80 3 77 27 3 a.) Elfogadhatjuk-e azt a hipotézist, hogy egy hallgató bukásszáma Bi(4; 0,25) eloszlású? b.) és azt, hogy Bi(4;p) eloszlású? 26.) A "Reggeli ital" tejgyárba mide szállítás el tt megvizsgálják a 25 dkgos túrókba található hajszálak számát. Több éves tapasztalat szerit egy csomagba ics 2 hajszálál több. A H 0 hipotézis (a mi ség elfogadható) szerit egy csomagba /2 valószí séggel ics hajszál, /3 valószí séggel hajszál va és /6 valószí séggel 2 hajszál esett bele. A túró mi ségét 20. április 7-é 00 csomag túró tételes elle rzésével tesztelték. 40 csomagba em volt hajszál, 40-be egy hajszál volt és 20-ba 2 hajszál. Elfogadjuk-e a megfelel ség hipotézisét? 27.) CASCO biztosítással redelkez k éves kárszámát vizsgáltuk. 4000 vezet adatait az alábbi táblázat tartalmazza. Vajo elfogadható-e %-os terjedelem mellett, hogy a kárszám Poisso eloszlású? Kárszám 0 2 3 4 5 >5 Vezet k száma 369 232 68 5 3 0 b.) Függetleségvizsgálat Feladat: va egy mita, két szempot szerit csoportosítva. Azt kell eldö- 7

tei, hogy a két szempot függetle-e egymástól. p i,j =P(egy meggyelés az (i,j) osztályba kerül) N i,j =eyi meggyelés kerül az (i,j) osztályba A mitavétel eredméye: 2. szempot... j... s Összese N... N j... N s N...... szempot i N i... N ij... N is N i..... r N r... N rj... N rs N r Összese N... N j... N s N i = s N j = r N i,j j= N i,j j= H 0 : a szempotok függetleek, azaz p i,j = p i p j i, j-re H : em azok ( ) r s Ni,j A próbastatisztika: T = 2 H N i N j 0 eseté χ 2 (r )(s ) eloszlásba, ha A kritikus tartomáy: X k = {x : T (x) > χ 2 (r )(s ), α } 28.) Az alábbi kotigecia-táblázat mutatja, hogy 00 évbe a csapadék meyisége és az átlagh mérséklet hogya alakult. Csapadék Kevés Átlagos Sok H mérséklet H vös 5 0 5 Átlagos 0 0 20 Meleg 5 20 5 (A cellákba az egyes esetek gyakoriságai találhatóak.) Tekithet -e a csapadékmeyiség és a h mérséklet függetleek? Feladat: Y val. változót szereték közelítei X val. változó lieáris függvéye segítségével: E[Y (ax + b)] 2 mi a,b Megoldása: a opt = Cov(X,Y ) D 2 (X) b opt = EY a opt EX Feladat (lieáris regresszió): Adottak (x, y ),..., (x, y ) potok, ezekre szereték egyeest illesztei (eve: regressziós egyees) legkisebb égyzetek módszerével. A modell: Y i = ax i + b + ε i, ahol Eε i = 0 és D 2 ε i = σ 2 < (i =,..., ) Megoldás: â = (xi x)(y i y) (xi x) 2, ˆb = y âx Reziduumok: ˆε i = y i âx i ˆb (,..., ) Reziduális égyzetösszeg: RNÖ= ˆε 2 i = (y i y) 2 (xi x)(y i y) (xi x) 2 ˆσ 2 = RNÖ 2 Tapasztalati korrelációs együttható: R = (xi x)(y i y) (xi x) 2 (y. Eek égy- i y) 2 zetét, R 2 -et determiációs együtthatóak hívjuk, és ezzel mérjük a modell jóságát. Az R 2 mutatja meg, hogy százalékba a modell az Y változékoyságából meyit magyaráz meg. Értéke 0 és között lehet, ha 0-hoz közeli, akkor a modell gyegé teljesít, ha -hez, akkor jól. 29.) Legyeek adottak a következ (x,y) párok: x i 0 6 5 3 y i 4 3 0 2 a.) Határozzuk meg és ábrázoljuk is az ax + b alakú regessziós egyeest! b.) Számoljuk ki a reziduálisokat és becsüljük meg a hiba-szóráségyzetet! c.) Meyire jó a modell? d.) Adjuk el rejelzést x=0-re a regressziós egyees alapjá! e.) Oldjuk meg a feladatot R segítségével! 30.) A Statisztika II. vizsga utá kiválasztottuk 8 hallgatót, akikt l megkérdeztük, meyi órát készültek a vizsgára és háy potot szereztek a tatárgy el feltételéek számító Statisztika I. tatárgyból a vizsgá: Statisztika II. potszám 49 55 56 62 65 70 78 92 Háy órát készült a vizsgára (ó) 5 6 4 3 2 9 2 24 Statisztika I. potszám 60 50 66 53 67 76 88 87 a.) Vizsgáljuk meg lieáris regresszióval a taulási id hatását a Statisztika II. potszámra! Ábrázoljuk a regressziós egyeest! b.) Illesszük égyzetes regressziós függvéyt a Statisztika II. potszámra, ha a magyarázó változó a taulási id! Ábrázoljuk a regressziós egyeest! c.) Illesszük lieáris regressziót a Statisztika II. potszámára, ha a magyarázó változók a taulási id és a Statisztika I. potszám! d.) Vessük össze a modelleket! 8