Leíró és matematikai statisztika gyakorlat 2018/2019 II. félév

Hasonló dokumentumok
Matematikai statisztika gyakorlat 2018/2019 II. félév

Matematikai statisztika

Statisztika 1. zárthelyi dolgozat március 18.

Segédanyag a Leíró és matematikai statisztika tantárgyhoz március 28.

Statisztika 1. zárthelyi dolgozat március 21.

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Mo= argmax f(x), ha X abszolút folytonos; Mo= argmax P (X = x i ), ha X diszkrét.

Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X = 1) = p Ind(p) P(X = 0) = 1 p. Leíró és matematikai statisztika

Statisztika. Földtudomány szak, geológus szakirány, 2015/2016. tanév tavaszi

Statisztika gyakorlat Geológus szakirány

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

BIOMATEMATIKA ELŐADÁS

Matematika B4 I. gyakorlat

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.

Segédanyag a Leíró és matematikai statisztika tantárgyhoz március 1.

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

6. feladatsor. Statisztika december 6. és 8.

Matematikai statisztika gyakorlat Programtervez informatikus alapszak, A szakirány 2018/2019 tavaszi félév Megoldások, végeredmények

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

A matematikai statisztika elemei

Statisztika (jegyzet)

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk;

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

æ MATEMATIKAI STATISZTIKA Dr. Bolla Marianna, Matematika Intézet, Sztochasztika Tanszék

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

kismintás esetekben vagy olyanokban, melyeknél a tanulóalgoritmust tesztadatokon szeretnénk

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

Valószín ségszámítás és statisztika gyakorlat Programtervez informatikus szak, esti képzés

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

2. Hatványsorok. A végtelen soroknál tanultuk, hogy az. végtelen sort adja: 1 + x + x x n +...

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

Statisztikai hipotézisvizsgálatok

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

V. Deriválható függvények

ezek alapján kívánunk dönteni. Ez formálisan azt jelenti, hogy ellenőrizni akarjuk,

Komputer statisztika

Statisztika október 27.

Idősorok elemzése [leíró statisztikai eszközök] I

STATISZTIKA I. x ÁR. x ÁR. x ÁR. x ÁR. Számosállat. Egységhozam. Termelési érték, árbevétel. Az ár. Hogyan lehet ezeket összehasonlítani?

Tudjuk, hogy az optimumot az ún. regressziós görbe szolgáltatja, melynek egyenlete:

Áringadozások elıadás Kvantitatív pénzügyek szakirány 2012/13 2. félév

1. A radioaktivitás statisztikus jellege

A tárgy címe: ANALÍZIS 1 A-B-C (2+2). 1. gyakorlat

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Dr. Karácsony Zsolt. Miskolci Egyetem november

Matematikai statisztika

Eötvös Loránd Tudományegyetem Informatikai Kar. Analízis 1. Írásbeli beugró kérdések. Készítette: Szántó Ádám Tavaszi félév

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztika elméleti összefoglaló

Nemparaméteres próbák

véletlen : statisztikai törvényeknek engedelmeskedik (Mi az ami közös a népszavazásban, a betegségek gyógyulásában és a fiz. kém. laborban?

? közgazdasági statisztika

ALGEBRA. egyenlet megoldásait, ha tudjuk, hogy egész számok, továbbá p + q = 198.

Feladatok és megoldások a 11. heti gyakorlathoz

1 k < n(1 + log n) C 1n log n, d n. (1 1 r k + 1 ) = 1. = 0 és lim. lim n. f(n) < C 3

18. Valószín ségszámítás. (Valószín ségeloszlások, függetlenség. Valószín ségi változók várható

egyetemi jegyzet Meskó Balázs

10.M ALGEBRA < <

(d) x 6 3x 2 2 = 0, (e) x + x 2 = 1 x, (f) 2x x 1 = 8, 2(x 1) a 1

3.1. A Poisson-eloszlás

VII. A határozatlan esetek kiküszöbölése

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

A statisztika részei. Példa:

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

1 n. 8abc (a + b) (b + c) (a + c) 8 27 (a + b + c)3. (1 a) 5 (1 + a)(1 + 2a) n + 1

Statisztika Elıadások letölthetık a címrıl

Debreceni Egyetem, Közgazdaság- és Gazdaságtudományi Kar. Feladatok a Gazdasági matematika I. tárgy gyakorlataihoz. Halmazelmélet

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Bevezetés a hipotézisvizsgálatokba

Kalkulus I. Első zárthelyi dolgozat szeptember 16. MINTA. és q = k 2. k 2. = k 1l 2 k 2 l 1. l 1 l n 6n + 8

Nevezetes sorozat-határértékek

Valószín ségszámítás és statisztika

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

SZÁMELMÉLET. Vasile Berinde, Filippo Spagnolo

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

A G miatt (3tagra) Az egyenlőtlenségek két végét továbbvizsgálva, ha mindkét oldalt hatványozzuk:

Kidolgozott feladatok a nemparaméteres statisztika témaköréből

[Biomatematika 2] Orvosi biometria

FELADATOK A KALKULUS C. TÁRGYHOZ

Debreceni Egyetem. Kalkulus példatár. Gselmann Eszter

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Matematika I. 9. előadás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

A Statisztika alapjai

18. Differenciálszámítás

Átírás:

Leíró és matematikai statisztika gyakorlat 08/09 II. félév Táblázatok Viszoyszámok: V = A, ahol A: a viszoyítás tárgya amit viszoyítuk; B B: a viszoyítás alapja amihez viszoyítuk Megoszlási: a sokaság egy részéek a sokaság egészéhez való viszoyítása Koordiációs: a sokaság egy részéek a sokaság egy másik részéhez való viszoyítása Diamikus: két időpot vagy időszak adatáak háyadosa Itezitási: külöböző fajta adatok viszoyítása egymáshoz; gyakra a mértékegységük is eltér Adott sokaság és aak m része eseté az összetett viszoyszám: m m m A i B i V i A i V = m = m = m B i Feladatok R: B i } {{ } súlyozott számtai átlag A i V i súlyozott harmoikus átlag. A 0. évbe törtéő épszámlálás alapjá a 0-4 év közötti épesség emek szeriti megoszlása 0-be a következő volt: Nem Népesség száma fő Férfi 37 039 Nő 30 96 Összese 68 35 Az adatok a Közpoti Statisztikai Hivatal holapjáról lettek letöltve: http : //www.ksh.hu/epszamlalas/tablak_teruleti_00. a Adja meg a táblázat adataiból számítható megoszlási viszoyszámokat! b Adja meg a táblázat adataiból számítható koordiációs viszoyszámokat! c A 06-os Mikrocezus szerit Magyarország épessége 9 803 837 fő. Számítsa ki a épsűrűséget! Ez milye viszoyszám?. Az euró eladási árfolyamáak alakulása az K&H Bakál a következő volt: Időpot Árfolyam Ft/euró 08. február 8. 38,33 09. február 8. 37,80 Az adatok a http://www.apiarfolyam.hu/ oldalról lettek letöltve. Adjo meg a táblázat adataiból számítható diamikus viszoyszámot és értelmezze a kapott értéket! 3. Egy termelő vállalatál a fizikai mukát végzők összese 8000 db alkatrészt állítottak elő, amiből a ők teljesítméye 8500 db volt. A vállalatak 950 férfi fizikai dolgozója va. A őkél a termelékeység, azaz az egy főre jutó termelt meyiség 7 db/fő. a Milye viszoyszám található a feladat szövegébe és mi eek a kiszámítási módja? b Szerkessze statisztikai táblát a megadott adatokból és töltse ki a hiáyzó adatokat! 4. Néháy iformáció az ELTE matematika alapszakjára 06-ba jeletkezőkről: az állami fiaszírozásos képzésre 348-a jeletkeztek, 36,494%-uk első helye jeletkezett, végül 0-et vettek fel, míg a költségtérítéses képzési formára jeletkezők 0,7%-át, 9 főt vették fel. Összese 4 ember jelölte be az ELTE matematika szakát első helye. a Milye viszoyszámok találhatók a feladat szövegébe és mi eek a kiszámítási módja? b Szerkessze statisztikai táblát a megadott adatokból és töltse ki a hiáyzó adatokat!

5. Egy vállalat égy részleggel redelkezik, az ott dolgozók bruttó fizetéséről az alábbi adatok állak redelkezésükre: Részleg Átlagkereset e Ft/fő Dolgozók létszáma fő Raktár 00 0 Összeszerelő 50 6 Műhely 50 8 Irodaház 300 0 Összese...... a Milye viszoyszám található a táblázatba és mi eek a kiszámítási módja? b Számítsa ki a hiáyzó potozott értékeket! 6. Egy szálloda 06-os vedégforgalmáról az alábbiakat ismerjük: Származási Vedég- Egy vedég- Egy vedégre ország éjszakák éjszakára jutó jutó vedégszerit száma szállás díja éjszakák száma a vedég éj Ft/éj éj/fő Belföldi 5000 6000 4 Külföldi 4000 000 Összese 9000...... a Határozza meg a teljes hotelre voatkozóa az egy vedégéjszakára jutó szállás díjat, és b az egy vedégre jutó vedégéjszakák számát! 7. Magyarország épességéről az alábbiakat ismerjük: Település jellege Népesség megoszlása Népesség változása 0-be % 990-ről 0-re % Budapest 7,4-4,4 Többi város 5,9 -,4 Községek 30,7-0,8 Összese 00,0... a 990 és 0 között évete átlagosa meyivel változott a budapesti lakosság %-ba kifejezve? b Háy százalékkal változott a épesség száma 990-ről 0-re? c Melyik települése élők részaráya csökket?

Idexszámítás Érték-, ár- és volumeidexek: Idex vagy idexszám: közvetleül em összesíthető, de gazdaságilag összetartozó adatok átlagos változását mutató összetett viszoyszám. Tegyük fel, hogy m külöböző terméket értékesítük két külöböző időszakba, és az értékesítés árbevételét szereték elemezi. Jelölések: q 0,j : a j. termékből eladott meyiség a bázisidőszakba q,j : a j. termékből eladott meyiség a tárgyidőszakba p 0,j : a j. termék egységára a bázisidőszakba p,j : a j. termék egységára a tárgyidőszakba v 0,j : a j. termék értékesítéséből származó árbevétel a bázisidőszakba, számítása: v 0,j = q 0,j p 0,j v,j : a j. termék értékesítéséből származó árbevétel a tárgyidőszakba, számítása: v,j = q,j p,j Egyedi idexek: mostatól a j idexek elhagyva Egyedi volumeidexek: i q = q q 0 i q,j = q,j q 0,j Egyedi áridexek: i p = p p 0 i p,j = p,j p 0,j Egyedi értékidexek: i v = v v 0 = qp q 0p 0 = i p i q i v,j = v,j v 0,j = q,j p,j q 0,j p 0,j Összetett idexek: Bázisidőszaki Tárgyidőszaki Idex fajtája súlyozású vagy súlyozású vagy Fisher-féle Laspeyres-féle Paasche-féle Áridex: Ip 0 q0 p = I q p p = Ip F = Ip q0 p 0 q p Ip 0 Volumeidex: I 0 q = Értékidex: I v = q p 0 I q p q = Iq F = Iq q0 p 0 q0 p 0 Iq v q p = = Iq 0 Ip = Iq Ip 0 v0 q0 p 0 Az idexek képleteibe lévő osztások helyett külöbségeket is lehet képezi, ekkor az I helyett K-t íruk, például K 0 p = q 0 p q0 p 0. Ezek közti összefüggések: K v = K 0 q + K p = K q + K 0 p. Feladatok:. Egy műszaki cikkeket forgalmazó áruház okosóra forgalma a 06/07-es évek decemberébe a következő volt: Eladott meyiség db Ár Ft/db Eladás értéke e Ft Márka 06. 07. 06. 07. 06. 07. q 0 q p 0 p p 0 q 0 p q p 0 q p q 0 Samsug xxx 43 39 43900 49900 887,7 946, 7, 45,7 Huawei xxx 3 9 47900 5900 53,8 534, 389, 69,8 Nokia xxx 40 37 55900 6900 36,0 37,3 068,3 56,0 Soy xxx 6 59900 74900 57,9 98,4 958,4 57,9 Összese............ 694,4 7005,9 67,9 797,4 a Jellemezze az értékesítésbe bekövetkezett meyiségi, ár- és értékváltozásokat egyedi és összetett idexekkel! Értelmezze szövegese az egyes idexeket! b Számítsa ki a meyiségváltozásból ill. árváltozásból adódó bevételmódosulást! 3

Feladatok R:. Egy kereskedelmi egység három fajta paprikás chips-et árul, a következő táblázat a 04/05-ös értékesítésről tartalmaz adatokat: 04. 05. Márka értékesített Egységár értékesített Egységár meyiség db Ft/db meyiség db Ft/db Chio 5 300 30 30 Lays 0 50 30 40 Cheetos 0 00 0 0 Összese............ a Jellemezze az értékesítésbe bekövetkezett meyiségi, ár- és értékváltozásokat egyedi és összetett idexekkel! Értelmezze szövegese az egyes idexeket! b Számítsa ki az árváltozás miatti többletbevételt!. Egy vállalat termelési értékéek árbevételéek a 35,4%-át 04-be az I. számú üzem, a többit pedig a II. számú üzem adta. Az I. számú üzem termékeiek egységára 04-ről 05-re átlagosa 5%-kal, a II. számú üzemé pedig átlagosa 3%-kal csökket. Számítsuk ki a vállalati termelés volumeéek változását, ha ismert, hogy a vállalati termelési érték 3%-kal emelkedett! Értelmezze szövegese a kapott volumeváltozást! 3. Egy kisvállalkozás kétféle terméket gyárt. Termelési adatai: Termék Termelési érték 05-be M Ft Volumeváltozás fajtája folyó áro 04-es áro 04=00% A 50 60 0 B 60 80 0 Összese......... a Határozza meg a termelés értékidexét! b Határozza meg midkét súlyozással az ár- és volumeidexeket! c Számítsa ki az volumeváltozás miatti többletbevételt 04-es árako! 4. Lujza éi kávézójába 3 féle kávét szolgál fel, a családi köyvelésből az alábbi adatok ismertek: Kávéfajta A forgalom értéke Az árak A forgalom értékéek 05-be e Ft alakulása, 05/00 % Cappuccio 000 30 00 Cafe Latte 500 0 80 Espresso 000 0 50 a Számítso érték-, ár- és volumeidexet a kávézó forgalmára voatkozóa! b A forgalom értékéek övekedéséből háy forit volt az ár- és a volumeváltozás hatása? 4

3. Osztályközös gyakorisági sorok Osztályközök Osztályközepek Gyakoriság x,a x,f x f x,a x,f x f......... x k,a x k,f x k f k k f i = i-edik osztályköz: x i = x i,a + x i,f Statisztikák: k f i x i Mitaátlag: x = k f i x i x Tapasztalati szórás: s = k f i x i x Korrigált tapasztalati szórás: s = Tapasztalati módusz: x mo,a + d a h mo, ahol a móduszt tartalmazó osztályköz az, d a + d f amelyikbe az egységyi osztályközhosszúságra jutó gyakoriság a legagyobb x mo,a móduszt tartalmazó osztályköz alsó értéke h mo móduszt tartalmazó osztályköz hossza d a móduszt tartalmazó míusz azt megelőző osztályköz gyakorisága d f móduszt tartalmazó míusz azt követő osztályköz gyakorisága Külöböző hosszúságú osztályközös gyakorisági sor eseté az egységyi osztályközhosszúságra jutó gyakoriságok alapjá számoljuk d a -t és d f -et. Tapasztalati mediá: x i,a + f i h i, ahol f a kumulált gyakoriság és f i a mediá abba az i. osztályközbe va, amelyikre f i és f i x i,a mediát tartalmazó osztályköz alsó értéke h i mediát tartalmazó osztályköz hossza f i mediát megelőző osztályköz kumulált gyakorisága f i mediát tartalmazó osztályköz gyakorisága Tapasztalati z-kvatilis: x i,a + z f i h i, ahol Feladatok R: f i a z-kvatilis abba az i. osztályközbe va, amelyikre f i z és f i z x i,a, h i, f i, f i hasolá defiiálva mit a mediáál. Lakások vízfogyasztásáak adatai: Vízfogyasztás m 3 Lakások száma -30 6 30-40 9 40-50 4 50-60 6 60-8 Számolja ki a lakások vízfogyasztására voatkozó statisztikákat: átlag, módusz, mediá, korrigált szórás és 0,4-es kvatilis! Értelemezze a kapott eredméyeket! 5

Feladatok:. Az élveszületések száma Aprajafalvá 08-ba a csecsemők születéskori súlya szerit: Súly g Élveszületések száma 0-999 000-499 4 500-999 7 3000-3499 6 3500-5000 9 a Számítsa ki papíro, R élkül és értelmezze szövegese az alábbi statisztikákat: mitaátlag, 0,4-es kvatilis b Mit számol az alábbi R program? Értelmezze szövegese a kapott eredméyt! > adatok = arraydim = c5, > colamesadatok = c xi, fi > rowamesadatok = c 0 999, 000 499, 500 999, 3000 3499, 3500 5000 > adatok[, ] = c000, 50, 750, 350, 450 > adatok[, ] = c, 4, 7, 6, 9 > = sumadatok[, ] > sqrtsumadatok[, ] adatok[, ] sumadatok[, ] adatok[, ]/ / [] 74.569 3. A kocetráció elemzése Ha a meyiségi ismérv: diszkrét és viszoylag kevés ismérvérték va, akkor mide ismérvértéket felsoroluk, folytoos vagy sok ismérvérték va, akkor osztályközös gyakorisági sort készítük. : a sokaság elemszáma f i : gyakoriság az i. osztályközbe f i : kumulált gyakoriság az i. osztályközbe, azaz f i = g i : relatív gyakoriság az i. osztályközbe, azaz g i = g i : kumulált relatív gyakoriság az i. osztályközbe s i : az i. osztályköz értékösszege: z i = x i f i s i az i. osztályköz kumulált értékösszege z i : az i. osztályköz relatív értékösszege: z i = si z i az i. osztályköz kumulált relatív értékösszege s i i i f i k= fi f i i Kocetráció: a sokasághoz tartozó teljes értékösszeg jeletős része a sokaság kevés egységére összpotosul. k k Gii-együttható: G = f i f j x i x j. j= Lorez-görbe: a kocetráció mértékét szemléltető ábra. A vízszites tegelye a g i kumulált relatív gyakoriságok, a függőleges tegelye a z i kumulált relatív értékösszegek szerepelek, 0-tól 00%-ig. Behúzzuk a 45 fokos egyeest. Végül megrajzoljuk a 0, 0, g, z, g, z,..., g k, z k,, potok összekötésével kapott töröttvoalat. Kocetrációs területek hívjuk a töröttvoal és az átló által közbezárt területet. Erős a kocetráció, ha a töröttvoal közel va a égyzet oldalaihoz. Gyege a kocetráció, ha a töröttvoal közel va az átlóhoz. Kocetrációs együttható: L = G x Kocetrációs terület -szerese. Értéke 0 és közötti; miél agyobb, aál erősebb a kocetráció. Herfidahl-idex: HI = k zi Értéke k és közötti; miél agyobb, aál erősebb a kocetráció. 6

Feladatok R:. Az egyetem büféjébe egy adott apo az összes vedég fogyasztását megvizsgálták, és ez alapjá az elköltött összegekről az alábbi táblázatot készítették el: Fogyasztás összege Ft Vedégek száma fő 0 00 40 0 500 4 50 800 80 80 00 0 6 Összese 00 Vizsgálja meg az elköltött összegek kocetrációját Lorez-görbével és kocetrációs együtthatóval!. Az előadáso összegyűjtött hallgatói adatok alapjá töltse ki az alábbi táblázatot: Sportolással töltött órák száma Hallgatók száma fő Összese Vizsgálja meg a hallgatók sportolással töltött órái számáak kocetrációját Lorez-görbével és kocetrációs együtthatóval! 7

4. Leíró Statisztika Defiíció Mita. X,..., X valószíűségi változó sorozat. A továbbiakba feltesszük, hogy függetleek és azoos eloszlásúak. Realizációja: x,..., x Defiíció Statisztika. A mita valamely függvéye, pl.: Mitaátlag v. átlag: X = X i Tapasztalati szórás: S = X i X az átlagtól való átlagos abszolút eltérés Korrigált tapasztalati szórás: S = X i X Szórási együttható vagy relatív szórás: V = S X = S 00% az átlagtól való átlagos eltérés százalékba X /megjegyzés: lehet a korrigált tapasztalati szórással számoli/ k-adik tapasztalati mometum k, k Z: m k = Xi k Tapasztalati módusz: a legtöbbször előforduló érték Redezett mita: X... X a mitaelemek em csökkeő sorredbe Tapasztalati mediá: X +, ha páratla és X +X +, ha páros Terjedelem: R = X X legagyobb legkisebb mitaelem z-kvatilis: q z = if{x : F x z}. Ha F ivertálható, akkor q z = F z. Tapasztalati z-kvatilis: q z értelmezése: a mitaelemek z-ed része legfeljebb a q z, z-ed része pedig legalább a q z értéket veszi fel 0 < z < ; sokféleképpe számolható, pl. iterpolációs módszerrel: először megállapítjuk a sorszámot: + z = e + t e: egészrész, t: törtrész, majd kiszámoljuk a z-kvatilist: q z = Xe + txe+ Xe. Kvartilisek: Speciális kvatilisek, alsó vagy első kvartilis: Q = q, 4 mediá: Q = q, felső vagy harmadik kvartilis: Q 3 = q 3 4 Iterkvartilis terjedelem: IQR = q 3 q = Q 3 Q 4 4 Tapasztalati eloszlásfüggvéy: F x = IX i < x { ha X i < x ahol IX i < x = idikátor függvéy 0 ha X i x Az F x tapasztalati eloszlásfüggvéy és az F x elméleti eloszlásfüggvéy közötti eltérés maximuma valószíűséggel egyeletese 0-hoz kovergál, ami azt jeleti, hogy elég agy mita eseté F x éréke mide x-re tetszőleges közel va F x értékéhez és -et övelve mideütt aak közelébe marad. Gliveko-Catelli tétel Defiíció Boxplot. <boxplotom.jpg> A = max{x, Q, 5 IQR}, B = Q, C = Q, D = Q 3, E = mi{x, Q 3 +, 5 IQR} F : kieső értékek, azokat tütetjük fel potokkét, amik A- vagy E- kívülre esek 8

Feladatok R:. Egy szabályos dobókockával égyszer dobtuk és a következőket kaptuk:, 3, 6,. a Számolja ki a mitaátlagot, tapasztalati szórást és korrigált tapasztalati szórást, a szórási együtthatót a korrigált szórást haszálva, valamit a második tapasztalati mometumot! b Számítsa ki és rajzolja fel a tapasztalati eloszlásfüggvéyt is! c Mi a kockadobás elméleti eloszlásfüggvéye? Ábrázolja ezt a függvéyt is! d A f loorruif00, mi =, max = 7 utasítással geeráljo 00 kockadobást és aak ábrázolja a tapasztalati eloszlásfüggvéyét az R program segítségével. Megjegyzés: geerálhat más számú kockadobást is. Mit tapasztal? e Tekitsük a feti a 0, 03, 06, 0 adatokat, melyeket az előzőekből 00-zal való eltolással kaptuk. Meyi lesz most a mitaátlag és a tapasztalati szórás? f Az a-potbeli adatokat szorozzuk meg 3-mal: 3, 9, 8, 3. Hogya változik ekkor a mitaátlag és a tapasztalati szórás?. Egy csoportba a hallgatók magassága cm: 80 63 500 57 65 65 74 9 7 65-68 86 a Nézze rá az adatokra! Reálisak? Javítsa az esetleges adathibákat a holapo található alapadatok fájl alapjá! b Adja meg a redezett mitát! c Rajzolja fel a tapasztalati eloszlásfüggvéyt! Meyi a tapasztalati eloszlásfüggvéy értéke a 80 helye? Értelmezze szövegese! d Elemezze a hallgatók testmagasságát alapstatisztikák: átlag, korrigált tapasztalati szórás, szórási együttható, kvartilisek, terjedelem, iterkvartilis terjedelem, tapasztalati ferdeség, tapasztalati csúcsosság segítségével! e Készítse boxplot ábrát! f Készítse alkalmas osztályközös gyakorisági sort, majd abból hisztogramot! Vesse ezt össze az R program hist utasításával kapott hisztogrammal. 3. Legye adat = c, 0,, 0, 8, 3, 5, 7, 8,, 3, 5,, 7, 8, 3, 5, 3,, 8. Mit számol az alábbi R program? a sumadat < 3 b amestableadat[tableadat == maxtableadat] c sdadat == sqrtsumadat meaadatˆ/legthadat TRUE vagy FALSE? Ameyibe hamis az állítás, hogya lehet igazzá tei? d rep = repc A, B, c0, 0 df = cbidas.data.f rameadat, as.data.f ramerep libraryggplot ggplotdf, aesx = rep, y = adat + geom_boxplotf ill = gold + scale_x_discreteame = A és B csoport 9

4. Statisztikai mita és mitatér Valószíűségi mező: Ω, A, P Ω: emüres halmaz eseméytér, elemi eseméyek ω halmaza kísérlet lehetséges kimeeteleiek halmaza; érmedobás: Ω = {F, I} A Ω: σ-algebra eseméyek családja, az eseméytér összes részhalmaza A A lehetséges kimeetelek halmaza; érmedobás: A = {, {F }, {I}, Ω}, pl. A={F} P : A [0, ] valószíűségi mérték eseméyek valószíűsége; érmedobás: pl. PA = Statisztikai mező: Ω, A, P ha mide P P-re Ω, A, P valószíűségi mező ameyibe P = {P ϑ ϑ Θ R p paramétertér}: paraméteres statisztikai probléma Valószíűségi változó: X : Ω R; érmedobás: pl. Xω = { 0 ha ω = F ha ω = I elemű mita: X=X, X,..., X : Ω χ R valószíűségi változó sorozat, továbbiakba feltesszük, hogy függetleek és azoos eloszlásúak i.i.d rögzített ω Ω eseté X ω = x, X ω = x,..., X ω = x a mita realizációja: x, x,..., x valószíűségi változóra voatkozó darab kísérlet kimeetele, érmedobás: pl. érme ötszöri feldobásáál megfigyelt eseméyek: I, I, F, F, I, így a mita értéke:,, 0, 0, / itt: Ω = {F, I} 5 / Mitatér: χ, R egy részhalmaza; érmedobás: pl. érme ötszöri feldobásáál {0, } 5 Feladatok:. Határozza meg a mitateret a következő esetekbe: a Egy dobókocka háromszori feldobása. / mitatér = {,, 3, 4, 5, 6} 3 / b Egy diák felkelési időpotjait jegyzik fel 0 apo keresztül. / mitatér = [00 : 00, 4 : 00 0 / c Három pézérmét -szer dobuk fel. Megfigyelés: a három pézérme feldobásakor a F dobások száma / mitatér = {0,,, 3} / d Egy ember mide héte vesz egy lottószelvéyt, addig játszik, amíg -es találata lesz. Megfigyelés: a játszott hetek száma / mitatér = N / e Hat ember mide héte vesz egy lottószelvéyt, midegyik addig játszik, amíg -es találata lesz. Megfigyelés: a játszott hetek száma midegyikükél / mitatér = N 6 / 0

5 Becsléselmélet Torzítatla, hatásos és kozisztes becslések Legye X = X, X,..., X egy mita. A T X statisztika becslése a ϑ paraméter gϑ függvéyéek, ahol ϑ Θ R p, ha T : χ Θ. Másképp: A mitatére értelmezett függvéyt statisztikáak hívjuk. Becslést úgy kaphatuk, ha egy statisztikába a mitát behelyettesítjük. A T X statisztika torzítatla becslése a ϑ paraméter gϑ függvéyéek, ha E ϑ T X = gϑ ϑ Θ eseté. Legyeek T X és T X torzítatla becslései gϑ-ak. Ekkor azt modjuk, hogy T X hatásosabb T X-él, ha D ϑ T X D ϑ T X mide ϑ Θ eseté. A T X torzítatla becslést hatásos becslések evezzük, ha mide torzítatla becslésél hatásosabb. A T X becsléssorozat =,,... aszimptotikusa torzítatla becslése gϑ-ak, ha E ϑ T X gϑ ϑ Θ eseté. A T X becsléssorozat =,,... gyegé kozisztes becslése gϑ-ak, ha T X sztochasztikusa gϑ ϑ Θ eseté. Másképpe: ϵ > 0-ra P ϑ T X gϑ ϵ 0 ϑ Θ eseté. Megj. A T becsléssorozat gyegé kozisztes becslése gϑ-ak, ha elégséges feltétel T X aszimptotikusa torzítatla és Dϑ T X 0 Csebisev-egyelőtleség A T X becsléssorozat =,,... erőse kozisztes becslése a gϑ-ak, ha T X vsz.-gel gϑ ϑ Θ eseté. Másképpe: P ϑ {ω : T Xω gϑ} = ϑ Θ eseté. Diszkrét eloszlású X, X,..., X mita eseté: A T X statisztika elégséges a ϑ paraméterre, ha mide x, t párra, a P ϑ X = x T X = t valószíűség em függ ϑ-tól. Megj. T X elégséges h és g ϑ függvéyek, melyekre P ϑ X = x = hx g ϑ T x Abszolút folytoos X, X,..., X mita eseté: A T X statisztika elégséges a ϑ paraméterre, ha a sűrűségfüggvéyek f,ϑ x = hx g ϑ T x alakú faktorizációja. Feladatok: Legye X = X, X,..., X egy mita emlékeztető: feltettük, hogy a továbbiakba a mita függetle és azoos eloszlású valószíűségi változókból áll.. Mutassa meg, hogy a várható érték összes T X = a i X i a i = alakú lieáris becslései közül az átlag a legkisebb szóráségyzetű!. Céluk az ismeretle m paraméter becslése Nm, mita eseté. Tekitsük az alábbi statisztikákat: T X = X 8 T X = X3+X7 T 3 X = X9+X9 8 T 4 X = X a A feti statisztikák közül melyek torzítatlaok, illetve kozisztesek? Amelyik em torzítatla, hogya tudák torzítatlaá tei? b Vizsgálja meg a feti statisztikák közül a torzítatlaokat hatásosság szempotjából! 3. Torzítatlaok-e az alábbi becslések? Ha em, akkor godolkodjuk azo, hogya teheték torzítatlaá. a Mitaátlag a várható értékre. b Tapasztalati szóráségyzet a szóráségyzetre. c Mitaátlag reciproka az expoeciális eloszlás paraméterére.

Megoldás: Tegyük fel, hogy adott egy Ω, A, P = {P ϑ ϑ Θ} paraméteres statisztikai mező, valamit X = X,..., X -elemű mita. a Legye T X = X = X i, és gϑ = E ϑ X, ahol ϑ Θ. Mide ϑ Θ eseté E ϑ T X = E ϑ X i = tehát a mitaátlag torzítatla becslés a várható értékre. E ϑ X i =E ϑ X b Legye T X = X i X, és gϑ = D ϑ X. Vegyük észre, hogy T X = X i X = D ϑx i + =D ϑ X = E ϑx = gϑ, Xi X X i + X = = X E ϑx i D =E ϑ X Xi X. A feti összefüggés alapjá mide ϑ Θ eseté E ϑ T X = E ϑ Xi X = E ϑ Xi E ϑ X = =D ϑ Xi+E ϑ Xi =D ϑ X+E ϑ X = ϑ X i E ϑ X i = = D ϑx + E ϑx D ϑx i =D ϑ X E ϑ X i =E ϑ X = D ϑx + E ϑx D ϑx E ϑx = D ϑx D ϑx = gϑ, tehát a tapasztalati szóráségyzet em torzítatla becslés a szóráségyzetre, de s = X i X az ú. korrigált tapasztalati szóráségyzet torzítatla becslés a szóráségyzetre. c Tegyük fel, hogy a mita eloszlása λ-expoeciális, ahol λ > 0 paraméter, tovább legye T X =, és gλ = λ. Xi Mivel X i Gamma, λ, ezért λ E λ T X = E λ t λγ λ t X = i 0 t Γ e λt dt = Γ 0 Γ e λt dt = =f Γ,λ t = λ λ = gλ, tehát az SX = T X = torzítatla becslés a paraméterre. Xi Vegyük észre, hogy az expoeciális λ > 0 eloszlás eseté E X > -t kaptuk, de megjegyezzük, hogy ez az E X egyelőtleség mide em kostas valószíűségi változó eseté feáll. Más szóval, em kostas X valószíűségi változó eseté sohasem igaz, hogy E X = EX. Bizoyítás a Cauchy-Schwarz egyelőtleség alapjá. 4. Expλ mita eseté adjo torzítatla becslést λ -ra és e 3λ -ra! 5. P oissoλ mita eseté adjo torzítatla becslést e λ -ra és λ -re! 6. Legye X,..., X függetle, azoos abszolút folytoos eloszlású azaz létezik sűrűségfüggvéye valószíűségi változók sorozata. Adja meg X = mix,..., X és X = maxx,..., X eloszlás- és sűrűségfüggvéyét! A miimumál külö is vizsgáljuk meg azt az esetet, ha az X i változók expoeciális eloszlásúak! =

Megoldás. Először határozzuk meg X eloszlásfüggvéyét. Tetszőleges t R eseté F X t = P X < t = P X t = P {X i t} = PX i t = = [ P X i < t] = [ F Xi t] = [ F X t]. Az X sűrűségfüggvéye az eloszlásfüggvéye deriválásával kapható meg. Tetszőleges t R eseté f X t = [ F X t] f X t = [ F X t] f X t. Az X esetébe is először az eloszlásfüggvéyt határozzuk meg. Mide t R eseté F X t = P X < t = P {X i < t} = PX i < t = [F X t]. Az X sűrűségfüggvéyét ismét deriválással határozzuk meg. Mide t R eseté f X t = [F X t] f X t. A továbbiakba tegyük fel, hogy X Expλ, ahol λ > 0. Ekkor F X t = e λt Idt > 0, illetve f X t = λe λt Idt > 0, tehát F X t = e λ t Idt > 0 f X t = λe λ t Idt > 0. Azt kaptuk, hogy függetle azoos λ-paraméterű expoeciális eloszlások miimumáak eloszlása szité expoeciális eloszlású, melyek paramétere λ. 7. Mutassa meg, hogy expoeciális eloszlású mita eseté T X = X statisztika torzítatla, de em kozisztes becslése a várható értékek! 8. A [0, ϑ] itervallumo egyeletes eloszlásból vett elemű mita alapjá adjuk tapasztalati becslést a ϑ > 0 paraméterre több megoldás is lehetséges! Torzítatla-e a becslés? Ha em, akkor tegyük torzítatlaá! Melyik a hatásosabb? Melyik kozisztes? Megoldás: Legye T X = X i, és gϑ = ϑ. Ekkor mide ϑ > 0 eseté E ϑ T X = E ϑ X i = E ϑ X i =E ϑ X = E ϑ X = ϑ ϑ = gϑ, tehát a mitaátlag em torzítatla becslés a paraméterre, de T X = T X = X i torzítatla becslés a paraméterre. Egy másik megoldás: Legye SX = maxx,..., X, és gϑ = ϑ. Határozzuk meg SX eloszlásfüggvéyét. Az eloszlásfüggvéy szité függ a ϑ paramétertől, de ezt az alábbi számolásba em tütetjük fel. F SX t = PmaxX,..., X < t = P {X i < t} = PX i < t = [F X t]. =PX <t=f X t Ebből deriválással megkapható a sűrűségfüggvéy. A sűrűségfüggvéy szité függ a ϑ paramétertől, de ezt az alábbi számolásba most sem tütetjük fel. { f SX t = [F X t] = [F X t] t f X t = ϑ ϑ ha 0 < t ϑ 0 egyébkét. Jelölje f ϑ t az SX statisztika P ϑ szeriti sűrűségfüggvéyét. Ekkor mide ϑ > 0 eseté E ϑ SX = tf ϑ tdt = ϑ 0 t dt = [ ] t + ϑ ϑ ϑ = ϑ + + t=0 ϑ + = + ϑ ϑ = gϑ, de S X = + + SX = maxx,..., X torzítatla becslés a paraméterre. 3

9. Keressük elégséges statisztikát a következő eloszlásokból vett elemű mita alapjá! Miimális elégséges-e? a Poissoλ, ahol λ > 0 paraméter. b Idikátorp, ahol 0 < p < paraméter. c Biomiálisr, p, ahol r ismert és 0 < p < paraméter. d Diszkrét egyeletes az {,,..., N} halmazo, ahol N =,, 3,... paraméter. e Expoeciálisλ, ahol λ > 0 paraméter. Megoldás: a Legye X = X,..., X Poissoλ eloszlásból származó -elemű mita, ahol λ > 0. L x λ; = P λ X = x = P λ {X i = x i } = P λ X i = x i = = x i! =hx λ }{{ xi e λ } g λt x, így a Neyma Fisher-féle faktorizációs tétel alapjá T X = X i elégséges statisztika. Mide x, y realizációra L x λ; L y λ; = x i! λ xi e λ y i! λ yi e λ = x i! λ xi y i! yi, λ xi x i! e λ = ami potosa akkor em függ λ-tól, ha x i = y i, azaz T x = T y, tehát T X miimális elégséges statisztika. b Legye X = X,..., X Idikátorp eloszlásból származó -elemű mita, ahol 0 < p < paraméter. L x p; = P p X = x = P p {X i = x i } = P p X i = x i = p xi p xi Id{x i = 0 vagy } = = p xi p xi } {{ } =g pt X Id{ i [] : x i = 0 vagy }, =hx így a Neyma Fisher-féle faktorizációs tétel alapjá T X = X i elégséges statisztika. Mide x, y realizációra L x p; L y p; = p xi p xi Id{ i [] : x i = 0 vagy } yi p yi Id{ i [] : y i = 0 vagy }, p ami potosa akkor em függ p-től, ha x i = y i, azaz T x = T y, tehát T X miimális elégséges statisztika. c Legye X = X,..., X Biomiálisr, p eloszlásból származó -elemű mita, ahol r ismert és 0 < p < paraméter. r L x p; = P p X = x = P p {X i = x i } = P p X i = x i = p xi p r xi = = r x i } {{ } =hx p xi p r xi } {{ } =g pt x így a Neyma Fisher-féle faktorizációs tétel alapjá T X = X i elégséges statisztika. Mide x, y realizációra L x p; L y p; =, r x i p xi p r xi r x r y i p yi p r = i Yi r p xi yi p yi xi, y i ami potosa akkor em függ p-től, ha x i = y i, azaz T x = T y, tehát T X miimális elégséges statisztika. x i 4

d Legye X = X,..., X az {,,..., N} halmazo egyeletes eloszlásból származó -elemű mita, ahol N =,, 3,... paraméter. L x N; = P N X = x = P N {X i = x i } = P N X i = x i = N Idx i N = = N Idx N, g N T x és hx, így a Neyma Fisher-féle faktorizációs tétel alapjá T X = X elégséges statisztika. Mide x, y realizációra L x N; L y N; = N Idx N N Idy N, ami potosa akkor em függ N-től, ha x = y, azaz T x = T y, tehát T X miimális elégséges statisztika. e Legye X = X,..., X Expoeciálisλ eloszlásból származó -elemű mita, ahol λ > 0 paraméter. Feladatok R: L x λ; = f λ x = f λ x i = λe λxi Idx i > 0 = λ e λ xi } {{ } =g λ T x így a Neyma Fisher-féle faktorizációs tétel alapjá T X = X i elégséges statisztika. Mide x, y realizációra L x λ; L y λ; = λ e λ xi Id i [] : x i > 0 λ e λ yi Id i [] : y i > 0, Id i [] : x i > 0, =hx ami potosa akkor em függ λ-tól, ha x i = y i, azaz T x = T y, tehát T X miimális elégséges statisztika. 0. Geeráljo 00000-szer 6 elemű [0,3] itervallumo egyeletes eloszlású mitát és határozza meg a 8. feladat becsléseit, majd hasolítsa is össze azokat! 5

7. Maximum-likelihood becslések Legyeek X, X,..., X függetle azoos eloszlású i.i.d. valószíűségi változók, és legye ϑ Θ az ismeretle paraméter Likelihood függvéy: Lϑ, x = f ϑ x = f ϑ x i, ha az eloszlás folytoos, Lϑ, x = P ϑ X = x = P ϑ X i = x i, ha az eloszlás diszkrét. Log-likelihood függvéy: lϑ, x = llϑ, x Maximum-likelihood módszer ML-módszer az imeretle paraméter becslésére: Azt a paraméterértéket keressük, ahol a likelihood függvéy a legagyobb értéket veszi fel azaz diszkrét esetbe az ismeretle paraméter azo értéket keressük, amely mellett a bekövetkezett eredméy maximalis valószíűségű: max Lϑ, x Ameyibe a függvéy deriválható ϑ szerit, akkor a maximumot kereshetjük a szokásos módo, az első és második deriváltak segítségével, azoba a feladatukat jeletőse megehezíti, hogy olya -szeres szorzatot kellee deriváli, amelyikek mide tagjába ott va az a változó, ami szerit deriváluk kellee. Ezért likelihood függvéy helyett a log-likelihood függvéy maximumhelyét keressük. Ha ϑ dimeziós, akkor ϑ lϑ, x = 0, míg ha ϑ = ϑ,..., ϑ p p dimeziós, akkor ϑi lϑ, x = 0 megoldásából kapjuk a becslést. A második deriváltak segítségével elleőrizzük, hogy valóba maximum. Tétel ML-becslés ivariás tulajdosága: Ha ϑ ML-becslése ˆϑ, akkor tetszőleges g függvéy eseté gϑ ML-becslése g ˆϑ. Feladatok:. Legyeek X, X,..., X függetle azoos eloszlású valószíűségi változók az alábbi eloszlásokból. Számolja ki az ismeretle paraméterek ML-becslését! a Bim, p biomiális eloszlás tfh. m N adott b Geop Pascal-eloszlás c Expλ expoeciális eloszlás d Γα, λ Gamma-eloszlás tfh. α R + adott ϑ 7. Mometumok módszere E módszert akkor szokás alkalmazi az imeretle paraméterek becslésére, amikor sok ismeretle paraméter va, és a ML becslést ehéz kiszámítai. i A mitából számítható tapasztalati mometumokat m k := xk i egyelővé tesszük az elméleti mometumokkal M k := E ϑ X k, az elsőtől kezdve, potosa ayit, ameyi paraméter va. Tehát p darab ismeretle paraméter eseté a következő p ismeretlees egyeletredszert kell megoldai: M = m = x Feladatok:. M p = m p. Legyeek X, X,..., X függetle azoos Ea, b eloszlású valószíűségi változók. Számolja ki az ismeretle paraméterek mometum-becslését!. Legyeek X, X,..., X függetle azoos Nµ, σ eloszlású valószíűségi változók. Mutassa meg, hogy a maximum likelihood módszerrel és a mometumok módszerével is ugyaazokat a becsléseket kapjuk µ-re és σ-ra is! 6

7.3 Fisher-féle iformáció Legyeek X, X,..., X függetle azoos abszolút folytoos eloszlású i.i.d. valószíűségi változók f ϑ sűrűségfüggvéyel, és legye ϑ Θ az ismeretle paraméter Fisher-féle iformáció: I ϑ = E ϑ lϑ, X, egy mitaelem iformációja: I ϑ = E ϑ ϑ ϑ l f ϑx Ha I ϑ < és a hogy f ϑ x ϑ dx = 0 bederiválási feltétel teljesül, akkor E ϑ ϑ l f ϑx = 0 is teljesül, amiből következik, I ϑ = I ϑ. Megj. Mivel E ϑ ϑ l f ϑx = 0, az egy elemű mita Fisher-féle iformációja: I ϑ = Dϑ ϑ l f ϑx. Cramér-Rao egyelőtleség: f ϑ x Ha I ϑ < és dx = 0 bederiválási feltétel, továbbá a T X statisztika a ψ függvéyel képzett ψϑ paraméterfüggvéy torzítatla becslése, Dϑ T X < és T x f ϑx ϑ dx = T xf ϑ x dx, akkor R ϑ ϑ R D ϑ T X ψ ϑ I ϑ = ψ ϑ I ϑ = iformációs határ Megj. Speciálisa, ha T X torzítatla becslése ϑ-ak, továbbá a feti regularitási feltételek teljesülek, akkor D ϑt X I ϑ = I ϑ. Megj. A Cramér-Rao tétel em azt állítja, hogy az iformációs határ elérődik valamely torzítatla becslés eseté. Viszot ha elérődik, akkor az a T becslés hatásos sőt az egyetle ilye. Az is lehet, hogy va hatásos becslés, de az iformációs határ em érődik el. Feladatok:. Számítsuk ki a Fisher-iformációt a következő eloszláscsaládokból vett elemű mita eseté. a Poissoλ, ahol λ > 0 paraméter, b Idikátorp, ahol 0 < p < paraméter, c Biomiálisr, p, ahol r ismert és 0 < p < paraméter, d Expoeciálisλ, ahol λ > 0 paraméter, e Gammaα, λ, ahol α ismert és λ > 0. 7

8. Kofideciaitervallumok Eddig: potbecslés, azaz a becsüledő paramétert vagy aak függvéyét a mitaelemekből képzett egyetle statisztikával becsültük. Nem elég iformatív, em tudi meyi bizoytalaság va a becslésbe. Most: a becslés egy egész itervallum, melyek határai statisztikák Legye Ω, A, P statisztikai mező, ahol P = {P ϑ ϑ Θ R p }, és legye X,..., X függetle, azoos eloszlású mita. Defiíció Kofideciaitervallum. A T X, T X statisztikapárral defiiált itervallum legalább ε szitű kofideciaitervallum a ψϑ paraméterfüggvéyre, ha P ϑ T X < ψϑ < T X ε ϑ Θ ahol ε előre adott kis pozitív szám pl. ε = 0, 05, az ehhez tartozó kofideciaszit 95%. Kofideciaitervallum a ormális eloszlás várható értékére - ismert szórás eseté: Legyeek X,..., X Nµ, σ függetle azoos eloszlású mita, σ ismert, µ ismeretle paraméter, ekkor az α megbízhatósági szitű kofideciaitervallum µ-re: ahol u α X u α a stadard ormális eloszlás megfelelő kvatilisét jelöli. - ismeretle szórás eseté: σ, X + u α Legyeek X,..., X Nµ, σ függetle azoos eloszlású mita, σ és µ ismeretle paraméterek, ekkor az α megbízhatósági szitű kofideciaitervallum µ-re: ahol t, α X t, α σ S, X S + t, α az szabadsági fokú t-eloszlás megfelelő kvatilisét jelöli. Megj.: A kofideciaitervallum hossza aál kisebb, miél agyobb az mitaelemszám és miél kisebb a szórás. Ezeket kostas szite tartva, a szigifikaciaszit övelésével ε csökketésével viszot ő a kofideciaitervallum hossza. Kofideciaitervallum a ormális eloszlás szóráségyzetére Legyeek X,..., X Nµ, σ függetle azoos eloszlású mita σ ismeretle paraméterrel, ekkor az α megbízhatósági szitű kofideciaitervallum σ -re: S χ,, α S χ, α ahol χ, α ill. χ, α értékek az szabadsági fokú χ -eloszlás megfelelő kvatiliseit jelöli. Feladatok R:. Legye ξ,..., ξ 5 függetle azoos Nµ, eloszlású mita. A megfigyelt értékek a következők: 4, 3,,, 6 a Határozza meg 95%-os megbízhatóságú kofideciaitervallumot µ-re! b Háy elemű mitára va szükség, ha azt szereték, hogy a kofideciaitervallum legfeljebb,5 hosszúságú legye? c Mi változik az a esetbe, ha a szórást em ismerjük? d Adjo a szóráségyzetre 98%-os megbízhatósági kofideciaitervallumot! e Oldja meg a feladatot abba az esetbe, ha a mita Nm + 5, eloszlásból származik! 8

. Tekitsük a 4. gyakorlat. feladatába szereplő hallgatói javított magassságokat cm. a Tegyük fel, hogy a hallgatók magassága ormális eloszlású 0 cm szórással. Adjo 95% megbízhatósági kofideciaitervallumot a hallgatók magasságáak várható értékére! b Adjo kofideciaitervallumot abba az esetbe is, ha a szórást em ismerjük! c Háy elemű mitára va szükség, ha azt szereték, hogy a kofideiciaitervallum legfeljebb 8 cm hosszúságú legye? 3. Egy műszerrel tízszer megmértük egy elleállást, és a következő adatokat kaptuk: 0., 9.9, 8.9, 9.5, 9.8, 9.4, 9.3, 0.0, 9.5, 9.6 Ω. Adjuk 90%-os megbízhatósági szitű kofideciaitervallumot az elleállás téyleges értékére! a Meyibe változik a kofidecia itervallum ha tudjuk, hogy műszer mérési eredméyéek a szórása 0.4 Ω? 4. Egy gép előírt hosszúságú darabokat vág le egy acéllemezből, de a hosszúság ormális eloszlású igadozást mutat, melyek szóráségyzete 9 cm. Adjuk 95%-os megbízhatósági szitű kofidecia itervallumot a levágott darabok átlagos hosszára, ha egy 8 elemű mita átlaga 8 cm! 5. Az előző évbe figyelemmel kísértük a sárkáyföldi tőzsdeidex, a SüSüX változását. Az alapstatisztikák: átlag: 3,8; szórás: 95,3. A tőzsde 00 apo keresztül volt yitva. Adjo ezek alapjá 95%-os megbízhatóságú kofideciaitervallumot az idex adott évre voatkozó várható értékére! 9

9. Hipotézisvizsgálat Hipotézis: állítás, amiek igazságát vizsgáli szereték Statisztikai próba: eljárás amiek a segítségével dötést hozhatuk a hipotézisről Legye Ω, A, P statisztikai mező, ahol P = {P ϑ ϑ Θ R p }, és legye X = X,..., X függetle, azoos eloszású mita a P ϑ sokaságból. Jelölje X a mitateret. Nullhipotézis: H 0 : ϑ Θ 0 Ellehipotézis: H : ϑ Θ Paramétertér: Θ = Θ 0 Θ Dötés: T X statisztika T : X R próbastatisztika segítségével, melyek ismerjük az eloszlását a ullhipotézis feállása eseté Mitateret két részre botjuk: X = X e X k és X e X k = X k : kritikus tartomáy azo X megfigyelések halmaza, amikre elutasítjuk a ullhipotézist X e : elfogadási tartomáy azo X megfigyelések halmaza, amikre elfogadjuk a ullhipotézist Kritikus érték: c függ α-tól, ld. alább X k = {x X : T x c} vagy X k = {x X : T x c} vagy X k = {x X : T x c} X e = {x X : T x < c} X e = {x X : T x > c} X e = {x X : T x < c} Dötés Valós állapot H 0 -t elfogadjuk X e H 0 -t elvetjük X k H 0 igaz ϑ Θ 0 helyes dötés α elsőfajú hiba α H 0 hamis ϑ Θ másodfajú hiba β helyes dötés β Elsőfajú hiba valószíűsége: Egyszerű hipotézis Θ 0 halmaz egyelemű eseté: P ϑ0 X X k = α ϑ 0 Θ 0 / = Pelvetjük H 0 -t H 0 igaz / Összetett hipotézis Θ 0 halmaz több elemű eseté: P ϑ X X k α ϑ Θ 0 Próba potos terjedelme vagy szigifikaciaszitje: α = sup{p ϑ X X k : ϑ Θ 0 } Megbízhatósági kofidecia- szit: α / = Pelfogadjuk H 0 -t H 0 igaz / A próba meghatározása: előre rögzített α terjedelemhez azt a c értéket keressük, amire a próba potos terjedelme éppe α. Másodfajú hiba valószíűsége: βϑ = P ϑ X X e = P ϑ X X k ϑ Θ / = P ϑ elfogadjuk H 0 -t H 0 hamis / Erőfüggvéy: ψϑ = βϑ / = Pelvetjük H 0 -t H 0 hamis / Miél erősebb a próba, aál agyobb valószíűséggel veti el a hamis ullhipotézist. Vagyis a próba ereje aak a valószíűsége, hogy egy adott külöbséget adott mitaagyság és terjedelem mellett egy statisztikai próba kimutat. Kísérletek tervezésekor az erő agyságáak előre meghatározott értékéből határozható meg a mitaelemszám. A próba erejét addig em tudjuk kiszámoli, ameddig az ellehipotézis egy értékét em rögzítjük ill. em modjuk meg a külöbég agyságát, amit ki szereték mutati. p-érték: aak a valószíűsége, hogy igaz H 0 eseté a tapasztalt eltérést vagy aál agyobb eltérést kapuk. Ha egy próbát számítógép segítségével végzük el, redszerit a p-érték révé tuduk dötei: ha p-érték< α, akkor elvetjük H 0 -t. A hipotézisek em egyeragúak. H 0 -t csak idokolt esetbe szereték elutasítai, így az elsőfajú hiba súlyosabbak számít, mit a másodfajú hiba. Általába az elsőfajú hiba legagyobb valószíűségét adjuk meg, de a másodfajú hiba csökketésére is törekszük pl. mitaagyság övelésével. H 0 elfogadása: statisztikailag em találtuk komoly bizoyítékot arra, hogy H 0 em lee igaz; vagyis H 0 elfogadása eseté sem lehet állítai, hogy H 0 teljesül H 0 elvetése: statisztikailag komoly bizoyítékot találtuk arra, hogy a H 0 em igaz, azaz H igaz 0

Hipotézisvizsgálat: Paraméteres próbák Egymitás próbák X,..., X Nµ, σ függetle azoos eloszlású mita, µ ismeretle paraméter H 0 : µ = µ 0 H 0 : µ µ 0 H 0 : µ µ 0 H : µ µ 0 H : µ > µ 0 H : µ < µ 0 Egymitás u-próba σ ismert Próbastatisztika: u = X µ 0 σ H 0 eseté N0, Kritikus tartomáyok: X k = {X : u > u α } X k = {X : u > u α } X k = {X : u < u α } = {X : u > u α vagy u < u α } <hipovizsgu.jpg> <hipovizsgur.jpg> <hipovizsgul.jpg> Kapcsolat a kofideciaitervallummal az alábbi lépések ekvivalesek: u > u α u > u α vagy u < u α X µ 0 σ X µ 0 > u α σ vagy X µ 0 < u α > u α vagy X µ 0 σ σ µ 0 / X u α σ, X + u α < u α σ Vagyis a ullhipotézist kétoldai potosa akkor utasítjuk el, ha az α megbízhatósági szitű kofideciaitervallum µ-re em tartalmazza µ 0 -t. Egymitás t-próba σ ismeretle Próbastatisztika: t = X µ 0 s H 0 eseté t Kritikus tartomáyok: X k = {X : t > t, α/ } X k = {X : t > t, α } X k = {X : t < t,α } Kétmitás próbák X,..., X Nµ, σ és Y,..., Y m Nµ, σ függetle miták, µ és µ ismeretle paraméterek H 0 : µ = µ H 0 : µ µ H 0 : µ µ H : µ µ H : µ > µ H : µ < µ a két mita a két mita párokét összetartozó, függetle em függetle σ és σ ismert Kétmitás u-próba Egymitás u-próba a külöbségekre előzetes F-próba σ és σ ismeretle σ = σ σ σ Egymitás t-próba Kétmitás t-próba Welch-próba a külöbségekre Kétmitás u-próba σ, σ ismert Próbastatisztika: u = X Y σ + σ m H 0 eseté N0, előzetes F-próba σ, σ ismeretle H 0 : σ = σ H : σ σ Próbastatisztika: s H 0 eseté s F = F,m ha s > s s F m, ha s > s s H 0 eseté Kétmitás t-próba σ = σ ismeretle m Próbastatisztika: t = + m X Y s +m s +m H 0 eseté t +m Welch-próba σ σ ismeretle Próbastatisztika: t = X Y s + s m H 0 eseté t f, ahol f S + S m S S + m m

Feladatok R:. Azt szereték vizsgáli, hogy a api középhőmérséklet október 8-á Budapeste 5 C alatt volt-e. Az elmúlt 4 év api középhőmérsékletei a következők voltak: 4, 8;, ; 6, 8;, C, valamit tegyük fel, hogy az adatok ormális eloszlásból származak. a Írjuk fel a ull- és ellehipotézist! b Tegyük fel, hogy a api középhőmérséklet szórása σ =. Tesztelje a feti hipotézist α = 0.05 terjedelem mellett! Adja meg a kritikus tartomáyt és p-értéket! Mi a dötés? c Tesztelje a hipotézist úgy is, hogy em haszálja a szórásra voatkozó előzetes iformációt! d Milye hipotézist írjuk fel, ha azt szereték vizsgáli, hogy a api középhőmérséklet október 8-á Budapeste 5 C-tól külöböző volt? Teszteljük a feti adatok segítségével!. Bublisztába az ÖDSZ párt vezetőségi tagjaiak havi keresete millió bublikba jól közelíthető Nµ, eloszlással. A többi lakosál a kereset Nµ, 4 eloszlással közelíthető. Rita TORA okyomozó újságíró kiderítette éháy a Nagy vezér stadioba szurkoló ember keresetét: VIP páholyba ülők: 0.47,.0, 8.67, 6.67, 8.00, 0.40,.7, 0.05, 4.85, 9.93, 9.73, 0.39 Normál sorokba ülők: 4.56, 6.67, 4.0,.9, 3.89, 5.48, 3.89, 0., 5.3, 4.4,.36, 0. a Ameyibe a VIP páholyba csak az ÖDSZ párt vezetőségi tagjai ülek, akkor 5%-os elsőfajú hibavalószíűség mellett elfogadja-e a H 0 : µ = 0 hipotézist a kétoldali ellehipotézissel szembe? b Ameyibe az ÖDSZ párt vezetőségi tagjai csak a VIP páholyba ülek, akkor 5%-os elsőfajú hibavalószíűség mellett elfogadja-e a H 0 : µ = 0 hipotézist a kétoldali ellehipotézissel szembe? c Meyi a p érték a b részfeladatál? d El tudja-e fogadi a H 0 : µ = µ hipotézist? 3. A fogyasztóvédelmi hatóság többszöri lakossági bejeletést kapott, hogy a Portokall evű, fél literes kiszerelésű aracsitalokba a flakora írt 500 ml-él jóval kevesebb üdítő va. Ez alapjá vizsgálatot kezdtek, a fogyasztóvédelem mukatársa vásárolt a boltba 0 darabot, majd megézte a bee lévő édes edű térfogatát ml: 483, 50, 498, 496, 50, 483, 494, 49, 505, 486. Tegyük fel, hogy egy fél literes üdítős üvegbe töltött aracslé meyisége ormális eloszlást követ. Állíthatjuk-e 95%-os megbízhatóság eseté, hogy a Portokall gyártója át akarja veri a vevőket? 4. A Természettudomáyi Kar II. évfolyamá az egyik gyakorlati csoportba 0-e írtak statisztika zárthelyit. Két feladatsor volt, midkettőbe 5 potot lehetett eléri. Tegyük fel, hogy az elért potszámok ormális eloszlásúak. A potszámokat az alábbi táblázat tartalmazza.. feladatsor 8 4 0. feladatsor 5 4 9 5 a Vajo az első feladatsor ehezebb volt? b Meyibe változik a helyzet, ha em 0 diákról, haem csak 5-ről va szó, és a. feladatsor a pótzh eredméye? 5. Az alábbi két mita 0 egyforma képességüek feltételezett sportoló súlylökésbe elért eredméyeit tartalmazza. A sportolók két ötfős csoportba készültek az edzőtáborba. Edzéstervük ugyaaz volt, de az első csoportba készülők mide reggel fejekét 0 tojást és 5 túró rudit ettek meg. A második csoportba készülőkek reggel és este - kg szaloát és - kg madártejet kellett megei. hét felkészülés utá értékelték az eredméyeket. Tételezzük fel, hogy ormális eloszlásból származak a miták és a terjedelem 5%.. csoport 5,8 5, 6,3 7, 6,. csoport 9,0, 7, 4,7,0 a Melyik diéta volt jobb, ha a dobások szórását -ek tekitjük? b Állíthatjuk-e, hogy a második csoportba agyobb változékoyságot mutat a sportolók teljesítméye? c Ha em ismerjük a szórást, akkor tekithetjük-e valamelyik diétát jobbak?

0. Hipotézisvizsgálat: Nemparaméteres próbák Diszkrét illeszkedésvizsgálat Legye X,..., X egy elemű mita és tegyük fel, hogy a mitaelemek r külöböző x j j =,... r értéket vehetek fel. Továbbá jelölje ν j j =,... r az egyes értékek megfigyelt gyakoriságát, azaz függetle megfigyelést osztályozuk valamilye szempot szerit, r párokét diszjukt osztályba. Az egyes osztályok feltételezett valószíűségei redre p,... p r. Osztályok... r Összese Értékek x x... x r Gyakoriságok ν ν... ν r Valószíűségek p p... p r Azt vizsgáljuk, hogy a mita eloszlása megegyezik-e a feltételezett eloszlással. Ismert eloszlás eseté tiszta illeszkedésvizsgálatot végzük. Ha viszot az eloszlás paraméteres és csak az eloszláscsaládot ismerjük, a paramétereket viszot em pl. az a kérdés, hogy származhatak-e az adatok p paraméterű biomiális eloszlásból, akkor becsléses illeszkedésvizsgálatot végzük. Tiszta illeszkedésvizsgálat: H 0 : P X i = x j = p j j =,..., r H : legalább egy j melyre P X i = x j p j Próbastatisztika: T = r ν j p j j= Becsléses illeszkedésvizsgálat: p j H 0 eseté χ r Kritikus tartomáy: X k = {x : T x > χ r, α} Legye θ egy s dimeziós paramétervektor, valamit legye ˆθ a θ paramétervektor ML-becslése, és legye ˆp j = p j ˆθ. H 0 : P X i = x j = ˆp j j =,..., r H : legalább egy j melyre P X i = x j ˆp j Próbastatisztika: T = r ν j ˆp j j= ˆp j H 0 eseté χ r s Kritikus tartomáy: X k = {x : T x > χ r s, α} Megjegyzés: Mivel a próba aszimptotikus, vigyázuk kell arra, hogy a mita elemszáma elég agy legye. Koyhaszabálykét meg szokás követeli, hogy az ú. elméleti gyakoriság p j legalább 5 legye. Ha ez em teljesül, akkor a kis várt gyakoriságokkal redelkező eseméyeket összevojuk. Függetleségvizsgálat függetle megfigyelést két szempot szerit osztályozuk, az. szempot szerit r osztály, míg a. szempot szerit s osztály va. Aak a valószíűsége, hogy egy megfigyelést az. szempot szerit az i-edik, a második szerit pedig a j-edik osztályba soroluk, p ij. Az ilye tulajdoságú megfigyelések számát pedig ν ij -vel jelöljük. Az osztályozási eljárás eredméyét ú. kotigeciatábla formájába szokás megadi:. szempot... j... s Sorösszegek ν... ν j... ν s ν...... szempot i ν i... ν ij... ν is ν i..... r ν r... ν rj... ν rs ν r Oszlopösszegek ν... ν j... ν s ν ij = megfigyelések gyakorisága az i, j osztályba ν i = s ν j = r ν ij j= ν ij Hasolóa p i ill. p j a margiális eloszlást jelölik, tehát a [p ij ] mátrix sor-, illetve oszlopösszegei: p i = s H 0 : a két szempot függetle egymástól, azaz p ij = p i p j i r, j s H : a két szempot em függetle, azaz p ij p i p j legalább egy i, j párra p ij j= p j = r p ij 3

Próbastatisztika: T = r j= s νij νi ν j ν i ν j H 0 eseté Kritikus tartomáy: X k = {x : T x > χ r s, α } χ r s Megjegyzés: Ha r = s =, akkor a próbastatisztika a következőképpe leegyszerűsödik: T = ν ν ν ν H 0 eseté χ ν ν ν ν. Homogeitásvizsgálat Va két függetle miták adatsoruk az egyikbe, a másikba m megfigyeléssel. Valamilye szempot szerit r, párokét diszjukt osztályba soroljuk a megfigyeléseket. Az i-edik osztály valószíűsége p i az. mita és q i a. mita eseté i =,,..., r. Legyeek az egyes osztályok gyakoriságai ν,..., ν r az. mita és µ,..., µ r a. mita eseté. Osztályok... r Összese. mita Gyakoriságok ν ν... ν r Valószíűségek p p... p r. mita Gyakoriságok µ µ... µ r m Valószíűségek q q... q r Azt vizsgáljuk, hogy a két mita ugyaolya eloszlás szerit sorolódik-e be az egyes osztályokba: H 0 : a két eloszlás megegyezik, azaz p i = q i i =,... r H : a két eloszlás em egyezik meg, azaz legalább egy i, hogy p i q i Próbastatisztika: T,m = m Feladatok R: r νi µi m H 0 eseté χ r Kritikus tartomáy: X k = {x : T,m x > χ ν i + µ r, α} i. Egy gyárba egy termék miőségét 4 elemű mitákat véve elleőrzik, havota 300 mitavétellel. Megszámolták, hogy a legutóbbi hóapba háyszor volt selejtes a mita, melyek eredméyeit az alábbi táblázat tartalmazza: Selejtesek száma 0 3 4 Darabszám 80 3 77 7 3 Modellezhető a mitákba levő selejtesek száma a 4; 0, 5, ill. b 4; p paraméterű biomiális eloszlással α = 0, 05?. Az alábbi kotigecia-táblázat mutatja, hogy egy 00 éves időszakba egy adott apo a csapadék meyisége és az átlaghőmérséklet hogya alakult: Hőmérséklet Csapadék kevés átlagos sok hűvös 5 0 5 átlagos 0 0 0 meleg 5 0 5 A cellákba az egyes esetek gyakoriságai találhatóak. α = 0, 05 mellett tekithető-e a csapadékmeyiség és a hőmérséklet függetleek? 3. Két dobókockával dobva az alábbi gyakoriságokat figyeltük meg: Dobások 3 4 5 6. kocka 7 4 6 3 8 3. kocka 8 5 4 0 α = 0, 05 mellett dötsük arról, hogy tekithető-e a két eloszlás azoosak! 4

0. Egyszerű lieáris regresszió Adott x, y,..., x, y számpárokra szereték egyeest illesztei. Modell: y i = ax i + b + ε i, ahol ε i függetle, azoos eloszlású hiba, általába feltesszük, hogy ormális eloszlású Eε i = 0 és D ε i = σ < i =,..., Cél: a és b becslése Módszer: legkisebb égyzetek: mi Megoldás: â = y i ax i + b xi xy i y xi x, eek szóráségyzete: D â = σ xi x ˆb = y âx, eek szóráségyzete: D ˆb = σ + x xi x Reziduálisok: ˆε i = y i ŷ i = y i âx i + ˆb i =,..., Reziduális szóráségyzet becslése: ˆσ yi ŷ i = = SSE = MSE Szóródások: yi y = ŷ i y + y i ŷ i, azaz SST = SSR + SSE Tapasztalati korrelációs együttható: R = Determiációs együttható: R = SST SSE SSE Illeszkedésvizsgálat grafikusa: Q-Q plot xi xy i y xi x y i y Grafikus ábrázolási módszer, amely a mita eloszlásáról feltett hipotézisvizsgálatra ad szemléletes iformációt pl. az adatok ormális eloszlásúak-e. Ekkor a tapasztalati megfigyelt és az elméleti illesztett eloszlást, illetőleg az ezekből kapott kvatiliseket vetjük össze. A következőkbe csak ormális eloszlás vizsgálatára ézzük a módszert, de kiterjeszthető más eloszlásokra is. Normalitásvizsgálat Jelölje x, x,..., x a mitát és x x x pedig a redezett mitát. Ez utóbbi x i értékek a tapasztalati kvatilis értékek i azaz a talpasztalati eloszlásfüggvéy értékeihez tartozó kvatilisek. Az elméleti kvatilis értékek pedig az + potokba a stadard ormális eloszlás kvatilisei: Φ i +, i =,,...,. A Q-Q plot a Φ i +, x i redezett párok a síko, i =,...,. Ha a mita ormális eloszlásból származik, a potok megközelítőleg egy egyees voalo fogak elhelyezkedi. Megjegyzés: Külöböző eljárások/programok külöbözőképpe adják meg a potokat, ahol az elméleti kvatiliseket vesszük, pl. > 0 eseté az R program i / -et haszál. A Q-Q plot értelemszerűe fog változi. Feladatok R:. Legyeek adottak a következő x,y párok: x i 0 6 5 3 y i 4 3 0 a Határozza meg és ábrázolja is az ax + b alakú regessziós egyeest! b Számolja ki a reziduálisokat és becsülje meg a hiba szóráségyzetét! c Adjo előrejelzést x = 0-re a regressziós egyees alapjá!. Egy darabológép 00 cm-es rudak vágására va beállítva. A következő táblázat hat véletleszerűe kiválasztott rúd hosszát és súlyát tartalmazza: x i cm 0,3 03,7 98,6 99,9 97, 00, y i dkg 609 66 586 594 579 605 a Határozza meg és ábrázolja is az ax + b alakú regressziós egyeest! b Számolja ki a reziduálisokat és becsülje meg a hiba szóráségyzetét! c Adjo előrejelzést x = 00 cm-re a regressziós egyees alapjá! 5