Leíró és matematikai statisztika gyakorlat 08/09 II. félév Táblázatok Viszoyszámok: V = A, ahol A: a viszoyítás tárgya amit viszoyítuk; B B: a viszoyítás alapja amihez viszoyítuk Megoszlási: a sokaság egy részéek a sokaság egészéhez való viszoyítása Koordiációs: a sokaság egy részéek a sokaság egy másik részéhez való viszoyítása Diamikus: két időpot vagy időszak adatáak háyadosa Itezitási: külöböző fajta adatok viszoyítása egymáshoz; gyakra a mértékegységük is eltér Adott sokaság és aak m része eseté az összetett viszoyszám: m m m A i B i V i A i V = m = m = m B i Feladatok R: B i } {{ } súlyozott számtai átlag A i V i súlyozott harmoikus átlag. A 0. évbe törtéő épszámlálás alapjá a 0-4 év közötti épesség emek szeriti megoszlása 0-be a következő volt: Nem Népesség száma fő Férfi 37 039 Nő 30 96 Összese 68 35 Az adatok a Közpoti Statisztikai Hivatal holapjáról lettek letöltve: http : //www.ksh.hu/epszamlalas/tablak_teruleti_00. a Adja meg a táblázat adataiból számítható megoszlási viszoyszámokat! b Adja meg a táblázat adataiból számítható koordiációs viszoyszámokat! c A 06-os Mikrocezus szerit Magyarország épessége 9 803 837 fő. Számítsa ki a épsűrűséget! Ez milye viszoyszám?. Az euró eladási árfolyamáak alakulása az K&H Bakál a következő volt: Időpot Árfolyam Ft/euró 08. február 8. 38,33 09. február 8. 37,80 Az adatok a http://www.apiarfolyam.hu/ oldalról lettek letöltve. Adjo meg a táblázat adataiból számítható diamikus viszoyszámot és értelmezze a kapott értéket! 3. Egy termelő vállalatál a fizikai mukát végzők összese 8000 db alkatrészt állítottak elő, amiből a ők teljesítméye 8500 db volt. A vállalatak 950 férfi fizikai dolgozója va. A őkél a termelékeység, azaz az egy főre jutó termelt meyiség 7 db/fő. a Milye viszoyszám található a feladat szövegébe és mi eek a kiszámítási módja? b Szerkessze statisztikai táblát a megadott adatokból és töltse ki a hiáyzó adatokat! 4. Néháy iformáció az ELTE matematika alapszakjára 06-ba jeletkezőkről: az állami fiaszírozásos képzésre 348-a jeletkeztek, 36,494%-uk első helye jeletkezett, végül 0-et vettek fel, míg a költségtérítéses képzési formára jeletkezők 0,7%-át, 9 főt vették fel. Összese 4 ember jelölte be az ELTE matematika szakát első helye. a Milye viszoyszámok találhatók a feladat szövegébe és mi eek a kiszámítási módja? b Szerkessze statisztikai táblát a megadott adatokból és töltse ki a hiáyzó adatokat!
5. Egy vállalat égy részleggel redelkezik, az ott dolgozók bruttó fizetéséről az alábbi adatok állak redelkezésükre: Részleg Átlagkereset e Ft/fő Dolgozók létszáma fő Raktár 00 0 Összeszerelő 50 6 Műhely 50 8 Irodaház 300 0 Összese...... a Milye viszoyszám található a táblázatba és mi eek a kiszámítási módja? b Számítsa ki a hiáyzó potozott értékeket! 6. Egy szálloda 06-os vedégforgalmáról az alábbiakat ismerjük: Származási Vedég- Egy vedég- Egy vedégre ország éjszakák éjszakára jutó jutó vedégszerit száma szállás díja éjszakák száma a vedég éj Ft/éj éj/fő Belföldi 5000 6000 4 Külföldi 4000 000 Összese 9000...... a Határozza meg a teljes hotelre voatkozóa az egy vedégéjszakára jutó szállás díjat, és b az egy vedégre jutó vedégéjszakák számát! 7. Magyarország épességéről az alábbiakat ismerjük: Település jellege Népesség megoszlása Népesség változása 0-be % 990-ről 0-re % Budapest 7,4-4,4 Többi város 5,9 -,4 Községek 30,7-0,8 Összese 00,0... a 990 és 0 között évete átlagosa meyivel változott a budapesti lakosság %-ba kifejezve? b Háy százalékkal változott a épesség száma 990-ről 0-re? c Melyik települése élők részaráya csökket?
Idexszámítás Érték-, ár- és volumeidexek: Idex vagy idexszám: közvetleül em összesíthető, de gazdaságilag összetartozó adatok átlagos változását mutató összetett viszoyszám. Tegyük fel, hogy m külöböző terméket értékesítük két külöböző időszakba, és az értékesítés árbevételét szereték elemezi. Jelölések: q 0,j : a j. termékből eladott meyiség a bázisidőszakba q,j : a j. termékből eladott meyiség a tárgyidőszakba p 0,j : a j. termék egységára a bázisidőszakba p,j : a j. termék egységára a tárgyidőszakba v 0,j : a j. termék értékesítéséből származó árbevétel a bázisidőszakba, számítása: v 0,j = q 0,j p 0,j v,j : a j. termék értékesítéséből származó árbevétel a tárgyidőszakba, számítása: v,j = q,j p,j Egyedi idexek: mostatól a j idexek elhagyva Egyedi volumeidexek: i q = q q 0 i q,j = q,j q 0,j Egyedi áridexek: i p = p p 0 i p,j = p,j p 0,j Egyedi értékidexek: i v = v v 0 = qp q 0p 0 = i p i q i v,j = v,j v 0,j = q,j p,j q 0,j p 0,j Összetett idexek: Bázisidőszaki Tárgyidőszaki Idex fajtája súlyozású vagy súlyozású vagy Fisher-féle Laspeyres-féle Paasche-féle Áridex: Ip 0 q0 p = I q p p = Ip F = Ip q0 p 0 q p Ip 0 Volumeidex: I 0 q = Értékidex: I v = q p 0 I q p q = Iq F = Iq q0 p 0 q0 p 0 Iq v q p = = Iq 0 Ip = Iq Ip 0 v0 q0 p 0 Az idexek képleteibe lévő osztások helyett külöbségeket is lehet képezi, ekkor az I helyett K-t íruk, például K 0 p = q 0 p q0 p 0. Ezek közti összefüggések: K v = K 0 q + K p = K q + K 0 p. Feladatok:. Egy műszaki cikkeket forgalmazó áruház okosóra forgalma a 06/07-es évek decemberébe a következő volt: Eladott meyiség db Ár Ft/db Eladás értéke e Ft Márka 06. 07. 06. 07. 06. 07. q 0 q p 0 p p 0 q 0 p q p 0 q p q 0 Samsug xxx 43 39 43900 49900 887,7 946, 7, 45,7 Huawei xxx 3 9 47900 5900 53,8 534, 389, 69,8 Nokia xxx 40 37 55900 6900 36,0 37,3 068,3 56,0 Soy xxx 6 59900 74900 57,9 98,4 958,4 57,9 Összese............ 694,4 7005,9 67,9 797,4 a Jellemezze az értékesítésbe bekövetkezett meyiségi, ár- és értékváltozásokat egyedi és összetett idexekkel! Értelmezze szövegese az egyes idexeket! b Számítsa ki a meyiségváltozásból ill. árváltozásból adódó bevételmódosulást! 3
Feladatok R:. Egy kereskedelmi egység három fajta paprikás chips-et árul, a következő táblázat a 04/05-ös értékesítésről tartalmaz adatokat: 04. 05. Márka értékesített Egységár értékesített Egységár meyiség db Ft/db meyiség db Ft/db Chio 5 300 30 30 Lays 0 50 30 40 Cheetos 0 00 0 0 Összese............ a Jellemezze az értékesítésbe bekövetkezett meyiségi, ár- és értékváltozásokat egyedi és összetett idexekkel! Értelmezze szövegese az egyes idexeket! b Számítsa ki az árváltozás miatti többletbevételt!. Egy vállalat termelési értékéek árbevételéek a 35,4%-át 04-be az I. számú üzem, a többit pedig a II. számú üzem adta. Az I. számú üzem termékeiek egységára 04-ről 05-re átlagosa 5%-kal, a II. számú üzemé pedig átlagosa 3%-kal csökket. Számítsuk ki a vállalati termelés volumeéek változását, ha ismert, hogy a vállalati termelési érték 3%-kal emelkedett! Értelmezze szövegese a kapott volumeváltozást! 3. Egy kisvállalkozás kétféle terméket gyárt. Termelési adatai: Termék Termelési érték 05-be M Ft Volumeváltozás fajtája folyó áro 04-es áro 04=00% A 50 60 0 B 60 80 0 Összese......... a Határozza meg a termelés értékidexét! b Határozza meg midkét súlyozással az ár- és volumeidexeket! c Számítsa ki az volumeváltozás miatti többletbevételt 04-es árako! 4. Lujza éi kávézójába 3 féle kávét szolgál fel, a családi köyvelésből az alábbi adatok ismertek: Kávéfajta A forgalom értéke Az árak A forgalom értékéek 05-be e Ft alakulása, 05/00 % Cappuccio 000 30 00 Cafe Latte 500 0 80 Espresso 000 0 50 a Számítso érték-, ár- és volumeidexet a kávézó forgalmára voatkozóa! b A forgalom értékéek övekedéséből háy forit volt az ár- és a volumeváltozás hatása? 4
3. Osztályközös gyakorisági sorok Osztályközök Osztályközepek Gyakoriság x,a x,f x f x,a x,f x f......... x k,a x k,f x k f k k f i = i-edik osztályköz: x i = x i,a + x i,f Statisztikák: k f i x i Mitaátlag: x = k f i x i x Tapasztalati szórás: s = k f i x i x Korrigált tapasztalati szórás: s = Tapasztalati módusz: x mo,a + d a h mo, ahol a móduszt tartalmazó osztályköz az, d a + d f amelyikbe az egységyi osztályközhosszúságra jutó gyakoriság a legagyobb x mo,a móduszt tartalmazó osztályköz alsó értéke h mo móduszt tartalmazó osztályköz hossza d a móduszt tartalmazó míusz azt megelőző osztályköz gyakorisága d f móduszt tartalmazó míusz azt követő osztályköz gyakorisága Külöböző hosszúságú osztályközös gyakorisági sor eseté az egységyi osztályközhosszúságra jutó gyakoriságok alapjá számoljuk d a -t és d f -et. Tapasztalati mediá: x i,a + f i h i, ahol f a kumulált gyakoriság és f i a mediá abba az i. osztályközbe va, amelyikre f i és f i x i,a mediát tartalmazó osztályköz alsó értéke h i mediát tartalmazó osztályköz hossza f i mediát megelőző osztályköz kumulált gyakorisága f i mediát tartalmazó osztályköz gyakorisága Tapasztalati z-kvatilis: x i,a + z f i h i, ahol Feladatok R: f i a z-kvatilis abba az i. osztályközbe va, amelyikre f i z és f i z x i,a, h i, f i, f i hasolá defiiálva mit a mediáál. Lakások vízfogyasztásáak adatai: Vízfogyasztás m 3 Lakások száma -30 6 30-40 9 40-50 4 50-60 6 60-8 Számolja ki a lakások vízfogyasztására voatkozó statisztikákat: átlag, módusz, mediá, korrigált szórás és 0,4-es kvatilis! Értelemezze a kapott eredméyeket! 5
Feladatok:. Az élveszületések száma Aprajafalvá 08-ba a csecsemők születéskori súlya szerit: Súly g Élveszületések száma 0-999 000-499 4 500-999 7 3000-3499 6 3500-5000 9 a Számítsa ki papíro, R élkül és értelmezze szövegese az alábbi statisztikákat: mitaátlag, 0,4-es kvatilis b Mit számol az alábbi R program? Értelmezze szövegese a kapott eredméyt! > adatok = arraydim = c5, > colamesadatok = c xi, fi > rowamesadatok = c 0 999, 000 499, 500 999, 3000 3499, 3500 5000 > adatok[, ] = c000, 50, 750, 350, 450 > adatok[, ] = c, 4, 7, 6, 9 > = sumadatok[, ] > sqrtsumadatok[, ] adatok[, ] sumadatok[, ] adatok[, ]/ / [] 74.569 3. A kocetráció elemzése Ha a meyiségi ismérv: diszkrét és viszoylag kevés ismérvérték va, akkor mide ismérvértéket felsoroluk, folytoos vagy sok ismérvérték va, akkor osztályközös gyakorisági sort készítük. : a sokaság elemszáma f i : gyakoriság az i. osztályközbe f i : kumulált gyakoriság az i. osztályközbe, azaz f i = g i : relatív gyakoriság az i. osztályközbe, azaz g i = g i : kumulált relatív gyakoriság az i. osztályközbe s i : az i. osztályköz értékösszege: z i = x i f i s i az i. osztályköz kumulált értékösszege z i : az i. osztályköz relatív értékösszege: z i = si z i az i. osztályköz kumulált relatív értékösszege s i i i f i k= fi f i i Kocetráció: a sokasághoz tartozó teljes értékösszeg jeletős része a sokaság kevés egységére összpotosul. k k Gii-együttható: G = f i f j x i x j. j= Lorez-görbe: a kocetráció mértékét szemléltető ábra. A vízszites tegelye a g i kumulált relatív gyakoriságok, a függőleges tegelye a z i kumulált relatív értékösszegek szerepelek, 0-tól 00%-ig. Behúzzuk a 45 fokos egyeest. Végül megrajzoljuk a 0, 0, g, z, g, z,..., g k, z k,, potok összekötésével kapott töröttvoalat. Kocetrációs területek hívjuk a töröttvoal és az átló által közbezárt területet. Erős a kocetráció, ha a töröttvoal közel va a égyzet oldalaihoz. Gyege a kocetráció, ha a töröttvoal közel va az átlóhoz. Kocetrációs együttható: L = G x Kocetrációs terület -szerese. Értéke 0 és közötti; miél agyobb, aál erősebb a kocetráció. Herfidahl-idex: HI = k zi Értéke k és közötti; miél agyobb, aál erősebb a kocetráció. 6
Feladatok R:. Az egyetem büféjébe egy adott apo az összes vedég fogyasztását megvizsgálták, és ez alapjá az elköltött összegekről az alábbi táblázatot készítették el: Fogyasztás összege Ft Vedégek száma fő 0 00 40 0 500 4 50 800 80 80 00 0 6 Összese 00 Vizsgálja meg az elköltött összegek kocetrációját Lorez-görbével és kocetrációs együtthatóval!. Az előadáso összegyűjtött hallgatói adatok alapjá töltse ki az alábbi táblázatot: Sportolással töltött órák száma Hallgatók száma fő Összese Vizsgálja meg a hallgatók sportolással töltött órái számáak kocetrációját Lorez-görbével és kocetrációs együtthatóval! 7
4. Leíró Statisztika Defiíció Mita. X,..., X valószíűségi változó sorozat. A továbbiakba feltesszük, hogy függetleek és azoos eloszlásúak. Realizációja: x,..., x Defiíció Statisztika. A mita valamely függvéye, pl.: Mitaátlag v. átlag: X = X i Tapasztalati szórás: S = X i X az átlagtól való átlagos abszolút eltérés Korrigált tapasztalati szórás: S = X i X Szórási együttható vagy relatív szórás: V = S X = S 00% az átlagtól való átlagos eltérés százalékba X /megjegyzés: lehet a korrigált tapasztalati szórással számoli/ k-adik tapasztalati mometum k, k Z: m k = Xi k Tapasztalati módusz: a legtöbbször előforduló érték Redezett mita: X... X a mitaelemek em csökkeő sorredbe Tapasztalati mediá: X +, ha páratla és X +X +, ha páros Terjedelem: R = X X legagyobb legkisebb mitaelem z-kvatilis: q z = if{x : F x z}. Ha F ivertálható, akkor q z = F z. Tapasztalati z-kvatilis: q z értelmezése: a mitaelemek z-ed része legfeljebb a q z, z-ed része pedig legalább a q z értéket veszi fel 0 < z < ; sokféleképpe számolható, pl. iterpolációs módszerrel: először megállapítjuk a sorszámot: + z = e + t e: egészrész, t: törtrész, majd kiszámoljuk a z-kvatilist: q z = Xe + txe+ Xe. Kvartilisek: Speciális kvatilisek, alsó vagy első kvartilis: Q = q, 4 mediá: Q = q, felső vagy harmadik kvartilis: Q 3 = q 3 4 Iterkvartilis terjedelem: IQR = q 3 q = Q 3 Q 4 4 Tapasztalati eloszlásfüggvéy: F x = IX i < x { ha X i < x ahol IX i < x = idikátor függvéy 0 ha X i x Az F x tapasztalati eloszlásfüggvéy és az F x elméleti eloszlásfüggvéy közötti eltérés maximuma valószíűséggel egyeletese 0-hoz kovergál, ami azt jeleti, hogy elég agy mita eseté F x éréke mide x-re tetszőleges közel va F x értékéhez és -et övelve mideütt aak közelébe marad. Gliveko-Catelli tétel Defiíció Boxplot. <boxplotom.jpg> A = max{x, Q, 5 IQR}, B = Q, C = Q, D = Q 3, E = mi{x, Q 3 +, 5 IQR} F : kieső értékek, azokat tütetjük fel potokkét, amik A- vagy E- kívülre esek 8
Feladatok R:. Egy szabályos dobókockával égyszer dobtuk és a következőket kaptuk:, 3, 6,. a Számolja ki a mitaátlagot, tapasztalati szórást és korrigált tapasztalati szórást, a szórási együtthatót a korrigált szórást haszálva, valamit a második tapasztalati mometumot! b Számítsa ki és rajzolja fel a tapasztalati eloszlásfüggvéyt is! c Mi a kockadobás elméleti eloszlásfüggvéye? Ábrázolja ezt a függvéyt is! d A f loorruif00, mi =, max = 7 utasítással geeráljo 00 kockadobást és aak ábrázolja a tapasztalati eloszlásfüggvéyét az R program segítségével. Megjegyzés: geerálhat más számú kockadobást is. Mit tapasztal? e Tekitsük a feti a 0, 03, 06, 0 adatokat, melyeket az előzőekből 00-zal való eltolással kaptuk. Meyi lesz most a mitaátlag és a tapasztalati szórás? f Az a-potbeli adatokat szorozzuk meg 3-mal: 3, 9, 8, 3. Hogya változik ekkor a mitaátlag és a tapasztalati szórás?. Egy csoportba a hallgatók magassága cm: 80 63 500 57 65 65 74 9 7 65-68 86 a Nézze rá az adatokra! Reálisak? Javítsa az esetleges adathibákat a holapo található alapadatok fájl alapjá! b Adja meg a redezett mitát! c Rajzolja fel a tapasztalati eloszlásfüggvéyt! Meyi a tapasztalati eloszlásfüggvéy értéke a 80 helye? Értelmezze szövegese! d Elemezze a hallgatók testmagasságát alapstatisztikák: átlag, korrigált tapasztalati szórás, szórási együttható, kvartilisek, terjedelem, iterkvartilis terjedelem, tapasztalati ferdeség, tapasztalati csúcsosság segítségével! e Készítse boxplot ábrát! f Készítse alkalmas osztályközös gyakorisági sort, majd abból hisztogramot! Vesse ezt össze az R program hist utasításával kapott hisztogrammal. 3. Legye adat = c, 0,, 0, 8, 3, 5, 7, 8,, 3, 5,, 7, 8, 3, 5, 3,, 8. Mit számol az alábbi R program? a sumadat < 3 b amestableadat[tableadat == maxtableadat] c sdadat == sqrtsumadat meaadatˆ/legthadat TRUE vagy FALSE? Ameyibe hamis az állítás, hogya lehet igazzá tei? d rep = repc A, B, c0, 0 df = cbidas.data.f rameadat, as.data.f ramerep libraryggplot ggplotdf, aesx = rep, y = adat + geom_boxplotf ill = gold + scale_x_discreteame = A és B csoport 9
4. Statisztikai mita és mitatér Valószíűségi mező: Ω, A, P Ω: emüres halmaz eseméytér, elemi eseméyek ω halmaza kísérlet lehetséges kimeeteleiek halmaza; érmedobás: Ω = {F, I} A Ω: σ-algebra eseméyek családja, az eseméytér összes részhalmaza A A lehetséges kimeetelek halmaza; érmedobás: A = {, {F }, {I}, Ω}, pl. A={F} P : A [0, ] valószíűségi mérték eseméyek valószíűsége; érmedobás: pl. PA = Statisztikai mező: Ω, A, P ha mide P P-re Ω, A, P valószíűségi mező ameyibe P = {P ϑ ϑ Θ R p paramétertér}: paraméteres statisztikai probléma Valószíűségi változó: X : Ω R; érmedobás: pl. Xω = { 0 ha ω = F ha ω = I elemű mita: X=X, X,..., X : Ω χ R valószíűségi változó sorozat, továbbiakba feltesszük, hogy függetleek és azoos eloszlásúak i.i.d rögzített ω Ω eseté X ω = x, X ω = x,..., X ω = x a mita realizációja: x, x,..., x valószíűségi változóra voatkozó darab kísérlet kimeetele, érmedobás: pl. érme ötszöri feldobásáál megfigyelt eseméyek: I, I, F, F, I, így a mita értéke:,, 0, 0, / itt: Ω = {F, I} 5 / Mitatér: χ, R egy részhalmaza; érmedobás: pl. érme ötszöri feldobásáál {0, } 5 Feladatok:. Határozza meg a mitateret a következő esetekbe: a Egy dobókocka háromszori feldobása. / mitatér = {,, 3, 4, 5, 6} 3 / b Egy diák felkelési időpotjait jegyzik fel 0 apo keresztül. / mitatér = [00 : 00, 4 : 00 0 / c Három pézérmét -szer dobuk fel. Megfigyelés: a három pézérme feldobásakor a F dobások száma / mitatér = {0,,, 3} / d Egy ember mide héte vesz egy lottószelvéyt, addig játszik, amíg -es találata lesz. Megfigyelés: a játszott hetek száma / mitatér = N / e Hat ember mide héte vesz egy lottószelvéyt, midegyik addig játszik, amíg -es találata lesz. Megfigyelés: a játszott hetek száma midegyikükél / mitatér = N 6 / 0
5 Becsléselmélet Torzítatla, hatásos és kozisztes becslések Legye X = X, X,..., X egy mita. A T X statisztika becslése a ϑ paraméter gϑ függvéyéek, ahol ϑ Θ R p, ha T : χ Θ. Másképp: A mitatére értelmezett függvéyt statisztikáak hívjuk. Becslést úgy kaphatuk, ha egy statisztikába a mitát behelyettesítjük. A T X statisztika torzítatla becslése a ϑ paraméter gϑ függvéyéek, ha E ϑ T X = gϑ ϑ Θ eseté. Legyeek T X és T X torzítatla becslései gϑ-ak. Ekkor azt modjuk, hogy T X hatásosabb T X-él, ha D ϑ T X D ϑ T X mide ϑ Θ eseté. A T X torzítatla becslést hatásos becslések evezzük, ha mide torzítatla becslésél hatásosabb. A T X becsléssorozat =,,... aszimptotikusa torzítatla becslése gϑ-ak, ha E ϑ T X gϑ ϑ Θ eseté. A T X becsléssorozat =,,... gyegé kozisztes becslése gϑ-ak, ha T X sztochasztikusa gϑ ϑ Θ eseté. Másképpe: ϵ > 0-ra P ϑ T X gϑ ϵ 0 ϑ Θ eseté. Megj. A T becsléssorozat gyegé kozisztes becslése gϑ-ak, ha elégséges feltétel T X aszimptotikusa torzítatla és Dϑ T X 0 Csebisev-egyelőtleség A T X becsléssorozat =,,... erőse kozisztes becslése a gϑ-ak, ha T X vsz.-gel gϑ ϑ Θ eseté. Másképpe: P ϑ {ω : T Xω gϑ} = ϑ Θ eseté. Diszkrét eloszlású X, X,..., X mita eseté: A T X statisztika elégséges a ϑ paraméterre, ha mide x, t párra, a P ϑ X = x T X = t valószíűség em függ ϑ-tól. Megj. T X elégséges h és g ϑ függvéyek, melyekre P ϑ X = x = hx g ϑ T x Abszolút folytoos X, X,..., X mita eseté: A T X statisztika elégséges a ϑ paraméterre, ha a sűrűségfüggvéyek f,ϑ x = hx g ϑ T x alakú faktorizációja. Feladatok: Legye X = X, X,..., X egy mita emlékeztető: feltettük, hogy a továbbiakba a mita függetle és azoos eloszlású valószíűségi változókból áll.. Mutassa meg, hogy a várható érték összes T X = a i X i a i = alakú lieáris becslései közül az átlag a legkisebb szóráségyzetű!. Céluk az ismeretle m paraméter becslése Nm, mita eseté. Tekitsük az alábbi statisztikákat: T X = X 8 T X = X3+X7 T 3 X = X9+X9 8 T 4 X = X a A feti statisztikák közül melyek torzítatlaok, illetve kozisztesek? Amelyik em torzítatla, hogya tudák torzítatlaá tei? b Vizsgálja meg a feti statisztikák közül a torzítatlaokat hatásosság szempotjából! 3. Torzítatlaok-e az alábbi becslések? Ha em, akkor godolkodjuk azo, hogya teheték torzítatlaá. a Mitaátlag a várható értékre. b Tapasztalati szóráségyzet a szóráségyzetre. c Mitaátlag reciproka az expoeciális eloszlás paraméterére.
Megoldás: Tegyük fel, hogy adott egy Ω, A, P = {P ϑ ϑ Θ} paraméteres statisztikai mező, valamit X = X,..., X -elemű mita. a Legye T X = X = X i, és gϑ = E ϑ X, ahol ϑ Θ. Mide ϑ Θ eseté E ϑ T X = E ϑ X i = tehát a mitaátlag torzítatla becslés a várható értékre. E ϑ X i =E ϑ X b Legye T X = X i X, és gϑ = D ϑ X. Vegyük észre, hogy T X = X i X = D ϑx i + =D ϑ X = E ϑx = gϑ, Xi X X i + X = = X E ϑx i D =E ϑ X Xi X. A feti összefüggés alapjá mide ϑ Θ eseté E ϑ T X = E ϑ Xi X = E ϑ Xi E ϑ X = =D ϑ Xi+E ϑ Xi =D ϑ X+E ϑ X = ϑ X i E ϑ X i = = D ϑx + E ϑx D ϑx i =D ϑ X E ϑ X i =E ϑ X = D ϑx + E ϑx D ϑx E ϑx = D ϑx D ϑx = gϑ, tehát a tapasztalati szóráségyzet em torzítatla becslés a szóráségyzetre, de s = X i X az ú. korrigált tapasztalati szóráségyzet torzítatla becslés a szóráségyzetre. c Tegyük fel, hogy a mita eloszlása λ-expoeciális, ahol λ > 0 paraméter, tovább legye T X =, és gλ = λ. Xi Mivel X i Gamma, λ, ezért λ E λ T X = E λ t λγ λ t X = i 0 t Γ e λt dt = Γ 0 Γ e λt dt = =f Γ,λ t = λ λ = gλ, tehát az SX = T X = torzítatla becslés a paraméterre. Xi Vegyük észre, hogy az expoeciális λ > 0 eloszlás eseté E X > -t kaptuk, de megjegyezzük, hogy ez az E X egyelőtleség mide em kostas valószíűségi változó eseté feáll. Más szóval, em kostas X valószíűségi változó eseté sohasem igaz, hogy E X = EX. Bizoyítás a Cauchy-Schwarz egyelőtleség alapjá. 4. Expλ mita eseté adjo torzítatla becslést λ -ra és e 3λ -ra! 5. P oissoλ mita eseté adjo torzítatla becslést e λ -ra és λ -re! 6. Legye X,..., X függetle, azoos abszolút folytoos eloszlású azaz létezik sűrűségfüggvéye valószíűségi változók sorozata. Adja meg X = mix,..., X és X = maxx,..., X eloszlás- és sűrűségfüggvéyét! A miimumál külö is vizsgáljuk meg azt az esetet, ha az X i változók expoeciális eloszlásúak! =
Megoldás. Először határozzuk meg X eloszlásfüggvéyét. Tetszőleges t R eseté F X t = P X < t = P X t = P {X i t} = PX i t = = [ P X i < t] = [ F Xi t] = [ F X t]. Az X sűrűségfüggvéye az eloszlásfüggvéye deriválásával kapható meg. Tetszőleges t R eseté f X t = [ F X t] f X t = [ F X t] f X t. Az X esetébe is először az eloszlásfüggvéyt határozzuk meg. Mide t R eseté F X t = P X < t = P {X i < t} = PX i < t = [F X t]. Az X sűrűségfüggvéyét ismét deriválással határozzuk meg. Mide t R eseté f X t = [F X t] f X t. A továbbiakba tegyük fel, hogy X Expλ, ahol λ > 0. Ekkor F X t = e λt Idt > 0, illetve f X t = λe λt Idt > 0, tehát F X t = e λ t Idt > 0 f X t = λe λ t Idt > 0. Azt kaptuk, hogy függetle azoos λ-paraméterű expoeciális eloszlások miimumáak eloszlása szité expoeciális eloszlású, melyek paramétere λ. 7. Mutassa meg, hogy expoeciális eloszlású mita eseté T X = X statisztika torzítatla, de em kozisztes becslése a várható értékek! 8. A [0, ϑ] itervallumo egyeletes eloszlásból vett elemű mita alapjá adjuk tapasztalati becslést a ϑ > 0 paraméterre több megoldás is lehetséges! Torzítatla-e a becslés? Ha em, akkor tegyük torzítatlaá! Melyik a hatásosabb? Melyik kozisztes? Megoldás: Legye T X = X i, és gϑ = ϑ. Ekkor mide ϑ > 0 eseté E ϑ T X = E ϑ X i = E ϑ X i =E ϑ X = E ϑ X = ϑ ϑ = gϑ, tehát a mitaátlag em torzítatla becslés a paraméterre, de T X = T X = X i torzítatla becslés a paraméterre. Egy másik megoldás: Legye SX = maxx,..., X, és gϑ = ϑ. Határozzuk meg SX eloszlásfüggvéyét. Az eloszlásfüggvéy szité függ a ϑ paramétertől, de ezt az alábbi számolásba em tütetjük fel. F SX t = PmaxX,..., X < t = P {X i < t} = PX i < t = [F X t]. =PX <t=f X t Ebből deriválással megkapható a sűrűségfüggvéy. A sűrűségfüggvéy szité függ a ϑ paramétertől, de ezt az alábbi számolásba most sem tütetjük fel. { f SX t = [F X t] = [F X t] t f X t = ϑ ϑ ha 0 < t ϑ 0 egyébkét. Jelölje f ϑ t az SX statisztika P ϑ szeriti sűrűségfüggvéyét. Ekkor mide ϑ > 0 eseté E ϑ SX = tf ϑ tdt = ϑ 0 t dt = [ ] t + ϑ ϑ ϑ = ϑ + + t=0 ϑ + = + ϑ ϑ = gϑ, de S X = + + SX = maxx,..., X torzítatla becslés a paraméterre. 3
9. Keressük elégséges statisztikát a következő eloszlásokból vett elemű mita alapjá! Miimális elégséges-e? a Poissoλ, ahol λ > 0 paraméter. b Idikátorp, ahol 0 < p < paraméter. c Biomiálisr, p, ahol r ismert és 0 < p < paraméter. d Diszkrét egyeletes az {,,..., N} halmazo, ahol N =,, 3,... paraméter. e Expoeciálisλ, ahol λ > 0 paraméter. Megoldás: a Legye X = X,..., X Poissoλ eloszlásból származó -elemű mita, ahol λ > 0. L x λ; = P λ X = x = P λ {X i = x i } = P λ X i = x i = = x i! =hx λ }{{ xi e λ } g λt x, így a Neyma Fisher-féle faktorizációs tétel alapjá T X = X i elégséges statisztika. Mide x, y realizációra L x λ; L y λ; = x i! λ xi e λ y i! λ yi e λ = x i! λ xi y i! yi, λ xi x i! e λ = ami potosa akkor em függ λ-tól, ha x i = y i, azaz T x = T y, tehát T X miimális elégséges statisztika. b Legye X = X,..., X Idikátorp eloszlásból származó -elemű mita, ahol 0 < p < paraméter. L x p; = P p X = x = P p {X i = x i } = P p X i = x i = p xi p xi Id{x i = 0 vagy } = = p xi p xi } {{ } =g pt X Id{ i [] : x i = 0 vagy }, =hx így a Neyma Fisher-féle faktorizációs tétel alapjá T X = X i elégséges statisztika. Mide x, y realizációra L x p; L y p; = p xi p xi Id{ i [] : x i = 0 vagy } yi p yi Id{ i [] : y i = 0 vagy }, p ami potosa akkor em függ p-től, ha x i = y i, azaz T x = T y, tehát T X miimális elégséges statisztika. c Legye X = X,..., X Biomiálisr, p eloszlásból származó -elemű mita, ahol r ismert és 0 < p < paraméter. r L x p; = P p X = x = P p {X i = x i } = P p X i = x i = p xi p r xi = = r x i } {{ } =hx p xi p r xi } {{ } =g pt x így a Neyma Fisher-féle faktorizációs tétel alapjá T X = X i elégséges statisztika. Mide x, y realizációra L x p; L y p; =, r x i p xi p r xi r x r y i p yi p r = i Yi r p xi yi p yi xi, y i ami potosa akkor em függ p-től, ha x i = y i, azaz T x = T y, tehát T X miimális elégséges statisztika. x i 4
d Legye X = X,..., X az {,,..., N} halmazo egyeletes eloszlásból származó -elemű mita, ahol N =,, 3,... paraméter. L x N; = P N X = x = P N {X i = x i } = P N X i = x i = N Idx i N = = N Idx N, g N T x és hx, így a Neyma Fisher-féle faktorizációs tétel alapjá T X = X elégséges statisztika. Mide x, y realizációra L x N; L y N; = N Idx N N Idy N, ami potosa akkor em függ N-től, ha x = y, azaz T x = T y, tehát T X miimális elégséges statisztika. e Legye X = X,..., X Expoeciálisλ eloszlásból származó -elemű mita, ahol λ > 0 paraméter. Feladatok R: L x λ; = f λ x = f λ x i = λe λxi Idx i > 0 = λ e λ xi } {{ } =g λ T x így a Neyma Fisher-féle faktorizációs tétel alapjá T X = X i elégséges statisztika. Mide x, y realizációra L x λ; L y λ; = λ e λ xi Id i [] : x i > 0 λ e λ yi Id i [] : y i > 0, Id i [] : x i > 0, =hx ami potosa akkor em függ λ-tól, ha x i = y i, azaz T x = T y, tehát T X miimális elégséges statisztika. 0. Geeráljo 00000-szer 6 elemű [0,3] itervallumo egyeletes eloszlású mitát és határozza meg a 8. feladat becsléseit, majd hasolítsa is össze azokat! 5
7. Maximum-likelihood becslések Legyeek X, X,..., X függetle azoos eloszlású i.i.d. valószíűségi változók, és legye ϑ Θ az ismeretle paraméter Likelihood függvéy: Lϑ, x = f ϑ x = f ϑ x i, ha az eloszlás folytoos, Lϑ, x = P ϑ X = x = P ϑ X i = x i, ha az eloszlás diszkrét. Log-likelihood függvéy: lϑ, x = llϑ, x Maximum-likelihood módszer ML-módszer az imeretle paraméter becslésére: Azt a paraméterértéket keressük, ahol a likelihood függvéy a legagyobb értéket veszi fel azaz diszkrét esetbe az ismeretle paraméter azo értéket keressük, amely mellett a bekövetkezett eredméy maximalis valószíűségű: max Lϑ, x Ameyibe a függvéy deriválható ϑ szerit, akkor a maximumot kereshetjük a szokásos módo, az első és második deriváltak segítségével, azoba a feladatukat jeletőse megehezíti, hogy olya -szeres szorzatot kellee deriváli, amelyikek mide tagjába ott va az a változó, ami szerit deriváluk kellee. Ezért likelihood függvéy helyett a log-likelihood függvéy maximumhelyét keressük. Ha ϑ dimeziós, akkor ϑ lϑ, x = 0, míg ha ϑ = ϑ,..., ϑ p p dimeziós, akkor ϑi lϑ, x = 0 megoldásából kapjuk a becslést. A második deriváltak segítségével elleőrizzük, hogy valóba maximum. Tétel ML-becslés ivariás tulajdosága: Ha ϑ ML-becslése ˆϑ, akkor tetszőleges g függvéy eseté gϑ ML-becslése g ˆϑ. Feladatok:. Legyeek X, X,..., X függetle azoos eloszlású valószíűségi változók az alábbi eloszlásokból. Számolja ki az ismeretle paraméterek ML-becslését! a Bim, p biomiális eloszlás tfh. m N adott b Geop Pascal-eloszlás c Expλ expoeciális eloszlás d Γα, λ Gamma-eloszlás tfh. α R + adott ϑ 7. Mometumok módszere E módszert akkor szokás alkalmazi az imeretle paraméterek becslésére, amikor sok ismeretle paraméter va, és a ML becslést ehéz kiszámítai. i A mitából számítható tapasztalati mometumokat m k := xk i egyelővé tesszük az elméleti mometumokkal M k := E ϑ X k, az elsőtől kezdve, potosa ayit, ameyi paraméter va. Tehát p darab ismeretle paraméter eseté a következő p ismeretlees egyeletredszert kell megoldai: M = m = x Feladatok:. M p = m p. Legyeek X, X,..., X függetle azoos Ea, b eloszlású valószíűségi változók. Számolja ki az ismeretle paraméterek mometum-becslését!. Legyeek X, X,..., X függetle azoos Nµ, σ eloszlású valószíűségi változók. Mutassa meg, hogy a maximum likelihood módszerrel és a mometumok módszerével is ugyaazokat a becsléseket kapjuk µ-re és σ-ra is! 6
7.3 Fisher-féle iformáció Legyeek X, X,..., X függetle azoos abszolút folytoos eloszlású i.i.d. valószíűségi változók f ϑ sűrűségfüggvéyel, és legye ϑ Θ az ismeretle paraméter Fisher-féle iformáció: I ϑ = E ϑ lϑ, X, egy mitaelem iformációja: I ϑ = E ϑ ϑ ϑ l f ϑx Ha I ϑ < és a hogy f ϑ x ϑ dx = 0 bederiválási feltétel teljesül, akkor E ϑ ϑ l f ϑx = 0 is teljesül, amiből következik, I ϑ = I ϑ. Megj. Mivel E ϑ ϑ l f ϑx = 0, az egy elemű mita Fisher-féle iformációja: I ϑ = Dϑ ϑ l f ϑx. Cramér-Rao egyelőtleség: f ϑ x Ha I ϑ < és dx = 0 bederiválási feltétel, továbbá a T X statisztika a ψ függvéyel képzett ψϑ paraméterfüggvéy torzítatla becslése, Dϑ T X < és T x f ϑx ϑ dx = T xf ϑ x dx, akkor R ϑ ϑ R D ϑ T X ψ ϑ I ϑ = ψ ϑ I ϑ = iformációs határ Megj. Speciálisa, ha T X torzítatla becslése ϑ-ak, továbbá a feti regularitási feltételek teljesülek, akkor D ϑt X I ϑ = I ϑ. Megj. A Cramér-Rao tétel em azt állítja, hogy az iformációs határ elérődik valamely torzítatla becslés eseté. Viszot ha elérődik, akkor az a T becslés hatásos sőt az egyetle ilye. Az is lehet, hogy va hatásos becslés, de az iformációs határ em érődik el. Feladatok:. Számítsuk ki a Fisher-iformációt a következő eloszláscsaládokból vett elemű mita eseté. a Poissoλ, ahol λ > 0 paraméter, b Idikátorp, ahol 0 < p < paraméter, c Biomiálisr, p, ahol r ismert és 0 < p < paraméter, d Expoeciálisλ, ahol λ > 0 paraméter, e Gammaα, λ, ahol α ismert és λ > 0. 7
8. Kofideciaitervallumok Eddig: potbecslés, azaz a becsüledő paramétert vagy aak függvéyét a mitaelemekből képzett egyetle statisztikával becsültük. Nem elég iformatív, em tudi meyi bizoytalaság va a becslésbe. Most: a becslés egy egész itervallum, melyek határai statisztikák Legye Ω, A, P statisztikai mező, ahol P = {P ϑ ϑ Θ R p }, és legye X,..., X függetle, azoos eloszlású mita. Defiíció Kofideciaitervallum. A T X, T X statisztikapárral defiiált itervallum legalább ε szitű kofideciaitervallum a ψϑ paraméterfüggvéyre, ha P ϑ T X < ψϑ < T X ε ϑ Θ ahol ε előre adott kis pozitív szám pl. ε = 0, 05, az ehhez tartozó kofideciaszit 95%. Kofideciaitervallum a ormális eloszlás várható értékére - ismert szórás eseté: Legyeek X,..., X Nµ, σ függetle azoos eloszlású mita, σ ismert, µ ismeretle paraméter, ekkor az α megbízhatósági szitű kofideciaitervallum µ-re: ahol u α X u α a stadard ormális eloszlás megfelelő kvatilisét jelöli. - ismeretle szórás eseté: σ, X + u α Legyeek X,..., X Nµ, σ függetle azoos eloszlású mita, σ és µ ismeretle paraméterek, ekkor az α megbízhatósági szitű kofideciaitervallum µ-re: ahol t, α X t, α σ S, X S + t, α az szabadsági fokú t-eloszlás megfelelő kvatilisét jelöli. Megj.: A kofideciaitervallum hossza aál kisebb, miél agyobb az mitaelemszám és miél kisebb a szórás. Ezeket kostas szite tartva, a szigifikaciaszit övelésével ε csökketésével viszot ő a kofideciaitervallum hossza. Kofideciaitervallum a ormális eloszlás szóráségyzetére Legyeek X,..., X Nµ, σ függetle azoos eloszlású mita σ ismeretle paraméterrel, ekkor az α megbízhatósági szitű kofideciaitervallum σ -re: S χ,, α S χ, α ahol χ, α ill. χ, α értékek az szabadsági fokú χ -eloszlás megfelelő kvatiliseit jelöli. Feladatok R:. Legye ξ,..., ξ 5 függetle azoos Nµ, eloszlású mita. A megfigyelt értékek a következők: 4, 3,,, 6 a Határozza meg 95%-os megbízhatóságú kofideciaitervallumot µ-re! b Háy elemű mitára va szükség, ha azt szereték, hogy a kofideciaitervallum legfeljebb,5 hosszúságú legye? c Mi változik az a esetbe, ha a szórást em ismerjük? d Adjo a szóráségyzetre 98%-os megbízhatósági kofideciaitervallumot! e Oldja meg a feladatot abba az esetbe, ha a mita Nm + 5, eloszlásból származik! 8
. Tekitsük a 4. gyakorlat. feladatába szereplő hallgatói javított magassságokat cm. a Tegyük fel, hogy a hallgatók magassága ormális eloszlású 0 cm szórással. Adjo 95% megbízhatósági kofideciaitervallumot a hallgatók magasságáak várható értékére! b Adjo kofideciaitervallumot abba az esetbe is, ha a szórást em ismerjük! c Háy elemű mitára va szükség, ha azt szereték, hogy a kofideiciaitervallum legfeljebb 8 cm hosszúságú legye? 3. Egy műszerrel tízszer megmértük egy elleállást, és a következő adatokat kaptuk: 0., 9.9, 8.9, 9.5, 9.8, 9.4, 9.3, 0.0, 9.5, 9.6 Ω. Adjuk 90%-os megbízhatósági szitű kofideciaitervallumot az elleállás téyleges értékére! a Meyibe változik a kofidecia itervallum ha tudjuk, hogy műszer mérési eredméyéek a szórása 0.4 Ω? 4. Egy gép előírt hosszúságú darabokat vág le egy acéllemezből, de a hosszúság ormális eloszlású igadozást mutat, melyek szóráségyzete 9 cm. Adjuk 95%-os megbízhatósági szitű kofidecia itervallumot a levágott darabok átlagos hosszára, ha egy 8 elemű mita átlaga 8 cm! 5. Az előző évbe figyelemmel kísértük a sárkáyföldi tőzsdeidex, a SüSüX változását. Az alapstatisztikák: átlag: 3,8; szórás: 95,3. A tőzsde 00 apo keresztül volt yitva. Adjo ezek alapjá 95%-os megbízhatóságú kofideciaitervallumot az idex adott évre voatkozó várható értékére! 9
9. Hipotézisvizsgálat Hipotézis: állítás, amiek igazságát vizsgáli szereték Statisztikai próba: eljárás amiek a segítségével dötést hozhatuk a hipotézisről Legye Ω, A, P statisztikai mező, ahol P = {P ϑ ϑ Θ R p }, és legye X = X,..., X függetle, azoos eloszású mita a P ϑ sokaságból. Jelölje X a mitateret. Nullhipotézis: H 0 : ϑ Θ 0 Ellehipotézis: H : ϑ Θ Paramétertér: Θ = Θ 0 Θ Dötés: T X statisztika T : X R próbastatisztika segítségével, melyek ismerjük az eloszlását a ullhipotézis feállása eseté Mitateret két részre botjuk: X = X e X k és X e X k = X k : kritikus tartomáy azo X megfigyelések halmaza, amikre elutasítjuk a ullhipotézist X e : elfogadási tartomáy azo X megfigyelések halmaza, amikre elfogadjuk a ullhipotézist Kritikus érték: c függ α-tól, ld. alább X k = {x X : T x c} vagy X k = {x X : T x c} vagy X k = {x X : T x c} X e = {x X : T x < c} X e = {x X : T x > c} X e = {x X : T x < c} Dötés Valós állapot H 0 -t elfogadjuk X e H 0 -t elvetjük X k H 0 igaz ϑ Θ 0 helyes dötés α elsőfajú hiba α H 0 hamis ϑ Θ másodfajú hiba β helyes dötés β Elsőfajú hiba valószíűsége: Egyszerű hipotézis Θ 0 halmaz egyelemű eseté: P ϑ0 X X k = α ϑ 0 Θ 0 / = Pelvetjük H 0 -t H 0 igaz / Összetett hipotézis Θ 0 halmaz több elemű eseté: P ϑ X X k α ϑ Θ 0 Próba potos terjedelme vagy szigifikaciaszitje: α = sup{p ϑ X X k : ϑ Θ 0 } Megbízhatósági kofidecia- szit: α / = Pelfogadjuk H 0 -t H 0 igaz / A próba meghatározása: előre rögzített α terjedelemhez azt a c értéket keressük, amire a próba potos terjedelme éppe α. Másodfajú hiba valószíűsége: βϑ = P ϑ X X e = P ϑ X X k ϑ Θ / = P ϑ elfogadjuk H 0 -t H 0 hamis / Erőfüggvéy: ψϑ = βϑ / = Pelvetjük H 0 -t H 0 hamis / Miél erősebb a próba, aál agyobb valószíűséggel veti el a hamis ullhipotézist. Vagyis a próba ereje aak a valószíűsége, hogy egy adott külöbséget adott mitaagyság és terjedelem mellett egy statisztikai próba kimutat. Kísérletek tervezésekor az erő agyságáak előre meghatározott értékéből határozható meg a mitaelemszám. A próba erejét addig em tudjuk kiszámoli, ameddig az ellehipotézis egy értékét em rögzítjük ill. em modjuk meg a külöbég agyságát, amit ki szereték mutati. p-érték: aak a valószíűsége, hogy igaz H 0 eseté a tapasztalt eltérést vagy aál agyobb eltérést kapuk. Ha egy próbát számítógép segítségével végzük el, redszerit a p-érték révé tuduk dötei: ha p-érték< α, akkor elvetjük H 0 -t. A hipotézisek em egyeragúak. H 0 -t csak idokolt esetbe szereték elutasítai, így az elsőfajú hiba súlyosabbak számít, mit a másodfajú hiba. Általába az elsőfajú hiba legagyobb valószíűségét adjuk meg, de a másodfajú hiba csökketésére is törekszük pl. mitaagyság övelésével. H 0 elfogadása: statisztikailag em találtuk komoly bizoyítékot arra, hogy H 0 em lee igaz; vagyis H 0 elfogadása eseté sem lehet állítai, hogy H 0 teljesül H 0 elvetése: statisztikailag komoly bizoyítékot találtuk arra, hogy a H 0 em igaz, azaz H igaz 0
Hipotézisvizsgálat: Paraméteres próbák Egymitás próbák X,..., X Nµ, σ függetle azoos eloszlású mita, µ ismeretle paraméter H 0 : µ = µ 0 H 0 : µ µ 0 H 0 : µ µ 0 H : µ µ 0 H : µ > µ 0 H : µ < µ 0 Egymitás u-próba σ ismert Próbastatisztika: u = X µ 0 σ H 0 eseté N0, Kritikus tartomáyok: X k = {X : u > u α } X k = {X : u > u α } X k = {X : u < u α } = {X : u > u α vagy u < u α } <hipovizsgu.jpg> <hipovizsgur.jpg> <hipovizsgul.jpg> Kapcsolat a kofideciaitervallummal az alábbi lépések ekvivalesek: u > u α u > u α vagy u < u α X µ 0 σ X µ 0 > u α σ vagy X µ 0 < u α > u α vagy X µ 0 σ σ µ 0 / X u α σ, X + u α < u α σ Vagyis a ullhipotézist kétoldai potosa akkor utasítjuk el, ha az α megbízhatósági szitű kofideciaitervallum µ-re em tartalmazza µ 0 -t. Egymitás t-próba σ ismeretle Próbastatisztika: t = X µ 0 s H 0 eseté t Kritikus tartomáyok: X k = {X : t > t, α/ } X k = {X : t > t, α } X k = {X : t < t,α } Kétmitás próbák X,..., X Nµ, σ és Y,..., Y m Nµ, σ függetle miták, µ és µ ismeretle paraméterek H 0 : µ = µ H 0 : µ µ H 0 : µ µ H : µ µ H : µ > µ H : µ < µ a két mita a két mita párokét összetartozó, függetle em függetle σ és σ ismert Kétmitás u-próba Egymitás u-próba a külöbségekre előzetes F-próba σ és σ ismeretle σ = σ σ σ Egymitás t-próba Kétmitás t-próba Welch-próba a külöbségekre Kétmitás u-próba σ, σ ismert Próbastatisztika: u = X Y σ + σ m H 0 eseté N0, előzetes F-próba σ, σ ismeretle H 0 : σ = σ H : σ σ Próbastatisztika: s H 0 eseté s F = F,m ha s > s s F m, ha s > s s H 0 eseté Kétmitás t-próba σ = σ ismeretle m Próbastatisztika: t = + m X Y s +m s +m H 0 eseté t +m Welch-próba σ σ ismeretle Próbastatisztika: t = X Y s + s m H 0 eseté t f, ahol f S + S m S S + m m
Feladatok R:. Azt szereték vizsgáli, hogy a api középhőmérséklet október 8-á Budapeste 5 C alatt volt-e. Az elmúlt 4 év api középhőmérsékletei a következők voltak: 4, 8;, ; 6, 8;, C, valamit tegyük fel, hogy az adatok ormális eloszlásból származak. a Írjuk fel a ull- és ellehipotézist! b Tegyük fel, hogy a api középhőmérséklet szórása σ =. Tesztelje a feti hipotézist α = 0.05 terjedelem mellett! Adja meg a kritikus tartomáyt és p-értéket! Mi a dötés? c Tesztelje a hipotézist úgy is, hogy em haszálja a szórásra voatkozó előzetes iformációt! d Milye hipotézist írjuk fel, ha azt szereték vizsgáli, hogy a api középhőmérséklet október 8-á Budapeste 5 C-tól külöböző volt? Teszteljük a feti adatok segítségével!. Bublisztába az ÖDSZ párt vezetőségi tagjaiak havi keresete millió bublikba jól közelíthető Nµ, eloszlással. A többi lakosál a kereset Nµ, 4 eloszlással közelíthető. Rita TORA okyomozó újságíró kiderítette éháy a Nagy vezér stadioba szurkoló ember keresetét: VIP páholyba ülők: 0.47,.0, 8.67, 6.67, 8.00, 0.40,.7, 0.05, 4.85, 9.93, 9.73, 0.39 Normál sorokba ülők: 4.56, 6.67, 4.0,.9, 3.89, 5.48, 3.89, 0., 5.3, 4.4,.36, 0. a Ameyibe a VIP páholyba csak az ÖDSZ párt vezetőségi tagjai ülek, akkor 5%-os elsőfajú hibavalószíűség mellett elfogadja-e a H 0 : µ = 0 hipotézist a kétoldali ellehipotézissel szembe? b Ameyibe az ÖDSZ párt vezetőségi tagjai csak a VIP páholyba ülek, akkor 5%-os elsőfajú hibavalószíűség mellett elfogadja-e a H 0 : µ = 0 hipotézist a kétoldali ellehipotézissel szembe? c Meyi a p érték a b részfeladatál? d El tudja-e fogadi a H 0 : µ = µ hipotézist? 3. A fogyasztóvédelmi hatóság többszöri lakossági bejeletést kapott, hogy a Portokall evű, fél literes kiszerelésű aracsitalokba a flakora írt 500 ml-él jóval kevesebb üdítő va. Ez alapjá vizsgálatot kezdtek, a fogyasztóvédelem mukatársa vásárolt a boltba 0 darabot, majd megézte a bee lévő édes edű térfogatát ml: 483, 50, 498, 496, 50, 483, 494, 49, 505, 486. Tegyük fel, hogy egy fél literes üdítős üvegbe töltött aracslé meyisége ormális eloszlást követ. Állíthatjuk-e 95%-os megbízhatóság eseté, hogy a Portokall gyártója át akarja veri a vevőket? 4. A Természettudomáyi Kar II. évfolyamá az egyik gyakorlati csoportba 0-e írtak statisztika zárthelyit. Két feladatsor volt, midkettőbe 5 potot lehetett eléri. Tegyük fel, hogy az elért potszámok ormális eloszlásúak. A potszámokat az alábbi táblázat tartalmazza.. feladatsor 8 4 0. feladatsor 5 4 9 5 a Vajo az első feladatsor ehezebb volt? b Meyibe változik a helyzet, ha em 0 diákról, haem csak 5-ről va szó, és a. feladatsor a pótzh eredméye? 5. Az alábbi két mita 0 egyforma képességüek feltételezett sportoló súlylökésbe elért eredméyeit tartalmazza. A sportolók két ötfős csoportba készültek az edzőtáborba. Edzéstervük ugyaaz volt, de az első csoportba készülők mide reggel fejekét 0 tojást és 5 túró rudit ettek meg. A második csoportba készülőkek reggel és este - kg szaloát és - kg madártejet kellett megei. hét felkészülés utá értékelték az eredméyeket. Tételezzük fel, hogy ormális eloszlásból származak a miták és a terjedelem 5%.. csoport 5,8 5, 6,3 7, 6,. csoport 9,0, 7, 4,7,0 a Melyik diéta volt jobb, ha a dobások szórását -ek tekitjük? b Állíthatjuk-e, hogy a második csoportba agyobb változékoyságot mutat a sportolók teljesítméye? c Ha em ismerjük a szórást, akkor tekithetjük-e valamelyik diétát jobbak?
0. Hipotézisvizsgálat: Nemparaméteres próbák Diszkrét illeszkedésvizsgálat Legye X,..., X egy elemű mita és tegyük fel, hogy a mitaelemek r külöböző x j j =,... r értéket vehetek fel. Továbbá jelölje ν j j =,... r az egyes értékek megfigyelt gyakoriságát, azaz függetle megfigyelést osztályozuk valamilye szempot szerit, r párokét diszjukt osztályba. Az egyes osztályok feltételezett valószíűségei redre p,... p r. Osztályok... r Összese Értékek x x... x r Gyakoriságok ν ν... ν r Valószíűségek p p... p r Azt vizsgáljuk, hogy a mita eloszlása megegyezik-e a feltételezett eloszlással. Ismert eloszlás eseté tiszta illeszkedésvizsgálatot végzük. Ha viszot az eloszlás paraméteres és csak az eloszláscsaládot ismerjük, a paramétereket viszot em pl. az a kérdés, hogy származhatak-e az adatok p paraméterű biomiális eloszlásból, akkor becsléses illeszkedésvizsgálatot végzük. Tiszta illeszkedésvizsgálat: H 0 : P X i = x j = p j j =,..., r H : legalább egy j melyre P X i = x j p j Próbastatisztika: T = r ν j p j j= Becsléses illeszkedésvizsgálat: p j H 0 eseté χ r Kritikus tartomáy: X k = {x : T x > χ r, α} Legye θ egy s dimeziós paramétervektor, valamit legye ˆθ a θ paramétervektor ML-becslése, és legye ˆp j = p j ˆθ. H 0 : P X i = x j = ˆp j j =,..., r H : legalább egy j melyre P X i = x j ˆp j Próbastatisztika: T = r ν j ˆp j j= ˆp j H 0 eseté χ r s Kritikus tartomáy: X k = {x : T x > χ r s, α} Megjegyzés: Mivel a próba aszimptotikus, vigyázuk kell arra, hogy a mita elemszáma elég agy legye. Koyhaszabálykét meg szokás követeli, hogy az ú. elméleti gyakoriság p j legalább 5 legye. Ha ez em teljesül, akkor a kis várt gyakoriságokkal redelkező eseméyeket összevojuk. Függetleségvizsgálat függetle megfigyelést két szempot szerit osztályozuk, az. szempot szerit r osztály, míg a. szempot szerit s osztály va. Aak a valószíűsége, hogy egy megfigyelést az. szempot szerit az i-edik, a második szerit pedig a j-edik osztályba soroluk, p ij. Az ilye tulajdoságú megfigyelések számát pedig ν ij -vel jelöljük. Az osztályozási eljárás eredméyét ú. kotigeciatábla formájába szokás megadi:. szempot... j... s Sorösszegek ν... ν j... ν s ν...... szempot i ν i... ν ij... ν is ν i..... r ν r... ν rj... ν rs ν r Oszlopösszegek ν... ν j... ν s ν ij = megfigyelések gyakorisága az i, j osztályba ν i = s ν j = r ν ij j= ν ij Hasolóa p i ill. p j a margiális eloszlást jelölik, tehát a [p ij ] mátrix sor-, illetve oszlopösszegei: p i = s H 0 : a két szempot függetle egymástól, azaz p ij = p i p j i r, j s H : a két szempot em függetle, azaz p ij p i p j legalább egy i, j párra p ij j= p j = r p ij 3
Próbastatisztika: T = r j= s νij νi ν j ν i ν j H 0 eseté Kritikus tartomáy: X k = {x : T x > χ r s, α } χ r s Megjegyzés: Ha r = s =, akkor a próbastatisztika a következőképpe leegyszerűsödik: T = ν ν ν ν H 0 eseté χ ν ν ν ν. Homogeitásvizsgálat Va két függetle miták adatsoruk az egyikbe, a másikba m megfigyeléssel. Valamilye szempot szerit r, párokét diszjukt osztályba soroljuk a megfigyeléseket. Az i-edik osztály valószíűsége p i az. mita és q i a. mita eseté i =,,..., r. Legyeek az egyes osztályok gyakoriságai ν,..., ν r az. mita és µ,..., µ r a. mita eseté. Osztályok... r Összese. mita Gyakoriságok ν ν... ν r Valószíűségek p p... p r. mita Gyakoriságok µ µ... µ r m Valószíűségek q q... q r Azt vizsgáljuk, hogy a két mita ugyaolya eloszlás szerit sorolódik-e be az egyes osztályokba: H 0 : a két eloszlás megegyezik, azaz p i = q i i =,... r H : a két eloszlás em egyezik meg, azaz legalább egy i, hogy p i q i Próbastatisztika: T,m = m Feladatok R: r νi µi m H 0 eseté χ r Kritikus tartomáy: X k = {x : T,m x > χ ν i + µ r, α} i. Egy gyárba egy termék miőségét 4 elemű mitákat véve elleőrzik, havota 300 mitavétellel. Megszámolták, hogy a legutóbbi hóapba háyszor volt selejtes a mita, melyek eredméyeit az alábbi táblázat tartalmazza: Selejtesek száma 0 3 4 Darabszám 80 3 77 7 3 Modellezhető a mitákba levő selejtesek száma a 4; 0, 5, ill. b 4; p paraméterű biomiális eloszlással α = 0, 05?. Az alábbi kotigecia-táblázat mutatja, hogy egy 00 éves időszakba egy adott apo a csapadék meyisége és az átlaghőmérséklet hogya alakult: Hőmérséklet Csapadék kevés átlagos sok hűvös 5 0 5 átlagos 0 0 0 meleg 5 0 5 A cellákba az egyes esetek gyakoriságai találhatóak. α = 0, 05 mellett tekithető-e a csapadékmeyiség és a hőmérséklet függetleek? 3. Két dobókockával dobva az alábbi gyakoriságokat figyeltük meg: Dobások 3 4 5 6. kocka 7 4 6 3 8 3. kocka 8 5 4 0 α = 0, 05 mellett dötsük arról, hogy tekithető-e a két eloszlás azoosak! 4
0. Egyszerű lieáris regresszió Adott x, y,..., x, y számpárokra szereték egyeest illesztei. Modell: y i = ax i + b + ε i, ahol ε i függetle, azoos eloszlású hiba, általába feltesszük, hogy ormális eloszlású Eε i = 0 és D ε i = σ < i =,..., Cél: a és b becslése Módszer: legkisebb égyzetek: mi Megoldás: â = y i ax i + b xi xy i y xi x, eek szóráségyzete: D â = σ xi x ˆb = y âx, eek szóráségyzete: D ˆb = σ + x xi x Reziduálisok: ˆε i = y i ŷ i = y i âx i + ˆb i =,..., Reziduális szóráségyzet becslése: ˆσ yi ŷ i = = SSE = MSE Szóródások: yi y = ŷ i y + y i ŷ i, azaz SST = SSR + SSE Tapasztalati korrelációs együttható: R = Determiációs együttható: R = SST SSE SSE Illeszkedésvizsgálat grafikusa: Q-Q plot xi xy i y xi x y i y Grafikus ábrázolási módszer, amely a mita eloszlásáról feltett hipotézisvizsgálatra ad szemléletes iformációt pl. az adatok ormális eloszlásúak-e. Ekkor a tapasztalati megfigyelt és az elméleti illesztett eloszlást, illetőleg az ezekből kapott kvatiliseket vetjük össze. A következőkbe csak ormális eloszlás vizsgálatára ézzük a módszert, de kiterjeszthető más eloszlásokra is. Normalitásvizsgálat Jelölje x, x,..., x a mitát és x x x pedig a redezett mitát. Ez utóbbi x i értékek a tapasztalati kvatilis értékek i azaz a talpasztalati eloszlásfüggvéy értékeihez tartozó kvatilisek. Az elméleti kvatilis értékek pedig az + potokba a stadard ormális eloszlás kvatilisei: Φ i +, i =,,...,. A Q-Q plot a Φ i +, x i redezett párok a síko, i =,...,. Ha a mita ormális eloszlásból származik, a potok megközelítőleg egy egyees voalo fogak elhelyezkedi. Megjegyzés: Külöböző eljárások/programok külöbözőképpe adják meg a potokat, ahol az elméleti kvatiliseket vesszük, pl. > 0 eseté az R program i / -et haszál. A Q-Q plot értelemszerűe fog változi. Feladatok R:. Legyeek adottak a következő x,y párok: x i 0 6 5 3 y i 4 3 0 a Határozza meg és ábrázolja is az ax + b alakú regessziós egyeest! b Számolja ki a reziduálisokat és becsülje meg a hiba szóráségyzetét! c Adjo előrejelzést x = 0-re a regressziós egyees alapjá!. Egy darabológép 00 cm-es rudak vágására va beállítva. A következő táblázat hat véletleszerűe kiválasztott rúd hosszát és súlyát tartalmazza: x i cm 0,3 03,7 98,6 99,9 97, 00, y i dkg 609 66 586 594 579 605 a Határozza meg és ábrázolja is az ax + b alakú regressziós egyeest! b Számolja ki a reziduálisokat és becsülje meg a hiba szóráségyzetét! c Adjo előrejelzést x = 00 cm-re a regressziós egyees alapjá! 5