ÁVF GM szak 2010 ősz KÖVETKEZTETŐ STATISZTIKA A MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 ősz Utoljára módosítva: 2010-09-07 ÁVF Oktató: Lipécz György 1
A becslés alapfeladata Pl. Hányan láttak egy TV műsort? Jellemzően kétféle választ lehet adni: Pontbecslés Pl. A minta alapján a sokasági nézettségi arány 32 %. Vesznek egy mintát, azaz, megkérdeznek pl. 1300 embert, és ebből következtetnek, hogy a teljes sokaság hányadrésze látta a műsort. Intervallumbecslés: A nézettségi arány 95% valószínűséggel 29 és 35 % közé esik. 2
Mintavétel A mintavétel módja lehet: véletlen és nem véletlen 1. A véletlen kiválasztás. Ismerjük a sokaság elemeinek mintába kerülési valószínűségét. A véletlen minta fontos jellemzője: a reprezentativitás. Egyszerű véletlen mintavétel Visszatevéssel Visszatevés nélkül Rétegzett minta Csoportos és többlépcsős minta 3
Mintavétel (folyt) 2. A nem-véletlen mintavétel Szisztematikus mintavétel (PL. a kijáratnál minden 10-ik vevő megkérdezése) Kvóta szerinti minta Koncentrált minta (Fogy.K. Top 200) Önkényes minta 4
A mintaátlag eloszlása Alapkérdések: Tekinthető-e, ill. mikor tekinthető a mintaátlag eloszlása normális eloszlásúnak? A mintaátlag várható értéke és a sokasági átlag közötti összefüggés A mintaátlag szórása és a sokasági szórás közötti összefüggés 5
A mintaátlag mint valószínűségi változó A mintaátlag valószínűségi változó (mintáról mintára változik), amelynek van eloszlása, várható értéke, szórása. A mintaátlag normális eloszlású, Ha a sokaság normális eloszlású Vagy: ha a minta elég nagy. (n > 30; pl. 100 elem) Ha a sokaság eloszlása nem ismert és a minta kicsi (30 elem alatti), akkor a mintaátlag eloszlása sem ismert. (Ekkor további megfontolásokra van szükség.) 6
A mintaátlag eloszlásának paraméterei Ha a minta véletlen (a sokaság eloszlásától függetlenül, akár visszatevéses a mintavétel akár nem) akkor, A mintaátlag várható értéke a sokasági átlag: A mintaátlagok szórása, (standard hiba) E ( ) X Visszatevéses mintánál: Visszatevés nélküli mintánál: 1 n n N n n N N n 1 Ahol n / N a kiválasztási arány 7
Testmagasság A minta és mintaátlag normális eloszlása 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 140 145 150 155 160 165 170 175 180 185 190 195 200 205 210 8
PÉLDA sokaság és a minta közötti összefüggésre Vegyünk egy 5 elemű sokaságot. A sokaság elemei legyenek: (2, 3, 4, 5, 6). N =5 Írjuk össze az összes lehetséges 2 elemű mintát! n = 2 (minden húzás után visszatesszük a kihúzott elemet.) Ellenőrizzük, hogy a) A mintaátlagok várható értéke (átlaga) megyegyezik a sokasági átlaggal! b) A mintaátlag varianciája a sokasági variancia n-ed része! Végezzük el visszatevés nélküli mintára is! Hogyan módosul ekkor a mintátlag varianciája? 9
Megoldás 1. (Visszatevéses minta esetén) A sokasági átlag: A sokasági szórásnégyzet ill. szórás: A minta átlaga 2 2 2 2 3 2,5 2 4 3 2 5 3,5 A mintaátlagok átlaga: A mintaátlagok szórásnégyzete: Következtetés: 10
Megoldás 2. (Visszatevés nélküli minta esetén) A sokasági átlag: 4 A sokasági szórásnégyzet: 2 ill. szórás: 2 A minta átlaga 2 3 2,5 2 4 3 2 5 3,5 2 6 4 3 4 3,5 3 5 4 3 6 4,5 A mintaátlagok átlaga: 4 A mintaátlagok szórásnégyzete = Következtetés: 11
Relatív gyakoriság (%) A mintaátlagok eloszlása (%) 25 20 20 15 12 16 16 12 10 8 8 5 4 4 0 1 1,5 2 2,5 3 3,5 4 4,5 5 Mintaátlagok 12
A becslő-fv és a jó becslés kritériumai A becslő fv fogalma: A sokasági paraméter becslésére szolgáló, a mintaelemek értékétől függő függvény. pl. a mintaátlag egy becslőfv, mert értéke a mintaelemek értékétől függ, és ezzel becsüljük a sokasági átlagot. A jó becslés kritériumai Torzítatlanság Hatásosság Konzisztencia 13
Torzítatlan becslések A mintaátlag a sokasági átlag torzítatlan becslése E() mintabeli arány a sokasági aránynak torzítatlan becslése E ( p) P Vagy: E ( g) G A minta szórása a sokasági szórás torzított becslése. A minta korrigált szórása már torzítatlan ˆ E(s) s X ( n i 1 ) 2 14
A jó becslés kritériumai (folyt) Hatásosság: a becslőfüggvény szórása. Minél kisebb a szórása, annál hatásosabb Konzisztencia (az a tulajdonság, hogy egyre nagyobb mintát véve egyre pontosabb becslést kapunk) 15
BECSLÉS A sokasági várható érték intervallum-becslése A sokasági várható értéket a mintaközéppel becsüljük. Ez így egy torzítatlan pontbecslés, - amely nem fog pontosan egybeesni a sokaság tényleges várható értékével. Meg tudunk azonban adni egy intervallumot, amelybe a sokasági várható érték egy előre adott (pl. 95%-os) valószínűséggel beleesik. 16
A sokasági átlag intervallumbecslése 95 %-os megbízhatósági szint mellett Ismerjük a mintaátlag eloszlását, és szórását. Tudjuk, hogy M ( ) X Kérdés: mekkora az az intervallum, amelybe a véletlen minta átlaga, ill. annak standardje 95 % valószínűséggel esik? Átrendezve: 1,96 Rövidebb formában: X 1,96 1,96 X 1, 96 X 1, 96 Tehát 95 % a valószínűsége annak, hogy a sokasági a mintaátlag 1,96 szórásnyi környezetében található. X 17
Az intervallumbecslés általános gondolatmenete Annak a valószínűsége, hogy P Átrendezve z z p X X z 1 z p Tömörebben: X z p X z p n 18
Kifejezések Az (1- ) valószínűség a megbízhatósági szint, vagy konfidencia-szint Az (1- ) valószínűséghez tartozó intervallum a megbízhatósági intervallum vagy konfidenciaintervallum A z p szorzat a maimális hiba vagy hibahatár. z p 19
PÉLDA - Átlagbecslési alapfeladat A főiskolások sokaságából 100 fős, azonos eloszlású véletlen mintát vettünk. A mintaátlag 178 cm-nek adódott. A sokaságról tudjuk, hogy normál eloszlású, 15 cm-es szórással, nem ismerjük viszont a sokasági átlagot. a) Adjon becslést a sokasági átlagra 95%-os megbízhatósági szinten! b) Hogyan változna az eredmény, ha a megbízhatósági szint csak 90%-os lenne? 20
További figyelembeveendő problémák Ha nem független a mintavétel. Ha nem ismerjük a sokasági szórást, 21
A nem független mintavétel esete A standard hiba kisebb lesz, 1 n X z p 1 n n N n N ahol az n /N a kiválasztási arány. 22
Példa Becslés nem független mintavétellel Egy 200 fős cég dolgozóiból egyszerű véletlen mintavétellel kiválasztottunk 100 főt, hogy megbecsülhessük a dolgozók átlagbérét. A mintaátlag 82 eft. A sokaságról tudjuk, hogy normál eloszlású 15 eft szórással a) Becsülje meg a cég dolgozóinak átlagbérét, ha a megbízhatósági szint 95%! b) Hogyan változna az eredmény, ha a vizsgált cég dolgozóinak száma 20 000 fő lenne, de az egyéb adatok változatlanok maradnának? 23
Ha a sokasági szórás nem ismert Ha nem ismerjük a sokasági szórást, akkor a mintából becsüljük. A korrigált mintaszórással számolunk: ˆ s ( és (n -1) szabadságfokú t-eloszlással n i 1 ) 2 24
A Student (t) eloszlás használata Mikor? Ha az alapsokaság szórása, kis minta (n<30) esetén kötelező, nem ismert. nagy minta (n>30; az n=100 már nagy minta!) esetén a standard normális eloszlás z- je is használható Miért? mert a mintátlag standardje nem a standard normál eloszlást követi, hanem a nagyobb szórású t-eloszlást. A mintából becsült szórás használata esetén a becslés bizonytalanabb. 25
A Student (t) eloszlás ábrája különböző mintanagyságok mellett 26
PÉLDA (Becslés, a sokasági szórás nem ismert) Egy 5 ezer fős egyetemen 9 fős egyszerű véletlen minta alapján szeretnénk becslést adni a matematika vizsgára fordított tanulási időre. A normáleloszlás feltételezhető. A mintaátlag 16 óra. A minta korrigált szórása 4 óra. a) Adjunk becslést az egyetemi készülési átlagra 95%-os megbízhatósági szint mellett! b) Hogyan változna az eredmény, ha 100 fős mintára vonatkozna a fenti átlag és korrigált szórás? 27
Értékösszeg-becslés esetén Megszorozzuk N-nel a mintából becsült átlagot és a maimális hibát (hibahatárt) Egyébként minden ugyanúgy megy, mint az átlag-becslésnél. 28
PÉLDA (Értékösszeg becslése) Egy főiskola 5 000 hallgatójának éves színházjegy-vásárlásait vizsgálták mintavételes felméréssel. A sokaság normál eloszlása feltételezhető. A 100 fős mintában az éves összes vásárlási érték 97 000 Ft volt. Az átlagtól való eltérés a mintában átlagosan 680 ft. Mennyi a mintaátlag standard hibája? Becsülje meg 95%-os valószínűséggel, hogy mennyi az egy hallgatóra jutó színházjegy vásárlás értéke a vizsgált főiskolán! Mennyi a főiskolások által szinházjegyre költött teljes összeg maimális értéke? (A megbízhatósági szint továbbra is 95%) 29
Az átlagbecslés lépései (Áttekintés) 1. A becslőfv az 2. A becslőfv eloszlása: normális vagy Student t? Ismert-e a sokasági szórás? Ha nem: a minta nagy vagy kicsi? 3. A standard hiba kiszámítása Ha a minta visszatevés nélküli, 0,05 alatt van-e az (n/n) arány? Független-e (visszatevéses-e) a minta? 4. A konf. intervallum kiszámítása z ˆ t ˆ Adott konfidenciaszinthez tartozó z vagy t meghatározása (táblázatból v. szám.géppel) 5. Az eredmény értelmezése 30
Minta-nagyság meghatározása EV mintánál Visszatevéses eset: n z 2 Visszatevés nélküli eset: z 2 2 n 2 2 2 z N 31
PÉLDA (Folyt) Értékösszeg becslése, mintanagyság meghatározása Egy főiskola 5 000 hallgatójának éves színházjegy-vásárlásait vizsgálták mintavételes felméréssel. A sokaság normál eloszlása feltételezhető. A 100 fős mintában az éves összes vásárlási érték 97 000 Ft volt. Az átlagtól való eltérés a mintában átlagosan 680 Ft. KÉRDÉS: Ha az - átlagra vonatkozó becslés hibahatárát 80 forint alá szeretnénk szorítani, mekkora mintára lenne szükségünk? 32
Köszönöm a figyelmüket! 33