Általános statisztika II Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László
|
|
- Zsófia Pintér
- 7 évvel ezelőtt
- Látták:
Átírás
1 Általános statisztika II Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László
2 Általános statisztika II Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László Publication date 1997 Szerzői jog 1997 dr. Korpás Attiláné, Sándorné dr. Kriszt Éva, Varga Edit, Veitzné Kenyeres Erika, Nemzeti Tankönyvkiadó Rt. Dr. Korpás Attiláné- főiskolai docens Sándorné Dr. Kriszt Éva - főiskolai docens (9. és 10. fejezet) Varga Edit - főiskolai adjunktus (11. fejezet) Veitzné Kenyeres Erika - főiskolai tanársegéd (6., 7. és 8. fejezet) A gyakorlófeladatokat: Dr. Korpás Attiláné állította össze. Szakmai lektor: Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása, illetve utánközlése a kiadó engedélye nélkül tilos!
3 Tartalom 6. Mintavétel Alapfogalmak, jelölések Véletlen mintavételi eljárások Független, azonos eloszlású minta kiválasztása Egyszerű véletlen mintavétel Szisztematikus mintavétel Rétegzett mintavétel Csoportos mintavétel Többlépcsős mintavétel Kombinált eljárások Nem véletlen mintavételi eljárások A mintajellemzők fontosabb tulajdonságai Gyakorlófeladatok Statisztikai becslések Alapfogalmak A becslőfüggvényekkel szemben támasztott követelmények Torzítatlanság Konzisztencia Hatásosság Elégségesség Intervallumbecslés A sokaság várható értékének becslése A sokasági értékösszeg becslése A sokasági arány becslése A sokasági szórásnégyzet becslése A konfidenciaintervallum meghatározása rétegzett mintavétel esetén A minta elemszámának meghatározása Gyakorlófeladatok Hipotézisvizsgálat A hipotézisvizsgálat alapfogalmai A hipotézisvizsgálat során elkövethető hibák A statisztikai hipotézisvizsgálat menete Egymintás statisztikai próbák A várható értékkel kapcsolatos próbák A sokasági szórásra vonatkozó próba A sokasági arányszámmal (valószínűséggel) kapcsolatos próba Kétmintás statisztikai próbák Két sokasági várható érték különbségének vizsgálata Két sokasági arányra (valószínűségre) vonatkozó próba Két sokasági szórás egyezőségére vonatkozó statisztikai próba Egyéb hipotézisvizsgálatok Illeszkedésvizsgálat Függetlenségvizsgálat Varianciaanalízis Gyakorlófeladatok Kétváltozós korreláció- és regressziószámítás Kétváltozós korrelációszámítás A kovariancia A lineáris korrelációs együttható A rangkorrelációs együttható Kétváltozós regressziószámítás Az elméleti regresszió A tapasztalati regresszió A regressziófüggvény paramétereinek meghatározása A változók felcserélhetősége A rugalmassági együttható iii
4 Általános statisztika II Statisztikai következtetések a kétváltozós lineáris regresszió alapján A regressziós modell feltételrendszere A regressziós becslés pontosságának mérése A regressziófüggvény paramétereinek intervallumbecslése Regressziós becslések és prognózisok A regressziófüggvény eredményeinek hipotézis-ellenőrzése A reziduális változó vizsgálata A paraméterek robusztus becslése Nemlineáris regresszió Gyakorlófeladatok Többváltozós korreláció- és regressziószámítás A lineáris regressziófüggvény meghatározása A háromváltozós lineáris regressziófüggvény A legkisebb négyzetek módszere és tulajdonságai A regressziófüggvény paramétereinek intervallumbecslése A regressziófüggvény eredményeinek ellenőrzése A varianciaanalízis alkalmazása a többváltozós regressziószámításban Többváltozós korrelációszámítás Páronkénti korrelációs együttható Parciális korrelációs együttható Többszörös korrelációs és determinációs együttható A multikollinearitás és mérése Néhány kiegészítés a regressziószámításhoz Minőségi ismérvek kezelése a regressziós modellben A tényezőváltozók kiválasztása Gyakorlófeladatok Az idősorok összetevőinek vizsgálata Az idősorok összetevői Additív és multiplikatív komponensek Trendszámítás Trendszámítás mozgóátlagolással Analitikus trendszámítás A szezonalitás vizsgálata Szezonális eltérések számítása Szezonindexek számítása Előrejelzés az eredmények alapján Gyakorlófeladatok A. Függelék B. Tárgymutató iv
5 Az ábrák listája 6,1. A képviselők életkor szerinti megoszlásának hisztogramja ,2. A mintaátlagok megoszlásának hisztogramja 100 db 30 elemű minta alapján ,3. A mintaátlagok megoszlásának hisztogramja 100 db 100 elemű minta alapján ,1. A és becslőfüggvény eloszlás ,2. A konfidenciaintervallum ábrázolása ,3. A konfidenciaintervallum elhelyezkedése a mintavétel többszöri végrehajtása esetén ,4. A standard normális és a Student-féle t-eloszlás ,5. A sűrűségfüggvénye különböző szabadságfokok esetén ,1. Az elfogadási és a kritikus tartomány lehetséges elhelyezkedés ,2. ábra a. Az elfogadási és a kritikus tartomány elhelyezkedés a z próbafüggvénynél ,2. ábra b. Az elfogadási és a kritikus tartomány elhelyezkedés a z próbafüggvénynél ,2. ábra c. Az elfogadási és a kritikus tartomány elhelyezkedés a z próbafüggvénynél ,3. Az elfogadási és a kritikus tartomány elhelyezkedés ,4. Az α és a β grafikus meghatározása különböző alternatívhipotézisek esetén ,5. Az α és a β grafikus meghatározása különböző kritikus értékek esetén ,6. Az F-eloszlás sűrűségfüggvénye különböző szabadságfokok esetén ,1. Pontdiagramok különböző korrelációs együtthatókkal ,2. Rangszámpárok ábrázolása ,3. A munkában töltött évek számának és a bruttó kereseteknek megfelelő pontok ,4. A bruttó átlagkereset a munkában töltött évek számának függvényében a középfokú végzettségű nőknél ,5. Korrrelálatlanság ,6. Függvényszerű kapcsolat ,7. A függvénytípus kiválasztását segítő grafikus ábrák ,8. A legkisebb négyzetek módszere ,9. A megfigyelt adatok és a különböző módon számolt regressziófüggvények ,10. A szállítási távolság és a szállítás időtartamának pontdiagramja ,11. A koordináta-rendszer transzformációja ,12. A változók felcserélése ,13. A hibatényező eloszlásának vizsgálata ,14. A mérési hiba hatása a regressziófüggvényre ,1. A regressziós együtthatók közötti összefüggések ,2. Útdiagram ,1. Az idősorok komponensei ,2. A háztartások gázfelhasználásának alakulása Nógrád megyében 1990 és 1994 között ,3. A népesség természetes fogyásának alakulása Nógrád megyében ,4. Az ellátatlan munkanélküliek létszámának alakulása ,5. A kiemelt üdülőövezet vendéglétszámának idősora és exponenciális trendje ,6. Az urántermelés parabolikus trendje v
6 A táblázatok listája 6.1. A sokaság típusa, a mintavétel módja és a mintaelemek kapcsolata elemű minták mintaátlagainak megoszlása A 100 elemű minták átlagai elemű minták mintaátlagainak megoszlása A mintába került üvegek nettó töltési tömeg szerinti megoszlása A mintába került kávécsomagok megoszlása A rétegzett mintából történő becslés jelölésrendszere A számításhoz szükséges adatok A sokaság és a minta elemszámának megoszlása elemű minta adatai A hipotézisvizsgálat során hozott döntések és bekövetkezésük valószínűsége A másodfajú hiba elkövetésének valószínűsége különböző ellenhipotézisek esetén Az z-próba elfogadási tartományának határai szignifikanciaszint mellett A t-próba elfogadási tartományának határai α szignifikanciaszint mellett A elfogadási tartományának határai α szignifikanciaszint mellett Két mintát igénylő próbák esetén alkalmazott jelölések A 10 elemű minta mérési eredményei Az F-próba elfogadási tartományai α szignifikanciaszint mellett A minta valamilyen ismérv szerinti megoszlása A kiválasztott vendégek kiszolgálási idő szerinti megoszlása A próbafüggvény számított értékének meghatározására szolgáló munkatábla A megkérdezett személyek nemhez való tartozás és beosztás szerinti megoszlása Munkatábla a próbafüggvény aktuális értékének meghatározásához Varianciaanalízis-tábla sémája Az egyes dolgozók teljesítményadatai Az olvasók megoszlása kölcsönzési idő és a kölcsönzött kötetek szerint Az olvasók megoszlása kölcsönzési idő és a kölcsönzött kötetek szerint Munkatábla a lineáris korrelációs együttható kiszámításához A versenyen elért helyezések Munkatábla a rangkorrelációs együttható kiszámításához Munkatábla a rangkorrelációs együttható kiszámításához A hallgatók létszámmegoszlása A hallgatók matematika- és statisztika-vizsgaeredményei közötti kapcsolat tapasztalati regressziófüggvénye A munkában töltött évek száma és a havi átlagkereset tapasztalati regressziófüggvénye a középfokú végzettségű nőknél Munkatábla az analitikus regressziófüggvény meghatározásához Munkatábla a normálegyenletekkel történő megoldáshoz Munkatábla a transzformált normálegyenletekkel történő megoldáshoz A maradék-négyzetösszeg kiszámításának táblázata Varianciaanalízis-tábla Varianciaanalízis-tábla Eredménytábla a szállítási távolság és a szállítási idő közötti összefüggés vizsgálatához A feljegyzett adatok táblázata Munkatábla a reziduumok számítására A megmaradó adatok táblázata a Munkatábla a hatványkitevős regressziófüggvény meghatározásához A tokaji aszú életkora és eladási ára közötti összefüggés Munkatábla az exponenciális regressziófüggvény meghatározásához A szállítási idő vizsgálatára vonatkozó adatok Számítások a transzformált változók alapján A maradéktag négyzetösszegének kiszámítása Az eddigi részeredmények A regressziófüggvény paramétereinek ellenőrzéséhez szükséges részeredmények A varianciaanalízis-tábla többváltozós regressziószámítás esetén vi
7 Általános statisztika II A varianciaanalízis-tábla A 20 elemű minta adatai Az felbontása Az felbontása Háromtagú mozgóátlagok számítása ( ) Négytagú mozgóátlagok számítása ( ) A háztartások számára értékesített gázmennyiség Nógrád megyében 1990 és 1994 között negyedéves bontásban A mozgóátlagolású trendszámítás munkatáblája ( ) A népesség természetes fogyásának alakulása Nógrád megyében Munkatábla a paraméterek meghatározásához Munkatábla a paraméterek meghatározásához A legkisebb négyzetek módszerének megfelelő négyzetösszeg kiszámítása Az ellátatlan munkanélküliek létszámának alakulása Nógrád megyében 1991 és 1994 között (ezer fő) Munkatábla az ellátatlan munkanélküliek létszámának alakulását kifejező lineáris trendfüggvény kiszámításához A legkisebb négyzetek módszerének megfelelő négyzetösszeg kiszámításának munkatáblája Egy kiemelt üdülőövezet vendégeinek létszáma 1982 és 1992 között A legkisebb négyzetek módszerének megfelelő négyzetösszeg számítása A trendtől való eltérések összehasonlítása Az urántermelés alakulása Magyarországon Az egyedi szezonális eltérések számítási táblázata Egy márkakereskedő személygépkocsi-értékesítésének adatai Munkatábla az egyedi szezonindexek kiszámításához A személygépkocsi-értékesítés szezonalitását jellemző szezonindexek A trend és a szezonhatás előrejezése A standard normális eloszlású valószínűségi változó eloszlásfüggvényének táblázata A standard normális eloszlású valószínűségi változó eloszlásfüggvényének táblázata (folytatás) A -eloszlás táblázata A -eloszlás táblázata (folytatás) AzF-eloszlás táblázata Az F-eloszlás táblázata (folytatás) Az F-eloszlás táblázata (folytatás) Az F-eloszlás táblázata (folytatás) Az F-eloszlás táblázata (folytatás) Az F-eloszlás táblázata (folytatás) A Student-féle t-eloszlás táblázata vii
8
9 6. fejezet - Mintavétel Alapfogalmak, jelölések Tankönyvünk első kötetében a megfigyelt statisztikai sokaság elemzésére szolgáló különböző eszközökkel, mutatószámokkal ismerkedtünk meg. A sokaságot ismertnek feltételezve, figyelmünket csak arra fordítottuk, hogyan lehet annak összetételét, változását, törvényszerűségeit megvizsgálni. Nem tértünk ki részletesen arra, hogy az alapadatokhoz teljes körű vagy részleges felvétellel jutottunk. Utólag azt mondhatjuk, hogy az eddigiek során megfigyelésünk a sokaság minden elemére kiterjedt, tehát elemzéseink a sokaság teljes körű megfigyelésén alapultak. Ebben a kötetben olyan módszerekkel ismerkedünk meg, amelyekhez nem szükséges a sokaság minden egyes elemének megfigyelése, mivel erre gyakran nincs is lehetőségünk. A társadalmi-gazdasági statisztikában azonban az adatokhoz való hozzájutás gyakori formája a részleges adatgyűjtés, melynek egyik módja a reprezentatív megfigyelés. Reprezentatív megfigyelésre vagy más néven mintavételes megfigyelésre van szükség pl. a lakosság életkörülményeivel kapcsolatos kérdések (jövedelem, fogyasztási szokások stb.) megválaszolásához, a tömegtermelés minőség-ellenőrzési eljárásaihoz vagy a közvélemény-kutatásokhoz. Ily módon becsüljük pl. a várható termés mennyiségét a mezőgazdaságban vagy a kisvállalkozások tevékenységének eredményeit is. (Ilyen jellegű kérdésekkel már a Valószínűségszámítás c. tárgyban is foglalkoztunk.) A reprezentatív megfigyelés, röviden szólva a mintavétel célja, hogy valamely sokaság egy részének megfigyelése révén következtetéseket tudjunk levonni a sokaság egészére, annak jellemzőire, összetételére vonatkozóan. Azt a sokaságot, amelyre a mintavétel segítségével következtetni szeretnénk, alap sokaságnak, az alapsokaság azon részét, amely alapján a következtetéseket levonjuk, mintasokaságnak nevezzük. A továbbiakban az alapsokaságot röviden sokaságnak, a mintasokaságot pedig mintának fogjuk nevezni. Tekintsük át először a sokaság megadásának módjait és a legfontosabb sokasági jellemzőket. A sokaság elemszáma lehet véges vagy végtelen. Legyen X a sokaság egy ismérve. Ha a sokaságból véletlenszerűen kiemelünk egy egyedet, ennek ismérvértéke a véletlentől függ, ezért valószínűségi változó, ezt a véletlentől függő ismérvértéket jelölje eloszlásfüggvénye Ekkor Véges sokaság esetén az egyedeket, illetve azok ismérvértékeit nagyság szerint sorba rendezhetjük. Az ismérvértékek legyenek (N az egyedek száma). Ekkor A várható értéke, vagy másképpen a sokaság ismérvértékének várható értéke véges sokaság esetén mint ismeretes az átlaggal egyenlő: szórásnégyzete 1
10 Mintavétel Végtelen elemszámú sokaság esetén két esetet különböztetünk meg. Ha diszkrét valószínűségi változó, ami azt jelenti, hogy az ismérvértékek véges vagy megszámlálhatóan végtelen halmazt alkotnak, akkor az F eloszlásfüggvény szintén egy lépcsősfüggvény (az intervallumban állandó), várható értéke Ha folytonos és létezik a sűrűségfüggvénye, akkor a várható értéke (ha ez az improprius integrál is létezik). A szórásnégyzetet a szokásos módon kapjuk: (A jobb oldalon szereplő várható értékeknek is létezniük kell.) A gyakorlatban a mintavétel általában véges sokaságból történik. Ugyanakkor a nagy elemszámú sokaságokat tekinthetjük végtelennek, így a végtelen elemszámú sokaságra kidolgozott eszközök jól használhatók ezen sokaságok esetén is. Ezek után tekintsük át a mintával kapcsolatos alapfogalmakat. A minta elemszáma, tekintet nélkül arra, hogy véges vagy végtelen sokaságból származik, mindig véges. Elemszámát n-nel jelöljük. Az egyes mintaelemek valószínűségi változók, értékük mintáról mintára változhat. Ezeket célszerű -nel jelölni. A minta elemei csak addig tekinthetők változóknak, míg a mintavétel nem történt meg, a minta elemeinek kiválasztása után konkrét számértékek lesznek: A mintából különböző mintajellemzők (átlag, szórás, értékösszeg, arány stb.) számíthatók. Miután a minta elemei valószínűségi változók, az ezekből számított mintajellemzők is valószínűségi változók lesznek, értékük mintáról mintára változhat attól függően, hogy mely sokasági elemek kerültek a mintába. Ez a mintajellemzőknek nagyon fontos tulajdonsága. A véges elemszámú sokaságból történő mintavételnél alapvető fontosságú, hogy rendelkezésre álljon egy ún. mintavételi keret, amely egyenként tartalmazza a vizsgálni kívánt sokaság elemeit, mégpedig mindegyiket, és mindegyiket csak egyszer. Egy ilyen teljes keret biztosítása sokszor nem könnyű feladat, mert vannak olyan sokaságok, amelyeknél az elemek száma és összetétele napról napra változik, s bármilyen jó is a megszűnő és az újonnan létrejövő egységek nyilvántartása, ez szükségszerűen különbözik a mintavételi keret összeállításakor létező sokaságtól. (Ilyen nehézség léphet fel a mintavételi keret összeállításánál, ha a sokaságot pl. Magyarország népessége vagy a Magyarországon működő kisvállalkozások stb. képezik.) A mintavétel tervezése, a mintavételi eljárás megválasztása során két egymásnak ellentmondó követelményt kell figyelembe vennünk. Az egyik követelmény a pontosság, a másik az olcsóság. Mivel az egyik követelmény előtérbe helyezése a másik háttérbe szorulását jelenti, lényeges a mintavétel tervezése során az elvárt célok és a lehetséges eszközök pontos megfogalmazása, számbavétele. Az, hogy ezen követelményeket mennyire vesszük figyelembe a mintavétel tervezése során, lényegesen befolyásolja a mintaelemek kiválasztási eljárását. A következőkben a mintaelemek kiválasztási módjait tekintjük át. A mintaelemek kiválasztása visszatevéssel vagy visszatevés nélkül történhet. Végtelen (vagy végtelennek tekintett) elemszámú sokaságból akár visszatevéssel, akár visszatevés nélkül választjuk ki a minta elemeit, azok mint valószínűségi változók minden esetben függetlenek lesznek egymástól. Véges sokaság esetén csak a visszatevéses mintavétel eredményez független mintaelemeket. A mintaelemek ezen tulajdonságára a későbbiek során még visszatérünk. Az elmondottakat a 6.1. táblázatban foglaltuk össze. 2
11 Mintavétel 6.1. táblázat - A sokaság típusa, a mintavétel módja és a mintaelemek kapcsolata A sokaság elemszáma A mintavétel módja A mintaelemek végtelen visszatevéses visszatevés nélküli függetlenek véges visszatevéses visszatevés nélküli nem függetlenek Az elmondottak alapján különbséget teszünk független mintavételi eljárások és nem független mintavételi eljárások között. Véges sokaság esetén a minta fontos jellemzője a kiválasztási arány, amely azt mutatja meg, hogy a sokaság elemeinek mekkora hányada kerül a mintába. Adott N mellett annál nagyobb valószínűséggel lehet a mintából a sokaságra következtetni, minél nagyobb a kiválasztási arány. Az n-nek, a minta elemszámának azonban nagyobb jelentősége van a kiválasztási aránynál, mert ez határozza meg a mintából való következtetésnél használható módszereket. A mintavétel során és a mintából történő következtetésnél meg kell különböztetnünk a kis és a nagy minta fogalmát. Ennek jelentőségét az adja, hogy a mintából számított jellemzők nagy részének (pl. mintaátlag, mintabeli arány) eloszlása nagy minta esetén közelítőleg normális eloszlásúvá válik, ennélfogva kezelésük egyszerűsödik. (Ezen megállapításra a későbbiek során még visszatérünk.) Felvetődik a kérdés, hogy mi tekinthető kis, illetve nagy mintának. Azt mondhatjuk, hogy már nagy mintának tekinthető, azaz egyes mintajellemzők eloszlásfüggvényei ezen mintaelemszám fölött már közelítőleg normális eloszlásúvá válnak. A mintanagysághoz szorosan kapcsolódik a mintavételi hiba fogalma. A mintavételi hiba abból adódik, hogy a sokaság egy részéből következtetünk az egészre. Meghatározásának módszerei matematikailag kidolgozottak. Nagysága, illetve annak valószínűsége a sokaság jellege, az alkalmazott mintavételi eljárás és a mutató fajtája mellett alapvetően a mintanagyságtól függ, hiszen a mintanagyság növelésével a sokaság egyre nagyobb részét vizsgáljuk meg, s így egyre kisebbé válik a mintavételből eredő nagy hiba valószínűsége. A mintaelemek kiválasztása során elkövethetünk ún. nem mintavételi hibát is, amely több forrásból adódhat: többek között a sokaságot nem tökéletesen fedi le a mintavételi keret (pl. ilyen fordulhat elő, ha a megfigyelt sokaság a Magyarországon működő kisvállalkozások), nem sikerül a megfigyeléseket a terv szerint végrehajtani, válaszmegtagadás vagy egyéb okok miatt hiányoznak adatok. Hiba adódhat abból is, hogy a kérdésekre kapott válaszok nem egészen pontosak (tudatosan vagy önhibáján kívül téves adatot szolgáltat a válaszadó), vagy hibákat követhetnek el a kódolás, táblázás stb. során. Az ilyen típusú hibák nagyságát nehéz meghatározni. Vizsgálatuknak, feltárásuknak elsődlegesen az a célja, hogy a mintavétel tervezésének és végrehajtásának különböző fázisaiban hatásukat csökkenteni lehessen. Egy mintából csak akkor lehet számítható megbízhatóságú következtetéseket levonni a sokaságra vonatkozóan, ha a minta elemeit nem önkényesen, hanem véletlenszerűen választjuk ki. A véletlenszerűség nem feltétlenül jelenti azt, hogy a sokaság minden egyes elemének egyenlő esélye van a mintába történő kerülésre, hanem csak azt jelenti, hogy minden elemhez egy előre meghatározott ismert valószínűség tartozik, és biztosítjuk, hogy ezzel a valószínűséggel kerüljön be a mintába az adott elem, továbbá azt, hogy a mintaelemek kiválasztási eljárásának előre meghatározottnak és egyértelműnek kell lennie. Ha a minta elemeit véletlenszerűen választjuk ki a sokaságból, véletlen (vagy valószínűségi) mintát kapunk. Attól függően, hogy a mintavétel során biztosítjuk-e a véletlenszerűséget vagy sem, különböző mintavételi eljárásokról beszélhetünk Véletlen mintavételi eljárások 3
12 Mintavétel Független, azonos eloszlású minta kiválasztása Független, azonos eloszlású mintát akkor kapunk, ha homogén és végtelen (vagy nagyon nagy) sokaságból veszünk véletlen (visszatevéses vagy visszatevés nélküli) mintát, illetve amikor véges sokaságból visszatevéssel választjuk ki a minta elemeit. Tehát független mintát veszünk. Ilyenkor a minta elemei (vagy függetlennek tekinthető), azonos eloszlású valószínűségi változók lesznek. független Ugyanis az i-edik mintaelem ismérvértékére nyilvánvalóan igaz, hogy tehát az egyes mintaelemek mint valószínűségi változók eloszlása a ismérvérték sokaságbeli eloszlásával azonos. Alkalmazása elsősorban a tömegtermelés minőség-ellenőrzésénél célszerű. Például azonos eloszlású, független mintához jutunk, ha az 1 kg-os liszt töltési tömegének ellenőrzéséhez mintát veszünk. Ekkor a sokaság végtelennek tekinthető, így a minta elemei minden esetben függetlenek lesznek. A gyakorlatban azonban nem túl gyakran jutunk független, azonos eloszlású mintához, mivel a valóságban ritkán áll rendelkezésünkre végtelen vagy végtelennek tekinthető sokaság, vagy véges sokaság esetén nem minden esetben van lehetőség a mintaelemek megvizsgálása után a sokaságba történő visszatevésre (pl. egy adott cégtől vásárolt gumiabroncsok elhasználódásának minőségi vizsgálatakor). Ennek ellenére ez a mintavételi eljárás későbbi vizsgálataink során kiemelt szerepet kap, mert matematikailag rendkívül könnyen kezelhető, és ezen a mintatípuson keresztül lehet a legkönnyebben megmutatni a sokasági és a mintajellemzők kapcsolatát Egyszerű véletlen mintavétel Egyszerű véletlen mintavételt hajtunk végre homogén, véges elemszámú sokaság esetén, amikor a mintát visszatevés nélkül választjuk ki, elemenként egyenlő valószínűséggel. (Ezt az esetet a valószínűségszámításban is vizsgáltuk.) A végrehajtásához egy, a mintavételi keret minden elemét, de mindegyiket csak egyszer tartalmazó komplex lista szükséges. Ezen listából a mintaelemek kiválasztása történhet sorsolással, ún. véletlenszám-táblázattal, illetve számítógépes véletlenszám-generálással. A visszatevés nélküliség követelményét a sorsolásnál oly módon biztosíthatjuk, hogy a kihúzott cédulákat nem tesszük vissza az urnába, míg a véletlenszám-táblázatnál, illetve a számítógépes véletlenszám-generálásnál az ismételten előforduló sorszámot átugorjuk, és haladunk tovább a táblázatban, illetve a számítógép által előállított listában. Az egyszerű véletlen mintavétel során különböző összetételű mintát kaphatunk. Minden n elemű minta előfordulásának a valószínűsége ugyanakkora. Természetesen a mintavétel végrehajtása után csak egyetlenegy mintánk lesz, s ebből következtetünk a sokaság jellemzőire. A gyakorlatban a sokaságok ritkán homogének, ezért az egyszerű véletlen mintavétel tiszta alkalmazása sem fordul elő gyakran, de ugyanakkor kiindulópontként szolgál a bonyolultabb eljárásokhoz Szisztematikus mintavétel A gyakorlatban a véletlen kiválasztást a szisztematikus mintavétellel lehet legegyszerűbben megvalósítani. Az eljárás lényege a következő: egy n elemű mintát kívánunk venni egy N elemű sokaságból. Ehhez először a sokaságot valamely szempont szerint sorba rendezzük általában eleve adott egy sorrend, majd meghatározzuk a számértéket, ahol a szám egész részét jelenti. Az első k elem közül egyenlő valószínűséggel kiválasztjuk a kiindulópontot, s ezután szisztematikusan az erre következő minden k-adik elem kerül be a mintába. A szisztematikus mintavétel végrehajtása rendkívül egyszerű, nem igényel szakismeretet, ellenőrzése is könnyű. Ezen mintavételi eljárás azonban csak akkor eredményez véletlen mintát, ha a listaképző ismérv és a megfigyelt 4
13 Mintavétel ismérv között nincs sztochasztikus kapcsolat. Súlyos torzítást okozhat az is, ha a lista rejtett trendet vagy periodicitást tartalmaz. Tekintsük a következő példát. Valamely főiskola hallgatóinak akikről rendelkezésre áll egy ábécé szerinti lista a tandíjfizetéssel kapcsolatos véleményére vagyunk kíváncsiak. Ekkor a szisztematikus mintavétel nagy valószínűséggel véletlen mintát fog eredményezni, hiszen nagyon valószínű, hogy a hallgató nevének kezdőbetűje és a tandíj fizetéséről alkotott véleménye között nincs sztochasztikus kapcsolat. Ebben az esetben a szisztematikus kiválasztás egyszerűsíti a munkát Rétegzett mintavétel Minden mintavételnél felmerül az a kérdés, hogyan lehet a mintaelemek kiválasztását úgy végrehajtani, hogy az meghatározott mintanagyság mellett minél jobban reprezentálja a vizsgálni kívánt sokaságot. Célszerű továbbá olyan becslési eljárásokat alkalmazni, amelyek minél kisebb hibával becsülik az ismeretlen sokasági jellemzőt. A leggyakrabban alkalmazott ilyen eljárás az ún. rétegzett mintavétel. A rétegzett mintavétel során a vizsgált ismérv szempontjából heterogén sokaságot több homogén (minél kisebb szórású) részsokaságra (rétegekre) bontjuk úgy, hogy a csoportok kiadják a teljes sokaságot, továbbá egyetlen sokasági elem se tartozzon két vagy több csoportba. Az egyes rétegeken belül a minta elemeinek a kiválasztása egyszerű véletlen mintavétellel történik. A rétegzett mintavétel eredményeként egyrészt jobb keresztmetszetet kapunk a vizsgált sokaság összetételéről, másrészt az egyes rétegek nagyobb homogenitása miatt ezeken belüli kisebb mintákból is megfelelő pontosságú következtetést vonhatunk le. Ilyen módon az eredetileg heterogén sokaságra ugyanakkora minta esetén pontosabb következtetést tudunk levonni rétegzett mintából, mint ha egyszerű véletlen mintavételt alkalmaztunk volna. A rétegzés nem csupán pontosságnövelő hatása miatt elterjedt mintavételi eljárás. A rétegzett kiválasztást arra is felhasználhatjuk, hogy az egyes rétegek sokasági jellemzőire megbízható becslést adjunk. Pl. az egyik kisvárosunkban a háztartások jövedelemviszonyait szeretnénk megvizsgálni. Ehhez a város háztartásait a gyermekszám alapján rétegekbe soroljuk. A mintavétel végrehajtása után lehetőség van egyrészt a kisvárosban lévő háztartások egy főre jutó jövedelmének, másrészt az egyes rétegek tehát a gyermektelen, az 1 gyermekes, a 2 gyermekes stb. háztartások esetén az egy főre jutó jövedelemnek a becslésére. Rétegzett mintavételt alkalmaz többek között a Központi Statisztikai Hivatal negyedéves rendszerességgel az 50 vagy kevesebb főt foglalkoztató iparba és a kivitelező építőiparba sorolt kisszervezetek reprezentatív megfigyelésére. (Az 50 főt meghaladó létszámú szervezetek megfigyelése teljes körű és folyamatos.) A rétegzés során több szempontot is figyelembe vettek: jogi személyiségű-e a gazdasági társaság; a jogi személyiségű társaságokon belül 21 és 50 fő közötti vagy 21 fő alatti létszámkategóriába tartozik-e; budapesti vagy vidéki székhelyű-e, illetve azt, hogy mikor alakult meg a gazdasági társaság. Ezen szempontok alapján a feldolgozóiparban 16, a kivitelező építőiparban 12 réteget alakítottak ki 1 a vizsgálat végrehajtásához. A továbbiak megértéséhez néhány újabb jelölés bevezetésére van szükség. A sokaság rétegeinek számát M-mel jelöljük, az egyes rétegeken belül a sokaság elemszáma pedig: ekkor: Rétegenként elemű mintákat veszünk, és a mintákra igaz, hogy 1 A módszer részletes leírása Dr. Telegdi László: Az ipari és építőipari kisszervezetek reprezentatív megfigyelése (Statisztikai Szemle március) c. tanulmányában olvasható. 5
14 Mintavétel Felvetődik a kérdés, hogy hogyan osszuk el a minta elemeit az egyes rétegek között. A mintaelemek szétosztása történhet arányos elosztással, illetve nem arányos elosztással. a) Az arányos elosztás lényege, hogy a mintában a sokasági rétegarányoknak megfelelően választjuk meg a minta elemszámát, tehát adott réteg aránya a mintában és a sokaságban megegyezik, azaz Ezt a kedvező tulajdonságot a későbbi számításoknál fogjuk felhasználni. A j-edik réteg mintaelemszámát ekkor a következő összefüggéssel állapíthatjuk meg: b) A nem arányos elosztás során a mintában a rétegarányok nem egyeznek meg a sokaságbeli arányokkal. Tehát A következőkben a nem arányos elosztáshoz tartozó néhány, a statisztikai gyakorlatban legtöbbször előforduló eljárást mutatunk be. Egyenletes elosztás során minden egyes rétegbe azonos számú mintaelem kerül. Így a j-edik réteg mintaelemszáma lesz. Előnyös tulajdonsága, hogy egyszerű, semmilyen tervezési előkészítést nem igényel, végrehajtása kényelmes. Hátránya pedig, hogy az egyes rétegek nagyságát, szórását stb. nem veszi figyelembe a szükséges mintaelemszám meghatározásához. Így nagyfokú torzítást okozhat. A Neyman-féle optimális elosztás végrehajtásához szükséges, hogy előre ismerjük (vagy legalább hozzávetőlegesen becsülni tudjuk) a sokaság rétegenkénti szórásait. Ekkor rögzített mintaelemszám mellett kedvezőbb tulajdonságú mintát kapunk, ha nagyobb szórású rétegből aránylag nagyobb, kisebb szórásúból pedig kisebb mintát veszünk. Ezt az eljárást a rendszeres időközönként megismétlődő megfigyeléseknél alkalmazzák. Így a megelőző időszak eredményei felhasználhatók az egyes rétegek mintaelemszámának meghatározásához. A j-edik réteg mintaelemszáma az alábbi összefüggés alapján határozható meg: ahol a j-edik réteg elemszáma a sokaságban, a j-edik réteg szórása a sokaságban, n: a minta elemszáma Csoportos mintavétel Az egyszerű véletlen, a szisztematikus és a rétegzett mintavétel során feltételeztük, hogy rendelkezésünkre áll egy olyan lista a mintavételi keret, amely a sokaság összes elemét tartalmazza, s ebből választjuk ki a mintát. A gyakorlati feladatok egy részénél azonban ilyen lista nem áll rendelkezésre, bár elkészíthető volna, de előállítása költséges és munkaigényes lenne. Más esetekben rendelkezésre áll ugyan a lista, de ha abból választanánk ki közvetlenül a mintaelemeket, a felvétel végrehajtása rendkívül költséges lenne. Ezen 6
15 Mintavétel feladatoknál célszerű a sokaság elemeit nem közvetlenül kiválasztani, hanem ezek természetes vagy mesterséges csoportjait megfigyelni. A csoportos mintavétel során a homogén sokaság elemeinek (természetes vagy mesterséges) csoportjai közül egyszerű véletlen mintát veszünk, majd a kiválasztott csoportokon belül minden egyes egyedet megfigyelünk. A csoportos mintavétel esetén a költségtakarékosságot tartjuk elsődleges szempontnak, míg a megfigyelés megbízhatósága némileg háttérbe szorul. Bizonyos esetekben a csoportos mintavétel segítségével, ugyanazon költségkeret mellett lényegesen nagyobb mintához juthatunk, mint egyszerű véletlen mintavétellel. Nézzünk néhány példát a csoportos mintavétel alkalmazására. Egy adott évben vizsgálni kívánjuk a szakközépiskolában végzettek továbbtanulását, illetve munkába állását az érettségi után 3 hónappal. Ha egyszerű véletlen mintavételt hajtanánk végre, akkor az országban található valamennyi szakközépiskola végzős évfolyamának tanulóiról teljes körű listát kellene összeállítani. A mintát ebből a listából kellene kiválasztani. Egy ilyen lista összeállítása rendkívül nehézkes és költséges lenne. További jelentős költséget jelentene, hogy az így kiválasztott diákok területileg is rendkívül szétszórtan helyezkednek el, így az információk begyűjtése is hosszadalmas lenne. Ha azonban csoportos mintavételt végzünk, akkor a középiskolák rendelkezésre álló országos listájából egyszerű véletlen mintavétellel kiválaszthatunk néhány középiskolát. Ilyenkor a kiválasztott iskola végzős évfolyamának valamennyi hallgatója belekerül a mintába, s a felvétel során mindannyiukat meg kell kérdezni. Ebben az esetben a csoportok területi koncentráltsága miatt a csoportos mintavétel olcsóbb, mint az egyszerű véletlen mintavétel. Az egyik nagy országos politikai párt valamely döntés meghozatala előtt kíváncsi a tagság véleményére. Ekkor egyszerűbb és olcsóbb a helyi pártszervezetek közül néhányat egyszerű véletlen mintavétellel kiválasztani, s ezeknél minden párttagot megkérdezni, mint egy részletes címlistát összeállítani a párt tagságáról. Csak akkor célszerű a csoportos mintavétel alkalmazása, ha a helyi szervezeteken belül a párt tagjainak véleménye nem azonos a vizsgált kérdésről. Ellenkező esetben a csoportos mintavétel torz eredményre vezethet. A fenti példákból is kitűnik, hogy a csoportos mintavétel során kétféle egység különül el: elsődleges mintavételi egység, amelyre a felvétel közvetlenül irányul (iskolák, helyi szervezetek), végső mintavételi egység, amelyre vonatkozóan következtetéseket akarunk levonni a kapott mintából (tanulók, párttagok) Többlépcsős mintavétel A többlépcsős mintavételt hasonló esetekben alkalmazzuk, mint a csoportos mintavételt amelyet egylépcsősnek is szoktak nevezni, azzal a különbséggel, hogy többször ismételjük meg egymás után az egyszerű véletlen mintavételt, tehát a mintaelemek kiválasztása több fokozatban, több lépcsőben történik. A mintavétel végrehajtása során először kiválasztjuk az elsődleges mintavételi egységeket. Attól függően, hogy hányszor ismételjük meg egymás után az egyszerű véletlen kiválasztást, két-, három- vagy többlépcsős mintavételről beszélhetünk. Ha az elsődleges mintavételi egységeken belül rögtön a megfigyelni kívánt elemeket választjuk ki (egyszerű véletlen mintavétellel), akkor kétlépcsős a mintavétel. Ha az elsődleges mintavételi egységeken belül először újabb nagyobb csoportokat választunk ki, majd az így képzett csoportokból választjuk ki a mintaelemeket, akkor a mintavétel három- (vagy több-) lépcsős lesz. A többlépcsős mintavétel előnye a csoportos kiválasztással szemben, hogy homogén elsődleges mintavételi egységek homogenitása esetén a teljes körű megfigyelés helyett mintára támaszkodik, s ezáltal csökken a fölösleges adatfelvételek száma, s így ugyanakkora elemszámú minta esetén kisebb a mintavételi hiba valószínűsége, mint a csoportos mintavételnél. Előző példánkat folytatva, ha a helyi szervezetekben nem kérdeznek meg minden párttagot, hanem egyszerű véletlen mintavétellel kiválasztanak néhányat, s csak ezeknek teszik fel a megfelelő kérdéseket, akkor kétlépcsős mintavételi eljárást hajtanak végre. Ebben az esetben az első lépcső a helyi szervezetek (elsődleges mintavételi egységek) kiválasztása, a második lépcső pedig a megkérdezésre kerülő tagok (végső mintavételi egységek) kiválasztása Kombinált eljárások 7
16 Mintavétel A kombinált eljárások gyakorta egy lépésben alkalmaznak több, eddig megismert mintavételi módszert. Ily módon ötvözhető például a rétegzés pontosságnövelő előnye a csoportos vagy többlépcsős mintavétel költségmegtakarításával. A KSH pl. az egységes lakossági adatfelvételi rendszerben (ELAR) egyszerre alkalmaz rétegzést és lépcsőzést. A kombinált eljárások külön csoportját képezik a ismétlődő felvételek, illetve panelfelvételek. Ezen felvételek alkalmazására akkor van szükség, ha a vizsgált sokaság szerkezetét vagy az egyes egyedek jellemzőinek időbeni változását akarjuk vizsgálni. Az ismétlődő felvételek esetén nem szükséges, hogy a mintában szereplő egyedek azonosak legyenek. E módszer legfőbb erénye, hogy egy-egy időpontban a vizsgált sokaság keresztmetszetéről megbízható képet ad. Az ismétlődő felvételek általában úgy történnek (például a legtöbb országban a munkaerő-felvételek), hogy a minta elemei néhány egymás után következő megkérdezéskor azonosak, majd előírt rend szerint cserélődnek. A panelfelvételeknél a minta elemeinek a lehetőségek keretei között azonosaknak kell lenniük, s ezáltal alkalmasak az egyes egyedek jellemzőinek időbeni vizsgálatára. A panelfelvétel előnye, hogy számos társadalmi jelenségre vonatkozóan pontosabb információkat ad, mint a szerkezeti változásokból levonható következtetések. Ezeket az előnyöket már az 1940-es években felismerték, és törekedtek a panelfelvételek alkalmazására. Az eljárás hátránya, hogy a mintába került egyedek nyomon követése nehéz, és a válasz megtagadása miatti torzítás gyorsan növekszik. Ilyen panelfelvételnek tekinthető például a KSH háztartás-statisztikája, amelyben ELAR mintára támaszkodva nyernek kétévenként összehasonlító adatokat a lakosság jövedelmére és fogyasztási szokásaira vonatkozóan. A gyakorlatban sokszor előfordul a teljes körű felvétel és a mintavétel összekapcsolása. Pl. Magyarországon jelenleg 3-4 évente tartanak teljes körű állatszámlálást, amikor a kisgazdaságok teljes állatállományát összeírják. Ezen információ kiegészítéseként negyedévente reprezentatív felvételt végeznek egyes fontosabb állatfajták állományának becslése érdekében. A teljes körű felvételek közötti időszakban a reprezentatív felvételből és a megelőző teljes körű felvételből következtetnek a sokaság állapotára, a teljes állatállományra. Ez úgy történik, hogy kiválasztják a sokaságnak a reprezentatív felvétel során a mintába került egyedeit, majd ezeknél a teljes körű és a reprezentatív megfigyelés során nyert eredményeket összehasonlítják. A tapasztalt változásokat a sokaságra matematikai módszerek segítségével általánosítják Nem véletlen mintavételi eljárások Az eddigiek során áttekintettük a véletlenen alapuló mintavételi eljárásokat. Vannak azonban olyan mintavételi eljárások, amelyekre a véletlen kiválasztás nem jellemző, így ezen eljárásokkal létrejövő minták nem tekinthetők véletlen avagy valószínűségi mintáknak. Az eddig ismertetett mintavételi eljárásoknak számtalan hátrányos tulajdonsága van. Ezek közül a leglényegesebb, hogy nincs biztosítva, a minta a sokaságra valóban jellemző legyen, így félrevezető következtetések forrása lehet. Továbbá a nem véletlen minták esetén nem lehetséges a mintából számított jellemzők hibájának a meghatározása, tehát nem tudjuk a bizonytalanság, a tévedés várható hibáját becsülni. Ennek ellenére a nem véletlen mintavételi eljárásokat széles körben alkalmazzák, mivel végrehajtásuk egyszerűbb és esetenként lényegesen olcsóbb, mint a korrektül megtervezett és végrehajtott véletlen mintavétel. Főleg igénytelen felvételeknél (gyors elővizsgálatoknál) használják, korlátozott következtetési lehetőségekkel. A szisztematikus kiválasztásról a véletlen mintavételi eljárások között már esett szó. Láttuk, ha a listaképző ismérv és a megfigyelt ismérv között nincs sztochasztikus kapcsolat, akkor ez az eljárás véletlen mintát eredményez. Ellenkező esetben a kapott mintaelemek nem lesznek függetlenek egymástól, így a következtetések levonása során figyelembe kell venni a mintaelemek függőségéből adódó torzítást is. Időbeni megfigyeléseknél a periodicitás veszélye miatt alkalmazása nem célszerű. Eléggé elterjedt mintavételi eljárás a kvóta szerinti kiválasztás. Ennek lényege, hogy a felvételt végző személyek (kérdezőbiztosok) előre megkapják, hogy milyen összetételű mintához kell jutniuk, de az előre adott kereteken belül rájuk van bízva a véletlenszerű kitöltés. A kvóta szerinti kiválasztás legnagyobb hátránya, hogy a kapott minta a kérdezőbiztosok szimpátiája, illetve ítélőképessége szerint áll össze. Ez a statisztikailag nem számszerűsíthető szubjektivitás jelentős mértékben befolyásolja a kapott eredményeket. Az önkormányzati választások várható eredményét mintavételes eljárással kívánják meghatározni. Kvóta szerinti kiválasztás esetén a kérdezőbiztos úgy kapja meg a feladatát, hogy kérdezzen meg az adott választókörzetben öt 18 és 30 év, tíz 31 és 40 év közötti férfit, három 18 és 30 közötti nőt stb. Ezeken a határokon belül saját maga választja ki a megkérdezett személyeket, elvben véletlenszerűen, gyakorlatban 8
17 Mintavétel azonban szubjektíven, ötletszerűen. Annak ellenére, hogy a kérdezőbiztos korrektül jár el, előfordulhat, ha kora délutáni órában végzi a felmérést, hogy a felvett mintában nagyobb lesz pl. a munkanélküliek aránya, mint a sokaságban. Továbbá gyakori, hogy a kérdezőbiztos saját ismeretségi köréből igyekszik véletlen mintát biztosítani, ez viszont bizonyos szempontból homogén csoportok megfigyelését jelenti. Az önkényes kiválasztás során a felvételt végző személy szakmai ismereteire támaszkodva a véletlent figyelmen kívül hagyva választja ki a sokaságra jellemző (vagy legalábbis általa jellemzőnek tartott) mintát. Sokéves tapasztalatok mutatják, hogy az ilyen kiválasztáson alapuló megfigyelés sokszor erősen torzított eredményt ad. Meg kell említenünk, hogy az önkényes kiválasztás a mintavétel történelmileg elsőként alkalmazott módszere volt, mára azonban eléggé visszaszorult. Az utóbbi időben elterjedt az ún. exit pool eljárás, amelyet elsősorban a választási eredmények előrejelzésére alkalmaznak. A módszer lényege, hogy a szavazóhelyiségből kijövő választót megkérdezik arról, hogy kire adta a voksát, s az így kapott minta alapján következtetnek a választási eredményekre A mintajellemzők fontosabb tulajdonságai Ha a minta elemeit véletlen mintavételi eljárással választjuk ki, akkor a mintaelemek ismérvértékei és a mintajellemzők valószínűségi változók lesznek. A következőkben a mintajellemzők közül a minta átlagával foglalkozunk részletesen. Kiszámítása a összefüggéssel történik, ahol az i-edik mintaelem ismérvértéke. Egy konkrét mintavételnél, ha adódik, akkor a mintaátlag A mintaátlag tulajdonságait független, azonos eloszlású minta esetén mutatjuk be, mivel ezen mintavételi mód kezelése matematikailag egyszerűbb. Néhány esetben gyakorlati jelentősége miatt kitérünk az egyszerű véletlen mintavétel esetére is. Tekintsük először a mintaelemek eloszlását. A független, azonos eloszlású minta esetén a minta elemeinek eloszlása megegyezik a sokaság eloszlásával. A mintaelemek várható értéke és szórása pedig a sokaság várható értékével és szórásával fog megegyezni. Hiszen és Feladatunk azonban a mintaátlag vizsgálata. A mintaátlagot mint valószínűségi változót várható értékével, szórásával és eloszlásával jellemezhetjük. Vizsgáljuk meg először a mintaátlag mint valószínűségi változó várható értékét. Valószínűségszámításból ismeretes, hogy Így a minta átlagának várható értéke: vagyis megegyezik a sokaságra vonatkozó várható értékkel. 9
18 Mintavétel A mintaátlag szórásnégyzete a mintaelemek függetlensége miatt Így a mintaátlag szórásnégyzete azaz a mintaátlag szórása A mintaátlag szórását, a -ot a mintaátlag standard hibájának nevezzük. A standard hiba megmutatja, hogy mekkora a mintaátlagok sokasági várható értéktől való átlagos (négyzetes) eltérésének várható értéke. Nagysága a sokasági szórástól és a mintanagyságtól (n) függ. Egyszerűbben fogalmazva a standard hiba arra ad választ, hogy egyetlen mintavétel esetén mekkora hibát követünk el átlagosan. Mivel a hiba elkövetésének oka maga a reprezentatív mintavétel, szokásos ezt a hibát a reprezentatív megfigyelés hibájának is nevezni. Ha a mintaelemek kiválasztása egyszerű véletlen mintavétellel történt, akkor a mintaátlag standard hibájának meghatározása (bizonyítás nélkül) a következő összefüggéssel történik: ahol a -t korrekciós tényezőnek vagy véges szorzónak nevezzük. A fenti összefüggésben a korrekciós tényező alkalmazása egyszerű véletlen mintavételnél abból következik, hogy ezen eljárás esetén a mintaelemek nem függetlenek, és ezért a standard hiba levezetésekor a mintaelemek közötti kapcsolatszorosságról tájékoztató kovarianciát is figyelembe kell venni. Az összefüggésből jól látható, hogy egyszerű véletlen mintavétel esetén a mintaátlag szórása jelentős mértékben függhet a kiválasztási aránytól. A korrekciós tényező értéke 0 és 1 között lehet. Alacsony (pl. 1% alatti) kiválasztási arány esetén értéke közel esik 1-hez, ezért elhagyása lényegesen nem befolyásolja a kapott eredményt. Ha viszonylag magas a kiválasztási arány (5 és 10% közötti vagy ennél nagyobb), akkor a korrekciós tényező alkalmazására feltétlenül szükség van. Konkrét mintavételnél a standard hibát -gal fogjuk jelölni, és a összefüggéssel határozzuk meg. Végül vizsgáljuk meg a mintaátlag eloszlását. Független, azonos eloszlású minta esetén a mintaátlag ( ) eloszlásáról a következők mondhatók (a bizonyításokat nem részletezzük, de felhívjuk a figyelmet arra, hogy a a valószínűségi változók összegének konstansszorosa): 1. Normális eloszlású sokaság esetén a mintaátlag is normális eloszlású, függetlenül a minta nagyságától. (Normális eloszlású valószínűségi változók összege is normális eloszlású.) 10
19 Mintavétel 2. Ha a sokaság eloszlása nem ismert, de nagy mintát veszünk, akkor a mintaátlag közelítőleg normális eloszlású lesz, a centrális határeloszlás-tétel 2 következményeként. 3. Ha a sokaság eloszlása nem ismert és kis mintát veszünk, akkor a mintaátlag eloszlása függ a sokaság eloszlásától, ezért általánosan semmit sem tudunk mondani. A mintaátlag egy-egy mintavételnél megvalósuló konkrét értékeinek eloszlását is szemléltethetjük. Erre vonatkozóan nézzük a következő példát. Az 1994-ben megválasztott 371 országgyűlési képviselő életkor szerinti megoszlása a következő hisztogrammal szemléltethető 3 (6.1. ábra): 6,1. ábra - A képviselők életkor szerinti megoszlásának hisztogramja A mintaátlag eloszlásának vizsgálatához a 371 elemű sokaságból először 30, majd 100 elemű mintákat vettünk számítógépes véletlenszám-generálás segítségével, visszatevéssel, így független, azonos eloszlású mintához jutottunk. A mintavételt mindkét esetben 100-szor ismételtük meg, majd minden egyes mintára vonatkozóan kiszámítottuk a mintaátlagot. A 30 elemű minták mintaátlagainak megoszlása a következő volt (6.2. táblázat): 6.2. táblázat - 30 elemű minták mintaátlagainak megoszlása A mintaátlag értéke (év) 43,90 43,91 45,00 45,01 46,10 46,11 47,20 47,21 48,30 48,31 49,40 49,41 50,50 50,51 51,60 A mintaátlagok megoszlása (%) Matematika üzemgazdászoknak. Valószínűségszámítás. (Szerk: dr. Csernyák László.) Nemzeti Tankönyvkiadó, Budapest, oldal. (A további hivatkozásoknál: Valószínűségszámítás.) 3 Az alapadatokat nem közöljük. 11
20 Mintavétel 51,61 52,70 52,71 53, Összesen 100 Ezt követően a 100 elemű mintákat választottuk ki a 30 elemű mintákhoz hasonló módon. A kiszámított mintaátlagokat a 6.3. táblázat tartalmazza: 6.3. táblázat - A 100 elemű minták átlagai 47,08 48,64 48,38 46,54 48,68 47,74 46,29 47,52 48,46 48,02 49,51 47,78 46,94 49,34 46,25 47,48 48,21 47,71 46,78 46,03 51,25 47,71 47,55 47,57 47,21 47,78 47,82 46,13 48,58 48,32 48,99 46,74 46,62 47,83 46,70 48,04 47,33 45,68 48,13 47,39 49,45 48,71 46,08 47,16 47,14 48,52 49,47 47,06 48,33 47,65 49,34 47,05 48,13 47,14 50,17 47,54 48,07 48,45 47,98 48,37 46,09 47,87 46,07 47,69 47,79 50,11 47,89 48,68 46,99 47,80 47,97 46,88 47,92 47,48 46,77 47,91 47,35 47,32 46,70 46,73 48,27 49,10 46,17 47,77 48,14 47,16 49,45 46,86 48,96 48,49 48,49 48,44 46,66 50,24 48,05 48,64 47,22 48,17 46,08 46,94 A kapott mintaátlagokat osztályközös relatív gyakorisági sorba rendeztük (6.4. táblázat) táblázat elemű minták mintaátlagainak megoszlása A mintaátlag értéke (év) 46,10 46,11 47,20 47,21 48,30 48,31 49,40 49,41 50,50 50,51 51,60 A mintaátlagok megoszlása (%) Összesen 100 A mintaátlagok megoszlásait hisztogrammal szemléltethetjük (6.2. és 6.3. ábra). 6,2. ábra - A mintaátlagok megoszlásának hisztogramja 100 db 30 elemű minta alapján 12
Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László
Általános statisztika II Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László Általános statisztika II Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László Publication
RészletesebbenStatisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.
Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,
RészletesebbenStatisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.
Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,
RészletesebbenStatisztikai következtetések Nemlineáris regresszió Feladatok Vége
[GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell
RészletesebbenKÖVETKEZTETŐ STATISZTIKA
ÁVF GM szak 2010 ősz KÖVETKEZTETŐ STATISZTIKA A MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 ősz Utoljára módosítva: 2010-09-07 ÁVF Oktató: Lipécz György 1 A becslés alapfeladata Pl. Hányan láttak
RészletesebbenStatisztika I. 8. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes
RészletesebbenVIZSGADOLGOZAT. I. PÉLDÁK (60 pont)
VIZSGADOLGOZAT (100 pont) A megoldások csak szöveges válaszokkal teljes értékűek! I. PÉLDÁK (60 pont) 1. példa (13 pont) Az egyik budapesti könyvtárban az olvasókból vett 400 elemű minta alapján a következőket
RészletesebbenHipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok
STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris
RészletesebbenStatisztika elméleti összefoglaló
1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11
RészletesebbenMatematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása
Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus
RészletesebbenMintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás
STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x
RészletesebbenGVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet
GVMST22GNC Statisztika II. 3. előadás: 8. Hipotézisvizsgálat Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Hipotézisvizsgálat v becslés Becslés Ismeretlen paraméter Közeĺıtő
RészletesebbenBiomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision
RészletesebbenMatematikai statisztika c. tárgy oktatásának célja és tematikája
Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:
RészletesebbenHipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás
STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H
RészletesebbenStatisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1
Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában
RészletesebbenMintavételi eljárások
Mintavételi eljárások Daróczi Gergely, PPKE BTK 2008. X.6. Óravázlat A mintavétel célja Alapfogalmak Alapsokaság, mintavételi keret, megfigyelési egység, mintavételi egység... Nem valószínűségi mintavételezési
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
Részletesebben2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!
GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az
RészletesebbenGVMST22GNC Statisztika II.
GVMST22GNC Statisztika II. 4. előadás: 9. Kétváltozós korreláció- és regressziószámítás Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Korrelációszámítás
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,
Részletesebbenbiometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás
Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani
RészletesebbenA Statisztika alapjai
A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati
Részletesebben1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása
HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat
RészletesebbenStatisztika I. 12. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 1. előadás Előadó: Dr. Ertsey Imre Regresszió analízis A korrelációs együttható megmutatja a kapcsolat irányát és szorosságát. A kapcsolat vizsgálata során a gyakorlatban ennél messzebb
RészletesebbenMódszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!
BGF KKK Módszertani Intézeti Tanszéki Osztály Budapest, 2012.. Név:... Neptun kód:... Érdemjegy:..... STATISZTIKA II. VIZSGADOLGOZAT Feladatok 1. 2. 3. 4. 5. 6. Összesen Szerezhető pontszám 21 20 7 22
RészletesebbenKUTATÁSMÓDSZERTAN 4. ELŐADÁS. A minta és mintavétel
KUTATÁSMÓDSZERTAN 4. ELŐADÁS A minta és mintavétel 1 1. A MINTA ÉS A POPULÁCIÓ VISZONYA Populáció: tágabb halmaz, alapsokaság a vizsgálandó csoport egésze Minta: részhalmaz, az alapsokaság azon része,
Részletesebben[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát
RészletesebbenAz idősorok összetevői Trendszámítás Szezonalitás Prognosztika ZH
Idősorok Idősor Statisztikai szempontból: az egyes időpontokhoz rendelt valószínűségi változók összessége. Speciális sztochasztikus kapcsolat; a magyarázóváltozó az idő Determinisztikus idősorelemzés esetén
Részletesebben[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.15. Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza) alkotja az eseményteret. Esemény: az eseménytér részhalmazai.
Részletesebbeny ij = µ + α i + e ij
Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai
RészletesebbenBiomatematika 2 Orvosi biometria
Biomatematika 2 Orvosi biometria 2017.02.13. Populáció és minta jellemző adatai Hibaszámítás Valószínűség 1 Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza)
Részletesebben4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis
1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb
RészletesebbenIntervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.
Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Feladatok Gazdaságstatisztika 7. Statisztikai becslések (folyt.); 8. Hipotézisvizsgálat
RészletesebbenLeíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév
Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév A pirossal írt anyagrészeket nem fogom közvetlenül számon kérni a vizsgán, azok háttérismeretként,
RészletesebbenSTATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés
Mit nevezünk idősornak? STATISZTIKA 10. Előadás Idősorok analízise Egyenlő időközökben végzett megfigyelések A sorrend kötött, y 1, y 2 y t y N N= időpontok száma Minden időponthoz egy adat, reprodukálhatatlanság
RészletesebbenTartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE
Tartalomjegyzék 5 Tartalomjegyzék Előszó I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE 1. fejezet: Kontrollált kísérletek 21 1. A Salk-oltás kipróbálása 21 2. A porta-cava sönt 25 3. Történeti kontrollok 27 4. Összefoglalás
RészletesebbenSTATISZTIKA I. Mintavétel fogalmai. Mintavételi hiba. Statisztikai adatgyűjtés Nem véletlenen alapuló kiválasztás
Mintavétel fogalmai STATISZTIKA I.. Előadás Mintavétel, mintavételi technikák, adatbázis A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x n, mindig
RészletesebbenBiometria az orvosi gyakorlatban. Korrelációszámítás, regresszió
SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás
RészletesebbenTöbbváltozós lineáris regressziós modell feltételeinek tesztelése I.
Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Kvantitatív statisztikai módszerek Petrovics Petra Többváltozós lineáris regressziós
RészletesebbenTARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23
TARTALOMJEGYZÉK 1. téma Átlagbecslés (Barna Katalin).... 7 2. téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23 3. téma Összefüggések vizsgálata, korrelációanalízis (Dr. Molnár Tamás)... 73 4. téma Összefüggések
RészletesebbenStatisztika I. 11. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció:
RészletesebbenTöbbváltozós lineáris regressziós modell feltételeinek
Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p
RészletesebbenVéletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.
Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza
RészletesebbenKabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a
Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,
RészletesebbenHipotézis vizsgálatok
Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével
Részletesebben6. Előadás. Vereb György, DE OEC BSI, október 12.
6. Előadás Visszatekintés: a normális eloszlás Becslés, mintavételezés Reprezentatív minta A statisztika, mint változó Paraméter és Statisztika Torzítatlan becslés A mintaközép eloszlása - centrális határeloszlás
RészletesebbenSTATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése
4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól
RészletesebbenNormális eloszlás tesztje
Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra
Részletesebbeny ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell
Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.
RészletesebbenTöbb valószínűségi változó együttes eloszlása, korreláció
Tartalomjegzék Előszó... 6 I. Valószínűségelméleti és matematikai statisztikai alapok... 8 1. A szükséges valószínűségelméleti és matematikai statisztikai alapismeretek összefoglalása... 8 1.1. Alapfogalmak...
RészletesebbenStatisztikai becslés
Kabos: Statisztika II. Becslés 1.1 Statisztikai becslés Freedman, D. - Pisani, R. - Purves, R.: Statisztika. Typotex, 2005. Reimann J. - Tóth J.: Valószínűségszámítás és matematikai statisztika. Tankönyvkiadó,
RészletesebbenMi az adat? Az adat elemi ismeret. Az adatokból információkat
Mi az adat? Az adat elemi ismeret. Tények, fogalmak olyan megjelenési formája, amely alkalmas emberi eszközökkel történő értelmezésre, feldolgozásra, továbbításra. Az adatokból gondolkodás vagy gépi feldolgozás
RészletesebbenStatisztika 3. Dr Gősi Zsuzsanna Egyetemi adjunktus Koncentráció mérése Koncentráció általában a jelenségek tömörülését, összpontosulását értjük. Koncentráció meglétéről gyorsan tájékozódhatunk, ha sokaságot
RészletesebbenAdatok statisztikai értékelésének főbb lehetőségei
Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció
RészletesebbenValószínűségi változók. Várható érték és szórás
Matematikai statisztika gyakorlat Valószínűségi változók. Várható érték és szórás Valószínűségi változók 2016. március 7-11. 1 / 13 Valószínűségi változók Legyen a (Ω, A, P) valószínűségi mező. Egy X :
RészletesebbenMintavétel. Kovács István BME Menedzsment és Vállalatgazdaságtan. Tanszék
Mintavétel Kovács István BME Menedzsment és Vállalatgazdaságtan Tanszék Alapfogalmaink Sokaság azon elemek összessége, amelyek valamilyen közös jellemzővel bírnak, és megfelelnek a marketingkutatási probléma
RészletesebbenKettőnél több csoport vizsgálata. Makara B. Gábor
Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10
RészletesebbenStatisztika Elıadások letölthetık a címrıl
Statisztika Elıadások letölthetık a http://www.cs.elte.hu/~arato/stat*.pdf címrıl Konfidencia intervallum Def.: 1-α megbízhatóságú konfidencia intervallum: Olyan intervallum, mely legalább 1-α valószínőséggel
RészletesebbenMatematikai statisztikai elemzések 6.
Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematikai statisztikai elemzések 6. MSTE6 modul Regressziószámítás: kétváltozós lineáris és nemlineáris regresszió, többváltozós
RészletesebbenHipotézis vizsgálatok
Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével
RészletesebbenStatisztika I. 10. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 10. előadás Előadó: Dr. Ertsey Imre Varianciaanalízis A különböző tényezők okozta szórás illetőleg szórásnégyzet összetevőire bontásán alapszik Segítségével egyszerre több mintát hasonlíthatunk
RészletesebbenA leíró statisztikák
A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az
RészletesebbenKorreláció és lineáris regresszió
Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.
RészletesebbenBevezető Mi a statisztika? Mérés Csoportosítás
Gazdaságstatisztika 1. előadás Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Oktatók Előadó Kóczy Á. László (koczy.laszlo@kgk.bmf.hu) Fogadóóra: szerda 11:30 11:55, TA125 Gyakorlatvezető
RészletesebbenKÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység
KÖZPONTI STATISZTIKAI HIVATAL A vizsgarészhez rendelt követelménymodul azonosító száma, megnevezése: 2144-06 Statisztikai szervezői és elemzési feladatok A vizsgarészhez rendelt vizsgafeladat megnevezése:
RészletesebbenKészítette: Fegyverneki Sándor
VALÓSZÍNŰSÉGSZÁMÍTÁS Összefoglaló segédlet Készítette: Fegyverneki Sándor Miskolci Egyetem, 2001. i JELÖLÉSEK: N a természetes számok halmaza (pozitív egészek) R a valós számok halmaza R 2 {(x, y) x, y
RészletesebbenSTATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba
Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum
RészletesebbenA statisztika oktatásáról konkrétan
A világ statisztikája a statisztika világa ünnepi konferencia Esztergom, 2010.október 15. A statisztika oktatásáról konkrétan Dr. Varga Beatrix PhD. egyetemi docens MISKOLCI EGYETEM Üzleti Statisztika
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,
RészletesebbenStatisztika II előadáslapok. 2003/4. tanév, II. félév
Statisztika II előadáslapok 3/4 tanév, II félév BECSLÉS ÉS HIPOTÉZISVIZSGÁLAT Egyik konzervgyár vágott zöldbabot exportál A szabvány szerint az üvegek nettó töltősúlyának az átlaga 3 g, a szórása 5 g Az
RészletesebbenA mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra
A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra Vörös Zsuzsanna NÉBIH RFI tervezési referens 2013. április 17. Egy kis felmérés nem kor Következtetések: 1. a jelenlevők nemi megoszlása:
RészletesebbenStatisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus
Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Gyakorisági sorok Mennyiségi ismérv jellemző rangsor készítünk. (pl. napi jegyeladások száma) A gyakorisági sor képzése igazából tömörítést jelent Nagyszámú
RészletesebbenLineáris regressziószámítás 1. - kétváltozós eset
Lineáris regressziószámítás 1. - kétváltozós eset Orlovits Zsanett 2019. február 6. Adatbázis - részlet eredmény- és magyarázó jellegű változók Cél: egy eredményváltozó alakulásának jellemzése a magyarázó
RészletesebbenBevezetés a hipotézisvizsgálatokba
Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -
RészletesebbenRegressziós vizsgálatok
Regressziós vizsgálatok Regresszió (regression) Általános jelentése: visszaesés, hanyatlás, visszafelé mozgás, visszavezetés. Orvosi területen: visszafejlődés, involúció. A betegség tünetei, vagy maga
RészletesebbenA TÁRKI ADATFELVÉTELEINEK DOKUMENTUMAI. Omnibusz 2003/08. A kutatás dokumentációja. Teljes kötet
A TÁRKI ADATFELVÉTELEINEK DOKUMENTUMAI Omnibusz 2003/08 A kutatás dokumentációja Teljes kötet 2003 Tartalom BEVEZETÉS... 4 A MINTA... 6 AZ ADATFELVÉTEL FŐBB ADATAI... 8 TÁBLÁK A SÚLYVÁLTOZÓ KÉSZÍTÉSÉHEZ...
RészletesebbenValószínűségszámítás összefoglaló
Statisztikai módszerek BMEGEVGAT Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:
Részletesebben[GVMGS11MNC] Gazdaságstatisztika
[GVMGS11MNC] Gazdaságstatisztika 1. előadás Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem Oktatók Előadó Kóczy Á. László (koczy.laszlo@kgk.uni-obuda.hu)
RészletesebbenBevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus
Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár PhD kurzus Mi a statisztika? A sokaság (a sok valami) feletti áttekintés megszerzése, a sokaságról való információszerzés eszköze. Célja: - a sokaságot
RészletesebbenStatisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat
Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat 7. lecke Paraméter becslés Konfidencia intervallum Hipotézis vizsgálat feladata Paraméter becslés és konfidencia
RészletesebbenA mérési eredmény megadása
A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk meg: a determinisztikus és a véletlenszerű
RészletesebbenKorrelációs kapcsolatok elemzése
Korrelációs kapcsolatok elemzése 1. előadás Kvantitatív statisztikai módszerek Két változó közötti kapcsolat Független: Az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az
RészletesebbenKabos: Statisztika II. ROC elemzések 10.1. Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.
Kabos: Statisztika II. ROC elemzések 10.1 ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás szóhasználatával A riasztóberendezés érzékeli, ha támadás jön, és ilyenkor riaszt. Máskor nem. TruePositiveAlarm:
Részletesebbenegyetemi jegyzet Meskó Balázs
egyetemi jegyzet 2011 Előszó 2. oldal Tartalomjegyzék 1. Bevezetés 4 1.1. A matematikai statisztika céljai.............................. 4 1.2. Alapfogalmak......................................... 4 2.
RészletesebbenGyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László
Gyakorló feladatok Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László I/. A vizsgaidőszak második napján a hallgatók %-ának az E épületben, %-ának a D épületben,
RészletesebbenMÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI
MÉRÉSI EREDMÉYEK POTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI. A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk
RészletesebbenBiometria gyakorló feladatok BsC hallgatók számára
Biometria gyakorló feladatok BsC hallgatók számára 1. Egy üzem alkalmazottainak megoszlása az elért teljesítmény %-a szerint a következı: Norma teljesítmény % Dolgozók száma 60-80 30 81-90 70 91-100 90
RészletesebbenBiomatematika 13. Varianciaanaĺızis (ANOVA)
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 13. Varianciaanaĺızis (ANOVA) Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date:
RészletesebbenSTATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.
STATISZTIKA 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 MAGY. MAT. TÖRT. KÉM. ANNA BÉLA CILI András hármas. Béla Az átlag 3,5! kettes. Éva ötös. Nóri négyes. 1 mérés: dolgokhoz valamely szabály alapján szám rendelése
RészletesebbenHipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58
u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58 u- t- 2/58 eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ
Részletesebbenföldtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás
Matematikai statisztika elıadás, földtudományi BSc (geológus szakirány) 2014/2015 2. félév 6. elıadás Konfidencia intervallum Def.: 1-α megbízhatóságú konfidencia intervallum: Olyan intervallum, mely legalább
RészletesebbenVizsgafeladatok. 1. feladat (3+8+6=17 pont) (2014. január 7.)
Vizsgafeladatok 1. feladat (3+8+6=17 pont) (2014. január 7.) Az elmúlt négy év a 2010. I. és a 2013. IV. negyedéve között csapadék mennyiségének alakulásáról az alábbiakat ismerjük: Időszak Csapadék mennyiéség
RészletesebbenBAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.
BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. 1 Mérési hibák súlya és szerepe a mérési eredményben A mérési hibák csoportosítása A hiba rendűsége Mérési bizonytalanság Standard és kiterjesztett
Részletesebben(Independence, dependence, random variables)
Két valószínűségi változó együttes vizsgálata Feltételes eloszlások Két diszkrét változó együttes eloszlása a lehetséges értékpárok és a hozzájuk tartozó valószínűségek (táblázat) Példa: Egy urna 3 fehér,
RészletesebbenStatisztika II. tantárgyi kalauz
Balog Margit - Monoriné Szabó Edit Statisztika II. tantárgyi kalauz Szolnoki Főiskola Szolnok 006. Statisztika II. Tantárgyi kalauz Ez a kalauz az alábbi tankönyvekhez készült: Általános statisztika II.
RészletesebbenMérési hibák 2006.10.04. 1
Mérési hibák 2006.10.04. 1 Mérés jel- és rendszerelméleti modellje Mérési hibák_labor/2 Mérési hibák mérési hiba: a meghatározandó értékre a mérés során kapott eredmény és ideális értéke közötti különbség
RészletesebbenStatisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában
Statisztikai alapok Leíró statisztika Lineáris módszerek a statisztikában Tudományosan és statisztikailag tesztelhető állítások? A keserűcsokoládé finomabb, mint a tejcsoki. A patkány a legrondább állat,
Részletesebben