STATISZTIKA III. Oktatási segédlet



Hasonló dokumentumok
Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

Regresszió. Fő cél: jóslás Történhet:

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok október hó: (adott a vastagon szedett!) S i g i z i g i z i

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

KUTATÁSMÓDSZERTAN 4. ELŐADÁS. A minta és mintavétel

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

4 2 lapultsági együttható =

Békefi Zoltán. Közlekedési létesítmények élettartamra vonatkozó hatékonyság vizsgálati módszereinek fejlesztése. PhD Disszertáció

KÖVETKEZTETŐ STATISZTIKA

Dr. Ratkó István. Matematikai módszerek orvosi alkalmazásai Magyar Tudomány Napja. Gábor Dénes Főiskola

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

A sokaság/minta eloszlásának jellemzése

Táblázatok 4/5. C: t-próbát alkalmazunk és mivel a t-statisztika értéke 3, ezért mind a 10%-os, mind. elutasítjuk a nullhipotézist.

GYAKORLÓ FELADATOK BECSLÉS - HIPOTÉZISVIZSGÁLAT

METROLÓGIA ÉS HIBASZÁMíTÁS

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

I. A közlekedési hálózatok jellemzői II. A közlekedési szükségletek jellemzői III. Analitikus forgalom-előrebecslési modell

A multikritériumos elemzés célja, alkalmazási területe, adat-transzformációs eljárások, az osztályozási eljárások lényege

Statisztika I. 3. előadás. Előadó: Dr. Ertsey Imre

Minősítéses mérőrendszerek képességvizsgálata

Konfidencia-intervallumok

Lineáris regresszió. Statisztika I., 4. alkalom

Az elektromos kölcsönhatás

? közgazdasági statisztika

Bevezető milyen információkkal rendelkezik a magyar lakosság ezekről a termékkategóriákról Módszertan:

Az entrópia statisztikus értelmezése

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

KOMBINATORIKA ELŐADÁS osztatlan matematika tanár hallgatók számára. Szita formula

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

MATEMATIKAI STATISZTIKA KISFELADAT. Feladatlap

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Biometria gyakorló feladatok BsC hallgatók számára

STATISZTIKA. Gyakorló feladatok az első zh-ra

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

/11 Változtatások joga fenntartva. Kezelési útmutató. UltraGas kondenzációs gázkazán. Az energia megőrzése környezetünk védelme

Nemparaméteres eljárások

STATISZTIKA I. Mintavétel fogalmai. Mintavételi hiba. Statisztikai adatgyűjtés Nem véletlenen alapuló kiválasztás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Az egyszerűsítés utáni alak:

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

TÁRKI ADATFELVÉTELI ÉS ADATBANK OSZTÁLYA OMNIBUSZ 98/1. SPSS állomány neve: Könyvtári dokumentum sorszáma: 287. Budapest, 1998.

A TÁRKI ADATFELVÉTELEINEK DOKUMENTUMAI OMNIBUSZ 2004/05. A kutatás dokumentációja

Adatsorok jellegadó értékei

Új módszertan a kerékpározás mérésében

Mintavételi eljárások

Magyarország kerékpáros nagyhatalom és Budapest minden kétséget kizáróan elbringásodott: egyre többen és egyre gyakrabban ülnek nyeregbe a fővárosban

Kísérlettervezési alapfogalmak:

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

A TÁRKI ADATFELVÉTELEINEK DOKUMENTUMAI. Omnibusz 2003/08. A kutatás dokumentációja. Teljes kötet

Statisztika elméleti összefoglaló

Balogh Edina Árapasztó tározók működésének kockázatalapú elemzése PhD értekezés Témavezető: Dr. Koncsos László egyetemi tanár

Hipotézis vizsgálatok

Algoritmusok és adatszerkezetek gyakorlat 09 Rendezések

Fuzzy rendszerek. A fuzzy halmaz és a fuzzy logika

Sta t ti t s i zt z i t k i a 3. előadás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Korreláció-számítás. 1. előadás. Döntéselőkészítés módszertana. Dr.

A gabonavertikum komplex beruházás-elemzés módszertani fejlesztése OTKA: Részletes zárójelentés Témavezető: Dr. Ertsey Imre

NKFP6-BKOMSZ05. Célzott mérőhálózat létrehozása a globális klímaváltozás magyarországi hatásainak nagypontosságú nyomon követésére. II.

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

TÁRKI ADATFELVÉTELI ÉS ADATBANK OSZTÁLYA. Változás SPSS állomány neve: Budapest, 2002.

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Varianciaanalízis. Egytényezős kísérletek (Más néven: egyutas osztályozás, egyszempontos varianciaanalízis ANOVA)

Philosophiae Doctores. A sorozatban megjelent kötetek listája a kötet végén található

TÁRKI ADATFELVÉTELI ÉS ADATBANK OSZTÁLYA OMNIBUSZ 2002/10. SPSS állomány neve: Budapest, október

Biostatisztika VIII. Mátyus László. 19 October

A mintában szereplő határon túl tanuló diákok kulturális háttérre

Adatelemzés és adatbányászat MSc

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Koncentráció és mérése gazdasági és társadalmi területeken. Kerékgyártó Györgyné BCE Statisztika Tanszék

? közgazdasági statisztika

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

MINTAFELADATOK. 1. Az alábbi diagram egy kiskereskedelmi lánc boltjainak forgalomkoncentrációját szemlélteti:

2. személyes konzultáció. Széchenyi István Egyetem

ALAKOS KÖRKÉS PONTOSSÁGI VIZSGÁLATA EXCEL ALAPÚ SZOFTVERREL OKTATÁSI SEGÉDLET. Összeállította: Dr. Szabó Sándor

ADATREDUKCIÓ I. Középértékek

II. Rákóczi Ferenc Kárpátaljai Magyar Fıiskola. Pataki Gábor. STATISZTIKA I. Jegyzet

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

BÁTASZÉKÉRT MARKETING NONPROFIT KORLÁTOLT FELELŐSSÉGŰ TÁRSAS január december 31.

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

BETEGJOGI, ELLÁTOTTJOGI ÉS GYERMEKJOGI KUTATÁS

MŰSZAKI TUDOMÁNYI DOKTORI ISKOLA. Napkollektorok üzemi jellemzőinek modellezése

Teljes eseményrendszer. Valószínőségszámítás. Példák. Teljes valószínőség tétele. Példa. Bayes tétele

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A sokasági értékösszeg becslése a könyvvizsgálatban

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kettőnél több csoport vizsgálata. Makara B. Gábor

ÁLTALÁNOS STATISZTIKA

Átírás:

MISKOLCI EGYETEM Gazdaságtudomány Kar Üzlet Informácógazdálkodás és Módszertan Intézet Üzlet Statsztka és Előrejelzés Tanszék STATISZTIKA III. Oktatás segédlet 003.

MISKOLCI EGYETEM Gazdaságtudomány Kar Üzlet Informácógazdálkodás és Módszertan Intézet Üzlet Statsztka és Előrejelzés Tanszék STATISZTIKA III. Oktatás segédlet Készítette: Dr. Ilyésné dr. Molnár Emese egyetem adjunktus Kovács Tamás doktorandusz

Ez az oktatás segédlet a Mskolc Egyetem Gazdaságtudomány Karán folyó nappal és levelező közgazdász képzésben a Statsztka III. tantárgy oktatásához készült. 3

MINTAVÉTELES ELJÁRÁSOK I. Az nformácó szerzés módja A társadalm-gazdaság folyamatok (statsztka) elemzéséhez megbízható, pontos nformácókra van szükség. Az nformácók lehetnek számszerű jellemzők, vagy szövegesen kfejezhető tulajdonságok. Azok az nformácók, amelyeket egy szervezet saját magáról gyűjt, elemez, továbbít, belső nformácóknak nevezzük. Ugyanakkor a folyamatok megsmeréséhez szükség van a külső környezet megsmerésére, lletve előfordulhat, hogy k kell elégíten más szervezetek, vagy a környezet nformácós gényét s. A környezetre vonatkozó nformácókat külső nformácóknak nevezzük. Az adatokhoz (nformácókhoz) hozzájuthatunk úgy s, hogy saját magunk közvetlenül gyűjtünk adatokat, vagy valamlyen erre specalzált szervezetet bízunk meg az adatgyűjtéssel. Az így szerzett adat az elsődleges (prmer) adat. Ha már korábban nylvánosságra hozott, mások által egyéb célra gyűjtött és felhasznált adatokból dolgozunk, akkor másodlagos (szekunder) adatokról beszélünk. Ilyenek például a Központ Statsztka Hvatal által gyűjtött és publkált adatok. A gyakorlat munka során gyakran kerülhetünk olyan helyzetbe, hogy nem tudjuk, vagy nem akarjuk a vzsgált alapsokaság összes adatát összegyűjten és megvzsgáln, hanem megelégszünk, vagy meg kell elégednünk azzal, hogy a teljes sokaságnak csak egy részét, egy mntát vzsgálunk meg, s ez alapján vonjuk le a következtetésenket az alapsokaságra. Például, ha azt szeretnénk megtudn, hogy az egyetemsták menny dőt fordítanak a tanulásra a szorgalm dőszakban, akkor algha választhatjuk azt a megoldást, hogy az összes egyetemstát megkérdezzük, és ez alapján válaszoljuk meg a kérdést. Sokkal kézenfekvőbb néhány (száz vagy ezer) egyetemsta megkérdezése után levonn a következtetést. Elvleg (fzkalag) kvtelezhető lenne, hogy megkérdezünk mnden egyetemstát, de a befektetett munka nem lenne arányban a kapott eredménnyel, hszen néhány (száz vagy ezer) egyetemsta megkérdezésével s megbízható eredményre juthatunk. Ugyanakkor bzonyos esetekben az s előfordulhat, hogy lehetetlen a sokaság mnden elemének megfgyelése. Gondoljunk például arra, ha azt szeretnénk megtudn, hogy egy csomagoló automata mlyen selejtaránnyal dolgozk. Ekkor meg kellene számoln, hogy az automata az üzembe helyezésétől kezdve a működőképességének végég hány selejtet állított elő. Mre a számolás véget érne, a megszerzett nformácó már érdektelenné válna. Hasonlóan lehetetlen a teljes sokaság vzsgálata akkor, ha a megfgyelés, vzsgálat az egyedek károsodásával jár, például szakító próbának tesszük k a terméket (anyagot). Nylvánvalóan a próba után már nem lesz a termék ugyanolyan tulajdonságú, nem lesz ugyanakkora a szakító szlárdsága, mnt a próba előtt. Tehát el kell fogadnunk, hogy dőnként nem érdemes, vagy lehetetlen megvzsgáln a teljes sokaságot, csak egy mnta megfgyelése alapján kell levonnunk a következtetésenket. Ahhoz azonban, hogy ez a következtetés helytálló, megbízható legyen, a megfgyeln kívánt mntát megfelelően, matematka-statsztka szabályok, törvények fgyelembe vételével kell kválasztan, a mntavételt meg kell tervezn. A különböző adatszerzés módok részletes smertetése előtt smételjünk át néhány alapfogalmat, jelölést. 4

a.) a sokaság eleme: X 1, X, X N, ; lehet véges elemszámú (N) vagy végtelen b.) mntaelemek: x 1, x,..x n véges számú valószínűség változó, értékük mntáról mntára változhat. c.) véletlen kválasztás: mnden sokaság elem egy előre meghatározott valószínűséggel kerül a mntába, mely nem azonos a hétköznap értelemben használt véletlennel! d.) lsta: a sokaság elemenek felsorolását tartalmazza. e.) kválasztás arány: N n f.) mntavétel hba, mely abból adódk, hogy nem a teljes sokaságot fgyeltük meg. g.) a felvételhez kapcsolódó hbák, függetlenül attól, hogy a megfgyelés teljes körű volt e, vagy részleges (pld. pontatlan kérdés, hbás vagy hbásan rögzített válasz, stb.) A mntavétel célja tehát olyan adatokat nyern, amelyek segítségével megalapozott következtetéseket lehet levonn a sokaságra vonatkozóan. A mntavétel lépése: 1. a mntavétel megtervezése, a mntaelemek kjelölése. a kjelölt mntaelemek megfgyelése, azaz a felvétel végrehajtása II. Mntavétel módok A különböző adatszerzés módokat, lletve a megfgyelés, a mntavétel leggyakrabban előforduló módszeret az alább ábra mutatja be: ADATSZERZÉSI MÓDOK Részleges adatfelvétel Teljes körű adatfelvétel (cenzus) Kontrollált kísérletek Reprezentatív megfgyelés Egyéb részleges adatfelvétel Véletlenen alapuló kválasztás FAE EV R CS TL Nem véletlenen alapuló kválasztás Szsztematkus Kvótás Hólabda Koncentrált Önkényes Stb. 5

Teljes körű adatfelvétel (cenzus) csak véges sokaság esetén lehetséges. Mvel gen dőés költséggényes, ezért csak rtkán, vagy ks elemszámú sokaság esetén kerül rá sor. Nálunk rendszeresen a Központ Statsztka Hvatal végez teljes körű megfgyeléseket nagy méretű sokaság esetén. Ilyen például a 10 évenként sorra kerülő népszámlálás vagy az általános mezőgazdaság összeírás (ÁMÖ). A részleges adatfelvételeket három nagy csoportba sorolhatjuk, melyek tulajdonságakban alapvetően eltérnek egymástól. Kontrollált kísérletek: végtelen sokaságról való nformálódás eszköze arra ad választ, hogy a kísérlet végzője által megtervezett feltétel együttesek (kezelések) mlyen eredményre vezetnek. Reprezentatív megfgyelés: a mntavételből származó mnden eredményt a sokaság egészének jellemzésére használják fel, azaz általánosítanak a teljes sokaságra. reprezentatív a mnta, ha tükröz az alapsokaságot, annak jellemzőt, tulajdonságat, összetételét. mndg megadható a mntavétel hba, azaz, hogy a mntavétel tényéből mekkora hba fakad. Nem reprezentatív megfgyelés (egyéb részleges megfgyelés): nncs benne az általánosításra való törekvés, a következtetések kzárólag a megfgyelt egyedekre vonatkoznak. A továbbakban a reprezentatív megfgyelésen belül a véletlenen alapuló kválasztással foglalkozunk részletesebben. A véletlen kválasztást s többféleképpen lehet és érdemes végrehajtan annak függvényében, hogy mlyen smeretekkel rendelkezünk az alapsokaságról, s természetesen, hogy mennyre szeretnénk növeln a következtetésünk megbízhatóságát, pontosságát. Ha a vzsgáln kívánt sokaság a vzsgálat szempontjából homogénnek teknthető, azaz nem különíthetőek el benne a vzsgálat szempontjából eltérően vselkedő egyedek, valamnt smert, azaz rendelkezésre áll a teljes sokaság a mntavételhez, akkor egyszerűbben végrehajtható módszereket alkalmazhatunk. Azonban abban az esetben, ha tudjuk az alapsokaságról, hogy az eleme a vzsgálat szempontjából egyértelműen, jól csoportosíthatók, azaz heterogén a sokaság, akkor a megbízható következtetés érdekében nem elégedhetünk meg az előbb említett egyszerűbb módszerekkel, mert esetleg olyan mntához jutunk, mely téves következtetésekhez vezet. A mntavétel megtervezése, a mntavétel módok közül a célnak, lletve a sokaság jellemzőnek legmegfelelőbb kválasztása egyértelműen azt a célt szolgálja, hogy következtetésünk mnél nagyobb megbízhatóságú legyen. Ezt egy egyszerű, de gen szemléletes példával s gazoln lehet. Feladatunk a szórakozásra (moz, színház, különböző rendezvények valamnt könyvtár-látogatásra) fordított dő meghatározása, becslése. Nylvánvaló, hogy azok, akk nagyobb városokban élnek, lletve akknek a jövedelme az átlagostól magasabb, azoknak több a lehetőségük az lyen jellegű tevékenységre. Tehát a sokaság ebből a szempontból nem teknthető homogénnek, mert a lakóhely és a jövedelem s erősen befolyásolja a szórakozásra fordított dőt. Ha ebben az esetben a legegyszerűbben végrehajtható, un. egyszerű mntavételt alkalmazzuk, akkor előfordulhat szélsőséges esetben hogy a mntánk csak főváros, vagy kzárólag alacsonyabb jövedelmű egyéneket fog 6

tartalmazn. Ha ebből a mntából vonjuk le a következtetésünket, akkor vagy egyk, vagy másk rányba, de gen jelentősen el fog térn az eredmény a valóságostól. A továbbakban tekntsük át részletesebben a véletlenen alapuló kválasztás módok közül azokat, amelyek a gyakorlat életben a leggyakrabban fordulnak elő: 1.) FAE független, azonos eloszlású mnta Homogén és végtelen vagy nagyon nagy számosságú sokaságból veszünk mntát vsszatevéssel vagy vsszatevés nélkül. Hasonló eredményre vezet, ha véges sokaságból egyenlő valószínűséggel vsszatevéses mntát veszünk. Gyakorlat alkalmazása elsősorban a tömegtermelés mnőségellenőrzésénél célszerű..) EV egyszerű véletlen mnta Összehasonlítva: Homogén és véges elemszámú sokaság esetén alkalmazható. A mntát vsszatevés nélkül választjuk k. Mnden lehetséges n elemű mnta kválasztásának a valószínűsége azonos. Hasonló a FAE mntához, de véges és ksebb elemszámú sokaságok esetén nkább ez használatos. a FAE kényelmesebb elmélet tulajdonságokkal rendelkezk, az EV pedg a gyakorlatban nkább használatos (azonos elem megfgyelése felesleges, lletve ha a megfgyelés károsítja az egyedet, akkor a vsszatevés nem valósítható meg). A Statsztka II. tantárgy keretében megsmert módszerek, melyek lehetővé teszk a mntából a teljes sokaságra történő következtetést a matematka hátterüket tekntve független, azonos eloszlású mnta esetén alkalmazhatók, ennek ellenére tanulmányank során ezeket a módszereket egyszerű véletlen mntavétel esetén használtuk. Ennek oka egyrészt, hogy a gyakorlatban sokkal gyakrabban használatos az egyszerű véletlen mntavétel, mvel a vsszatevés csökkenthet a rendelkezésre álló nformácó mennységét. Másrészt vszont a megsmert matematka statsztka módszerek egyszerű véletlen mntavétel esetén s használhatók, akkor, ha a becslés n (következtetés) hbáját egy k 1- korrekcós tényezővel korrgáljuk. A korrekcó N elhagyható, ha a kválasztás arány nagyon kcs, azaz a kválasztás arány nem ér el a 10 %-ot. Az előző két mntavétel mód megbízhatóan csak homogén sokaság esetén használható, am a gyakorlatban nagyon rtka. Ha smert, hogy a sokaság a vzsgálat szempontjából jól elkülöníthető csoportokra bontható, akkor az előzőekben smertetett mntavétel módok ugyan technkalag használhatók, de megbízhatóságuk kérdéses. Ekkor célszerű az egyes csoportokat rétegeket külön-külön vzsgáln, azaz rétegezett mntavételt használn. 7

3.) R rétegzett mntavétel Heterogén sokaság esetén alkalmazható. Először a fősokaságot valamlyen smérv szernt átfedés-mentesen homogén rétegekre osztjuk; Ezután az egyes rétegeken belül egymástól függetlenül EV (rtkábban FAE) mntát veszünk. Jelölés: N 1, N, N M a rétegek elemszáma n 1, n,..n m a mnták elemszáma M j1 N j N és M j1 n j n Azért célszerű ennek a mntavétel módnak az alkalmazása, mert azonos mntanagyság esetén a vzsgált jellemzőkre (µ, σ) ksebb hbát kapunk, mnt az EV mntavétellel, feltéve, hogy a rétegezés jó volt. Rétegezés módok: mlyen szempontok alapján döntsük el, hogy egy-egy rétegből menny egyedet fgyeljünk meg, azaz mlyen legyen a mnta rétegenként elosztása? a.) egyenletes: - mnden rétegből ugyananny elemet választunk k függetlenül az egyes rétegek részarányától, lletve a réteg egyéb tulajdonságatól: n n j n ; előnye, hogy végrehajtása gen egyszerű. N - Grafkusan ábrázolva: N 1 N 3 N n b.) arányos: - a mntába az egyes rétegek sokaság arányanak megfelelően választjuk az elemeket n j N j n N - végrehajtása szntén egyszerű, s mvel a mntában és a sokaságban ugyanazok az arányok teljesülnek, ez megkönnyít a később számításokat. 8

- Grafkusan ábrázolva: N 1 n 1 n 3 N 3 n N c) Neyman-féle optmáls: - rögzített mntanagyság esetén kedvezőbb tulajdonságú mntát kapunk, ha a nagyobb szóródású rétegből nagyobb mntát veszünk: n j N j σ j N σ j j n - mnmáls mntavétel hbához jutunk, de a végrehajtása a gyakorlatban nem egyszerű, mvel szükséges hozzá a rétegek szórásának smerete. d) költség-optmáls: - az egyes rétegek szórása mellett smerjük és a kválasztásnál fgyelembe vesszük az egyes rétegek megfgyelésének költségét s. - adott költségkeret mellett mnmáls hbát eredményez. A rétegzett mntavétel specáls kérdése: a.) többcélú mnta: előfordulhat, hogy egy felméréssel több esetenként eltérő kérdésre keresk a választ, ekkor felmerül a kérdés, hogy m legyen a rétegképző smérv/szempont? Lehetséges megoldások: () kompromsszumos elosztás: a különböző szempontok szernt elvégzett elosztás átlagát tekntjük a legjobb elosztásnak. () Kombnált rétegzés: nem egy, hanem több smérv alapján bontjuk a sokaságot rétegekre. Pld. KSH ELAR lakosság adatfelvételében a lakosságot lakóhely (megye) településtípus (város, község) szernt rétegezk. foglalkozás struktúra b.) utólagos rétegzés: az adatfelvétel eredetleg egyszerű véletlen mntavétellel történt, mvel nem volt smert, hogy a vzsgáln kívánt sokaság a vzsgálat szempontjából heterogén. Ekkor a felvétel eredményet utólag soroljuk rétegekbe, és úgy számolunk vele, mntha az adatok eleve rétegzett mntából származnának. 9

A továbbakban smertetett mntavétel módok leggyakrabban akkor használhatók, ha smerjük ugyan a vzsgáln kívánt sokaságot, de nem áll rendelkezésre a sokaság elemenek a teljes lstája, am alapján a mntavételt megtervezhetjük, ugyanakkor smert, hogy a sokaság mlyen csoportokra bontható, s rendelkezésre áll a csoportok lajstroma. 4.) CS csoportos (egylépcsős) mntavétel Homogén, véges sokaság esetén használható, ha nem áll rendelkezésre a sokaság elemek teljes lstája, de nagyobb csoportokra rendelkezünk lstával. Akkor s alkalmazható, ha a csoportok a koncentráltságuk matt könnyebben, olcsóbban fgyelhetők meg, mnt az egyedek. Először a csoportok halmazából EV mntát veszünk, majd az így kválasztott csoportokat teljes körűen megfgyeljük (pld: skolások drogfogyasztás szokása). - elsődleges mntavétel egység amre a mntavétel közvetlenül rányul (skolák) - másodlagos/végső mntavétel egység amre a következtetést le akarjuk vonn (dákok) 5.) TL többlépcsős mntavétel hasonló esetekben használjuk, mnt a csoportos mntavételt tt több lépcsőben jutunk el a végső megfgyelés egységhez leggyakorbb a kétlépcsős - először EV mntavétellel kválasztjuk a csoportokat, majd a csoporton belül s EV mntavételt végzünk. Pld. skolák (EV) osztályok (EV) dákok (EV v teljes körűen) Grafkusan ábrázolva: EV vagy FAE R CS TL A matematka-statsztka módszerekkel történő valószínűség alapokon nyugvó következtetésnek a véletlenen alapuló mntavétel az alapja, mégs a gyakorlatban előfordulhat, hogy egyéb mntavétel módot alkalmazunk. Természetesen, ha a kválasztásban a véletlen helyett a tudatos befolyásolás érvényesül, le kell mondanunk arról, hogy a megfgyelés a következtetés megbízhatóságát, pontosságát a véletlenen alapuló matematka-statsztka módszerekkel határozzuk meg. Ugyanakkor a gyakorlat haszna ezeknek a módszereknek mégs szükségessé tesz a módszerek áttekntő smertetését különösen azért, mert bzonyos esetekben a nem véletlenen alapuló kválasztás hasonló tulajdonságokkal rendelkezhet, mnt a reprezentatív megfgyelés egyéb módszere. 10

Nem véletlen mntavétel eljárások 1) Szsztematkus kválasztás ha n elemű mntát akarunk venn egy N elemű sokaságból, akkor meghatározva a N k lépésközt a k 0 véletlen kezdőpontból kndulva mnden k-adk elemet fgyeljük n meg: k 0, k 0 +k, k 0 +k;. A mnta gyorsan és mechankusan kválasztható. Egybeeshet az EV megfgyeléssel, ha az elemek felsorolása független a megfgyelés tárgyától. ). Kvótás kválasztás A felvételt végző személy előre megkapja, hogy mlyen összetételűnek kell lenn a mntának. Pld. Lakosság egészség állapota korcsoportok adottak 3.) Koncentrált kválasztás Erősen koncentrált sokaság esetén használható, amkor vszonylag kevés egyed nagy befolyással/hatással rendelkezk a sokaság jellemzőre ezeknek nagyobb esélyt adunk a mntába kerülésre. Pld: fogyasztó árndex számításánál egy-egy termékcsoportot az reprezentál, amelynek a legnagyobb a forgalma. 4.) Hólabda kválasztás Rtka és nehezen számba vehető sokaságnál alkalmazható. Néhány kválasztott egyedből kndulva azok smeretség körében keressük a következő mntaelemeket, majd az új egyedek smét a saját smeretség körükben továbbadják a kérdőívet. 5.) Önkényes (szubjektív) kválasztás Ez volt a reprezentatív mntavétel történetleg elsőként alkalmazott módszere. A mntavételt tervező szakma smerete alapján választják k a mntát. Ismételt vagy másodlagos mntavétel eljárások Az alábbakban smertetett módszereket akkor alkalmazhatjuk, ha a megfgyelés eredményeképpen nem áll rendelkezésre elegendő számú adat (nformácó), nncs elég nagy mnta a következtetésenk levonásához. A másodlagos mntavétel eljárások főbb jellemző: Specáls csoport a gyakorlatban alkalmazott mntavétel módok között. Elv alapja az a felsmerés, hogy a tényleges mntavétel gen költséges, míg a számítógép használata egyre olcsóbb! A meglévő ksebb és olcsóbb mntákat számítógépes módszerekkel megtöbbszörözk. A meglévő mntából újabb mntákat képeznek azért, hogy a mntában lévő nformácókat jobban khasználják. 11

1) Független részmnták módszere A legegyszerűbb mntasmétlés módszer A meglévő mnta független és véletlen feldarabolásával új mntákat állít elő. ) Kegyensúlyozott smétlések: Az összes lehetséges módon felez a mntát. 3) Jackknfe módszer Úgy állít elő új mesterséges mntákat, hogy az eredet mntából mndg elhagy egy-egy elemet n db n-1 elemű mntát kap. 4.) Bootstrap módszer A meglévő n elemű mntából újabb n elemű vsszatevéses mntákat készít. III. Mntafeladat megoldása Az egyszerű véletlen mntavétel esetén már a Statsztka II. tantárgy keretében megsmerhettük a mntából való következtetés, a becslés és hpotézs-vzsgálat legegyszerűbb módszeret. A továbbakban egy mntapélda részletes smertetésén keresztül megsmerhetjük a várható érték és a szórás, mnt két legfontosabb sokaság jellemző becslésének módszerét rétegzett mntavétel esetén s, valamnt egy specáls becslés eljárás, a hányados-becslés alapjat. A mntából való következtetés másk nagy csoportjából, a hpotézs-vzsgálat módszere közül az un. nemparaméteres próbák alkalmazását mutatjuk be. Annak érdekében, hogy Magyarországot tursztka szempontból vonzóbbá tegyük a Kelet-Közép Európa tursták számára s, a jelenleg helyzet megsmerése érdekében az Országos Idegenforgalm Hvatal részletes statsztka felmérést tartott öt szomszédos, vagy környező országból Csehországból, Horvátországból, Oroszországból, Szlovákából és Ukrajnából hazánkba érkezett személyek körében. Többek között vzsgálták az 1999-ben és 000-ben tt töltött vendégéjszakák és a nevezett országokból érkezettek számának alakulását. A felmérés során 000-ben összesen 0 000 főt kérdeztek meg, akk a vzsgált országok szernt egyenletes megoszlásban kerültek a mntába. A rétegzett mntavétel alapján az alább adatok állnak rendelkezésre (a sokaság szórás értéke korább felmérésből smertek): Ország Hazánkba érkezettek száma (N ) Mntába kerültek száma (n ) Vendégéjszakák átlaga ( x ) Sokaság szórás (σ ) Mntabel szórás (s ) Csehország 37 037 4 000,7 1,7 1,6 Horvátország 35 38 4 000,1 1,0 1,1 Oroszország 56 389 4 000 3,6,3,1 Szlováka 33 448 4 000,9 1,4 1,5 Ukrajna 36 400 4 000,6 1,1 0,8 Összesen 198 51 0 000 1

a) Várható érték becslése rétegzett mntából Az elemzés első lépéseként becsüljük meg az 5 országból hazánkba érkezett tursták által tt töltött vendégéjszakák átlagos számát 98%-os megbízhatóság sznt mellett! A feladat elvégzéséhez meg kell határoznunk a táblázat adata alapján a vzsgált 5 országból hozzánk érkezettek megoszlás vszonyszámat mnd a teljes sokaságban, mnd a mntában. A sokaság és mntabel arányok összevetéséből megállapíthatjuk, hogy arányosan, vagy nem arányosan rétegzett mnta áll rendelkezésünkre. A megoszlás vszonyszámokkal kbővített táblázat: Ország Hazánkba érkezettek száma (N ) Sokaságbel arány N ; (%) N Mntába kerültek száma (n ) Mntabel arány n ; (%) n Vendégéjszakák átlaga ( x ) Sokaság szórás (σ ) Mntabel szórás (s ) Csehország 37 037 18,66 4 000 0,7 1,7 1,6 Horvátország 35 38 17,75 4 000 0,1 1,0 1,1 Oroszország 56 389 8,40 4 000 0 3,6,3,1 Szlováka 33 448 16,85 4 000 0,9 1,4 1,5 Ukrajna 36 400 18,34 4 000 0,6 1,1 0,8 Összesen 198 51 100,00 0 000 100,8645 Látható, hogy nem arányos rétegezéssel van dolgunk, hszen a sokaság arányok jelentősen eltérnek a mntabel arányoktól. Ilyen esetben a mntaátlag és a mntaátlaghoz tartozó standard hba meghatározásához a sokaság arányokat kell alkalmaznunk. A mntaátlag meghatározása: N x x N 0,1866,7 + 0,1775,1 + 0,84 3,6 + 0,1685,9 + 0,1834,6,8645 A mnta alapján tehát azt mondhatjuk, hogy a vzsgált 5 országból hazánkba érkezett tursták átlagosan,8645 éjszakát töltöttek tt. Ez a mntaátlag jelent az tt töltött vendégéjszakák átlagának becslése szempontjából a pontbecslést. A becsléshez meg kell határoznunk a mntaátlag standard hbáját. Mvel a mntába került személyeknek a sokasághoz vszonyított aránya meghaladja a 10%-ot, ezért alkalmazn kell a n k korrekcós tényezőt, ahol k 1. N s x s x N s n 1,6 4000 + + 0,8 4000 1 0,1866 1... 0,1834 1 N n N 4000 37037 4000 36400 0,0114 13

Mvel nagy mntánk van, ezért a z eloszlásfüggvény táblázatából kell kkeresnünk a 98%-os megbízhatósághoz tartozó függvényértéket: z 0,98,3 A becslő függvény alapján most már elvégezhetjük a vendégéjszakák átlagos számára vonatkozó becslést: x ± s x zπ,8645 ± 0,0114,3 [,838 ;, 891] Levonhatjuk tehát azt a következtetést, hogy a vzsgált 5 országból érkező tursták által tt töltött vendégéjszakák átlagos száma 98%-os valószínűséggel,838 és,891 közé esk. Értékösszeg becslése Állapítsuk meg 95%-os megbízhatósággal azt, hogy 000-ben a vzsgált 5 országból Magyarországra érkezett tursták összesen menny vendégéjszakát töltöttek tt! Ehhez a sokaság összes elemszámával (N) kell megszoroznunk a 95%-hoz tartozó, új konfdenca ntervallum alsó és felső határát. ( x s z ) 19851 (,8645 ± 0,0114 1,96) [ 5640 ; 573073] N x ± π Megállapíthatjuk, hogy a vzsgált 5 országból 000-ben hazánkba érkezett tursták által tt töltött összes vendégéjszaka száma 95%-os valószínűséggel 564 0 és 573 073 közé esk. b) Neyman-féle optmáls rétegezés Állapítsuk meg, hogyan kellett volna mntavételt elvégezn, ha a Neyman-féle optmáls rétegezést alkalmaztuk volna! A Neyman-féle optmáls rétegezés alapelve az, hogy az egyes rétegek sokaság elemszáma mellett azok sokaság szórásának fgyelembe vételével válasszuk meg a mntába kerülő elemek számát. Ebből tehát az s következk, hogy amennyben rendelkezésre áll a számítás során a sokaság szórás értékeket kell alkalmazn és nem a mntabel szórásokat! A Neyman-féle optmáls rétegezés általános képlete: N σ n n N σ A nevező értékét célszerű előre kszámítan: N σ 37037 1,7 +... + 36400 1,1 31476, 8 Ez alapján az egyes országokból érkező tursták esetén az alább táblázatban szereplő nagyságú mntákat kellett volna venn az optmáls rétegezéshez (mvel személyekről van szó, ezért a táblázatbel értékek egészre kerekítettek): 14

Ország Optmáls mntanagyság (fő) 37037 1,7 Csehország 0000 4001 31476,8 3538 1,0 Horvátország 0000 39 31476,8 56389,3 Oroszország 0000 841 31476,8 33448 1,4 Szlováka 0000 975 31476,8 36400 1,1 Ukrajna 0000 544 31476,8 Összesen 0 000 Felhívjuk a fgyelmet, hogy a Neyman féle módszer az eredet mntanagyságot osztja fel az egyes rétegek között, így a rétegenként optmáls mntanagyság összegének azonosnak kell lenn az eredet mntanagysággal, jelen esetben 0 000 fővel! c) Hányados-becslés Ahogyan már a feladat elején említettük, egy évvel korábban, 1999-ben s elvégeztek egy ugyanlyen felmérést, ahol a mnta elemszáma és a rétegezés módja s megegyezett a 000 évvel, amből tudjuk, hogy 1999-ben a vzsgált 5 országból érkezett tursták összlétszáma nem változott, az átlagos vendégéjszakák száma esetükben 3,15 volt, a mntabel szórás pedg 1,748. Ismert továbbá, hogy a két év mntája alapján az tt töltött vendégéjszakák szorzatösszege 160 10. Határozzuk meg a két mnta alapján 98 %-os megbízhatósággal, hogy 1999-ről 000-re a vzsgált 5 országból érkezők esetében a nálunk töltött vendégéjszakák száma hány százalékkal esett vssza és ez hány vendégéjszakány csökkenést jelentett! A feladatot hányados-becslés segítségével oldjuk meg. Először mnt mnden becslés esetében el kell végeznünk egy pontbecslést, am jelen esetben a két mnta átlagának hányadosa lesz. Mvel dőbel változást vzsgálunk, ezért a 000-es mnta (továbbakban x-szel jelölve) átlagát kell elosztanunk az 1999-es mnta (továbbakban y-nal jelölve) átlagával. x h y,8645 3,15 0,917 Ebből azt a következtetést vonhatjuk le, hogy a két év mntá alapján a vzsgált országokból érkezett tursták által tt töltött vendégéjszakák száma 1999-ről 000-re 8,3 %-kal csökkent. 15

Hasonlóan a több, eddg használt becslőformulához, jelen esetben s szükségünk van a standard hba meghatározására, melynek általános képlete hányadosbecslés esetén: y ( y) x + h h xy s h 1 Melőtt magát a standard hbát meghatározhatnánk, számos segédszámítást kell elvégeznünk. Az 1999-es mnta szórását smerjük, vszont a 000-es mntáét még nem. Számítsuk k először tehát a 000-es mnta szórását, amhez szükségünk lesz a mnta külső és belső szórásnégyzetere s: n N s x K n n ( x x) 4000 (,7,8645) +... + 4000 (,6,8645) 0000 4894 0000 0,447 s x B n s n 4000 1,6 +... + 4000 0,8 0000 4480,14 0000 s x s x + s x 0,447 +,14,4587 s x K B 1,568 Az alább táblázat a standard hba meghatározásának knduló adatat tartalmazza: Adat 1999-es mnta (y) 000-es mnta (x) Átlag 3,15,8645 Szórás 1,748 1,568 Elemszám 0 000 0 000 Σxy 160 10 A standard hba képletében szereplő értékek meghatározása: s s x y dx x n x x n 1 n 1 dy y n y y n 1 n 1 ( n 1) s + n x 19999 1,568 + 0000,8645 x ( n 1) s + n y 19999 1,748 + 0000 3,15 y x 1377,64 y 56107, 1495 ( y ) ( n y) ( 0000 3,15) 390000500 Itt hívnánk fel a fgyelmet arra, hogy ( ) y y! 16

Most már mnden adat rendelkezésünkre áll a standard hba képletébe való behelyettesítéshez: s h 1377,64 + 0,917 56107,1495 0,917 16010 1 390000500 0000 0,00558 19851 A becslőképletből hányzk még a próbafüggvény értéke, amt hányados-becslés esetén π + 1 mndg a t-próba táblázatából határozunk meg valószínűség mellett. t 0,99,33 Ez alapján a hányados-becslésünk a következő: h ± ο 99 s h t, 0,917 ± 0,00558,33 [ 0,904 ; 0, 930] Levonhatjuk tehát azt a következtetést, hogy a vzsgált 5 országból érkező tursták által tt töltött vendégéjszakák száma 1999-ről 000-re 98 %-os valószínűséggel 7 % és 9,6 % között mértékben csökkent. A feladathoz tartozott annak meghatározása s, hogy ez a 7 és 9,6% között csökkenés ténylegesen hány vendégéjszakány csökkenést jelentett. Ehhez nduljunk k abból a feladat elején olvasható nformácóból, hogy a vzsgált 5 országból érkezett tursták száma nem változott 1999 és 000 között, így a vendégéjszakák számának tényleges csökkenése csak az átlag csökkenésének és nem a tursták létszámcsökkenésének köszönhető. 1999-ben így az 5 ország turstá 19851 3,15 619854 vendégéjszakát töltöttek nálunk, am 7 és 9,6 % között mértékben csökkent: 619854 0,07 43390 619854 0,096 59506 98%-os megbízhatósággal állíthatjuk tehát, hogy a megállapított csökkenés 43 390 és 59 506 között vendégéjszaka kesést jelentett. d) Varanca analízs Következő feladatként vzsgáljuk meg a 000-es mnta alapján, hogy 5%-os szgnfkanca sznten befolyásolja-e a Magyarországon töltött éjszakák számának alakulását az, hogy melyk országból érkezett a tursta. Ennek eldöntéséhez nem-paraméteres hpotézsvzsgálatra, varanca analízsre lesz szükségünk. A hpotézsek, melyek elfogadásáról vagy elvetéséről döntünk: H H 0 1 : β β... β 1 : : β 0 5 azaz függetlenség áll azaz van kapcsolat fenn 17

A H 0 hpotézsről való döntéshez F-próbát használunk, melyhez k kell számítanunk a külső és belső eltérés négyzetösszegeket: S K ( x ) 4000 (,7,8645) +... + 4000 (,6,8645) 4894 n x S B n s 4000 1,6 +... + 4000 0,8 4480 F S K m 1 S B n m 4894 5 1 4480 0000 5 55,48 Ezt követően meg kell határoznunk az α 5 %-hoz tartozó felső krtkus értéket az F-eloszlás táblázatából ν 1 m-1 4 és ν n-m 19 995 (gyakorlatlag ν ) szabadságfokok mellett: c f,37. H 0 A mellékelt ábra alapján könnyen leolvasható, hogy a mntánk alapján a H 0 hpotézst elvetjük, azaz van c f,37 55,48 kapcsolat a Magyarországon töltött vendégéjszakák száma és az országhoz való tartozás között. H 1 e) Illeszkedésvzsgálat Az már a knduló táblázaton látszott, hogy Oroszországból jelentősen több tursta érkezett 000-ben, mnt a másk 4 országból. A több országból azonban közelítőleg azonos számban érkeztek, ezért az elemzés során arra s adjunk választ, mszernt 5 %-os szgnfkanca sznten gaz-e, hogy az Oroszországon kívül 4 országból érkezők száma egyenletes eloszlást követ! Ennek megválaszolása szntén nem-paraméteres hpotézsvzsgálattal történk: lleszkedésvzsgálat elvégzése szükséges. Ennek alapelve az, hogy a ténylegesen megfgyelt gyakorság értékeket vszonyítjuk az egyenletes eloszlás esetére feltételezett gyakorság értékekhez. A feladat megoldása jelen esetben s a hpotézsek felállításával kezdődk: H H 0 1 : Pr( x ) P : : Pr( x ) P azaz egyenletes az eloszlás azaz nem egyenletes az eloszlás 18

A szükséges segédszámításokat az alább táblázat tartalmazza: Ország Tényleges gyakorság f ;(fő) Egyenletes eloszlás esetére feltételezett valószínűség P Egyenletes eloszlás esetére feltételezett gyakorság np ( f np ) Csehország 37 037 0,5 1413 0, 5 35 530,75 63,85 Horvátország 35 38 0,5 35 530,75,41 Szlováka 33 448 0,5 35 530,75 1,09 Ukrajna 36 400 0,5 35 530,75 1,7 Összesen 14 13 1,00 14 13,00 09,6 Ezt követően meg kell határoznunk a felső krtkus értéket a Χ -eloszlás táblázatából, ν r 1 - b 4-1-0 3 szabadságfok ( ahol b a becsült paraméterek száma) és 1 - α 0,95 valószínűség sznt mellett: c f 7,81. A mellékelt ábra alapján leolvasható, hogy a mnta alapján a H 0 hpotézst elvetjük, azaz nem egyenletes a Csehországból, Horvátországból, Szlovákából és Ukrajnából Magyarországra érkezett tursták számának eloszlása. np H 0 H 1 c f 7,81 09,6 19

FELHASZNÁLT IRODALOM 1. Köves Pál Párnczky Gábor: Általános statsztka Tankönyvkadó, Budapest, 1989. Hajdu Pntér Rappay Rédey: Statsztka Pécs, 1994 3. Korpás Attláné dr. : Általános statsztka Nemzet Tankönyvkadó, 1996 4. Szarvas Beatrx Sugár András: Példatár a Statsztka című tankönyvhöz Aula Kadó, 1997 5. B. Kröpfl. W. Peschek E. Schneder A. Schönleb: Alkalmazott statsztka Műszak Könyvkadó, Budapest, 000 0

Feladatok 1

1. feladat A háztartások hav egy főre jutó élelmszer kadásat rétegzett kválasztás alapján vzsgálták az észak-magyarország régóban. A felmérés során a húsfogyasztásra vonatkozóan az alább adatokat kapták: Háztartás Háztartások száma Átlagos kadás Szórás Mnta elemszám az alapsokaságban (Ft/fő) (Ft) (n) (ezer) a mntában Város 300 900 15 000 6 000 Község 00 600 1 000 3 500 Összesen: 500 1 500...... Feladat: a) Becsülje meg a város háztartás év átlagos egy főre jutó húsfogyasztás kadásanak alsó és felső határát 99,7 %-os valószínűség sznten! b) Becsülje meg 96 %-os megbízhatósággal a háztartások egy főre jutó húsfogyasztás kadásanak összegét!. feladat A STAT-III. közvélemény-kutató cég megbízást kapott, hogy állapítsa meg 98 %-os megbízhatósággal egy nagyvárosban a családok élelmszer-vásárlásanak átlagos értékét. A cég rétegzett mntavételes eljárást alkalmazva az alább számítás részeredményekhez jutatott: Terület Mnta elemszáma Átlagos vásárlás Korrgált tapasztalat (n) érték (Ft/fő/alkalom) szórás (Ft) Belváros 40 8.600 450 Külváros zöldövezet 40 13.100 600 Lakótelep 30 1.00 380 Összesen:. Az átlagos vásárlás érték normáls eloszlást követ. A város 00 000 lakosának ¼-e lakk a belvárosban és 60 %-a lakótelepen, a több a külváros zöldövezetében. Feladat: Mlyen eredményre jutott a STAT-II. cég? 3. feladat Az egyetem hallgatók kulturáls és sportkadásanak becslésére 100 elemű véletlen mntát választottak k. A mntában a következő adatokat kapták: A hallgató Megoszlás az Het kulturáls és sportkadás (Ft/fő) Fő neme alapsokaság (%) átlaga szórása Nő 0 60 1 600 00 Férf 80 40 1 400 300 Összesen: 100 100... Feladat: a) Becsülje meg az egyetem hallgatóság het átlagos kulturáls- és sportkadását 95 %-os megbízhatóság sznten! b) Indokolja meg, hogy mkért folyamodtak a fent mntavétel tervhez!

4. feladat Egy pzzéra üzletlánc pac terjeszkedéséhez szeretné megbecsüln, hogy adott városban mekkora összeget költenek a fogyasztók havonta átlagosan pzzára. A felmérés során rétegzett mntavétel eljárással 400 elemű mntát vettek. A mnta ¾-e fatalokból (5 év alatt) és ¼-e dősebbekből (5 év felett) állt. Ismert, hogy a városban a pzzát fogyasztókra s ugyanlyen arányok érvényesek. A mnta alapján azt tapasztalták, hogy a fatalok átlagos hav pzzafogyasztásának értéke 1 800 Ft/fő/hó, a pzza-fogyasztás értékének négyzetösszege 1 008 67 500,0 Ft. Az dősebbek a mntában 80 000 Ft-ot költöttek pzzára, a korrgált tapasztalat szórás pedg 00 Ft volt. Feladat: Becsülje meg 96 %-os megbízhatósággal a városban az átlagos pzza-fogyasztás értékét! 5. feladat Egy országban új társaság adótörvény bevezetését tervez a kormány. Szeretnék a lehető legmagasabb adót kvetn, de nem akarják elveszíten a sok külföld befektetőt, s lehetetlen helyzetbe hozn a vállalkozásokat. Ezért a törvény alkotása előtt egy előzetes felmérést végeztek arra vonatkozóan, m az a maxmáls adókulcs, amt még a vállalkozók s elfogadhatónak tartanak. Az országban 348 600 vállalkozás működk. Egy 1000 elemű mntavétel eredménye: A vállalkozás tulajdonosa A vállalkozások aránya a sokaságban (%) A megkérdezett vállalkozások száma (db) Javasolt maxmáls adókulcs átlaga (%) Javasolt maxmáls adókulcs szórása (%) Belföld 6 300 30 6 Külföld 3 50 0 5 Vegyes tulajdonú 4 450 5 7 Összesen 100 1000 Feladat: Becsülje meg 95,5 %-os megbízhatóság sznten, menny a vállalkozások által javasolt adókulcs átlagos nagysága! 6. feladat Egy mezőgazdaság tevékenységgel foglalkozó községben állatösszeírást tartottak. 1 950 háztartásban 3 400 db-ot vallottak be, ellenőrzésre kválasztottak 50 háztartást, ahol tételesen megszámlálták az állatokat. Számítás részeredmények: Bevallott: x 60 x 8760 Tényleges: 744 y 965 xy 9050 Feladat: Határozza meg 95 %-os megbízhatósággal a bevallás arányt, majd a korrgált állatállományt! 3

7. feladat Egy adott évben 4,5 mlló fő készített adóbevallást. A bevallott adó összege 00 mllárd Ft volt. Az adóbevallások ellenőrzése 1000 elemű mntát vesznek. A mntavétel eredménye: Fő Bevallott adó (Ft) Tényleges adókötelezettség (Ft) 1. 35 400 6 000. 31 600 31 600......... 1000 115 000 16 00 Átlag 44 000 48 000 Szórás 18 000 1 000 A mntában a bevallott és tényleges adó összege közt korrelácós együttható értéke 0,8. Feladat: Becsülje meg 95,5 %-os megbízhatósággal a tényleges adó nagyságát a bevallás arány segítségével! 8. feladat Egy megyében 0 ezer háztartásban tartanak kacsát. Az 1995. év elej állatszámlálás során összesen 85 ezer kacsáról adtak számot. A bevallás ellenőrzését egy 300 elemű véletlen mnta alapján végezték el. A 300 háztartás felmérése során az alább adatok váltak smertté: Kacsák száma: 1 450 Kacsák bevallott száma: 1 300 Kacsák számának relatív szórása: 3 % A kacsák bevallott számának relatív szórása: 6 % A tényleges és a bevallott szám között lneárs korrelácós együttható: 0,71 Feladat: Becsülje meg 95 %-os megbízhatósággal a bevallás arányt és ennek segítségével a megye tényleges kacsaállományának nagyságát! 9. feladat Egy 1 000 háztartásra kterjedő véletlen mntában egymást követő hónapban megfgyelték a háztartások megtakarításanak alakulását: Megnevezés 001. szeptember 001. október Átlag (eft) 5, 5,6 Relatív szórás (%) 40 40 Lneárs korrelácós együttható 0,8 Feladat: Készítsen 98 %-os megbízhatósággal ntervallum-becslést a megtakarítások relatív növekedésére vonatkozóan! 4

10. feladat Egy 9 000 főt foglalkoztató gyár dolgozóra vonatkozó adatok 001-ben: Foglalkoztatás Alapsokaságbel Mntabel mnőség arány (%) átlagkereset (Ft) szórás (Ft) létszám (n) Fzka 65 74 800 13 00 400 Nem fzka 35 145 800 5 500 400 Összesen: 100 800 Feladat: a) Becsülje meg 95,5 %-os megbízhatósággal a foglalkoztatottak átlagkeresetének alsó és felső határát! b) Ellenőrzze azt a hpotézst, hogy az átlagkereset független a foglalkozástól! (α 5%) 11. feladat Egy felsőoktatás ntézményben a hallgatók nap étkezésre fordított kadásat vzsgálták, s étkezés lehetőségek szernt rétegzett mntavétellel az alább értékeket tapasztalták: Étkezés lehetőség Megkérdezettek Átlagos nap étkezés A nap étkezés száma (fő) kadás (Ft/fő) kadás szórása (Ft/fő) Menza 100 480 80 Önkszolgáló étterem 100 60 150 Gyorsbüfé 100 550 50 Összesen 300 Feladat: a.) Becsülje meg 96 %-os megbízhatósággal a hallgatók nap átlagos étkezés kadását, ha smert, hogy a hallgatók fele a gyorsbüfében, 0 %-a pedg általában a menzán ebédel! b.) Ha átlagosan egy nap 5600-an étkeznek az ntézményben, akkor összesen mekkora bevételre számíthat naponta a három vendéglátópar egységet üzemeltető cég? c.) Befolyásolja-e az étkezés helye (menza, étterem, büfé) az étkezésre fordított összeg nagyságát? (α 5%) 1. feladat Az egyetemsták alkoholfogyasztás szokásanak vzsgálatára egy mnta alapján kérdőíves felmérést végeztek három egyetemen. A mnta kválasztása arányos rétegezéssel történt. A kérdőíves felmérés egyk kérdése úgy szólt, menny alkoholt fogyasztanak a megkérdezettek egy hétvég buln. A válaszokat az alkoholtartalom ( ) alapján üveg sörre számították át: Egyetem Megkérdezettek Átlagosan elfogyasztott A fogyasztott alkohol szórása száma (fő) alkohol ( üveg sör) a mntában a sokaságban SZE 80,6 1,8 ME 50,8 1,6 1 DE 70 3,4,7 3 Összesen 00... 5

Feladat: a) Tegyük fel, hogy a három egyetem közös bult rendez. Ha a 3 egyetemre együtt 45 000-en járnak, akkor becsülje meg 95 %-os bztonsággal, hány üveg sört (lletve annak megfelelő alkoholt) kell a bulra bztosítan, ha mndenkre számítanak! b) Hogyan kellett volna meghatározn a mnta összetételét, ha a Neyman-féle optmáls rétegezést alkalmazzák? c) Ellenőrzze le 5 %-os szgnfkanca - sznten, hogy van e kapcsolat az egyetem és az alkoholfogyasztás szokás között! 13. feladat Egy felsőoktatás ntézmény Statsztka Tanszékén a vzsgadőszak végén kértékelték a statsztka szgorlat eredményet. Az írásbel vzsga eredményet 50 véletlenszerűen kválasztott hallgató dolgozata alapján vzsgálták: Az írásbel dőpontja A mntába került A pontszám relatív Átlagos pontszám hallgatók száma szórása (%) Május 9. 5 61 5 Júnus 6. 15 55 10 Júnus 13. 8 66 8 Júnus 0. 1 70 15 Júnus 6. 10 53 10 Összesen: 50 Feladat: α 5 %-os szgnfkanca-sznten elfogadható-e az az állítás, hogy az egyes vzsganapokon azonos nehézségű dolgozatokat írtak a hallgatók? 14. feladat Egy húsboltban próbavásárlásokat végeztek a többlet-számolások ellenőrzésére. A próbavásárlások során az alább adatokat tapasztalták: Eladó neve Próbavásárlások Többlet-számolások száma átlaga (Ft) eltérés-négyzetösszege A. K. 16 5,0 1 63 N. T. 14 0,0 1 358 P. J. 0 8,5 711 K. Z. 14 15,0 1 199 Összesen 64... Feladat: Ellenőrzze le 5%-os szgnfkanca-sznten, hogy van-e különbség az eladók között a többlet-számolások tekntetében! 15. feladat Adott évben Magyarországon 515.000 látogató vett részt hangversenyeken, akk közül településtípusonként egyszerű véletlen mntavételezéssel megállapították a látogatók átlagos életkorát. A látogatók településtípusonként megoszlását és a mntából származó adatokat a következő táblázat tartalmazza: 6

A Látogatók átlagos Életkor Látogatók Létszám hangverseny életkora szórása száma helye a mntában Budapest 13.000 117 39,6 15,4 A több város 336.000 335 37,7 16, Községek 56.000 48 36,0 13,8 Összesen 515.000 500 - - Feladat: 1. Számítsa k, hogy 95%-os megbízhatóság sznt mellett menny a látogatók átlagos életkorának alsó és felső határa!. Ha a szórások alapján szerették volna optmalzáln a rétegzett mntavételt, hogyan kellett volna összeállítan a mntát, ha a rétegek szórása az alapsokaságban 14, 17 és 1 a tábla szernt sorrendben? 3. 5%-os szgnfkanca sznten van-e kapcsolat a hangverseny helyszíne és a látogatók átlagos életkora között? 16. feladat Egy 8 000 hallgatóval rendelkező egyetemen a hallgatók egy részétől megkérdezték, hogy hetente mekkora összeget költenek kulturáls és sportolás célokra. Egy 500 elemű véletlen mntát választottak, amelyről a következő adatok smertek: A rétegekben a het kulturáls- és sportkadás átlagosan a nők esetén 1800 Ft/fő, a férfak esetén 150 Ft/fő. Ezen átlagos kadásoktól való eltérések korrgált négyzetes átlaga a férfak esetén 450 Ft/fő, a nők esetén 310 Ft/fő. Az egyetemen a nők és a férfak megoszlása 60-40% és a kulturáls- és sportkadásak szórása 40, lletve 330 Ft/fő. A mntaelemek kválasztás aránya férfak esetén 7,815 %. Feladat: a.) Becsülje meg az egyetem hallgatóság het átlagos kulturáls- és sportkadását 95 %- os megbízhatóság sznten! b.) c.) A mntavételt másképpen s végrehajtották. Az új mntát 5 egymástól függetlenül választott egyenlő számosságú részmntából töltötték fel. A mntákban a het kulturáls- és sportkadások átlagos összege rendre 1400, 180, 1360, 1470 és 1390 Ft/fő volt. Becsülje meg 98 %-os megbízhatósággal e mntavétel esetén az egyetem hallgatók által kulturáls és sportcélokra elköltött het forntösszeg nagyságát! Hogyan kellett volna a mntát összeállítan, ha a Neymann-féle optmáls rétegezést alkalmazták volna? 17. feladat Egy üdülőtelepen a nyár dény alatt megfordult vendégek 60%-a volt külföld és 40 %-a haza. Megfgyelték 360 vendég megkérdezésével, hogy menny dőt töltöttek az üdülőtelepen. A mntavételt úgy hajtották végre, hogy először 10 vendéget kérdeztek meg, majd ezt még kétszer megsmételték. A mntában az átlagos tartózkodás dő rendre 9,8 és 13 nap/fő volt. 7

Feladat: a) Becsülje meg 90 %-os megbízhatósággal, hogy a vendégek átlagosan legalább hány napot tartózkodtak az üdülőtelepen! b) A mntavételt másképpen s végrehajtották: az üdülőtelepen megfordult mnden 100 haza és mnden 100 külföld vendég közül 18-at kérdeztek meg. A következő eredmények smertek: az dény alatt.000 vendég fordult meg az üdülőtelepen, akknek az átlagos tartózkodás dejétől való eltérések négyzetes átlaga haza vendégek esetén nap/fő, külföld vendégek esetén 4 nap/fő volt. A mntában az átlagos tartózkodás dő a külföld vendégek esetén 11, a hazaak esetén 8 nap/fő volt, amelyeknek a szórása rendre 3 és 5 nap/fő volt. Becsülje meg 98 %-os megbízhatóság sznten, hogy az üdülőben megfordult vendégek összesen hány napot töltöttek el ott a nyaralásuk alkalmával! c.) Hogyan kellett volna a mntát összeállítan, ha a Neymann-féle optmáls rétegzést alkalmazták volna? 18. feladat Egy degenforgalm felmérés során az 1988-ban hazánkba látogató olasz tursták átlagos tttartózkodás dejét kívánták becsüln. Mvel jól átteknthető mntavétel tervet nem lehetett készíten, a felvétel során úgy jártak el, hogy havonta 10 megfgyelést végeztek, majd a kapott 10 elemű mntát véletlenszerűen 6 darab, egyenként 0 elemű részmntára osztották, és ezek segítségével végeztek becslést. A 6 részmntából kapott átlagokat az alább tábla mutatja: Mnta sorszáma Átlagos tt-tartózkodás dő (vendégéjszaka) 1. 4,8. 4,3 3. 5,6 4. 4,7 5. 4,9 6. 5,7 Feladat: Becsülje meg 90 %-os megbízhatósággal az olasz tursták átlagos tt-tartózkodás dejét! 19. feladat Egy tejpar vállalat 4 500 vevőnek (üzletbe) szállít tejet. A vállalat szakembere a vsszaszállított tej tovább-feldolgozására való felkészülés érdekében fel akarták mérn, hogy tejből menny a vsszáru naponta. Ennek érdekében arányos rétegzett részmntákat vettek (a rétegzés a vevők típusa szernt történt), ezek száma 6 volt, s egy-egy részmntába 50 vevő került. A részmntákból a következő becsült adatokat kapták a vsszáru mennységére vonatkozólag: Részmnta sorszáma Átlagos vsszáru mennység egy vevőtől (lter) 1. 3. 3. 18 4. 19 5. 18 6. 0 8

Feladat: a.) Becsülje meg, hogy egy vevőtől átlagosan menny tejet szállítanak vssza naponta! b.) Számítsa k e becslés standard hbáját! c.) Határozza meg a konfdenca ntervallumot a nap átlagos vsszáru mennységre vonatkozólag 95 %-os megbízhatóság mellett! d.) Becsülje meg, hogy az összes vevőtől menny tejet szállítanak vssza naponta! e.) Számítsa k a becsült összes vsszáru-mennység standard hbáját! f.) Határozza meg a konfdenca ntervallumot az összes vsszáru mennységre vonatkozólag 99 %-os valószínűség sznt mellett! 0. feladat Egy szocológa felmérés keretében elemezték az egyetemsták lakáshelyzetét és hav kadásakat, s 50 egyetemstát megkérdezve az alább adatokat kapták: Hol lakk Megkérdezettek száma Hav összkadásuk A hav átlagos kadás (fő) (Ft) relatív szórása (%) Szülenél 16 40 000 5 Kollégumban 4 86 400 40 Albérletben 10 64 000 0 Összesen 50 190 400 Feladat: 5 %-os szgnfkanca sznten elfogadná-e a fent adatok alapján, hogy van kapcsolat a hallgatók lakáshelyzete és hav átlagos kadása között? 1. feladat Egy 00 elemű véletlen mnta megoszlása a könyvtár látogatás szokások és az skola végzettség szernt: Könyvtár látogatás 8 általános Középfokú Felsőfokú szokások végzettségű (fő) Összesen Nem jár könyvtárba 30 10 3 43 Néha jár 8 70 7 85 Rendszeresen jár 0 50 7 Összesen: 40 100 60 00 Feladat: Vzsgálja meg, hogy van-e szgnfkáns kapcsolat a két smérv között! (α 5 %). feladat Egy megye 60 ezer személygépkocs tulajdonosa közül véletlenszerűen kválasztottak 50-et a gépkocsjavítás gények és a gépkocs típusa közt kapcsolat jellegének feltárására. A mnta megoszlását az alább táblázat mutatja: A gépkocs A gépkocs meghbásodása esetén azt nagy értékű közepes értékű szerény értékű Összesen - maga javítja 1 3 11 15 - smerőse javítja 0 3 7 10 - magánszervz javítja 4 7 13 - márkaszervz javítja 1 3 8 1 Összesen: 6 16 8 50 9

Feladat: Vzsgálja meg 5 %-os szgnfkanca-sznten, hogy a gépkocsjavítás gények és a gépkocs típusa függetlennek teknthető-e? 3. feladat Közlekedésbztonság szervek 1000 személy sérüléses közút balesetet vzsgáltak meg aszernt, hogy mlyen súlyos volt a baleset és a baleset alkalmával a sérült vselt-e bztonság övet. A kapott eredmények az alábbak voltak: Baleset Bztonság övet kmenetele vselt nem vselt Összesen Könnyű 440 160 600 Súlyos 100 00 300 Halálos 60 40 100 Összesen 600 400 1000 Feladat: Ellenőrzze alkalmas próbával, hogy a baleset kmenetele független-e attól, hogy az llető vselt-e bztonság övet! (α 0,1) 4. feladat Egy közvélemény kutatás során egyk gazdaság témájú TV műsorról az alább kép alakult k a dplomások körében: Nylatkozó A műsor megítélése foglalkozása Jó Megfelelő Rossz Összesen Közgazdász 100 00 100 400 Jogász 100 60 40 00 Egyéb dplomás 100 60 40 00 Összesen 300 30 180 800 Feladat: Tesztelje 5%-os szgnfkanca sznten a foglalkozás jellege és a TV műsor mnősítése között kapcsolatot! 5. feladat Egy marketnggel foglalkozó cég vezetője arra kíváncs, hogy jól kképzett munkatársanak ügynök teljesítménye független-e az életkortól. Az adatokat az alapján rendszerezték, hogy egy adott termékből egy hónap alatt hány darabot skerült az ügynöknek eladna. A véletlenszerűen kválasztott 60 ügynök adatat az alább táblázat tartalmazza: Az ügynök életkora Eladások száma 5 és 9 között 10 és 15 között 16 és 0 között Összesen 30 év alatt 5 8 7 0 30 és 40 év között 8 9 9 6 40 év felett 6 5 3 14 Összesen: 19 19 60 Feladat: Befolyásolja-e az életkor az ügynökök munkájának eredményességét? (α 5%) 30

6. feladat Az élelmszerboltokban rendszeresen végeznek ellenőrzést arra vonatkozóan, hány fornttal csapják be a vásárlókat. A vzsgált dőszakban 6 egymástól független, 100-100 elemű véletlen mntát vettek, és megnézték a vásárló számláját, lletve a vásárlás tényleges értékét. A mntavétel eredménye a táblázatban látható: A mnta sorszáma A többlet-elszámolás átlagos összege (Ft) 1. 6. 70 3. 85 4. 85 5. 54 6. 64 Feladat: Becsülje meg, hány Ft-tal károsították meg a vásárlókat, ha a kskereskedelm élelmszer-forgalom összege a vzsgált dőszakban 176 Mrd Ft, egy vásárlás átlagos összege 00 Ft volt! (π 95%) 7. feladat Egy közvélemény-kutató ntézet 1000 felnőtt személyt megkérdezett arról, hogy mekkora fogyasztó árndexre számít 000 és 001 között. A mntavételre öt egymástól független és azonos nagyságú részmnta kválasztása útján került sor. Az öt részmnta adata: Részmnta sorszáma Átlagos várt fogyasztó árndex, % 1. 110. 111 3. 108 4. 110 5. 111 Feladat: Készítsen 98 %-os megbízhatóság szntű konfdenca ntervallumot a várt fogyasztó árndex átlagos nagyságára vonatkozóan! 8. feladat A különböző közgazdaság egyetemekre való jelentkezés eloszlásának vzsgálata céljából 1 00 érettségzőt megkérdeztek, hogy melyk egyetemre adta be jelentkezés lapját. A különböző ntézetekbe történő jelentkezés megoszlása a következő volt: Egyetem Budapest Debrecen Pécs Mskolc Szeged Jelentkezők száma (fő) 43 19 155 16 187 Feladat: Ellenőrzze le 5 %-os szgnfkanca-sznten, hogy egyenlő megoszlásban jelentkeztek az egyes egyetemekre! 31

9. feladat Egy édespar vállalat szállítás szerződése szernt egy cukorka-keverékben azonos arányúnak kell lenne az ötféle töltésű cukorkaszemeknek. Egy 1 000 elemű mntában a megoszlás az alább tábla szernt alakult: Töltelékfajta Cukorkák száma (db) Málna 178 Meggy 13 Méz 4 Ctrom 194 Narancs 191 Összesen: 1.000 Feladat: Ellenőrzze különböző szgnfkanca-sznteken, hogy a szállítmány eleget tesz-e az eloszlásra vonatkozó követelményeknek! 30. feladat Egy város rendőrsége szernt az éjszaka betörések száma egyenletesen oszlk meg a hét napjan. Egy het megfgyelés alapján a betörések száma az alább volt: Nap Betörések száma Hétfő 6 Kedd 8 Szerda 5 Csütörtök 7 Péntek 1 Szombat 17 Vasárnap 15 Összesen: 70 Feladat: Ellenőrzze α0,05 szgnfkanca-sznten, hogy gaz-e a rendőrség állítása! 31. feladat Egy packutatás során különböző (A, B, C, D, E) csomagolásban mutattak be egy új parfümkülönlegességet, s azt vzsgálták, hogyan befolyásolja a vásárlás szándékot a különböző csomagolás: Csomagolás A vásárlók száma (fő) A 4 B C 40 D 36 E 30 Feladat: Mlyen szgnfkanca sznten fogadhatjuk el azt a feltevést, hogy a vásárlókat a csomagolás s motválja a vásárlás során? 3

3. feladat A lég közlekedésben fontos fgyelemmel kísérn az utasok átlagos testsúlyát, ezért dőről dőre ellenőrzk, hogy a felnőtt utasok testsúlya nem tér-e el a feltételezettől. Ehhez szükség van a testsúly eloszlásának smeretére s, mely a feltétel szernt normáls eloszlást követ. A feltételezés ellenőrzése céljából megmérték 100 véletlenszerűen kválasztott utas súlyát, a mérés eredményét az alább táblázat tartalmazza: Testsúly (kg) Utasok száma (fő) 60 7 61 70 15 71 80 3 81 90 8 91 100 13 101 5 Összesen: 100 Feladat: Ellenőrzze le, hogy az eloszlás normálsnak teknthető-e a mnta alapján! (α 1%) 33. feladat Egy ruhaüzletben véletlenszerűen kválasztott 100 vásárló vásárlás érték szernt eloszlását vzsgálták. Ismert, hogy a 100 vásárló átlagosan 10 85 Ft-ért vásárolt, a vásárlás értékek korrgált tapasztalat szórása pedg 6,66 eft volt. A vásárlás értékek eloszlásáról a következő adatokat smerjük: Vásárlás érték Vásárlók száma (eft/fő) (fő) z.... 5 5-0,88. 19 1,8947 6 10 30-0,1 0,45 0,68..... 11 15 15-0,63 0,7356 0,834.. 16 0 1,38.... 0,1806.. 1 10..... 0,5 Összesen....... Feladat: Töltse k a táblázat hányzó adatat! Vzsgálja meg, hogy normálsnak teknthető-e a vásárlás értékek eloszlása! 34. feladat Egy élelmszerkereskedelm cég árbevételének alakulását vzsgálva 100 véletlenszerűen kválasztott napon megvzsgálták az árbevétel nagyság szernt megoszlását. A 100 nap adatat a következő táblázat tartalmazza: Árbevétel Napok száma (MFt) (db) z np 5 10 5.. 0,039 4 0,5 11 0 15-0,75 0,66 0,1874 1 30 0,5 0,5987.. 37 0,43 31 40 30 1,6.. 0,975 41 10.... 0,1038 10 Összesen..... 33