Általános statisztika I Havasy, György Molnár, Máténé Szunyogh, Zsuzsanna Tóth, Mártonné Korpás, Attiláné Csernyák, László

Hasonló dokumentumok
Bevezető Mi a statisztika? Mérés Csoportosítás

[GVMGS11MNC] Gazdaságstatisztika

Általános statisztika I. Havasy, György Molnár, Máténé Szunyogh, Zsuzsanna Tóth, Mártonné Korpás, Attiláné Csernyák, László

Sta t ti t s i zt z i t k i a 3. előadás

Sándorné dr. Kriszt Éva dr. Csesznák Anita. Statisztika I. Szerkesztette Sándorné dr. Kriszt Éva. Nemzedékek Tudása Tankönyvkiadó, Budapest

2. előadás. Viszonyszámok típusai

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

Sta t ti t s i zt z i t k i a 1. előadás

Megoldások. Az ismérv megnevezése közös megkülönböztető szeptember 10-én Cégbejegyzés időpontja

Statisztikai alapfogalmak

Viszonyszám A B. Viszonyszám: két, egymással kapcsolatban álló statisztikai adat hányadosa, ahol A: a. viszonyítadóadat

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Statisztikai alapfogalmak

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Statisztika. Dr Gősi Zsuzsanna. Egyetemi adjunktus. Sportmenedzsment Tanszék

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Statisztika I. 2. előadás: Statisztikai táblák elemzése. Kóczy Á. László. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem

Áruforgalom tervezése. 1. óra A gazdasági statisztika alapjai Alapfogalmak, viszonyszámok

1. óra: Területi statisztikai alapok viszonyszámok, középértékek

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

STATISZTIKA I. 3. rész. T.Nagy Judit

Bevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I.

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

1. Egy Kft dolgozóit a havi bruttó kereseteik alapján csoportosítottuk: Havi bruttó bér, ezer Ft/fő

Statisztika I. 1. előadás. Előadó: Dr. Ertsey Imre

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

Statisztika 1. Tantárgyi útmutató

Korrelációs kapcsolatok elemzése

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

6. A kereskedelmi készletek elszámoltatása, az értékesítés elszámoltatása 46. Összefoglaló feladatok 48.

STATISZTIKA. Gyakorló feladatok az első zh-ra


TANTÁRGYI ÚTMUTATÓ. Statisztika 1.

Statisztika I. 7. előadás. Előadó: Dr. Ertsey Imre

GAZDASÁGI STATISZTIKA

Statisztikai. Statisztika Üzleti szakügyintéző felsőfokú szakképzés I. évfolyam VS (NFG ÜS302G4) es tanév I. félév

[GVMGS11MNC] Gazdaságstatisztika

A leíró statisztikák

5. Előadás. Grafikus ábrázolás Koncentráció elemzése

Függetlenségvizsgálat, Illeszkedésvizsgálat

Biomatematika 2 Orvosi biometria

Tantárgyi útmutató. 1. A tantárgy helye a szaki hálóban. 2. A tantárgyi program általános célja. Statisztika 1.

2013 ŐSZ. 1. Ismertesse a mérési skálák tulajdonságait és a közöttük lévő összefüggéseket.

1. Előadás. Statisztikai alapfogalmak. A statisztikai munka fázisai. Statisztikai adatok csoportosításának lehetőségei. Statisztikai sorok, táblák.

Módszertani Intézeti Tanszéki Osztály

Mérési hibák

7, 6, 0, 4, 0, 1, 5, 2, 2, 16, 1, 0, 2, 3, 9, 2, 4, 10, 3, 1, 2, 12, 4, 1

[Biomatematika 2] Orvosi biometria

10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Kistérségi gazdasági aktivitási adatok

9.3. Külkereskedelmi statisztika Pénzügystatisztika, az államháztartás információs rendszere Agrárstatisztikai információs

Statisztika összefoglalás

A sokaság/minta eloszlásának jellemzése

Statisztika I. 2. előadás. Előadó: Dr. Ertsey Imre

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

OSAP Bér- és létszámstatisztika. Vezetõi összefoglaló

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Az egészségügyi és gazdasági indikátorok összefüggéseinek vizsgálata Magyarországon

STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

A GDP hasonlóképpen nem tükrözi a háztartások közötti munka- és termékcseréket.

Matematika feladatbank I. Statisztika. és feladatgyűjtemény középiskolásoknak

Matematikai geodéziai számítások 6.

A Debreceni Egyetem Intézményfejlesztési Terve

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Módszertani leírás a Munkaerő-felmérés II. negyedévi Megváltozott munkaképességűek a munkaerőpiacon című kiegészítő felvételhez

AZ ÖSSZEHASONLÍTÁST TORZÍTÓ TÉNYEZŐK ÉS KISZŰRÉSÜK

A gazdasági növekedés mérése

y ij = µ + α i + e ij

KUTATÁSMÓDSZERTAN 4. ELŐADÁS. A minta és mintavétel

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Módszertani leírás a Munkaerő-felmérés I. negyedévi Munkanélküli érintettség, diszkrimináció című kiegészítő felvételhez

Biomatematika 2 Orvosi biometria

Matematikai statisztika

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Az Állami Foglalkoztatási Szolgálat munkanélküli nyilvántartásának fontosabb adatai augusztus FOGLALKOZTATÁSI HIVATAL

TÁJÉKOZTATÓ BARANYA MEGYE MUNKAERŐ-PIACI HELYZETÉNEK ALAKULÁSÁRÓL ÁPRILIS

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

A Statisztika alapjai

Osztályozóvizsga követelményei

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

AZ ORSZÁGOS NYUGDÍJBIZTOSÍTÁSI FŐIGAZGATÓSÁG STATISZTIKAI ZSEBKÖNYVE

matematikai statisztika

A statisztika alapjai - Bevezetés az SPSS-be -

1. előadás Horváthné Csolák Erika

[Biomatematika 2] Orvosi biometria

TAMP ÉS CO-TAMP KÖZÖS ÉS NEMZETI VONZÓKÉPESSÉGI PLATFORM

Az Állami Foglalkoztatási Szolgálat munkanélküli nyilvántartásának fontosabb adatai szeptember FOGLALKOZTATÁSI HIVATAL

Matematikai geodéziai számítások 6.

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Matematikai statisztikai elemzések 2.

Kutatásmódszertan és prezentációkészítés

Átírás:

Általános statisztika I Havasy, György Molnár, Máténé Szunyogh, Zsuzsanna Tóth, Mártonné Korpás, Attiláné Csernyák, László

Általános statisztika I Havasy, György Molnár, Máténé Szunyogh, Zsuzsanna Tóth, Mártonné Korpás, Attiláné Csernyák, László Publication date 1996 Szerzői jog 1996 Havasy György, Korpás Attiláné, Molnár Máténé, Szunyogh Zsuzsanna, Tóth Mártonné, Nemzeti Tankönyvkiadó Rt. Szerkesztette: Dr. Korpás Attiláné- főiskolai docens Szerzők: Dr. Havasy György - főiskolai docens (4. fejezet) Dr. Molnár Máténé - főiskolai docens (3. fejezet) Dr. Szunyogh Zsuzsanna - főiskolai docens (5. fejezet) Dr. Tóth Mártonné - főiskolai adjunktus (1. és 2. fejezet) A gyakorlófeladatokat: Dr. Korpás Attiláné állította össze. Szakmai lektor: Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása, illetve utánközlése a kiadó engedélye nélkül tilos!

Tartalom 1. A statisztika alapfogalmai... 1 1. 1.1. A statisztika tárgya és szerepe... 1 2. 1.2. A statisztikai sokaság és ismérv... 2 3. 1.3. Statisztikai adat... 4 4. 1.4. Statisztikai csoportosítás és összehasonlítás... 7 5. 1.5. Viszonyszámok... 11 6. 1.6. Átlagok... 13 7. 1.7. Gyakorlófeladatok... 18 2. Egy ismérv szerinti elemzés... 22 1. 2.1. A mennyiségi ismérv szerinti elemzés... 22 1.1. 2.1.1. A mennyiségi ismérv... 22 1.2. 2.1.2. Gyakorisági sorok... 23 1.3. 2.1.3. Értékösszegsor... 30 1.4. 2.1.4. A gyakorisági sorok grafikus ábrázolása... 34 1.5. 2.1.5. Helyzetmutatók... 39 1.6. 2.1.6. Szóródási mutatók... 51 1.7. 2.1.7. Az aszimmetria mérőszámai... 57 1.8. 2.1.8. A koncentráció elemzése... 59 2. 2.2. Az időbeli ismérv szerinti elemzés... 62 2.1. 2.2.1. Idősorok... 62 2.2. 2.2.2. Dinamikus viszonyszámok... 63 2.3. 2.2.3. Az idősorok grafikus ábrázolása... 66 2.4. 2.2.4. Az idősorok elemzése átlagokkal... 68 3. 2.3. Gyakorlófeladatok... 72 3. A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése... 78 1. 3.1. A statisztikai táblákról általában... 78 2. 3.2. Az egyszerű táblák elemzése... 80 2.1. 3.2.1. Intenzitási viszonyszámok és dinamikus viszonyszámok együttes alkalmazása 81 2.2. 3.2.2. A fejlődési tendenciák kimutatása, összehasonlítása... 85 3. 3.3. A csoportosító táblák elemzése... 90 3.1. 3.3.1. Rész- és összetett viszonyszámok... 90 3.2. 3.3.2. Szerkezet- és dinamikai változás vizsgálata... 93 4. 3.4. A kombinációs táblák (a sztochasztikus kapcsolatok) elemzése... 98 4.1. 3.4.1. Függvényszerű kapcsolat. Függetlenség... 102 4.2. 3.4.2. Az asszociáció szorosságának mérése... 104 4.3. 3.4.3. A vegyes kapcsolat elemzése... 110 4.4. 3.4.4. A korreláció elemzése csoportosított adatokból kiindulva... 121 5. 3.5. Gyakorlófeladatok... 126 4. Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása... 132 1. 4.1. A standardizálás módszere... 132 2. 4.2. Az összetett intenzitási viszonyszámok (főátlagok) különbségének felbontása összetevőire 135 2.1. 4.2.1. A részviszonyszámok (részátlagok) különbözőségének hatása... 136 2.2. 4.2.2. Az összetétel különbözőségének hatása... 137 3. 4.3. Indexszámítás standardizálás alapján (hányadosfelbontás)... 138 3.1. 4.3.1. A főátlagindex... 139 3.2. 4.3.2. A részátlagindex... 140 3.3. 4.3.3. Az összetételhatás indexe... 141 4. 4.4. Alkalmazási területek... 142 4.1. 4.4.1. Az átlagbérek időbeli változásának vizsgálata... 143 4.2. 4.4.2. Az átlagárak időbeli változásának vizsgálata... 144 5. 4.5. Gyakorlófeladatok... 147 5. Érték-, ár- és volumenindexek... 153 1. 5.1. Az indexszám fogalma... 153 2. 5.2. Érték-, ár- és volumenindex-számítás... 153 2.1. 5.2.1. Indexszám számítása aggregát formában... 155 iii

Általános statisztika I 2.2. 5.2.2. Az indexek átlagformái... 156 3. 5.3. Az indexek súlyozása... 159 4. 5.4. Összefüggések az indexszámításban... 161 4.1. 5.4.1. Az indexszámok közötti összefüggések... 161 4.2. 5.4.2. Az aggregátumok közötti összefüggések... 162 4.3. 5.4.3. Csoportosított sokaságra számított indexek... 164 5. 5.5. Az indexszámok gyakorlati alkalmazása... 166 6. 5.6. Indexsorok... 167 6.1. 5.6.1. Az indexsorok közötti összefüggések... 171 7. 5.7. Területi indexek... 172 8. 5.8. Gyakorlófeladatok... 174 A. Irodalom... 181 6. Tárgymutató... 182 iv

Az ábrák listája 2.1. A háztartások taglétszám szerinti eloszlásának bot-ábrája... 35 2.2. A lakások vízfogyasztás szerinti megoszlásának hisztogramja... 35 2.3. A lakások vízfogyasztás szerinti megoszlásához tartozó kumulált relatív gyakoriságok... 36 2.4. A biztosítások biztosítási díj szerinti megoszlásának hisztogramja... 37 2.5. A lakások vízfogyasztás szerinti megoszlásának gyakorisági poligonja... 38 2.6. A biztosítások biztosítási díj szerinti megoszlásának gyakorisági poligonja... 38 2.7.... 39 2.8.... 40 2.9. A lakások vízfogyasztás szerinti megoszlása... 41 2.10. A vízfogyasztás alsó és felső kvartilisének, mediánjának, kilencedik decilisének becslése... 49 2.11.... 51 2.12. A népesség koncentrációja Nógrád és Zala megyében (Lorenz-görbe)... 61 2.13. A takarékbetét-állomány alakulása... 66 2.14. A Magyarországra érkező turisták számának alakulása... 67 2.15. Az épített lakások számának alakulása... 70 3.1. A statisztikai táblák típusai... 80 3.2. Az egészségügyi ellátás alakulása az 1985-ös bázisévhez viszonyítva... 88 3.3. Az egészségügyi ellátottság intenzitási viszonyszámainak alakulása az 1985-ös bázisévhez viszonyítva... 88 3.4. A lakásállomány szobaszám szerinti összetételének alakulása... 96 3.5. A lakásállomány szobaszám szerinti összetételének alakulása... 97 3.6. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat... 123 5.1.... 163 v

A táblázatok listája 1.1. Példák a sokaságokra... 2 1.2. Csoportosító sor általános sémája... 8 1.3. A Magyarországra érkező külföldiek megoszlása az utazás jellege szerint 1993-ban... 8 1.4. A népesség megyék szerinti megoszlása 1994. január 1-jén... 9 1.5. Az ATS devizaszámla kamatának alakulása az IBUSZ Banknál... 11 1.6. Az 1 főre jutó GDP néhány európai országban 1993-ban... 11 1.7. A 2024 év közötti népesség nemek szerinti megoszlása 1994. január 1-jén... 12 1.8. A német márka (DEM) eladási árfolyamának alakulása az OTP Banknál... 12 1.9. Magyarország 1993. évi idegenforgalmát jellemző adatok... 13 2.1. Egy társasház 50 lakásának az elmúlt kéthavi vízfogyasztása a leolvasás sorrendjében (adatok m 3 -ben)... 22 2.2. A lakásonkénti vízfogyasztás növekvő sorrendben (adatok m 3 -ben)... 23 2.3. A gyakorisági sorok általános sémája... 24 2.4. A lakások szobaszám szerinti eloszlása... 25 2.5. A társasház lakásainak megoszlása a vízfogyasztás szerint... 26 2.6. A lakások vízfogyasztás szerinti megoszlása... 27 2.7. A nyugdíjas nők megoszlása a nyugdíj nagysága szerint 1994 áprilisában... 28 2.8. A társasház vízfogyasztására vonatkozó adatok... 28 2.9. A társasház vízfogyasztására vonatkozó adatok... 29 2.10. Az értékösszegsor általános sémája... 30 2.11. A település háztartásainak taglétszám szerinti eloszlása... 30 2.12. A település lakosainak eloszlása az egyes háztartások taglétszáma szerint... 31 2.13. Az összes vízfogyasztás megoszlása... 31 2.14. Munkatábla az osztályközép meghatározásához... 32 2.15. Az összes vízfogyasztás megoszlása... 33 2.16. Az összes vízfogyasztás megoszlása... 33 2.17. A társasház vízfogyasztására vonatkozó adatok... 34 2.18. Lakásbiztosítások megoszlása valamely biztosító egyik fiókjánál a biztosítási díj nagysága szerint 37 2.19. Munkatábla a medián becsléséhez... 44 2.20. Valamely biztosító egyik fiókjánál kötött lakásbiztosításokra vonatkozó adatok... 45 2.21. Egy biztosító valamely fiókjánál kötött lakásbiztosításokra vonatkozó adatok... 46 2.22. A nyugdíjas nők nyugdíj szerinti megoszlása 1994 áprilisában (decilis eloszlás)... 50 2.23. Munkatábla az átlagos eltérés és a szórás számításához... 53 2.25. A szimmetrikus és aszimmetrikus eloszlások jellemzői... 58 2.26. Zala megye településeinek és össznépességének megoszlása népességnagyság szerint 1994. január 1- jén... 59 2.27. Munkatábla a koncentráció vizsgálatához (a fejrovatba csak a jelöléseket írva)... 60 2.28. Magyarország személygépkocsi-állományának alakulása (az évek december 31-én)... 62 2.29. Magyarországra érkező külföldi turisták számának alakulása... 63 2.30. A bázis- és láncviszonyszámok számítása... 64 2.31. A lakosság takarékbetét-állományának alakulása (az évek december 31-én)... 64 2.32. Valamely utazási iroda valutakészletének és valutaértékesítésének adatai... 69 2.33. Az épített lakások számának alakulása Magyarországon... 70 3.1. A budapesti székhelyű külföldi érdekeltségű vállalkozások számának alakulása (december 31-i adatok)... 78 3.2. A magyarországi népesség életkor szerinti megoszlásának alakulása... 79 3.3. A magyarországi lakott lakások számának megoszlása komfortosság és településtípusok szerint (1990. január 1.)... 79 3.4. Az orvosi ellátás néhány adata (december 31-i adatok)... 81 3.5. Orvosi ellátásra vonatkozó adatok... 83 3.6. Az egészségügyi ellátásra vonatkozó adatok (december 31-i adatok)... 86 3.7. Az egészségügyi ellátásra vonatkozó adatok... 86 3.8. A csoportosító tábla általános sémája... 90 3.9. Magyarország népességére és a magyarországi lakásokra vonatkozó adatok (1994. január 1.) 91 3.10. A magyarországi népességszám és lakásellátottság településtípusonként (1994. január 1.)... 92 vi

Általános statisztika I 3.11. A magyarországi lakások számának megoszlása szobaszám szerint (január 1-jei adatok)... 93 3.12. A magyarországi lakásállomány nagyságának és szobaszám szerinti összetételének alakulása 93 3.13. Magyarország népességszámának és megoszlásának alakulása településtípusonként (január 1-jei adatok)... 94 3.14. A magyarországi lakásállományra vonatkozó adatok... 95 3.15. A kontingenciatábla sémája... 99 3.16. A közép- és felsőfokú tanintézetekben nappali tagozaton tanulók számának megoszlása lakóhelyük és a tanintézet típusa szerint (1990. január 1.)... 100 3.17. A kontingenciatábla sémája relatív gyakoriságokkal (megoszlási viszonyszámokkal)... 101 3.18. A tanulók relatív gyakoriságai lakóhelyük és a tanintézet típusa szerint... 101 3.19. A tanulók %-os megoszlása lakóhelyük és a tanintézet típusa szerint... 102 3.20. Az E ismérv szerinti rész- és összetett megoszlási viszonyszámok... 103 3.21. Kontingenciatáblázat alternatív ismérvek esetén... 104 3.22. Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.) 105 3.23. Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.) 106 3.24. A függetlenség feltételezésével számított gyakoriságok ( )... 107 3.25. A számítása... 108 3.26. A vegyes kapcsolat adatbázisa... 110 3.27. Egy bizonyos települési székhellyel működő jogi személyiségű ipari szervezetek létszámadatai (főben)... 110 3.28. A kontingenciatábla sémája vegyes kapcsolat esetén... 112 3.29. Egy bizonyos települési székhellyel működő ipari szervezetek megoszlása gazdálkodási forma és létszám szerint... 113 3.30. A vizsgált ipari szervezetekre vonatkozó rész- és főátlagok... 114 3.31. A vizsgált ipari szervezetekre vonatkozó adatok... 117 3.32. A korrelációs tábla sémája... 121 3.33. Egy társasházban lévő lakások megoszlása a szobák száma és a lakásban lakó személyek száma szerint... 121 3.34. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati regressziófüggvénye... 122 3.35. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati regressziófüggvénye... 125 4.1. Jövedelem- és létszámadatok két vállalkozásnál... 132 4.2. Két összetett intenzitási viszonyszám meghatározása és összehasonlítása... 134 4.3. Két ország halandósági viszonyainak alakulása (fiktív adatok)... 135 4.4. Egy megye forgalmi és népességadatai az 1994. és 1995. évben... 139 4.5. A lakosság összetételének változása... 142 4.6. Egy vállalkozás munkaügyi adatai... 143 4.7. 4.7. táblázat... 143 4.8. Egy homogén árucsoportba tartozó három cikk értékesítési adatai... 146 5.1. Jövedelem Egy iparcikkeket forgalmazó fővárosi áruház Videoton teletextes televízióforgalma az 19931994-es években... 154 5.2. Az egyes televíziótípusok érték-, ár- és mennyiségváltozását jelző egyedi indexek... 154 5.3. Az indexek kiszámítási képleteinek áttekintő táblázata... 159 5.4. A Videoton televíziók forgalmának alakulása az 19931994. években egy fővárosi, iparcikkeket forgalmazó üzletben... 165 5.5. Néhány gyümölcs felvásárlására vonatkozó adatok az 19901993. években... 168 5.6. Az 19901993. évi felvásárlás összértéke különböző évi árakon számítva... 168 5.7. Néhány cikk felhozatalára vonatkozó adatok két alföldi város piacán 1995 júniusában... 172 vii

1. fejezet - A statisztika alapfogalmai 1. 1.1. A statisztika tárgya és szerepe A bennünket körülvevő világ megismeréséhez, a társadalom és a gazdaság működéséhez, bármilyen szintű döntéshez sokféle információra van szükség. Az információk között kitüntetett szerepe van a számszerű információknak, mert ezek a másféle információknál tömörebbek és egyértelműbbek. A számszerű információk gyűjtésében, feldolgozásában, elemzésében és publikálásában fontos szerepe van a statisztikának. A statisztika a valóság tömör, számszerű jellemzésére szolgáló tudományos módszertan, illetve gyakorlati tevékenység. A statisztikai tevékenység az emberiség fejlődése folyamán jóval korábban kialakult, mint a statisztika tudománya. A statisztikai tevékenység úgyszólván egyidős az állammal, kezdetben az állam fenntartásához szükséges információk (pl. a fegyverforgatásra alkalmas férfiak száma, a termények mennyisége stb.) gyűjtése és közlése volt a feladata. A statisztikatudomány kialakulása azonban csupán a kapitalizmus kifejlődésével vette kezdetét. Ekkor a népesség és a termelés koncentrálódása következtében a korábbi egyszerű nyilvántartási formák már nem voltak alkalmasak az egyre sokoldalúbb statisztikai jellegű állami és társadalmi igények kielégítésére. A statisztikatudomány fokozatosan fejlődve amihez nagy lendületet adott a valószínűségszámítás kialakulása és tételeinek elterjedése önálló módszertudománnyá vált. Eredményeit a társadalomtudományok mellett széles körben alkalmazzák a természettudomány különböző területein is. A statisztikának egyre nagyobb szerepe van a gazdasági döntések előkészítése, az üzleti problémák elemzése mellett pl. az orvosi és biológiai kérdések megválaszolásában is. A statisztika mint gyakorlati tevékenység a tömegesen előforduló jelenségek egyedeire vonatkozó információk gyűjtése, feldolgozása, elemzése, ennek alapján a vizsgált jelenség egészének tömör, számszerű jellemzése. A statisztika másrészt az információk összegyűjtésének, leírásának, elemzésének, értékelésének és közlésének tudományos módszertana. A fenti megfogalmazásban igen fontos a tömeges jelző. A statisztika mindig tömegesen (nagy számban) előforduló jelenségek vizsgálatával foglalkozik. E tömegjelenségek igen sokfélék lehetnek, pl. egy ország népessége, egy áruház forgalma, egy ország gépkocsiállománya, az energiatermelés, a lakosság fogyasztása stb. A statisztikai módszerek között vannak egészen egyszerű eljárások és vannak bonyolultabb, matematikaistatisztikai módszerek. A statisztikai módszertanon belül megkülönböztetünk leíróstatisztikát és statisztikai következtetést. A leíró statisztika az információk összegyűjtését, összegzését, tömör, számszerű jellemzését szolgáló módszereket foglalja magában. Ide sorolhatjuk az adatgyűjtést, az adatok ábrázolását, csoportosítását, az adatokkal végzett egyszerűbb aritmetikai műveleteket, az eredmények áttekinthető formában való megjelenítését. Leíró statisztikai módszereket alkalmazunk például akkor, ha valamely település háztartásait (tömegjelenség) megfigyeljük taglétszámuk, jövedelmük, kiadásaik, fogyasztási szokásaik stb. szerint. A begyűjtött információkat rögzítjük, majd csoportosítjuk a háztartásokat jövedelem, taglétszám stb. szerint, kiszámíthatjuk a háztartások átlagos jövedelmét, átlagos rezsiköltségét stb. A csoportosított adatokat, eredményeket szemléletes módon (ábrákkal, táblázatos formában) megjelenítjük, közzétesszük. A statisztikai következtetést akkor alkalmazzuk, ha a tömegjelenségek egyedeinek teljes körű megfigyelésére nincs lehetőség, vagy a teljes körű megfigyelés túl költséges így gazdaságtalan és időigényes. Ilyen esetben az egyedek egy szűkebb csoportját figyeljük meg. A viszonylag kis számú egyedre vonatkozó információk és az azokból számított eredmények alapján következtetünk a tömegjelenség egészére, jellemzőire, tulajdonságaira. Következtetéses statisztikai módszereket alkalmazunk például a közvélemény-kutatásoknál, a forgalomba kerülő termékek minőségének ellenőrzésekor, a lakosok életkörülményeinek vizsgálatánál. További alkalmazással találkozhatunk különböző tényezők közötti összefüggések vizsgálatánál. A lakosság jövedelme (vagy annak változása) pl. miként befolyásolja a tartós fogyasztási cikkekre fordított kiadási összegeket (vagy azok változását), vagy különböző ráfordítások hogyan befolyásolják a termelés eredményességét. 1

A statisztika alapfogalmai Könyvünk mind a leíró statisztikai, mind a következtetéses statisztikai módszerek közül a komoly matematikai apparátust nem igénylő, leggyakrabban használt elemzési eszközöket tárgyalja. A statisztikai módszertant más szempont szerint is csoportosíthatjuk. Megkülönböztetünk általános statisztikát és szakstatisztikát. Az általános statisztika a statisztika általános elméleti kérdéseivel, a statisztikai vizsgálatok során alkalmazásra kerülő módszerekkel általánosságban foglalkozik, a szakstatisztika a társadalmi-gazdasági élet egy-egy területének statisztikai módszerekkel való vizsgálatát tárgyalja. Ilyen például a népességstatisztika, az idegenforgalmi statisztika stb. 2. 1.2. A statisztikai sokaság és ismérv A statisztika mint már említettük mindig tömegesen előforduló jelenségek és az azokat alkotó egységek vizsgálatával foglalkozik. A statisztikai sokaság a megfigyelés tárgyát képező egyedek összessége, halmaza. A sokaságot alkotó egyedeket a halmaz elemeit a sokaság egységeinek nevezzük. Statisztikai sokaságot alkothatnak élőlények, pl. a magyar felsőoktatás hallgatói, a Magyarországra érkező külföldi turisták, az ország lóállománya; tárgyak, pl. az ország lakásállománya, a kórházakban használt röntgenkészülékek; szervezetek, pl. a magyar főiskolák, ipari vállalkozások; képzett egységek, pl. bruttó hazai termék, gyümölcsfogyasztás stb. Az élőlényekből, tárgyakból, szervezetekből álló sokaságok egyértelműen elkülönülő egységekből állnak. Az ilyen sokaságokat diszkrét sokaságoknak nevezzük. A képzett egységekből álló, ún. folytonos sokaságoknál az egységeket önkényesen határozhatjuk meg. Pl. a sokaság egy egysége: 1 Mrd Ft GDP, 1 kg gyümölcsfogyasztás stb. A statisztikai sokaságok abból a szempontból is különböznek egymástól, hogy csak egy időpontra vonatkozóan vagy csak időtartamra vonatkoztatva értelmezhetők. Pl. egy megye népessége a természetes szaporodás (fogyás) 1 és a vándorlási különbözet 2 miatt állandóan változhat. Ezért e sokaság csak időpontban (pl. 1995. december 31. 0 óra, 00 perckor) 3 értelmezhető, ragadható meg. Ugyanakkor a Videoton-gyár termelése mivel a termelés egy folyamat időpontban nem, csak egy időtartamban (a termelés egy napon, egy hónapban, egy évben stb.) értelmezhető. Az időpontra vonatkoztatva értelmezhető sokaságokat álló sokaságoknak, az időtartamra vonatkoztatva értelmezhetőket pedig mozgó sokaságoknak nevezzük. A sokaság tartalmazhat véges (a gépkocsiállomány egy adott időpontban és területen) és végtelen (azonos körülmények között tetszőlegesen sokszor megismételhető kísérletek eredményeinek halmaza) elemszámú egyedet. A társadalmi-gazdasági vizsgálatokat általában véges számú egyed megfigyelésével végezzük. A sokaságok fajtáit szemlélteti az 1.1. táblázat: 1.1. táblázat - Példák a sokaságokra A sokaság megnevezése egysége fajtája Zala megye személygépkocsiállománya 1995. december 31-én egy személygépkocsi diszkrét, álló, véges A lakosság takarékbetét- egymilliárd (millió folytonos, álló, 1Az élveszületések és halálozások különbsége. 2A megyébe letelepülő és elköltöző népesség különbsége. 3Ezt az időpontot a megfigyelés eszmei időpontjának szokás nevezni. 2

A statisztika alapfogalmai állománya 1995. július 31-én 1995-ben Nógrád megyében született gyermekek stb.) Ft betétállomány egy gyermek véges diszkrét, mozgó, véges Magyarország 1995. évi sörfogyasztása egy liter (hektoliter, üveg stb.) sörfogyasztás folytonos, mozgó, véges A statisztika a sokaságot az egyedeken keresztül vizsgálja, ugyanis bármely sokaság az egységei tulajdonságainak felsorolásával jellemezhető. Statisztikai ismérv a statisztikai sokaság egyedeit jellemző tula jdonság. Az ismérv lehetséges kimenetelei az ismérvváltozatok. Ismérv pl. a gépkocsik típusa, fogyasztása, gyártási helye, ipari vállalkozásoknál a foglalkoztatottak száma, a bruttó kibocsátás, a területi elhelyezkedés, a vállalkozás profilja. Ismérvváltozatok pl. a gépkocsik típusánál a Lada, Opel stb., az ipari vállalkozások területi elhelyezkedésénél Baranya megye, Békés megye stb., a gépkocsi fogyasztása esetén pedig számadatok. Ha az ismérv csak két változattal rendelkezik, alternatív ismérvnek nevezzük. Ilyen pl. a nem (változatai: férfi, nő). A kettőnél több változattal rendelkező ismérvek is átalakíthatók alternatív ismérvvé. Pl. az aktív keresők évi jövedelme kettőnél több változattal rendelkező ismérv (elvileg annyi változata lehetséges, ahány aktív kereső van), alternatívvá alakítva: legfeljebb 500 000 Ft, ill. 500 000 Ft-nál nagyobb évi jövedelemmel rendelkezők. Egy adott sokaságra vonatkozóan beszélhetünk közös és megkülönböztető ismérvekről. Azokat az ismérveket, amelyek szerint a sokaság egységei egyformák (pl. amelyek a sokaságot definiálják), közös ismérveknek nevezzük. Azokat az ismérveket, amelyek szerint az egyedek különböznek egymástól (ezek alapján a sokaság részsokaságokra bontható), megkülönböztető ismérveknek nevezzük. Ha a megfigyelt sokaságot a Pénzügyi és Számviteli Főiskola Zalaegerszegi Intézete nappali tagozatára 1995. szeptember 11-én beiratkozott I. évfolyamos hallgatók képezik, akkor a definiáló közös ismérvek: a beiratkozás helye (PSZF Zalaegerszegi Intézete), az évfolyam (I.), a beiratkozás időpontja (1995. szept. 11.), megkülönböztető ismérvek pl. a hallgatók neme, iskolai végzettsége, lakcíme, életkora, a felvételi vizsgán elért pontszáma stb. Attól függően, hogy az ismérvváltozatok milyen jellegű információt adnak a sokaság egyedeiről, különböző fajta ismérveket különböztetünk meg. Az ismérvek fajtái: időbeli ismérvek: az egységek időbeli elhelyezésére szolgáló rendező elvek. Ismérvváltozatai: időpontok, időszakok. (Pl. a főiskolai hallgatók születési ideje, a gépkocsik gyártási ideje.) területi ismérvek: az egységek térbeli elhelyezésére szolgáló rendező elvek. Ismérvváltozatai: földrajzi egységek. (Pl. a főiskolai hallgatók lakhelye, a gépkocsik gyártási helye.) minőségi ismérvek: az egyedek számszerűen nem mérhető tulajdonságai. (Pl. a főiskolai hallgatók neme, a gépkocsik típusa.) mennyiségi ismérvek: az egyedek számszerűen mérhető (megszámlálható) tulajdonságai. Ismérvváltozatait ismérvértékeknek nevezzük. 3

A statisztika alapfogalmai (Pl. a főiskolai hallgatók felvételi pontszáma, a gépkocsik fogyasztása.) Mérési szintek A felsorolt ismérvek közül csak a mennyiségi ismérv változatai számadatok. Bizonyos szabályok betartása mellett azonban minden ismérv lehetséges változatai számértékekké alakíthatók. Például a nem ismérvének két változata van: férfi és nő. E változatokhoz számértékeket rendelhetünk: férfi:1; nő:2. Ilyen alapon a sokasági egységek bármilyen tulajdonságának megfigyelése és rögzítése az egységek számokkal való jellemzésének, azaz mérésének tekinthető. A mérés számok meghatározott szabályok szerinti hozzárendelése jelenségekhez (dolgokhoz, tárgyakhoz, eseményekhez), illetve ezek bizonyos tulajdonságaihoz. A hozzárendelési szabályok alapján négy mérési skálát (szintet) különböztetünk meg: névleges skála, sorrendi skála, intervallumskála, arányskála. A névleges (nominális)mérési skála (mérési szint) a számok kötetlen hozzárendelését jelenti. Nominális skálát alkalmazunk a területi és minőségi ismérvek szerinti megfigyeléseknél. E skálán való méréskor a számok (kódszámok) csak a sokaság egyedeinek azonosítására szolgálnak. Ilyen nominális skála pl. a rendszám, irányítószám, biztosítási szám stb. Mivel a számok csak az egyedek azonosítását (megkülönböztetését) szolgálják, közöttük az egyéb relációk (pl. nagyobb, kisebb) nem értelmezhetők, ezért e számokkal végzett különböző számtani műveleteknek semmi értelme nincs. A sorrendi (ordinális) mérési skála a sokaság egyedeinek egy közös tulajdonság alapján való sorba rendezése. Ilyen sorrendi skála pl. a hallgatók osztályzata, a tornászok helyezési sorrendje, az országok hitelképességi sorrendje, a termékek minőségi osztályai stb. A skálán bár a sorszámok közötti különbség azonos (egy-egy) az egyes egyedek nem feltétlenül egyenlő távolságra helyezkednek el egymástól. Az első és második helyre sorolt tornász teljesítménye között pl. nem biztos, hogy ugyanakkora a különbség, mint a negyedik és ötödik helyre sorolté között. A mérésből származó adatokkal (sorszámokkal) ezért csak azok a műveletek végezhetők, amelyek során kizárólag a skálát képező számértékek sorrendisége kerül kihasználásra. Az intervallumskála (különbségi skála) már a szó hagyományos értelmében is mérést jelent, ugyanis a skálaértékek különbségei is valós információt adnak a sokaság egységeiről. Az intervallumskálának egy jellegzetes tulajdonsága, hogy a mértékegység és a nullapont meghatározása önkényes, és e nulla érték nem tükrözi a tulajdonság hiányát. Ilyen skálán mérik például a hőmérsékletet. Ha a skála mértékegysége a Celsiusfok (pl. a Fahrenheit-fok is használatos mértékegység), a skála nullpontja a víz fagyáspontja, és ez nyilvánvalóan nem tekinthető abszolút nullpontnak. A skálán két érték összege vagy aránya nem értelmezhető. Pl. nem mondhatjuk, hogy a + 20 C-os és a + 5 C-os hőmérséklet összege + 25 C, vagy hogy a 20 C-os hőmérséklet kétszerese a 10 C-osnak. Ugyanakkor két-két adat különbsége, a két különbség összege és aránya már értelmezhető. Pl. az 5 C és a 10 C közötti különbség azonos a 15 C és 20 C közötti különbséggel. A 20 C és 30 C közötti különbség kétszerese az előbbi bármelyik különbségnek. Az arányskálán történő mérés a legmagasabb mérési szint nyújtja a legtöbb információt. A skálának valódi nullpontja van, mely nullpont a tulajdonság hiányát jelzi. A skála bármely két értékének aránya független a mértékegységtől. E skálán nyert számokkal a statisztikai elemzésekhez szükséges összes művelet elvégezhető. Arányskálán mért értékek pl. a hosszúság, a jövedelem, a költség, a termelés mennyisége stb. 3. 1.3. Statisztikai adat A statisztikatudomány fontos alapfogalmai közé tartozik a statisztikai adat fogalma. A statisztikai adat valamely statisztikai sokaság elemeinek száma vagy a sokaság valamilyen másféle számszerű jellemzője, mérési eredmény. 4

A statisztika alapfogalmai A statisztikai adat mindig tartalmaz fogalmi jegyeket, időbeli, térbeli vagy másféle azonosítókat és ezek mellett egy számértéket. A statisztikai adat tehát nem pusztán a számérték maga. Statisztikai adat pl.: 1994-ben hazánkban 657 ezer tonna volt az almatermés; Magyarország népessége 1994. január 1-jén 10 277 ezer fő volt; 1992-ről 1993-ra az 1 főre jutó reáljövedelem 5%-kal csökkent. Azokat a statisztikai adatokat, melyekhez mérés vagy számlálás útján jutunk, alapadatoknak nevezzük (almatermés, népesség száma). Két vagy több alapadattal végzett műveletek eredményeként leszármaztatott adatokhoz jutunk. Pl. az ország személygépkocsi-állománya 1992. december 31-én 2 058 334 db, 1993. december 31-én 2 091 623 db volt. E két alapadatból osztással képzett leszármaztatott adat: A személygépkocsi-állomány 1 év alatt 1,016-szeresére, vagyis 101,6%-ra, azaz 1,6%-kal nőtt. Statisz tikai mutatószámok: azok a statisztikai adatok (általában leszármaztatott adatok), melyekkel valamilyen rendszeresen megismétlődő (pl. társadalmi, gazdasági) jelenséget statisztikailag jellemezhetünk. Az életszínvonal egyik mutatószáma pl. az 1 főre jutó reáljövedelem, a gazdasági fejlettségé az 1 főre jutó GDP, a termelékenységé az 1 órára jutó termelés stb. A statisztikai vizsgálatok kiindulópontját az alapadatok képezik. Az alapadatokkal szemben többféle követelményt támasztunk. Az adatok legyenek a felhasználás szempontjából elfogadható pontosságúak. Minél pontosabbakaz adatok,annál megalapozottabb döntéseket hozhatunk. Az adatok kellő időben álljanak rendelkezésre. Az adatszolgáltatás gyorsasága ugyanis fontos szerepet játszik a társadalmi-gazdasági folyamatok alakításában. A szükséges adatokhoz a lehető legkisebb ráfordítással (költséggel) jussunk hozzá. E követelményeknek az elfogadható pontosság, a gyorsaság és a gazdaságosság egy időben általában tökéletesen megfelelni nem lehet (például a gyorsaság a pontosság ellen hat). Az alapadatokhoz többféle módon juthatunk. A statisztikai elemzések forrását képezhetik az eredetileg nem statisztikai célra készült kimutatások, nyilvántartások. (Pl. az önkormányzatok lakónyilvántartása, gépkocsik nyilvántartásai, a gazdasági szervezetek különféle számviteli nyilvántartásai stb.) A statisztikai adatok másik forrását az e célra szervezett adatgyűjtések (adatfelvételek) képezik. Az adatgyűjtést (adatfelvételt) minden esetben megelőzi egy olyan adatfelvételi program kidolgozása, melyben a statisztikai tevékenység egészét megtervezzük. Az adatfelvétel végrehajtása előtt a vizsgálat eredményessége szempontjából tisztázni kell a felvétel célját, az adatfeldolgozás, az elemzés és a közlés menetét. Ennek elmaradása használhatatlan alapadatokhoz, téves információhoz vezethet. Az ilyen adatok, információk pedig megalapozatlan, hibás döntéseket eredményezhetnek. Ez csak úgy kerülhető el, hogy a vizsgálat céljának alárendelten tervezzük meg a statisztikai tevékenység teljes folyamatát az adatgyűjtéstől kezdve az adatközlésig. Az adatgyűjtés megtervezésénél dönteni kell arról is, hogy az adatfelvétel a vizsgált sokaság minden egységére kiterjedjen-e, vagy csak a sokaság megfelelő módon kiválasztott részére. Az adatfelvétel, attól függően, hogy a sokaság mekkora részére terjed ki, lehet teljes körű és részleges. A teljes körű felvétel a vizsgált sokaság valamennyi egyedére kiterjed. Ilyen felvételt csak véges elemszámú sokaság esetén lehet megvalósítani. A teljes körű megfigyelések jellegzetes példái a népszámlálások. A részleges felvétel a sokaságnak csak egy kiválasztott részére terjed ki. Végtelen elemszámú sokaság megfigyelése csak részleges adatfelvétellel lehetséges. Véges és nagy számú sokaság esetén is gyakran kerül sor azonban ilyen felvételre. Ennek elsősorban az a magyarázata, hogy a sokaság teljes körű megfigyelése jelentős 5

A statisztika alapfogalmai költséggel jár és időigényes. Egy szakszerűen végzett részleges megfigyelés, amellett hogy olcsóbb és gyorsabb a teljes körű felvételnél, alkalmas a teljes sokaságra vonatkozó következtetések levonására is. A részleges adatfelvétel jellegzetes típusai: a reprezentatív adatfelvétel, a monográfia és egyéb részleges (nem reprezentatív) adatfelvételek. Reprezentatív (mintavételes) adatfelvételnek nevezzük a részleges felvételnek azt a fajtáját, amelynél a megfigyelésbe vont részsokaság kiválasztása meghatározott elvek, módszerek alapján történik, és a kiválasztott részsokaság hűen tükrözi (reprezentálja) az egész sokaságot. A megfigyelt sokaság egészét alapsokaságnak, a kiválasztott részsokaságot mintasokaságnak vagy röviden mintának nevezzük. A mintából származó minden eredményt a sokaság egészének jellemzésére használunk fel, a felvétel részlegessége ellenére a sokaság egészére általánosítjuk. E mintából való következtetés éppen a felvétel részlegessége miatt csak bizonyos hibával valósítható meg, amit mintavételi hibának nevezünk. Ilyen mintavételes adatfelvételt alkalmazunk pl. a lakosság jövedelmének, fogyasztási szokásainak vizsgálatánál, a mezőgazdaságban a várható termésmennyiség becsléséhez, a közvélemény-kutatásoknál stb. A monográfia a sokaság egy vagy néhány kiemelt egyedének részletes statisztikai vizsgálatát jelenti. Ilyen például egy nagyon jó és egy nagyon rossz eredményt elérő bank tevékenységének, gazdálkodásának sokoldalú elemzése. Egyéb, részleges adatgyűjtéssel is találkozhatunk a gyakorlatban. Például, ha egy adott termék (pl. egy mosópor) vásárlói kérdőívet kapnak, és az önként kitöltött és beküldött kérdőíveket feldolgozzák. Az ilyen adatgyűjtések, bár hasznos információkat szolgáltatnak, nem általánosíthatók az alapsokaságra. A részleges felvétel megismert típusai közül a társadalmi-gazdasági statisztika legfontosabb és leggyakrabban használt módszere a reprezentatív megfigyelés. Az adatgyűjtések során általában kérdőíveket használunk, melyek a kérdések mellett a válaszok rögzítésére szolgáló üres rovatokat is tartalmaznak. A kérdőív lehet egyéni kérdőív és lajstrom. Az egyéni kérdőívre egy, a lajstromra több megfigyelési egység adatai kerülnek. A felvétel tárgyát képező sokaság egyedeit megfigyelési egységeknek nevezzük (azon egyedeket tehát, akikre (amikre) vonatkozóan adatokat (információkat) gyűjtünk). Ezek az egyedek nem feltétlenül azonosak az adatszolgáltató, az ún. számbavételi egységekkel. Például állatszámlálás esetén a megfigyelési egységek az egyes állatok, a számbavételi egységek pedig az egyes gazdálkodók, vállalkozók. A kérdőíveket önszámlálás esetén maga az adatszolgáltató tölti ki, kikérdezéses eljárásnál a számlálóbiztosok jegyzik fel a válaszokat. A statisztikai adatfelvételek egyik kulcskérdése a kérdőívek helyes megszerkesztése, ami a módszertani ismeretek mellett az adott terület alapos szakmai ismeretét is igényli. A feltett kérdéseknek egyértelműeknek, közérthetőeknek kell lenniük, és igazodniuk kell a vizsgálat céljaihoz. A nem eléggé körültekintően megfogalmazott kérdések ugyanis a valóságtól eltérő irányba terelhetik a válaszadást. Az előzőekből következik, hogy minden adatfelvétel bizonyos hibalehetőséget rejt magában. Hibát eredményezhet a pontatlan kérdéseket, fogalmakat tartalmazó kérdőív, az adatszolgáltató valóságostól eltérő válaszai, szervezési-végrehajtási hibák. Az eddig leírtakból látható, hogy a statisztikai adatok általában csak korlátozottan pontosak lehetnek. Egyrészt a már említett adatfelvételi hibák szinte elkerülhetetlen fellépése miatt, másrészt az adatfeldolgozás és adatközlés során előforduló hibák miatt. Ezért a valóságos (pontos) adat és a hibákkal torzított mért adat egymástól eltér. A valóságos adat (A) és a mért adat jelöljük: különbségét a statisztikai adat abszolút hibájának nevezzük és a-val A gyakorlatban az abszolút hibát nem tudjuk meghatározni, mivel a valóságos adat (A) nem ismert. Ezért becslést adunk arra a számértékre, amelynél az abszolút hiba biztosan nem nagyobb. 6

A statisztika alapfogalmai Az adott becslést a közelítő érték (mért adat) abszolút hibakorlátjának nevezzük. Így minden statisztikai adat megadható az módon. Ez a megadási mód arra utal, hogy a valóságos adat (A) valahol az és határok között helyezkedik el. A statisztikai adatok módon történő megadása helyett a gyakorlatban igen elterjedt megoldás az is, hogy a statisztikai adatokat bizonyos nagyságrendre kerekítve adjuk meg, azaz a statisztikai adatban számszerűen csak az ún. szignifikáns számjegyek jelennek meg. Szignifikáns számjegyeknek nevezzük azokat a számjegyeket, melyekben még feltétlenül megbízunk, amelyeket még pontosnak fogadunk el. Ha a legutolsó kiírt számjegy helyi értéke akkor az abszolút hibakorlát: Magyarország népességének száma 1994. január 1-jén a Magyar Statisztikai Évkönyv szerint 10 277 ezer fő. A közölt statisztikai adatban a legutolsónak (számszerűen) kiírt szignifikáns számjegy helyi értéke. (Ez a közlési mód azt sugallja, hogy az utolsó három százas, tízes, egyes helyi értékű számjegy nem megbízható (nem szignifikáns), ezért számszerűen nem írjuk ki.) A statisztikai adat (népességszám) abszolút hibakorlátja: Gyakran célszerűbb, kifejezőbb az elkövetett hibát (vagy hibakorlátot) a valóságos (vagy mért) adathoz viszonyítani. Az abszolút hiba (a) és a valóságos adat (A) hányadosát relatív hibának, az abszolút hibakorlát és a mért adat hányadosát a statisztikai adat relatív hibakorlátjának nevezzük. A relatív hibát és a relatív hibakorlátot általában százalékos formában szokták megadni. A népességszám relatív hibakorlátja: Megállapíthatjuk, hogy a fenti példában a statisztikai adat hibája rendkívül kicsi. A korlátozott pontosságú (pontatlan) statisztikai adatokkal végzett minden számítási művelet eredménye ugyancsak korlátozottan pontos (pontatlan) lesz. Ezért mind az adatok kezelésénél, mind a belőlük levont következtetéseknél figyelembe kell vennünk az adatok korlátozott pontosságát. Így elkerülhető például, hogy nem szignifikáns eltérések alapján rangsorolást végezzünk vagy nem valós különbségeket magyarázzunk. 4. 1.4. Statisztikai csoportosítás és összehasonlítás Csoportosítás A statisztikai megfigyelés eredményeként nagy tömegű adathoz jutunk, amely a vizsgált sokaságról különböző ismérvek alapján nyújt széles körű információt, számszerű ismereteket. Ahhoz, hogy a sokaságot, annak összetételét megismerhessük, a sokaságot a különböző ismérvek szerint osztályoznunk, csoportosítanunk kell. 7

A statisztika alapfogalmai A csoportosítás a sokaság felosztása a sokaság egységeit jellemző megkülönböztető ismérv szerint. A csoportosításnál ügyelni kell arra, hogy olyan sokaságrészeket, ún. osztályokat alakítsunk ki, hogy azok átfedésmentesek és teljesek legyenek. E két követelmény együtt azt jelenti, hogy a sokaság minden egysége egyértelműen besorolható legyen valamelyik de csak egy kialakított osztályba. Ha a csoportképző ismérv változatainak száma kevés (pl. ha az aktív keresőket nemek vagy megyék szerint csoportosítjuk), az osztályok képzése nem okoz gondot. Ilyen esetben általában egy ismérvváltozat képez egy osztályt. Ha az ismérvváltozatok száma nagy, az osztályok képzése már nem egyértelmű, és a módszertani ismereteken túl szakmai ismereteket is igényel. (Pl. az aktív keresők foglalkozás, kereset szerinti, vagy a vállalkozások tevékenységtípus szerinti csoportosításánál.) Ha a vállalkozások esetén minden tevékenységtípust felsorolnánk, egy hosszú listát kapnánk, ami nehezen áttekinthető. Ilyen esetben szükség lehet arra, hogy az adott ismérv egynél több változata képezzen egy osztályt. A gyakorlatban ilyen csoportosításoknál általában az ún. nómenklatúrákat szabványnak tekinthető, rendszeres felhasználásra kerülő osztályozási rendszereket alkalmazzák. Az egy ismérv szerinti osztályozás eredménye egy csoportosító sor, melynek általános sémája (1.2. táblázat): 1.2. táblázat - Csoportosító sor általános sémája Osztály Egységek száma Összesen N ahol a csoportképző ismérv alapján képzett i-edik osztály azonosítója, a sokaság osztályba sorolt egységeinek száma, ún. gyakorisága, k : a kialakított osztályok száma, N : a sokaság egységeinek száma. A sémából is látható, hogy a gyakoriságok összege egyenlő a sokaság elemszámával (N). Tehát A csoportképző ismérv fajtájától függően a csoportosító sorok lehetnek: minőségi, mennyiségi, területi és idősorok. A mennyiségi és idősorok képzésével, jellemzőivel a tankönyv 2. fejezetében részletesen foglalkozunk, ezért itt csak a minőségi és területi sort szemléltetjük egy-egy példával. Minőségi sor (1.3 táblázat): 1.3. táblázat - A Magyarországra érkező külföldiek megoszlása az utazás jellege szerint 1993-ban Utazás jellege Külföldiek száma 8

A statisztika alapfogalmai (E fő) Turista Kiránduló Átutazó 22 804 11 719 6 076 Összesen 40 599 Területi sor (1.4. táblázat): 1.4. táblázat - A népesség megyék szerinti megoszlása 1994. január 1-jén Megye Népesség száma (fő) Budapest Budapest egyik megyéhez sem tartozik közigazgatásilag, ezért a statisztikai kiadványokban külön sorban tüntetik fel. Baranya Bács-Kiskun Békés Borsod-Abaúj-Zemplén Csongrád Fejér Győr-Moson-Sopron Hajdú-Bihar Heves Jász-Nagykun-Szolnok Komárom-Esztergom Nógrád Pest Somogy Szabolcs-Szatmár-Bereg Tolna Vas Veszprém Zala 1 955 696 416 405 538 560 401 323 743 835 436 639 422 448 426 738 548 942 328 754 418 858 312 295 221 032 964 939 338 245 560 888 249 938 272 835 377 531 301 067 Összesen 10 276 968 9

A statisztika alapfogalmai Az egy ismérv szerinti csoportosítás a sokaságról kevés információt nyújt, ezért gyakran alkalmazzuk az ún. kombinatív csoportosítást. Ennek lényege, hogy az egyik ismérv szerint képzett osztályokon belül egy másik ismérv szerint is csoportosítunk. Pl. a lakott lakásokat csoportosítjuk területi elhelyezkedés és komfortfokozat szerint (a megfigyelés időpontja:1990. január 1.). K: komfortos, FK: félkomfortos, KN: komfort nélküli. A kombinatív csoportosítással kapott adatokat táblázatba is rendezhetjük, statisztikai táblát készíthetünk. Ennek részleteiről a 3. fejezetben lesz szó. Összehasonlítás A mindennapi életben és a statisztikai elemző munkában is gyakran találkozunk az összehasonlítás mozzanatával. Az összehasonlítás két vagy több statisztikai adat egymáshoz való viszonyítása. Az összehasonlítás az adatok egyszerű összevetésén túl általában különbség és hányados képzésével történik. Pl. Az ATS devizaszámla kamata az IBUSZ Banknál 1995. június 23-án 3,437%, július 23-án 3,375% volt. Az adatok puszta összevetése alapján azt tudjuk megállapítani, hogy a devizaszámla kamata csökkent. Ha a változás nagyságára is kíváncsiak vagyunk, akkor a két időpont kamatának a különbségét vagy hányadosát számítjuk ki. A két szám különbsége: A két szám hányadosa: A devizaszámla kamata 0,062 százalékponttal, illetve 1,8 százalékkal csökkent. Két százalékban (ezrelékben) kifejezett adat (mutatószám) különbségének mértékegységét százalékpontnak(ezrelékpontnak) szokás nevezni. (A kamatváltozás mértékét a gyakorlatban általában százalékpontban adják meg.) Az összehasonlítandó adatokat is statisztikai sorba rendezhetjük. Az így képzett sorokat összehasonlító soroknak nevezzük, melyeket a csoportosító sorokhoz hasonlóan az ismérvek fajtája szerint is megkülönböztethetünk. A különböző időpontokban megfigyelt devizaszámla-kamatokat sorba rendezve idősort képezhetünk (1.5. táblázat). 10

A statisztika alapfogalmai 1.5. táblázat - Az ATS devizaszámla kamatának alakulása az IBUSZ Banknál Időpont Kamat (%) 1995. június 23. július 23. 3,437 3,375 Az összehasonlító területi sor pedig a különböző földrajzi területeken végzett megfigyelések eredményeit rögzíti. Az 1.6. táblázat ilyen sort szemléltet. 1.6. táblázat - Az 1 főre jutó GDP néhány európai országban 1993-ban Ország Albánia Ausztria Hollandia Lengyelország Magyarország Németország Portugália Románia Spanyolország Svájc Szlovákia 1 főre jutó GDP (USD) 340 23 120 20 710 2 020 3 300 23 560 7 890 1 120 13 650 36 410 1 900 5. 1.5. Viszonyszámok A csoportosított, sorba rendezett adatok elemzésének egyik legegyszerűbb eszköze a viszonyszám. A viszonyszám két egymással logikai kapcsolatban álló statisztikai adat hányadosa. Képlettel: ahol V: a viszonyszám, A: a viszonyítás tárgyát képező adat, amit viszonyítunk, B: a viszonyítás alapját képező adat, amihez viszonyítunk. A viszonyszámokat számíthatjuk azonos fajta (azonos mértékegységű) és különböző fajta (általában különböző mértékegységű) adatokból. Az azonos fajta adatokból számított viszonyszámok azt fejezik ki, hogy egyik adat hányszorosa a másiknak. Jellegzetes fajtái a megoszlási, a koordinációs és a dinamikus viszonyszámok. 11

A statisztika alapfogalmai A megoszlási viszonyszám a sokaság egyes részeinek a sokaság egészéhez viszonyított arányát fejezi ki. 1.7. táblázat - A 2024 év közötti népesség nemek szerinti megoszlása 1994. január 1-jén Nem Népesség száma (fő) Férfi Nő 372 425 354 289 Összesen 726 714 Az 1.7. táblázat szerinti minőségi sorból számítható megoszlási viszonyszámok: a férfiak aránya: a nők aránya: A 2024 év közötti népesség 51,2%-a férfi, 48,8%-a nő volt 1994. január 1-jén. A koordinációs viszonyszám a sokaság két részadatának hányadosa. A 1.7. táblázat adataiból számítható koordinációs viszonyszámok: 1000 férfira jutó nők száma: 1000 nőre jutó férfiak száma: A dinamikus viszonyszám két időszak (időpont) adatának hányadosa. 1.8. táblázat - A német márka (DEM) eladási árfolyamának alakulása az OTP Banknál Időpont 1994. július 10. 1995. július 10. Árfolyam (Ft/DEM) 66,12 90,76 Dinamikus viszonyszám: (az 1.8. táblázat adataival számolva). A német márka eladási árfolyama 1 év alatt 37,3%-kal nőtt. A különböző fajta, általában kü lönböző mértékegységű adatokból számított viszonyszámokat intenzitási viszonyszámoknak nevezzük. Az intenzitási viszonyszámok azt fejezik ki, hogy egyik mennyiségből (számláló) mennyi jut a másik mennyiség (nevező) egy egységére. E viszonyszámok általában két egymással valamilyen kapcsolatban álló sokaság nagyságának adatából képzett hányadosok. Pl. 1994. január 1-jén a lakások száma 3955 ezer db, a lakásokban felszerelt távbeszélő-állomások (telefonok) száma 1 134 884 db volt. 12

A statisztika alapfogalmai Az intenzitási viszonyszám az 1000 lakásra jutó távbeszélő-állomások száma: A különböző fajta, különböző mértékegységű de egymással kapcsolatban álló adatokat is statisztikai sorba rendezhetjük. Az így képzett sort leíró sornak nevezzük. A leíró sorokat általában abból a célból készítjük, hogy valamilyen társadalmi-gazdasági egységet (pl. egy országot, egy vállalkozást, egy intézményt stb.) vagy jelenséget (pl. az egészségügyi ellátást, a külkereskedelmet stb.) jellemezzünk. E sortípust az alábbi példával szemléltetjük (1.9. táblázat). 1.9. táblázat - Magyarország 1993. évi idegenforgalmát jellemző adatok Megnevezés Külföldre utazó magyarok száma (E fő) Magyarországra érkező külföldiek száma (E fő) ebből turisták (E fő) Idegenforgalom bevétele (M Ft) Idegenforgalom kiadása (M Ft) Adat 12 115 40 599 22 804 110 312 68 961 6. 1.6. Átlagok A viszonyszámok mellett talán a leggyakrabban használt elemzési eszközök az átlagok, melyeket középértékeknek is szokás nevezni. Az átlagokat azonos fajta adatok halmazának tömör, számszerű jellemzésére használjuk. Ilyen halmazt képezhetnek például a mennyiségi ismérv értékei, az idősor adatai, a viszonyszámok stb. Az adatok jellegétől függően az átlagukat számtani, harmonikus, mértani vagy négyzetes átlaggal számíthatjuk ki. Az egyes átlagok alkalmazási területeivel tankönyvünk későbbi fejezeteiben ismerkedünk meg. Az átlagszámítás során az átlagolandó értékeket a következő módon jelöljük: ahol: N : a megfigyelt átlagolandó értékek száma, az i-edik átlagolandó érték. A különböző átlagok kiszámítását az alábbi, adatból álló számpéldával is szemléltetjük: 2, 6, 4, 2, 6, 4, 6, 2, 5, 6. Számtani átlag A számtani átlag (jele: változatlan marad. ) az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok összege Tehát Ebből a számtani átlag: 13

A statisztika alapfogalmai Adataink alapján: Mivel az átlagolandó értékek között azonos értékek is előfordulnak, ezért a következő formában is kiszámíthatjuk az átlagot: Az alapadatokat áttekinthető formába rendezve csoportosító sort kapunk. (Ennek sémáját az 1.2. táblázatban mutattuk be.) Az egyforma átlagolandó értékeket egy osztályba sorolva k számú csoportot képezünk. Ezért a továbbiakban a szummázás -ig terjed. (Továbbra is 10 átlagolandó értékkel dolgozunk, de ezeket csoportba soroltuk be.) Átlagolandó értékek száma (gyakorisága) 2 4 5 6 3 2 1 4 Összesen 10 A csoportosító sor sémájában bevezetett jelölések szerint: ahol: k : az egymástól különböző átlagolandó értékek száma, a gyakoriságok, melyeket az átlagszámítás során súlyoknak nevezünk. Ezt a számítási formát súlyozott formának nevezzük. A számtani átlag nagysága nem változik, ha a súlyokat (gyakoriságokat) egy konstans számmal megszorozzuk vagy elosztjuk. Ha a gyakoriságokat elosztjuk az átlagolandó értékek számával (N), megoszlási viszonyszámokat kapunk, melyeket -vel jelölünk: Jellemző, hogy Példánkban: 14

A statisztika alapfogalmai 2 4 5 6 0,3 0,2 0,1 0,4 Összesen 1,0 Könnyű belátni, hogy az átlagot e megoszlási viszonyszámok alapján is számíthatjuk. Számszerűen: Az előző számítási módból látható, hogy a számtani átlag nagyságát két tényező befolyásolja: a) az átlagolandó értékek abszolút nagysága. Az átlag mindig a legkisebb és legnagyobb érték közé esik: b) A súlyok viszonylagos nagysága, a súlyarányok. A súlyarányokon múlik, hogy az átlag az intervallumban hol helyezkedik el. Ha a kisebb átlagolandó értékeknek nagyobb a súlyaránya, akkor az átlag az intervallum alsó, ha a nagyobb átlagolandó értékeknek nagyobb a súlyaránya, akkor az átlag az intervallum felső határához esik közelebb. A fenti megállapítások nemcsak a számtani átlagra, hanem a később ismertetendő átlagfajtákra is igazak. A számtani átlag tulajdonságai: 1. Az átlagolandó értékek és a számtani átlag különbségeinek algebrai összege nulla. Ez azt jelenti, hogy ha minden átlagolandó értéket a számtani átlaggal helyettesítünk, akkor e helyettesítéssel elkövetett eltérő előjelű hibák (különbségek) összességükben kiegyenlítik egymást. E tulajdonság könnyen belátható: mert az átlag definíciója szerint 15

A statisztika alapfogalmai 2. Ha az átlagolandó értékekből levonunk egy konstans számot (A)és a különbségeket négyzetre emeljük, akkor ezen négyzetek összege (vagy ahogy mondani szokták: az eltérések négyzetösszege) akkor lesz a legkisebb, ha a konstans a számtani átlaggal azonos. Tehát Az átlag e tulajdonságát négyzetes minimum tulajdonságnak nevezzük. A tulajdonság úgy bizonyítható, hogy az eltérés-négyzetösszegnek mint A-nak a függvénye ott lehet minimális, ahol az első derivált nulla: Ebből: Mivel pozitív, az valóban minimális. 3. Ha az átlagolandó értékek mindegyikéhez ugyanazt az A állandót hozzáadjuk, akkor a számtani átlag éppen ezen A állandóval változik meg. Tehát, ha ( ), akkor. Ugyanis 4. Ha az átlagolandó értékeket egy B állandóval megszorozzuk, a számtani átlag is B-szeresére változik. Tehát, ha ( ), akkor Ugyanis Harmonikus átlag A harmonikus átlag (jele: )az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok reciprokainak összege változatlan marad. Tehát Ebből a harmonikus átlag : 16