Általános statisztika I. Havasy, György Molnár, Máténé Szunyogh, Zsuzsanna Tóth, Mártonné Korpás, Attiláné Csernyák, László



Hasonló dokumentumok
Bevezető Mi a statisztika? Mérés Csoportosítás

[GVMGS11MNC] Gazdaságstatisztika

Általános statisztika I Havasy, György Molnár, Máténé Szunyogh, Zsuzsanna Tóth, Mártonné Korpás, Attiláné Csernyák, László

Sta t ti t s i zt z i t k i a 3. előadás

Sándorné dr. Kriszt Éva dr. Csesznák Anita. Statisztika I. Szerkesztette Sándorné dr. Kriszt Éva. Nemzedékek Tudása Tankönyvkiadó, Budapest

2. előadás. Viszonyszámok típusai

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

Sta t ti t s i zt z i t k i a 1. előadás

Megoldások. Az ismérv megnevezése közös megkülönböztető szeptember 10-én Cégbejegyzés időpontja

Statisztikai alapfogalmak

Viszonyszám A B. Viszonyszám: két, egymással kapcsolatban álló statisztikai adat hányadosa, ahol A: a. viszonyítadóadat

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Statisztikai alapfogalmak

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Statisztika. Dr Gősi Zsuzsanna. Egyetemi adjunktus. Sportmenedzsment Tanszék

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Statisztika I. 2. előadás: Statisztikai táblák elemzése. Kóczy Á. László. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem

Áruforgalom tervezése. 1. óra A gazdasági statisztika alapjai Alapfogalmak, viszonyszámok

1. óra: Területi statisztikai alapok viszonyszámok, középértékek

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

STATISZTIKA I. 3. rész. T.Nagy Judit

Bevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I.

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.


1. Egy Kft dolgozóit a havi bruttó kereseteik alapján csoportosítottuk: Havi bruttó bér, ezer Ft/fő

Statisztika I. 1. előadás. Előadó: Dr. Ertsey Imre

Statisztika 1. Tantárgyi útmutató

6. A kereskedelmi készletek elszámoltatása, az értékesítés elszámoltatása 46. Összefoglaló feladatok 48.

Korrelációs kapcsolatok elemzése

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

STATISZTIKA. Gyakorló feladatok az első zh-ra

Statisztika I. 7. előadás. Előadó: Dr. Ertsey Imre

TANTÁRGYI ÚTMUTATÓ. Statisztika 1.

Tantárgyi útmutató. 1. A tantárgy helye a szaki hálóban. 2. A tantárgyi program általános célja. Statisztika 1.

Statisztikai. Statisztika Üzleti szakügyintéző felsőfokú szakképzés I. évfolyam VS (NFG ÜS302G4) es tanév I. félév

[GVMGS11MNC] Gazdaságstatisztika

GAZDASÁGI STATISZTIKA

A leíró statisztikák

5. Előadás. Grafikus ábrázolás Koncentráció elemzése

Módszertani Intézeti Tanszéki Osztály

Függetlenségvizsgálat, Illeszkedésvizsgálat

Biomatematika 2 Orvosi biometria

1. Előadás. Statisztikai alapfogalmak. A statisztikai munka fázisai. Statisztikai adatok csoportosításának lehetőségei. Statisztikai sorok, táblák.

Mérési hibák

7, 6, 0, 4, 0, 1, 5, 2, 2, 16, 1, 0, 2, 3, 9, 2, 4, 10, 3, 1, 2, 12, 4, 1

[Biomatematika 2] Orvosi biometria

2013 ŐSZ. 1. Ismertesse a mérési skálák tulajdonságait és a közöttük lévő összefüggéseket.

10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Kistérségi gazdasági aktivitási adatok

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

9.3. Külkereskedelmi statisztika Pénzügystatisztika, az államháztartás információs rendszere Agrárstatisztikai információs

Statisztika összefoglalás

A sokaság/minta eloszlásának jellemzése

Statisztika I. 2. előadás. Előadó: Dr. Ertsey Imre

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

OSAP Bér- és létszámstatisztika. Vezetõi összefoglaló

Matematika feladatbank I. Statisztika. és feladatgyűjtemény középiskolásoknak

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Az egészségügyi és gazdasági indikátorok összefüggéseinek vizsgálata Magyarországon

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

A GDP hasonlóképpen nem tükrözi a háztartások közötti munka- és termékcseréket.

Matematikai geodéziai számítások 6.

STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés

A Debreceni Egyetem Intézményfejlesztési Terve

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Módszertani leírás a Munkaerő-felmérés II. negyedévi Megváltozott munkaképességűek a munkaerőpiacon című kiegészítő felvételhez

AZ ÖSSZEHASONLÍTÁST TORZÍTÓ TÉNYEZŐK ÉS KISZŰRÉSÜK

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

A gazdasági növekedés mérése

y ij = µ + α i + e ij

KUTATÁSMÓDSZERTAN 4. ELŐADÁS. A minta és mintavétel

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Osztályozóvizsga követelményei

Biomatematika 2 Orvosi biometria

Módszertani leírás a Munkaerő-felmérés I. negyedévi Munkanélküli érintettség, diszkrimináció című kiegészítő felvételhez

Matematikai statisztika

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

TÁJÉKOZTATÓ BARANYA MEGYE MUNKAERŐ-PIACI HELYZETÉNEK ALAKULÁSÁRÓL ÁPRILIS

A Statisztika alapjai

1. előadás. Lineáris algebra numerikus módszerei. Hibaszámítás Számábrázolás Kerekítés, levágás Klasszikus hibaanalízis Abszolút hiba Relatív hiba

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

matematikai statisztika

AZ ORSZÁGOS NYUGDÍJBIZTOSÍTÁSI FŐIGAZGATÓSÁG STATISZTIKAI ZSEBKÖNYVE

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

A statisztika alapjai - Bevezetés az SPSS-be -

[Biomatematika 2] Orvosi biometria

18. modul: STATISZTIKA

Az Állami Foglalkoztatási Szolgálat munkanélküli nyilvántartásának fontosabb adatai augusztus FOGLALKOZTATÁSI HIVATAL

TAMP ÉS CO-TAMP KÖZÖS ÉS NEMZETI VONZÓKÉPESSÉGI PLATFORM

1. előadás Horváthné Csolák Erika

Matematikai geodéziai számítások 6.

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Átírás:

Általános statisztika I Havasy, György Molnár, Máténé Szunyogh, Zsuzsanna Tóth, Mártonné Korpás, Attiláné Csernyák, László

Általános statisztika I Havasy, György Molnár, Máténé Szunyogh, Zsuzsanna Tóth, Mártonné Korpás, Attiláné Csernyák, László Publication date 1996 Szerzői jog 1996 Havasy György, Korpás Attiláné, Molnár Máténé, Szunyogh Zsuzsanna, Tóth Mártonné, Nemzeti Tankönyvkiadó Rt. Szerkesztette: Dr. Korpás Attiláné- főiskolai docens Szerzők: Dr. Havasy György - főiskolai docens (4. fejezet) Dr. Molnár Máténé - főiskolai docens (3. fejezet) Dr. Szunyogh Zsuzsanna - főiskolai docens (5. fejezet) Dr. Tóth Mártonné - főiskolai adjunktus (1. és 2. fejezet) A gyakorlófeladatokat: Dr. Korpás Attiláné állította össze. Szakmai lektor: Dr. Csernyák László - egyetemi tanár, tanszékvezető, a matematikatudomány kandidátusa A mű más kiadványban való részleges vagy teljes felhasználása, illetve utánközlése a kiadó engedélye nélkül tilos!

Tartalom 1. A statisztika alapfogalmai... 1 1.1. A statisztika tárgya és szerepe... 1 1.2. A statisztikai sokaság és ismérv... 2 1.3. Statisztikai adat... 6 1.4. Statisztikai csoportosítás és összehasonlítás... 10 1.5. Viszonyszámok... 15 1.6. Átlagok... 18 1.7. Gyakorlófeladatok... 25 2. Egy ismérv szerinti elemzés... 30 2.1. A mennyiségi ismérv szerinti elemzés... 30 2.1.1. A mennyiségi ismérv... 30 2.1.2. Gyakorisági sorok... 32 2.1.3. Értékösszegsor... 41 2.1.4. A gyakorisági sorok grafikus ábrázolása... 47 2.1.5. Helyzetmutatók... 54 2.1.6. Szóródási mutatók... 71 2.1.7. Az aszimmetria mérőszámai... 81 2.1.8. A koncentráció elemzése... 83 2.2. Az időbeli ismérv szerinti elemzés... 87 2.2.1. Idősorok... 87 2.2.2. Dinamikus viszonyszámok... 89 2.2.3. Az idősorok grafikus ábrázolása... 93 2.2.4. Az idősorok elemzése átlagokkal... 94 2.3. Gyakorlófeladatok... 100 3. A sokaságok több ismérv szerinti vizsgálata, a statisztikai táblák elemzése... 107 3.1. A statisztikai táblákról általában... 107 3.2. Az egyszerű táblák elemzése... 110 3.2.1. Intenzitási viszonyszámok és dinamikus viszonyszámok együttes alkalmazása... 111 3.2.2. A fejlődési tendenciák kimutatása, összehasonlítása... 117 3.3. A csoportosító táblák elemzése... 123 3.3.1. Rész- és összetett viszonyszámok... 124 3.3.2. Szerkezet- és dinamikai változás vizsgálata... 127 3.4. A kombinációs táblák (a sztochasztikus kapcsolatok) elemzése... 133 3.4.1. Függvényszerű kapcsolat. Függetlenség... 139 3.4.2. Az asszociáció szorosságának mérése... 141 iii

Általános statisztika I 3.4.3. A vegyes kapcsolat elemzése... 149 3.4.4. A korreláció elemzése csoportosított adatokból kiindulva... 165 3.5. Gyakorlófeladatok... 172 4. Összetett intenzitási viszonyszámok (főátlagok) összehasonlítása... 180 4.1. A standardizálás módszere... 180 4.2. Az összetett intenzitási viszonyszámok (főátlagok) különbségének felbontása összetevőire... 184 4.2.1. A részviszonyszámok (részátlagok) különbözőségének hatása... 186 4.2.2. Az összetétel különbözőségének hatása... 188 4.3. Indexszámítás standardizálás alapján (hányadosfelbontás)... 189 4.3.1. A főátlagindex... 190 4.3.2. A részátlagindex... 192 4.3.3. Az összetételhatás indexe... 194 4.4. Alkalmazási területek... 195 4.4.1. Az átlagbérek időbeli változásának vizsgálata... 196 4.4.2. Az átlagárak időbeli változásának vizsgálata... 198 4.5. Gyakorlófeladatok... 202 5. Érték-, ár- és volumenindexek... 209 5.1. Az indexszám fogalma... 209 5.2. Érték-, ár- és volumenindex-számítás... 209 5.2.1. Indexszám számítása aggregát formában... 211 5.2.2. Az indexek átlagformái... 213 5.3. Az indexek súlyozása... 218 5.4. Összefüggések az indexszámításban... 221 5.4.1. Az indexszámok közötti összefüggések... 221 5.4.2. Az aggregátumok közötti összefüggések... 222 5.4.3. Csoportosított sokaságra számított indexek... 224 5.5. Az indexszámok gyakorlati alkalmazása... 227 5.6. Indexsorok... 229 5.6.1. Az indexsorok közötti összefüggések... 234 5.7. Területi indexek... 235 5.8. Gyakorlófeladatok... 238 A. Irodalom... 247 6. Tárgymutató... 248 iv

Az ábrák listája 2.1. A háztartások taglétszám szerinti eloszlásának bot-ábrája... 48 2.2. A lakások vízfogyasztás szerinti megoszlásának hisztogramja... 49 2.3. A lakások vízfogyasztás szerinti megoszlásához tartozó kumulált relatív gyakoriságok... 50 2.4. A biztosítások biztosítási díj szerinti megoszlásának hisztogramja... 52 2.5. A lakások vízfogyasztás szerinti megoszlásának gyakorisági poligonja... 53 2.6. A biztosítások biztosítási díj szerinti megoszlásának gyakorisági poligonja... 54 2.7.... 55 2.8.... 56 2.9. A lakások vízfogyasztás szerinti megoszlása... 58 2.10. A vízfogyasztás alsó és felső kvartilisének, mediánjának, kilencedik decilisének becslése... 69 2.11.... 71 2.12. A népesség koncentrációja Nógrád és Zala megyében (Lorenz-görbe)... 86 2.13. A takarékbetét-állomány alakulása... 93 2.14. A Magyarországra érkező turisták számának alakulása... 94 2.15. Az épített lakások számának alakulása... 98 3.1. A statisztikai táblák típusai... 110 3.2. Az egészségügyi ellátás alakulása az 1985-ös bázisévhez viszonyítva... 121 3.3. Az egészségügyi ellátottság intenzitási viszonyszámainak alakulása az 1985-ös bázisévhez viszonyítva... 121 3.4. A lakásállomány szobaszám szerinti összetételének alakulása... 132 3.5. A lakásállomány szobaszám szerinti összetételének alakulása... 133 3.6. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat... 168 5.1.... 224 v

A táblázatok listája 1.1. Példák a sokaságokra... 3 1.2. Csoportosító sor általános sémája... 10 1.3. A Magyarországra érkező külföldiek megoszlása az utazás jellege szerint 1993-ban... 11 1.4. A népesség megyék szerinti megoszlása 1994. január 1-jén... 12 1.5. Az ATS devizaszámla kamatának alakulása az IBUSZ Banknál... 14 1.6. Az 1 főre jutó GDP néhány európai országban 1993-ban... 14 1.7. A 2024 év közötti népesség nemek szerinti megoszlása 1994. január 1-jén... 16 1.8. A német márka (DEM) eladási árfolyamának alakulása az OTP Banknál... 17 1.9. Magyarország 1993. évi idegenforgalmát jellemző adatok... 17 3 2.1. Egy társasház 50 lakásának az elmúlt kéthavi vízfogyasztása a leolvasás sorrendjében (adatok m -ben)... 30 3 2.2. A lakásonkénti vízfogyasztás növekvő sorrendben (adatok m -ben)... 31 2.3. A gyakorisági sorok általános sémája... 33 2.4. A lakások szobaszám szerinti eloszlása... 35 2.5. A társasház lakásainak megoszlása a vízfogyasztás szerint... 36 2.6. A lakások vízfogyasztás szerinti megoszlása... 37 2.7. A nyugdíjas nők megoszlása a nyugdíj nagysága szerint 1994 áprilisában... 38 2.8. A társasház vízfogyasztására vonatkozó adatok... 39 2.9. A társasház vízfogyasztására vonatkozó adatok... 40 2.10. Az értékösszegsor általános sémája... 41 2.11. A település háztartásainak taglétszám szerinti eloszlása... 42 2.12. A település lakosainak eloszlása az egyes háztartások taglétszáma szerint... 42 2.13. Az összes vízfogyasztás megoszlása... 43 2.14. Munkatábla az osztályközép meghatározásához... 44 2.15. Az összes vízfogyasztás megoszlása... 45 2.16. Az összes vízfogyasztás megoszlása... 46 2.17. A társasház vízfogyasztására vonatkozó adatok... 47 2.18. Lakásbiztosítások megoszlása valamely biztosító egyik fiókjánál a biztosítási díj nagysága szerint... 50 2.19. Munkatábla a medián becsléséhez... 61 2.20. Valamely biztosító egyik fiókjánál kötött lakásbiztosításokra vonatkozó adatok... 63 2.21. Egy biztosító valamely fiókjánál kötött lakásbiztosításokra vonatkozó adatok... 65 2.22. A nyugdíjas nők nyugdíj szerinti megoszlása 1994 áprilisában (decilis eloszlás)... 70 2.23. Munkatábla az átlagos eltérés és a szórás számításához... 75 2.25. A szimmetrikus és aszimmetrikus eloszlások jellemzői... 81 2.26. Zala megye településeinek és össznépességének megoszlása népességnagyság szerint 1994. január 1-jén... 84 2.27. Munkatábla a koncentráció vizsgálatához (a fejrovatba csak a jelöléseket írva)... 85 vi

Általános statisztika I 2.28. Magyarország személygépkocsi-állományának alakulása (az évek december 31-én)... 88 2.29. Magyarországra érkező külföldi turisták számának alakulása... 88 2.30. A bázis- és láncviszonyszámok számítása... 90 2.31. A lakosság takarékbetét-állományának alakulása (az évek december 31-én)... 90 2.32. Valamely utazási iroda valutakészletének és valutaértékesítésének adatai... 95 2.33. Az épített lakások számának alakulása Magyarországon... 97 3.1. A budapesti székhelyű külföldi érdekeltségű vállalkozások számának alakulása (december 31-i adatok)... 107 3.2. A magyarországi népesség életkor szerinti megoszlásának alakulása... 108 3.3. A magyarországi lakott lakások számának megoszlása komfortosság és településtípusok szerint (1990. január 1.)... 109 3.4. Az orvosi ellátás néhány adata (december 31-i adatok)... 111 3.5. Orvosi ellátásra vonatkozó adatok... 114 3.6. Az egészségügyi ellátásra vonatkozó adatok (december 31-i adatok)... 118 3.7. Az egészségügyi ellátásra vonatkozó adatok... 118 3.8. A csoportosító tábla általános sémája... 123 3.9. Magyarország népességére és a magyarországi lakásokra vonatkozó adatok (1994. január 1.)... 125 3.10. A magyarországi népességszám és lakásellátottság településtípusonként (1994. január 1.)... 126 3.11. A magyarországi lakások számának megoszlása szobaszám szerint (január 1-jei adatok)... 127 3.12. A magyarországi lakásállomány nagyságának és szobaszám szerinti összetételének alakulása... 128 3.13. Magyarország népességszámának és megoszlásának alakulása településtípusonként (január 1-jei adatok)... 129 3.14. A magyarországi lakásállományra vonatkozó adatok... 131 3.15. A kontingenciatábla sémája... 135 3.16. A közép- és felsőfokú tanintézetekben nappali tagozaton tanulók számának megoszlása lakóhelyük és a tanintézet típusa szerint (1990. január 1.)... 136 3.17. A kontingenciatábla sémája relatív gyakoriságokkal (megoszlási viszonyszámokkal)... 137 3.18. A tanulók relatív gyakoriságai lakóhelyük és a tanintézet típusa szerint... 138 3.19. A tanulók %-os megoszlása lakóhelyük és a tanintézet típusa szerint... 138 3.20. Az E ismérv szerinti rész- és összetett megoszlási viszonyszámok... 139 3.21. Kontingenciatáblázat alternatív ismérvek esetén... 141 3.22. Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.)... 143 3.23. Magyarország népességének összetétele nem és gazdasági aktivitás szerint (1993. január 1.)... 144 3.24. A függetlenség feltételezésével számított gyakoriságok ( )... 146 3.25. A számítása... 3.26. A vegyes kapcsolat adatbázisa... 3.27. Egy bizonyos települési székhellyel működő jogi személyiségű ipari szervezetek létszámadatai (főben)... 3.28. A kontingenciatábla sémája vegyes kapcsolat esetén... 3.29. Egy bizonyos települési székhellyel működő ipari szervezetek megoszlása gazdálkodási forma és létszám szerint... vii 147 149 150 152 153

Általános statisztika I 3.30. A vizsgált ipari szervezetekre vonatkozó rész- és főátlagok... 156 3.31. A vizsgált ipari szervezetekre vonatkozó adatok... 160 3.32. A korrelációs tábla sémája... 165 3.33. Egy társasházban lévő lakások megoszlása a szobák száma és a lakásban lakó személyek száma szerint... 166 3.34. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati regressziófüggvénye... 167 3.35. A lakások szobaszáma és a lakásokban élő személyek száma közötti kapcsolat tapasztalati regressziófüggvénye... 171 4.1. Jövedelem- és létszámadatok két vállalkozásnál... 180 4.2. Két összetett intenzitási viszonyszám meghatározása és összehasonlítása... 182 4.3. Két ország halandósági viszonyainak alakulása (fiktív adatok)... 184 4.4. Egy megye forgalmi és népességadatai az 1994. és 1995. évben... 190 4.5. A lakosság összetételének változása... 195 4.6. Egy vállalkozás munkaügyi adatai... 196 4.7. 4.7. táblázat... 196 4.8. Egy homogén árucsoportba tartozó három cikk értékesítési adatai... 200 5.1. Jövedelem Egy iparcikkeket forgalmazó fővárosi áruház Videoton teletextes televízióforgalma az 19931994-es években... 210 5.2. Az egyes televíziótípusok érték-, ár- és mennyiségváltozását jelző egyedi indexek... 211 5.3. Az indexek kiszámítási képleteinek áttekintő táblázata... 217 5.4. A Videoton televíziók forgalmának alakulása az 19931994. években egy fővárosi, iparcikkeket forgalmazó üzletben... 225 5.5. Néhány gyümölcs felvásárlására vonatkozó adatok az 19901993. években... 229 5.6. Az 19901993. évi felvásárlás összértéke különböző évi árakon számítva... 230 5.7. Néhány cikk felhozatalára vonatkozó adatok két alföldi város piacán 1995 júniusában... 236 viii

1. fejezet - A statisztika alapfogalmai 1.1. A statisztika tárgya és szerepe A bennünket körülvevő világ megismeréséhez, a társadalom és a gazdaság működéséhez, bármilyen szintű döntéshez sokféle információra van szükség. Az információk között kitüntetett szerepe van a számszerű információknak, mert ezek a másféle információknál tömörebbek és egyértelműbbek. A számszerű információk gyűjtésében, feldolgozásában, elemzésében és publikálásában fontos szerepe van a statisztikának. A statisztika a valóság tömör, számszerű jellemzésére szolgáló tudományos módszertan, illetve gyakorlati tevékenység. A statisztikai tevékenység az emberiség fejlődése folyamán jóval korábban kialakult, mint a statisztika tudománya. A statisztikai tevékenység úgyszólván egyidős az állammal, kezdetben az állam fenntartásához szükséges információk (pl. a fegyverforgatásra alkalmas férfiak száma, a termények mennyisége stb.) gyűjtése és közlése volt a feladata. A statisztikatudomány kialakulása azonban csupán a kapitalizmus kifejlődésével vette kezdetét. Ekkor a népesség és a termelés koncentrálódása következtében a korábbi egyszerű nyilvántartási formák már nem voltak alkalmasak az egyre sokoldalúbb statisztikai jellegű állami és társadalmi igények kielégítésére. A statisztikatudomány fokozatosan fejlődve amihez nagy lendületet adott a valószínűség-számítás kialakulása és tételeinek elterjedése önálló módszertudománnyá vált. Eredményeit a társadalomtudományok mellett széles körben alkalmazzák a természettudomány különböző területein is. A statisztikának egyre nagyobb szerepe van a gazdasági döntések előkészítése, az üzleti problémák elemzése mellett pl. az orvosi és biológiai kérdések megválaszolásában is. A statisztika mint gyakorlati tevékenység a tömegesen előforduló jelenségek egyedeire vonatkozó információk gyűjtése, feldolgozása, elemzése, ennek alapján a vizsgált jelenség egészének tömör, számszerű jellemzése. A statisztika másrészt az információk összegyűjtésének, leírásának, elemzésének, értékelésének és közlésének tudományos módszertana. A fenti megfogalmazásban igen fontos a tömeges jelző. A statisztika mindig tömegesen (nagy számban) előforduló jelenségek vizsgálatával foglalkozik. E tömegjelenségek igen sokfélék lehetnek, pl. egy ország népessége, egy áruház forgalma, egy ország gépkocsiállománya, az energiatermelés, a lakosság fogyasztása stb. A statisztikai módszerek között vannak egészen egyszerű eljárások és vannak bonyolultabb, matematikai-statisztikai módszerek. A statisztikai módszertanon belül megkülönböztetünk leíróstatisztikát és statisztikai következtetést. A leíró statisztika az információk összegyűjtését, összegzését, tömör, számszerű jellemzését szolgáló módszereket foglalja magában. Ide sorolhatjuk az adatgyűjtést, az adatok ábrázolását, csoportosítását, az adatokkal végzett egyszerűbb aritmetikai műveleteket, az eredmények áttekinthető formában való megjelenítését. Leíró statisztikai módszereket alkalmazunk például akkor, ha valamely település háztartásait (tömegjelenség) megfigyeljük taglétszámuk, jövedelmük, kiadásaik, fogyasztási szokásaik stb. szerint. A begyűjtött információkat rögzítjük, majd csoportosítjuk a háztartásokat jövedelem, taglétszám stb. szerint, kiszámíthatjuk a háztartások átlagos jövedelmét, átlagos rezsiköltségét stb. A csoportosított adatokat, eredményeket szemléletes módon (ábrákkal, táblázatos formában) megjelenítjük, közzétesszük. 1

A statisztika alapfogalmai A statisztikai következtetést akkor alkalmazzuk, ha a tömegjelenségek egyedeinek teljes körű megfigyelésére nincs lehetőség, vagy a teljes körű megfigyelés túl költséges így gazdaságtalan és időigényes. Ilyen esetben az egyedek egy szűkebb csoportját figyeljük meg. A viszonylag kis számú egyedre vonatkozó információk és az azokból számított eredmények alapján következtetünk a tömegjelenség egészére, jellemzőire, tulajdonságaira. Következtetéses statisztikai módszereket alkalmazunk például a közvélemény-kutatásoknál, a forgalomba kerülő termékek minőségének ellenőrzésekor, a lakosok életkörülményeinek vizsgálatánál. További alkalmazással találkozhatunk különböző tényezők közötti összefüggések vizsgálatánál. A lakosság jövedelme (vagy annak változása) pl. miként befolyásolja a tartós fogyasztási cikkekre fordított kiadási összegeket (vagy azok változását), vagy különböző ráfordítások hogyan befolyásolják a termelés eredményességét. Könyvünk mind a leíró statisztikai, mind a következtetéses statisztikai módszerek közül a komoly matematikai apparátust nem igénylő, leggyakrabban használt elemzési eszközöket tárgyalja. A statisztikai módszertant más szempont szerint is csoportosíthatjuk. Megkülönböztetünk általános statisztikát és szakstatisztikát. Az általános statisztika a statisztika általános elméleti kérdéseivel, a statisztikai vizsgálatok során alkalmazásra kerülő módszerekkel általánosságban foglalkozik, a szakstatisztika a társadalmi-gazdasági élet egy-egy területének statisztikai módszerekkel való vizsgálatát tárgyalja. Ilyen például a népességstatisztika, az idegenforgalmi statisztika stb. 1.2. A statisztikai sokaság és ismérv A statisztika mint már említettük mindig tömegesen előforduló jelenségek és az azokat alkotó egységek vizsgálatával foglalkozik. A statisztikai sokaság a megfigyelés tárgyát képező egyedek összessége, halmaza. A sokaságot alkotó egyedeket a halmaz elemeit a sokaság egységeinek nevezzük. Statisztikai sokaságot alkothatnak élőlények, pl. a magyar felsőoktatás hallgatói, a Magyarországra érkező külföldi turisták, az ország lóállománya; tárgyak, pl. az ország lakásállománya, a kórházakban használt röntgenkészülékek; szervezetek, pl. a magyar főiskolák, ipari vállalkozások; képzett egységek, pl. bruttó hazai termék, gyümölcsfogyasztás stb. Az élőlényekből, tárgyakból, szervezetekből álló sokaságok egyértelműen elkülönülő egységekből állnak. Az ilyen sokaságokat diszkrét sokaságoknak nevezzük. A képzett egységekből álló, ún. folytonos sokaságoknál az egységeket önkényesen határozhatjuk meg. Pl. a sokaság egy egysége: 1 Mrd Ft GDP, 1 kg gyümölcsfogyasztás stb. A statisztikai sokaságok abból a szempontból is különböznek egymástól, hogy csak egy időpontra vonatkozóan vagy csak időtartamra vonatkoztatva 1 2 értelmezhetők. Pl. egy megye népessége a természetes szaporodás (fogyás) és a vándorlási különbözet miatt állandóan változhat. Ezért e 1 Az élveszületések és halálozások különbsége. 2

A statisztika alapfogalmai 3 sokaság csak időpontban (pl. 1995. december 31. 0 óra, 00 perckor) értelmezhető, ragadható meg. Ugyanakkor a Videoton-gyár termelése mivel a termelés egy folyamat időpontban nem, csak egy időtartamban (a termelés egy napon, egy hónapban, egy évben stb.) értelmezhető. Az időpontra vonatkoztatva értelmezhető sokaságokat álló sokaságoknak, az időtartamra vonatkoztatva értelmezhetőket pedig mozgó sokaságoknak nevezzük. A sokaság tartalmazhat véges (a gépkocsiállomány egy adott időpontban és területen) és végtelen (azonos körülmények között tetszőlegesen sokszor megismételhető kísérletek eredményeinek halmaza) elemszámú egyedet. A társadalmi-gazdasági vizsgálatokat általában véges számú egyed megfigyelésével végezzük. A sokaságok fajtáit szemlélteti az 1.1. táblázat: 1.1. táblázat - Példák a sokaságokra A sokaság megnevezése egysége fajtája Zala megye személygépkocsi-állománya 1995. december 31-én egy személygépkocsi diszkrét, álló, véges A lakosság takarékbetétállománya 1995. július 31-én egymilliárd (millió folytonos, álló, véges stb.) Ft betétállomány 1995-ben Nógrád megyében egy gyermek diszkrét, mozgó, véges született gyermekek Magyarország 1995. évi sörfogyasztása egy liter (hektoliter, üveg stb.) sörfogyasztás folytonos, mozgó, véges A statisztika a sokaságot az egyedeken keresztül vizsgálja, ugyanis bármely sokaság az egységei tulajdonságainak felsorolásával jellemezhető. Statisztikai ismérv a statisztikai sokaság egyedeit jellemző tulajdonság. Az ismérv lehetséges kimenetelei az ismérvváltozatok. Ismérv pl. a gépkocsik típusa, fogyasztása, gyártási helye, ipari vállalkozásoknál a foglalkoztatottak száma, a bruttó kibocsátás, a területi elhelyezkedés, a vállalkozás profilja. 2 A megyébe letelepülő és elköltöző népesség különbsége. Ezt az időpontot a megfigyelés eszmei időpontjának szokás nevezni. 3 3

A statisztika alapfogalmai Ismérvváltozatok pl. a gépkocsik típusánál a Lada, Opel stb., az ipari vállalkozások területi elhelyezkedésénél Baranya megye, Békés megye stb., a gépkocsi fogyasztása esetén pedig számadatok. Ha az ismérv csak két változattal rendelkezik, alternatív ismérvnek nevezzük. Ilyen pl. a nem (változatai: férfi, nő). A kettőnél több változattal rendelkező ismérvek is átalakíthatók alternatív ismérvvé. Pl. az aktív keresők évi jövedelme kettőnél több változattal rendelkező ismérv (elvileg annyi változata lehetséges, ahány aktív kereső van), alternatívvá alakítva: legfeljebb 500 000 Ft, ill. 500 000 Ft-nál nagyobb évi jövedelemmel rendelkezők. Egy adott sokaságra vonatkozóan beszélhetünk közös és megkülönböztető ismérvekről. Azokat az ismérveket, amelyek szerint a sokaság egységei egyformák (pl. amelyek a sokaságot definiálják), közös ismérveknek nevezzük. Azokat az ismérveket, amelyek szerint az egyedek különböznek egymástól (ezek alapján a sokaság részsokaságokra bontható), megkülönböztető ismérveknek nevezzük. Ha a megfigyelt sokaságot a Pénzügyi és Számviteli Főiskola Zalaegerszegi Intézete nappali tagozatára 1995. szeptember 11-én beiratkozott I. évfolyamos hallgatók képezik, akkor a definiáló közös ismérvek: a beiratkozás helye (PSZF Zalaegerszegi Intézete), az évfolyam (I.), a beiratkozás időpontja (1995. szept. 11.), megkülönböztető ismérvek pl. a hallgatók neme, iskolai végzettsége, lakcíme, életkora, a felvételi vizsgán elért pontszáma stb. Attól függően, hogy az ismérvváltozatok milyen jellegű információt adnak a sokaság egyedeiről, különböző fajta ismérveket különböztetünk meg. Az ismérvek fajtái: időbeli ismérvek: az egységek időbeli elhelyezésére szolgáló rendező elvek. Ismérvváltozatai: időpontok, időszakok. (Pl. a főiskolai hallgatók születési ideje, a gépkocsik gyártási ideje.) területi ismérvek: az egységek térbeli elhelyezésére szolgáló rendező elvek. Ismérvváltozatai: földrajzi egységek. (Pl. a főiskolai hallgatók lakhelye, a gépkocsik gyártási helye.) minőségi ismérvek: az egyedek számszerűen nem mérhető tulajdonságai. (Pl. a főiskolai hallgatók neme, a gépkocsik típusa.) mennyiségi ismérvek: az egyedek számszerűen mérhető (megszámlálható) tulajdonságai. Ismérvváltozatait ismérvértékeknek nevezzük. (Pl. a főiskolai hallgatók felvételi pontszáma, a gépkocsik fogyasztása.) 4

A statisztika alapfogalmai Mérési szintek A felsorolt ismérvek közül csak a mennyiségi ismérv változatai számadatok. Bizonyos szabályok betartása mellett azonban minden ismérv lehetséges változatai számértékekké alakíthatók. Például a nem ismérvének két változata van: férfi és nő. E változatokhoz számértékeket rendelhetünk: férfi:1; nő:2. Ilyen alapon a sokasági egységek bármilyen tulajdonságának megfigyelése és rögzítése az egységek számokkal való jellemzésének, azaz mérésének tekinthető. A mérés számok meghatározott szabályok szerinti hozzárendelése jelenségekhez (dolgokhoz, tárgyakhoz, eseményekhez), illetve ezek bizonyos tulajdonságaihoz. A hozzárendelési szabályok alapján négy mérési skálát (szintet) különböztetünk meg: névleges skála, sorrendi skála, intervallumskála, arányskála. A névleges (nominális)mérési skála (mérési szint) a számok kötetlen hozzárendelését jelenti. Nominális skálát alkalmazunk a területi és minőségi ismérvek szerinti megfigyeléseknél. E skálán való méréskor a számok (kódszámok) csak a sokaság egyedeinek azonosítására szolgálnak. Ilyen nominális skála pl. a rendszám, irányítószám, biztosítási szám stb. Mivel a számok csak az egyedek azonosítását (megkülönböztetését) szolgálják, közöttük az egyéb relációk (pl. nagyobb, kisebb) nem értelmezhetők, ezért e számokkal végzett különböző számtani műveleteknek semmi értelme nincs. A sorrendi (ordinális) mérési skála a sokaság egyedeinek egy közös tulajdonság alapján való sorba rendezése. Ilyen sorrendi skála pl. a hallgatók osztályzata, a tornászok helyezési sorrendje, az országok hitelképességi sorrendje, a termékek minőségi osztályai stb. A skálán bár a sorszámok közötti különbség azonos (egy-egy) az egyes egyedek nem feltétlenül egyenlő távolságra helyezkednek el egymástól. Az első és második helyre sorolt tornász teljesítménye között pl. nem biztos, hogy ugyanakkora a különbség, mint a negyedik és ötödik helyre sorolté között. A mérésből származó adatokkal (sorszámokkal) ezért csak azok a műveletek végezhetők, amelyek során kizárólag a skálát képező számértékek sorrendisége kerül kihasználásra. Az intervallumskála (különbségi skála) már a szó hagyományos értelmében is mérést jelent, ugyanis a skálaértékek különbségei is valós információt adnak a sokaság egységeiről. Az intervallumskálának egy jellegzetes tulajdonsága, hogy a mértékegység és a nullapont meghatározása önkényes, és e nulla érték nem tükrözi a tulajdonság hiányát. Ilyen skálán mérik például a hőmérsékletet. Ha a skála mértékegysége a Celsius-fok (pl. a Fahrenheit-fok is használatos mértékegység), a skála nullpontja a víz fagyáspontja, és ez nyilvánvalóan nem tekinthető abszolút nullpontnak. A skálán két érték összege vagy aránya nem értelmezhető. Pl. nem mondhatjuk, hogy a + 20 C-os és a + 5 C-os hőmérséklet összege + 25 C, vagy hogy a 20 C-os hőmérséklet kétszerese a 10 C-osnak. Ugyanakkor két-két adat különbsége, a két különbség összege és aránya már értelmezhető. 5

A statisztika alapfogalmai Pl. az 5 C és a 10 C közötti különbség azonos a 15 C és 20 C közötti különbséggel. A 20 C és 30 C közötti különbség kétszerese az előbbi bármelyik különbségnek. Az arányskálán történő mérés a legmagasabb mérési szint nyújtja a legtöbb információt. A skálának valódi nullpontja van, mely nullpont a tulajdonság hiányát jelzi. A skála bármely két értékének aránya független a mértékegységtől. E skálán nyert számokkal a statisztikai elemzésekhez szükséges összes művelet elvégezhető. Arányskálán mért értékek pl. a hosszúság, a jövedelem, a költség, a termelés mennyisége stb. 1.3. Statisztikai adat A statisztikatudomány fontos alapfogalmai közé tartozik a statisztikai adat fogalma. A statisztikai adat valamely statisztikai sokaság elemeinek száma vagy a sokaság valamilyen másféle számszerű jellemzője, mérési eredmény. A statisztikai adat mindig tartalmaz fogalmi jegyeket, időbeli, térbeli vagy másféle azonosítókat és ezek mellett egy számértéket. A statisztikai adat tehát nem pusztán a számérték maga. Statisztikai adat pl.: 1994-ben hazánkban 657 ezer tonna volt az almatermés; Magyarország népessége 1994. január 1-jén 10 277 ezer fő volt; 1992-ről 1993-ra az 1 főre jutó reáljövedelem 5%-kal csökkent. Azokat a statisztikai adatokat, melyekhez mérés vagy számlálás útján jutunk, alapadatoknak nevezzük (almatermés, népesség száma). Két vagy több alapadattal végzett műveletek eredményeként leszármaztatott adatokhoz jutunk. Pl. az ország személygépkocsi-állománya 1992. december 31-én 2 058 334 db, 1993. december 31-én 2 091 623 db volt. E két alapadatból osztással képzett leszármaztatott adat: A személygépkocsi-állomány 1 év alatt 1,016-szeresére, vagyis 101,6%-ra, azaz 1,6%-kal nőtt. Statisztikai mutatószámok: azok a statisztikai adatok (általában leszármaztatott adatok), melyekkel valamilyen rendszeresen megismétlődő (pl. társadalmi, gazdasági) jelenséget statisztikailag jellemezhetünk. Az életszínvonal egyik mutatószáma pl. az 1 főre jutó reáljövedelem, a gazdasági fejlettségé az 1 főre jutó GDP, a termelékenységé az 1 órára jutó termelés stb. A statisztikai vizsgálatok kiindulópontját az alapadatok képezik. Az alapadatokkal szemben többféle követelményt támasztunk. 6

A statisztika alapfogalmai Az adatok legyenek a felhasználás szempontjából elfogadható pontosságúak. Minél pontosabbakaz adatok,annál megalapozottabb döntéseket hozhatunk. Az adatok kellő időben álljanak rendelkezésre. Az adatszolgáltatás gyorsasága ugyanis fontos szerepet játszik a társadalmi-gazdasági folyamatok alakításában. A szükséges adatokhoz a lehető legkisebb ráfordítással (költséggel) jussunk hozzá. E követelményeknek az elfogadható pontosság, a gyorsaság és a gazdaságosság egy időben általában tökéletesen megfelelni nem lehet (például a gyorsaság a pontosság ellen hat). Az alapadatokhoz többféle módon juthatunk. A statisztikai elemzések forrását képezhetik az eredetileg nem statisztikai célra készült kimutatások, nyilvántartások. (Pl. az önkormányzatok lakónyilvántartása, gépkocsik nyilvántartásai, a gazdasági szervezetek különféle számviteli nyilvántartásai stb.) A statisztikai adatok másik forrását az e célra szervezett adatgyűjtések (adatfelvételek) képezik. Az adatgyűjtést (adatfelvételt) minden esetben megelőzi egy olyan adatfelvételi program kidolgozása, melyben a statisztikai tevékenység egészét megtervezzük. Az adatfelvétel végrehajtása előtt a vizsgálat eredményessége szempontjából tisztázni kell a felvétel célját, az adatfeldolgozás, az elemzés és a közlés menetét. Ennek elmaradása használhatatlan alapadatokhoz, téves információhoz vezethet. Az ilyen adatok, információk pedig megalapozatlan, hibás döntéseket eredményezhetnek. Ez csak úgy kerülhető el, hogy a vizsgálat céljának alárendelten tervezzük meg a statisztikai tevékenység teljes folyamatát az adatgyűjtéstől kezdve az adatközlésig. Az adatgyűjtés megtervezésénél dönteni kell arról is, hogy az adatfelvétel a vizsgált sokaság minden egységére kiterjedjen-e, vagy csak a sokaság megfelelő módon kiválasztott részére. Az adatfelvétel, attól függően, hogy a sokaság mekkora részére terjed ki, lehet teljes körű és részleges. A teljes körű felvétel a vizsgált sokaság valamennyi egyedére kiterjed. Ilyen felvételt csak véges elemszámú sokaság esetén lehet megvalósítani. A teljes körű megfigyelések jellegzetes példái a népszámlálások. A részleges felvétel a sokaságnak csak egy kiválasztott részére terjed ki. Végtelen elemszámú sokaság megfigyelése csak részleges adatfelvétellel lehetséges. Véges és nagy számú sokaság esetén is gyakran kerül sor azonban ilyen felvételre. Ennek elsősorban az a magyarázata, hogy a sokaság teljes körű megfigyelése jelentős költséggel jár és időigényes. Egy szakszerűen végzett részleges megfigyelés, amellett hogy olcsóbb és gyorsabb a teljes körű felvételnél, alkalmas a teljes sokaságra vonatkozó következtetések levonására is. A részleges adatfelvétel jellegzetes típusai: a reprezentatív adatfelvétel, a monográfia és egyéb részleges (nem reprezentatív) adatfelvételek. Reprezentatív (mintavételes) adatfelvételnek nevezzük a részleges felvételnek azt a fajtáját, amelynél a megfigyelésbe vont részsokaság kiválasztása meghatározott elvek, módszerek alapján történik, és a kiválasztott részsokaság hűen tükrözi (reprezentálja) az egész sokaságot. A megfigyelt sokaság egészét alapsokaságnak, a kiválasztott részsokaságot mintasokaságnak vagy röviden mintának nevezzük. A mintából származó minden eredményt a sokaság egészének jellemzésére használunk fel, a felvétel részlegessége ellenére a sokaság egészére általánosítjuk. E mintából való következtetés éppen a felvétel részlegessége miatt csak bizonyos hibával valósítható meg, amit mintavételi hibának nevezünk. 7

A statisztika alapfogalmai Ilyen mintavételes adatfelvételt alkalmazunk pl. a lakosság jövedelmének, fogyasztási szokásainak vizsgálatánál, a mezőgazdaságban a várható termésmennyiség becsléséhez, a közvélemény-kutatásoknál stb. A monográfia a sokaság egy vagy néhány kiemelt egyedének részletes statisztikai vizsgálatát jelenti. Ilyen például egy nagyon jó és egy nagyon rossz eredményt elérő bank tevékenységének, gazdálkodásának sokoldalú elemzése. Egyéb, részleges adatgyűjtéssel is találkozhatunk a gyakorlatban. Például, ha egy adott termék (pl. egy mosópor) vásárlói kérdőívet kapnak, és az önként kitöltött és beküldött kérdőíveket feldolgozzák. Az ilyen adatgyűjtések, bár hasznos információkat szolgáltatnak, nem általánosíthatók az alapsokaságra. A részleges felvétel megismert típusai közül a társadalmi-gazdasági statisztika legfontosabb és leggyakrabban használt módszere a reprezentatív megfigyelés. Az adatgyűjtések során általában kérdőíveket használunk, melyek a kérdések mellett a válaszok rögzítésére szolgáló üres rovatokat is tartalmaznak. A kérdőív lehet egyéni kérdőív és lajstrom. Az egyéni kérdőívre egy, a lajstromra több megfigyelési egység adatai kerülnek. A felvétel tárgyát képező sokaság egyedeit megfigyelési egységeknek nevezzük (azon egyedeket tehát, akikre (amikre) vonatkozóan adatokat (információkat) gyűjtünk). Ezek az egyedek nem feltétlenül azonosak az adatszolgáltató, az ún. számbavételi egységekkel. Például állatszámlálás esetén a megfigyelési egységek az egyes állatok, a számbavételi egységek pedig az egyes gazdálkodók, vállalkozók. A kérdőíveket önszámlálás esetén maga az adatszolgáltató tölti ki, kikérdezéses eljárásnál a számlálóbiztosok jegyzik fel a válaszokat. A statisztikai adatfelvételek egyik kulcskérdése a kérdőívek helyes megszerkesztése, ami a módszertani ismeretek mellett az adott terület alapos szakmai ismeretét is igényli. A feltett kérdéseknek egyértelműeknek, közérthetőeknek kell lenniük, és igazodniuk kell a vizsgálat céljaihoz. A nem eléggé körültekintően megfogalmazott kérdések ugyanis a valóságtól eltérő irányba terelhetik a válaszadást. Az előzőekből következik, hogy minden adatfelvétel bizonyos hibalehetőséget rejt magában. Hibát eredményezhet a pontatlan kérdéseket, fogalmakat tartalmazó kérdőív, az adatszolgáltató valóságostól eltérő válaszai, szervezési-végrehajtási hibák. Az eddig leírtakból látható, hogy a statisztikai adatok általában csak korlátozottan pontosak lehetnek. Egyrészt a már említett adatfelvételi hibák szinte elkerülhetetlen fellépése miatt, másrészt az adatfeldolgozás és adatközlés során előforduló hibák miatt. Ezért a valóságos (pontos) adat és a hibákkal torzított mért adat egymástól eltér. A valóságos adat (A) és a mért adat különbségét a statisztikai adat abszolút hibájának nevezzük és a-val jelöljük: A gyakorlatban az abszolút hibát nem tudjuk meghatározni, mivel a valóságos adat (A) nem ismert. Ezért becslést adunk arra a számértékre, amelynél az abszolút hiba biztosan nem nagyobb. 8

A statisztika alapfogalmai Az adott becslést a közelítő érték (mért adat) abszolút hibakorlátjának megadási mód arra utal, hogy a valóságos adat (A) valahol az és nevezzük. Így minden statisztikai adat megadható az módon. Ez a határok között helyezkedik el. A statisztikai adatok módon történő megadása helyett a gyakorlatban igen elterjedt megoldás az is, hogy a statisztikai adatokat bizonyos nagyságrendre kerekítve adjuk meg, azaz a statisztikai adatban számszerűen csak az ún. szignifikáns számjegyek jelennek meg. Szignifikáns számjegyeknek nevezzük azokat a számjegyeket, melyekben még feltétlenül megbízunk, amelyeket még pontosnak fogadunk el. Ha a legutolsó kiírt számjegy helyi értéke akkor az abszolút hibakorlát: Magyarország népességének száma 1994. január 1-jén a Magyar Statisztikai Évkönyv szerint 10 277 ezer fő. A közölt statisztikai adatban a legutolsónak (számszerűen) kiírt szignifikáns számjegy helyi értéke. (Ez a közlési mód azt sugallja, hogy az utolsó három százas, tízes, egyes helyi értékű számjegy nem megbízható (nem szignifikáns), ezért számszerűen nem írjuk ki.) A statisztikai adat (népességszám) abszolút hibakorlátja: Gyakran célszerűbb, kifejezőbb az elkövetett hibát (vagy hibakorlátot) a valóságos (vagy mért) adathoz viszonyítani. Az abszolút hiba (a) és a valóságos adat (A) hányadosát relatív hibának, az abszolút hibakorlát és a mért adat hányadosát a statisztikai adat relatív hibakorlátjának nevezzük. A relatív hibát és a relatív hibakorlátot általában százalékos formában szokták megadni. 9

A statisztika alapfogalmai A népességszám relatív hibakorlátja: Megállapíthatjuk, hogy a fenti példában a statisztikai adat hibája rendkívül kicsi. A korlátozott pontosságú (pontatlan) statisztikai adatokkal végzett minden számítási művelet eredménye ugyancsak korlátozottan pontos (pontatlan) lesz. Ezért mind az adatok kezelésénél, mind a belőlük levont következtetéseknél figyelembe kell vennünk az adatok korlátozott pontosságát. Így elkerülhető például, hogy nem szignifikáns eltérések alapján rangsorolást végezzünk vagy nem valós különbségeket magyarázzunk. 1.4. Statisztikai csoportosítás és összehasonlítás Csoportosítás A statisztikai megfigyelés eredményeként nagy tömegű adathoz jutunk, amely a vizsgált sokaságról különböző ismérvek alapján nyújt széles körű információt, számszerű ismereteket. Ahhoz, hogy a sokaságot, annak összetételét megismerhessük, a sokaságot a különböző ismérvek szerint osztályoznunk, csoportosítanunk kell. A csoportosítás a sokaság felosztása a sokaság egységeit jellemző megkülönböztető ismérv szerint. A csoportosításnál ügyelni kell arra, hogy olyan sokaságrészeket, ún. osztályokat alakítsunk ki, hogy azok átfedésmentesek és teljesek legyenek. E két követelmény együtt azt jelenti, hogy a sokaság minden egysége egyértelműen besorolható legyen valamelyik de csak egy kialakított osztályba. Ha a csoportképző ismérv változatainak száma kevés (pl. ha az aktív keresőket nemek vagy megyék szerint csoportosítjuk), az osztályok képzése nem okoz gondot. Ilyen esetben általában egy ismérvváltozat képez egy osztályt. Ha az ismérvváltozatok száma nagy, az osztályok képzése már nem egyértelmű, és a módszertani ismereteken túl szakmai ismereteket is igényel. (Pl. az aktív keresők foglalkozás, kereset szerinti, vagy a vállalkozások tevékenységtípus szerinti csoportosításánál.) Ha a vállalkozások esetén minden tevékenységtípust felsorolnánk, egy hosszú listát kapnánk, ami nehezen áttekinthető. Ilyen esetben szükség lehet arra, hogy az adott ismérv egynél több változata képezzen egy osztályt. A gyakorlatban ilyen csoportosításoknál általában az ún. nómenklatúrákat szabványnak tekinthető, rendszeres felhasználásra kerülő osztályozási rendszereket alkalmazzák. Az egy ismérv szerinti osztályozás eredménye egy csoportosító sor, melynek általános sémája (1.2. táblázat): 1.2. táblázat - Csoportosító sor általános sémája Osztály Egységek száma 10

A statisztika alapfogalmai Összesen ahol N a csoportképző ismérv alapján képzett i-edik osztály azonosítója, a sokaság osztályba sorolt egységeinek száma, ún. gyakorisága, k : a kialakított osztályok száma, N : a sokaság egységeinek száma. A sémából is látható, hogy a gyakoriságok összege egyenlő a sokaság elemszámával (N). Tehát A csoportképző ismérv fajtájától függően a csoportosító sorok lehetnek: minőségi, mennyiségi, területi és idősorok. A mennyiségi és idősorok képzésével, jellemzőivel a tankönyv 2. fejezetében részletesen foglalkozunk, ezért itt csak a minőségi és területi sort szemléltetjük egy-egy példával. Minőségi sor (1.3 táblázat): 1.3. táblázat - A Magyarországra érkező külföldiek megoszlása az utazás jellege szerint 1993-ban Utazás jellege Külföldiek száma (E fő) Turista 22 804 Kiránduló 11 719 11

A statisztika alapfogalmai Átutazó 6 076 Összesen 40 599 Területi sor (1.4. táblázat): 1.4. táblázat - A népesség megyék szerinti megoszlása 1994. január 1-jén Megye Budapest egyik megyéhez Budapest sem tartozik közigazgatásilag, ezért a statisztikai kiadványokban külön sorban tüntetik fel. Népesség száma (fő) 1 955 696 416 405 538 560 Baranya Bács-Kiskun Békés Borsod-Abaúj-Zemplén Csongrád Fejér Győr-Moson-Sopron Hajdú-Bihar Heves Jász-Nagykun-Szolnok Komárom-Esztergom Nógrád Pest 401 323 743 835 436 639 422 448 426 738 548 942 328 754 418 858 312 295 221 032 964 939 338 245 560 888 12

A statisztika alapfogalmai Somogy 249 938 Szabolcs-Szatmár-Bereg 272 835 Tolna 377 531 Vas 301 067 Veszprém Zala Összesen 10 276 968 Az egy ismérv szerinti csoportosítás a sokaságról kevés információt nyújt, ezért gyakran alkalmazzuk az ún. kombinatív csoportosítást. Ennek lényege, hogy az egyik ismérv szerint képzett osztályokon belül egy másik ismérv szerint is csoportosítunk. Pl. a lakott lakásokat csoportosítjuk területi elhelyezkedés és komfortfokozat szerint (a megfigyelés időpontja:1990. január 1.). K: komfortos, FK: félkomfortos, KN: komfort nélküli. A kombinatív csoportosítással kapott adatokat táblázatba is rendezhetjük, statisztikai táblát készíthetünk. Ennek részleteiről a 3. fejezetben lesz szó. 13

A statisztika alapfogalmai Összehasonlítás A mindennapi életben és a statisztikai elemző munkában is gyakran találkozunk az összehasonlítás mozzanatával. Az összehasonlítás két vagy több statisztikai adat egymáshoz való viszonyítása. Az összehasonlítás az adatok egyszerű összevetésén túl általában különbség és hányados képzésével történik. Pl. Az ATS devizaszámla kamata az IBUSZ Banknál 1995. június 23-án 3,437%, július 23-án 3,375% volt. Az adatok puszta összevetése alapján azt tudjuk megállapítani, hogy a devizaszámla kamata csökkent. Ha a változás nagyságára is kíváncsiak vagyunk, akkor a két időpont kamatának a különbségét vagy hányadosát számítjuk ki. A két szám különbsége: A két szám hányadosa: A devizaszámla kamata 0,062 százalékponttal, illetve 1,8 százalékkal csökkent. Két százalékban (ezrelékben) kifejezett adat (mutatószám) különbségének mértékegységét százalékpontnak(ezrelékpontnak) szokás nevezni. (A kamatváltozás mértékét a gyakorlatban általában százalékpontban adják meg.) Az összehasonlítandó adatokat is statisztikai sorba rendezhetjük. Az így képzett sorokat összehasonlító soroknak nevezzük, melyeket a csoportosító sorokhoz hasonlóan az ismérvek fajtája szerint is megkülönböztethetünk. A különböző időpontokban megfigyelt devizaszámla-kamatokat sorba rendezve idősort képezhetünk (1.5. táblázat). 1.5. táblázat - Az ATS devizaszámla kamatának alakulása az IBUSZ Banknál Időpont Kamat (%) 1995. június 23. 3,437 július 23. 3,375 Az összehasonlító területi sor pedig a különböző földrajzi területeken végzett megfigyelések eredményeit rögzíti. Az 1.6. táblázat ilyen sort szemléltet. 1.6. táblázat - Az 1 főre jutó GDP néhány európai országban 1993-ban Ország 1 főre jutó GDP (USD) 14

A statisztika alapfogalmai Albánia 340 Ausztria 23 120 Hollandia 20 710 Lengyelország 2 020 Magyarország 3 300 Németország 23 560 Portugália 7 890 Románia 1 120 Spanyolország 13 650 Svájc 36 410 Szlovákia 1 900 1.5. Viszonyszámok A csoportosított, sorba rendezett adatok elemzésének egyik legegyszerűbb eszköze a viszonyszám. A viszonyszám két egymással logikai kapcsolatban álló statisztikai adat hányadosa. Képlettel: ahol V: a viszonyszám, A: a viszonyítás tárgyát képező adat, amit viszonyítunk, B: a viszonyítás alapját képező adat, amihez viszonyítunk. A viszonyszámokat számíthatjuk azonos fajta (azonos mértékegységű) és különböző fajta (általában különböző mértékegységű) adatokból. 15

A statisztika alapfogalmai Az azonos fajta adatokból számított viszonyszámok azt fejezik ki, hogy egyik adat hányszorosa a másiknak. Jellegzetes fajtái a megoszlási, a koordinációs és a dinamikus viszonyszámok. A megoszlási viszonyszám a sokaság egyes részeinek a sokaság egészéhez viszonyított arányát fejezi ki. 1.7. táblázat - A 2024 év közötti népesség nemek szerinti megoszlása 1994. január 1-jén Nem Népesség száma (fő) Férfi 372 425 Nő 354 289 Összesen 726 714 Az 1.7. táblázat szerinti minőségi sorból számítható megoszlási viszonyszámok: a férfiak aránya: a nők aránya: A 2024 év közötti népesség 51,2%-a férfi, 48,8%-a nő volt 1994. január 1-jén. A koordinációs viszonyszám a sokaság két részadatának hányadosa. A 1.7. táblázat adataiból számítható koordinációs viszonyszámok: 1000 férfira jutó nők száma: 1000 nőre jutó férfiak száma: A dinamikus viszonyszám két időszak (időpont) adatának hányadosa. 16

A statisztika alapfogalmai 1.8. táblázat - A német márka (DEM) eladási árfolyamának alakulása az OTP Banknál Időpont Árfolyam (Ft/DEM) 1994. július 10. 66,12 1995. július 10. 90,76 Dinamikus viszonyszám: (az 1.8. táblázat adataival számolva). A német márka eladási árfolyama 1 év alatt 37,3%-kal nőtt. A különböző fajta, általában különböző mértékegységű adatokból számított viszonyszámokat intenzitási viszonyszámoknak nevezzük. Az intenzitási viszonyszámok azt fejezik ki, hogy egyik mennyiségből (számláló) mennyi jut a másik mennyiség (nevező) egy egységére. E viszonyszámok általában két egymással valamilyen kapcsolatban álló sokaság nagyságának adatából képzett hányadosok. Pl. 1994. január 1jén a lakások száma 3955 ezer db, a lakásokban felszerelt távbeszélő-állomások (telefonok) száma 1 134 884 db volt. Az intenzitási viszonyszám az 1000 lakásra jutó távbeszélő-állomások száma: A különböző fajta, különböző mértékegységű de egymással kapcsolatban álló adatokat is statisztikai sorba rendezhetjük. Az így képzett sort leíró sornak nevezzük. A leíró sorokat általában abból a célból készítjük, hogy valamilyen társadalmi-gazdasági egységet (pl. egy országot, egy vállalkozást, egy intézményt stb.) vagy jelenséget (pl. az egészségügyi ellátást, a külkereskedelmet stb.) jellemezzünk. E sortípust az alábbi példával szemléltetjük (1.9. táblázat). 1.9. táblázat - Magyarország 1993. évi idegenforgalmát jellemző adatok Megnevezés Adat Külföldre utazó magyarok száma (E fő) 12 115 Magyarországra érkező külföldiek száma (E fő) 40 599 ebből turisták (E fő) 22 804 Idegenforgalom bevétele (M Ft) 110 312 17

A statisztika alapfogalmai Idegenforgalom kiadása (M Ft) 68 961 1.6. Átlagok A viszonyszámok mellett talán a leggyakrabban használt elemzési eszközök az átlagok, melyeket középértékeknek is szokás nevezni. Az átlagokat azonos fajta adatok halmazának tömör, számszerű jellemzésére használjuk. Ilyen halmazt képezhetnek például a mennyiségi ismérv értékei, az idősor adatai, a viszonyszámok stb. Az adatok jellegétől függően az átlagukat számtani, harmonikus, mértani vagy négyzetes átlaggal számíthatjuk ki. Az egyes átlagok alkalmazási területeivel tankönyvünk későbbi fejezeteiben ismerkedünk meg. Az átlagszámítás során az átlagolandó értékeket a következő módon jelöljük: ahol: N : a megfigyelt átlagolandó értékek száma, az i-edik átlagolandó érték. A különböző átlagok kiszámítását az alábbi, adatból álló számpéldával is szemléltetjük: 2, 6, 4, 2, 6, 4, 6, 2, 5, 6. Számtani átlag A számtani átlag (jele: ) az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok összege változatlan marad. Tehát Ebből a számtani átlag: Adataink alapján: 18

A statisztika alapfogalmai Mivel az átlagolandó értékek között azonos értékek is előfordulnak, ezért a következő formában is kiszámíthatjuk az átlagot: Az alapadatokat áttekinthető formába rendezve csoportosító sort kapunk. (Ennek sémáját az 1.2. táblázatban mutattuk be.) Az egyforma átlagolandó értékeket egy osztályba sorolva k számú csoportot képezünk. Ezért a továbbiakban a szummázás értékkel dolgozunk, de ezeket csoportba soroltuk be.) Átlagolandó értékek száma (gyakorisága) 2 3 4 2 5 1 6 4 Összesen 10 A csoportosító sor sémájában bevezetett jelölések szerint: ahol: k : az egymástól különböző átlagolandó értékek száma, a gyakoriságok, melyeket az átlagszámítás során súlyoknak nevezünk. Ezt a számítási formát súlyozott formának nevezzük. 19 -ig terjed. (Továbbra is 10 átlagolandó

A statisztika alapfogalmai A számtani átlag nagysága nem változik, ha a súlyokat (gyakoriságokat) egy konstans számmal megszorozzuk vagy elosztjuk. Ha a gyakoriságokat elosztjuk az átlagolandó értékek számával (N), megoszlási viszonyszámokat kapunk, melyeket Jellemző, hogy Példánkban: 2 0,3 4 0,2 5 0,1 6 0,4 Összesen 1,0 Könnyű belátni, hogy az átlagot e megoszlási viszonyszámok alapján is számíthatjuk. Számszerűen: Az előző számítási módból látható, hogy a számtani átlag nagyságát két tényező befolyásolja: a) az átlagolandó értékek abszolút nagysága. 20 -vel jelölünk:

A statisztika alapfogalmai Az átlag mindig a legkisebb és legnagyobb érték közé esik: b) A súlyok viszonylagos nagysága, a súlyarányok. A súlyarányokon múlik, hogy az átlag az intervallumban hol helyezkedik el. Ha a kisebb átlagolandó értékeknek nagyobb a súlyaránya, akkor az átlag az intervallum alsó, ha a nagyobb átlagolandó értékeknek nagyobb a súlyaránya, akkor az átlag az intervallum felső határához esik közelebb. A fenti megállapítások nemcsak a számtani átlagra, hanem a később ismertetendő átlagfajtákra is igazak. A számtani átlag tulajdonságai: 1. Az átlagolandó értékek és a számtani átlag különbségeinek algebrai összege nulla. Ez azt jelenti, hogy ha minden átlagolandó értéket a számtani átlaggal helyettesítünk, akkor e helyettesítéssel elkövetett eltérő előjelű hibák (különbségek) összességükben kiegyenlítik egymást. E tulajdonság könnyen belátható: mert az átlag definíciója szerint 2. Ha az átlagolandó értékekből levonunk egy konstans számot (A)és a különbségeket négyzetre emeljük, akkor ezen négyzetek összege (vagy ahogy mondani szokták: az eltérések négyzetösszege) akkor lesz a legkisebb, ha a konstans a számtani átlaggal azonos. Tehát Az átlag e tulajdonságát négyzetes minimum tulajdonságnak nevezzük. 21

A statisztika alapfogalmai A tulajdonság úgy bizonyítható, hogy az eltérés-négyzetösszegnek mint A-nak a függvénye ott lehet minimális, ahol az első derivált nulla: Ebből: Mivel pozitív, az valóban minimális. 3. Ha az átlagolandó értékek mindegyikéhez ugyanazt az A állandót hozzáadjuk, akkor a számtani átlag éppen ezen A állandóval változik meg. Tehát, ha ( ), akkor. Ugyanis 4. Ha az átlagolandó értékeket egy B állandóval megszorozzuk, a számtani átlag is B-szeresére változik. Tehát, ha ( ), akkor Ugyanis Harmonikus átlag Aharmonikus átlag (jele: )az a szám, amellyel az egyes átlagolandó értékeket helyettesítve azok reciprokainak összege változatlan marad. 22