Statisztika 1 előadás
Témakörök Statisztikai alapfogalmak Statisztikai sorok Mennyiségi sorok csoportosítása Statisztikai táblák
Statisztika fogalma Gyakorlati tevékenység Adatok összessége Módszertan A statisztika, mint gyakorlati tevékenység a tömegesen előforduló jelenségek egyedeire vonatkozó információk gyűjtése, feldolgozása és elemzése, illetve ennek alapján a vizsgált jelenség egészének tömör, számszerű jellemzése
Statisztikai tevékenység ágai Statisztikai tevékenység ágazatai: Népességstatisztika: az emberi népességre vonatkozó adatok gyűjtése, feldolgozása, elemzése; Gazdaságstatisztika: gazdasági élet egészének legfőbb, számszerű mozzanatai (makro jellegű); Ágazati statisztikák: egyes népgazdasági ágak adatai (mikro jellegű); Vállalati, üzemi statisztika; Társadalomstatisztika: társadalmi élet nem gazdasági területeivel foglalkozik
A statisztikai munka fázisai Tervezés: a statisztikai munka céljának definiálása Adatgyűjtés: Kikérdezés (személyes interjú, telefon, posta) Megfigyelés Kísérlet Feldolgozás: adatok ellenőrzése, helyesbítése Elemzés: matematikai és logikai műveletek
Statisztikai alapfogalmak Sokaság: a statisztikai megfigyelés tárgyát képező egyedek összessége Sokaság típusai: Diszkrét sokaság: elkülönülő egységekből áll Folytonos sokaság: egységeit csak önkényesen lehet elkülöníteni egymástól Álló (stock) sokaság: a sokaságot időpontra vonatkozóan értelmezhetjük Mozgó (flow) sokaság: a sokaságot időtartamra vonatkozóan értelmezhetjük Véges számosságú sokaság Végtelen számosságú sokaság
Statisztikai alapfogalmak Statisztikai ismérv: A statisztikai ismérv a statisztikai sokaság egységeit jellemző tulajdonság Az ismérv lehetséges kimenetelei az ismrévváltozatok Típusai: Időbeli: időpont vagy időtartam megnevezéséből áll Területi: földrajzi megjelölés, pl: ország, megye, város, község Minőségi: pl nem, foglalkozás, hajszín Mennyiségi (számmal): pl életkor, testmagasság, lábméret Fajtái: diszkrét folytonos Közös Megkülönböztető
Példa: sokaság definiálása 2009 október 2-án a ME posztgraduális képzésben részt vevő hallgatói Statisztika előadáson az A/1 épületben Ismérv Közös Megkülönböztető Minőségi Posztgraduális képzés, magyar, egyetemista Szak, munkahelyi beosztás, nem, hajszín, Mennyiségi van 1 diplomája testmagasság, életkor felvett kreditek száma, Időbeli 2009 10 02 születési idő, érettségi időpontja Területi Miskolc, A/1 születési hely, lakhely
Statisztikai sokaság Sokaság: A Magyarországra érkező nyugat-európai turisták 2010 nyarán Ismérv típusa Közös Megkülönböztető Minőségi Mennyiségi Időbeli Területi
Statisztikai adat Statisztikai adat: A statisztikai adat valamely statisztikai sokaság tagjainak a száma vagy a sokaság valamilyen másféle számszerű jellemzője Típusai: Abszolút adatok Leszármaztatott adatok Mutatószámok: Azok az adatok, amelyekkel valamilyen rendszeresen megismétlődő társadalmi, gazdasági jelenséget statisztikailag jellemezni szoktunk
Mérési skálák A mérés a számok meghatározott szabályok szerinti hozzárendelése jelenségekhez (dolgokhoz, eseményekhez, tárgyakhoz), illetve ezek bizonyos tulajdonságaihoz Mérési skálák típusai: névleges skála, sorrendi skála, intervallum skála, arány skála
Nominális skála Jellemzői: A számok, megjelölések kötetlen hozzárendelését jelenti A számok, jelölések csak a sokaság egyedeinek azonosítására szolgálnak A legegyszerűbb és legkevésbé informatív mérési fokozat Semmi értelme sincs a kódszámok hányadosának vagy különbségének, sőt még azok nagyságrendjének sem Az egységekhez tartozó számértékeknek nincs mértékegysége Például: Az évfolyam hallgatóinak születési hely, nem, hajszín, stb alapján történő csoportosítása Két emberről csak annyit mondhatunk, hogy egyforma vagy nem
Ordinális skála Jellemzői: Az egységek a tulajdonságok szerint rangsorba állíthatók (Nemcsak azt mutatja, hogy két ember azonos vagy különböző, hanem pl: nagyobb, konzervatívabb, vallásosabb, stb) A skálaértékek bármilyen számértékek lehetnek számértékek nem hordoznak információt Nincs értelme a skálaértékkel végzett műveleteknek Például: (Egy társaságban a résztvevőket megkérjük, iskolai végzettség szerint álljanak csoportokba A csoportokat elrendezhetjük: általános, közép és felsőfokú végzettségűekből állókra Fontos, hogy a csoportok távolságának nincs jelentősége, állhatnak 5, 10, vagy 50 méterre egymástól)
Intervallumskála Jellemzői: A mennyivel több / nagyobb kérdésre is válasz tudunk adni A skálaértékek különbségei valós információt nyújtanak a sokaság egységeiről Skálaértékek különbségei is tényként kezelhető információt nyújtanak A skáláknak már van mértékegysége is A skála kezdőpontja a 0 pont önkényes Például: A rangsorba rendezett tulajdonságokat egyenlő közök választják el (Pl: IQ tesztek: 100-110, 110-120: egyenlő távolságok (Két ember összehasonlításánál mondhatjuk, hogy különböznek egymástól (nominális), egyik nagyobb a másiknál (ordinális) és meg tudjuk mondani, hogy mennyivel (intervallum)
Arányskála Jellemzői: A legtöbb információt nyújtó skála A kezdőpont egyértelműen adott és rögzített, s így a skálaértékek egymáshoz való aránya is meghatározható (életkor, jövedelem, stb)
Statisztikai csoportosítás A csoportosítás a sokaság felosztása a sokaság egységeit jellemző megkülönböztető ismérv szerint Bármely osztályozástól elvárható: teljesek legyenek átfedésmentesek homogén osztályokat eredményezzen Azt a tulajdonságot, amely szerint a sokaságot csoportosítjuk, csoportképző ismérvnek nevezzük A csoportosítás típusai az ismérvek fajtái szerint: Időbeli csoportosítás: a statisztikai adatokat időszakok vagy időpontok szerint rendezzük Területi csoportosítás: a statisztikai adatokat területi (földrajz) tulajdonság szerint rendezzük Minőségi csoportosítás: a statisztikai adatokat minőségi megjelölés szerint rendezzük Mennyiségi csoportosítás: a statisztikai adatokat a számszerűen kifejezhető tulajdonságaik szerint rendezzük
Statisztikai csoportosítás Csoportosítás típusai: Időbeli Területi Minőségi mennyiségi Osztály Egységek száma C 1 f 1 C 2 f 2 C k Összesen f k N
Statisztikai sorok Statisztikai adatoknak meghatározott összefüggésben, valamilyen meghatározott ismérv szerinti felsorolása A sort létrehozó összefüggés származhat: Egy sokaság osztályozásából, Egy sokaság térbeli/időbeli összehasonlításából, Egyazon jelenséghez tartozó többféle sokaság felsorakoztatásából
Statisztikai sorok Típusai: Csoportosító sor: Egy fősokaság és a megfelelő részsokaságok nagyságát adja meg Tartozéka az összegző adat Azonos fajta és azonos mértékegységű adatokat tartalmaz Összehasonlító sor: A felsorolás célja kifejezetten az időbeli vagy a térbeli összehasonlítás Ez is azonos fajta és mértékegységű adatokat tartalmaz, de azok általában nem adhatók össze Leíró sor: Általában különbözőfajta, különböző mértékegységű adatokat tartalmaz, amelyek mindegyike egy meghatározott jelenségre, társadalmi vagy gazdasági egységre vonatkozik, azt több különböző szempontból jellemzi
Leíró sor (példa) Magyarország népességére és gazdaságára vonatkozó adatok (2004) Megnevezés A mutató értéke Terület (km 2 ) 93030 Népesség (ezer fő) 10098 Munkanélküliségi ráta (%) 6,1
Összehasonlító sorok
Idősorok Az idősorok a jelenségek, folyamatok időbeli alakulását mutatják, és lehetővé teszik statisztikai adatok időbeli összehasonlítását Típusai: Tartam idősor: valamilyen időtartam alatt történt folyamat alakulását mutatja, a mozgó sokaságokra vonatkozó adatokat kapcsolja egymáshoz Az adatai általában összegezhetőek Állapot idősor: a különböző időpontokra vonatkozólag végrehajtott időponti felvételek eredményeit sorolja fel, állósokaságokra vonatkozó adatokat kapcsol egymáshoz, adatai nem adhatóak össze
Idősorok (példa állapot idősorra) Magyarország népessége a népszámlálások eszmei időpontjában, fő Év Népesség száma 1970 10322 1980 10709 1990 10709 2001 10214
Idősorok (példa összehasonlító tartam idősorra) A házasságkötések számának alakulása Magyarországon Forrás: Ksh Év A házasságkötések száma (db) 2000 48110 2001 43583 2002 46008 2003 45398 2004 43791 2005 44234
Idősorok (példa csoportosító tartam idősorra) Egy kiskereskedelmi bolt forgalmának negyedéves adatai 2005-ben Negyedév Forgalom (eft) I 3880 II 4020 III 3975 IV 4665 Év összesen 16540
Területi összehasonlító sorok A GDP volumenének évi átlagos növekedési üteme 2001-2005 (%) Ország Évi átlagos növekedési ütem Csehország 3,5 Horvátország 4,7 Magyarország 4,2 Szlovénia 3,4 Forrás: Ksh
Területi csoportosító sorok A felsőoktatási intézmények száma a magyarországi régiókban (db), 2006/2007 Régió Intézmények száma Észak- Magyarország 5 Közép-Dunántúl 8 Összesen 71 Forrás: Ksh
Csoportosító sorok
Minőségi csoportosító sorok Magyarországon a vendéglátóhelyek száma, db (2005) Üzlettípus Vendéglátóhelyek száma Étterem, cukrászda 36648 Munkahelyi vendéglátóhely 5819 Bár, borozó 13827 Összesen 56294 Forrás: Ksh
Minőségi összehasonlító sorok Magyarországon a férfiak és a nők születéskor várható átlagos élettartama (2005) Forrás: Ksh Nem Születéskor várható átlagos élettartam (év) Férfi 68,6 Nő 76,9
Mennyiségi sorok A dolgozók kereset szerinti megoszlása Kereset (eft) Dolgozók száma (fő) -100 9 100,1-140 12 140,1-180 2 180,1-220 1 220,1-1 Összesen 25
Mennyiségi sorok Jellemzői: A statisztikai adatok elemzésének egyik leggyakoribb esete A statisztikai sokaság mennyiségi ismérv szerinti csoportosításának eredménye A csoportosítást számszerűen meghatározott ismérv alapján végezzük A mennyiségi sor mindig két számsort tartalmaz, amelyikből az egyik mindig a mennyiségi ismérv változatait fejezi ki
Példa mennyiségi sorokra Egy vállalkozás 20 dolgozójának havi nettó átlagkeresetének rangsora (eft): 60 60 60 80 80 80 100 100 100 100 120 120 120 120 120 130 130 130 140 140
Gyakorisági sor A gyakoriság azt mutatja, hogy a mennyiségi ismérv szerint képzett egy-egy osztályba (osztályközbe) a sokaságnak hány egysége tartozik A gyakorisági sorok általános sémája Ismérvérték X i Gyakoriság f i X 1 f 1 X 2 f 2 X i X k Összesen f i f k N
Gyakorisági sor (példa alapján) A vállalat dolgozóinak havi nettó kereset szerinti megoszlása Nettó átlagkereset (eft) x i Létszám (fő) f i 60 3 80 3 100 4 120 5 130 3 140 2 Összesen 20
Relatív gyakorisági sor A relatív gyakoriságok azt mutatják, hogy a mennyiségi ismérv szerint képzett egy-egy osztályba (osztályközbe) a sokaságnak hányad része (hány százaléka) tartozik Képlete: g i = f i N (i = 1,, Az eloszlás, illetve a megoszlás, azt mutatja meg, hogy az ismérvértékek hogyan oszlanak meg az egyes osztályok között A gyakorisági sorok általános sémája: Ismérvérték X i k) Relatív gyakoriság g i (%) X 1 g 1 X 2 g 2 X i g i X k g k Összesen 100
Relatív gyakorisági sor (példa alapján) A vállalat dolgozóinak havi nettó kereset szerinti megoszlása Nettó átlagkereset (eft) x i Létszám (fő) f i Relatív gyakoriság g i (%) 60 3 3 = 15 g 1 = 20 80 3 15 100 4 20 120 5 25 130 3 15 140 2 10 Összesen 20 100
Értékösszeg sor Az értékösszegsor a mennyiségi ismérv alapján kialakított osztályokhoz (osztályközökhöz) az azokba tartozó egységek ismérvértékeinek összegét rendeli Képlete: s i =f i * x Az értékösszegsor általános sémája Ismérvérték X i Étékkösszeg s i X 1 s 1 X 2 s 2 X i X k Összesen s i s k s
Értékösszeg sor (példa alapján) A vállalat dolgozóinak havi nettó kereset szerinti megoszlása Nettó átlagkereset (eft) x i Létszám (fő) f i Értékösszeg eft 60 3 s 1 = 3 60 = 180 80 3 240 100 4 400 120 5 600 130 3 390 140 2 280 Összesen 20 2090
Relatív értékösszeg sor Relatív értékösszegen egy olyan megoszlási viszonyszámot értünk, amely az egyes osztályok (osztályközök) értékösszegét (S i ) a teljes értékösszeghez (S) viszonyítja Képlete: z i = k s i=1 i s i = s s i Az értékösszegsor általános sémája Ismérvérték X i Relatív értékösszeg (%) Z i X 1 z 1 X 2 z 2 X i z i X k z k Összesen 100
Relatív értékösszeg sor (példa alapján) A vállalat dolgozóinak havi nettó kereset szerinti megoszlása Nettó átlagkereset (eft) x i Értékösszeg Ft Relatív értékösszeg % 180 2090 60 180 z 1 = = 8,6 80 240 11,5 100 400 19,1 120 600 28,7 130 390 18,7 140 280 13,4 Összesen 2090 100,0
Kumulált gyakorisági és relatív gyakorisági sorok A kumulált gyakoriságok (jele: f i ), illetve kumulált relatív gyakoriságok (jele: g i ) adatai azt mutatják, hogy az adott értéknek megfelelő és annál kisebb ismérvértékek hányszor (f i ), illetve milyen arányban (g i ) fordulnak elő A kumulált gyakorisági, illetve kumulált relatív gyakorisági sort úgy képezzük, hogy a gyakoriságokat (f i ), illetve relatív gyakoriságokat (g i ) rendre halmozva összeadjuk
Kumulált gyakorisági és relatív gyakorisági sorok (példa alapján) A vállalat dolgozóinak havi nettó kereset szerinti megoszlása Nettó átlagkereset (eft) x i Létszám (fő) f i f i Relatív gyakoriság g i (%) g i 60 3 3 15 15 80 3 6 15 30 100 4 10 20 50 120 5 15 25 75 130 3 18 15 90 140 2 20 10 100 Összesen 20-100 -
Kumulált értékösszeg és relatív értékösszeg sorok (példa alapján) A vállalat dolgozóinak havi nettó kereset szerinti megoszlása Értékösszeg eft s i Ft Relatív értékösszeg % z i % 180 180 8,6 8,6 240 420 11,5 20,1 400 820 19,1 39,2 600 1420 28,7 67,9 390 1810 18,7 86,6 280 2090 13,4 100,0 2090-100,0 -
Statisztikai táblák A statisztikai sorok összefüggő rendszere Formai követelmények: Cím A tábla fej- és oldalrovata egyértelműen írja le az ismérvváltozatokat Forrás Adatok magyarázata
Statisztikai táblák Táblák csoportosítása: Rendeltetés szerint: Feldolgozói Közlési Munkatábla Csoportosítás szerepe szempontjából: Egyszerű Csoportosító Kombinációs
Egyszerű tábla Magyarország népességére és gazdaságára vonatkozó adatok (2004) Megnevezés A mutató értéke Terület (km 2 ) 93030 Népesség (ezer fő) 10098 Munkanélküliségi ráta (%) 6,1 Forrás: Ksh
Csoportosító tábla A felsőoktatási intézmények száma a magyarországi régiókban (db), 2006/2007 Régió Intézmények száma Közép-Magyarország 39 Közép-Dunántúl 8 Nyugat-Dunántúl 4 Dél-Dunántúl 3 Észak- Magyarország 5 Észak-Alföld 6 Dél- Alföld 6 Összesen 71 Forrás: Ksh
Kombinációs tábla A Stat Kft dolgozóinak megoszlása nemek szerint, fő Végzettség Dolgozók neme Férfi Nő Összesen Vezető 3 2 5 Beosztott 4 12 16 Összesen 7 14 21
Köszönöm a figyelmet!