Statisztika 3. Dr Gősi Zsuzsanna Egyetemi adjunktus
Koncentráció mérése Koncentráció általában a jelenségek tömörülését, összpontosulását értjük. Koncentráció meglétéről gyorsan tájékozódhatunk, ha sokaságot egy mennyiségi ismérv alapján csoportosítjuk. A koncentráció számításánál un. relatív gyakoriságot és a relatív értékösszeget számolhatjuk.
A városok népességmegoszlása 1997-ben Népesség (fő) Városok száma 2000-4999 20 5000-9999 61 10000-49999 105 50000-99999 11 100000-8 Összesen 205
Koncentráció erőssége Erős koncentráció, ha a sokaság nagy hányadához a teljes értékösszeg kis hányada tartozik vagyis a sokaság kis hányada az értékösszeg jelentős hányadát tudhatja magáénak. A koncentrációt ábrázoló görbe: a Lorenz görbe
Csoportosított adatok átlaga, szórása
Átlagok Statisztika vizsgálat során feltételezzük, hogy a sokaság homogén. Heterogén sokaságot esetében viszonylag egyszerűen, valamilyen ismérv alapján homogén részekre bonthatjuk.
A sportra fordított napi időmennyiség Megoszlás (%) Napi átlagos idő (óra) Megnevezés Megkérde- zettek száma A sportolás időtarta- mának szórása férfi 120 60 3 1,5 nő 80 40 2 0,5
Szórás Belső szórás: a csoportokon belüli szórást mutatja Külső szórás: csoportok átlagainak szórása Teljes szórás: a két tényező együttes értéke
Kapcsolatvizsgálatok Független Sztochasztikus a kapcsolat valószínűsíthető Asszociációs mindkét ismérv minőségi Vegyes az ok minőségi az okozat mennyiségi Korrelációs mindkét ismérv mennyiségi Determinisztikus
Intenzitás mérőszáma A T mutató fejezi ki a kapcsolat erősségét Az értéke -1 és +1 között lehet az előjel a kapcsolat irányát mutatja A mutatószám értékei a következőket fejezhetik ki 0 nincs kapcsolat 0 < T < 0,3 gyenge a kapcsolat 0,3 < T < 0,7 közepes szorosságú kapcsolat 0,7 < T < 1 erős kapcsolat 1 függvényszerű vagy determinisztikus kapcsolat
A felmérés eredménye Játékhely A vizsgálat eredménye Összesen Győzelem Vereség Otthon 39 9 48 Idegenben 11 21 32 Összesen 50 30 80
Kontigenciatábla Ismérv B ismérv változatai Összesen változatai B B A 1 f 11 f 12 S 1 A 2 f 21 f 22 S 2 Összesen O 1 O 2 n
Idősorok elemzése
Idősor elemzés A klasszikus idősor elemzés abból a feltételezésből indul ki, hogy az idősort egy tartós, hosszú távú tendencia (trend), szabályos hullámmozgások, periodikus ingadozások (szezonalitás) határozzák meg és ezektől eseti, egyenként nem jelentős eltérítő hatást vált ki a véletlen ingadozás.
Az idősor elemzés eszközei Grafikus ábrázolás: lehetővé teszi a fő tendenciák vonások felismerését. Bázis ill. láncviszonyszámok az idősorok gyors, előzetes elemzésére szolgál. Egyszerűbb eszközök az un. átlagok Számtani átlag Kronologikus átlag
Kronologikus átlag Egy adott időszak korrekt jellemzéséhez vizsgált időszakon éven kívüli megfigyelés is szükséges, de az első és utolsó megfigyelés csak fél súllyal szerepel. Képlete y k t y y... 1 2 2 n1 n 1 y y 2 n
Január 48 Létszámadat a 2006-os évre Hónapok vonatkozóan Alkalmazottak száma Január 50 Február 55 Március 62 Április 48 Május 56 Június 60 Július 58 Augusztus 52 Szeptember 48 Október 49 November 52 December 51
Idősorok összetevői Trend vagy alapirányzat egy határozottan jelentkező tendencia Periodikus ingadozás rendszeresen ismétlődő hullámzás (pl idegenforgalom, gázfogyasztás) Véletlen ingadozás szabálytalan mozgás /Idősor elemzés esetén ezt a három hatást kell elkülöníteni/
Idősorok kapcsolata Additív kapcsolat az idősor a trend hatás a periodikus hatás és a véletlen ingadozás összege Multiplikatív kapcsolat az idősor érték a három tényező szorzata
Két fő módszere Mozgó átlagok módszere többszörös átlagolás Analitikus trendszámítás az idősort matematikai függvénnyel fejezzük ki Lineáris (egyenes) függvény Exponenciális függvény Másodfokú polinom Logisztikus görbe
Lineáris trendfüggvény y t 0 1 b b t b 1 t t t y t t 2 y b 0 y b t 1
Olimpia résztvevők adatai Összesen 104 216 Helyszín Év Résztvevők száma London 1948 4 092 Helsinki 1952 5 429 Melbourne 1956 3 178 Róma 1960 5 313 Tokió 1964 5 133 Mexikóváros 1968 5 498 München 1972 7 121 Montreal 1976 6 043 Moszkva 1980 5 283 Los Angeles 1984 6 802 Szoül 1988 8 473 Barcelona 1992 9 368 Atlanta 1996 10 322 Sydney 2000 11 651 Athén 2004 10 500
Indexszámítás
Alapvetés Bevétel = egységár x mennyiség Jelölése v = p x q Egyedi indexek Egyedi árindex i p Egyedi volumenindex Egyedi értékindex p p 1 0 i v iq p q p 1 0 q 1 q q 0 1 0
Egy stadion bevételi adatai Megnevezés Szeptember Szeptember Október November Egységár Mennyiség Egységár Mennyiség p 0 q 0 p 1 q 1 Belépőjegy 800 5000 880 4000 Reklám- felület 8000 100 7200 120