Kvantitatív elemzési módszerek

Hasonló dokumentumok
Korrelációs kapcsolatok elemzése

5. Előadás. Grafikus ábrázolás Koncentráció elemzése

Kvantitatív statisztikai módszerek

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet

A sokaság/minta eloszlásának jellemzése

Függetlenségvizsgálat, Illeszkedésvizsgálat

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Az idősorok összetevői Trendszámítás Szezonalitás Prognosztika ZH

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Grafikus ábrázolás. 3. előadás. Statisztikai szoftver alkalmazás.

1. előadás Horváthné Csolák Erika

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Bevezetés. 1. előadás. Statisztikai szoftver alkalmazás.

Sta t ti t s i zt z i t k i a 3. előadás

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Bevezető Mi a statisztika? Mérés Csoportosítás

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok


Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

[GVMGS11MNC] Gazdaságstatisztika

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Statisztikai alapfogalmak

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Sta t ti t s i zt z i t k i a 1. előadás

y ij = µ + α i + e ij

Regressziós vizsgálatok

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Korreláció és lineáris regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

A leíró statisztikák

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

Statisztika elméleti összefoglaló

[Biomatematika 2] Orvosi biometria

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

[Biomatematika 2] Orvosi biometria

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

A valószínűségszámítás elemei

2. előadás. Viszonyszámok típusai

Idősorok elemzése előadás. Előadó: Dr. Balogh Péter

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Segítség az outputok értelmezéséhez

Bevezetés az SPSS program használatába

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

A statisztika alapjai - Bevezetés az SPSS-be -

Bevezetés a Korreláció &

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

GVMST22GNC Statisztika II.

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Bevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I.

Többváltozós lineáris regressziós modell feltételeinek

Korreláció számítás az SPSSben

A statisztika alapjai - Bevezetés az SPSS-be -

Statisztika I. 13. előadás Idősorok elemzése. Előadó: Dr. Ertsey Imre

GAZDASÁGI STATISZTIKA

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Szezonális ingadozás. (Stacionárius idősoroknál, ahol nem beszélhetünk trendről, csak a véletlen hatást kell kiszűrni. Ezzel nem foglalkozunk)

Exponenciális kisimítás. Üzleti tervezés statisztikai alapjai

Biomatematika 2 Orvosi biometria

Statisztika összefoglalás

Statisztikai alapfogalmak

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

1. Előadás. Statisztikai alapfogalmak. A statisztikai munka fázisai. Statisztikai adatok csoportosításának lehetőségei. Statisztikai sorok, táblák.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A mérési eredmény megadása

[Biomatematika 2] Orvosi biometria

Bevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I.

Biomatematika 2 Orvosi biometria

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Adatok statisztikai értékelésének főbb lehetőségei

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Statisztika I. 2. előadás: Statisztikai táblák elemzése. Kóczy Á. László. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének

Hipotézis vizsgálatok

Matematikai statisztikai elemzések 2.

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Mérési adatok illesztése, korreláció, regresszió

Sorozatok határértéke SOROZAT FOGALMA, MEGADÁSA, ÁBRÁZOLÁSA; KORLÁTOS ÉS MONOTON SOROZATOK

Kettőnél több csoport vizsgálata. Makara B. Gábor

Több valószínűségi változó együttes eloszlása, korreláció

Többváltozós Regresszió-számítás

Elemi statisztika fizikusoknak

Matematikai geodéziai számítások 6.

Viszonyszám A B. Viszonyszám: két, egymással kapcsolatban álló statisztikai adat hányadosa, ahol A: a. viszonyítadóadat

[Biomatematika 2] Orvosi biometria

Átírás:

Kvantitatív elemzési módszerek Dr. Szilágyi Roland Dr. Varga Beatrix

Bevezetés 2

A statisztika fogalma gyakorlati tevékenység, amelynek eredményeképpen statisztikai adatokhoz jutunk; e tevékenység eredményeképpen kapott adatok összessége; a statisztikai tevékenység módszertana A statisztika - mint gyakorlati tevékenység - tömegesen előforduló jelenségek egyedeire vonatkozó információk gyűjtése, feldolgozása és elemzése, a vizsgált jelenség egészének tömör, számszerű jellemzése. 3

Statisztikai alapfogalmak Statisztikai sokaság: a statisztikai megfigyelés tárgyát képező egyedek összessége, halmaza. A sokaság egységei: a sokaságot alkotó egyedek Ismérvek: Azok a kritériumok, amelyek szerint a sokaság egységeit jellemezzük. 4

A sokaság definiálása egységek tételes felsorolása, vagy a közös tulajdonságok megadása. 5

Az ismérvek tipizálása 1. Időbeli: időpont vagy időtartam megnevezéséből áll Területi: földrajzi megjelölés, Minőségi: pl. nem, foglalkozás, hajszín Mennyiségi: számmal jellemezzük diszkrét: csak egymástól jól elkülönülő értéket vehet fel. folytonos : egy adott intervallumon belül bármilyen értéket felvehet. 6

Az ismérvek tipizálása 2. Közös: adott tulajdonság szempontjából egyforma sokasághoz tartoznak. Ezért a sokaság megadása történik a közös ismérvek megadásával. Megkülönböztető: sokaság jellemzése a megkülönböztető ismérvek szerinti megoszlás vizsgálatából két változattal rendelkezők: alternatív ismérvek (pl. nem) több változattal rendelkezők: Tulajdonság meglétét vagy hiányát is kifejezik. 7

Statisztikai sorok és táblák Statisztikai sor: Statisztikai adatoknak meghatározott összefüggésben, valamilyen ismérv szerinti felsorolása A sort létrehozó összefüggés származhat: 1. egy sokaság osztályozásából (csoportosító sor); 2. egy sokaság nagyságának összehasonlításából (összehasonlító sor); 3. egyazon jelenséghez tartozó többféle sokaság felsorolásából (leíró sor). A csoportosító és összehasonlító sorok osztályozhatóak az ismérv fajtája szerint: - minőségi - mennyiségi - területi - időbeli 8

Összehasonlító sor Azonos fajta és mértékegységű adatokat tartalmaz, de azok általában nem adhatók össze. Az összehasonlító sorok altípusai: 1. idősorok Az idősorok a jelenségek, folyamatok időbeli alakulását mutatják, lehetővé teszik az időbeli összehasonlítást. állapot idősor: álló sokaságok időbeli alakulását mutatja tartam idősor: mozgó sokaságok időbeli alakulását mutatja. 2. területi sorok A területi sorok esetében a csoportképző ismérv a terület. Ez lehet egy ország vagy az országon belül egy régió, megye, város, stb. 9

Csoportosító sorok Azonos fajta és mértékegységű adatokat tartalmaz. Egy fősokaság és a megfelelő részsokaságok nagyságát adják meg. Tartozéka az összesen adat. 10

Leíró sor Általában különböző fajta és különböző mértékegységű adatokat tartalmaz Az adatok mindegyike egy meghatározott jelenségre, társadalmi vagy gazdasági egységre vonatkozik 11

Statisztikai táblák A táblák csoportosítása: 1.) rendeltetése szerint: feldolgozói: az adatok feldolgozása közben összeállított közlési: a munka végső eredményeit foglalja össze munkatábla: azért készítjük, hogy belőle további számításokat végezzünk 2.) csoportosítás szerepe szempontjából: egyszerű csoportosító kombinációs 12

A statisztikai táblák szerkesztésének szabályai A tábla részei formai szempontból: oszlop a tábla függőleges része, sor a tábla vízszintes része, rovat a sor és az oszlop találkozása. Szöveget is tartalmazó rovatok: fejrovat a táblában felül helyezkednek el, oldalrovat a sorok előtt találhatók, összegrovat a sorok és az oszlopok adatainak összegzését tartalmazó rovatok. 13

Statisztikai táblák tartozékai Cím, forrás mértékegység időpont, időszak Fej- és oldalrovat 14

Mérési skálák Számok meghatározott szabályok szerinti hozzárendelése jelenségekhez, bizonyos tulajdonságokhoz. 4 féle szabály alapján (erősségi fokozat szerint): - nominális skála - sorrendi skála - intervallum skála (különbség skála) - arány skála 15

1. Nominális skála (névleges) Számok kötetlen hozzárendelése Területi, minőségi ismérvek megfigyelésekor A szám csak azonosító Pl. rendszám, irányítószám Pl: kódolás: Szőke: 1, barna: 2, vörös: 3, fekete: 4 Férfi: 1, nő: 2 16

2. Ordinális, sorrendi skála A sokaság egyedeinek egy közös tulajdonság alapján való sorba rendezése. A skálán az egyes egyedek nem feltétlen egyforma távolságra helyezkednek el egymástól. Pl. hallgatók osztályzata, országok hitelképességének sorrendje 17

3. Intervallum skála A két adat különbsége értelmezett, valós adat. Zérus pontja önkényes. A zérus pont nem jelenti azt, hogy az adott egyed nem rendelkezik az adott tulajdonsággal. De: nem értelmezhető a két adat összege, aránya, különbsége. Pl. Celsius fok 18

4. Arány skála A legerősebb mérési skála Zérus pontja természetesen adódik Bármely két érték aránya független a mértékegységtől Értelmezhető a két adat összege, aránya is Pl. hosszúság, pontszám 19

Leíró statisztikai vizsgálatok 20

A sokaság/minta eloszlásának jellemzése tipikus értékek meghatározása; az adatok különbözőségének vizsgálata, a sokaság/minta eloszlásgörbéjének elemzése. 21

Eloszlásjellemzők Középértékek helyzeti (Me, Mo) számított Aszimmetria mérése Pearson-féle mutató (A) F mutató β 1 mutató grafikus ábrázolás Szóródási mérőszámok szórás ( ) relatív szórás (V) terjedelem (R) interkvartilis terjedelem (IQR) Egyéb jellemzők koncentráció kvantilisek momentumok grafikus ábrák 22

Középértékekkel szembeni követelmények egyértelmű számítás; tipikus, jellemző értékek legyenek; szemléletes, jó értelmezhetőség; közepes helyzet X min K X max 23

Középértékek jellemzői A mennyiségi ismérvet egyetlen számmal jellemzik. Dimenzió: az ismérv mértékegysége. 24

Középértékek Átlagok Számtani Harmonikus Mértani Négyzetes x g x Kronológikus x h x q x k Helyzeti középértékek Módusz (Mo) Medián (Me) 25

Számtani átlag Az a szám, amelyet az átlagolandó értékek helyére téve azok összege változatlan marad. Egyedi értékeknél: x x1 x2... x n n i1 n n x i Súlyozott forma: n f i 1 x i x f i i 26

A számtani átlag matematikai tulajdonságai Az egyes elemek - átlagolandó értékek - átlagtól való eltéréseinek összege 0: n i=1 i Ha minden egyes elemhez hozzáadunk egy "a" konstans értéket, az így kapott elemek számtani átlaga "a"-val tér el az eredeti elemek átlagától. Ha minden egyes elemet megszorzunk egy "b" konstans értékkel, akkor az így kapott elemek átlaga "b"-szerese lesz az eredeti elemek átlagának. x - x = 0 27

A számtani átlag matematikai tulajdonságai x y Ha az x 1, x 2,..., x n elemek átlaga, az y 1, y 2,..., y n elemek átlaga, akkor az x 1 + y 1 ; x 2 + y 2 ;...; x n + y n átlaga x y lesz. Az elemek mindegyikéből egy tetszőleges "a" állandót levonva ezen eltérések négyzetösszege akkor lesz minimális, ha az "a" állandó éppen az,azaz n 2 x - a i=1 i minimális, ha a = x 28

A számtani átlag előnyös tulajdonságai Világos, érthető fogalom, számítása egyszerű. Minden adathalmaznak létezik számtani átlaga, s egy van belőle. Minden elem figyelembe vételével kerül kiszámításra. Kiszámításához nem szükséges az egyedi értékek ismerete, elegendő azok összegét tudni. 29

A számtani átlag hátrányos tulajdonságai A kiugró értékekre (ún. outlier-ekre) érzékeny. (nyesett átlag trimmed mean) Osztályközös gyakorisági sor alkalmazása esetén nem tudjuk figyelembe venni az egyedi értékeket. Nyitott osztályközök használatakor adatvesztés. 30

Geometriai átlag Geometriai átlag az a szám, amelyet az egyedi értékek helyére írva azok szorzata változatlan marad. Egyedi értékek esetén: x g n n i1 x i Súlyozott átlagforma: x g n n π i1 x f i i 31

Súlyozott átlagok x i : átlagolandó értékek f i : súlyok A súlyozott átlag nagysága függ: az átlagolandó értékek abszolút nagyságától, a súlyarányoktól (a súlyok egymáshoz viszonyított arányától), súlyként f i /n=g i is használható. 32

Helyzeti középértékek Medián A rangsorba rendezett adatok közül a középső elem (az előforduló értékek fele kisebb a medián-nál, fele pedig nagyobb) 33

Medián előnyös tulajdonságai egyértelműen meghatározható, nem csak mennyiségi jellemzők esetén határozható meg, hanem rangsorba rendezhető minőségi ismérvek esetén is, értéke független a szélső értékektől. 34

Medián hátrányos tulajdonságai Csak rangsorba rendezett elemekből számítható. Induktív statisztikai célra nem igazán alkalmas. Ha az egyedek jelentős hányada azonos ismérvértékkel rendelkezik, akkor nem célszerű használni. 35

Módusz (Mo) Diszkrét ismérv esetén: A leggyakrabban előforduló elem Folytonos ismérv esetén: A gyakorisági görbe maximuma. 36

A módusz jellemzői Előnyös tulajdonságok: Tipikus érték Valamennyi mérési skála esetén alkalmazható. Nem érzékeny a szélső, kiugró értékekre. Hátrányos tulajdonságok: Nem minden esetben létezik, vagy előfordulhat, hogy több is van belőle. Induktív statisztikai célra általában nem alkalmas 37

Kvantilisek Azok az értékek, melyeknél az összes előforduló értékek j/k-ad része kisebb, illetve az (1-j/k)-ad része nagyobb. (j=1,2,,k-1) Fontosabb kvantilisek: Medián (Me) k=2 Tercilisek (T j ) k=3 Kvartilisek (Q j ) k=4 Kvintilisek (K j ) k=5 Decilisek (D j ) k=10 A j-edik kvantilis sorszáma j n 1 k 38

Szóródásszámítás Szóródáson azonos fajta számszerű értékek különbözőségét értjük. Mérése: Szélső értékek eltérése alapján Átlagtól való eltérés alapján Egymástól való eltérés alapján 39

A szóródás mérőszámai A szóródás terjedelmének mutatói A szóródás terjedelme: R=X max -X min Kifejezi, hogy mekkora értékkörben ingadoznak az ismérvértékek. A szóródás interkvartilis terjedelme: IQR=Q 3 -Q 1 Kifejezi, hogy mekkora értékkörben ingadozik az ismérvértékek középső 50%-a. A szóródás interdecilis terjedelme: IDR=D 9 -D 1 Kifejezi, hogy mekkora értékkörben ingadozik az ismérvértékek középső 80%-a. 40

Szórás (σ) A szórás az egyedi értékek átlagtól való eltéréseinek a négyzetes átlaga. = d i = i=1 n A σ 2 -et varianciának is nevezzük. n 2 k i=1 f k i i=1 d f i 2 i 41

Szórás (σ) főbb tulajdonságai Az x i értékek additív transzformációja esetén a szórás nem változik. Az x i értékek multiplikatív transzformációja esetén a szórás a transzformációnak megfelelően 2 2 2 változik. x q x Értéke 0, ha x=constans Értékhatára 0 x N 1 42

Relatív szórás (V) Kifejezi, hogy az egyedi értékek átlagosan hány %-kal térnek el az átlagos értéktől. V = x 43

Relatív szórás (V) tulajdonságai értékhatárai: dimenzió nélküli 0 V N -1 különböző mértékegységű vagy nagyságrendű adatok szóródásának az összehasonlítására alkalmas 44

Alakmutatók és helyzetmutatók Az egymóduszú gyakorisági eloszlások lehetséges eltérései a normális gyakorisági görbétől. 45

Aszimmetria mutatók Pearson-féle A mutató A x Mo Előjele az aszimmetria irányát mutatja. A 0 bal oldali, jobbra elnyúló aszimmetria A 0 jobb oldali, balra elnyúló aszimmetria A = 0 szimmetrikus eloszlás. Abszolút értékének nincs felső korlátja. A>1 meglehetősen erős aszimmetria 46

Eltérő jellegzetességű gyakorisági eloszlások 47

A helyzetmutatók elhelyezkedése szimmetrikus és aszimmetrikus eloszlás esetében 48

Grafikus ábrázolás 49

Grafikus ábrázolás fontossága Grafikus ábrázolás során elkövethető hibák: Mondanivaló szempontjából nem megfelelő ábratípus kiválasztása Tárgynak megfelelő ábra helytelen használata Kimaradó lehetőségek, mivel legtöbbször nem ismerik azokat. 50

Grafikus ábrázolás: Vizsgált jelenség természetéről teljes képet ad. Arányokat érzékelteti. Legyen áttekinthető, és csak azt mutassa amire szolgál. Legyen célorientált és homogén. Lehetőleg egy jelenséget ábrázoljon. Legyen az ábra a lehető legegyszerűbb. Tengelyek skálája megfelelő legyen. Félreértelmezhetőség kerülése. Megszakító jel használata körültekintést igényel. 51

Grafikus ábrák tartozékai: Cím Tengely-felíratok Forrás Jelmagyarázat, ha szükséges Skálabeosztás 52

Grafikus ábrázolás fajtái: 1) Mértani alakzatok felhasználásával Koordinátarendszeren kívüli Kördiagram Koordinátarendszeren alapuló Pontdiagram Vonaldiagram Oszlopdiagram Szalagdiagram 53

2.) Térképeken alapuló ábrázolás Kartogram Kartodiagram Ponttérkép 3.) Figurális ábrázolás (piktogram) 54

1) Koordinátarendszeren alapuló: állapotidősor pont/vonal diagram Magyarország sertésállománya, 1983-2005 (év végi adatok) ezer db 12 000 10 000 8 000 6 000 4 000 2 000 0 Forrás: Magyar Statisztikai évkönyv 2005. 1982 1987 1992 1997 2002 év 55

Az életkor és a kereset összefüggése Forrás: Kitalált Vállalat adatai 56

Ezer lakosra jutó élveszületés és halálozás alakulása Forrás: Demográfiai évkönyv 2004. 57

Pálcika diagram Néhány értéket felvevő diszkrét mennyiségi ismérvek esetében 58

Tartamidősor - oszlopdiagram 59

Hisztogram, poligon Az oszlopok területe kell, hogy arányos legyen az ábrázolt gyakorisággal. Eltérő osztályközhosszúság esetén az f i gyakoriságok helyett az f i /h i egységnyi osztályközhosszúságra eső gyakoriságokat ábrázoljuk. 60

Szalagdiagram A magyar népesség kor és nem szerinti megoszlása 1900-ban. (Forrás: www.ksh.hu) 61

Gazdaságelméleti Poláris és koordinátarendszer Módszertani Intézet poláris hálózat A radardiagram a fogyasztói árak változását mutatja be 2000 januárjában, a lakosság vásárlásaiban fontos szerepet betöltő termékekből és szolgáltatásokból képzett kiadási főcsoportok szerinti bontásban. Forrás: KSH 62

Koordinátarendszeren kívüli mértani alakzat A háztartások fogyasztásának szerkezete 2005. Forrás: Magyar Statisztikai évkönyv 2005. 63

Osztott oszlopdiagram 64

Kartogram Egy állandó lakosra jutó SZJA alapot képező jövedelem kistérségenként, 2004 Forrás: Területi Statisztikai Évkönyv 2004. 65

Kartodiagram Népsűrűség és városi népesség aránya 2002.január 1. Forrás: sdt.sulinet.hu 66

Figurális ábrázolás 67

Box plot (doboz ábra) 68

A box plot ábra elemei 69

70

Férfiak születéskor várható átlagos élettartamának box-plot ábrái 71

Sztochasztikus kapcsolatok elemzése 72

Két változó közötti kapcsolat Független: Az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az Y szerinti hovatartozásról. Sztochasztikus: Az egyik ismérv hatással van a másikra, de nem határozza meg egyértelműen annak értékeit/változatait. Függvényszerű (determinisztikus): A vizsgált egységek X szerinti hovatartozásának ismeretében egyértelműen megmondható azok Y szerinti hovatartozása is. 73

Sztochasztikus kapcsolatok fajtái Asszociáció (mindkét ismérv minőségi/területi ismérv, nominális skálán mérve). Vegyes (egyik ismérv mennyiségi, másik területi/minőségi, intervallum/arány és nominális skálán mérve. Korreláció (mindkét ismérv mennyiségi, intervallum/arány skálán mérve). Rangkorreláció (mindkét változó sorrendi skálán mérhető). 74

A kapcsolatszorossági mutatókkal szemben támasztott követelmények Egyértelmű definíció Zárt intervallumban mozogjon Célszerű, ha: 0 < mutató < 1 0: teljes függetlenség 1: függvényszerű (determinisztikus) a kapcs. Monotonitás 75

Asszociáció I. Yule-féle asszociációs együttható Y =0 függetlenség 0< Y <0,3 gyenge erősségű kapcsolat 0,3< Y <0,7 közepes erősségű kapcsolat 0,7< Y <1 szoros kapcsolat Y =1 függvényszerű kapcsolat Y>0 ha az azonos indexű ismérvek vonzzák egymást Y f f 11 11 f f 00 00 f f 10 10 f f 01 01 76

Asszociáció II. Csuprov-féle asszociációs együttható A függetlenség feltételezésével számított gyakoriságokból indul ki. A T együtthatót mindig pozitívnak tekintjük Az együttható csak az s=t esetben érheti el a maximális 1 értéket, minden más esetben T<1 érvényes. T χ f 2 * ij P f n s 1 t 1 s i1 i f n t j1 j χ f 2 ij f A B PA PB f * ij * ij 2 77

Asszociáció III. Cramer mutató A t>s esetében a Csuprov-féle együttható helyett a Cramer mutatót használjuk. A t>s esetben is elérheti a maximális 1 értéket, így a mutató alapján lehetőség nyílik a különböző méretű táblákkal reprezentált asszociációs kapcsolatok szorosságának összehasonlítására is. T max C 4 T T max s 1 t 1 n s t 2 χ s 1 A C együtthatót mindig pozitívnak tekintjük. 78

Vegyes kapcsolatok I. Szóráshányados: a kapcsolat szorosságának mérőszáma H Szórásnégyzet-hányados: A mennyiségi ismérv szóródását mennyiben befolyásolja a csoportosító ismérv szerinti hovatartozás. H 2 H=H 2 =0 függetlenség H=H 2 =1 függvényszerű (determinisztikus) kapcsolat S k S Sk S σk σ σ σ 2 k 2 79

Vegyes kapcsolatok II. Sokaságukban három eltérést tudunk számítani a j-edik csoport i-edik elemére: teljes eltérés: az egyedi érték és a főátlag különbsége d ji belső eltérés: az egyedi érték és a részátlag különbsége külső eltérés: a részátlag és a főátlag különbsége B d K ji j ji B x x x ji ji j ji x x x K j ji 80

Vegyes kapcsolatok III. d ji Az összefüggés felírható az eltérés négyzetek összegére: B ji K ji S=S B +S K Valamint a szórásnégyzetre is: 2 2 2 σ σ σ σ 2 S n B K σ 2 B S n B σ 2 K S n K 81

Vegyes kapcsolatok IV. σ B belső szórás azt mutatja, hogy a fősokaság egészében az egyes értékek átlagosan mennyivel térnek el a saját csoportjuk részátlagától. σ K külső szórás azt mutatja, hogy a részátlagok átlagosan mennyivel térnek el a főátlagtól. A külső szórás azt a befolyásoló tényezőt ragadja ki, amelyet a csoportosító ismérv testesít meg, ezért alkalmas az ismérvek közötti kapcsolatok vizsgálatára. 82

Korrelációs kapcsolat elemzése I. Van-e összefüggés az ismérvek között? Milyen irányú az összefüggés? Mennyire szoros a kapcsolat? Az egyik ismérv változása milyen hatással van a másik ismérv változására? 83

Korrelációs kapcsolat elemzése II. A mennyiségi ismérvek közötti kapcsolatot korrelációnak nevezzük. A korrelációszámítás: a mennyiségi ismérvek közötti kapcsolat szorosságának mérése. A regressziószámítás: a mennyiségi ismérvek egymásra gyakorolt hatásának számszerűsítésével, e hatások irányának és mértékének megállapításával foglalkozik. 84

Korrelációs kapcsolat elemzése III. Ha a korreláció mögött egyirányú okozati összefüggés állapítható meg: az ok szerepét betöltő ismérvet tényezőváltozónak, magyarázó-, független változónak (X), az okozat szerepét játszó ismérvet pedig eredményváltozónak, függő változónak (Y) nevezzük. 85

A korreláció fontosabb típusai: Korreláció hiánya A regresszió-függvény bármely X helyen azonos (közel azonos) értéket vesz fel. A függvény képe vízszintes vonal. ( Y független X-től, X nem befolyásolja Y értékét.) 86

A korreláció hiánya Y = - 7. 4 E - 0 2 + 0. 2 0 8 3 4 8 X 3 R - S q = 3. 4 % 2 1 0-1 - 2-3 - 2-1 0 1 2 N i n c s k o r r e lá c i ó 87

A korreláció fontosabb típusai: Függvényszerű kapcsolat A korreláció hiányának logikai ellentéte a függvényszerű kapcsolat. Egy adott X értékhez csupán egyetlen Y érték tartozhat. Ilyenkor a pontdiagram pontjai a regresszió-vonalhoz illeszkednek, azaz a regresszió-vonal körül nincs szóródás. 88

A korreláció fontosabb típusai: Pozitív korreláció Általában a regressziógörbe körül van szóródás. A regressziógörbe alakja a korreláció tartalmát fejezi ki. Ha nagyobb X értékekhez általában nagyobb Y értékek tartoznak, vagyis a tényezőváltozó növelése az eredményváltozó nagyságát növeli. 89

Pozitív korreláció Y = -8. 6 E -0 2 + 0. 6 9 0 2 8 6 X 3 R -S q = 6 2. 5 % 2 1 0-1 - 2-3 - 3-2 - 1 0 1 2 3 P o z i t ív k o r r e l á c i ó 90

A korreláció fontosabb típusai: Negatív korreláció Az előbbi kapcsolat ellentéte természetesen a negatív korreláció, amelyet a regressziófüggvény ugyancsak szemléletesen jelez. 91

Negatív korreláció Y = 5. 0 7 E - 0 2-0. 6 4 7 8 7 2 X 3 R - S q = 7 0. 9 % 2 1 0-1 - 2-3 - 3-2 - 1 0 1 2 3 N e g a t ív k o r r e lá c i ó 92

A korreláció fontosabb típusai: Görbevonalú kapcsolat A lineáristól eltérő típust görbe vonalú (nemlineáris) kapcsolatnak nevezzük. A nemlineáris kapcsolatok egy részénél továbbra is van értelme pozitív, vagy negatív irányzatról beszélni, feltéve, hogy a görbe monoton növekvő, illetve csökkenő irányzatot mutat az értelmezési tartományon belül. Nem lehet azonban pozitív vagy negatív irányról beszélni, ha a regresszió irányt változtat. 93

Görbevonalú kapcsolat Y = 1 2. 0 9 5 8 + 6. 0 7 6 8 4 X + 1. 1 6 6 8 6 X * * 2 4 0 R - S q = 8 8. 4 % 3 0 2 0 1 0 0-3 - 2-1 0 1 2 3 N e m l i n e á r i s k o r r e lá c i ó 94

Korrelációs mutatószámok: Kovariancia Az X és Y mennyiségi változók közötti kapcsolat irányát mutatja meg. A megfelelő átlagtól vett ( x - x) és ( y - y) eltéréseken alapszik. C = d x d n -1 y = xy - x y n -1 C r s x s y 95

Kovariancia tulajdonságai A kovariancia nulla, ha a pozitív és a negatív előjelű eltérésszorzatok összege kiegyenlíti egymást. Kovariancia előjele a kapcsolat irányát mutatja. A kovariancia abszolút mértékének nincs határozott felső korlátja. A kovariancia a két változóban szimmetrikus, X és Y szerepe a formulában felcserélhető. 96

Korrelációs mutatószámok: Korrelációs együttható A korrelációs együttható a lineáris korreláció szorosságának legfontosabb mérőszáma. A kapcsolat hiányát (korrelálatlanság) az r = 0 érték jelzi. Az r előjele a korreláció irányát mutatja. Tökéletes (függvényszerű) lineáris kapcsolatnak - az iránytól függően - az r = +1, illetve r = -1 értékek felelnek meg. A szélsőséges helyzetek között az együttható abszolút értéke a kapcsolat szorosságáról tájékoztat. 97

Korrelációs együttható d d = xy - n x y x y d = x n x x 2 2 2 d = y n y y 2 2 2 ) )( ( 2 2 2 2 2 y 2 x y x y x y n y x n x y x xy- n d d d d C = r s s 98

A determinációs együttható megmutatja, hogy a magyarázóváltozó hány %-ban befolyásolja az eredményváltozó szóródását. Jele: r 2 Korrelációs mutatószámok: Determinációs együttható A determinációs együttható jellemzi: A regressziós függvény illeszkedését, A modell magyarázó erejét. 99

Korrelációs mutatószámok: Rangkorreláció Létezhetnek a statisztikai sokaság egységeinek olyan kvantitatív jellegű tulajdonságai, amelyek számszerűen egyáltalán nem, vagy csak nehezen mérhetők. A mutatószám értéke r-hez hasonlóan természetesen -1 és 1 között helyezkedik el. Ha a kétféle rangsorszám rendre megegyezik, akkor = 1, ha a sorszámok a két ismérv szerint következetesen ellentétesen alakulnak, akkor = -1. 2 6di = 1-2 n(n 1) 100

Többváltozós korreláció-számítás I. Korrelációs mátrix, annak elemei: R 1 r1 r2 r y y py r r r y1 1 21 p1 r r r y2 12 1 p2............ r r r yp 1p 2 p 1 r r y2 r y1 12 = = = C y y1 s s C s y x1 y2 s C12 s s x1 x2 x2 101

Többváltozós korreláció-számítás II. Parciális korrelációs együttható I. r y1.2 r y1 (1 r r 2 y2 y2 r 12 )(1 r 2 12 ) A kapcsolat irányát és erősségét is mutatja. r y1.2 = 0 x 1 és y függetlenek, ha x 2 hatását kiszűrjük 0 < ry1. 2 < 1 x 1 és y között sztochasztikus kapcsolat van, ha x 2 hatását kiszűrjük 102

Többváltozós korreláció-számítás III. Parciális korrelációs együttható II. A kontrollált korrelációs együtthatót mindig összehasonlítjuk a nem kontrollált együtthatóval. Ha: r y1 = r y1.23, akkor az x 2 -nek és x 3 -nak nincs hatása az y és x 1 közötti kapcsolatnál. r y1.23 = 0, akkor nincs valós, csak látszólagos kapcsolat az y és x 1 között. Alkalmas a látszólagos összefüggések leleplezésére. 103

Többváltozós korreláció-számítás IV. Többszörös korrelációs és determinációs együttható R y.1,2 R r 2 y1 r 2 y2 y. 12... p 1 2r 1 r 2 12 1 q yy y1 r y2 r 12 R 2 R R 2 y. 1,2,..., p 1 2 1 SSR SST n -1 n - p -1 1 q S S yy ŷ y (1 R 2 ) 104

Nem-paraméteres próbák 105

Nem paraméteres hipotézis vizsgálat A nem paraméteres hipotézis vizsgálat a sokasági paraméter értékére, vagy különbségére vonatkozó állítások helyett a sokaság egyéb jellemzőjére vonatkozó feltételezések ellenőrzésére irányul. Föbb típusai: Függetlenségvizsgálat Illeszkedésvizsgálat Varianciaanalízis 106

Alapfogalmak Nullhipotézis H 0 Aminek az elfogadásáról, ill. visszautasításáról döntünk. Gyakran egy tagadó válasz. Alternatív hipotézis H 1 A nullhipotézissel egymást kizáró állítások. Elsőfajú hiba Elsőfajú hibát követünk el akkor, ha elvetjük a nullhipotézist, holott az igaz. Másodfajú hiba Másodfajú hibáról akkor beszélünk, ha elfogadjuk a nullhipotézist, bár az nem igaz. Szignifikancia szint (α) Az elsőfajú hiba elkövetésének kockázata, megadja, hogy következtetésünk mekkora valószínűséggel érvényes. Csökkentése szűkíti a visszautasítási tartományt, növeli az elfogadási tartományt, növeli a másodfajú hiba esélyét 107

A hipotézis vizsgálat lépései 1. A nullhipotézis H 0 és az alternatív hipotézis H 1 felállítása 2. A próbafüggvény kiválasztása, és aktuális értékének meghatározása a minta a lapján. 3. A szignifikanciaszint megválasztása 4. A próbafüggvény kritikus értékének meghatározása az eloszlástáblázatból. 5. A visszautasítási és elfogadási tartomány meghatározása. 6. Döntéshozás 108

Függetlenségvizsgálat A sztochasztikus kapcsolatok szorosságának mérőszámai általában 0 számszerű értékkel jelzik a kapcsolat hiányát, a gyakorlatban azonban ritka a tényleges 0 érték. Előfordulhat, hogy véletlen hatás miatt egymástól teljesen független ismérvek vizsgálatakor nullától eltérő eredményt kapunk. Van-e kapcsolat adott szignifikancia szinten, a két minőségi ismérv között? 109

H 0 : függetlenek H 1 : nem függetlenek 2 s t i1 j1 f ij f f ij ij 2 110

Illeszkedésvizsgálat A sokaság eloszlásának egészére vonatkozó hipotézisek vizsgálatát illeszkedésvizsgálatnak hívjuk. Tiszta illeszkedésvizsgálat Becsléses illeszkedésvizsgálat Elméleti alapeloszlás: Egyenletes eloszlás Normális eloszlás Tapasztalati eloszlások összehasonlítása 111

H H 1 0 : P r ( x r i ) : i : P ( x ) 2 r i1 i f i np P P i i np i i (i=1,2,,r) 2 = H 0 : H 1 : normális eloszlást követ nem követ normális eloszlást Feltétel: legalább 50 tagú legyen a sokaság, továbbá, hogy egy-egy ismérvváltozathoz (osztályközhöz) tartozó várható gyakoriság legalább 5 legyen 112

Varianciaanalízis Minősíthető függetlenségvizsgálatnak Vegyes és korrelációs kapcsolatok területén alkalmazható Annak a nullhipotézisnek az ellenőrzésére szolgál, hogy kettőnél több azonos szórású normális eloszlású valószínűségi változónak azonos-e a várható értéke is. 113

H 0 : Függetlenség áll fenn H 1 : Van sztochasztikus kapcsolat 114

Osztályozási módszerek 115

Klaszteranalízis Hasonló dolgok csoportosítását jelenti, gyakorlatilag az osztályozás szinonimájaként értelmezhetjük. 116

A klaszteranalízis célja A klaszteranalízis alapvető célja, hogy a megfigyelési egységeket viszonylag homogén csoportokba rendezze, az elemzésbe bevont változók alapján. A folyamat akkor sikeres, ha az egységek hasonlítanak csoporttársaikhoz, azonban eltérnek a más csoportba tartozó elemektől. 117

A klaszterelemzés korlátai Nem vonhatók le következtetések a mintából az alapsokaságra, vagyis elsősorban feltáró technikaként használható. Nincs egyetlen legjobb megoldás. Minden esetben létrehoz klasztereket, függetlenül attól, hogy azok ténylegesen léteznek-e az adatokban, vagy sem. A megoldások teljes mértékben a változóktól függnek. A kialakult csoportok nem függetlenek az egyedek adatbázisbeli sorrendjétől. 118

Klasztermódszerek I. Hierarchikus összevonó eljárások Egyszerű láncmódszer (Single linkage): Azokat a megfigyelési egységeket vonja össze első lépésben, amelyek között legkisebb a távolság (legjobban hasonlítanak egymáshoz). Két klaszter közötti távolságot mindig a két legközelebbi pont távolsága határozza meg. Teljes láncmódszer (Complete linkage): távolságot a két legtávolabbi pont határozza meg. két klaszter közötti Átlagos láncmódszer: két klaszter távolságát az összes megfigyelési egység páronkénti távolságának átlaga definiálja. (általában előnyösebb mint az előzőek) 119

Egyszerű láncmódszer 120

Teljes láncmódszer 121

Klasztermódszerek II. Hierarchikus összevonó eljárások Ward-féle eljárás: Minden klaszterre kiszámolják az összes változó átlagát, majd minden megfigyelési egységre meghatározzák a négyzetes euklidészi távolságot. Minden lépésnél azt a két klasztert vonják össze, amelyeknél a klaszteren belüli szórásnégyzet növekedése a legkisebb. Centroidmódszer: Két klaszter közötti távolság a centroidjuk (összes változó átlaga) közötti távolság. A centroidokat minden lépés után újra számolják. 122

Klasztermódszerek III. Nem hierarchikus eljárások Nagyobb esetszámnál (kb. 2000) a hierarchikus klaszterezés már körülményesebb, ezért célszerű a K- közép módszert választani. A két módszer közötti alapvető különbség: Előre meg kell határozni a létrehozandó klaszterek számát. Induláskor ismertnek tételezzük fel a klaszterközepeket, melyeket mi is megadhatunk, de érdemes a programra bízni ezek kijelölését. 123

1. 2. 3. 4. 5. 6. Gazdaságtudományi Kar A probléma megfogalmazása (Kutatási probléma, hipotézis, vizsgálandó elemek nagysága, stb.) Feltételek vizsgálata Pl: kiugró értékek, reprezentatív minta, skálázás Hasonlósági és távolságmérték meghatározása (Ahol kisebb a távolság, azok a megfigyelési értékek hasonlóbbak) Klasztermódszer kiválasztása Hierarchikus vs. nem hierarchikus Klaszterek száma Hány csoport? Mi alapján? Klaszterek értelmezése, jellemzése Elnevezés, értékelés Klaszteranalízis folyamata 7. Klaszterelemzés érvényességének ellenőrzése 124

Idősorok elemzése 125

Az idősorok elemzésének egyszerűbb eszközei Számtani átlag Kronológikus átlag Dinamikus viszonyszám Átlagos abszolút eltérés Átlagos relatív eltérés 126

Átlagos abszolút és relatív változás Átlagos abszolút változás: az egy időszakra jutó átlagos változást adja meg. Képlete: Átlagos relatív változás: a változás átlagos ütemét adja meg. Képlete: 127

Átlagok alkalmazása Időben lejátszódó folyamat elemzésének eszköze: számtani átlag. Képlete: y = t=1 n y t Ha az időbeli megfigyeléseink időpontra vonatkoznak: kronológikus átlag. Képlete: y k = y 1 n + n 1 2 t=2 y t + y n 2 n 1 128

Idősorok grafikus ábrázolása Grafikus ábrázolás: Az idősorok alaptendenciáinak tömör, áttekintő jellemzése. Fő típusai: Állapotidősorok: az időbeli ismérv értékei egy-egy időponthoz tartoznak ezért célszerű ábrázolásuk egy-egy pont. Az állapotidősor javasolt ábrája a pontdiagram. Tartamidősorok: a vízszintes tengelyen elvben intervallumok szerepelnek, a jelenséget pedig célszerű ezen intervallumok fölé rajzolt oszlopokkal (téglalapokkal) bemutatni. 129

Az idősorok komponenseinek elkülönítése A jelenségek fejlődése, alakulása, és így az azoknak megfelelő idősor számos tényező együttes hatásának az eredménye. Az egy-egy jelenség változását befolyásoló soksok tényezőről mélyebb, részletesebb információnk általában nincs. Az idősorelemzés megközelítési módjai: determinisztikus sztochasztikus idősorelemzés. A valószínűség-számítás szemszögéből nézve az idősorok adatai az időben véletlenszerűen lejátszódó, vagyis sztochasztikus folyamatok empirikus adatai. 130

Az idősorok összetevői A statisztikai elemzés szempontjából négy komponenst különböztetünk meg: alapirányzat vagy trend, periodikus ingadozás, ciklus, véletlen ingadozás. 131

Alapirányzat vagy trend Jele: y ij Jellemzői: - az idősorban tartósan érvényesülő tendencia - a fejlődés legfontosabb komponense. - több tényező együttes hatásának a következménye, - alapvetően társadalmi-gazdasági törvényszerűségek határozzák meg. 132

Periodikus ingadozás Jele: s j Jellemzői: - Az idősorokban rendszeresen ismétlődő hullámzás. - Leggyakoribb típusai: az idényszerű vagy szezonális ingadozások - Az idényhatás állandó periódushosszúságú hullámzás, ritmikus ingadozás; - általában olyan idősorokban állapíthatjuk meg jelenlétét, amelynek adatai egy évnél rövidebb időszakra (hónap, negyedév) vonatkoznak. - Vannak olyan periodikus hullámzások is, amelyeknél a periódus rövidebb, mint egy év. 133

Ciklus Jele: c Jellemzői: - Olyan periodikus ingadozás az idősorban, amely kevésbé szabályos, jelenlétét csak hosszabb idősorok alapján lehet felfedni és tanulmányozni. - Az ingadozások periódusának hosszúságát egyrészt természeti okok is befolyásolhatják - Fő típusai az ún. gazdasági (konjunktúra) ciklusok. 134

Véletlen ingadozás Jele: v ij Jellemzői: - Ezt az összetevőt valószínűségi változónak tekintjük. - Véletlennek igen sok, egyenként nem jelentős, egymás hatását elősegítő vagy keresztező végső eredményét tekintjük. - A véletlen hatás eredménye, hogy az idősorok adatai a trendből, illetve a periodikus komponensből adódó görbe körül sztochasztikusan ingadoznak. 135

Idősorok elemzésének feladatai 1. A fejlődés alapirányzatát megismerése, miközben eltekintünk a többi összetevőitől. Az idősort tehát mintegy ki akarjuk simítani: a szezonális, a ciklikus és a véletlen ingadozást "el akarjuk tüntetni", hogy a trendvonalat tisztán lássuk. 2. A mozgó átlagolás és a regressziós módszerekből származtatható analitikus kiegyenlítéssel számszerűsíteni az idősorban rejlő tendenciákat. 3. Az idényszerű hullámzás jellemzőinek mérése, amelynek során természetesen ki kell küszöbölni az idősorban érvényesülő trendhatást és a véletlen ingadozást, valamint - amennyiben a vizsgált idősorban előfordul - a gazdasági ciklus hatását. 4. A konjunktúrahullám (gazdasági ciklus) kimutatása (a többi hatás kiszűrésével). 5. A véletlen hatások kezelése. 136

Additív és multiplikatív összefüggés A gyakorlati idősorok esetében nem mindig jelenik meg minden komponens egyszerre. A komponensek közötti összefüggés lehet: - Additív - y ij = y ij + s j + c + v ij - Multiplikatív - y ij = y ij s j c v ij 137

Idősorok elemzésének bonyolultabb eszközei Idősoron egymást követő, azonos tartalmú megfigyelések sorozatát értjük, és y 1, y 2,, y t,,y n módon jelöljük. A trendszámítás feladata az idősor fő komponensének, az alapirányzatnak a kimutatása. Az idősor kiegyenlítése, kisimítása a célunk úgy, hogy a periodikus ingadozás és a véletlen ingadozás hatását kiküszöböljük. Az idősorok kiegyenlítésének módszerei: - mozgóátlagolás, - analitikus trendszámítás. 138

Trendszámítás mozgó átlagolással A mozgó átlagolás alapgondolata az, hogy a trendet az eredeti sor dinamikus átlagaként állítjuk elő. A számítás menete a következő: Kiszámítjuk az idősor első k adatának egyszerű számtani átlagát. Ez az első trendérték, amelyet az érintett időszak közepéhez - vagyis a (k+1) 1/2-edik időszakhoz - rendelünk. Ezután elhagyjuk az első adatot, és ehelyett vesszük a következő (k+1)-ediket. Ismét átlagot számítva nyerjük a következő mozgó átlagot, vagyis trendértéket, amelyet a megfelelő időszakhoz rendelünk. Így haladunk, amíg az utolsó adatot is felhasználjuk. Az eredményül kapott trendértékek sorozata a kiegyenlített idősor. 139

Mozgó átlagok számítása Páratlan k tagszám esetén az yt (t = 1, 2,..., n) idősorból számított k tagú mozgó átlagok sorozata a t = j+1-edik időszaktól a t = n-j-edik időszakig tart, ahol j = (k-1)/2. t+j l=t j A t-edik időszakhoz rendelt mozgó átlag: y (k) t = 1 y k i Páros tagszám esetén az az időszak, amelyet a mozgó átlag jellemez, mindig két, eredetileg megadott időszak közé esik. Ezen a helyzeten egy újabb művelet, az ún. középre igazítás, vagy centírozás beiktatásával segítünk. Középre igazítás: a kiszámított mozgó átlagokat páronként rendre átlagoljuk, vagyis újabb, ezúttal kéttagú mozgó átlagok sorozatát számítjuk ki. Ezek a trendértékek már a megadott időszakra vonatkoznak. 140

Mozgó átlagolás jellemzői A kapott mozgóátlag, mint trend megmutatja az idősor alapirányzatát, miközben eltekintünk a többi komponenstől. A véletlen hatás kiküszöbölését (pontosabban: csökkentését) az átlagolás művelete révén érjük el. A véletlen kikapcsolása annál tökéletesebb, minél nagyobb tagszámú mozgó átlagokat számítunk. A periodikus ingadozás hatását a mozgó átlag tagszámának megfelelő kijelölésével küszöbölhetjük ki. Szezonális ingadozásnál ügyeljünk arra, hogy minden egyes mozgó átlag átfogjon egy (vagy több) teljes idényciklust. A mozgó átlag tagszámát úgy választhatjuk meg, hogy egy-egy ciklushoz tartozó adatok számával egyenlő vagy annak egész számú többszöröse legyen. 141

Analitikus trendszámítás Ha a vizsgált jelenség tartós irányzatát az idő függvényében valamilyen regressziós függvénnyel határozzuk meg, analitikus trendszámításról beszélünk. Az analitikus trendszámítás a leggyakrabban alkalmazott szűrő és simító eljárás. Az analitikus trendszámítás esetén mindenekelőtt két kérdést kell tisztázni: - Milyen típusú függvénnyel akarjuk leírni az idősort? - Hogyan mérjük az illeszkedést, és mikor tekintünk egy illeszkedést jónak? 142

Lineáris trend Ha olyan jelenség időbeni változását vizsgáljuk, amelynél azt tapasztaljuk, hogy az időegységenként bekövetkezett változás, növekedés vagy csökkenés abszolút értelemben közel állandó, a változás egyenletes, az alapirányzat értékeit lineáris trenddel határozzuk meg. Lineáris trendfüggvény: y t = b 0 + b 1 t 143

A paraméterek meghatározása 144

A paraméterek meghatározása Ha a t értékeket a t=0 követelménynek eleget tevő módon választjuk meg, akkor Amiből mindkét paraméter becslésére közvetlen képlet adódik: 145

A paraméterek értelmezése A b0 paraméter az alapirányzat értéke a t=0-val jelölt időpontban. - Ha t=1, 2,, n, akkor a vizsgálatba bevont időpontot megelőző időpont trend szerinti értéke. - Ha t=0 és páratlan az időpontok száma: a középső időpont alapirányzata, és egyben a vizsgált idősor adatainak számtani átlaga. - Ha t=0 és páros az időpontok száma, nincs 0-val jelölt időpont, a b0 paraméter az idősor adatainak számtani átlaga. A b1 paraméter az időegységenkénti átlagos abszolút változás mértéke, előjelétől függően növekedést vagy csökkenést jelez a vizsgálatba bevont időtartam alatt. Ha t=0 és az időpontok száma páros, akkor 2b1 az időegységenkénti átlagos abszolút változás mértéke. Jelentését tekintve a lineáris trendfüggvény b1 paraméter megegyezik az időbeli változás átlagos mértékével, azaz a mutatószámmal. 146

Relatív reziduális szórás Megmutatja, hogy a lineáris trenddel becsült érték a valós értéktől átlagosan mennyivel tér el. A mutató által eldönthető, hogy a vizsgált idősor milyen trendfüggvénnyel írható le a legjobban. Jele: V e Képlete: V e = s e y 147

Exponenciális trend Ha a vizsgált jelenség egyik időszakról a másik időszakra megközelítőleg mindig ugyanannyiszorosára, azonos százalékkal nő vagy csökken, azaz az időegységenkénti relatív változás ingadozik egy állandó körül, a tartós irányzatot exponenciális trenddel fejezzük ki. Az exponenciális trendfüggvény általános alakja: Y t = β 0 + β 1 t 148

Exponenciális trend Az exponenciális függvény pozitív β 0 esetén logaritmikus transzformációval lineáris alakra hozható, a paraméterek meghatározása visszavezethető a lineáris függvényre (a logaritmus alapja tetszőleges lehet): logy t = logβ 0 + t logβ 1 A t=1,2,, n időpontban mért y 1,,y n adatokból a legkisebb négyzetek módszerével meghatározhatjuk (új jelölések bevezetésével) az y t = a b t exponenciális trendfüggvényt. Itt az a β 0, a b pedig a β 1 értékének egy realizálódott idősor alapján történt becslése. 149

Paraméterek értelmezése A b 0 paraméter a jelenség alapirányzat szerinti értéke a t=0-val jelölt időpontban. Ha t=0, és nincs 0-val jelölt időpont, a b 0 paraméter az idősor adatainak mértani átlaga. A b 1 paraméter az időegységenkénti átlagos relatív változás mutatószáma. Jelzi, hogy a vizsgált időszak alatt a jelenség értéke időegységenként átlagosan hányszorosára, hány %-ra (100*b 1 ) vagy hány %-kal (100*b 1-100, ha növekedés, 100-100*b 1, ha csökkenés) változott. 150

Köszönöm a figyelmet! 151