GAZDASÁGSTATISZTIKA
GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi Tanszék, az MTA Közgazdaságtudományi Intézet, és a Balassi Kiadó közreműködésével.
ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA Készítette: Bíró Anikó Szakmai felelős: Bíró Anikó 2010. június
GAZDASÁGSTATISZTIKA 3. hét Korreláció, egyváltozós regresszió bevezetés Bíró Anikó
Munkanélküliségi ráta (%) Példa 2. óráról Két változó között negatív kapcsolat pontdiagram (KSH) 20 18 16 14 12 10 8 6 4 2 0 0 1000 2000 3000 4000 5000 6000 GDP/fő (ezer Ft)
Korreláció Két változó közti kapcsolat számszerűen Jelölés: X és Y közti korreláció r XY Korreláció négyzete (r XY2 ): Y varianciájának mekkora hányadát magyarázza X = X varianciájának mekkora hányadát magyarázza Y
Kiegészítés: korreláció képlettel r i N 1 N i 1 ( Y i ( Y i Y ) Y 2 )( X N i 1 i ( X X i ) X ) 2
Korreláció tulajdonságai 1 és 1 közötti érték Pozitív érték pozitív kapcsolat. r = 0: nem korrelál a két változó Nagyobb pozitív érték erősebb pozitív kapcsolat X és Y közti korreláció = Y és X közti korreláció Változó korrelációja önmagával = 1 Konstanssal korreláció = 0
Példa Munkanélküliségi ráta és GDP/fő közti korreláció = 0,62 Negatív kapcsolat Magasabb GDP/fő alacsonyabb munkanélküliség GDP/fő megyénkénti szóródása munkanélküliségi ráta szóródásának 38%-át magyarázza (0,62*0,62 = 0,384)
Okság? Egyik változó okozza-e a másikat? Korreláció nem árulkodik okság irányáról Nincs is feltétlenül okság Előző példák? (GDP munkanélk., GDP gazdasági szervezetek száma)
Több változó közti korreláció M változó M(M 1)/2 korreláció Korrelációs mátrix 3 változóra (X, Y, Z): X Y Z X 1 Y r XY 1 Z r XZ r ZY 1
Kapcsolat szorossága grafikusan Pontdiagram két változó között Lásd TK. 57 58. Mennyire egyszerű egyenest húzni a pontokra? Mennyire szóródnak a pontok?
Korreláció vs. regresszió Változók közötti kapcsolat számszerűsítése Korreláció 2 változó között Oksági kapcsolat? Regresszió Komplex összefüggések (több változó) Lehet mögötte gazdasági modell okság Példák: bérregresszió (végzettség, ), infláció regresszió (kamat, )
Egyváltozós regresszió Y függő változó, X magyarázó változó Feltevés: lineáris kapcsolat Regressziós egyenes: Y X Valóság: adatok nem illeszkednek pontosan egy egyenesre
Értékesítés 1000USD Példa: hirdetési kiadás 560 550 540 530 520 510 500 490 480 470 0 20 40 60 80 100 Hirdetés 1000USD
Hibatag Lineáris regresszió: közelítés Kihagyott, meg nem figyelhető változók Nem lineáris kapcsolat Regressziós modell hibataggal Y X e Hiba: adatpont és regressziós egyenes közti távolság Okság (modell)? Korreláció általánosítása?
Becslés Együtthatók értékeit nem ismerjük Becsült együtthatók: legjobban illeszkedő egyenes együtthatói Jelölés ˆ, ˆ Reziduum (maradéktag): Y ˆ ˆX u e u
OLS becslés Legjobban illeszkedő egyenes maradéktag négyzetösszege minimális SSR i Legkisebb négyzetes becslés = ordinary least squares (OLS) N 1 2 u i
Hirdetési példa, folyt. Becsült együtthatók 502,92 tengelymetszet; 0,22 értékesítés együtthatója Értelmezés? Meredekség Y átlagos változása X egységnyi növekedése esetén Marginális hatás
Korreláció Összefoglalás Két változó közti kapcsolat szorossága Korreláció tulajdonságai Értelmezéshez: korreláció négyzete Lineáris regresszió (egyváltozós) Lehet mögötte oksági modell Hibatag Reziduum (maradéktag) Becslés: OLS
Gyakorlat Korreláció, egyváltozós regresszió bevezetés
Korreláció Két változó közti kapcsolat számszerűen Korreláció négyzete (r XY2 ): Y varianciájának mekkora hányadát magyarázza X = X varianciájának mekkora hányadát magyarázza Y Excel: KORREL() függvény
Korreláció tulajdonságai 1 és 1 közötti érték Pozitív érték pozitív kapcsolat. r = 0: nem korrelál a két változó X és Y közti korreláció = Y és X közti korreláció Változó korrelációja önmagával = 1
Példák Korreláció és korreláció négyzet? KSH megyei adatok: Munkanélküliségi ráta és GDP/fő között? KSH: GDP/fő és gazdasági szervezetek száma között megyénként? MNB: HUF/EUR és HUF/USD között?
Több változó közti korreláció példa Európai minta, 50 év feletti nők (SHARE, részminta) Végzettség (0 4 skála) Dohányzott-e valaha napi rendszerességgel Rosszindulatú daganat Kvalitatív adatok Milyen korreláció várható?
Példa, folyt. Közvetlen (immediate) okság: dohányzás rákos betegség Végz. Végz. 1 Dohányzás Rák Közvetett (proximate) okság: magasabb végzettség rákos betegség Dohányzás 0,18 1 Rák 0,01 0,04 1
Egyváltozós regresszió Y függő változó, X magyarázó változó Feltevés: lineáris kapcsolat Regressziós egyenes Y X Hibatag vs. maradéktag
Példa: hirdetési kiadás Koop: Advert.xls fájl Korreláció? Pontdiagram Regressziós egyenes Excelben: Diagram/Trendvonal felvétele
OLS becslés Legjobban illeszkedő egyenes maradéktag négyzetösszege minimális SSR Legkisebb négyzetes becslés = ordinary least squares (OLS) Excel: Adatelemzés/Regresszió együtthatók becslése és értelmezése hirdetési példában? Együtthatók érzékenysége mértékegységre? i N 1 2 u i
További példák KSH megyei adatok: munkanélküliség regressziója regisztrált gazdasági szervezetek számára Y: munkanélküliség X: gazdasági szervezetek Forest.xls: népesedés hatása erdőirtásra?
Házi feladat (egyéni) 3 változó kiválasztása egy tetszőleges adatbázisból egy adott évre, amelyek között korreláció várható Milyen kapcsolat és miért várható? Leíró statisztika az adatokra (grafikonok + számszerűen) Korrelációk elemzése