Adminisztratív kérdések, bevezetés Ferenci Tamás 1 tamas.ferenci@medstat.hu 1 Statisztika Tanszék Budapesti Corvinus Egyetem Első fejezet
Tartalom Technikai kérdések 1 Technikai kérdések Adminisztratív ügyek Tudnivalók a félévről 2 a társadalmi-gazdasági jelenségek elemzésében 3 i elemzések kivitelezése
Adminisztratív ügyek Tudnivalók a félévről Hol vagyunk most? Bevezetés az ökonometriába (de formálisan: ) kurzus (4MK24NAK01M) G Kar, pénzügy mesterszak, nappali munkarend Egy félév (szemben például a K Karos alapszakos ökonometria oktatással) A kurzus honlapja: http://www.medstat.hu/oko.html Konkrétabban: http://medstat.hu/oko/2015osz/oko2015osz.html
Oktatók és oktatás Technikai kérdések Adminisztratív ügyek Tudnivalók a félévről Előadás: Ferenci Tamás BCE Statisztika Tsz., óraadó (ÓE, egyetemi adjunktus) E-mail: tamas.ferenci@medstat.hu Hétfő 11:40 13:10, E.332 (régi épület) Gyakorlatvezető: Ruzsa Gábor BCE Statisztika Tsz., e. tanársegéd Csütörtök, 9:50-11:20, S. 2. 220 (G3) Csütörtök, 11:40-13:10, S. 2. 218 (G2) Csütörtök, 13:40-15:10, S. 2. 218 (G1)
Adminisztratív ügyek Tudnivalók a félévről Osztályozás A kurzus státusza: vizsgával záruló (V); 5 kredit A félév során 80 pontot lehet szerezni, összetételt lásd mindjárt Pontok jegyre konvertálása a szokásos Statisztika Tanszékes stílusban (40-től elégséges, onnan 10-esével felfelé)
Megszerezhető pontok Adminisztratív ügyek Tudnivalók a félévről A félév során 80 pontot lehet szerezni, a következő összetételben: Gyakorlatokon 4 alkalommal röpzh, 3 legjobb számít, egyenként 5, összesen 15 pont Félév végéig 2 házi feladat beadása, 5 és 10, összesen 15 pont Két teljesen kidolgozott adatelemzés (pontos specifikáció a honlapon) Valós adatokon, gretl használatával Írásban kell beadni, az első vizsga kezdete mínusz 24 óráig, a gyakorlatvezetőnek Vizsgaidőszakban vizsga, 50 pont Írásban (mintavizsga a honlapon, formát mutatja) Feleletválasztás, többszörös feleletválasztás (oda-vissza), példamegoldás és kifejtős (elméleti) kérdések
Pluszpontok Technikai kérdések Adminisztratív ügyek Tudnivalók a félévről A félév során pluszpontok is szerezhetőek, jellemzően a 0,25 3 pont tartományban: ezek közvetlenül hozzáadódnak a többi ponthoz az évvégi elszámolásnál! Pluszpontot három dologért lehet szerezni: 1 Gyakorlati aktivitás honorálása 2 Kiadott pluszmunka (jellemzően valamilyen kutatási feladat) elvégzése, jelentkezés alapján 3 Cikkfeldolgozás, egyéb önálló munka, jelentkezés alapján
Segédanyagok, ajánlott irodalom Adminisztratív ügyek Tudnivalók a félévről Két szóba jövő könyv: R. Ramanathan: Bevezetés az ökonometriába, alkalmazásokkal (Panem Kiadó, 2003) G. S. Maddala: Bevezetés az ökonometriába (Nemzeti Tankönyvkiadó, 2004) Ramanathan: gyakorlatorientáltabb, idősoros rész problémás; beszerezhetőség? Maddala: sokkal mélyebb elmélet, több téma; idősorhoz egyébként is ajánlott; beszerezhetőség? Angolul Jeffrey M. Wooldridge: Introductory Econometrics, A Modern Approach című műve az alapolvasmány Előadásdiák (és egyéb anyagok) elérhetőek a honlapon (http://www.medstat.hu/oko.html) Diasor handout és lecture note stílusban is fent lesz
Egy kis copyright Technikai kérdések Adminisztratív ügyek Tudnivalók a félévről Ezen diasor alapját jelentő diák, valamint a legtöbb gyakorlaton használt adatbázis Hajdu Ottó munkája
Adminisztratív ügyek Tudnivalók a félévről Miről fog szólni a félév Ismerkedés az ökonometriával... Elmélet röviden Módszerek és alkalmazási területek bőven... tehát inkább horizontális ismeretbővítés Szemléletünk modellorientált lesz A vizsgált jelenségekre (elsősorban: társadalmi-gazdasági) ökonometriai modelleket alkotunk...... hogy azok alapján a jelenségeket előrejelezzük elemezzük Tehát: társadalmi-gazdasági jelenségek kvantitatív elemzésére adunk eszközt
Adminisztratív ügyek Tudnivalók a félévről Miért bevezetés? A modern ökonometria rendkívül matematika-igényes, ha precízen csinálják Bár gyakorlati tudomány, de ha szabatosan tárgyalják, akkor jó öreg definíció-tétel-bizonyítás tudomány, nagyon-nagyon komoly matematikai apparátussal Mi ezt szinte teljesen megspóroljuk!... ettől bevezetés Nem bizonyítunk semmit, precíz tétel-kimondás is alig Ehelyett a módszerek alkalmazására koncentrálunk, az alapok matematikailag precíz tárgyalását megspórolva
Előkövetelmények Technikai kérdések Adminisztratív ügyek Tudnivalók a félévről Formálisan Statisztika I. és Statisztika II., de facto: Statisztika I. gyakorlatilag semmi Statisztika II. intenzíven, különösen: becsléselmélet és hipotézisvizsgálat (mintavételi helyzet, mintavételi ingadozás, becslőfüggvény, becslések tulajdonságai, konfidenciaintervallum, hipotézisvizsgálat alapfogalmai, tesztstatisztika, p-érték) Valószínűségszámítás különösen az idősoros részhez (alapfogalmak, valószínűségi változó, eloszlás- és sűrűségfüggvény, momentumok, korreláció, kovariancia, többdimenziós eloszlások, együttes- és vetületi eloszlás) Analízis (derivált, parciális derivált, optimalizálás) Lineáris algebra (skalár, vektor, mátrix, mátrix szorzása skalárral, mátrixok összeadása, mátrix szorzása mátrixszal, transzponálás, determináns, inverz)
Adminisztratív ügyek Tudnivalók a félévről Amit még tudni kell A tanszéki honlap nem frissül, nem is a mostani félévre vonatkozik (ld. helyette a kurzus honlapját, ott minden fent van) Előadások interaktívak Gyakorlatokon a tanult módszerek alkalmazása Használt programok: Excel és gretl gretl-ről még lesz szó gyakorlaton Akit ez sem rémített meg, bátran jelentkezzen, ha van kedve a tananyagon túl is foglalkozni ökonometriával: egyéni kutatásokat, TDK-sokat szívesen látunk!
Mi az ökonometria? Technikai kérdések Nem statisztika alkalmazása történetesen gazdasági adatokra...... nem matematika, amihez történetesen adatok is rendelhetőek...... a hangsúly az adatok és a módszerek kölcsönös egymásra hatásán van. Definíció () Az ökonometria feladata gazdasági-társadalmi jelenségek statisztikai modellezése. Beszéljünk mindhárom komponensről! Statisztikai ( módszertani bázis) Modellorientált ( lásd később) Gazdasági-társadalmi jelenségekkel foglalkozik
A modellezésről általában i modelleket alkotunk... de mit mondhatunk a modellekről általában? A modellezés torzított lényegkiemelés! Azaz: a valóság egyszerű mását hozzuk létre Motiváció: a valóság túl bonyolult, hogy a maga eredeti formájában vizsgáljuk Épp azért egyszerűsítünk, hogy vizsgálni tudjuk valamilyen számunkra kényelmes eszközzel ez legtöbbször matematikai A modell épp azért egyszerűsít, hogy vizsgálható legyen... de közben szükségképp torzít is lásd a turistatérkép példáját Ebből is látszik: a modellezés kulcsa az absztrakciós szint helyes megválasztása Kompromisszumos döntés, optimum keresése: egyensúly a kezelhetőség és a valósághűség között
I. esettanulmány: a lakásár-adatbázis Az adatbázis budai használt lakások kínálati árát [M Ft], és bizonyos jellemzőit tartalmazza, jelesül: Alapterület [m 2 ] Teraszméret [m 2 ] Szobák száma [db] Félszobák száma [db] Fürdőszobák száma [db] Hányadik emeleten van? [N] Déli fekvésű? [I/N] Valós adatok a 2000-es évek elejéről n = 1406 megfigyelési egység Ez lesz a mintánk (mi a sokaság?)
Modellezési feladat megfogalmazása Adjunk ökonometriai modellt a kínálati árra! Tehát: hogyan magyarázhatjuk a kínálati ár alakulását a lakás jellemzőivel? Elemzés Előrejelzés Az ökonometriában matematikai, még közelebbről: algebrai modelleket ( egyenletek ) fogunk használni Mire akarhatunk egy modellt ha már megvan felhasználni? Például egy lehetséges modell erre a kérdésre: Ár = 4,3 + 0,4 Alapterület,
Determinisztikus modell 200 150 Kínálati ár [MFt] 100 50 0 100 200 300 400 500 Alapterület [m^2] Mi ezzel a baj? Függvényszerű kapcsolat az ár és az alapterület között? Hihető ez...?
Következő ötlet Technikai kérdések Próbálkozzunk így: Ár = 4,3 + 0,4 Alapterület + u, ahol u valamiféle hibát foglal magába (kihagyott változó, rossz függvényforma, valóság változékonysága stb.) 200 150 Kínálati ár [MFt] 100 50 0 100 200 300 400 500 Alapterület [m^2]
Sztochasztikus modellek Csak ennek van értelme! sztochasztikusan fogjuk modellezni a vizsgált jelenségeket Ne foglalkozzunk vele, hogy hogyan jött ki az egyenlet, a lényeg, hogy valahogy kijött Ez az egyenlet tehát egy teljes értékű ökonometriai modell! (Hogy mennyire jó vagy rossz, az persze más kérdés)
Modell megfogalmazása Érezhető, hogy a fenti modell két részre bontható: Struktúra: Ár = α + β Alapterület + u Paraméter-becslés: α = 3 és β = 4 E kurzus keretében csak ilyen modellekkel fogunk foglalkozni: a struktúrát előre megadjuk...... de ez a megadás tartalmaz ismeretlen paramétereket E paraméterek értékét a minta alapján kell megbecsülnünk (valamilyen értelemben a lehető legjobban) Ezt paraméteres modellnek nevezzük; a továbbiakban csak ilyennel fogunk foglalkozni Elemzés? Előrejelzés?
Egyetlen példa nem-paraméteres modellekre 120 100 80 Kínálati ár [MFt] 60 40 20 0 50 100 150 200 Alapterület [m^2] Elemzés? Előrejelzés?
Struktúra megválasztása paraméteres modellnél Paraméteres modelleknél a struktúra a priori jellege azért nem azt jelenti, hogy az adatoktól teljesen függetlenül kell döntenünk, és ha rossz lóra teszünk, akkor így jártunk Ugyanis mód van arra, hogy egy adott modell (struktúra) jóságát az adatok fényében megítéljük (modelldiagnosztika)...... majd, ha azt tapasztaljuk, hogy baj van, akkor új modellt keressünk Újrabecsüljük az új modellt, majd újra modelldiagnosztikát végzünk és így tovább: a modellezés iteratív feladat lesz (Azért ezen iterációk száma sem lehet túl sok, különben egyéb problémák jelentkeznek de erről majd később)
Modell használata Technikai kérdések Nem törődve most azzal, hogy mennyire jó a fenti modell (és egyáltalán, hogyan jött ki), mire használhatjuk? Elemzés: minden mást változatlanul tartva, önmagában az alapterület hogyan hat a kínálati árra? (mennyivel kell többet fizetni modellünk szerint várhatóan egy m 2 -rel nagyobb lakásért?) Előrejelzés: modellünk szerint várhatóan mennyi az ára egy 30 m 2 -es lakásnak? Ha a modellünk értelmes lenne, akkor ezekre a kérdésekre értelmes válaszokat kapnánk! (A konkrét gazdasági felhasználás, gazdasági kérdések megválaszolása nyilvánvaló) Már a fenti primitív egyenlet mint ökonometriai modell is meg tud ilyen releváns kérdéseket válaszolni
Az ökonometriai modellezés módszertana Az ökonometriai modellezés tipikus lépései 1 Hipotézis felállítása (tipikusan: elmélet állítását empirikusan ellenőrizni vagy társadalmi-gazdasági kérdést kvantitatíve megválaszolni) 2 Adatgyűjtés 3 Modell kiválasztása (nem csak a jellege, a bonyolultsága is) 4 Modell becslése 5 A modell és a valóság szembesítése, modelldiagnosztika Iteratív folyamat! Ha viszont már jó a modell, akkor használhatjuk: Elemzés Előrejelzés Cél tehát: kérdések megválaszolása (döntéselőkészítés, hatásvizsgálat, policy-választás stb.)
Az ökonometriai adatok természetéről Pontosság kérdése Az adatok jellegük szerint csoportosíthatóak: Keresztmetszeti adatok (több megfigyelési egység egyetlen időpontban) Idősoros adatok (egy megfigyelési egység több időponton keresztül) A kettő kombinációja: paneladatok
Vegyük észre, hogy a statisztikai modell semmit nem mond a változók közti okozati kapcsolatokról (Pontosan ugyanolyan jól megmagyarázható a lakásár az alapterülettel, mint az alapterület a lakásárral!) Az előbbi példában elég nyilvánvaló, hogy az alapterület befolyásolja az lakásárat, és nem a lakásár az alapterületet, de sok más esetben ez nem ilyen egyértelmű Még egy egyértelmű példa: tűzoltók száma és a tűzben esett anyagi kár Confounding jelensége, zavaró változók: akkor van probléma, ha ez egyszerre hat az eredményváltozóra és függ össze a felhasznált magyarázóváltozóval Azaz: a korreláció nem implikál kauzalitást!
Példák a confounding-ra A confounding problémája teljesen általános a társadalmi-gazdasági jelenségek vizsgálatában! A több iskolát végzetteknek nagyobb a fizetése (a több iskolát végzettek nem oktatással összefüggő munkaalkalmassága is jobb akkor mi a valódi ok, illetve melyik milyen arányban?) A több előadást kihagyó hallgatók rosszabb pontszámot érnek el a vizsgán (a több előadást kihagyók nem csak kevesebbet hallanak az előadásból, de egyúttal tendenciájában kevésbé motiváltak is, ezért előadáshallgatástól függetlenül is kevesebbet tanulnak akkor mi a valódi ok, illetve melyik milyen arányban?) A cigányok többet bűnöznek (a cigányok inkább találhatóak az alsó szocioökonómiai szegmensben, ami önmagában nagyobb bűnőzövé válási kockázattal jár együtt akkor mi a valódi ok, illetve melyik milyen arányban?) Ebben az iskolában magasabb a továbbtanulási arány, tehát jobban tanítanak a tanárok (bizonyos iskolákban, logikus módon, mivel a múltbeli eredményeik is imponálóak az iskolát választó szülők számára, eleve a jobb diákok kerülnek be akkor mi a valódi ok, illetve melyik milyen arányban?) Figyelem: vegyük észre, hogy ezek a problémák csak elemzésnél jelentkeznek, ha pusztán előrejelezni akarunk, akkor ezt akár figyelmen kívül is hagyhatjuk (az alapterület jól előrejelezhető a kínálati árral!), bár sok szempontból ez nem túl jó ötlet
A confounding megoldása: kísérlet Tökéletes megoldást csak a randomizált, kontrollált kísérlet elvégzése tud szolgáltatni Ez az egyetlen ugyanis, ami biztosan kiszűr minden confoundert (azokat is, amiket nem tudunk jól mérni, sőt, azokat is, amikről eszünkbe sem jut, hogy confounder-ek!) Azonban a társadalmi-gazdasági vizsgálatokban (ökonometrián túl tipikus példa még az epidemiológia) ez sok eseteben kivihetetlen: embereknek véletlenszerűen különböző fokú oktatást adunk (4 általánostól a PhD-ig), majd megnézzük, hogy mekkora lesz a fizetésük?! Khm...
A confounding megoldása: megfigyelés Gyengébb bizonyítóerejű adatokból kell dolgozni (megfigyeléses adatok, kvázi-kísérlet, természetes kísérlet stb.) A statisztikai modellezés egyik felhasználása épp az lesz, hogy ilyen gyengébb adatokon is képesek legyünk kiszűrni a confounding-ot...... és ez által a gyengébb adataink ellenére is a valódi okozati viszonyokra következtetni! i modellekkel a modellfeltevések teljesülésének erejéig szét tudjuk választani az egyes hatásokat
Statisztikai modellek a confounding szűrésében Például építhetünk modellt, melyben az iskolai eredményt magyarázzuk az iskola valamely jellemzőjével (például típusával, helyével, fenntartójával stb.) és a belépő diákok teljesítményével Egy ilyen modellben el tudjuk különíteni, hogy a kimeneti eredményben milyen szerepet játszanak az egyes tényezők önmagukban! Ha a budapesti iskolákat hasonlítjuk a falusiakkal, nyilván a budapestiek a jobbak de ekkor a budapesti mivolt hatásába belemérjük azt is, hogy itt tendenciájában a diákok már belépéskor is jobbak...... a fenti modellel viszont ki tudjuk mutatni, hogy önmagában a budapesti mivolt (azaz ha a belépő teljesítmény adott, állandó értéken tartjuk) hogyan hat a kimeneti eredményre!
Confoundig szűrése: kontrollálás bizonyos változókra Sokszor tényleg így jelenik meg a feladat, tehát nem mindegyik hatás érdekel, csak egy kiemelt, de a többi zavaró hatását ki akarjuk szűrni, ezt úgy is szokás mondani, hogy kontrollálunk a többire ( budapesti mivolt hatása, kontrollálva a belépő teljesítményre ) Ez hatalmas fegyvertény, de természetesen az alapproblémát nem oldja tökéletesen meg: csak azt tudjuk szűrni, amiről egyáltalán tudunk (és le is tudjuk mérni ez sem feltétlenül triviális: hogyan mérhető le a szocioökonómiai státusz?), és persze azt is csak a modell jóságának erejéig
Szimultaneitás Technikai kérdések A helyzet lehet még ennél komplexebb is Nagyon sok esetben ugyanis nem csak az a probléma, hogy mi hat mire, hanem az is, hogy változók kölcsönösen hatnak egymásra Egészségügyi állapot és GDP, kínálat és kereslet, rendőri létszám és bűnözés stb. stb. Ez a szimultaneitás problémája
i elemzések kivitelezése Számítógépes ökonometriai programcsomagok Ma már ökonometriai munka elképzelhetetlen számítógépes támogatás nélkül Számítógépet használunk adatok tárolásához, feldolgozásához (pl. vizualizálás) és a tényleges modellezéshez is A legismertebb, ökonometriai munkára (is) alkalmas programcsomagok: gretl Egyszerű, nagyon kényelmesen használható, ingyenes, de némileg limitált tudású EViews Az ipar egyik legnépszerűbb, dedikáltan ökonometriai programcsomagja, nagy tudással bír, felhasználóbarát Stata Komplex statisztikai programcsomag, mely ökonometriai támogatást is nyújt R Ingyenes, hatalmas tudású, de nem célirányosan ökonometriára tervezett környezet, a kezdeti beletanulás komolyabb befektetést igényel