Bevezetés az ökonometriába Többváltozós regresszió: nemlineáris modellek Ferenci Tamás MSc 1 tamas.ferenci@medstat.hu 1 Statisztika Tanszék Budapesti Corvinus Egyetem Hetedik előadás, 2010. november 10.
Tartalom 1 Ismétlés Utóbbi előadások áttekintése 2 Pár gondolat a linearitásról általában Változóiban és paramétereiben nemlineáris modell 3 Fontosabb függvényformák áttekintése 4 Ramsey RESET
Előző részeink tartalmából Utóbbi előadások áttekintése Ismerkedés az ökonometriával, az ökonometriai modellezéssel Többváltozós lineáris regresszió alapjai Mintavételi vonatkozások: becslések és hipotézisvizsgálat Modellszelekció Modellspecifikáció (specifikációs torzítás), interakció Az OLS standard modellfeltevései, heteroszkedaszticitás és kezelése Nominális magyarázó változók szerepeltetése, dummyzás
Linearitás, mint közelítés Pár gondolat a linearitásról általában Változóiban és paramétereiben nemlineáris modell Az élet általában nemlineáris (ez van) Miért használunk mégis lineáris modelleket: mert sokszor nem térnek el (nagyon) a valóságtól, de mégis sokkal könnyebben kezelhetőek matematikailag (ez van) Ez tehát az esetek többségében egy közelítés Mint ilyen: vizsgálni kell az érvényességi határokat (csap példája) Munkaponti linearizálás
Érvényességi határok Pár gondolat a linearitásról általában Változóiban és paramétereiben nemlineáris modell Az érvényességi határokat az eddig látott modellekben is érdemes végiggondolni Azonnal kézenfekvő példa: a konstans (nagyon sok esetben) De sok meredekségnél is megragadható ez (fogyasztási függvény példája) Ez is egyfajta munkaponti linearizálás
Érvényességi határok Pár gondolat a linearitásról általában Változóiban és paramétereiben nemlineáris modell 50 0-50 -100-150 -200 0 2 4 6 8 10
Érvényességi határok Pár gondolat a linearitásról általában Változóiban és paramétereiben nemlineáris modell 50 0-50 -100-150 -200 0 2 4 6 8 10
Érvényességi határok Pár gondolat a linearitásról általában Változóiban és paramétereiben nemlineáris modell 50 0-50 -100-150 -200 0 2 4 6 8 10
Nemlinearitás fajtái Pár gondolat a linearitásról általában Változóiban és paramétereiben nemlineáris modell Az β 1 + β 2 X + β 3 X 2 egy nemlineáris kifejezés (matematikailag) De figyelem: ennek ellenére minden további nélkül, tökéletesen kezelhető pusztán az eddig látott (lineáris!) eszköztárral, hiszen az OLS-nek mindegy, hogy a második magyarázó változó értékei történetesen épp az első négyzetei (Egészen addig nincs baj, amíg a kapcsolat nem lineáris) Nem úgy mint az β 1 X β 2 ez nem becsülhető OLS-sel A megkülönböztetés végett az első esetet változójában, a másodikat paraméterében nemlineáris modellnek nevezzük Mi van nemlinearitást okozó pozícióban
Változójában nemlineáris modell Pár gondolat a linearitásról általában Változóiban és paramétereiben nemlineáris modell Jellemző: továbbra is fennáll a változók konstansokkal szorozva majd összeadva (tehát: lineáris kombinációs) struktúra De elképzelhető, hogy egy változó egy eredeti változó transzformáltja Itt szükségképp nemlineáris transzformációról beszélünk! Vegyük észre, hogy az eredeti és transzformált közti megkülönböztetés teljesen mesterséges (csak mi tudjuk, hogy mi volt az adatbázisban bemenő adatként), az OLS-nek mindegy Ide tartozik a kvadratikus hatás, általában az X a magyarázó változók, a log a X (de vigyázat: a logaritmus alapja nem paraméter), az a X stb. (a=konst) Az előzőek miatt további tárgyalást nem igényel
Paramétereiben nemlineáris modell Pár gondolat a linearitásról általában Változóiban és paramétereiben nemlineáris modell Megsérti a lineáris kombináció struktúráját: paraméter nem csak szorzóként szerepel a regresszióban Például X β, log β X stb. Ez már nem becsülhető OLS-sel: az eredmányváltozó nem állítható elő mátrixszorzatként Más módszert fogunk használni
Nemlinearitás kezelése Pár gondolat a linearitásról általában Változóiban és paramétereiben nemlineáris modell Mi egyetlen módszert fogunk látni: algebrai linearizálás Alkalmas transzformációval a nemlineáris problémát lineárissá alakítjuk, azt OLS-sel megoldjuk, majd a kapott eredményeket visszatranszformáljuk az eredeti transzformáció inverzével Például: Y = β 1 X β 2 u paramétereiben nemlineáris de mindkét oldal logaritmusát véve log Y = log β 1 + β 2 log X + u már az! Adatbázis logaritmálása, eredmények visszahatványozása Olyan esettel most nem foglalkozunk, ami ne lenne linearizálással kezelhető
Nemlinearitás hatásai Pár gondolat a linearitásról általában Változóiban és paramétereiben nemlineáris modell Kezelés szükségessége: lásd előbb Eltérő, specifikus értelmezések megjelenése
Log-log modell Fontosabb függvényformák áttekintése Például a Cobb-Douglas termelési modell: Y = β 1 L β L K β K, ahol Y a kibocsátás, L a munka, K a tőke (ill. általában a termelési tényezők) felhasználása Elaszticitása: El (Y, L) = dy Y dl L = dy L dl Y = β 1β L L βl 1 K β L K β 1 L β = β L K β K L Ezért nevezik konstans elaszticitású modellnek is Marginális hatás: dy dl = β 1β L L βl 1 K β K = β L Y L Kezelése linearizálással: mindkét oldalt logaritmáljuk log Y = log β 1 + β L log L + β K log K + u
Log-log modell Fontosabb függvényformák áttekintése Minden változót (eredmény és összes magyarázó is) logaritmálni kell Innen a modell neve Csak a konstans lesz logaritmálva, a többi koefficienst a transzformáció ellenére (ill. épp azért... ) közvetlenül kapjuk Volumenhozadék (skálahozadék): β K + β L viszonya 1-hez
Fontosabb függvényformák áttekintése Szakágazati termelési modell, Cobb-Douglas megközelítés Model 1: OLS, using observations 1 479 (n = 476) Missing or incomplete observations dropped: 3 Dependent variable: l_ertnarb const l_befeszk,l_forgeszk l_szemraf,l_ecsleir l_rlejkot, Mean dependent var 3,053985 S.D. dependent var 1,970754 Sum squared resid 109,4631 S.E. of regression 0,482597 R 2 0,940665 Adjusted R 2 0,940034 F (5, 470) 1490,231 P-value(F ) 1,3e 285 Log-likelihood 325,5952 Akaike criterion 663,1904 Schwarz criterion 688,1829 Hannan Quinn 673,0179 Volumenhozadék lineáris kombinációként tesztelhető Érdemes az R 2 -et is megnézni: ugyanez lineáris modellként 62,3%!
Log-lin modell Fontosabb függvényformák áttekintése Például a jövedelem alakulása: Y = e β 1+β 2 X +u Linearizálás ismét mindkét oldal logaritmálásával: log Y = β 1 + β 2 X + u Elnevezés logikája így már látható: az eredményváltozó logaritmálva, de a magyarázó változók maradnak szintben Növekedési ráta: e β 1+β 2 (X +1)+u = Ye β 2, pillanatnyi növekedési ütem: β 2 = dlog Y dx = 1 dy Y dx Elaszticitás: El (Y, X ) = dy X dx Y = β 2X, tehát csak X -től függ (közvetlenül)
Lin-log modell kakukktojás! Fontosabb függvényformák áttekintése Az előzőek alapján már világos a jelentése (pl. terület és kínálati ár összefüggése): Miért kakukktojás? β 2 értelmezése: Elaszticitás: Y = β 1 + β 2 log X + u dy dx = β 2 X β 2 = El (Y, X ) = β 2 X tehát csak Y -től függ (közvetlenül) dy dx /X X Y = β 2 Y,
Reciprok modell kakukktojás! Fontosabb függvényformák áttekintése Például keresleti modell: Y = β 1 + β 2 X + u Miért kakukktojás? Határkiadás: dy dx = β 2 X 2 Elaszticitás: El (Y, X ) = β 2 X 2 X Y = β 2 XY Paraméterek értelmezése, β j előjelének jelentősége az aszimptotikus viselkedés szempontjából: az élvezeti cikkek példája
Egy komplex példa vegyes modellre Fontosabb függvényformák áttekintése Tekintsük a következő kiadási modellt: Y = β 1 e β NN J β J+β JN N u, ahol Y a kiadás, N a nem (dummy, 1 ha férfi), J a jövedelem Alapvetően log-log jellegű (bár a β N felfogható exponenciálisként is), ráadásul még dummyzva is, hogy minden eltérő legyen nemenként (strukturális törés) Ez utóbbi miatt mondhatjuk egyszerűen, hogy log-log jellegű Linearizálás: log Y = log β 2 + β N N + β J J + β JN (J N) + u
Egy komplex példa vegyes modellre Fontosabb függvényformák áttekintése Paraméterértelmezések: β 1 és β N autonóm fogyasztás mindkét nemre teljesen külön (exponenciális jelleg ebben) A jövedelemnél célszerű az elaszticitást megragadni (a log-log jelleg miatt), hiszen: El (Y, J) = β J + β JN N nemtől függő elaszticitás (avagy: mindkét nemre teljesen külön elaszticitás, referencia-kódolás jelleggel)
A specifikációs tesztek Ramsey RESET Itt már nagyon erősen felmerül a kérdés: hogyan dönthetek a különféle függvényformák között? Ld. a termelési függvény példáját megadható lineárisan és Cobb-Douglas jelleggel (eredmény nagyon nem mindegy) Hogyan lehet analitikusan dönteni? Az előző példára: BM-teszt, PE-teszt stb., lásd Maddala Általánosságban (nem csak log/lin kérdésekre, mint az előzőek): ún. specifikációs tesztek
Ramsey RESET-je Ramsey RESET A modellspecifikáció általános tesztje Emiatt előnye: nem egy adott specifikációs kérdésre keres választ, hanem általában vizsgálja, hogy a specifikáció jó-e; hátránya, hogy ha nemleges választ ad, nem derül ki, hogy pontosan mi a specifikáció baja Trükk: új regressziót becsül, melynek eredményváltozója ugyanaz, de a magyarázó változókhoz hozzáadja az eredeti regresszió becsült eredményváltozójának magasabb hatványait (Ŷ 3 -ig néha Ŷ 4 -ig is) Nullhipotézis a helyes specifikáció, a tesztstatisztika: a hozzáadott változók együtt sem bírnak lényeges magyarázó erővel