Mért pot úgy kombálja kétfokozatú legksebb égyzetek módszere (2SLS az strumetumokat, ahogy? Kézrat A Huyad László 60. születésapjára készülő köyvbe Kézd Gábor 2004. júlus A Budapest Corvus Egyetem rövd életű Ökoometra Csoportjáak vezetőjekét Huyad Lac fotosak tartotta, hogy a taításo túl s foglalkozzuk ökoometra problémákkal, és ezekről beszéljük s egymás között. A cél az volt, hogy egymást jobba megsmertessük érdekes alkalmazásokkal, boyololtabb modellekkel, és az egyébkét általuk vszoylag gyakra haszált módszerek mélyebb hátterével. Ez a műhelymuka valóba eldult, bár a hétközapok vhara és az Ökoometra Csoportak és oktatóak a jövője körül bzoytalaság matt em futott fel teljese. De em adtuk fel a terveket. Ez az írás s ezt akarja bzoyíta: egy olya kérdést bocolgat, amelyet Lac többször felvetett, ám redese sosem beszéltük végg. A kérdés a következő. A kétfokozatú legksebb égyzetek módszere több strumetum eseté az edogé magyarázó változókak az egzogé magyarázó változókra (strumetumokra való leárs projekcóját haszálja a becsléshez. Ezáltal a túl sok strumetumból azok egyféle leárs kombácójával hoz létre éppe elegedő számú strumetumot. De vajo m a megfotolás pot e leárs kombácó mögött? Optmáls megoldás-e ez, és ha ge, mlye értelembe, és mlye feltételek mellett? És végül, elképzelhető-e olya sztuácó, amkor va a 2SLS-él jobb megoldás? Tektsük egy függetle azoos eloszású (d mtát és rajta egy kétváltozós leárs modellt, ahol a egyetle magyarázó változó va, amely edogé: y β0 + βx + u ( 0 E u Cov u, x 0 Az elemzés sorá végg feltesszük, hogy a modell korrektül specfkált, vagys a leárs függvéyforma a megfelelő, és x hatása y-ra mde egyes eseté β. x edogetása matt β OLS becslése kozsztes: p lm β _ OLS ( y y( x x β_ OLS 2 ( x x Cov( y, x Cov( β0 + βx + u, x V ( x V ( x Cov( u, x β V ( x β V x + V x
Ha találuk megfelelő strumetumot, β kozsztese becsülhető. Megfelelő (érvéyes strumetum korrelálatla a em megfgyelt kompoessel és korrelált az edogé magyarázó változóval: ( Cov z, u 0 Cov z, x 0 Ezeket az strumetum mometumfeltételeek evezzük. Az első mometumfeltétel azt köt k, hogy egy érvéyes strumetum em korrelálhat a em megfgyelhető heterogetással; a másodk azt, hogy a megfgyelhető magyarázó változóval vszot korrelála kell. E két feltétel eredméyekét az strumetum közvetleül em, a megfgyelt magyarázó változó keresztül vszot hat az eredméyváltozóra. Az strumetáls detfkácó, és az arra épülő strumetáls becslőfüggvéy ezt haszálja k: z és y megfgyelt együttmozgása két hatás eredője: z hatása x-re, és x hatása y-ra (z közvetleül em hat y-ra. Ha a megfgyelt z és y együttmozgásból kszűrjük z hatását x-re, megkapjuk x hatását y-ra, vagys β et. Az strumetáls változó (IV becslőfüggvéy: _ IV ( y y( z z ( x x( z z _ IV β β kozsztes becslőfüggvéye β ek: p lm β _ IV + Cov x, z Cov x, z ( β0 + β + Cov( x z β Cov y, z Cov x u, z Cov x, z, β Cov x, z Cov u, z Ha olya szerecsés helyzetbe vagyuk, hogy emcsak egy, haem több érvéyes strumetumuk s va, a bőség zavara vet fel egy újabb problémát. Ha a modell korrektül specfkált, bármelyk felhaszálásával kozsztese becsülhetjük β -et. Kombálásuk azoba hatásosabb becslőfüggvéyhez vezethet: több strumetum több formácót tartalmazhat, mt egy. Ha mdegyk strumetum korrelálatla u-val, úgy bármlye leárs kombácójuk s korrelátla: Cov z, u Cov z2, u... Cov zl, u 0 L L Cov λlzl, u λlcov( zl, u l 0 l A kétfokozatú legksebb égyzetek módszere (2SLS a következő kombácót alkalmazza: x γ + γ z + γ z +... + γ z, * 0 2 2 L L ahol a γ paraméterek az OLS becslések abba a leárs regresszóba, melyek eredméyváltozója az x, magyarázó változó pedg a z-k. A 2SLS ekkor 2
* * ( y y( x x * * ( x x _2SLS 2 β A kérdés az, hogy va-e olya leárs kombácó, amelyek ksebb (aszmptotkus varacája va, mt a többek, és ha ge, ezt hogya határozhatjuk meg - és hogy vajo a 2SLS lye becslőfüggvéy-e. A Mometumok Általáosított Módszere (GMM keretébe választ kaphatuk ezekre a kérdésekre. A kdulópotot az érvéyes strumetum mometumfeltétele jeletk. Legye x ( x a modell magyarázó változóak (esetükbe a kostas és az egyetle x a vektora; β ( β β 0 a becsüledő paraméterek vektora, és z ( z... zl az strumetumok vektora. x és β 2 -es, z pedg (L+ -es oszlopvektor (L strumetum és a kostas. Később haszáladó referecakét jegyezzük meg, hogy β 2SLS becslőfüggvéye e jelölések alapjá a következő: ( * * ( * β xx xy. 2SLS A továbbakba végg feltesszük, hogy (. E ragja 2 (ez a megfelelője az érvéyes strumetumok másodk mometumfeltételéek, vagys az x-szel való korreláltságak. A kduló mometumfeltételeket ekkor a következő egyeletredszer foglalja össze: ( E z u E z y x β 0. β GMM becslőfüggvéye az aalóga elvé alapul: a várható értéket aak mtabel megfelelőjével, a mtaátlaggal helyettesít: zu z ( y x β Szy Sβ E( zu prob. Szy z y S Mthogy véges mtába ulla valószíűséggel lesz mdegyk mtaátlag potosa ulla még ha a várható értékek md ullák s, a GMM azt a paramétert keres, amely mellett a mometumfeltételből képzett kvadratkus forma a legközelebb va ullához: β arg m S S β A S S β GMM zy zy β ( S ( A S S A Szy 3
ahol a másodk egyelőségél az optmum elsőredű feltételét írtuk le (khaszáljuk hogy a kvadratkus forma kovex, sőt valószíűséggel szgorúa kovex, így az elsőredű feltétel elégséges. S zy a mtabel égyzetösszeg (osztva a mtaelemszámmal, amely egy (L+ dmezójú oszlopvektor; S pedg ezzel aalóg mátrx, dmezója (L+ 2. A bármlye olya (L+ (L+ dmezójú valószíűség mátrx lehet, amely valószíűségbe valamlye poztív deft mátrxhoz kovergál: p lm A Ψ poz. def. A GMM becslőfüggvéy kozsztecáját ge egyszerű belát: β S A S S A S S ( S A S ( S A [ Sβ Szu ] ( β S ( A S S A Szu z u GMM zy + + β β+ Ψ Ψ β zu p lm GMM E E E E ( zu Az utolsó sorba azt haszáljuk k, hogy p S E( u β lm zu GMM z 0, hogy eek folytoos függvéye és így alkalmazható a Slutsky-tétel, valamt hogy az A mátrx valószíűség határáak (Ψ létezk az verze. 2 Az A mátrxtól függőe végtele sok GMM becslőfüggvéy létezk, és mdegyk kozsztes. Ez aak az újrafogalmazása, hogy érvéyes strumetumok bármlye leárs kombácójával készíthető kozsztes becslőfüggvéy: a kombácóhoz haszált súlyok mátrxa em más, mt A -/2. A GMM becslőfüggvéy szmptotkusa ormáls: D ( β GMM β N( 0, Λ Λ ΔΩΔ Δ E Ψ E E Ψ 2 2 ( ( ( Ω V zu E zu z E u z z A legksebb aszmptotkus varacát az a GMM becslőfüggvéy adja, amelybe A Ω plm Ω Ω E u zz 2 ( A Slutsky-tétel azt modja k, hogy ha p lmξ μ, akkor bármely f folytoos függvéyre plm f ξ f μ. 2 Elvleg em kell, hogy az verz véges mtába s létezze, csak olyakor általáosított verzt (Moore- Perose kell haszál. A léyeg megértéséhez ettől a fomságtól yugodta eltekthetük, és feltehetjük, hogy A maga s poztív deft. 4
Ezt a becslőfüggvéyt Optmáls GMM-ek (OGMM evezk: S S S S β OGMM Ω Ω z y Kcst pogyolá fogalmazva, az optmáls súlymátrx az strumetumok (z és a em megfgyelt heterogetás (u szorzata szórásáak (a covaracamátrx ½ hatváyáak az verze. Az tuícó gyakorlatlag ugyaaz, mt az általáosított legksebb égyzetek módszeréél (GLS: a legjobb leárs kombácó az, ahol az egyes strumetumok aál ksebb súlyt kapak, mél zajosabbak (mél kább szóródak véges mtába a 0 mometumfeltétel körül. A mmáls aszmptotkus varaca bzoyítást tt em vezetjük le; 3 léyegébe ugyaarra a kaptafára megy, mt a mmáls varacájú becslőfüggvéyek bzoyítása általába (Gauss-Markov tétel. Kérdés marad az, hogy potosa m s Ω, amelyről eddg ayt tuduk, hogy kozsztesek kell lee Ω-ra. Egyszerű választ ad erre az aalóga elve: 2 Ω u zz am kétlépcsős OGMM becslés eljárást jelet: első lépcsőbe megfelelőe kell u^ kat becsülük Ω^ hoz, majd másodk lépcsőbe e (Ω-ra kozsztese becsült Ω^ felhaszálásával kapjuk meg az OGMM becslőfüggvéyt. Ez megt a GLS módszerrel aalóg, lletve aak megvalósítható változatával (FGLS. Mde lye becslőfüggvéy kozsztes lesz Ω-ra, ha olya u y x β változók szerepelek bee, ahol β kozsztes becslőfüggvéye β-ak. Tudjuk, hogy a redelkezésre álló z változók bármlye leárs kombácójával kozsztes strumetáls becslőfüggvéy készíthető, vagy másképpe fogalmazva, bármely poztív deft A mátrx kozsztes GMM becslőfüggvéyhez vezet. Így bármelyket haszáljatjuk az első lépcsőbe, de praktkus szempotból az legegyszerűbb, ha az első lépcsőbe AI (az (L+ (L+ dmezójú egységmátrx. A kérdés az, hogy va-e ehhez az optmáls GMM-hez bárm köze a 2SLS-ek. A válasz: ge, bzoyos feltételek mellett. Tegyük fel, hogy u homoszkedasztkus z-re kodícoálva, vagys V(u z V(u, és ezért ( 2 ( 2 2 σ ( E u zz E u E zz E zz. Ebbe az esetbe Ω kozsztes becslőfüggvéye a következő: Ω u S zz σ 2 2 hom zz Elvleg ez s kétlépcsős eljárást tee szükségessé akárcsak az OGMM általáos esetébe, ám egy szerecsés véletle ettől megóv mket: mthogy a rezduáls varaca (lletve aak 3 Formáls bzoyítást lásd például Wooldrdge (2002, 8.3. fejezet. 5
recproka a becslőfüggvéyek md a evezőjébe, md a számlálójába szerepel, egyszerűe kesk: 2 2 ( ( ( σ ( σ ( S ( Szz S S Szz Szy β OGMM _ hom S ΩhomS S ΩhomSzy S Szz S S Szz S zy Közbe szép csedese elérkeztük a godolatmeet végéhez. Ez a becslőfüggvéy ugyas em más mt a 2SLS: ( ( y ( ( ( y γ zz γ γ z y ( S S z z ( S S ( S S S Szz zz Szz S S Szz zy ( zz z ( ( ( S ( Szz S S Szz Szy βogmm_hom β 2SLS xx x γ z γ z γ z zz zz zz y z S S S S S S y S S S S S S S S zz zz zz zz zz zz zz zy OLS zz ahol a másodk sorba khaszáltuk, hogy defícó szert γ γ S S. A 2SLS tehát potosa megegeyzk az Optmáls GMM-mel ha a em megfgyelt heterogetás az strumetumokra kodcoálta homoszkedasztkus. Vagys ebbe az esetbe 2SLS az a leárs kombácója az strumetumokak, amelyka legksebb aszpmtotkus varacájú becslést bztosítja. Magyarul: a legjobb. Ameybe a em megfgyelt heterogetás heteroszkedasztkus, akkor vszot em az. De vajo praktkus szempotból léyeges-e az OGMM és a 2SLS között külöbség heteroszkedsztkus esetbe? Ezt a kérdés két dolog s motválja. Egyrészt az OGMM boyoluoltabb eljárást géyel, ezért ha praktkus szempotból em agy az előye, kár vele bajlód. Másrészt ráadásul az OGMM kétlépcsős eljárása emcsak boyolultabb, de véges mtába bzoytalaabb, sőt torz s lehet (lásd pl. Podvsky, 999. A kérdés vzsgálatához egy egyszerű Mote Carlo szmulácót végeztük el. A szmulácó sorá két külöböző adatgeeráló folyamatot (DGP, egy homoszkedasztkust (DGP és egy heteroszkedasztkust (DGP 2 vzsgáltuk. Mdkét folyamatba egy edogé magyarázó változó (x és 2 érvéyes strumetum volt (z és z 2 ; a két strumetum közül z jobba korrelált x-szel (vagys erősebb, z 2 kevésbé (gyegébb. DGP 2 -be az strumetumok égyzete korreláltak a em megfgyelt heterogetás (u égyzetével, így u feltételese heteroszkedasztkus volt (Corr(u 2,z 2 Corr(u 2,z 2 2 0.25. A heteroszkedasztctás mértéke közepese erősek modható. 4 4 γ az az (L+ 2 dmezójú OLS paramétervektor, amelyek első oszlopába x első eleméek a kostasak, másodk oszlopába x másodk eleméek x-ek a z vektoro futtatott regresszós paraméteret becsüljük. Mthogy a kostas em szóródk, aak paramétere md ullák, így γ első oszlopa s ullvektor. 6
A Mote Carlo szmulácóba 50 ezerszer geeráltuk mtát az adott DGP alapjá, és ezeke a mtáko egyekét megbecsültük β OLS, IV (IV csak z -gyel, IV 2 (IV csak z 2 - vel, 2SLS és OGMM becsléset. Az 50 ezer smétlés utá megvzsgáltuk a külöböző módoko becsült β ek átlagos relatív eltérését a valóságtól (Rel.Bas vagys relatív torzítás, a szóródását (Std vagys szórás, valamt a torzítás és a szóródás együttes hatásakét adódó teljes eltéréségyzetet (RMSE, root mea squared error. A Mote Carlo szmulácót elvégeztük 00, 000 és 0 000 elemű mtákra s. Az alább táblázat foglalja össze szmulácók eredméyet. A DGP-k potos leírását a Függelék tartalmazza. Táblázat: A Mote Carlo szmulácók eredméye DGP (homoszkedasztkus DGP2 (heteroszkedasztkus OLS IV(z IV(z2 2SLS OGMM OLS IV(z IV(z2 2SLS OGMM 00 Rel.bas 0.463-0.084-0.75 0.00 0.0 0.463-0.044.334 0.04 0.02 Std 0.089 27.442 77.039 0.529 0.534 0.092 9.928 482.8 0.660 0.660 RMSE 0.472 27.442 77.039 0.529 0.534 0.472 9.928 482.9 0.660 0.660 000 Rel.bas 0.464-0.008-0.094 0.000 0.000 0.464-0.006-0.05 0.00 0.00 Std 0.028 0.3 3.324 0.9 0.9 0.029 0.67 7.247 0.53 0.53 RMSE 0.465 0.3 3.325 0.9 0.9 0.464 0.67 7.247 0.53 0.53 0 000 Rel.bas 0.464-0.00-0.004 0.000 0.000 0.464-0.00-0.005 0.000 0.000 Std 0.009 0.040 0.02 0.037 0.037 0.009 0.052 0.32 0.048 0.048 RMSE 0.464 0.040 0.02 0.037 0.037 0.464 0.052 0.32 0.048 0.048 A szmulácók redbe kmutatják az smert eredméyeket: az OLS torz, és bár szórása mde mtaagyság mellett ksebb mt bárm más becslőfüggvéyé, végeredméybe agyo mellélő. Az egyetle strumetumot haszáló strumetáls becslőfüggvéyek ks mtába torzak, ám agy mtába ez eltűk (kozszteca. Az erősebb IV-t (z haszáló becslőfüggvéyek a ksmtás torzítása és a szórása s ksebb, mt a gyegébb strumetumot (z 2 haszálóé. Az strumetumokat kombáló becslőfüggvéyekbe (2SLS, OGMM gyakorlatlag eltűk a ksmtás torzítás, és a szórás s mdg jóval ksebb, mt az egy strumetumot haszáló IV-k eseté. A heteroszkedasztkus DGP esetébe bzoytalaabbak becslések: a torzítások és a szórások s általába agyobbak. Am fő kérdésüket, a 2SLS és az OGMM vszoyát llet, az eredméyek meglehetőse egyértelműek. Homoszkedasztkus DGP mellett a 2SLS ks mtába precízebb (hsze khaszálja a homoszkedasztctás feltevését, am tt helyes, közepes és agy mtába azoba a kettő teljese azoos eredméy produkál. Heteroszkedasztkus DGP eseté a agy mtás hasolóság megmarad, de ks mtába sem jobb az OGMM. Az eredméyek mögött valószíűleg az áll, hogy bár az OGMM gyorsabba kovergál a valós β-hoz (ksebb az aszmptotkus varacája, ez az előy praktkus szempotból eleyésző. Ugyaakkor azoba az OGMM kétlépcsős eljárása plusz bzoytalaságot vsz a becslésbe ks mta eseté, ezért ks mtába scs meg az előye a 2SLS-sel szembe. Az aaltkus és a szmulácós eredméyeket a következőképpe foglalhatjuk össze. A 2SLS elvleg s a legjobb (legsebb aszmptotkus varacát adó módo kombálja az strumetumokat homoszkedasztkus esetbe. Heteroszkedasztkus esetbe elvleg va ála 7
jobb becslőfüggvéy, praktkusa azoba eek az elvleg jobb becslések több a hátráya, mta az előye. A 2SLS megállja a helyét heteroszkedasztkus köryezetbe s, ezért haszáljuk csak bátra. Hvatkozások: Podvsky, Ja M. (999: Fte sample propertes of GMM estmators ad tests. I L. Mátyás (szerk: Geeralzed Method of Momets Estmato. Cambrdge Uversty Press. Jeffrey M. Wooldrdge (2002: Ecoometrc aalyss of cross secto ad pael data. MIT Press. Függelék A Mote Carlo szmulácókba haszált adatgeeráló folyamatok (DGP-k potos leírása DGP : z ~ dn(0,0.5 z 2 ~ dn(0,0.5 x 0.5z + 0.2z 2 + v v ~ dn(0,σ v úgy, hogy σ x u ~ N(0, úgy, hogy Corr(u,v0.5 y β x + u β vagys: edogé x, 2 érvéyes strumetum z & z 2, z erősebb: Corr(x,u 0.464 Corr(u,z Corr(u,z 2 0. Corr(z,x 0.25, Corr(z 2,x 0.0. Homoszkedasztctás: Corr(u 2, z 2 Corr(u 2, z 2 2 0. DGP 2 : z ~ dn(0,0.5 z 2 ~ dn(0,0.5 x 0.5z + 0.2z 2 + v v ~ dn(0,σ v úgy, hogy σ x u ~ N(0, úgy, hogy Corr(u,v0.5 y β x + u β vagys: edogé x, 2 érvéyes strumetum z & z 2, z erősebb: Corr(x,u 0.464 Corr(u,z Corr(u,z 2 0. Corr(z,x 0.25, Corr(z 2,x 0.0. Heteroszkedasztctás: Corr(u 2, z 2 Corr(u 2, z 2 2 0.25, amt egy autoregreszív kodcoáls heteroszkedasztctás (ARCH modell geerál: 8
u ψ v+ e 2 2 2 e ε 0.5 + z + z, ε ~ dn 0, σ, hogy σ ε u 9