Mûhely Huyad László kaddátus, egyetem taár, a Statsztka Szemle főszerkesztője A heteroszkedasztctásról egyszerûbbe E-mal: laszlo.huyad@ksh.hu A heteroszkedasztctás az ökoometra modellezés egyk kulcsfogalma, és bár valójába meglehetőse egyszerű fogalom, talá boyolult hagzású eve s hozzájárul ahhoz, hogy megértése és gyakorlat kezelése olykor elég ehézkes. Az oktatásba szerzett tapasztalatok alapjá sokszor úgy tűt, hogy a hallgatók tt adták fel a regresszós modell megsmerését, tt jutottak el oda, hogy a továbbakba meg se próbálták megérte. E rövd írás célja, aak bemutatása, hogy a heteroszkedasztctás fogalmát, és a vele kapcsolatos fotosabb, elsősorba becslés voatkozásokat a megszokottál egyszerűbbe s lehet tárgyal, legalábbs, am az alapokat llet. A modell, amt tt haszáluk, ge egyszerű, és esetekét még ezt s csak specáls, köye kezelhető esetekre vzsgálom, hsze mdez csak arra szolgál, hogy megértsük ezt a fotos fogalmat, és a vele kapcsolatos legléyegesebb tételeket. Ezért ez a ks írás em helyettesíthet a heteroszkedasztctás részletesebb ökoometra leírásat, melyek a magyar yelvű szakrodalomba s hozzáférhetők (Kőrös et al. [990], Maddala [004], Ramaatha [003]). A heteroszkedasztctás fogalma és egy egyszerű modellje A heteroszkedasztctás általába egy modellbe a szórások külöbözőségét jelet. Sok modell eseté, főkét az egyszerűség kedvéért, a külöböző csoportok, kategórák, változóértékek mögött meghúzódó sokaságok szórása egyelőségét feltételezk. Ez rtká fed a valóságot, de kéyelmes feltételezés, többyre leegyszerűsít a modell szerkezetét, így a becslését, tesztelését stb. s. Az egyelő szórások feltételezése, azaz a homoszkedasztctás, em természetes feltevés, haem mesterséges egy- Statsztka Szemle, 84. évfolyam. szám
76 Huyad László szerűsítés (hasolóa az dősorelemzés stacoartás fogalmához). A heteroszkedasztctás tehát em hba (mt ahogy azt sok köyv tárgyalja), haem ytás a valóság felé. Hbáak csak abba az összefüggésbe lehet tekte, amelybe elsősorba ddaktka okokból a lehető legegyszerűbb, homoszkedasztkus modellt tektjük alapak. A heteroszkedasztctás bemutatására és egyes kérdéseek kezelésére szokásos leárs regresszós modell helyett most egy egyszerű átlagbecslést tektük, amely persze felfogható olya leárs regresszóak s, ahol csak a tegelymetszet együtthatója külöbözk 0-tól. Kduló potuk az, hogy adott egy heterogéek tekthető sokaság, amelybe azoba a külöböző, eltérő szórású csoportok közös várható értékkel redelkezek, és feladatuk eek a közös várható értékek a becslése. E feladat mögé külöféle terpretácókat képzelhetük. Egy lye feladat lehet az, hogy két vagy több ágazatba hasolók az átlagfzetések, ám az eltérő vállalatszerkezet (például agyság) matt az ágazat szórások léyegese eltérek egymástól. Egy másk lehetséges feladat lehet az, hogy valamely műszak ckk átlagárát kívájuk becsül, kombált dősoros és keresztmetszet adatokból. Ha feltételezzük az átlagár stabltását (am a gyártástechológa fejlődése, lletve az ezzel párhuzamosa zajló műszak fejlődés eredőjekét dőbe stablak tekthető), akkor az dőbe változó (bővülő) választék következtébe ugyacsak változó szórás tételezhető fel. Ezekbe az esetekbe külöböző szórású részsokaságokból veszük mtákat, amelyek agysága s változhat. Egy lye feladato már jól megmutathatók a heteroszkedasztkus köryezetbe törtéő becslések tulajdosága, de a még egyszerűbb tárgyalás érdekébe a továbbakba azt s feltételezzük, hogy mde részsokaságból egyetle elemű mtát veszük a becslés érdekébe. Ekkor tehát feladatuk a következő. Legye y, y,, y egy -elemű FAE-mta, ahol feltételezzük, hogy y ~ ( µ, σ ) és σ smert szórás. A cél a közös µ várható érték becslése. Ez a feladat em más, mt a legegyszerűbb átlagbecslés kterjesztése em egyelő szórás (varaca) esetére. Hagsúlyozzuk, hogy a külöböző mtaagyságok elvbe semmt sem változtatáak a későbbeke, csak a jelölések váláak léyegese boyolultabbá, és így félő, hogy éppe az a pot skkada el a tárgyalásból, am matt ezt a ks elemzést végezzük. Ezért maraduk eél a végletekg lecsupaszított, leegyszerűsített modellél. A továbbakba eze a modelle keresztül mutatjuk meg a becslés fő problémát, a lehetséges becslőfüggvéyeket és azok tulajdoságat. A hagyomáyos (OLS-) becslés A legegyszerűbb becslőfüggvéyt µ -re ebbe az esetbe s a közöséges legksebb égyzetek (OLS) módszerével yerhetjük a következő módo. Statsztka Szemle, 84. évfolyam. szám
A heteroszkedasztctásról egyszerûbbe 77 Legye egyszerű modellük y = µ + ε, ahol a modell végletese egyszerű szerkezete folytá ε várható értékétől eltektve ugyaolya tulajdoságokkal redelkezk, mt y. Ezért az OLS azt a µ ˆ -t keres, amelykre = ( y = g µ ˆ ) // mmáls. Vegyük észre, hogy // em vesz fgyelembe az eltérő varacákat, azaz a heteroszkedasztkus köryezetet. A megoldás egyszerű szélsőérték-feladat megoldásakét közsmert: y µ = = = y = µ ˆ OLS ˆ, vagy a később tárgyalással jobba összhagba lévő jelölésekkel: µ ˆ OLS = w y, ahol w =. // = Eek a becslőfüggvéyek a tulajdosága azoal adódak: Torzítatla, azaz E( ˆ ) = µ, hsze ( ) = µ Varacája: µ OLS = E és = ; y w = ( ˆ ) ( ) = σ Var µ OLS = w Var y =, /3/ am alapjá rögtö belátjuk lehet ksebb varacájú torzítatla becslőfüggvéyt készíte. A varaca becslése értelmetle, hsze cs elegedő mtaelemük a becsléshez. (Megjegyezzük, hogy ha az említett, súlyozott feladatot vzsgáltuk vola, akkor elvbe lee elegedő szabadságfokuk a varacák becslésére, de a szokásos (OLS) varacabecslés ekkor s értelmetle, hsze em egy, haem több varaca létezk. Statsztka Szemle, 84. évfolyam. szám
78 Huyad László Egy ad hoc becslőfüggvéy jobb tulajdoságokkal Ez az rodalomba em szokásos becslőfüggvéy a gyakorlatba sem haszálatos, tt csupá érdekességképp mutatjuk be aak demostrálására, hogy a heteroszkedasztkus köryezetbe a hagyomáyos becslőfüggvéy mlye gyegé teljesít. Ez a becslőfüggvéy azo az ötlete alapul, hogy a agyobb szórású réteghez tartozó mtaelem aráyosa ksebb súlyt képvselje a becslőfüggvéybe, és fordítva. Ezért alakja: µ ˆ AH = w y, ahol = σ w = = σ. /4/ Mvel a kostrukcójáál fogva varacája pedg w = =, a /4/ becslőfüggvéy s torzítatla, ( ) ( σ ) ˆ σ µ AH = = = ( σ ) ( ) Var. /5/ = = σ Köye belátható, hogy az /5/ varaca ksebb vagy egyelő a /3/ OLSvaracájával, azaz = σ ( σ ) =. /6/ Az egyelőtleség gazolásához szorozzuk meg mdkét oldalt -el, majd vojuk gyököt mdkét oldalo. Ekkor azt kapjuk, hogy = σ = σ, /7/ am pedg a harmokus, és a égyzetes átlagok közt közsmert agyságred relácó. Ekkor /7/ azt jelet, hogy az OLS-becslőfüggvéy lye feltételek mellett em lehet mmáls varacájú, hsze a találomra felvett becslőfüggvéy s torzítatla, de varacája ksebb. Köszöet Mhályffy Lászlóak az tt yújtott látszólag apró, de valójába agyo haszos segítségért. Statsztka Szemle, 84. évfolyam. szám
A heteroszkedasztctásról egyszerûbbe 79 Tovább becslőfüggvéyek Az ökoometra szakrodalom tovább becslőfüggvéyeket javasol a heteroszkedasztkus esetre. Ezek közül kemelkedk a WLS, amelyk azo az elve yugszk, hogy a varacákkal fordította súlyozott eltérés-égyzetösszegeket mmalzálja: y µ ˆ g = mµ /8/ = σ Szélsőérték-számítással azoal adódk, hogy a g y µ ˆ = µ ˆ = σ σ = 0 egyelet megoldása adja a becslőfüggvéyt: WLS µ ˆ = w y és = σ w = = σ. /9/ Ez a becslőfüggvéy természetese torzítatla és varacája: 4 ( ) ( σ ) σ WLS = = ( σ ) ( σ ) = ( σ ) Var µ ˆ =. /0/ = = σ = Úgy s becslőfüggvéyhez juthatuk, ha a torzítatla becslőfüggvéyek halmazá mmáljuk aak varacáját. Ha mdez a leárs becslőfüggvéyek teré törték, akkor jutuk el a legjobb torzítatla, leárs becslőfüggvéyhez (BLUE). Esetükbe ez azt jelet, hogy a következő korlátozott szélsőérték-feladatot kell megoldauk: w σ = m w =, feltéve, hogy w 0 és =. // w = A megoldást tt csak a legegyszerűbb ( = ) esetre mutatjuk meg, mvel tetszőleges esetére a megoldás kcst hosszadalmas (Huyad [000]). Ekkor g = w ( w ) σ m σ + w és a szélsőérték létezéséek elsőredű feltétele g w = w σ ( w ) σ = 0. Statsztka Szemle, 84. évfolyam. szám
80 Huyad László w Ezt átredezve σ = σ + σ -re az adódk, hogy w σ w = σ + σ, és e természetese. Tovább egyszerű átredezés utá ebből az kapható, hogy σ w =, // σ + σ am aalóg a /9/ WLS-súlyokkal. A hvatkozott taulmáy általáosságba s bzoyítja ezt, ezért azt állíthatjuk, hogy a WLS a legjobb leárs torzítatla becslőfüggvéyt (BLUE) eredméyez. Megjegyezzük, hogy a // súlyok alkalmazásáak egy gyakor példája a portfolóelmélet, ahol két (vagy több) kockázatú (varacájú) befektetés mmáls kockázatú (optmáls) portfolóját kívájuk összerak az összetétel (súlyok) alkalmas megválasztásával. Eddg a változók eloszlására semmféle feltételt em kötöttük k, ezért ezek az eredméyek eloszlástól függetleek, az eloszlásra ézve robusztusak. Ha feltételezük valamlye smert eloszlást a sokaság változóra, akkor a maxmum lkelhood alkalmazásával tovább, még erősebb eredméyeket yerhetük. Ilye esetekbe kézefekvő a ormáls eloszlás feltételezése, am ayt jelet, hogy mtaelemekre a továbbakba az y ~ N( µ, σ ) feltételezést tesszük, és a függetle mtaelemek matt a kovaracamátrx dagoaltását s feltételezzük. Ekkor a lkelhood függvéy és a log-lkelhood függvéy redre a következő lesz: y µ L = exp σ σ σ π = σ y µ log L = C, = σ ahol a C kostasba foglaltuk össze a µ -től em függő tagokat. A log-lkelhood szélsőértékhelyé jutuk el a maxmum lkelhood (ML) becslőfüggvéyhez. Az első dervált:, log L = µ = y µ σ σ, /3/ Statsztka Szemle, 84. évfolyam. szám
A heteroszkedasztctásról egyszerûbbe 8 és eek 0-helyé lehet szélsőérték. /3/-at megoldva az kapjuk, hogy ML µ ˆ = w y és = σ w = = σ. /4/ Mvel eze a helye a másodk dervált egatív, ez valóba ML-becslőfüggvéy, és látható, hogy potosa megegyezk a /9/ WLS-becslőfüggvéyel. Ez természetese azt s jelet, hogy ormáls eloszlás eseté redelkezk az ML agymtás tulajdoságaval (kozsztes, aszmptotkusa hatásos és határeloszlása ormáls). A lkelhood függvéy elemzése azoba még tovább következtetések levoását eged meg. A másodk dervált ugyas log L =, µ = σ és eek alapjá az formácós határ eek várható értékéek -szerese I ( µ ) =, = σ am éppe recproka a WLS-becslőfüggvéy varacájáak: I( µ ) = =. /5/ Var ( µ ) = σ ˆ WLS Ez azt jelet, hogy ha feltételezzük a sokaság változók ormáls eloszlását, akkor a közös várható értékre készített becslőfüggvéy varacája elér a Cramér Rao alsó határt, így a becslőfüggvéy véges mtá s abszolút hatásos (MVUE) (Huyad [00]). Következtetések A következtetéseket összefoglalva krajzolódk az a éháy állítás, amelyek ebbe, a legegyszerűbb esetbe jellemzk a heteroszkedasztkus köryezetbe készített becsléseket. Heteroszkedasztkus köryezetbe a µ egyszerű OLSbecslőfüggvéye torzítatla marad. Statsztka Szemle, 84. évfolyam. szám
8 Huyad: A heteroszkedasztctásról egyszerûbbe A varaca OLS-becslése ebbe az esetbe értelmetle. Köye lehet talál olya torzítatla becslőfüggvéyt, amelyk varacája ksebb, mt az OLS-becslőfüggvéyé, tehát az elveszt hatásosságát. A súlyozott legksebb égyzetekkel készült becslőfüggvéy (WLS) torzítatla és a legjobb leárs tulajdoságokkal redelkezk. Ha feltételezzük, hogy a változók ormáls eloszlást követek, akkor a maxmum lkelhood módszer a WLS-sel megegyező becslőfüggvéyt javasol. Ez em csupá aszmptotkusa, de véges mtákba s legjobb (mmáls varacájú) torzítatla becslőfüggvéy, és agy mták eseté örökl az ML tulajdoságat, azaz kozsztes, és határeloszlása ormáls. Mt azt korábba említettük, a vzsgált modell az y = β0 + βx + ε leárs regresszós modell specáls esete, ha β 0 = µ és β = 0. A heteroszkedasztctással kapcsolatos ökoometra elemzések legegyszerűbb esetbe egy lye regresszós modellből dulak k, de mvel a heteroszkedasztctás a maradékváltozó jellemzője, az tt bemutatott tulajdoságok aalógok az ökoometrából smertekkel, értelemszerű általáosítások mellett. Nem foglalkoztuk a heteroszkedasztctás egy sor egyéb voatkozásával, így azzal, hogy mkét lehet kmutat (grafkusa, tesztekkel), azzal, hogy mkét lehet becsül, és a becslések mlye tulajdosága vaak akkor, ha a σ -k em smertek, mlye hatással vaak a külöféle traszformácók a heteroszkedasztctás kezelésére stb. Reméljük azoba, hogy elértük azt az alapvető célt, hogy egyszerű, köye áttekthető feladato, jórészt elem eszközök segítségével megmutassuk a heteroszkedasztctás jelelétébe alkalmazott és alkalmazható becslések tulajdoságat. Irodalom HUNYADI L. [000]: A kétmtás t-próbáról. I: Fél évszázad statsztka szolgálatába. Taulmáykötet Köves Pál tszteletére. Közpot Statsztka Hvatal. Budapest. HUNYADI L. [00]: Statsztka következtetéselmélet közgazdászokak. Statsztka módszerek a társadalm és a gazdaság elemzésekbe. Közpot Statsztka Hvatal. Budapest. KŐRÖSI G. MÁTYÁS L. SZÉKELY I. [990]: Gyakorlat ökoometra. Közgazdaság és Jog Köyvkadó. Budapest. MADDALA, G. S. [004]: Bevezetés az ökoometrába. Közgazdaság taköyvek. Nemzet Taköyvkadó. Budapest. RAMANATHAN, R. [003]: Bevezetés az ökoometrába alkalmazásokkal. Paem Kadó. Budapest. Statsztka Szemle, 84. évfolyam. szám