VITA A DETERMIÁCIÓS EGYÜTTHATÓRÓL HUYADI LÁSZLÓ Egyes vélekedések szernt a regresszós modellek (többszörös) determnácós együtthatója nem jó mutatószám, hszen sok olyan hányossága van, amelyek folytán alkalmazása kerülendő, de legalábbs nagyon szűk körre korlátozandó. Ezekkel a nézetekkel vtatkozva a ckk felsorakoztatja a determnácós együttható kedvező tulajdonságat, amelyek a regresszós elemzés egyk központ fontosságú mutatójává avatják. A tanulmány bemutatja a determnácós együttható alkalmazását leíró keretek közt, kapcsolatát a modellválasztás krtérumokkal, szerepét a regresszós modell különböző tesztjeben, így a szokásos AOVA F-tesztben, a paraméterkorlátozások vzsgálatában, és kapcsolatat az aszmptotkus próbákkal. Végső következtetése az, hogy bár a determnácós együttható egyoldalú alkalmazása és mnden határon túl öncélú növelése valóban kerülendő, a mutató alkalmazása nem nélkülözhető, nagyon ks értéke pedg, amk jellemzők a szocológa kutatásokra, komoly modellhbák jelzése lehetnek. A TÁRGYSZÓ: Korrelácószámítás. Regresszó. Modellépítés. nem kísérlet elrendezésű adatokat felhasználó tudományok közös gondja az, hogyan alakítsák k modelljeket, hogyan hdalják át az elmélet(ek) és a nem smételhető kísérletek által szolgáltatott adatok ellentmondását. A társadalm gazdaság modellezés, ahol ez a nem kísérletező jelleg domnál, egyk gen elterjedt hagyományos eszköze a regresszós elemzés. A regresszószámításban általánosan használt mutató az R többszörös determnácós együttható, amelynek alkalmazása azonban ellentmondásos. Mndenk használja, de gyakran helytelen értelmezést adnak nek. Van ak túlbecsül, van ak látn se szeretné. A helyzetet bonyolítja az s, hogy a modellezés változó alapelve ugyanannak a mutatónak gyakran más és más tulajdonságát emelk k, ezért egyes mutatók megítélése dőben s változó. Az R s lyen ellentmondásos mutató. Móta a Statsztka Szemle főszerkesztője vagyok, többször volt alkalmam találkozn szocológa tanulmányokkal (például Róbert; 1998, Bukod Róbert; 1999, Fényes; 1999), amelyek szerző számomra örvendetes módon gen gyakran modellszámításokkal kívánták alátámasztan mondanvalójukat. Ezen modellek egyk közös jellemzője mnt arra a szerzőknek többször rámutattam az volt, hogy nagyon alacsony volt a determnácós együttható, am szerntem a modellek alkalmazhatóságát, a belőlük levonható következtetéseket alapvetően kétségessé tette. A szerzőket azonban ez a bírálat nem rázta meg, hanem mntegy megmosolyogva bírálatomat arra hvatkoztak, hogy Moksony Fe
754 HUYADI LÁSZLÓ renc egyk tanulmányában (Moksony; 1997) megndokolta, mért nem kell a szocológa kutatásokban ezt a tényt (mármnt az alacsony R -et) komolyan venn. Gondolatmenete az, hogy, maga az R nem gazán jó, lletve nem meghatározó mutató, ezért azokban a kutatásokban, ahol a fő cél nem az előrejelzés, hanem a hatáselemzés (az elmélet magyarázata, ellenőrzése vagy talán még nkább okság elemzés), használata nem ajánlott, következésképpen ks értéke nem lehet a modell rossz voltának mérőszáma, sőt ez esetleg még jó s lehet. (A kcs szép Small s beautful.) A tanulmány alapos áttanulmányozása után döntöttem úgy, hogy az abban foglaltakat meg kell válaszolnom, egyrészt azért mert több alapvetően helyes megállapítása mellett néhány kfejezetten téves állítást s tartalmaz, érvelése nem következetes, szemlélete gyakran a 30-40 évvel ezelőtt állapotokat tükröz, és főleg azért, mert a tanulmány, esetleg szándékán kívül, azt sugallja a fatal szocológusok nemzedékének, hogy a modellezés során, legalábbs a modell magyarázó ereje tekntetében, génytelennek lehet lenn. Eredetleg nem volt célom, hogy tételesen vtatkozzam Moksony Ferenc ckkével, hszen ha egy kcst jobban elmélyül a vzsgált kérdésekben, ha a szocológa rodalom mellett a kérdés statsztka ökonometra rodalmával s megsmerkedk, ha a magyar statsztka rodalmat egy kcst alaposabban átnéz, maga s rájön arra, hogy am helyes és ésszerű a mondanvalójában, azt már régen alaposabban s kelemezték, am pedg helytelen, arra jórészt másutt s rámutattak. Célom ennek kapcsán nkább az volt, hogy a vtatott R fontosabb tulajdonságat öszszegyűjtsem, megkíséreljem azokat rendszerezn és a jelenleg korszerűnek teknthető felfogás szernt értékeln. A tanulmány írása során azonban nem tudtam szó nélkül elmenn Moksony Ferenc egyes állítása mellett, ezért a megfelelő alapozás után azokra részletesen s ktérek. Ennek kapcsán megpróbálom bebzonyítan azt, hogy az R talán mégsem olyan rossz mutató, mnt amlyennek a szerző beállítja, talán mutat valamt, nem s keveset, és főleg arra szeretnék rámutatn, hogy a feltűnően ks R esetenként mlyen problémákat okoz. Még melőtt a lényegre térnék, szeretném tovább szűkíten a tárgyat: Moksony Ferenc szocológa kutatásokban alkalmazott modellekről beszél, én nkább a gazdaság ökonometra alkalmazásokat smerem. A kettő azonban lényegében nem tér el egymástól. A statsztka tudomány egysége a módszerekben rejlk, a módszerek azonossága az, am a statsztkát önálló tudománnyá avatja. Ezért a továbbakban statsztkusként, nem pedg közgazdászként vagy kváltképp nem szocológusként kívánok foglalkozn a kérdéssel. A regresszószámítás az, am a tudományok esetében közös, am a statsztka alapot jelent, a különbség pedg a két terület között az, hogy míg a szocológa általában alacsony mérés skálán mért (kategoráls) változókat használ, és nagymntás keresztmetszet elemzéseket végez, az ökonometra többnyre magas szntű mérés skálákon mért változókkal és vszonylag rövd dősorokkal (rtkábban paneladatokkal) dolgozk. A módszertan azonban közös. A továbbakban a determnácós együttható mnt leíró mutató különféle származtatás módjat és ebből adódó értelmezését mutatom be, először önállóan egyetlen kragadott modell, majd összehasonlító módon, több, egymással versenyző modell esetére. Ezt követően megvzsgálom, hogy mlyen szerepe van az R mutatónak mntavétel keretek közt, végül megkísérlem összegezn a következtetéseket, és ennek során rövden megfogalmazom Moksony Ferencnek adott válaszomat s.
A DETERMIÁCIÓS EGYÜTTHATÓRÓL 755 A DETERMIÁCIÓS EGYÜTTHATÓ LEÍRÓ KERETEK KÖZT Az elemzésben a determnácós együtthatót mnt leíró mérőszámot vzsgálom. Abból ndulok k, hogy van egy megfgyelt sokaságunk, amelyen értelmeztünk egy vagy több regresszós összefüggést, melyeket egyebek közt az R mutatóval jellemeztünk. Első lépésben azt nézem meg, hogy egyetlen modell keretében mlyen értelmezés adható ennek a mutatónak, majd azt fogom vzsgáln, mlyen szerepet játszhat e mutató egymással versenyző modellek összehasonlításában. Az együttható származtatása, értelmezése A determnácós együttható több elv alapján s származtatható. A továbbakban ezek közül négyet szeretnék rövden átteknten. a) Az R legegyszerűbb származtatása a varancafelbontás tételéből adódk. Legyen ugyans egy lneárs regresszós modellben az eredményváltozó varancája 1 Var(Y)=SST/, a magyarázott (külső) varanca belső) varanca pedg Var( Y ) Var( Y ) Var( e ), és nnen Var(Ŷ ) SSR/, a maradék (rezduáls, Var( e ) SSE/, akkor a varancafelbontás tétele alapján Var(Ŷ ) Var( e ) SSR Var(Y ) Var(Y ) SST SSE SST 1. /1/ Az /1/ egyenletet akár a varancák, akár a négyzetösszegek oldaláról nézzük, azt látjuk, hogy a regresszó által leírt, megragadott (megmagyarázott) rész és a meg nem ragadott, le nem írt (meg nem magyarázott) rész hogyan oszlk meg százalékosan. Az ebből a megoszlásból kragadott első tagot nevezzük determnácós együtthatónak, azaz R SSR 1 SST SSE SST. // A // egyenlet értelmezésére később még vsszatérünk, egyelőre csak annyt jegyzünk meg, hogy szándékosan nem specfkáltuk sem a megfgyelések számát (), sem pedg a változók számát (K) vagy jellegét (mérés skála) demonstrálva ezzel a // gen általános voltát. A // azt mutatja meg, hogy mekkora a regresszó által az eredményváltozó varancájából megmagyarázott hányad (magyarázó erő). Az s látható, hogy R az lleszkedés szorosságát mérő mutatószám. b) A másodk származtatás mód az ún. PRE- (Proportonal Reducton of Error) elven alapul, melyet éppen szocológusok dolgoztak k, s melynek részletes magyar nyelvű leírását egyebek közt a Hunyad Mundruczó Vta (1996) tankönyvben találhatjuk meg. Az elv lényege azt vzsgálja, vajon az eredményváltozóra vonatkozó előrejelzésünk hbája hogyan változk (hány százalékkal csökken) akkor, ha az Y változóra vonatkozó smeretenk mellett még a magyarázó változókra ( X ) vonatkozó (feltételes) nformácókat s j 1 A továbbakban általában a Hunyad Mundruczó Vta (1996) jelöléset használom.
756 HUYADI LÁSZLÓ felhasználjuk. Ebben az értelmezésben, ha az X j -kre vonatkozó smeretek nagyban javítják (ex post) előrejelzésünk pontosságát, akkor ezek a változók szoros kapcsolatban állnak az Y változóval, lyen értelemben a PRE-elven felépülő mutatók a kapcsolat szorosságának mutatószáma. A következőkben ezt a megalapozást egy többváltozós (sokaság) regresszós modellre mutatjuk be. Legyen knduló modellünk M Y 0 j1 alakú, a paraméterek legksebb négyzetekkel történő becslése után becsült modellünk pedg: j X j M ˆ 0 j X j j1 Ŷ ˆ. Ekkor az Y változó értékenek csupán az önmagában rejlő nformácókra támaszkodó legjobb becslése (ugyancsak a legksebb négyzetek értelmében) Y, a becsléskor elkövetett hba (megnt négyzetes értelemben) 1 (Y Y ) = SST = E 1. Ha smerjük az X változók értéket, akkor ezek segítségével elkészíthetjük az Ŷ regresszós becslést. Ennek smeretében az elkövetett összese hba értéke E (Y Ŷ ) SSE, és a PREelv alkalmazásával: E E PRE E SST SSE SSR SST SST 1 1 1 Az R mutató tehát felfogható olyan kapcsolatszorosság mérőszámnak s, amelyk azt mutatja, hogy a modellbe bekapcsolt magyarázó változók mlyen mértékben javítják a vzsgált jelenségre vonatkozó nformáltságunkat, menyre csökkentk a jelenségre vonatkozó (megfgyelés tartományon belül, azaz ex post) előrejelzésünk bzonytalanságát. c) Ismeretes, hogy a determnácós együttható a többszörös korrelácós együttható négyzete, és mnt lyen felfogható egy olyan lleszkedés mutató négyzetének, amelyk azt mutatja, hogy a modellel becsült értékek mlyen szoros sztochasztkus kapcsolatban állnak a valóságos adatokkal, azaz mlyen mértékben mozog együtt becsült modellünk a valósággal, azaz R r(y,ŷ ). d) Végül megmutatjuk, hogy az R mutató kétváltozós lneárs regresszó esetén nem csupán a magyarázatnak, az lleszkedésnek, az előrejelzés hbának, hanem a lneartásnak s mérőszáma. Kétváltozós lneárs esetben ugyans a megmagyarázott négyzetösszeg SSR 1 (Ŷ Ŷ ) 1 1 1 R. 1 1 ˆ ˆ ˆ ˆ ˆ ( X X ) ( X X ) ˆ d, 0 1 0 1 x
A DETERMIÁCIÓS EGYÜTTHATÓRÓL 757 amnek okán a regresszós együttható és a korrelácós együttható közt smert összefüggésből adódóan R SSR SST ˆ 1 d d x y r kapható. Ez az nterpretácó tehát azt jelent, hogy kétváltozós esetben az R egyben a lneartás mérőszáma s: mnél közelebb esk értéke 1-hez, annál nkább tömörülnek a megfgyelés értékek egy egyenes mentén, annál nkább gazoltnak látszk a modellezők által előszeretettel alapul vett lneartás feltétel. Az R néhány nterpretácójának bemutatása után, érdemes egy kcst megálln és elgondolkodn azokon az állításokon, melyeket ezekkel kapcsolatban Moksony Ferenc megfogalmazott, ak a magyarázó erővel kapcsolatban felvet a tartalm és a statsztka magyarázat eltérését. Igazat kell adn nek abban, hogy egy regresszóban a magas R önmagában még egyáltalában nem jelent tartalm magyarázatot. Igen, a tartalm és a statsztka magyarázatot meg kell különböztetn, és ehhez a hams regresszó közsmert példá hozzásegítenek. Azt azonban nem hszem, hogy egy kcst s gényes elemzésben valak helytelenül értelmezné a tartalm magyarázatot. Egy dolgot azonban mndenképpen hozzá kell ehhez tenn. Azt, hogy az egyk jelenség magyarázza-e valóban a máskat olyan értelemben, hogy oka a másknak, gyakran még logka szakma alapon sem lehet eldönten. Ezért a statsztkusok és az ökonométerek statsztka mutatókkal s megkísérelték az okságot megragadn. Jóllehet maga az okság vzsgálata a tesztekhez, tehát a mntából való következtetéshez kapcsolódk, az elv tt s megállja a helyét. Eszernt egy X jelenséget (változót) akkor tekntünk egy másk (Y) jelenség okának, ha az X smerete növel az Y-ra vonatkozó smeretenket. Mvel a koncepcót dősoros változókra dolgozták k, először megvzsgálják, hogy Y a saját magában (múltjában) lévő nformácókkal hogyan magyarázható (jelezhető előre), majd azt vzsgálják meg, hogy az előrejelzés pontossága (amt akár R mutatóval s mérhetünk) javul-e, mennyt javul akkor, ha bekapcsoljuk X-et. Ha javul, akkor azt állíthatjuk, hogy X oka Y-nak, azaz ebben az értelemben valóban magyarázza azt. Az okság megerősítéséhez azonban még az s kell, hogy belássuk a helyes rányt, azaz esetünkben azt s kmutassuk, hogy ha X oka Y-nak, akkor egyrányú okság kapcsolat esetén Y vszont nem oka X-nek. Amt Moksony Ferenc az előrejelzésről ír, algha tartható, ugyans nem választja szét következetesen az ex post és az ex ante előrebecslést (Moksony; 1998. 3. és 5. old.). Mnt azt korábban megmutattuk, az ex post előrejelzés ereje valóban szoros kapcsolatban van az R mutatóval, ám az, hogy m lesz a megfgyelés tartományon kívül, az elsősorban nem az R -től függ, hanem attól, hogy a megfgyelés tartományon kívül ugyanazok a törvényszerűségek érvényesülnek-e, mnt a megfgyeléseken belül, más szóval a jó ex ante előrejelzés feltétele az, hogy az eredményváltózónak a magyarázó változókra vonatkozó feltételes eloszlása ne változzék. Ennek pedg csak kevés köze van az R -hez. Ezt csak és legfeljebb olyan szakma smeretek gazolják, amelyek mögött valód, ndokolható ma Látható, hogy az elv egy kcst hasonló a PRE-elvhez, és ha az dősorokban lévő többletnformácókról elfeledkezünk, akkor ez az elv éppen az R mutatóhoz vezet. Ez azonban nem lyen egyszerű, mert az R mutató tulajdonsága matt, ha csak két változóról van szó késleltetett hatások nélkül, mndg szmmetrkus kapcsolatokat találunk.
758 HUYADI LÁSZLÓ gyarázat áll. Ha például előre kívánjuk jelezn az nflácót, nem elegendő feltárn azt, hogy az nflácó mlyen módon és mértékben függ a vlágpac energaáraktól, sem azt hogy megalapozott feltevésekkel rendelkezünk-e az energaárak jövőbel alakulásáról, de abban s bztosnak kell lennünk, hogy a hatásmechanzmus dőben állandó marad. Ennek pedg kevés köze van ahhoz, hogy skerült-e a múltra jól lleszkedő modellt készítenünk. (Az ökonometra és a regresszós modellek jelenleg bíráló egyebek közt ezt a fajta dőbel állandóságot vonják kétségbe, és ennek tudják be a korább modellek gyenge előrejelző erejét.) Amt Moksony Ferenc az lleszkedés szorosságáról (Moksony; 1998. 7. old.) ír, annak kétségtelenül van ésszerű magja, am a modellek összehasonlításakor még szóba fog kerüln. Egyetlen modell értékelésekor azonban és most egyelőre tt tartunk nem látom értelmét. Mesterkéltnek tartom azt az érvet, mszernt a modellező befolyásoln tudja a magyarázó változó(k) szóródását. Mesterséges kísérletekben ez természetesen megtehető, készíthetők érzékenységvzsgálatok, de az a feltevés, mszernt a 1 (Ŷ Ŷ ) ˆ 1 1 ( X X ) egyenletben mnden mást állandónak lehet teknten, csak X szóródása változk, véleményem szernt értelmetlen. Már csak azért s, mert ˆ 1 maga s függ az X szóródásától. Moksony Ferenc ezt azért nem látja, mert nem tesz vlágos megkülönböztetést az elmélet és a becsült paraméter között. Egyetlen modell értékelésekor tehát algha lehet kétségbe vonn azt, hogy az lleszkedés szorossága, am a modell egyk de természetesen messze nem egyetlen jellemzője, fontos, és ennek általánosan elfogadott jó mérőszáma éppen az R. Am a tökéletes modellről szóló fejtegetéseket llet (Moksony; 1998. 8. old.), természetesen egyet lehet érten azzal, hogy tökéletes modell nncs, a modell értékelésénél a tartalm kérdések a döntők, amre azonban következtetésként eljut, mélységesen nyugtalanító: mnden modell csak egy másk, a sajátunkéval versenyző elmélet talajáról bírálható az, hogy valamely modell jó vagy rossz, elmélet érveléssel dönthető csak el; az R -nek ebbe nncs beleszólása. Baj s volna, ha lenne; gépes számításokkal lehetne pótoln a tartalm gondolkodást. Azt hszem, érthető, ha ezt olvasva a statsztkusok felkapják fejüket, és sértve érzk magukat. Ebből ugyans az derül k, hogy e gondolatok szerzője nem rendelkezk kellő smerettel a modellezésről, a statsztka lényegéről (hszen tt már régen nem csak az R -ről van szó), arról, hogy az általa gépesnek nevezett gondolkodás nem más, mnt nagyon sok, alapos mély megfontolás rendszerbe szedése, egymásra építése, algortmzálása, azzal, hogy a statsztka modellezés lényege éppen abban áll, hogy korrekt módon eljárva saját eszközevel tudja szemléln és értékeln a valóságot leképező elméleteket. em hszem, hogy szerencsés és bölcs dolog a tartalm gondolkodást és a statsztkát egymással szembe állítan, vagy ha valak ezt mégs tudatosan megtesz, akkor számolna kell a statsztkusok jogos krtkájával. Amt ezek után Moksony Ferenc példa gyanánt ír, pedg egyszerűen nem releváns. Közsmert, hogyan függ R a változók számának növelésétől, ezért ezt nem ndokolt lyen formában felvetn. (Erre a kérdésre a későbbekben, az összehasonlítások kapcsán még vsszatérek.) Ugyancsak nem szerencsés a leíró és a mntavétel tulajdonságok keverése, ezért az ezzel kapcsolatban írottakra s később reflektálok. Am pedg egy Mayer-dézetet
A DETERMIÁCIÓS EGYÜTTHATÓRÓL 759 llet (Moksony; 1998. 10. old.) amennyben olyan hpotézsek érdekelnek bennünket, amelyek a mnta által felölelt dőszakon túlra s érvényesek, akkor az lleszkedés mutató gen gyenge ránymutatást jelentenek csupán azzal tökéletesen egyet lehet érten. Ez teljes mértékben megfelel annak, amt az ex ante előrejelzésekről korábban írtam, és ellentmondásban van Moksony Ferencnek korábban (3. és 5. old.) az előrejelzés kérdéséről kfejtett véleményével. Az aggregálás és az R kapcsolatáról Moksony Ferenc által mondottak helytállók ugyan, de valójában közsmert tényeket emlegetnek: ha az aggregálással a vzsgált változó (adott esetben a jövedelem) belső szóródását megszüntetjük, a teljes szóródás s csökken. Az, hogy egy ksebb szóródású változóra jobban lleszkedő egyenletet lehet becsüln, megnt csak nylvánvaló. Az pedg, hogy az R erre az aggregálásra értékének növelésével válaszol, véleményem szernt nem hba, hanem éppen azt mutatja, hogy vselkedése összhangban van az ésszerű statsztka gondolkodással. Az R nagyságáról annyt kétség kívül el kell mondan, hogy más és más modellek lletve adatbázsok esetén eltérő. Idősoros elemzések esetén többnyre az dősorokban rejlő közös tendencák következtében általában gen nagy, nem rtkán 0,999 erősségű determnácó tapasztalható. Keresztmetszet elemzésekben ez az érték lényegesen ksebb szokott lenn. Ámde melőtt ebből azt a következtetést vonnánk le, hogy lám mennyre eltérők az értékek, gondoljunk arra, hogy a tapasztalt és tsztességes elemzők soha nem az esetleges 0,999-et tűzk zászlajukra hanem smerve ennek fonákságát a megalapozott következtetések érdekében gyekeznek megszabaduln a látszatkorrelácóktól (például azzal, hogy nem az eredet dősort, hanem annak dfferencát vagy hányadosat, azaz az dősor változásanak valamely mértékét vzsgálják). Ezeket állítva egymással regresszós kapcsolatba, már korántsem kapunk olyan túlságosan szép, hhetetlen lleszkedéseket. Ezek voltak rövden észrevételem Moksony Ferenc bírálatanak egy részére, de még ezek kapcsán hátra van az, hogy megvzsgáljuk, mt jelent a nagyon ks R, amnek védelmében Moksony Ferenc a korábban bemutatott érveket felsorakoztatta. Mndenekelőtt tsztázn szeretném, hogy a legkevésbé sem akarom azt a kétségtelenül helytelen gyakorlatot bármlyen módon s támogatn, amelyk valóban látszat-megoldásokkal elért nagy R értékekkel akarja bzonyítan gazát. Azonban mnőség különbséget látok az R nyakló nélkül növelése, és a 3-5 százalékos modellek nem kellő óvatossággal történő elemzése, értelmezése között. agyon ks R -en a továbbakban 0,1 alatt R -et értek. A nagyon ks R egyfelől azt jelent, hogy az lleszkedés gyenge, rossz, a modellnek gen kevés köze van a valósághoz. Azt s jelent, hogy a modell magyarázó ereje kcs, azaz alg lehet valamt mondan a változók közt kapcsolatról, éppen az, amre alkalmazn akarjuk a modellt, nem úgy működk, ahogy kellene. A valóságnak csak valam egészen ks szeletét tudtuk megragadn a modellel, így az nem jelent lényeges többletnformácót a vzsgált változó szempontjából. em hszem, hogy ezekre a kfogásokra olyasm lehet a válasz, hogy csak egy változó hatását akarjuk vzsgáln, nem pedg az egész bonyolult rendszert. Ha csak egy változó hatását akarjuk vzsgáln, akkor egyváltozós elemzést célszerű végezn, ha pedg ez esetleges alkalmas kontrollváltozók bevonását gényl, akkor joggal várhatjuk el, hogy a valósághoz valamelyest közel álló eredmények adódjanak, hszen ha nem, akkor mre valók a kontrollváltozók. Külön probléma adódk akkor, ha csak kétváltozós elemzést végzünk, és ott kapunk gen kcs R mutatókat, hszen ez egyben a modell lneartásának s krtkája, azt s jelent, hogy a modell megformázása s hbás volt
760 HUYADI LÁSZLÓ (lehetett). Összességében ezen a ponton talán úgy lehet fogalmazn, hogy a nagy R önmagában még nem jelent jó modellt, de a nagyon ks R erősen arra utal, hogy modellünk rossz, és következtetésenket nagyon óvatosan kell megfogalmaznunk. A modellek összehasonlítása Az eddgekben mndg azt feltételeztük, hogy egyetlen modellünk van, azt számszerűsítjük, és az alapján szeretnénk a valóságot valamlyen sznten megítéln. Ez a kérdés a modellezés hőskorában még elfogadható volt, és a statsztka ökonometra modellezés apparátusa s sokág ebben a szellemben fejlődött, hszen egy kválasztott modellt szerettünk volna becsüln, elemezn, a valósággal szemben teszteln. Ennél érdekesebb és főleg lényegesebb kérdés az, amt a modern rányzatok egyre nkább előtérbe állítanak, nevezetesen az, hogy az egyes modelleket egymással szemben hogyan értékeljük. Ekkor tehát nem a tökéletes modell, hanem a mnél jobb modell megalkotása a cél. Ennek érdekében előtérbe kerültek az összehasonlítások módszere, a modellváltozatok közt választást elősegítő eszközök. Szűkítve a tárgyat, a továbbakban az R mutatót mnt a modellek közt választás eszközét vzsgáljuk. A kérdés tehát az, hogy két vagy több egymással versenyző modell közül melyket tekntjük statsztka szempontból jobbnak. Moksony Ferenc ezzel a kérdéssel s részletesen foglalkozk. Egyfelől a modellválasztás kapcsán (5. és 6. old.) bírálja az R mechankus alkalmazásán alapuló stepwse regresszó módszerét, majd felvet az eltérő szóródást mutató magyarázó változók esetét, végül a 9. oldalon a kontrollváltozók bevonásakor érnt a magyarázó változók számának és az R -nek a vszonyát. Ezzel a kérdéssel kapcsolatban mndenekelőtt arra kell utaln, hogy közsmert az R azon tulajdonsága, mszernt ha egy létező változókört a regresszóban egy tovább változóval bővítünk, akkor a bővített modell R mutatója nagyobb vagy egyenlő lesz az eredetével, és az egyenlőség s csak gen rtka, specáls, gyakorlatban sznte soha elő nem forduló esetekben adódk. 3 Ebből következk, hogy az összehasonlításokra az R valóban nem alkalmas, ezért az optmáls (legalábbs formálsan optmáls) modell változónak kválasztásánál nem jó stratéga az R mutatók alapján végezn a válogatást. A stepwse szelekcós eljárások (amelyek napjankban egyébként sem gazán népszerűek) sem az egyszerű algortmust használják, hanem lényegesen kfnomultabb módon járnak el (nem csak az R alapján válogatnak, fgyelembe veszk a t és az F értékeket, bztosítanak egy sor vsszaléptető ellenőrző fázst stb.). Ezekben az esetekben a modellválasztás alapja a rezduáls varanca, am nem más, mnt a szabadságfokkal osztott maradék négyzetöszszeg, azaz ˆ e SSE/( M 1), ahol M a magyarázó változók számát jelöl. Ésszerűnek tűnk az a krtérum, hogy (csupán statsztka szempontból) azt a modellt tekntsük a legjobbnak, amelyk mnmalzálja ezt a varancát. A statsztkusok azonban és ezt kváltképp ajánlom Moksony Ferenc fgyelmébe annyra megszokták és megszerették az R mutatót, hogy megkonstruálták azt az egyszerű transzformáltját, amelyk tulajdonságaban hasonlít az eredet R -hez, de modellválasztás cél esetén az előbb rezduáls varancával egyenértékűen használható. Ez a Thel-féle, szabadságfokkal korrgált R, 3 Ennek az állításnak az gazolása mnden haladó, regresszóról szóló vagy ökonometra műben megtalálható (például Mundruczó; 1981).
A DETERMIÁCIÓS EGYÜTTHATÓRÓL 761 közsmert, népszerű, mnden számottevő regresszós programcsomag kszámítja és standard eredményként közl. A Thel-féle korrgált R defnícója a következő: R 1 1 ( 1 R ). /3/ M 1 em részletezem a mutató megkonstruálásának elmélet hátterét (lásd például Thel; 1971), csupán bemutatom azt a fontos tulajdonságát, am matt alkalmazzuk. Felhasználva a teljes és a maradék négyzetösszeg smert SSE ( 1 R ) SST összefüggését, /3/ felírható a következő módon ( 1 R )SST 1 ( 1 R )SST M 1. /4/ Mvel a jobb oldal mennység éppen ˆ e, a bal oldal s az, s mvel adott Y változó és megfgyelésszám esetén a bal oldal R monoton csökkenő függvénye, az R maxmalzálása egyenlő a rezduáls varanca mnmalzálásával. Ezért ez az elv azt javasolja, hogy azt a modellt válasszuk, amelyk esetén az R maxmáls. Ezzel a krtérummal sokat lehetne foglalkozn, de most csak rövden említünk néhány tényt. A modern rányzatok (például Charemza Deadman; 1997) jóllehet nem vtatják a hasznosságát két hbájára hívják fel a fgyelmet. Egyrészt arra hvatkoznak, hogy ez a krtérum akkor s maxmumot mutathat, ha tartalmaz ugyan mnden fontos magyarázó változót, de tartalmaz felesleges, lényegtelen változókat s. Ez pedg ellentmond a statsztkában és ökonometrában általánosan elfogadott parsmona (lehető legegyszerűbb modell) elvének. A másk kedvezőtlen, mmár mntavétel tulajdonsága ezért valójában később kellene tárgyalnunk abból adódk, hogy az R ha mntából számítják, maga s valószínűség változó, eloszlása függ a modell több változójától, ezért a különböző modellek R mutató nem hasonlíthatók közvetlenül össze. Mndezen krtkák ellenére az R krtérum széles körben használt a modellválasztás feladatára, hszen, mnt számos alkalmazás és szmulácós kísérlet s mutatta, az esetek döntő hányadában helyes modellt eredményezett. Az R említett hányossága ugyanakkor megalapozták azt a kutatása rányzatot, amelyk a modellválasztás krtérumok kdolgozására vezetett, s amely krtérumokkal, lletve az R -hez fűződő kapcsolatakkal még foglalkozunk. Előtte azonban még az R -nek egy régen smert tulajdonságára szeretnénk felhívn a fgyelmet. Ez pedg az, hogy nagyon ks R értékek esetén R negatív értéket (!) vesz fel, ezért modellválasztás célra alkalmatlan. Könnyű belátn, hogy amennyben M R, 1 a korrgált R negatívvá válk, és így alkalmatlan tovább elemzésekre. Am az említett modellválasztás krtérumokat llet, valamenny hasonló gondolatra épül, mnt az R, azaz az R -et, vagy a maradék négyzetösszeget korrgálják valamlyen módon a modellben megjelenő változók száma szernt. Bár ezeket a krtérumokat többnyre
76 HUYADI LÁSZLÓ a maradék négyzetösszeggel fejezk k (Ramanathan; 1994. 81. old.), de érdekes összehasonlításra vezet az F-próbával való összevetésük (Maddala; 1988. 430 431. old.) s. A következőkben példa gyanánt az gen gyakran használt AIC-krtérumot (Akake Informaton Crteron) írjuk át az R függvényében. Az AIC az SSE AIC exp( K / ) /5/ mutatóra épül, és tekntve a közsmert SSE SST( 1 R ) összefüggést, azonnal felírható ez a krtérum az R függvényében: SST( 1 R ) AIC exp( K / ). /6/ A /6/ alapján látható, hogy rögzített változószám esetén az AIC az R monoton csökkenő függvénye, s mvel az AIC mnmuma vezet optmáls modellhez, ez az R maxmálásával egyenértékű. Természetesen, ha a változók száma (K) nem azonos, akkor a választást R mellett ez s befolyásolja. Mvel a több krtérum s mnden nehézség nélkül átírható lyen módon, és ezek azt mutatják, hogy míg a megfelelő krtérum mnmalzálása vezet a legjobb modellhez, és a krtérumfüggvények R -nek többnyre (de nem mndg és nem monoton módon) csökkenő függvénye, a nagyobb R nkább a modellek elfogadásához, a kcsk azok elutasításához vezetnek. Különösen érdemes fgyeln arra, hogy a nagyon ks R esetén túl az említett negatvtáson általában ezek a krtérumok a megfelelő modellek elutasítása mellett döntenek, lletve két ks R -tel rendelkező modell esetén döntésekben bzonytalanokká válhatnak. A modellek összehasonlításában játszott szerepét lletően az R mutatónak még két sajátosságát célszerű megemlíten. Egyfelől kterjedt rodalma van annak a kérdésnek, hogyan lehet mérn az R mutató segítségével az egyes változók hozzájárulását a regreszszós egyenlet magyarázatához, hogyan lehet ezt a dekompozícót felhasználn a multkollneartás elemzéséhez, m a parcáls korrelácós együtthatók és a determnácós együttható kapcsolata (például Thel; 1971, Mundruczó; 1981). Ezek a részletes elemzések arra utalnak, hogy az R mutató, ha méganny hbája s van, fontos szerepet játszk a korrelácós mutatók rendszerében, abból k nem emelhető. Másodszor meg kell jegyeznünk azt, hogy bár mnőség eredményváltozós modellek (logt, probt, tobt stb.) esetén ez a mutató közvetlenül nem alkalmazható, a kutatók annyra megszokták alkalmazását, hogy ezekre az esetekre s kfejlesztették a megfelelő R -et, és elkészítették egyebek közt az Efron, a Cragg Uhler vagy a McFadden-féle általánosításat, melyek konstrukcója az eredet mutató alapötletére épül (déz Maddala; 1988). KÖVETKEZTETÉS MITÁBÓL Az eddgekben szándékoltan csak olyan esetekkel foglalkoztunk, amelyekben feltételeztük, hogy a megfgyelések a sokaság egészére kterjednek. Bár már ott s néha kénytelenek voltunk kteknten a mntavételre, most azonban kfejezetten azt a feladatot vzs
A DETERMIÁCIÓS EGYÜTTHATÓRÓL 763 gáljuk meg, amkor megfgyelésenk csak egy mntára vonatkoznak, és a mntából számított mutatók segítségével kívánunk következtetn sokaság összefüggésekre. Elsőként célszerű a többváltozós regresszószámítás talán leggyakrabban használt tesztjét, a globáls F-próbát bemutatn. Ismeretes, hogy ennek nullhpotézse az, hogy a (lneárs regresszós) modell rossz, az eredményváltozót saját átlagával becsülve kapjuk a jó modellt, a több specfkált változó ehhez már nem tud érdemben semmt hozzátenn. Az F-próba felírható (és gyakran fel s írják) az R függvényében az alább módon: R n m 1 F F( m,n m 1). /7/ 1 R m Mvel tudjuk, hogy a modell helyességét tesztelő F-próba jobboldal krtkus tartománynyal rendelkezk, a nagyobb F-értékek mutatnak az elutasítás, azaz az elfogadható modell rányába, míg a ks F-értékek a rossz modell jellemző. Bár a krtkus értékek természetesen a szabadságfok függvényében változnak, ha mnd a mntanagyságot, mnd pedg a változószámot rögzítjük, akkor egyértelműen látszk, hogy a nagyobb R értékek jelzk a jó, a ksebbek pedg a rossz modellt. Azt már az adott feladat mérete dönt el, hogy ez a modell még szgnfkáns-e, avagy sem. Ennek vzsgálatára érdemesnek találom a napjankban gen népszerű aszmptotkus próbák megfelelő eredményet bemutatn és azokból továbblépn. Ezek nagy erőssége, hogy a knduló eloszlás specfkálása nélkül fogalmaznak meg döntés szabályt arra, hogy a modell nagy mnták esetén rossz-e (nullhpotézs), avagy van benne valam jó s (ellenhpotézs). Ezeknek az aszmptotkus próbáknak a próbafüggvényet s a mntából számított R függvényében szokták kfejezn. A részletek mellőzésével 4 a megfelelő lkelhood arány (LR), Lagrange-multplkátor (LM) és a Wald-típusú (W) tesztelvekből nagy mnták esetén a következő eredmények adódnak: 1 d LR nlog ( m ), 1 R d LM nr ( m ), nr W 1 R d ( m). Szavakkal kfejezve, az egyes elvek alapján számított próbafüggvények a mntanagyság kellő növelése esetén a határon kh-négyzet eloszlást követnek, és az eloszlás szabadságfoka megegyezk a magyarázó változók számával. Mvel ezen kh-négyzet próbák esetén s az ellenhpotézs (a krtkus tartomány) a jobb oldalon jelenk meg, a jó modellek esetében a próbafüggvény értéke nagy, am, tekntve hogy mndhárom próbafüggvény R növekvő függvénye, smét azt jelent, hogy a nagy R -ek tendencaszerűen jobb, a kcsk rosszabb modellekre utalnak. Itt azonban egy érdekes paradoxra kell felhívnunk a fgyelmet. Arról van ugyans szó, hogy bármelyk esetben (ez legnkább az LM-típusú teszt esetén látható) gaz az, hogy csupán a mntanagyság növelésével tetszőlegesen nagy próbafüggvényérték érhető el, azaz legyen bármlyen kcs az R, a modell elegendő mntanagyság és rögzített változószám (m), 4 Kétváltozós esetre a levezetések megtalálhatók Maddala (1988) könyvében, többváltozós esetre lásd Ramanathan (1993).
764 HUYADI LÁSZLÓ esetén szgnfkánsnak mutatkozk. A szokásos szgnfkancateszteknek ez többé-kevésbé smert tulajdonságuk, elemzők erre már többször rámutattak, és a regresszós modellekkel kapcsolatban egyebek közt Leamer (1990) hívta fel a fgyelmet ennek fonákságára. Szocológa modellekben (például Bukod Róbert; 1999 vagy Fényes; 1999) gyakran találkozunk ezzel a problémával: a modellek gen rosszul írják le a valóságot, determnácós együtthatójuk messze 0,1 alatt marad, mégs a nagy, gyakran több ezres mnta folytán mnden szóba jöhető sznten szgnfkánsnak mutatkoznak. Ekkor már természetesen nem lehet csodáln, ha mndg akad egy-két magyarázó változó, amelyk külön-külön s szgnfkánsnak bzonyul. A modern statsztka elmélet kutató rámutattak arra, hogy az ellentmondás oka a rögzített szgnfkancaszntben található. A hagyományos szgnfkancateszteknél rögzített szgnfkancasznt esetén a próba nagy mnták esetén erősen húz a nullhpotézs elutasítása rányába, így gyakorlatlag ezeket a próbákat nagyon nagy mntákra nem célszerű használn. A probléma áthdalására több megoldás s létezk (például bayes megfontolások, keverék-eloszlások használata), ezek alkalmazása azonban még nem krstályosodtak k. Ezek a kérdések egy kcst messzre vezettek az eredet céltól, az R mutató értékelésétől, ámde látn kellett, hogy annak tulajdonságaval, lletve alkalmazás nehézségevel függnek össze. Van azonban a mntavétellel kapcsolatban még egy olyan kérdés, amt tárgyaln kell, és amre Moksony Ferenc s utalt. Ez pedg az, hogy az eddgekben, amkor mntavétel keretről beszéltünk, mndg egyetlen mntából számítható R mutatót vzsgáltunk, és a kérdést úgy tettük fel, hogy ez az egyetlen mntából számított mutató mre enged következtetn. Van azonban a kérdésnek egy másk vetülete s, nevezetesen az, hogy maga az R s mnt mntából számított mennység mntavétel ngadozásnak van ktéve, értéke mntáról mntára változk. Sajnos az R eloszlását még eléggé szgorú feltételek mellett sem lehet valamely standard eloszlással egyértelműen leírn. 5 Ezért egzakt tesztelésére sncs alkalmas módszer, ám az elmondottakból egy dolog mégs nylvánvalóan kderül. Ha az R mntáról mntára ngadozk, a lényeges kérdés az lehet, hogy valamely konkrét esetben a determnácós együttható valóban 0-e, és csak a mntában tűnk 0-tól különbözőnek, avagy valóban sokaság sznten (szgnfkáns mértékben) s különbözk 0- tól. Jóllehet az eloszlásra nézve semmféle érdemleges eredmény nncs a brtokunkban, az ntutíve könnyen belátható, hogy nagyon kcs R -ek esetén sokkal nkább várható az, hogy azok csak a mnta sajátossága következtében vesznek fel 0-tól különböző értéket, mntsem az, hogy ez nagyobb R -ek esetén következk be. Ez smét a nagyon ks R -ek veszélyere hívja fel a fgyelmet. ZÁRÓKÖVETKEZTETÉSEK Az elmondottakat összegezve a következőkben látom a Moksony Ferenccel való vtában kemelendő pontokat: mondanvalójának azzal a részével, mszernt hbás elképzelés az, ha valak a modellek használhatóságát, jóságát egyedül az R mutató magas értékevel azonosítja, tökéletesen egyetértek; 5 Thel (1971) ezzel kapcsolatban déz Wshart eredményet, amelyek multnormáls modell feltételezése esetén s csak nehezen kezelhető, közelítő eredményeket adnak.
A DETERMIÁCIÓS EGYÜTTHATÓRÓL 765 nem értek ugyanakkor egyet azzal a megállapítással, mszernt a nagy R az előrejelzések esetén lényeges, a modellek értékelésénél és a modellépítésnél nem; ez utóbb álláspontomat azzal támasztottam alá, hogy bemutattam az R több lehetséges értelmezését, olyan transzformácót, amelyeket a modellépítés különböző pontjan kterjedten használnak; a nagyon ks R -ekkel rendelkező modellek külön problémát jelentenek, ugyans a) a nagyon sok megmagyarázatlan hatás kérdésessé tesz a csekély megmaradó eredményt, tesztelés esetén mndenképpen hátrányos helyzetbe kerülnek az lyen modellek (természetesen többnyre akkor, ha egymás ellen, nem pedg egy el- képzelt, de nem smert valóság ellen tesztelünk); b) a fontos R modellválasztás krtérum-mutató ekkor negatívvá, és ezáltal használhatatlanná válhat; c) gyanítható, hogy a nagyon ks mntabel R esetén a sokaság R = 0, ezért az egész modell értelmét veszt. Mndent összevetve, az R gen sok összefüggésben megjelenő, sznte központ fontosságú dagnosztka mutató, még akkor s, ha az utóbb években szerepe átértékelődött. Természetesen nem szabad fetszáln, de kellő óvatossággal használn lehet és kell, hszen nagymértékben segít a modellépítés munkáját. agyon kcs értéke veszélyeket hordoznak, ezért bár a nagy R önmagában nem jelent azt, hogy a modell jó, a kcs nagy valószínűséggel azt jelz, hogy a modell rossz. Lehet, hogy a kcs néha szép, de többnyre nem jó. IRODALOM BUKODI ERZSÉBET RÓBERT PÉTER (1999): A nők munkaerő-pac részvétele és a gyermekvállalás. Statsztka Szemle, 77. évf. 4. sz. 01 4. old. CHAREMZA, W. DEADMA, D. F.(1997): ew Drectons n Econometrc Practce ( nd ed.). Elgar P. Lm, Cheltenham. FÉYES HAJALKA (1999): Kísérletek az egyenlőtlenségek csökkentésére a felsőoktatásban. Statsztka Szemle, 78. évf. 3. sz. 151 169. old. HUYADI LÁSZLÓ MUDRUCZÓ GYÖRGY VITA LÁSZLÓ (1996): Statsztka. AULA, Budapest. LEAMER, L. (1978): Specfcaton Searches. Wley & Sons. Inc., ew York. MADDALA, G. S. (1988): Introducton to Econometrcs. Macmllan P.C., ew York. MOKSOY FEREC (1998): A kcs szép. A determnácós együttható értelmezése és használata a szocológa kutatásban. Szocológa Szemle, 77. évf. 4. sz. 3 17. old. MUDRUCZÓ GYÖRGY(1981) : Alkalmazott regresszószámítás. Akadéma Kadó, Budapest. RAMAATHA, R. (1993): Statstcal Methods n Econometrcs, Academc Press, San Dego. RÓBERT PÉTER (1998): Kk azok a vállalkozók? Közgazdaság Szemle, XLVI. évf. 5. sz. 403 47. old. THEIL, H. (1971.): Prncples of Econometrcs. Wley & Sons Inc., ew York. SUMMARY Accordng to some vews the coeffcent of determnaton of the multple regresson models has many defcences whch do not allow ts applcaton n a wde range of problems. Debatng wth these vews the paper summarses the advantageous features of the coeffcent of determnaton and shows ts central role n regresson analyss. The study hghlghts the propertes of ths measure n the descrptve statstcs, ts relaton to the dfferent model selecton crtera, to the AOVA F-test, and asymptotc tests as well. The concluson of the paper s that n spte of the dangers of msuse of ths ndcator, ts applcaton n regresson model-buldng s nevtable. Extremely small values of ths measure whch often occur n models of socology, may ndcate serous problems of the underlyng model.