A BINÁRIS LOGIT MODELLEK HASZNÁLATÁNAK ÉS TESZTELÉSÉNEK ESZKÖZEI



Hasonló dokumentumok
A központos furnérhámozás néhány alapösszefüggése

53. sz. mérés. Hurokszabályozás vizsgálata

Életkor (Age) és szisztolés vérnyomás (SBP)

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Feladatok megoldással

Mágneses anyagok elektronmikroszkópos vizsgálata

Integrált Intetnzív Matematika Érettségi

Szerző: Böröcz Péter János H-9026, Egyetem tér 1. Győr, Magyarország

BIOMATEMATIKA ELŐADÁS

Aktív lengéscsillapítás. Másodfokú lengrendszer tesztelése.

Modern piacelmélet. ELTE TáTK Közgazdaságtudományi Tanszék. Selei Adrienn

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

A vállalati likviditáskezelés szerepe eszközfedezettel rendelkező hitelszerződésekben

1. Vizsgazárthelyi megoldásokkal 1997/98 tél I. évf tk.

A Mozilla ThunderBird levelezőprogram haszálata (Készítette: Abonyi-Tóth Zsolt, SZIE ÁOTK, , Version 1.1)

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Elorejelzés (predikció vagy extrapoláció) Adatpótlás (interpoláció)

MATEMATIKA FELADATLAP a 8. évfolyamosok számára

Vezetéki termikus védelmi funkció

ISO 9000 és ISO 20000, minőségmenedzsment és információtechnológiai szolgáltatások menedzsmentje egy szervezeten belül

DR. JUHÁSZ MÁRTA BME Ergonómia és Pszichológia Tanszék 1111 Budapest, Egry J. u Tel: 1/

Egy harmadik fajta bolha mindig előző ugrásának kétszeresét ugorja és így a végtelenbe jut el.

Valószínűségszámítás. A standard normális eloszlás karakterisztikus függvénye. További tulajdonságok. További tulajdonságok.

Operatív döntéstámogatás módszerei

5. modul: Szilárdságtani Állapotok lecke: A feszültségi állapot

Országos Szilárd Leó fizikaverseny feladatai

Villamos érintésvédelem

A matematikai statisztika elemei

FELVÉTELI FELADATOK 8. osztályosok számára M 1 feladatlap

Néhány pontban a függvény értéke: x f (x)

Statisztikai hipotézisvizsgálatok

KORLÁTOS. mateking.hu BINOMIÁLIS ELOSZLÁS. Egy úton hetente átlag 3 balesetes nap van. Mi a valószínűsége, hogy egy adott héten 2 balesetes nap van?

A művészeti galéria probléma

GYAKORLÓ FELADATOK 3. A pénzügyi eszközök értékelése

MUNKAANYAG, A KORMÁNY ÁLLÁSPONTJÁT NEM TÜKRÖZI

VII. A határozatlan esetek kiküszöbölése

RSA. 1. Véletlenszerűen választunk két "nagy" prímszámot: p1, p2

Teherhordó üveg födémszerkezet: T gerenda ragasztott öv-gerinc kapcsolatának numerikus vizsgálata

n 1 1 n sehova szám (DÖNTETLEN) 1 0 k n n n 1 IZÉ HA a sorozat is lim akkor n NEVEZETES SOROZATOK HATÁRÉRTÉKEI ÖSSZEG HATÁRÉRTÉKE IZÉ

5. MECHANIKA STATIKA GYAKORLAT (kidolgozta: Triesz Péter, egy. ts.; Tarnai Gábor, mérnöktanár)

Mérés és elemzés Költség- és eredményelemzés

- 1 - A következ kben szeretnénk Önöknek a LEGO tanítási kultúráját bemutatni.

MINŐSÉGIRÁNYÍTÁSI KÉZIKÖNYV

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

22. előadás OLIGOPÓLIUM

I nyílt intervallum, ( ) egyenletet közönséges (elsõrendû explicit) differenciálegyenletnek nevezzük. Az

SOROK, FÜGGVÉNYSOROK SIMON ANDRÁS. m n=0 ca n = lim c m

Statisztika 1. zárthelyi dolgozat március 18.

Kalkulus II., második házi feladat

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Cikória szárítástechnikai tulajdonságainak vizsgálata modellkísérlettel

A szelepre ható érintkezési erő meghatározása

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Erő- és munkagépek I.

Matematikai statisztika

Módosítások: a) 22/2005. (IX. 19.) ör. b) 48/2006. (XII. 22.) ör. c) 7/2007. (II. 23.) ör. /2007.III. 1-

SIKALAKVÁLTOZÁSI FELADAT MEGOLDÁSA VÉGESELEM-MÓDSZERREL

M3 ZÁRT CSATORNÁBAN ELHELYEZETT HENGERRE HATÓ ERŐ MÉRÉSE

1. Testmodellezés Drótvázmodell. Testmodellezés 1

ANYANYELVI FELADATLAP a 8. évfolyamosok számára

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

ELOSZLÁS, ELOSZLÁSFÜGGVÉNY, SŰRŰSÉGFÜGGVÉNY

FELVÉTELI FELADATOK 4. osztályosok számára M 1 feladatlap

Arculati Kézikönyv. website branding print

10. Aggregált kínálat

JT 379

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

TÁMOGATÁSI SZERZŐDÉS. Leonardo da Vinci Innováció transzfer projektekre. Az Egész életen át tartó tanulás program 1 keretében

Statisztika 1. zárthelyi dolgozat március 21.

1. ábra A rádiócsatorna E négypólus csillapítása a szakaszcsillapítás, melynek definíciója a következő: (1)

A hőmérsékleti sugárzás

MATEMATIKA FELADATLAP a 8. évfolyamosok számára

Matematika B4 I. gyakorlat

PONTRENDSZEREK MECHANIKÁJA. A pontrendszert olyan tömegpontok alkotják, amelyek nem függetlenek egymástól, közöttük kölcsönhatás van (belső erők).

LÁTÓTÁVOLSÁG ÉS LÉGSZENNYEZETTSÉG BEVEZETÉS

Rudas Tamás: A hibahatár a becsült mennyiség függvényében a mért pártpreferenciák téves értelmezésének egyik forrása

VT 265

KORLÁTOS. mateking.hu BINOMIÁLIS ELOSZLÁS. Egy úton hetente átlag 3 balesetes nap van. Mi a valószínűsége, hogy egy adott héten 2 balesetes nap van?

Széchenyi István Egyetem. Alkalmazott Mechanika Tanszék

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

ANYANYELVI FELADATLAP a 8. évfolyamosok számára

FIZIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.

Név:... osztály:... Matematika záróvizsga 2010.

Villámvédelmi felülvizsgáló Villanyszerelő

1. AZ MI FOGALMA. I. Bevezetés ELIZA. Első szakasz (60-as évek) Második szakasz (70-es évek) Harmadik szakasz (80-as évek)

KOD: B , egyébként

Zoopedagógiai módszerek

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

ezek alapján kívánunk dönteni. Ez formálisan azt jelenti, hogy ellenőrizni akarjuk,

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő.

Installációs rendszerek

Operatív döntéstámogatás

ANYANYELVI FELADATLAP a 8. évfolyamosok számára

Kidolgozott feladatok a nemparaméteres statisztika témaköréből

Mike Evans Hogyan vizsgázz sikeresen?

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

3.1. A Poisson-eloszlás

6. előadás Véges automaták és reguláris nyelvek

Átírás:

MÓDSZERTANI TANULMÁNYOK A BINÁRIS LOGIT MODELLEK HASZNÁLATÁNAK ÉS TESZTELÉSÉNEK ESZKÖZEI M FÜLÖP PÉTER A biáris logit modllk az alkalmazott közgazdasági problémák stéb is ig haszos szközk bizoyulak. Haszálatuk azoba alapos körültkitést igéyl. A cikkb áttkitjük a modllk tsztlésék éháy, a szakirodalomba mgtalálható haszos szközét. TÁRGYSZÓ: Biáris logit modll. Rgrsszió. Modllépítés. it ismrts, a mikroökoómia lggyszrűbb dötési (optimalizációs) modlljib általába fltétlzzük, hogy a dötéshozó folytoosa hlyttsíthtő javak közül választ. Ezt a fltétlzést floldva, akkor bszélük diszkrét dötési modllkről, ha a modllb szrplő javak m oszthatók fl ttszőlgs kis részkr. Ily sttl találkozhatuk például akkor, ha a háztartások által vásárolt autók számát próbáljuk magyarázi: gy háztartás ha vásárol vht gy, két stb. autót, d például léggé lképzlhttl,4 autó vásárlása. A gyakorlati alkalmazások sorá kitütttt szrpt játszik a logisztikus loszláso alapuló ú. MNL- (multiomial logit) modll. Sokszor találkozhatuk a diszkrét dötési modllk azo spciális stévl is, amikor a magyarázi kívát változó csak két értékt vht fl: például vásárolt- a háztartás gy adott időszak alatt tlfot. Ily stkb szokás az ú. biáris modllkt haszáli. A biáris modllk blül szité kitütttt szrpt kap a logisztikus loszláshoz kapcsolható modll, az ú. biáris logit modll. Bcslésér már szit mid statisztikai programcsomag képs. Ahogy azoba az az alkalmazott kutatások sorá gyakra lőfordul, a modllépítést m midig kövti a modllk mgfllő tsztlés. Mivl az alkalmazásokhoz szükségs ismrtk összfoglalva m találhatók mg, jl cikk a biáris logit modllt az alkalmazott kutatásokba haszálókak kívá sgítségt yújtai, a haszálatához szükségs lgfotosabb ismrtk összgyűjtésévl és a voatkozó szakirodalom ismrttésévl. A kövtkzőkb lőször rövid áttkitjük a biáris logit modllk származtatását és bcslésük módszrét, a mitavétl gys kérdésit, majd mgkísérljük összfoglali a szakirodalomba flllhtő lgfotosabb és az alkalmazott kutatások sorá lghaszosabbak vélt tsztkt. Végül kitérük az idividuális szitű adatokhoz kapcsolódó lőrjlzési módszrr és a rziduumok vizsgálatáak gy grafikus módszrér is. Statisztikai Szml, 80. évfolyam, 00. 3. szám

6 FÜLÖP PÉTER. A BINÁRIS LOGIT MODELLEK SZÁRMAZTATÁSA, BECSLÉSÜK ÉS A MINTAVÉTEL EGYES KÉRDÉSEI A biáris logit modllkk számos származtatási módja létzik. Mi most az ú. láts változó alapuló mgközlítést tkitjük át. Ez az alkalmazott közgazdasági és marktig célú lmzésk stéb azért haszos, mrt közvtlül kapcsolható a sztochasztikus haszossági függvéykt haszáló optimalizációs módszrkhz (rről bővbb lásd Trai; 986, Adrso t al.; 99). Ez a mgközlítés gyúttal azt is jlti, hogy gydi (idividuális) vagy más év dötéshozói szitű adatokat tétlzük fl, thát m az rdméyváltozó lőfordulásáak rlatív gyakoriságát magyarázzuk, ham mid gys dötéshozóról külö-külö rdlkzük mgfigylésskkl. A biáris modllk stéb az rdméyváltozó csak két értékt vht fl. Lgy az -dik rdméyváltozó y (=,...,N, ahol N a mita lmszáma), x pdig jlts az -dik magyarázó változó k lmű oszlopvktorát, valamit lgy a paramétrk k lmű vktora és u gy adott loszlású hibatag. Mivl a magyarázott változó biáris: y = 0. A biáris modllk láts változó krsztüli lvztéskor fltétlzük gy ú. láts rdméyváltozót (jlöljük zt y -gal). Ezt tkithtjük például gy adott trmék * mgvásárlása, illtv mg m vásárlása közötti haszosság külöbségék. A lats változó két agyo fotos tulajdosággal rdlkzik: gyszrű liáris rgrsszióval kifjzhtő az rdti modll magyarázó változói sgítségévl (a hibatagok trmészts gymástól függtlk), és attól függő, hogy érték gy bizoyos küszöbszám (jllmző 0, hisz modllükb a kostas is szrpl) fltt vagy alatt va, rdti modllük biáris magyarázadó változója az vagy a 0 értékt vszi fl. Formálisa: y * E( u Var( u y = + u x x ) = 0 ) = σ ha y = 0 ha y Fltétlzv, hogy u szimmtrikus loszlású: * * * > 0 0. Pr( y = x ) = Pr( y > 0 x ) = Pr( + u > 0 x ) = G( ), ahol G(.) a véltl tag loszlásfüggvéy. Mivl a liáris rgrsszió által mgragadott összfüggést idxfüggvéyk is hívják, az általuk ismrtttt mgközlítésmódot idxfüggvéy alapuló modllk is vzik.

BINÁRIS LOGIT MODELLEK 63 σ szóráségyztű logisztikus loszlás loszlás- Mit ismrts a μ várható értékű és függvéy: G ( s) =. + ( s μ) π σ 3 Amyib a várható érték ullával, a szóráségyzt pdig π 3 -mal gylő, akkor stadard logisztikus loszlásról bszélük és az loszlásfüggvéyt általába Λ -val jlöljük. Stadard logisztikus loszlás sté thát az loszlásfüggvéy: Λ( s) =. s + Ha thát biáris modllük stéb fltétlzzük, hogy G( s) = Λ( s), akkor biáris logit modllről bszélük. Ekkor: Pr( y = x ) = G( ) = Λ( ) =. + A logit modll paramétrik a bcslés a maximum liklihood lv sgítségévl törtéik (ML-bcslés). A logisztikus loszlásfüggvéyk köszöhtő, a bcslés a lggyszrűbb Nwto Raphso módszr sgítségévl is lvégzhtő, 3 így szükség sté akár már miimális programozói ismrtk birtokába is írhatuk a logit modll bcslésér szolgáló programot. 4 A statisztikai és ökoomtriai programcsomagok közül lgikább a LIMDEP haszálatát javasoljuk. A bcsült kovariaciamátrix A modllépítés lgdhttl fltétl a paramétrk kovariaciamátrixáak bcslés. Mit ismrts, maximum liklihood bcslés sté a bcsült paramétrk aszimptotikus kovariaciamátrixát háromfélképp számíthatjuk ki:. a Hss-fél mátrix várható érték alapjá,. a Hss-fél mátrixak a bcsült paramétrk sgítségévl számolt érték alapjá, 3. a gradis vktorok sgítségévl. Mivl a logit modll stéb a Hss-fél mátrix m tartalmazza az y -t, az aszimptotikus kovariaciamátrix lső két számítási módszr mggyzik. Így a kövtkző két képlt sgítségévl számíthatjuk ki az aszimptotikus kovariaciamátrixokat: 5. a Hss-fél mátrixo alapuló bcslés, ahol p ˆ = Λ( ˆ ) : Var (ˆ) = N pˆ ( pˆ ) x x = ; A bcslés koziszts, aszimptotikusa torzítatla és hatásos, valamit a bcsült paramétrvktor aszimptotikusa ormális loszlású. 3 Lásd például Cramr (99). 4 Ismrt még számos más algoritmus is, amlyről jó áttkitést ad például Log (997). 5 Lásd például Lchr (99).

64 FÜLÖP PÉTER. a gradis vktorok külső szorzatá alapuló bcslés, amit Brdt Hall Hall Hausma- (BHHH) fél vagy OPG ( outr product gradit ) kovariaciamátrixak is szokás vzi: Var (ˆ) = N ( y pˆ ) x x =, ahol p ˆ ( x ˆ = Λ ). Mivl a bcsült kovariaciamátrix a bcsült iformációs mátrix (I) ivrz, a fti képltk sgítségévl az iformációs mátrix is mghatározható. Így a kétfélképp kiszámított iformációs mátrix a kövtkző: a Hss-fél mátrixo alapuló bcslés: N I ( ˆ) = pˆ ( pˆ ) x, = ahol p ˆ ( x ˆ = Λ ), a gradis vktorok külső szorzatá alapuló bcslés: ahol p ˆ = Λ( ˆ ). I ˆ) ( y pˆ ) x, ( = N = Mitavétl: xogé és dogé mita A gyakorlati alkalmazások sorá gyakra lőfordul, hogy mitákat valamily szmpot szrit rétgzzük. Az alkalmazott kutatásokba általába kétfajta gyszrűbb módo rétgztt mitával találkozhatuk: az gyik a magyarázó változó krsztül rétgztt mita (zt szokás xogé mitáak is vzi), a másik az rdméyváltozó krsztül rétgztt mita (zt szokás dogé mitáak is vzi). Ha például a vztéks tlfo vásárlását bfolyásoló téyzőkt kívájuk gy biáris logit modll sgítségévl mghatározi, akkor xogé mitáak tkithtjük a jövdlm szriti rétgzést, dogé mitáak pdig a tlfo vásárlása szriti rétgzést, azaz gy olya mitát, ahol külö mitát vszük a tlfot vásárlók, illtv m vásárlók alapsokaságából. Ez az st általába akkor fordul lő, ha az alapsokaságba az rdméyváltozó két kimtl agyságrdilg is külöböző aráyba fordul lő. Általáos rdméy, hogy a diszkrét dötési modllk stéb 6 ha xogé mitát haszáluk, akkor m kll módosítai az gyszrű véltl mitára kidolgozott bcslési módszrt, míg az dogé mita stéb ig (McFadd; 983). Ez utóbbi stéb a lggyakrabba haszált módszr a Maski Lrma (977) által javasolt ú. súlyozott xogé mitá alapuló maximum liklihood függvéy WESML (Wightd xogous 6 Empirikus mukákhoz a diszkrét dötési modllk általáos stér voatkozólag lghaszosabb áttkitést B Akiva Lrma (985) ad.

BINÁRIS LOGIT MODELLEK 65 sampl maximum liklihood) alkalmazása. 7 A súlyozott maximum liklihood bcslés koziszts, d aszimptotikusa m fltétlül hatásos. Mivl azoba m lht gyértlmű mghatározi, hogy az altratív szité koziszts bcslési ljárásokkal összvtv mlyik bcslés az aszimptotikusa hatásosabb, az mpirikus mukákba tkitttl köyű kiszámíthatóságára a súlyozott maximum liklihood bcslést alkalmazzák (Maski McFadd; 98, Pudy; 989). Míg a fti állítások általába érvéysk a diszkrét dötési modllkr, addig a logit modllk sté szrcsér sokkal gyszrűbb a hlyzt. Mgmutatható ugyais, hogy az gyszrű véltl mitavétlhz tartozó bcslésük a kostast lszámítva a paramétrk koziszts bcslését adja. 8 Így logit modllk sté dogé mita stéb is haszálhatjuk az gyszrű maximum liklihood bcslést, csupá a kostasra kttőél több lmű dötési halmaz (MNL-modllk) sté pdig az altratíva-spcifikus kostasokra voatkozó bcslésükt kll módosítai. Nézzük most mg, biáris logit modllk stéb mit is jlt a kostasak a ftbb mlíttt korrkciója. 9 Az alapsokaságot botsuk két részr aszrit, hogy az dogé változó mily értékt vsz fl. Potosa ily st a ftbb mlíttt példák: a vztéks tlfo vásárlását mghatározó modll bcsléséhz külö-külö vszük mitát a tlfot vásárlók, illtv m vásárlók alapsokaságából. A magyarázott változó vgy fl az -s és a 0 értékt aszrit, hogy az adott háztartás vásárol, illtv m vásárol tlfot. Vgyük thát gyszrű véltl mitát külö-külö az alapsokaságak a csak -s értékű dogé változókat tartalmazó lső és a csak 0 értékt tartalmazó második csoportjából. Tétlzzük fl, hogy az lső csoport sté a krstt aráy p, a második csoport sté pdig p, thát a mitába krülés valószíűség az lső csoportból p, a második csoportból pdig p. Ebb az stb a mitába Lgy most Pr( y = Pr( y = 0 p p = p p ) x = + p = p + p p + p + p + + ) x = + p = p + p p + p +. Ez stb a fti két összfüggést átírhatjuk a kövtkző alakra: Pr( y = x ) =, Pr( y. = 0 x ) = p + + p,. 7 Maski Lrma (977) másfajta trmiológiát haszál, zért szrpl a WESML-b az xogé szó. 8 Lásd Maski Lrma (977) 986 987. old. 9 A korrkciót Maddala (983) alapjá szmlélttjük.

66 FÜLÖP PÉTER γ p =. Ekkor a fti valószíűségk a kö- Lgy a továbbiakba vtkzőképp írhatók fl: γ = l p, azaz γ+ Pr( y = x ) = = = γ γ γ γ+ + + + Pr( y = 0 x ) =. γ+ + Ez utóbbi két kifjzés viszot azt jlti, hogy gy dogé mita stéb amyib ismrjük a mgfllő mitavétli aráyokat gy olya modllt bcsülük, amlyk paramétri a kostast kivév mggyzk az gyszrű véltl mitához tartozó modll paramétrivl. Így haszálhatjuk a szokásos maximum liklihood bcslést, csupá a kostasra voatkozó bcslésükt kll korrigáluk. Mivl a kostasra dogé mita sté γ -val agyobb értékt kapuk, zért gyszrű l kll vouk a kostas bcsült értékéből az γ l p l p kifjzés értékét. 0 Térjük most rövid vissza a vztéks tlfo vásárlását bfolyásoló téyzők bcslésér voatkozó példához. Ha a voalat m vásárlókhoz képst lyésző a voalat vásárlók száma, gyszrű véltl mitavétl sté yilvávalóa gazdaságtalaul agy mitával kll dolgozuk. Ha azoba külö vszük gyszrű véltl mitát a vásárlókból és a m vásárlókból, akkor léygs kisbb mitával dolgozhatuk, ráadásul a kostas korábba mlíttt korrkcióját lszámítva haszálhatjuk a stadard bcslési ljárást.. A BINÁRIS LOGIT MODELLEK TESZTELÉSÉNEK ESZKÖZEI A kövtkzőkb összfoglaljuk a biáris logit modllk építés sorá a szrző által lghaszosabbak vélt szközökt. Trmészts m áll módukba az gys tsztk, mutatók tljs, részltkb mő bmutatása. Ezért mid stb mgadjuk a kapcsolódó lgfotosabb irodalmat. A külöös boyolult számításokat fltétlző tsztk stéb szité ltkitük a számítások részlts ismrttésétől. Mivl a logit modllkt maximum liklihood lv alapuló függvéy sgítségévl bcsüljük, a tsztlés sorá lgikább alkalmazott szközök az ML-bcslésr voatkozó stadard spcifikációs tsztk: a Lagrag-multiplikátor (LM), a liklihood aráy (LR) és a Wald-típusú tsztk. Midgyik fajta tszthz tartozik gy, a modll adott spcifikációjához kapcsolható ull- és llhipotézis (H 0 és H ). A lggyszrűbb példa szrit, 0 Mgjgyzzük, hogy Maddala (983. 9. old.) alapjá tévs övli kll a bcsült kostas értékét. Az ily tsztk irát érdklődőkk a szrző javasolja az általa írt GAUSS-programot, amly tartalmazza a flsorolt tsztkhz szükségs számításokat. Amyib az olvasó a részltib is át kívája tkiti a biáris logit modllk építés sorá alkalmazott szközökt, akkor lső lépéskét a kövtkző irodalmat ajáljuk: B-Akiva Lrma (985), Lchr (99) és Log (997).

BINÁRIS LOGIT MODELLEK 67 ullhipotézis lht, hogy gy adott xogé változó paramétrérték ullával gylő, az llhipotézis pdig az, hogy z az érték m gylő ullával. A külöböző típusú tsztk mögött más-más lgodolás áll, zért a tsztstatisztikák kiszámítása is külöbözik. A Lagrag-multiplikátor lv alapuló tsztk stéb azt vizsgáljuk, vajo a logliklihood függvéy mrdkség szigifikása külöbözik- ullától a ullhipotézis fállása sté. Az LM-tsztt thát akkor érdms haszáli, ha a tsztstatisztika kiszámítása gyszrűbb a ullhipotézis fállása sté. Például htroszkdaszticitás tsztléskor képsk vagyuk olya LM-tszt készítésér, mlyk ullhipotézis a homoszkdasztikus modll, akkor a htroszkdaszticitás tsztléséhz flhaszálhatjuk a homoszkdaszticitást fltétlző modllből származó rdméykt. A liklihood aráy lv alapuló tsztk sté ki kll számítauk a log-liklihood függvéy értékét mid a ullhipotézis, mid az llhipotézis stér és zkt kll összvtük gymással. A Wald-típusú tsztlv pdig azt vizsgálja, hogy modllük adott spcifikációja szigifikása külöbözik- a ullhipotézishz tartozó spcifikációtól. Ebb az stb tsztstatisztikát csak az llhipotézishz kapcsolódó spcifikáció mlltt kll kiszámítauk. A Wald-tszt haszálata thát akkor lőyös, ha a tsztstatisztika értékét köybb az llhipotézis mlltt kiszámítai. Ily st a flslgs változó tsztlésék az st: a H hipotézis szrit az adott változó m flslgs, így modllükt bcsülhtjük az adott változóval is, majd zt a bcslést flhaszálva tsztlhtjük a változó flslgs voltát. Az általuk ismrttttk kívül trmészts számos más, az alkalmazott kutatásokba mglhtős ritká haszált, spcifikációs tszt is rdlkzésr áll, amlykről jó összfoglalót ad Maddala (995). A kövtkzőkb a modllépítés kiidulópotjakét, lőször a magyarázó változókra és azok kombiációjára voatkozó tsztkt ismrttjük. Ezt kövtő a véltl tag loszlásához kapcsolódóa a krsztmtszti adatok sté gyakra lőforduló htroszkdaszticitásak és a véltl tag szimmtriájáak tsztlését tkitjük át. A modll általáos jóságára voatkozó tsztk és az általáos jósági mutatók ismrttés utá gy, az lőrjlzéshz kapcsolódó tsztt, illtv az idividuális szitű adatokra voatkozó lőrjlzési módszrt mutatuk b. Áttkitésükt gy a rziduumok loszlásáak grafikus vizsgálatára voatkozó módszr ismrttésévl zárjuk. Ahogy az bből a rövid összgzésből is kitűik a biáris logit modllkhz kapcsolható alkalmazások agy részéhz igazodva a tsztk áttkitéskor alapvtő a krsztmtszti adatokat flhaszáló modllépítés szközir koctráltuk. Magyarázó változókra és azok kombiációira voatkozó tsztk A magyarázó változókra voatkozó tsztk lgfotosabbika biáris logit modllk sté az aszimptotikus z-tszt, amly az gys magyarázó változók tsztlésék lgfotosabb szköz. Mi zt a tsztt a flslgs változókra általáosa voatkozó Wald-tszt spciális stkét tárgyaljuk. Itt tkitjük át ugyaz problémáak az LM-tsztk kifordított változatát, a hiáyzó változók tsztlésék lhtőségét. a) Flslgs változó(k) és a magyarázó változókra voatkozó liáris változók tsztlés (Log; 997). Flslgs változók sté az ML-bcslés koziszts, d m hatásos. Vizsgálatát a Wald-tszt sgítségévl végzzük l, és a tszt H 0 hipotézis szrit az

68 FÜLÖP PÉTER adott magyarázó változó vagy változók flslgsk. A Wald-tsztt hasolóa a liáris modll tsztléséhz haszálják a magyarázó változókra voatkozó liáris fltétlk tsztlésér is. A tszthz kapcsolódó H 0 hipotézist a kövtkzőképp írható fl: Q = r, ahol a tsztldő paramétrk vktora, Q és r a ullhipotézishz tartozó mátrix és vktor. Ha például a = ( 0,, ) paramétrvktor sté a = 0 és = 0 fltétlt akarjuk tsztli azaz fltétlzzük, hogy z a két magyarázó változó fölöslgs akkor a H 0 -hoz tartozó fltétl: 0 0 0 0 0 0 =. 0 A tsztstatisztika kiszámítása a H hipotézis mlltt törtéik, k érték: [ Qˆ r] [ QVar(ˆ) Q ] [ Q r] W = ˆ, ahol a W a fltétlkk mgfllő számú (példákba: ) szabadságfokú χ -loszlást kövt. A tszt gy paramétrr voatkozó spciális st mgflltthtő a modllépítés sorá lggyakrabba haszált aszimptotikus z-tsztk. Ha ugyais ullhipotézisük például a =, akkor az aszimptotikus z-tszt alapjá * a z = ˆ * Var(ˆ ) aszimptotikusa stadard ormális loszlású. A ullhipotézisk mgfllő Waldstatisztika: * ( ˆ ) W =, Var(ˆ ) ami potosa a égyzt az aszimptotikus z-tszthz tartozó statisztikáak. Ha z stadard ormális loszlású valószíűségi változó, akkor z ~ χ (), így mcsak a két tsztstatisztika kiszámítása, ham aszimptotikus loszlása is mgflltthtő gymásak. b) Hiáyzó változó(k) st. Az ML-bcslés kkor m koziszts. Tsztlését az LM-tszt sgítségévl végzzük. A tszt H 0 hipotézis szrit az adott magyarázó válto- Egys hlyk zt aszimptotikus t-tsztk vzik (B-Akiva Lrma; 985).

BINÁRIS LOGIT MODELLEK 69 zók m szrplk a modllb. A tsztstatisztika kiszámítása a H 0 hipotézis mlltt törtéik. A tszt haszálatát biáris logit modll sté agyba mgköyíti Lchr (99) 84. oldalá található formula. Tapasztalataik szrit a tszt haszálata ritka, a modllépítés sorá ikább a flslgs változók tsztlésér szoktak koctráli. Htroszkdaszticitás Htroszkdasztikus stb lltétb a liáris modll klasszikus stévl a logit modll ML-bcslés m lsz koziszts (Yatchw Grilichs; 984). A htroszkdaszticitás azért mrül fl komoly problémakét, mrt gyrészt krsztmtszti adatok sté gyakra lőfordul, másrészt m korrigálható olya köydé, mit liáris modll stéb. Mivl logit modll stéb a véltl tag szóráségyzt, a π 3 htroszkdaszticitás tsztléséhz fltsszük, hogy σ π z τ =, 3 ahol z a rziduumok szórását magyarázó változót jlöli, τ pdig a mgfllő paramétr(k)t. A H 0 hipotézis szrit τ = 0, azaz a modllük homoszkdasztikus, hisz kkor π σ = ( =,..., N ). Az LM-tszt sokszor hagsúlyozott lőy, hogy a tszt statisztikát a H 0 hipotézis mlltt kll kiszámítauk, azaz a homoszkdasztikus stb 3 ( τ = 0 ). Ezért a htroszkdaszticitást LM-tszttl érdms vizsgáli. A mgfllő tsztstatisztika kiszámítása azoba még így is mglhtős körülméys. Szrcsér az LM-statisztika értékét kétfélképp is kiszámíthatjuk. Első lhtőségkét Davidso MacKio (984) többfajta ú. mstrségs liáris rgrssziót javasol, amlykk a léyg az, hogy az LM-tsztstatisztikák mgkaphatók külöböző (az ML-függvéy gradis vktorához, illtv az iformációs mátrixhoz kapcsolódó) liáris rgrssziók NR uc értékkét, ahol az R uc az ú. mctrális R -két értlmzdő, 3 N pdig a mgfigylésk száma. Az Ruc dfiíciója alapjá az R kostas élkül bcsült modllkr voatkoztatott változata: gy adott magyarázott változó bcsült, ŷ, és téylgs értékihz, y, tartozó égyztösszgk háyadosa, azaz R uc yˆ yˆ =. Így az LM-tszt végrhajtható a közöségs lgkisbb égyztk módszré- y y k sgítségévl. Davidso MacKio (984) több ily mstrségs rgrssziót mutat b. Az gyik stéb például mstrségs rgrssziók rdméyváltozója gy N lmű gységvktor, a magyarázó változók N k lmű mátrixa pdig a homoszkdaszticitást fltétlző H 0 hipotézis mlltt kiszámított modll (azaz gyszrű a bcsült modllük) log-liklihood függvéyék lső driváltjához tartozó értékk. 3 Az uctrd R mutatóról bővbb lásd például Darll (997).

70 FÜLÖP PÉTER Ehhz a kostas élküli rgrsszióhoz tartozó R uc értékt haszáljuk a tsztstatisztika kiszámításához. A számítások sajos mglhtős körülméysk lhtk és hz végzhtők l automatikusa, zért ikább a második számítási módszrt javasoljuk. A htroszkdaszticitásra voatkozó tszt kiszámításáak második módszr kihaszálja, hogy a biáris logit modll aalitikusa agyo jól kzlhtő és az LM-statisztika dfiíciója alapjá gyszrű a l L(ˆ H ) 0 ˆ H0 [ ] l L(ˆ H ) 0 I(ˆ H ) 0 ˆ H0 képlt alapjá számítható ki, ahol I az iformációs mátrixot, ˆ H0 pdig a paramétrvktor bcsült értékét jlöli a H 0 hipotézis, azaz a homoszkdaszticitás fltétlzés mlltt. A számítás körülméys ugya, d szrcsér Lchr (99)-b rdlkzésr állak a szükségs formulák, lhtőségt adva a képltk bprogramozására és a tsztlés automatikussá tétlér. Így a htroszkdaszticitás gyszrű tsztlhtő. Aszimmtrikus loszlás tsztlés Számos stb flmrülht az a kérdés, hogy adott probléma vizsgálatakor hlys- a logisztikus loszlás szimmtrikus voltát fltétlzi (Smith; 988). Szrcsér létzik olya loszlás, amlyk spciális st a szimmtrikus stadard logisztikus loszlás. Az rr voatkozó LM-tszt sté az ú. Burr-loszlást haszáljuk: Pr( y = x ) =, α > 0. α ( + ) Amyib α <, az loszlásfüggvéy gatív iráyba, α > sté pdig pozitív iráyba húzott. A szimmtrikus loszlásra voatkozó H 0 hipotézist ( α = ) LM-tszttl érdms vizsgáli, hisz H 0 tljsülés sté modllük mggyzik a logit modlll. Az LM-statisztika kiszámításához érdms a Lchr (99)-b található boyolult, d jól kövthtő és programozható képltt haszáli. A modll általáos jóságára voatkozó tsztk A modll általáos jóságára voatkozó tsztk szité a modllépítés lgfotosabb szközi közé tartozak. Az alábbiakba áttkitjük a szokásos LR-tsztt, az iformációs mátrixhoz kapcsolható kvésbé ltrjdt LM-tsztkt, majd bmutatjuk a bcsült modll rziduumait flhaszáló ig ltrjdt Parso-fél χ -statisztikát és a folytoos magyarázó változók stéb ikább haszálható Hosmr Lmshow-fél statisztikát. a) Az LR-tszt (B-Akiva Lrma; 985) a =... = k = 0 fállására voatkozó H 0 hipotézis sté az LR = (l L( c) l L(ˆ )) k szabadságfokú χ -loszlást kövt,

BINÁRIS LOGIT MODELLEK 7 ahol az L(c) és L( ˆ ) a log-liklihood függvéy értékét jlöli, amyib csak a kostas (azaz 0 0 ), illtv az általuk bcsült ˆ vktor a magyarázó változó. Ez a biáris logit modll stéb azt jlti, hogy az rdméyváltozó bkövtkzésék valószíűségér mid gys stb k a változóak a mitabli aráyát bcsüljük. Ha a = =... = k 0 fállására voatkozó H 0 hipotézist akarjuk tsztli, akkor az 0 = LR = (l L(0) l L(ˆ)) k szabadságfokú χ -loszlást kövt, ahol L(0) az MLfüggvéy értékét jlöli a = =... = k 0 sté. 0 = b) Az iformációs mátrixra voatkozó LM-tsztk (Whit; 98, Orm; 988) azo alapulak, hogy a bcsült modll hlysségér voatkozó H 0 hipotézis mlltt az iformációs mátrix kétfélképp kiszámított értéki (a Hss-fél mátrix, illtv a grádis vktorok sgítségévl kiszámított mátrixok) szigifikása m külöbözhtk gymástól, hisz a maximum liklihood lv alapuló bcslésk sté: E L ( = E, [ d ) d( ) ] ahol d() a log-liklihood függvéy k lmű grádis vktora. Az iformációs mátrixra voatkozó tsztk azért haszosak, mrt tkithtjük őkt a hlytl spcifikációkkal szmbi általáos tsztkét (például rossz magyarázó változók, rosszul fltétlztt loszlásfüggvéy, htroszkdaszticitás, mgfigyléskét változó paramétrk 4 ). Noha a szakirodalom általáos stb (lásd Orm; 988) a htroszkdaszticitás tsztléshz hasolóa mstrségs rgrssziókat haszál a próbafüggvéy kiszámítására, biáris logit modll sté érdmsbb kihaszáli, hogy z aalitikusa jól kzlhtő, és tsztstatisztika kiszámítására a Lchr (99)-b található képltkt alkalmazi. c) Parso-fél χ -statisztika (Hosmr Lmshow; 989) kiszámításához lőször ki kll számoluk az ú. Parso-fél rziduumokat, r, ahol y pˆ r =. A pˆ ( pˆ ) Parso-fél χ -statisztika szrit, a bcsült modll hlysségér voatkozó H 0 hipotézis mlltt, a r összg J (k+) szabadságfokú χ -loszlást kövt, ahol J a kovariások 5 számát jlti. Mg kll azoba jgyzük, hogy abba az stb, ha a kovariásokhoz csak kvés számú mgfigylés tartozik, a Parso-fél χ -statisztika alkalma- zása mglhtős félrvztő lht, így haszálatuk bb az stb m ajálott (McCullagh Nldr; 989. 0. old.). d) Hosmr Lmshow-fél statisztika (Hosmr Lmshow; 989, Vrds; 00) lőy a Parso-fél χ -statisztikával szmb az, hogy abba az stb is alkalmazható, amikor a kovariásokhoz csak gy mgfigylés tartozik. Kiszámításához a bcsült való- 4 Agol lvzés: radom cofficit variatio. 5 A magyarázó változók gymástól külöböző kombiációjáak a mitába lőforduló számát jlti. Ha thát va folytoos magyarázó változók, akkor z mggyzik a mita lmszámával, az N-l.

7 FÜLÖP PÉTER szíűségkt sorrdb állítjuk és blőlük g számú mgközlítőlg azoos agyságú csoportot képzük (a gyakorlatba általába g = 0, gy csoportba azoba m lht 5- él kvsbb mgfigylés). Az gys csoportokba a mgfigylésk számát j -vl jlöljük ( j =,..., g ). Ezt kövtő kiszámítjuk az alábbi mutatót: j Cˆ π = g ( o j j j ) j= jπ j ( π j ) pˆ ahol o = j l l = j y l és π j =. A bcsült modll hlysségér voatkozó H 0 hipotézis tljsülés mlltt Ĉ érték (g-) szabadságfokú χ loszlást l= j kövt. Általáos jósági mutatók Ezk a mutatók a tsztk mlltt a modllépítésk szité agyo fotos szközi, a modll általáos jóságára utaló mutatók értékik értlmzés mégis sok stb mglhtős bizoytala. Értékük ugyais agyba függ az adatok jllgétől. Ahogy Vall Zimmrma (996) mgjgyzi, krsztmtszti adatok sté például 0, körüli R érték mlltt sm kll fltétlül lvti a modllükt. Ez trmészts m jlti azt, hogy modllépítés sorá alacsoy mutatókra kll törkdük vagy akár ttől függtlül döthtük modllük jóságát illtő (Huyadi; 000). Figylmb kll azoba vük, hogy az alkalmazott kutatások célja az adott lhtőségk mlltt lgikább jóak, illtv borulátóbba fogalmazva a lgkvésbé rosszak tűő modll mgtalálása. Így járható útak tűik az, hogy gyrészt komolya vsszük a modllépítéshz kapcsolódó spcifikációs tsztkt, másrészt összvtjük a modllük által produkált jóságimutatóértékkt a szakirodalomba mgtalálható hasoló modllk értékivl. Amyib agyságrdbli ltérést tapasztaluk akár pozitív, akár gatív iráyba, érdms lgodolkoduk és mgkísérli mgmagyarázi aak okát. Itt tkitjük át a log-liklihood függvéyhz kapcsolódó pszudó-r, a McKlvy Zavoia-fél R, az Akaik s Iformatio Critrio (AIC) és a Baysia Iformatio Critrio (BIC) mutatókat. Id soroljuk thát azokat a mutatókat is, amlyk külöböző, gymásból m származtatható (o-std) modllk összhasolítására szolgálak. a) A log-liklihood függvéy alapuló pszudó-r mutatók a liklihood függvéy maximalizált értékét hasolítják valamily bázisértékhz, például ahhoz az értékhz, amikor csak gy kostas va a modllb, zzl próbálva mgragadi azt, hogy a magyarázó változók myit javítaak a modll. Jó összfoglalót ad a mutatókról Hagl Mitchll (99) és Vall Zimmrma (996). A lgikább haszált mutató a McFadd-fél korrigált pszudo-r mutató: ρ l L(ˆ) ( k + ) =. l L(0),

BINÁRIS LOGIT MODELLEK 73 b) A rziduumoko alapuló McKlvy Zavoia-fél pszudo-r kiszámítási módja: N N N ˆ ( y ) = N = ˆ N ( y ) + Nσˆ N = = A mutató számlálója a mögötts láts változóra voatkoztatva a modll által magyarázott ltéréségyzt összgkét értlmzhtő. Mivl az N ˆσ flfogható 6 modll által m magyarázott variaciáak, a mutató a modll által magyarázott variaciáak a tljs variaciához viszoyított aráyát fjzi ki. A külöböző R mutatóko közül zt a mutatót ajálja Vall Zimmrma (996), mrt lgikább z közlíti mg a mögötts láts változóhoz kapcsolódó R mutatót. c) Az Akaik s Iformatio Critrio (AIC) (lásd Log; 997) kiszámítási módja: l L(ˆ) + ( k + ) AIC =. Mivl alacsoyabb l L(ˆ ) magasabb ML-függvéy értékt jlöl, a több magyarázó változó övli, míg a mitaagyság övlés csökkti az N AIC-mutató értékét, zért az alacsoyabb érték jobb illszkdésr utal. Az AIC-mutatót haszálják a külöböző gymásból m származtatható, illtv külöböző mitákból bcsült modllk összhasolítására. d) A Baysia Iformatio Critrio (BIC) (Raftry; 996) kiszámítási módja: BIC = (l L(ˆ) l L( c)) k l( N) vagy BIC = l L(ˆ) ( N ( k + )). A mutatót gymásból m származtatható modllk összvtésér haszáljuk mégpdig úgy, hogy a külöböző modllkhz tartozó értékkt kiszámítjuk és a kisbb értékkl rdlkző modllt tkitjük jobbak. Általába kttőél agyobb külöbség sté már tkithtjük a kisbb értékkl rdlkző modllt jobbak (Log; 997.. old.). Előrjlzési tszt Az LR-tszt sgítségévl lhtőségük va a modll lőrjlzési rjék a tsztlésér (Adrso; 987). A tszt haszálatakor modllükt lőször a tljs mitát ( =,..., N ), majd csak a mita gy részét ( =,..., N ) flhaszálva bcsüljük ( l L N (ˆ ), illtv l L N (ˆ ) ). A log-liklihood függvéy két bcsléséhz tartozó értékik sgítségévl pdig kiszámítjuk az LR = (l L N (ˆ) l L (ˆ )) N kifjzés értékét. A mgfllő lőrjlzési rőr voatkozó H 0 hipotézis mlltt az LR ( N N) szabadságfokú χ loszlást kövt. Noha az lőrjlzési tsztkt általába idősorokhoz kötik, s- tükb jól haszálható krsztmtszti adatok sté is. A tsztt Adrso (987) alapvtő strukturális változás tsztlésér ajálja. A tszt haszos lht akkor is, ha. 6 Tkitttl arra, hogy biáris logit modll stéb a stadard logisztikus loszlást haszáljuk, ˆ π σ =. 3

74 FÜLÖP PÉTER mg akaruk győződi arról, hogy modllük myir érzéky a mgfigylésk számára. Dötéshozói szitű lőrjlzés biáris logit modll stéb A modllépítés sorá gyakra vizsgáljuk az általuk bcsült modll találati potosságát, azaz azt, hogy modllükt haszálva mily aráyba tudjuk ltaláli az dogé változó kimtlit. Ek a módszrk a haszálata kapcsá két az alkalmazott kutatásokba gyakorta lőforduló problémára kll flhívuk a figylmt. a) A szakirodalomba két okból több is csak iformális szközkét ajálják zkt a mutatókat. Egyrészt a modll paramétrik bcsléskor m a találati aráyt maximalizáljuk, így z a modll jóságáak a mérésér sm fltétlül adkvát szköz (lásd Gr; 993), másrészt a találati aráy agyba függ az rdméyváltozó mitabli loszlásától (B-Akiva Lrma; 985). b) Számos stb a dötéshozói szitű lőrjlzés ituitív dötési szabálya az, hogy a modllük által bcsült valószíűség 0,5-él agyobb- vagy kisbb. Lgy ŷ és ˆ az általuk bcsült y és. Ekkor az ituitív lőrjlzési szabály a kövtkző: y ˆ ha Λ( ˆ) > 0,5 = 0 ha Λ( ˆ) 0,5. Mivl biáris logit modll sté E ( y x ) = Λ( x), joggal várhatjuk l, hogy z a dötéshozói szitű lőrjlzés sté is így lgy, azaz az E( yˆ x ) ( x ˆ = Λ ) fltétl tljsüljö. Ha azoba lőrjlzésük sorá a fti szabályt haszáljuk, z a fltétl m fog tljsüli. Ugyais: ( yˆ x ) = Pr( Λ( ˆ) > 0,5 x ) Λ( x ˆ). E A dötéshozói szitű lőrjlzésk sté thát m érdms az ituitív dötési szabályt alkalmazuk. Az E( yˆ x ) ( x ˆ = Λ ) fltétlt tljsítő lőrjlzési módszr a kövtkző. Lgy ε gylts loszlású valószíűségi változó és lgy igaz, hogy 0 ε. Az lőrjlzési szabályt határozzuk mg a kövtkzőképp: Ebb az stb E( yˆ = Pr( Λ( ˆ) > ε = Pr( ε x ) = Pr( yˆ < Λ( ˆ) x ha Λ( ˆ) > ε ˆ y = 0 ha Λ( ˆ) ε. = x x ) * + Pr( Λ( ˆ) ε ). ) * + Pr( yˆ = 0 x x ) * 0 = ) * 0 =

BINÁRIS LOGIT MODELLEK 75 Mivl ε gy [0,] itrvallumú gylts loszlásból származik, Pr ( < Λ( ˆ) x ) = Λ( x ˆ). ε Így, ha gylts loszlású valószíűségi változót haszáluk a dötéskor küszöbszámkét, tljsüli fog az E( yˆ x ) ( x ˆ = Λ ) fltétl. A modllépítésb az gyéi szitű lőrjlzésk potosságáak haszálatakor körültkitő kll ljáruk. Az általába haszált ily jllgű mutatók: az R Cout és az R AdjCout. Az R Cout kiszámításakor gyszrű mgézzük lőrjlzésük találati aráyát. Köy blátható, hogy az így kiszámított érték agyba függ az rdméyváltozó loszlásától. Ezért szokás haszáli az RAdjCout mutatót, amly modllük hlys lő- rjlzésit viszoyítja ahhoz az sthz, amikor mid mgfigylés stéb a mitába gyakrabba lőforduló kimtlt tkitjük a bcslésükk (Log; 997. 06 09. old.). Előrjlztt kimtl y ˆ = y ˆ = 0 Sor összs Téylgs kimtl y = () () ( + ) y = 0 () () ( + ) Oszlop összs (+) (+) Flhaszálva a jlöléskt a két mutató kiszámítási módja a kövtkző: R Cout = ( jj) ; N j ( jj) maxr ( ( r+ )) j R = N max ( ( r+ )) AdjCout. r Grafikus módszrk A modllépítés sorá haszált grafikus módszrk agyba hasolítaak a liáris rgrsszió sorá alkalmazottakra. Itt is lhtségs a bcslést lgikább bfolyásoló mgfigylésk mghatározására haszálatos módszrk alkalmazása (jó áttkités rről Hosmr Lmshow; 989). Érdms még mgmlíti Fowlks (987)-t, amly még számos más, a modllépítés sorá haszos szközt mutat b. Az alkalmazott kutatásokba lgikább ltrjdt módszr a rziduumok Ladwhr-fél ábrázolása (Ladwhr t al.; 984). A továbbiakba zt ismrttjük. Eél az ábrázolási módál a bcsült modll sorba rdztt téylgs rziduumait ( r = y pˆ, =,...,N) vtjük össz a bcslésük sorá flhaszált magyarázó változók és bcsült paramétrk sgítségévl grált modllből kapott, szité sorba rdztt, szimulált rziduumokkal ( rˆ, =,...,N). A szimulált rziduumokat a kövtkző-

76 FÜLÖP PÉTER képp kapjuk. A modll magyarázó változói és az általuk bcsült paramétrk (ˆ ) alapjá lőrjlzést készítük a modll rdméyváltozójáról, az ŷ -ről ( =,...,N). Az lőrjlzést a ftbb ismrtttt lőrjlzési módszr sgítségévl végzzük (lásd dötéshozói szitű lőrjlzés biáris logit modll stéb). A szimulált rziduumok kiszámítása pdig úgy törtéik, hogy az rdméyváltozó ily módo lőrjlztt értékéből kivojuk a bcsült valószíűségkt, azaz rˆ = yˆ pˆ. Az így kapott értékkt a téylgs rziduumokhoz hasolóa sorba rdzzük. A szimulált rziduumokat kllő sokszor számítjuk ki 7 és rdzzük sorba ahhoz, hogy képzhssük azok valamily tipikus értékét (például mdiá) az alsó és flső kofidciahatárát (például ltkitük a lgmagasabb és lgalacsoyabb,5 százaléktól). Az így kiszámított téylgs rziduumokból, a szimulált rziduumok tipikus értékéből, valamit azok alsó és flső kofidciahatárából a kövtkzőképp készítük ábrát. A vízszits tgly a szimulált rziduumok tipikus értékét, a függőlgs tgly pdig a bcsült modllük téylgs rziduumait és a szimulált rziduumok alsó és flső kofidciahatárát ábrázoljuk. Mgfllő működő modll stéb bcsült modllük rziduumaiak az alsó és flső kofidciahatár közé kll si. Noha a módszr agyo látváyos, hátráya viszot, hogy m midig alkalmas az illszkdési hibák okaiak fltárására a modllél. Tapasztalataik szrit a kofidciahatárt m véltlszrű átlépő, téylgs rziduumok sté biztos m mgfllő a modllük. Nm mgfllő spcifikációval rdlkző modll azoba sajos produkálhat kofidciahatárok közé ső rziduumokat. A rziduumok Ladwhr-fél ábrázolását gy általuk grált biáris logit modll sgítségévl szmlélttjük. Az általuk grált biáris logit modll ötlmű paramétrvktora = ( 5 3,5 0,5). A magyarázó változók a kövtkzők: x 0 és 0 közé sik gylts loszlásba, x, x3 és x 4 dummy változók, amlyk 0,4, 0,3 és 0,4-s valószíűséggl vszik fl az -s értékt. A mita lmszáma 500, a szimulációk száma 40. Rziduumok Ladwhr-fél ábrázolása grál biáris logit modlll a) Négy magyarázó változóval téylgs rziduumok.0.8.6.4 alsó kofidciahatár..0 -.0 -.8 -.6 -.4 -..0..4.6.8.0 flső kofidciahatár -. szimulált rziduumok -.4 -.6 -.8 -.0 7 Ladwhr t al. (984) 5 szimulációt alkalmaz.

BINÁRIS LOGIT MODELLEK 77 b) x 3 magyarázó változó élkül téylgs rziduumok.0.8.6.4..0 -.0 -.8 -.6 -.4 -..0..4.6.8.0 flső kofidciahatár -. szimulált rziduumok -.4 -.6 -.8 alsó kofidciahatár -.0 Az a) ábrá mid a égy magyarázó változó sgítségévl bcsült modllhz tartozó rziduumokat láthatjuk, míg a b) ábrá a modllt az x 3 magyarázó változó élkül bcsültük (hiáyzó változó st). Az ábrá külö jlöltük azokat a tartomáyokat, ahol a téylgs rziduumok a kofidciahatároko kívülr sk. * A cikkb áttkitttük a biáris logit modllk származtatását és tsztlésük szközit. Az áttkités, rmélhtőlg, mggyőző mutatja, hogy zkk a modllkk az stéb is rdlkzésr állak a spcifikáció tsztléséhz a mgfllő szközök. Haszálatuk lhtővé tszi, hogy a biáris logit modllkt biztosággal és szélskörű haszáljuk az alkalmazott kutatásokba. IRODALOM ANDERSON, G. J. (987): Prdictio tsts i limitd dpdt variabls modls. Joural of Ecoomtrics, 34. sz. 53 6. old. ANDERSON, S. P. PALMA, A. THISSE, J. F. (99): Discrt choic thory of product diffrtiatio. MIT Prss, Cambridg, MA. BEN-AKIVA, M. LERMAN, S. R. (985): Discrt choic aalysis: thory ad applicatio to travl dmad. MIT Prss, Cambridg, MA. CRAMER, J. S. (99): Th logit modl for coomists. Edward Arold, Nw York. DARNELL, A. C. (997): A dictioary of coomtrics. Edward Elgar, Chltha. DAVIDSON, R. MACKINNON, J. G. (984): Covit spcificatio tsts for logit ad probit modls. Joural of Ecoomtrics, 5. évf. 4 6. old. FOWLKES, E. D. (987): Som diagostics for biary logistic rgrssio via smoothig. Biomtrika, 74. sz., 503 55. old. GREENE, W. H. (993): Ecoomtric aalysis. Prtic-Hall, Eglwood Cliffs, NJ. HAGLE, T. M. MITCHELL, G. E. (99): Goods-of-Fit masurs for probit ad logit. Amrica Joural of Political Scic, 36. sz. 76 784. old. HOSMER, D. W. LEMESHOW, S. (989): Applid logistic rgrssio. JohWily ad Sos, Nw York. HUNYADI, L. (000): A dtrmiációs gyütthatóról. Statisztikai Szml, 78. évf. 9. sz. 753 765. old. LANDWEHR, J. M. PREGIBON, D. SHOEMAKER, A. C. (984): Graphical mthods for asssig logistic rgrssio. Joural of th Amrica Statistical Associatio, 79. sz. 6 7. old. LECHNER, M. (99): Tstig logit modls i practic. Empirical Ecoomics, 6. sz. 77 98. old. LONG, S. J. (997): Rgrssio modls for catgorical ad limitd dpdt variabls. SAGE Publicatios, Nw York. MADDALA, G. S. (983): Limitd-dpdt ad qualitativ variabls i coomtrics. Cambridg Uivrsity Prss, Cambridg. MADDALA, G.S. (995): Spcificatio tsts i limitd dpdt variabl modls. I: MADDALA, G. S. PHILLIPS, P.C.B. SRINIVASAN, T. N. (szrk.), Advacs i coomtrics ad quatitativ coomics: ssays i hoor of C.R. Rao. Basil Blackwll, Oxford.

78 FÜLÖP: BINÁRIS LOGIT MODELLEK MANSKI, C. F. LERMAN, S. T. (977): Th stimatio of choic probabilitis from choic basd sampls. Ecoomtrica, 45. sz. 977 988. old. MANSKI, C. MCFADDEN, D. (98): Altrativs stimats ad sampl dsig for discrt choic aalysis. I: MANSKI, C. MCFADDEN, D. (szrk.), Structural aalysis of discrt data with coomtric applicatios. MIT Prss. Cambridg, MA. MCCULLAGH, P. - NELDER, J.A. (989): Gralizd liar modls. Chapma Hall, Lodo. MCFADDEN, D. (983): Ecoomtric modls for probabilistic choic. I: MANSKI, C. MCFADDEN, D. (szrk.), Structural aalysis of discrt data with coomtric applicatios. MIT Prss, Cambridg, MA. ORME, C. (988): Th calculatio of th iformatio matrix tst for biary data modls. Th Machstr School, 60. sz. 370 376. old. PUDNEY, S. (989): Modllig idividual choic: th coomtrics of corrs. Kiks ad Hols, Basil Blackwll. Oxford. RAFTERY, A. E. (996): Baysia modl slctio i social rsarch. I: MARSDEN, P.V. (szrk.), Sociological Mthology. Basil Blackwll, Oxford. SMITH, J. R. (988): O us of distributioal misspcificatio chcks i limitd dpdt variabl modls. Discussio Papr ES03, Dpartmt of Ecoomtrics ad Social Statistics, Uivrsity of Machstr. TRAIN, K. E. (993): Qualitativ choic aalysis. MIT Prss, Cambridg, MA. VEALL, M. R. ZIMMERMANN, K. F. (996): Psudo-R masurs for som commo limitd dpdt variabls modls. Joural of Ecoomic Survys, 0. sz. 4 59. old. VERDES, E. (00): Th π*-idx: computatio, charactrisatio ad applicatio of a w goodss of fit masur. PhDdisszrtáció, Dbrci Egytm. WHITE, H. (98): Maximum liklihood stimatio of misspcifd modls. Ecoomtrica, 50. sz. 5. old. YATCHEW, A. GRILICHES, Z. (984): Spcificatio rror i probit modls. Rviw of Ecoomics ad Statistics, 66. sz. 34 39. old. SUMMARY Biary logit modls provd to b usful statistical mthods i applid coomics. Ths modls, howvr, rquir carful usag. I this papr a ovrviw of statistical mthods ad tsts is giv, primarily from practical poit of viw.