Többváltozós Regresszió-számítás

Hasonló dokumentumok
Többváltozós Regresszió-számítás

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Regresszió-számítás. 2. előadás. Kvantitatív statisztikai módszerek. Dr.

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Korreláció-számítás. 1. előadás. Döntéselőkészítés módszertana. Dr.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Többváltozós lineáris regressziós modell feltételeinek

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

Regresszió. Fő cél: jóslás Történhet:

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

OLS regresszió - ismétlés Mikroökonometria, 1. hét Bíró Anikó A tantárgy tartalma

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

Lineáris regresszió. Statisztika I., 4. alkalom

Gyakorló feladatok a Kísérletek tervezése és értékelése c. tárgyból Lineáris regresszió, ismétlés nélküli mérések

Nemlineáris függvények illesztésének néhány kérdése

Statisztika feladatok

Boros Daniella Nappali tagozat Kereskedelem és marketing 2. évfolyam Gödöllő Neptun kód: OIPGB9

Határérték. Wettl Ferenc el adása alapján és Wettl Ferenc el adása alapján Határérték és

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztika elméleti összefoglaló

3. Lokális approximáció elve, végeselem diszkretizáció egydimenziós feladatra

Többváltozós lineáris regressziós modell feltételeinek tesztelése II.

ADATREDUKCIÓ I. Középértékek

) ( s 2 2. ^t = (n x 1)s n (s x+s y ) x +(n y 1)s y n x+n y. +n y 2 n x. n y df = n x + n y 2. n x. s x. + s 2. df = d kritikus.

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

4 2 lapultsági együttható =

a.) b.) c.) d.) e.) össz. 4 pont 2 pont 4 pont 2 pont 3 pont 15 pont

Több valószínűségi változó együttes eloszlása, korreláció

Regresszió és korreláció

Regresszió számítás. Mérnöki létesítmények ellenőrzése, terveknek megfelelése. Geodéziai mérések pontok helyzete, pontszerű információ

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

A differenciálegyenlet általános megoldása az összes megoldást tartalmazó halmaz.

Matematika OKTV I. kategória 2017/2018 második forduló szakgimnázium-szakközépiskola

7. Kétváltozós függvények

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI EMELT SZINT Egyenletek, egyenletrendszerek

Minősítéses mérőrendszerek képességvizsgálata

A multikritériumos elemzés célja, alkalmazási területe, adat-transzformációs eljárások, az osztályozási eljárások lényege

Regresszió és korreláció

A sokaság/minta eloszlásának jellemzése

Kísérlettervezési alapfogalmak:

Matematikai statisztika elıadás III. éves elemzı szakosoknak. Zempléni András 9. elıadásból (részlet)

Változók közötti kapcsolatok vizsgálata

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Korreláció és lineáris regresszió

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

Statisztika II előadáslapok. 2003/4. tanév, II. félév

OKTATÁSGAZDASÁGTAN. Készítette: Varga Júlia Szakmai felelős: Varga Júlia június

ADATREDUKCIÓ I. Középértékek

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI EMELT SZINT Egyenletek, egyenletrendszerek

Mikro és makroökonómia BMEGT30A001 C1-es kurzus Jegyzet gyanánt 2018 ősz 3.ELŐADÁS

MAGYARÁZAT A MATEMATIKA NULLADIK ZÁRTHELYI MINTAFELADATSOR FELADATAIHOZ 2010.

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

A végeselem programrendszer általános felépítése (ismétlés)

ξ y = (EXCEL-ben: ÁTLAG)

Kidolgozott feladatok a nemparaméteres statisztika témaköréből

Biológiai anyagok hatásának értékelése, ha közvetlen fizikai vagy kémiai analízis nem alkalmazható.

Másodfokú függvények

A DETERMINÁCIÓS EGYÜTTHATÓRÓL

4. Egyéni és piaci kereslet. 4.1 Ár-ajánlati görbe (PCC)

Matematikai statisztika

Függvények határértéke és folytonossága. pontban van határértéke és ez A, ha bármely 0 küszöbszám, hogy ha. lim

Kettőnél több csoport vizsgálata. Makara B. Gábor

ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

10. elıadás: Vállalati kínálat, iparági kínálat Piaci ár. A versenyzı vállalat kínálati döntése. A vállalat korlátai

Keresztkorreláció vizsgálata statisztikai teszttel

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Nemparaméteres eljárások

Algebrai egész kifejezések (polinomok)

Függetlenségvizsgálat, Illeszkedésvizsgálat

Varianciaanalízis 4/24/12

Dr. Ratkó István. Matematikai módszerek orvosi alkalmazásai Magyar Tudomány Napja. Gábor Dénes Főiskola

Regressziós vizsgálatok

Kétváltozós függvények ábrázolása síkmetszetek képzése által

Extrém-érték elemzés. Extrém-érték eloszlások. A normálhatóság feltétele. Megjegyzések. Extrém-érték modellezés

Elemi függvények. Nevezetes függvények. 1. A hatványfüggvény

Inverz függvények Inverz függvények / 26

1. MÁSODRENDŰ NYOMATÉK

ADATREDUKCIÓ I. Középértékek

Statisztikai. Statisztika Sportszervező BSc képzés (levelező tagozat) Témakörök. Statisztikai alapfogalmak. Statisztika fogalma. Statisztika fogalma

Y 10. S x. 1. ábra. A rúd keresztmetszete.

Bolyai János Matematikai Társulat. Rátz László Vándorgyűlés Baja

[Biomatematika 2] Orvosi biometria

Extrém-érték elemzés. Extrém-érték eloszlások. Megjegyzések. A normálhatóság feltétele. Extrém-érték modellezés

Kidolgozott feladatok a gyökvonás témakörhöz (10.A osztály)

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

5. előadás - Regressziószámítás

Szegedi Tudományegyetem Gazdaságtudományi Kar. Petres Tibor Tóth László. STATISZTIKA I. kötet

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Tartóprofilok Raktári program

A kereslet. Háztartás-statisztika KÖZGAZDASÁGTAN GAZDASÁGI INFORMATIKUSOKNAK. Háztartás panel Legfelső ötöd

4. hét Fogyasztói preferenciák, (hasznosság) A PIACI KERESLET - ÉS AMI MÖGÖTTE VAN. Varian: fejezet

Regresszióanalízis. Lineáris regresszió

Matematika szintfelmérő szeptember

Komplex regionális elemzés és fejlesztés tanév DE Népegészségügyi Iskola Egészségpolitika tervezés és finanszírozás MSc

Átírás:

Töváltozós Regresszó-számítás 4.-5. előadás Kvanttatív statsztka módszerek Dr. Szlág Roland

Korrelácó Célja a kacsolat szorosságának mérése. X (X, X,, X ): magarázó változó(k), független változó(k) Y: eredménváltozó, függő változó Regresszó Ok-okozat kacsolat: X okozza Y változását Célja a kacsolatan megfgelhető törvénszerűség megfogalmazása, amelet valamlen függvén ír le.

Töváltozós lneárs regresszós modell,,, és között kacsolatot árázoló egenes. Az függ:,,, d magarázó változótól A véletlen ngadozásától (ε) β, β,, β regresszós egütthatóktól. Y = β + β + β + + β +ε

Töváltozós lneárs regresszó adatstruktúrája n n n n X

Legkse négzetek módszere A legkse négzetek módszere segítségével megtalálható a legjo torzítatlan ecslése a (β, β, β, β ) regresszós aramétereknek. (BLUE) f ( ; ; ;... ;) (... ) mn ŷ...

6 A araméterecslés egenletrendszere mn )... ( ;) ;... ; ; ( f............ n

Az egenletrendszer mátr alakan felírva: n............ X X X T T

Az egenletrendszer mátr alakan felírva: X X X T T X X X T T Az egenletrendszer megoldása adja a regresszós araméterek ecsült értéket, melek segítségével felírható a taasztalat (ecsült) regresszó függvén.

A araméterek értelmezése ŷ... Y -val lesz egenlő aan az eseten, ha mnden X =. Ez csak aan az eseten értelmezhető, a Y értékkészletéen szereel a. Az X egségn növekedésének hatására az eredménváltozó átlagosan egséggel fog megváltozn, ha a tö magarázó változó értéke nem változk (Ceters Parus).

Rezduáls változó n n n e e e ˆ ˆ ˆ ˆ ˆ S = + S e A megfgelt Y értékek eltérés négzetösszege A regresszó által magarázott eltérésnégzetösszeg A rezduáls eltérés (maradék) eltérésnégzetösszege S ˆ

ANOVA A varanca forrása Eltérésnégzetösszeg (SS) Szaadságfo k (DF) Átlagos négzetösszeg (MS) F-érték SSR S ŷ = (ŷ ) Regresszó (R) MSR=SSR/ Haténező (E) SSE S = ( ŷ n-- MSE=SSE/(n--) e ) F MSR MSE SST S = ( ) Teljes (T) n- -

Modell tesztelés H : H : j. F SSR SSE n

β araméterek tesztelése Ha t számított <t krtkus H Ha t számított >t krtkus H : : H H e v s s( = t ) ; n t krtkus t

Töváltozós lneárs regresszós modell feltételrendszere A hatagra vonatkozó feltételek. Várható értéke M(ε) =. Varancája konstans Var(ε) = 3. A hatag értéke nem autokorreláltak. 4. Normáls eloszlású valószínűség változó.

A magarázó változókra vonatkozó feltételek. Egmástól lneársan függetlenek legenek. (egk magarázó változót se lehessen a tö magarázó változó lneárs komnácójaként előállítan). Értékek rögzítettek legenek, ne változzanak mntáról mntára. 3. Mérés hát nem tartalmaznak. 4. Nem korrelálnak a haténezővel.

Feltétel Felt. sérülése Köv. Ellenőrzés Megjegzés Lneartás Független (egmástól) Normáls eloszlás Nem korreláltak Nem lneárs kacsolat Függő és független változókra vonatkozó feltétel Multkollneartás Nem normáls eloszlás Autokorrelácó Homoszkedasztctás Heteroszkedasztctás; korrelál az X -vel Becsült értékek sérülése Megízhatatlan ecslés, magas st. ha a regr. koeffcensnél Pontdagram, r F szgnfkáns, t nem; Korrelácós mátr; VIF-mutató Hatagokra vonatkozó feltétel F-teszt, t-teszt érvéntelen Nem hatásos, nag KI Nem hatásos, nag KI Rezduumok standardzált eloszlásának hsztogramja Rezduumok árázolása az dő / a megfgelések sorrendjéen; Durn- Watson teszt Pontdagram a standardzált rezduumok szórásáról Kzárólag töváltozós regr. esetéen Legkse négzetek módszere kküszööl Idősornál merülhet fel a roléma. Logartmzálás vag a súlozottan LNM segít Forrás: Sajtos-Mtev [6], 7.o.

Standard lneárs regresszós modell Ahol az elő említett feltételek teljesülnek. Amennen a mntael adatok nem gazolják a feltételek teljesülését, onolulta modellre és ecslés eljárásokra van szükség.

A hatagra vonatkozó feltételek ellenőrzése. Várható értéke M(ε) =. Varancája konstans Var(ε) = 3. A hatag értéke nem autokorreláltak. 4. Normáls eloszlású valószínűség változó.

. M(ε) = A hatagok oztív és negatív értéke kegenlítk egmást. Ha eltér a -tól, annak oka lehet, hog khagtunk a modellől eg szgnfkáns magarázó változót. Nehéz a gakorlatan ellenőrzn. Ha feltételezzük, hog a legkse négzetek módszere érvénesül, akkor teljesül ez a feltétel.

A hatagra vonatkozó feltételek ellenőrzése. Várható értéke M(ε) =. Varancája konstans Var(ε) = 3. A hatag értéke nem autokorreláltak. 4. Normáls eloszlású valószínűség változó.

. Homoszkedasztctás (Var(ε) = ) A hatag varancája állandó. Ha nem: heteroszkedasztctás Tesztelése: o Grafkus a ecsült rezduumokat a kválasztott magarázó változó vag az ŷ függvénéen árázoljuk o Statsztka tesztek Goldfeld-Quandt-féle teszt, (Különösen akkor, ha a heteroszkedasztctás valamelk magarázó változóhoz kacsolódk.)

Homoszkedasztctás grafkus tesztelése e e e ŷ ŷ ŷ Homoszkedasztkus hatag Heteroszkedasztkus hatag e rezduum

Homoszkedasztctás Goldfeld- Quandt-féle tesztelése H : j = H : j n-r (a varancák eloszlást követnek és ezek egmástól függetlenek) Léése:. Rangsor: a keresztmetszet adatokat szernt rangsora rendezzük.. Független részmnták ; r;, (ahol r >, > ) 3. Regresszós függvének, rezduáls szórásnégzet (s e ) számítása az. és 3. csoortra e s 4. F-róa: F e s n - r n r n - r F (α/) n - r H F (-α/); ν,ν

A hatagra vonatkozó feltételek ellenőrzése. Várható értéke M(ε) =. Varancája konstans Var(ε) = 3. A hatag értéke nem autokorreláltak. 4. Normáls eloszlású valószínűség változó.

A hatag értéke korrelálatlanok Keresztmetszet adatokól történő egszerű véletlen mntavétel esetéen ez a feltétel automatkusan teljesül. Ha a modell dősoros adatokra éül, gakran előfordul a hatagok autokorreláltsága. Autokorrelácó oka: Nem megfelelő függvéntíus. Nem véletlen jellegű mérés ha. A modellen nem szereel valamenn léneges magarázó változó (nem smerjük fel a szereét / túl rövd dősor / nncs adat).

Autokorrelácó grafkus tesztelése e t t e e A khagott változók matt a rezduumok nem véletlenszerűek, hanem az egmást követő értékek között jelentős korrelácó van. t Az autokorrelácó a függvéntíus heltelen megválasztásának a következméne. + KVANTITATÍV TESZTEK!

Autokorrelácó tesztelése Durn-Watson H : ρ = korrelálatlan róával H : ρ autokorrelácó + zavaró autokorrelácó - zavaró autokorrelácó d l d u 4-d u 4-d l 4 d n t Határa: ( e n t t ) t d 4 Poztív autokorrelácó: d Negatív autokorrelácó: t e e d 4 Bzontalanság tartomán: nem tudunk dönten Növeln kell a megfgelések számát Új változót kell evonn a modelle Elfogadás tartomán

A Durn-Watson róa döntés tálázata H Elfogadjuk H := Elvetjük > Poztív autokorrelácó < Negatív autokorrelácó Nncs döntés d>d u d<d l d l <d<d u d<4-d u d>4-d l 4-d l <d<4-d u d u lletve d l értékét a Durn-Watson tálázatól határozzuk meg Forrás: Kerékgártó-Mundruczó [999]

A hatagra vonatkozó feltételek ellenőrzése. Várható értéke M(ε) =. Varancája konstans Var(ε) = 3. A hatag értéke nem autokorreláltak. 4. Normáls eloszlású valószínűség változó.

A hatag eloszlása normáls Tesztelése: Grafkusan árákkal Kvanttatív módszerekkel lleszkedésvzsgálat - róa Ferdeség, csúcsosság mérőszámokkal

A rezduumok eloszlásának grafkus tesztelése e z A rezduumokat várható értékük függvénéen árázoljuk. Ha az ára megközelítően lneárs, akkor a feltétel teljesült.

Illeszkedésvzsgálat H : P r (ε j ) = P j (normáls eloszláshoz tartozó megfelelő valószínűség érték) H : J j : P r (ε j ) P j r ( f ) np np H ( ),( r )

A magarázó változókra vonatkozó feltételek. Egmástól lneársan függetlenek legenek. (egk magarázó változót se lehessen a tö magarázó változó lneárs komnácójaként előállítan). Értékek rögzítettek legenek, ne változzanak mntáról mntára. 3. Mérés hát nem tartalmaznak. 4. Nem korrelálnak a haténezővel.

Multkollneartás Mntael tulajdonság mntán kívül nem alkalmazható. Ellenőrzése: X j =f(x, X,,X j-, X j+,,x ) regresszós modell kézése után: Töszörös determnácós egütthatóval F-róával (F>F krt ) VIF-mutatóval

VIF-mutató Varancanövelő ténező VIF VIF= VIF ha R j = (amkor a j. magarázó változó nem korrelál a tö magarázó változóval) VIF R j = (a j. magarázó változó ontosan kfejezhető a tö lneárs komnácójaként) VIF - genge multkollneartás 5 VIF VIF 5 - erős zavaró multkollneartás R - nagon erős, káros multkollneartás j j

Káros multkollneartás esetén megkeressük azokat a magarázó változókat, amelek a zavart okozzák, és elhagjuk őket a modellől; az egmással nagon szoros kacsolatan álló magarázó változókat eg új változóan összevonjuk (főkomonensek), amel mása lesz, mnt az eredet, de hordozza azok nformácótartalmát.

Otmáls regresszós modell feléítése Hogan válasszuk k, mel magarázó változók kerüljenek e a modelle és melek nem? Korrelácós egütthatók Stewse eljárások Backward elmnácós módszer Foreward módszer.

Backward elmnácó léése. A magarázó változóval szerntünk logkalag összefüggő valamenn változót eéítjük a modelle és kszámítjuk a araméterek standard háját.. Kszámítjuk a magarázó változók araméterere a arcáls t-róa értékét.

β araméterek tesztelése Ha t számított <t krtkus H Ha t számított >t krtkus H : : H H e v s s( = t ) ; n t krtkus t

H : o Gazdaságtudomán Kar Backward elmnácó léése 3. Megvzsgáljuk azt, hog az aszolút értéken legalacsona t értékkel író változó szgnfkáns változó-e: ha a róafüggvén értéke magasa az adott szgnfkancasznthez tartozó függvénértéknél. a változót megtartjuk a modellen, íg otmáls regresszó-függvénnek az általunk választott valamenn változót tartalmazó modell teknthető, tehát már első terácóan otmáls regresszó-függvénhez jutottunk. Een az eseten teszteljük a modell megízhatóságát.

Model Testng : H : H : j. Pr H : Pr F n SSR SSE H ; ) F F ( ; ) F ( ; ) F

H : o Gazdaságtudomán Kar Backward Elmnaton ha a róa értéke alacsona az adott szgnfkanca-sznthez tartozó értéknél, akkor e változót kzárjuk - elmnáljuk - a regresszós modellől: e változó - a tö változóhoz kéest - nem gakorol léneges hatást a magarázó változóra, nncs ndokunk a modellen való szereeltetésére. 4. A maradék magarázó változók felhasználásával eg úja modellt szerkesztünk, majd a. ontnál foltatjuk a vzsgálatot.

H : o Gazdaságtudomán Kar Foreward módszer. A modelle elsőként azt a változót éítjük e, amelnek a legszorosa a kacsolata az eredménváltozóval a legnago a arcáls determnácós egütthatója.. Megvzsgáljuk, hog az első léésen evont változó szgnfkáns kacsolatan van-e az eredménváltozóval. F SSR SSE n

Foreward módszer 3. Az első léésen evonásra nem került magarázó változókra (;; -; +; ;) meghatározzuk a arcáls korrelácós egütthatókat. Másodkként azt a változót vonjuk e a modelle, amelnél az tt meghatározott arcáls korrelácós egütthatók négzete ( arcáls determnácós egüttható ) értéke a legmagasa. 4. Az új változó evonásával meghatározott új regresszós modell araméteret. Ha a arcáls regresszós araméterek értéke szgnfkánsan különözk nullától, akkor a munkát tová foltatjuk. Ellenkező eseten vsszatérünk a 3. lééshez. 5. A folamat addg tart, amíg az összes alkalmasnak vált magarázó változót nem teszteljük.

.. Mesterséges változók a regresszós elemzésen (dumm) Aan az eseten, ha a mnőség smérvnek két változata lehetséges, lletve megoldható annak alternatívvá alakítása, akkor numerkussá tehető úg, hog az egk előfordulást értékkel, a másk előfordulást értékkel tesszük egenlővé. Íg a mnőség smérvek korlátozott száman eéíthetők a regresszós modelle., ha nem teljesül a feltétel, ha teljesül a feltétel

H : o Gazdaságtudomán Kar Dumm változó alkalmazása Tegük fel, hog a háztartások fogasztás kadás függ a háztartás jövedelmétől (X ). Valamnt feltehetően függ attól s, hog hol él. (eg vdék háztartás kadása másként alakulnak, mnt eg városé) X = ha a háztartás vdék X = ha a háztartás város X eg dumm változó. Y = β + β X + β X +ε

H : o Gazdaságtudomán Kar Dumm változó alkalmazása A araméter ecsült értéke megmutatja, hog a város háztartás kadása átlagosan mennvel töek (vag keveseek, ha negatíve) eg vdék háztartás kadásahoz kéest, ha a háztartás jövedelme uganann.

H : o Gazdaságtudomán Kar Dumm változó alkalmazása Ha a modell olan nem metrkus smérvet tartalmaz, amelk k smérvváltozattal rendelkezk és nem szeretnénk alternatívvá tenn, akkor, k- dara dumm változó segítségével éíthető a modelle, úg, hog az egk változat lesz a ázs érték.

H : o Gazdaságtudomán Kar Dumm változó alkalmazása Iskola végzettség általános közé felső ŷ

Köszönöm a fgelmet strolsz@un-mskolc.hu