Regressziós vizsgálatok

Hasonló dokumentumok
Regressziós vizsgálatok

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Bevezetés a Korreláció &

Korreláció és lineáris regresszió

Korreláció számítás az SPSSben

Mérési adatok illesztése, korreláció, regresszió

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Korrelációs kapcsolatok elemzése

Regresszió számítás az SPSSben

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

GVMST22GNC Statisztika II.

[Biomatematika 2] Orvosi biometria

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Matematikai geodéziai számítások 6.

Többváltozós Regresszió-számítás

Matematikai geodéziai számítások 6.

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika elméleti összefoglaló

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Matematikai statisztikai elemzések 6.

Fogalom STATISZTIKA. Alkalmazhatósági feltételek. A standard lineáris modell. Projekciós mátrix, P

Gyakorló feladatok a kétváltozós regresszióhoz 2. Nemlineáris regresszió

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Kvantitatív statisztikai módszerek

Többváltozós lineáris regressziós modell feltételeinek

Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis

Statisztika II előadáslapok. 2003/4. tanév, II. félév

11. elıadás ( lecke) 21. lecke. Korreláció és Regresszió (folytatás) Lineáris-e a tendencia? Linearizálható nem-lineáris regressziós függvények

Többváltozós lineáris regresszió 3.

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

[Biomatematika 2] Orvosi biometria

Változók közötti kapcsolat III.: a folytonos eset. Regresszió és korreláció.

5. előadás - Regressziószámítás

Ökonometriai modellek paraméterei: számítás és értelmezés

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

6. előadás - Regressziószámítás II.

(Independence, dependence, random variables)

Logisztikus regresszió október 27.

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

A többváltozós lineáris regresszió III. Főkomponens-analízis

Adatok statisztikai értékelésének főbb lehetőségei

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Az állat becsült kor. teljes súly. teljes hossz orrtól. törzs hossza. pocak körkörös méret. hátsó láb hossza kör

Lineáris regressziószámítás 1. - kétváltozós eset

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

LOGIT-REGRESSZIÓ a függő változó: névleges vagy sorrendi skála

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

A többváltozós lineáris regresszió 1.

Korreláció és Regresszió

Segítség az outputok értelmezéséhez

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Korreláció, regresszió. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Bevezetés az ökonometriába

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

A modellben az X és Y változó szerepe nem egyenrangú: Y (x n )

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

A leíró statisztikák

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

Heckman modell. Szelekciós modellek alkalmazásai.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Számítógépes döntéstámogatás. Statisztikai elemzés

Least Squares becslés

Logisztikus regresszió

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Faktoranalízis az SPSS-ben

TÖBBVÁLTOZÓS KORRELÁCIÓ- ÉS

Biometria gyakorló feladatok BsC hallgatók számára

BIOMATEMATIKA ELŐADÁS

Diszkriminancia-analízis

Varianciaanalízis 4/24/12

Geokémia gyakorlat. 1. Geokémiai adatok értelmezése: egyszerű statisztikai módszerek. Geológus szakirány (BSc) Dr. Lukács Réka

Tárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102

c adatpontok és az ismeretlen pont közötti kovariancia vektora

Faktoranalízis az SPSS-ben

Túlélés elemzés október 27.

GYAKORLÓ FELADATOK KORRELÁCIÓ- ÉS REGRESSZIÓ-SZÁMÍTÁS

Kockázatos pénzügyi eszközök

Több valószínűségi változó együttes eloszlása, korreláció

Line aris f uggv enyilleszt es m arcius 19.

Többváltozós lineáris regressziós modell feltételeinek tesztelése II.

Osztályozás, regresszió. Nagyméretű adathalmazok kezelése Tatai Márton

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Logisztikus regresszió

Valószínűségi változók. Várható érték és szórás

Korreláció és Regresszió (folytatás) Logisztikus telítıdési függvény Több független változós regressziós függvények

Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

x 2 e x dx c) (3x 2 2x)e 2x dx x sin x dx f) x cosxdx (1 x 2 )(sin 2x 2 cos 3x) dx e 2x cos x dx k) e x sin x cosxdx x ln x dx n) (2x + 1) ln 2 x dx

Bevezetés a hipotézisvizsgálatokba

Túlélés analízis. Probléma:

Logisztikus regresszió

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Átírás:

Regressziós vizsgálatok

Regresszió (regression) Általános jelentése: visszaesés, hanyatlás, visszafelé mozgás, visszavezetés. Orvosi területen: visszafejlődés, involúció. A betegség tünetei, vagy maga a betegség javulása. Regrediál.

Regressziószámítás Regresszió: a változók közötti kapcsolat elemzésének elterjedt eszköze. Vizsgálja: egy kitüntetett, a vizsgálat tárgyát képező változó, amelyet eredményváltozónak (vagy függő változónak, response) nevezünk, hogyan függ egy vagy több ún. magyarázó (vagy független, prediktor) változótól.

Regressziós felület Egy változó esetén: (elsőfajú) regressziós egyenes. Két változó esetén: (elsőfajú) regressziós sík. Több változó esetén: regressziós felület.

Regressziós általános modell Input vektor: Output: Y (valós) Y-t jósoljuk egy f(x) függvény segítségével úgy, hogy a várható hiba minimális legyen. Négyzetes hiba: Minkowsky hiba: a kitevőben 2 helyett p.

Nemlineáris regresszió Polinomos regresszió: Ebben az esetben a regressziós függvényt ŷ = a 0 + a 1 x + a 2 x 2 + + a n x n alakban keressük. Hatványkitevős regresszió: ŷ = ax b Ez azzal ekvivalens: ln ŷ= lna + blnx

Nemlineáris regresszió Exponenciális regresszió: ŷ = ab x Ezzel ekvivalens: ln ŷ= lna + (lnb)x Logaritmikus regresszió: ŷ = a + blnx

Nemlineáris regresszió Probit regresszió: Maga a kifejezés az angol probability unit szavak összevonásából keletkezett és a dózis-hatás (tehát kvantális hatásvizsgálat) összefüggés egyik gyakran alkalmazott statisztikai eszköze.

Logisztikus regresszió A függő változó kategórikus : - bináris (a megfigyelt eseménynek csak két állapota van), - polychotomus (a megfigyelt esemény több állapotú). Többváltozós módszer, amelyben Több tényező (jellemző, tünet) alapján valamely betegség előfordulásának valószínűségét becsüljük. A független változók eloszlására nincs feltétel. p ( x) ( x x x x4 ) 1 e 0 1 1 1 2 2 3 3 4

Pearson féle lineáris korreláció

Hipotézisek H 0 : nincs korrelációs kapcsolat r = 0 H 1 : van korrelációs kapcsolat r 0

Feltételek Y: normális eloszlású legyen. X: normális eloszlású legyen.

cov( x, y) d x d y kovariancia n r cov( x, y) var( x) var( y) Az r korrelációs együttható olyan -1 és +1 között elhelyezkedő mutatószám, amelyik 1-hez közeli abszolút értékei szoros, közel lineáris függvényszerű kapcsolatot, 0 körüli értékei a lineáris kapcsolat hiányát (az ún. korrelálatlanságot) jelentik. Az r a két változó kapcsolat szorosságának mérőszáma. d d 2 x x d y d 2 y

A korreláció (a két változó közötti kapcsolat) erősségének megítélése. Leegyszerűsített megoldás a kapcsolat erősségére: 0-0,25: Nincs vagy igen gyenge 0,25-0,50: Gyenge 0,50-0,70: Mérsékelten erős vagy erős 0,70-1,00: Igen erős

A korrelációs koefficiens legfontosabb tulajdonságai 1. Ha nincs lineáris korreláció, akkor a korrelációs koefficiens értéke: 0, tökéletes pozitív, ill. negatív lineáris korreláció fennállása esetén a korrelációs koefficiens értéke +1,00, ill. -1,00. 2. A korrelációs koefficiens értéke független a mértékegységektől, amelyekben a két változó rögzítve van (pl. testmagasság és testsúly közötti korreláció, mindegy, hogy ezek milyen mértékegységben (kg, font, cm, inch) vannak megadva). 3. A korrelációs koefficiens értékét az outlier (kiugró) értékek igen erősen befolyásolják. Ezt minden esetben végig kell gondolni és pl. adat-transzformációt kell végrehajtani. A kiugró érték lehet egy szabálytalan, torzult eloszlás eredménye, ilyenkor segíthet a transzformáció, vagy lehet mérési hiba, ilyenkor lehet a mérést ismételni, vagy az értéket kizárni. 4, A korreláció nem jelent ok-okozati kapcsolatot: ez lehet annak a következménye, hogy az x tengelyre felvett változó befolyásolja az y tengelyre felvettet; az y tengelyre felvett változó befolyásolja az x tengelyre felvettet- Egyik eset sem áll fenn, hanem egy harmadik tényező mindkettőt egy irányba (pozitív korreláció) vagy különböző irányokba (negatív korreláció) mozdítja el.

Parciális korreláció Egymás hatásától megtisztított érték. X, Y, Z változók esetén: pl. X, Y korrelációja: levesszük Z hatását a kapcsolatból.

Lineáris regresszió

Hipotézisek H 0 : nincs regressziós kapcsolat 1 = 0 H 1 : van regressziós kapcsolat 1 0

Feltételek Y: normális eloszlású legyen. X: hibamentesen mérjük és legalább 3 értéke legyen.

Lineáris regressziós modell yˆ ahol: E() = 0 Var() = 2 Cov( i, j ) = 0 ~ N(0,) ˆ 0 x Annyit feltételezünk, hogy: Van két változónk (legalább intervallumskála), Közöttük kvázi lineáris kapcsolat van. ˆ 1

yˆ ˆ 0 ˆ 1 x Hiba (0 átlagú) Eredményváltozó Magyarázó változó Kétváltozós lineáris modell

y Y változás X változás b (meredekség): y változás/x változás 0 x

Egy y^ = 0^+ 1^x egyenest keresünk Az input/output adatok nem feltétlenül esnek az egyenesre, a hiba e i y i = 0^ + 1^x i + e i A hibák négyzetösszegét akarjuk minimalizálni. e i véletlen zaj minimalizálnunk kell: Ez egy kvadratikus függvény, pontosan ott lesz minimális, ahol a 0 ittelve a 1 szerinti deriváltak nullák. Eredmény: ˆ 0 y ˆ x 1 n n n 2 2 2 e ˆ ˆ ˆ i ( yi yi ) ( yi 0 1xi ) i1 i1 i1 ˆ 1 n i1 ( x n i i1 ( x x)( y i i x) 2 y)

R 2 SSR 1 SSE SST SST Determinációs együttható - az eredményváltozónak a regresszió által magyarázott és teljes eltérésnégyzetösszegei hányadosaként számítható mutatószám. Jelölése R 2 Az R 2 százszorosa megmutatja, hogy a regressziós modellel az y adatokban meglévő variancia (bizonytalanság) hány százaléka szüntethető meg

Linearizálás, pl.

ˆ1 yˆ x

Elaszticitás - rugalmasság. Olyan mutatószám, mely megadja, hogy a magyarázó változó egy százalékos elmozdulása hány százalékos és milyen irányú elmozdulással jár együtt az eredményváltozóban. Pl. ár és jövedelem rugalmassági együttható - rugalmas fogyasztás (közszükségleti cikkek): I1I < rugalmatlan fogyasztás (luxuscikkek): I1I >

Ha a magyarázó változók száma (k) több (k>1), akkor sok(több)változós lineáris modellről beszélünk: y 0 1 x 1 2 x 2 x k k

Quantile regresszió A függő változó quantiliseinek a finomabb spektrumú becslése.