: az i -ik esélyhányados, i = 2, 3,..I

Hasonló dokumentumok
Feltesszük, hogy a mintaelemek között nincs két azonos. ha X n a rendezett mintában az R n -ik. ha n 1 n 2

Logisztikus regresszió

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Logisztikus regresszió október 27.

LOGIT-REGRESSZIÓ a függő változó: névleges vagy sorrendi skála

Logisztikus regresszió

Osztályozás, regresszió. Nagyméretű adathalmazok kezelése Tatai Márton

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Statisztika II előadáslapok. 2003/4. tanév, II. félév

Regresszió számítás az SPSSben

Likelihood, deviancia, Akaike-féle információs kritérium

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Bevezetés a Korreláció &

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

A modellben az X és Y változó szerepe nem egyenrangú: Y (x n )

Statisztika elméleti összefoglaló

Többváltozós lineáris regressziós modell feltételeinek

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Nemparaméteres próbák

MÓDSZERTANI ESETTANULMÁNY. isk_4kat végzettségek négy katban. Frequency Percent Valid Percent. Valid 1 legfeljebb 8 osztály ,2 43,7 43,7

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztikai szoftverek esszé

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

[Biomatematika 2] Orvosi biometria

Valószínűségszámítás összefoglaló

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

14 A Black-Scholes-Merton modell. Options, Futures, and Other Derivatives, 8th Edition, Copyright John C. Hull

Egy és többváltozós logisztikus regressziós vizsgálatok és alkalmazásaik a klinikumban

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Esettanulmány. A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre. Tartalomjegyzék. 1. Bevezetés... 2

Lineáris regresszió vizsgálata resampling eljárással

Segítség az outputok értelmezéséhez

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Statisztikai becslés

Bevezetés a hipotézisvizsgálatokba

Elektronikus kommunikáció jelentősége a fiatalok baráti kapcsolataiban

Sztochasztikus kapcsolatok

[Biomatematika 2] Orvosi biometria

A Statisztika alapjai

Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

Regresszió és ANOVA. Freedman: fejezet. Freedman: fejezet. Freedman: fejezet

Regressziós vizsgálatok

Számítógépes döntéstámogatás. Statisztikai elemzés

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Biostatisztika Összefoglalás

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

BIOMATEMATIKA ELŐADÁS

PDF created with FinePrint pdffactory Pro trial version Adott egy X folytonos változó, ami normális eloszlású.

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Továbblépés. Általános, lineáris modell. Példák. Jellemzık. Matematikai statisztika 12. elıadás,

Egy és (többváltozós) logisztikus regressziós vizsgálatok és alkalmazásaik a klinikumban

Több diszkrét kimenet multinomiális és feltételes logit modellek

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Kísérlettervezés alapfogalmak

GRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens

A valószínűségszámítás elemei

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Diszkriminancia-analízis

Baran Ágnes. Gyakorlat MATLAB. Baran Ágnes Gyakorlat 1 / 70

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

π = P(y bekövetkezik)

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis

Korreláció számítás az SPSSben

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

13. Túlélési analízis. SURVIVAL ANALYSIS Nyári Tibor Ph.D., Boda Krisztina Ph.D.

Keszi Roland. A távmunkavégzés munkaszervezeti bevezetését meghatározó tényezők a kkv szektorban. Szervezetszociológiai modellkísérlet

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Normális eloszlás tesztje

Matematikai geodéziai számítások 6.

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Statistical Inference

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Biostatisztika Összefoglalás

Való szí nű sé gi va ltózó, sű rű sé gfű ggvé ny, élószla sfű ggvé ny

Matematikai geodéziai számítások 6.

Kísérlettervezés alapfogalmak

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Túlélés elemzés október 27.

Adatelemzés és adatbányászat MSc

A valószínűségszámítás elemei

1. Példa. A gamma függvény és a Fubini-tétel.

IBNR számítási módszerek áttekintése

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

I. LABOR -Mesterséges neuron

Fogalom STATISZTIKA. Alkalmazhatósági feltételek. A standard lineáris modell. Projekciós mátrix, P

Átírás:

Kabos: Adatelemzés Ordinális logisztikus regresszió-1 Többtényezős regresszió (az adatelemzésben): Y közelítése b 1 X 1 + b 2 X 2 +... + b J X J alakban, y n = b 1 x n,1 + b 2 x n,2 +... + b J x n,j + ε n, n = 1, 2,.., N, ahol ε 1,.., ε N független N(, σ 2 ) eloszlású valószínűségi változók, és σ ismeretlen paraméter, és {x 1,1, x 2,1,.., x N,J } ismert értékek. Y kimeneti változó számértékű X 1,..., X J magyarázó változók Elterjedt szóhasználat: többváltozós regresszió. Bináris logisztikus regresszió: { 1 p 1 valószínűséggel az Y változó bináris, értékei = 2 p 2 valószínűséggel ϑ = P (Y = 1) P (Y = 2) : esélyhányados log(ϑ) közelítése a + b 1 X 1 + b 2 X 2 +... + b J X J alakban, ahol X 1,..., X J magyarázó változók Multinomiális logisztikus regresszió: 1 p 1 valószínűséggel 2 p 2 valószínűséggel az Y változó kategoriális, értékei =... I p I valószínűséggel ϑ = P (Y = i) P (Y = 1) : az i -ik esélyhányados, i = 2, 3,..I log(ϑ i ) közelítése a i + b 1,i X 1 + b 2,i X 2 +... + b J,i X J alakban, ahol X 1,..., X J magyarázó változók

Kabos: Adatelemzés Ordinális logisztikus regresszió-2 Ordinális logisztikus regresszió (PLUM) : 1 p 1 valószínűséggel 2 p 2 valószínűséggel az Y változó ordinális, értékei =... I p I valószínűséggel ϑ = P (Y i) P (Y > i) : az i -ik esélyhányados, i = 1, 2, 3,..(I 1) log(ϑ i ) közelítése a i + b 1,i X 1 + b 2,i X 2 +... + b J,i X J alakban, ahol X 1,..., X J magyarázó változók Ordinális logisztikus regresszió (CR) : ϑ = P (Y = i + 1) P (Y i) Probit regresszió : : az i -ik esélyhányados, i = 1, 2, 3,..(I 1) Y bináris változó Az egy magyarázó változós eset: a ϑ = P (Y = 1) valószínűséget P (ξ < X) alakban keressük, ahol ξ N(µ, σ 2 ) ahol µ, σ ismeretlen paraméterek. Több magyarázó változó esetében Φ 1 (ϑ) közelítését keressük a + b 1 X 1 + b 2 X 2 +... + b J X J alakban, ahol X 1,..., X J magyarázó változók, Φ a standard normális eloszlásfüggvény. Poisson regresszió : Y természetes szám értékű változó Y P oisson (ϑ) eloszlású, és log(ϑ) közelítése a + b 1 X 1 + b 2 X 2 +... + b J X J alakban. Az általánosított lineáris modell segítségével minden eddig bemutatott modell paraméterbecslése elvégezhető. Az utolsó két( példa t ) kivételével mind egy speciális link függvényéhez, a logit(t) = log 1 t függvényhez kapcsolódnak.

Bináris logisztikus regresszió kimeneti változó: studbin (bináris változó, az ISSP SocIneq v változójából létrehozva) magyarázó változók: és urb People study to earn a lot of money Frequency Percent Valid Percent Cumulative Percent Valid 1 Strongly agree 2 19.1 19.6 19.6 2 Agree 576 5.1 51.4 71.1 3 Neither agree nor disagree 182 15.8 16.2 87.3 4 Disagree 142 12.3 12.7. Total 11 97.4. Missing 8 Cant choose 19 1.7 9 No answer 11 1. Total 3 2.6 Total 115. studbin Frequency Percent Valid Percent Cumulative Percent Valid 1 796 69.2 71.1 71.1 2 324 28.2 28.9. Total 11 97.4. Missing System 3 2.6 Total 115. studbin B S.E. Wald df Sig. Step 1 rincom.3.8.3 1.749 urb -.3.155 6.766 1.9 Constant -.31.311.939 1.333

People study to earn a lot of money frequency 3 5 urban rural 1 2 Opinion A feltett kérdésre a választ két kimetelre vontuk össze opt.1 (egyetértő) illetve opt.2 (tagadó). Ez a hisztogram a lakhely típusa szerinti bontásban ábrázolja a válasz gyakoriságokat. opt.1 opt.2 össz URBAN 19 99 289 RURAL 457 159 616 opt.1 opt.2 össz URBAN 65.7% 34.3%.% RURAL 74.2% 25.8%.%

People study to earn a lot of money 3 pct of subtotal 3 A válaszolók jövedelemeloszlása: opt.1 (alsó hisztogram) és opt.2 (felső)

People study to earn a lot of money: opt.2.26.28.3.32.34.36.38 opt.1 opt.2 össz URBAN 65.7% 34.3%.% RURAL 74.2% 25.8%.% A bináris logisztikus regressziós modell esély függvénye: ábrázoljuk annak a valószínűségét, hogy egy ember a binarizált V kérdésre az opt 2. (tagadó) választ adja. A valószínűség a megkérdezett jövedelmének és lakhelyének függvénye.

Multinomiális logisztikus regresszió a kimeneti változó: ISSP SocIneq v4 változója (öt kategóriás), magyarázó változók: és urb Importance: coming from a wealthy a famil B Std. Error Wald df Sig. 2 Very important Intercept.788.499 2.496 1.114 rincom.73.33 4.766 1.29 [urb=1] -.433.493.771 1.38 [urb=2] b... 3 Fairly important Intercept 1.666.48 12.58 1.1 rincom.68.32 4.427 1.35 [urb=1].211.461.2 1.647 [urb=2] b... 4 Not very important Intercept 1.444.485 8.87 1.3 rincom.59.33 3.222 1.73 [urb=1].299.465.413 1.5 [urb=2] b... 5 Not important at all Intercept.437.53.68 1.4 rincom.56.35 2.548 1.1 [urb=1] -.279.5.287 1.592 [urb=2] b... a. The reference category is: 1 Essential. b. This parameter is set to zero because it is redundant.

Importance: coming from a wealthy famil Frequency Percent Valid Percent Cumulative Percent Valid 1 Essential 36 3.1 3.3 3,3 2 Very important 171 14.9 15.7 19, 3 Fairly important 453 39.4 41.5 6,4 4 Not very important 333 29. 3.5 9,9 5 Not important at all 99 8.6 9.1, Total 92 95.. Missing 8 Cant choose 22 1.9 9 No answer 36 3.1 Total 58 5. Total 115.

Importance: coming from a wealthy family urban rural frequency 5 15 25 1 2 3 4 5 Opinion

Importance: coming from a wealthy family pct of subtotal 5 3 5 3 5 3 5 3 5 3

Az eddigi ábrákból azt látjuk, hogy a jövedelemeloszlásban jól látható különbségek vannak a válasz osztályok között, viszont a lakhely típusa szerinti különbségek nem szembeötlők. A Multinomiális logisztikus modell paramétereinek szignifikancia szintjei alapján hasonló következtetésre jutunk. Most megnézzük a modell esély függvényeit (az egyes válasz opciók valószínűségét a válaszadó jövedelme és lakhely típusa függvényében). Importance: coming from a wealthy family: opt.1..1.2.3.4.5.6

Importance: coming from a wealthy family: opt.2..15..25.3 Importance: coming from a wealthy family: opt.3..45.5.55

Importance: coming from a wealthy family: opt.4.15..25.3.35 Importance: coming from a wealthy family: opt.5.4.6.8.

Multinomiális logisztikus regresszió a kimeneti változó: ISSP SocIneq v változója (négy kategóriára összevonva), magyarázó változók: és urb People study to earn a lot of money a B Std. Error Wald df Sig. 2 Agree Intercept.716.197 13.274 1. rincom..11.873 1.35 [urb=1].238.198 1.452 1.228 [urb=2] b... 3 Neither agree nor disagree Intercept -.622.243 6.523 1.11 rincom.12.13.857 1.355 [urb=1].73.238 8.721 1.3 [urb=2] b... 4 Disagree Intercept -.771.269 8.186 1.4 rincom.8.15.287 1.592 [urb=1].395.266 2.9 1.137 [urb=2] b... a. The reference category is: 1 Strongly agree. b. This parameter is set to zero because it is redundant.

People study to earn a lot of money Frequency Percent Valid Percent Cumulative Percent Valid 1 Strongly agree 2 19.1 19.6 19,6 2 Agree 576 5.1 51.4 71,1 3 Neither agree nor disagree 182 15.8 16.2 87,3 4 Disagree 142 12.3 12.7, Total 11 97.4. Missing 8 Cant choose 19 1.7 9 No answer 11 1. Total 3 2.6 Total 115.

People study to earn a lot of money frequency 5 15 25 3 35 urban rural 1 2 3 4 Opinion People study to earn a lot of money pct of subtotal 3 3 3 3

A fenti ábrákból nem sok különbséget látunk a jövedelemeloszlásban, de a lakhely típusa szerinti különbségek szembeötlők. A Multinomiális logisztikus modell paramétereinek szignifikancia szintjei alapján hasonló következtetésre jutunk. Most megnézzük a modell esély függvényeit (az egyes válasz opciók valószínűségét a válaszadó jövedelme és lakhely típusa függvényében). People study to earn a lot of money: opt.1 People study to earn a lot of money: opt.2..15..25.48.52.56.6 People study to earn a lot of money: opt.3 People study to earn a lot of money: opt.4.14.18.22.26.5.115.125

Multinomiális logisztikus regresszió a kimeneti változó: ISSP SocIneq v34 változója (négy kategóriára összevonva), magyarázó változók: és urb Differences in income are too large a B Std. Error Wald df Sig. 2 Agree Intercept -.276.5 1.811 1.178 rincom.33.13 6.467 1.11 [urb=1].431.185 5.414 1. [urb=2] b... 3 Neither agree nor disagree Intercept -1.642.257.791 1. rincom.62.15 17.118 1. [urb=1].868.213 16.583 1. [urb=2] b... 4 Disagree Intercept -3.425.328 8.716 1. rincom.125.17 56.458 1. [urb=1].855.263.524 1.1 [urb=2] b... a. The reference category is: 1 Strongly agree. b. This parameter is set to zero because it is redundant.

Differences in income are too large Frequency Percent Valid Percent Cumulative Percent Valid 1 Strongly agree 331 28.8 29.2 29,2 2 Agree 474 41.2 41.9 71,1 3 Neither agree nor disagree 5 17.8 18.1 89,2 4 Disagree 122.6.8, Total 1132 98.4. Missing 8 Cant choose 14 1.2 9 No answer 4.3 Total 18 1.6 Total 115.

Differences in income are too large frequency 5 15 25 3 urban rural 1 2 3 4 Opinion Differences in income are too large pct of subtotal 3 3 3 3

A fenti ábrákból jelentős különbségeket látunk a jövedelemeloszlásban, és a lakhely típusa szerinti különbségek is szembeötlők. A Multinomiális logisztikus modell paramétereinek szignifikancia szintjei alapján hasonló következtetésre jutunk. Most megnézzük a modell esély függvényeit (az egyes válasz opciók valószínűségét a válaszadó jövedelme és lakhely típusa függvényében). Differences in income are too large: opt.1 Differences in income are too large: opt.2..1.2.3.4.5..1.2.3.4 Differences in income are too large: opt.3 Differences in income are too large: opt.4.....2.4.6.8 1.

Ordinális logisztikus regresszió a kimeneti változó: ISSP SocIneq v34 változója (öt kategóriás), magyarázó változók: és urb. Differences in income are too large Estimate Std. Error Wald df Sig. Threshold [v34 = 1].227.1 2.618 1.6 [v34 = 2] 2.53.154 177.61 1. [v34 = 3] 3.435.185 345.111 1. [v34 = 4] 5.247.29 326.773 1. Location rincom.63.8 63.855 1. [urb=1].546.131 17.254 1. [urb=2] a... Link function: Logit. a. This parameter is set to zero because it is redundant.

Differences in income are too large frequency 5 15 25 3 urban rural 1 2 3 4 5 Opinion Differences in income are too large pct of subtotal 3 3 3 3 3

Ordinális logisztikus regresszió a kimeneti változó: ISSP SocIneq v34 változója (öt kategóriás), magyarázó változók: és urb Differences in income are too large: thresh.1 Differences in income are too large: thresh.2..2.4..4.8 Differences in income are too large: thresh.3 Differences in income are too large: thresh.4..4.8.2.6 1.