Bevezetés a Korreláció &

Hasonló dokumentumok
Regresszió számítás az SPSSben

Korreláció számítás az SPSSben

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Correlation & Linear. Petra Petrovics.

Correlation & Linear Regression in SPSS

Correlation & Linear Regression in SPSS

Esetelemzések az SPSS használatával

Többváltozós lineáris regressziós modell feltételeinek tesztelése II.

Sztochasztikus kapcsolatok

Regressziós vizsgálatok

Diszkriminancia-analízis

Korrelációs kapcsolatok elemzése

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Kvantitatív statisztikai módszerek

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Többváltozós lineáris regressziós modell feltételeinek

Statisztika II előadáslapok. 2003/4. tanév, II. félév

Magyarországon személysérüléses közúti közlekedési balesetek okozóik és abból alkoholos állapotban lévők szerinti elemzése. Rezsabek Tamás GSZDI

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Lineáris regresszió vizsgálata resampling eljárással

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Korreláció és lineáris regresszió

GyőrBike a győri közösségi bérkerékpár rendszer első éve

Ökonometriai modellek paraméterei: számítás és értelmezés

Statisztika II. feladatok

Korreláció, regresszió. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Esettanulmány. A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre. Tartalomjegyzék. 1. Bevezetés... 2

Gyakorló feladatok a kétváltozós regresszióhoz 2. Nemlineáris regresszió

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Kerékpáros közösségi kölcsönző rendszer működésének szabályszerűségei

Mérési adatok illesztése, korreláció, regresszió

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

A többváltozós lineáris regresszió 1.

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Correlation & Regression

Regressziós vizsgálatok

Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com

A gravitációs modell felhasználása funkcionális távolságok becslésére

Faktoranalízis az SPSS-ben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Faktoranalízis az SPSS-ben

GVMST22GNC Statisztika II.

Esetelemzés az SPSS használatával

Többváltozós Regresszió-számítás

Lineáris regressziószámítás 1. - kétváltozós eset

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

A statisztika alapjai - Bevezetés az SPSS-be -

PDF created with FinePrint pdffactory Pro trial version Adott egy X folytonos változó, ami normális eloszlású.

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Factor Analysis

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Logisztikus regresszió

Matematikai geodéziai számítások 6.

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat

Fogalom STATISZTIKA. Alkalmazhatósági feltételek. A standard lineáris modell. Projekciós mátrix, P

[Biomatematika 2] Orvosi biometria

Matematikai statisztikai elemzések 6.

Cséplő Máté PTE Egészségtudományi Doktori Iskola, hallgató

1. (Sugár Szarvas fgy., 186. o. S13. feladat) Egy antikvárium könyvaukcióján árverésre került. = x = 6, y = 12. s y y = 1.8s x.

Statistical Dependence

Tárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102

Matematikai geodéziai számítások 6.

Autoregresszív és mozgóátlag folyamatok. Géczi-Papp Renáta

Autoregresszív és mozgóátlag folyamatok

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Ökonometria gyakorló feladatok 1.

Bevezetés az ökonometriába

Az önkormányzati beruházási hajlandóság becslése a magyar kistelepülések körében OTKA KUTATÁS. A kutatást lezáró beszámoló

Ökonometria gyakorló feladatok Többváltozós regresszió

TÖBBSZÖRÖS REGRESZIÓS ANALÍZIS I. Többszörös lineáris regresszió. Füst György

Logisztikus regresszió

Logisztikus regresszió október 27.

Regionális diszparitások: a GDP és a munkanélküliségi ráta regionális összefüggéseinek vizsgálata az Európai Unióban.

A statisztika alapjai - Bevezetés az SPSS-be -

GEOSTATISZTIKA. Földtudományi mérnöki MSc, geofizikus-mérnöki szakirány. 2018/2019 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Ökonometria BSc Gyakorló feladatok a kétváltozós regresszióhoz

5. előadás - Regressziószámítás

Számítógépes döntéstámogatás. Statisztikai elemzés

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

LOGIT-REGRESSZIÓ a függő változó: névleges vagy sorrendi skála

Hipotézis vizsgálatok

13. előadás. Matlab 7. (Statisztika, regresszió, mérési adatok feldolgozása) Dr. Szörényi Miklós, Dr. Kallós Gábor. Széchenyi István Egyetem

Feltesszük, hogy a mintaelemek között nincs két azonos. ha X n a rendezett mintában az R n -ik. ha n 1 n 2

MI MOZGATJA A HATÁRIDŐS DEVIZAPOZÍCIÓKAT? A magyar piac elemzése

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Faktoranalízis előadás. Kvantitatív statisztikai módszerek

A HAZAI SPORTFINANSZÍROZÁSI RENDSZER HATÉKONYSÁGA AZ ÉLSPORTBAN

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Az állat becsült kor. teljes súly. teljes hossz orrtól. törzs hossza. pocak körkörös méret. hátsó láb hossza kör

Statisztikai programcsomagok gyakorlat Pót zárthelyi dolgozat megoldás

Változók közötti kapcsolat III.: a folytonos eset. Regresszió és korreláció.

A klímamodellek alkalmazásának tapasztalatai a magyarországi gabona félék hozam előrejelzéseiben

Diagnosztika és előrejelzés

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Nemlineáris modellek

A modellben az X és Y változó szerepe nem egyenrangú: Y (x n )

Statisztika elméleti összefoglaló

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

Korreláció és Regresszió

Problémás regressziók

VI. ADÓSNYILVÁNTARTÁS KAMATSZINT KOCKÁZATI PRÉMIUM: EGY NEMZETKÖZI ÖSSZEHASONLÍTÓ ELEMZÉS EREDMÉNYEI *

Átírás:

Bevezetés a Korreláció & Regressziószámításba Petrovics Petra Doktorandusz

Statisztikai kapcsolatok Asszociáció 2 minőségi/területi ismérv között Vegyes kapcsolat minőségi/területi és egy mennyiségi ismérv között Korreláció mennyiségi ismérvek között

Korreláció Célja a kapcsolat szorosságának mérése. Regresszió Célja a kapcsolatban megfigyelhető törvényszerűség megfogalmazása, amelyet valamilyen függvény ír le. X (or X 1, X 2,, X p ): magyarázó változó(k), független változó(k) Y: eredményváltozó, függő változó Ok-okozati kapcsolat: X okozza Y szóródásának változását

Korrelációs mutatószámok 1. Kovariancia (C) értéke - és + közötti; C = 0, amikor X és Y között nincs kapcsolat; a kapcsolat irányát mutatja; nem mutatja a kapcsolat értékét!!! 2. Korrelációs együttható (r) A kapcsolat irányát ÉS erősségét mutatja; 0 < r <1 Csak lineáris kapcsolat esetében használható! 3. Determinációs együttható (r 2 ) %-os formában méri a kapcsolat erősségét hány %-ban befolyásolja X az Y ingadozását

1. Feladat File / Open / Employee data.sav Van kapcsolat a - current salary és a - beginning salary között? KORRELÁCIÓ

Analyze / Correlate / Bivariate 0 < I r I<0,3 Gyenge kapcsolat 0,3 < I r I< 0,7 Közepesen erős kapcsolat 0,7 < I r I< 1 Erős kapcsolat r Irányt és erősséget mutat C Csak irányt mutat!!! + -

Output Mean Std. Deviation N Current Salary $34,419.57 $17,075.661 474 Beginning Salary $17,016.09 $7,870.638 474 Current Salary Beginning Salary Current Salary Beginning Salary Pearson Correlation 1,880(**) Sig. (2-tailed),000 Sum of Squares and Cross-products 137916495436,340 55948605047,73 Covariance 291578214,45 118284577,27 N 474 474 Pearson Correlation,880(**) 1 Sig. (2-tailed),000 Sum of Squares and Cross-products 55948605047,73 29300904965,45 Covariance 118284577,27 61946944,96 N 474 474

2. Feladat Van kapcsolat a: current salary previous experience (month) month since hire beginning salary között? Többváltozós KORRELÁCIÓ

Analyze / Correlate / Bivariate 0 < I r I<0,3 Gyenge kapcsolat 0,3 < I r I< 0,7 Közepesen erős kapcsolat r Irányt és erősséget mutat C Csak irányt mutat!!! 0,7 < I r I< 1 Erős kapcsolat + -

Output Current Salary r C Pearson Correlation Sig. (2-tailed) Sum of Squares and Cross-products Correlations Mátrix Previous Experience Months Beginning Current Salary (months) since Hire Salary 1 -,097*,084,880**,034,067,000 1,379E+011-82332343,5 6833347,5 5,59E+010 Covariance 291578214,5-174064,151 14446,823 118284577 N 474 474 474 474 Previous Experience Pearson Correlation -,097* 1,003,045 Negatív (months) Sig. (2-tailed),034,948,327 Sum of Squares and -82332343,54 5173806,810 1482,241 17573777 Cross-products irányú (inverz) & gyenge kapcsolat Direkt (pozitív irányú) & erős kapcsolat Months since Hire Beginning Salary Covariance N Pearson Correlation Sig. (2-tailed) Sum of Squares and Cross-products Covariance N Pearson Correlation Sig. (2-tailed) Sum of Squares and Cross-products Covariance N *. Correlation is significant at the 0.05 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed). -174064,151 10938,281 3,134 37153,862 474 474 474 474,084,003 1 -,020,067,948,668 6833347,489 1482,241 47878,295-739866,50 14446,823 3,134 101,223-1564,200 474 474 474 474,880**,045 -,020 1,000,327,668 55948605048 17573776,7-739866,5 2,93E+010 118284577,3 37153,862-1564,200 61946945 474 474 474 474 Negatív irányú (inverz) kapcsolat Pozitív irányú kapcsolat

Lineáris regressziós modell E (y) X és Y közötti kapcsolatot ábrázoló egyenes. Az Y függ: x 1, x 2,, x p p db magyarázó változótól A véletlen ingadozásától (ε) β 0, β 1,, β p regressziós együtthatóktól. y = β 0 + β 1 x + ε ahol: β 0 β 1 y függő vagy eredményváltozó x független vagy magyarázó változó ε véletlen hibatag β 0 x=0 helyen β 1 a függvény meredeksége x

Legkisebb négyzetek módszere y ŷ i = b 0 + b 1 X 1 Jelenlegi fizetés ($) Véletlen Kezdő fizetés ($) x

Scatter diagram lineáris S a l e s i n 1600 1200 800 400 $ 0 0 0 10 20 30 40 0 2 4 6 8 10 12 Advertising in $ Age of a house (year) 50 S e l l i n g p r i c e 5000 4000 3000 2000 1000 4000 nemlineáris w a s t a g e 40 30 20 10 S e l l i n g p r i c e 3000 2000 1000 0 0 10 20 30 40 Production (number of products per day) 0 0 5 10 15 Age of a car (year) Direkt kapcsolat Pozitív kapcsolat Inverz kapcsolat Negatív kapcsolat

Nincs kapcsolat 4000 Number of births 3000 2000 1000 0 0 10 20 30 40 Number of storks

3. Feladat File / Open / Employee data.sav Milyen természetű a kapcsolat a fizetés és az életkor között? Új változó létrehozása!

Új változó: életkor = adott év születési dátum (ÉV!) (date of birth) Transform / Compute Variable Adott év

Analyze / Regression / Curve Estimation Lineáris Compound (exponenciális) Power (hatványkitevős) Diagram

Output Lineáris Model Summary R R Square Adjusted R Square Std. Error of the Estimate,146,021,019 16928,804 The independent variable is age. Model Summary Compound Itt a legnagyobb az R 2 (illeszkedés) Power R R Square Adjusted R Square Std. Error of the Estimate,215,046,044,389 The independent variable is age. Model Summary R R Square Adjusted R Square Std. Error of the Estimate,156,024,022,393 The independent variable is age.

Output Melyik regressziófüggvény illeszkedik a legjobban?

Regresszió Analyze / Regression / Linear

R= Model 1 r 2 y1 Model Summary Adjusted Std. Error of R R Square R Square the Estimate,146 a,021,019 $16,928.804 a. Predictors: (Constant), age Többszörös korrelációs együttható + r 2 y2 2r 1 r y1 2 12 r y2 Gyenge kapcsolat r 12 Az összes változónak a függő változóra gyakorolt hatását fejezi ki Többszörös determinációs együttható Megmutatja, hogy a függő változó hány %-át határozza meg az összes független változó együttvéve. A függő változó (current salary) szóródását 2,1%-ban határozza meg ez a regressziós modell. Korrigált többszörös determinációs együttható R 2 n 1 = 1 (1 R n p 1 Összehasonlíthatóvá teszi a többszörös determinációs együtthatót a sokaságon belül. Kiszűri a különböző nagyságú mintákból eredő, különböző függő változó számú, különböző elemszámú (n) és független változó számú (p) sokaságokból eredő hibákat. 2 )

F-próba: modelltesztelés Minden szignifikanciaszinten elfogadható, hogy lineáris, megbízható a modell.

Model 1 b 0 b 1 (Constant) age Unstandardized Coefficients Coefficients a Standardized Coefficients B Std. Error Beta t Sig. 41543,805 2358,686 17,613,000 a. Dependent Variable: Current Salary -211,609 66,124 -,146-3,200,001 Regresszió egyenes: ŷ = b 0 + b 1 X t-próba: paraméterek tesztelése Minden szignifikanciaszinten elfogadhatók a paraméterek. b 0 : X = 0 helyen mennyi az Y. Ha 0 évesek a dolgozók, akkor a keresetük 41543,805$. (Nincs értelme.) b 1 : ha az X 1 egységgel nő, mennyivel változik az Y. Ha a dolgozók életkora 1 évvel nőne, a fizetésük 211,609$-ral csökkenne.

4. Feladat Jellemezze a kapcsolat természetét a current salary és az age, education level, beginning salary, month since hire, illetve previous experience között! y = current salary x 1 = age x 2 = education level (years) x 3 = beginning salary x 4 = month since hire x 5 = previous experience

Analyze / Regression / Linear y x

Output View

Output View yˆ = 13462.743 103,049 x 1+ 631.920 x2 + 1.771x3+ 166.444 x4 8. 301 x 5 Ha minden x=0 Ha x 1 1 egységgel nő az összes többi x változatlansága mellett Ha x 2 1 egységgel nő az összes többi x változatlansága mellett

Köszönöm a figyelmet!