Correlation & Linear Regression in SPSS

Hasonló dokumentumok
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Correlation & Linear. Petra Petrovics.

Correlation & Linear Regression in SPSS

Bevezetés a Korreláció &

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Correlation & Regression

Statistical Dependence

Korreláció számítás az SPSSben

Regresszió számítás az SPSSben

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Factor Analysis

Esetelemzések az SPSS használatával

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Introduction to Multiple Correlation

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Nonparametric Tests

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Hypothesis Testing. Petra Petrovics.

Descriptive Statistics

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Nonparametric Tests. Petra Petrovics.

Statistical Inference

Sztochasztikus kapcsolatok

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Review of Correlation & Regression

Statisztika II. feladatok

Esetelemzés az SPSS használatával

Választási modellek 3

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Logistic regression. Quantitative Statistical Methods. Dr.

GyőrBike a győri közösségi bérkerékpár rendszer első éve

Statisztikai hipotézisvizsgálatok. Paraméteres statisztikai próbák

Magyarországon személysérüléses közúti közlekedési balesetek okozóik és abból alkoholos állapotban lévők szerinti elemzése. Rezsabek Tamás GSZDI

On The Number Of Slim Semimodular Lattices

Kerékpáros közösségi kölcsönző rendszer működésének szabályszerűségei

A rosszindulatú daganatos halálozás változása 1975 és 2001 között Magyarországon

KISTERV2_ANOVA_

BIOMETRIA_ANOVA_2 1 1

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Cluster analysis in SPSS

Cluster Analysis. Potyó László

Animal welfare, etológia és tartástechnológia

Genome 373: Hidden Markov Models I. Doug Fowler

Quantitative Statistical Methods

Construction of a cube given with its centre and a sideline

Módszertani eljárások az időtényező vezetési, szervezeti folyamatokban betöltött szerepének vizsgálatához

Discussion of The Blessings of Multiple Causes by Wang and Blei

ANGOL NYELVI SZINTFELMÉRŐ 2014 A CSOPORT

Expansion of Red Deer and afforestation in Hungary

Angol Középfokú Nyelvvizsgázók Bibliája: Nyelvtani összefoglalás, 30 kidolgozott szóbeli tétel, esszé és minta levelek + rendhagyó igék jelentéssel

Lopocsi Istvánné MINTA DOLGOZATOK FELTÉTELES MONDATOK. (1 st, 2 nd, 3 rd CONDITIONAL) + ANSWER KEY PRESENT PERFECT + ANSWER KEY

ANGOL NYELV KÖZÉPSZINT SZÓBELI VIZSGA I. VIZSGÁZTATÓI PÉLDÁNY

STATISZTIKA PRÓBAZH 2005

MARKETINGKUTATÁS II. Oktatási segédanyag. Budapest, február

Statisztikai szoftverek esszé

Esettanulmány. A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre. Tartalomjegyzék. 1. Bevezetés... 2

Tudományos Ismeretterjesztő Társulat

Feltesszük, hogy a mintaelemek között nincs két azonos. ha X n a rendezett mintában az R n -ik. ha n 1 n 2

EN United in diversity EN A8-0206/419. Amendment

THE EFFECTIVENESS OF THE E-LEARNING APPLICATION: IMPACT ASSESSMENT OF THE QUALITY

Regional Expert Meeting Livestock based Geographical Indication chains as an entry point to maintain agro-biodiversity

First experiences with Gd fuel assemblies in. Tamás Parkó, Botond Beliczai AER Symposium

Bevezetés a kvantum-informatikába és kommunikációba 2015/2016 tavasz

Szerkezeti fa szilárdsági osztályozása Göcsök szerepe. Strength grading of stuctural lumber Effect of knots

Tudományos Ismeretterjesztő Társulat

A BÜKKI KARSZTVÍZSZINT ÉSZLELŐ RENDSZER KERETÉBEN GYŰJTÖTT HIDROMETEOROLÓGIAI ADATOK ELEMZÉSE

WIL-ZONE TANÁCSADÓ IRODA

ENROLLMENT FORM / BEIRATKOZÁSI ADATLAP

1., Egy területen véletlenszerűen kihelyezet kvadrátokban megszámlálták az Eringium maritimum (tengerparti ördögszekér) egyedeit.

Normál eloszlás. Gyakori statisztikák

Diszkriminancia-analízis

Statisztika II előadáslapok. 2003/4. tanév, II. félév

Phenotype. Genotype. It is like any other experiment! What is a bioinformatics experiment? Remember the Goal. Infectious Disease Paradigm

Supporting Information

FAMILY STRUCTURES THROUGH THE LIFE CYCLE

OROSZ MÁRTA DR., GÁLFFY GABRIELLA DR., KOVÁCS DOROTTYA ÁGH TAMÁS DR., MÉSZÁROS ÁGNES DR.

Többváltozós lineáris regressziós modell feltételeinek tesztelése II.

A JOHNSON NEYMAN-MÓDSZER BEMUTATÁSA ÉS ALKALMAZÁSA

Decision where Process Based OpRisk Management. made the difference. Norbert Kozma Head of Operational Risk Control. Erste Bank Hungary

General information for the participants of the GTG Budapest, 2017 meeting

Csima Judit április 9.

A modern e-learning lehetőségei a tűzoltók oktatásának fejlesztésében. Dicse Jenő üzletfejlesztési igazgató

ANGOL NYELVI SZINTFELMÉRŐ 2012 A CSOPORT. to into after of about on for in at from

A klímamodellek alkalmazásának tapasztalatai a magyarországi gabona félék hozam előrejelzéseiben

ACTA CLIMATOLOGICA ET CHOROLOGICA Universitatis Szegediensis, Tom , 2005,

Computer Architecture

PDF created with FinePrint pdffactory Pro trial version Adott egy X folytonos változó, ami normális eloszlású.

Az önkormányzati beruházási hajlandóság becslése a magyar kistelepülések körében OTKA KUTATÁS. A kutatást lezáró beszámoló

NÖVENDÉKNYULAK TESTÖSSZETÉTELÉNEK BECSLÉSE TOBEC MÓDSZERREL

A jövedelem alakulásának vizsgálata az észak-alföldi régióban az évi adatok alapján

Nem. Cumulative Percent 1,00 férfi ,9 25,9 25,9 2,00 nı ,1 73,1 99,0 99,00 adathiány 27 1,0 1,0 100,0 Total ,0 100,0

Dr. Szőke Szilvia Dr. Balogh Péter: Nemparaméteres eljárások

Utasítások. Üzembe helyezés

ELEKTRONIKAI ALAPISMERETEK ANGOL NYELVEN

Étkezési búzák mikotoxin tartalmának meghatározása prevenciós lehetıségek

Using the CW-Net in a user defined IP network

TAYLOR Gazdálkodás- és szervezéstudományi folyóirat

Lineáris regresszió vizsgálata resampling eljárással

FOSS4G-CEE Prágra, 2012 május. Márta Gergely Sándor Csaba

Gyakorlat: Sztochasztikus idősor-elemzés alapfogalmai II. Egységgyök-folyamatok és tesztek. Dr. Dombi Ákos

Skills Development at the National University of Public Service

Eladni könnyedén? Oracle Sales Cloud. Horváth Tünde Principal Sales Consultant március 23.

Érdeklődés, hogy adódhatnak-e költségek, ha pénzt vesz fel egy bizonyos országban

Érdeklődés, hogy adódhatnak-e költségek, ha pénzt vesz fel egy bizonyos országban

SEGÍTSÉG A GAZDÁLKODÓ EGYNYELVŰ KÖZÉPFOKÚ SZÓBELI NYELVVIZSGÁHOZ - ÜZLETI MODUL


Személyes adatváltoztatási formanyomtatvány- Magyarország / Personal Data Change Form - Hungary

Bevezetés az ökonometriába

Effect of sowing technology on the yield and harvest grain moisture content of maize (Zea mays L.) hybrids with different genotypes

A gravitációs modell felhasználása funkcionális távolságok becslésére

Átírás:

Petra Petrovics Correlation & Linear Regression in SPSS 4 th seminar

Types of dependence association between two nominal data mixed between a nominal and a ratio data correlation among ratio data

Correlation describes the strength of a relationship, the degree to which one variable is linearly related to another X (or X 1, X 2,, X p ): known variable(s) / independent variable(s) / predictor(s) Y: unknown variable / dependent variable causal relationship: X causes Y to change Regression shows us how to determine the nature of a relationship between two or more variables

Correlation Measures 1. Covariance 2. Coefficient of correlation 3. Coefficient of determination 4. Coefficient of rank correlation

1. Covariance A measure of the joint variation of the two variables; An average value of the product of the deviations of observations on 2 random variables from their sample means. C x, y x x y y n 1 ranges from - to + ; C = 0, when X and Y are uncorrelated; its sign shows the direction of correlation it doesn t measure the degree of relationship!!!

2. Coefficient of correlation r C s s x y = Σd d x 2 x d d y 2 y Pearson correlation A measure of how closely related two data series are. Its sign shows the direction of correlation It measures the strength of correlation 0 < r < 1 statistical dependence r = 0 X and Y are uncorrelated r = -1 negative r = 1 positive You can use only in case of linear relationship!

3. Coefficient of determination r 2 The square of the sample correlation coefficient between the outcomes and their predicted values. Measures the degree of correlation in percentage (%) It provides a measure of how well future outcomes are likely to be predicted by the model. Vary from 0 to 1. r 2 S S yˆ y =1- S S e y

Exercise 1 - Correlation File / Open / Employee data.sav Is there any relation between - current salary & - beginning salary? CORRELATION

Analyze / Correlate / Bivariate 0 I r I 0,3 weak dependence 0,3 I r I 0,7 medium-strong dependence 0,7 I r I 1 strong dependence r Shows direction and strength C Just direction! + -

Output Mean Std. Deviation N Current Salary $34,419.57 $17,075.661 474 Beginning Salary $17,016.09 $7,870.638 474 Current Salary Beginning Salary Current Salary Beginning Salary Pearson Correlation 1,880(**) Sig. (2-tailed),000 Sum of Squares and Cross-products 137916495436,340 55948605047,73 Covariance 291578214,45 118284577,27 N 474 474 Pearson Correlation,880(**) 1 Sig. (2-tailed),000 Sum of Squares and Cross-products 55948605047,73 29300904965,45 Covariance 118284577,27 61946944,96 N 474 474

Exercise 2 Multiple Correlation Is there any relation between the current salary previous experience (month) month since hire beginning salary? MULTIPLE CORRELATION

Analyze / Correlate / Bivariate 0 I r I 0,3 weak dependence 0,3 I r I 0,7 medium-strong dependence 0,7 I r I 1 strong dependence r Shows direction and strength C Just direction! + -

Output View Inverse relationship & weak dependence Direct relationship & strong dependence Current Salary Previous Experience (months) Months since Hire Beginning Salary r C Pearson Correlation Sig. (2-tailed) Sum of Squares and Cross-products Covariance N Pearson Correlation Sig. (2-tailed) Sum of Squares and Cross-products Covariance N Pearson Correlation Sig. (2-tailed) Sum of Squares and Cross-products Covariance N Pearson Correlation Sig. (2-tailed) Sum of Squares and Cross-products Covariance N *. Correlation is significant at the 0.05 level (2-tailed). Correlations **. Correlation is significant at the 0.01 level (2-tailed). Matrix Previous Experience Months Beginning Current Salary (months) since Hire Salary 1 -,097*,084,880**,034,067,000 1,379E+011-82332343,5 6833347,5 5,59E+010 291578214,5-174064,151 14446,823 118284577 474 474 474 474 -,097* 1,003,045,034,948,327-82332343,54 5173806,810 1482,241 17573777-174064,151 10938,281 3,134 37153,862 474 474 474 474,084,003 1 -,020,067,948,668 6833347,489 1482,241 47878,295-739866,50 14446,823 3,134 101,223-1564,200 474 474 474 474,880**,045 -,020 1,000,327,668 55948605048 17573776,7-739866,5 2,93E+010 118284577,3 37153,862-1564,200 61946945 474 474 474 474 Inverse relationship Direct relationship

Linear regression y ŷ = b 0 + b 1 x b 1 : for every 1 unit increase in x we expect y to change by b 1 units on average b 0 : when x=0, y=b 0 x

Exercise 3 Linear Regression File / Open / Employee data.sav Determine a linear relationship between the salary and the age of the employees! Create a new variable!

Transform / Compute Variable Create a new variable: age = this year date of birth (in year) This year

Regression Analyze / Regression / Linear

Model 1 Model Summary Adjusted Std. Error of R R Square R Square the Estimate,146 a,021,019 $16,928.804 a. Predictors: (Constant), age Multiple correlation coefficient Adjusted multiple determination coefficient R r 2 y1 r 2 y2 2r 1 r y1 2 12 r y2 r It expresses the combined effect of all the variables acting on the dependent variable Weak dependence 12 R 2 n 1 1 (1 R n p 1 Multiple determination coefficient It enables to compare the How many percent of the multiple determination variation of the dependent coefficient among variable can be explained by populations / samples the variation of all the with different size and independent variables different number of dependent variables as it The dependent variable s control for the number of (current salary) variation is sample / population size explained in 2,1% by the (n) and the number of regression model independent variables (p) 2 )

F-test: for model testing We can accept the model in every significance level. The F ratio (in the Analysis of Variance Table) is 10.241 and significant at p=.001. This provides evidence of existence of a linear relationship between the variables

Model 1 b 0 b 1 (Constant) age Unstandardized Coefficients a. Dependent Variable: Current Salary The regression line: ŷ = b 0 + b 1 x Coefficients a b 0 : If the x variable is 0, how much is the y. Standardized Coefficients B Std. Error Beta t Sig. 41543,805 2358,686 17,613,000-211,609 66,124 -,146-3,200,001 If the employees are 0-year-old, they earn $41543,805 (It doesn t mean anything.) b 1 : If the x increases by 1 unit, what is the difference in y. We can accept the parameters at every significance level. If the employees are 1 year older, they earn less money with $211,609 on average.

Exercise 4 Curve Estimation File / Open / Employee data.sav Determine the relationship between the salary and the age of the employees! Which regression model fit the most?

Analyze / Regression / Curve Estimation Linear Compound Power To get a chart

Output View Linear Model Summary R R Square Adjusted R Square Std. Error of the Estimate,146,021,019 16928,804 The independent variable is age. Model Summary Compound The highest R 2 Power R R Square Adjusted R Square Std. Error of the Estimate,215,046,044,389 The independent variable is age. Model Summary R R Square Adjusted R Square Std. Error of the Estimate,156,024,022,393 The independent variable is age.

Also in the Output View Faculty of Economics

Weak dependence. The age has 4,6% influence on the current salary s variation The model is significant.

b a ŷ = a b x = 40482.362 0.993 x a: no analyzation The parameters are significant. b: When an employee is 1 year older, the current salary will be 0.993 times higher on average.

Thank You for Your Attention stgpren@uni-miskolc.hu