Korrelációs kapcsolatok elemzése

Hasonló dokumentumok
Kvantitatív statisztikai módszerek

Korreláció számítás az SPSSben

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Korreláció-számítás. 1. előadás. Döntéselőkészítés módszertana. Dr.

Bevezetés a Korreláció &

Függetlenségvizsgálat, Illeszkedésvizsgálat

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Regressziós vizsgálatok

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

GVMST22GNC Statisztika II.

[Biomatematika 2] Orvosi biometria

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Regresszió számítás az SPSSben

Statisztikai alapfogalmak

Kvantitatív elemzési módszerek

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Matematikai statisztikai elemzések 5.

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Sztochasztikus kapcsolatok


Regressziós vizsgálatok

Többváltozós Regresszió-számítás

Lineáris regressziószámítás 1. - kétváltozós eset

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Mérési adatok illesztése, korreláció, regresszió

2. előadás. Viszonyszámok típusai

Korreláció és Regresszió

Korreláció és lineáris regresszió

Matematikai geodéziai számítások 6.

Segítség az outputok értelmezéséhez

Többváltozós lineáris regressziós modell feltételeinek tesztelése II.

Matematikai geodéziai számítások 6.

Matematikai statisztikai elemzések 6.

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

Nem Fő (f) % (g) Z 300. Férfi % Nő % Z %

Az állat becsült kor. teljes súly. teljes hossz orrtól. törzs hossza. pocak körkörös méret. hátsó láb hossza kör

A L Hospital-szabály, elaszticitás, monotonitás, konvexitás

Méréselmélet és mérőrendszerek 2. ELŐADÁS (1. RÉSZ)

TANTÁRGYI ÚTMUTATÓ. Statisztika 1.

Matematikai statisztikai elemzések 5.

Statisztika. Dr Gősi Zsuzsanna. Egyetemi adjunktus. Sportmenedzsment Tanszék

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

(Independence, dependence, random variables)

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Bevezető Mi a statisztika? Mérés Csoportosítás

Van-e kapcsolat a változók között? (példák: fizetés-távolság; felvételi pontszám - görgetett átlag)

A sokaság/minta eloszlásának jellemzése

Módszertani Intézeti Tanszéki Osztály

1. Egy Kft dolgozóit a havi bruttó kereseteik alapján csoportosítottuk: Havi bruttó bér, ezer Ft/fő

A leíró statisztikák

Statisztika I. 2. előadás: Statisztikai táblák elemzése. Kóczy Á. László. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem

Adatok statisztikai értékelésének főbb lehetőségei

[GVMGS11MNC] Gazdaságstatisztika

Diszkriminancia-analízis

Változók közötti kapcsolat III.: a folytonos eset. Regresszió és korreláció.

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Méréselmélet és mérőrendszerek

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

A mérési eredmény megadása

A statisztika oktatásáról konkrétan

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Fogalom STATISZTIKA. Alkalmazhatósági feltételek. A standard lineáris modell. Projekciós mátrix, P

ELEMZŐ SZOFTVEREK. A tanárok elemző munkáját támogatja három, egyszerűen használható, minimális alkalmazói ismereteket igénylő Excel állomány.

Számítógépes döntéstámogatás. Statisztikai elemzés

A kálium-permanganát és az oxálsav közötti reakció vizsgálata 9a. mérés B4.9

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com

Statisztikai alapfogalmak

Viszonyszám A B. Viszonyszám: két, egymással kapcsolatban álló statisztikai adat hányadosa, ahol A: a. viszonyítadóadat

Gyakorló feladatok a kétváltozós regresszióhoz 2. Nemlineáris regresszió

Sorozatok határértéke SOROZAT FOGALMA, MEGADÁSA, ÁBRÁZOLÁSA; KORLÁTOS ÉS MONOTON SOROZATOK

Közgazdaságtan alapjai. Dr. Karajz Sándor Gazdaságelméleti Intézet

Microsoft Excel Gyakoriság

A TANTÁRGY ADATLAPJA

1. A vállalat. 1.1 Termelés

A MEGÚJULÓ ENERGIAPOTENCIÁL EGER TÉRSÉGÉBEN A KLÍMAVÁLTOZÁS TÜKRÉBEN

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

GYAKORLÓ FELADATOK KORRELÁCIÓ- ÉS REGRESSZIÓ-SZÁMÍTÁS

Többváltozós lineáris regressziós modell feltételeinek

Függvények 1. oldal Készítette: Ernyei Kitti. Függvények

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Monitoring adatelemzés. Dr. Csoknyai Tamás

Biostatisztika VIII. Mátyus László. 19 October

A statisztika alapjai - Bevezetés az SPSS-be -

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Regresszió számítás. Tartalomjegyzék: GeoEasy V2.05+ Geodéziai Kommunikációs Program

STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés

Átírás:

Korrelációs kapcsolatok elemzése 1. előadás Kvantitatív statisztikai módszerek

Két változó közötti kapcsolat Független: Az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az Y szerinti hovatartozásról. Sztochasztikus: Az egyik ismérv hatással van a másikra, de nem határozza meg egyértelműen annak értékeit/változatait. Függvényszerű (determinisztikus): A vizsgált egységek X szerinti hovatartozásának ismeretében egyértelműen megmondható azok Y szerinti hovatartozása is.

A kapcsolat mérőszámai Két nominális változó közötti kapcsolatot az asszociációs mérőszámokkal jellemezzük. Ordinális típusú változók összefüggését a rangkorrelációs mutatók mérik. Arány skála típusú változók összefüggését korreláció- és regresszió-analízissel elemezzük. Intervallum/arány és nominális skálán mért változók közötti összefüggést H;

Sztochasztikus kapcsolatok fajtái Asszociáció (mindkét ismérv minőségi/területi ismérv, nominális skálán mérve). Vegyes (egyik ismérv mennyiségi, másik területi/minőségi, intervallum/arány és nominális skálán mérve. Korreláció (mindkét ismérv mennyiségi, intervallum/arány skálán mérve). Rangkorreláció (mindkét változó sorrendi skálán mérhető).

Korrelációs kapcsolat elemzése Van-e összefüggés az ismérvek között? Milyen irányú az összefüggés? Mennyire szoros a kapcsolat? Az egyik ismérv változása milyen hatással van a másik ismérv változására?

Alapfogalmak I. A mennyiségi ismérvek közötti kapcsolatot korrelációnak nevezzük. A korrelációszámítás: a mennyiségi ismérvek közötti kapcsolat szorosságának mérése. A regressziószámítás: a mennyiségi ismérvek egymásra gyakorolt hatásának számszerűsítésével, e hatások irányának és mértékének megállapításával foglalkozik.

Alapfogalmak II. Ha a korreláció mögött egyirányú okozati összefüggés állapítható meg: az ok szerepét betöltő ismérvet tényezőváltozónak, magyarázó-, független változónak (X), az okozat szerepét játszó ismérvet pedig eredményváltozónak, függő változónak (Y) nevezzük.

A korreláció fontosabb típusai

Korreláció hiánya A regresszió-függvény bármely X helyen azonos (közel azonos) értéket vesz fel. A függvény képe vízszintes vonal. ( Y független X-től, X nem befolyásolja Y értékét.)

A korreláció hiánya Y = - 7. 4 E - 0 + 0. 0 8 3 4 8 X 3 R - S q = 3. 4 % 1 0-1 - - 3 - - 1 0 1 N i n c s k o r r e lá c i ó

Függvényszerű kapcsolat A korreláció hiányának logikai ellentéte a függvényszerű kapcsolat. Egy adott X értékhez csupán egyetlen Y érték tartozhat. Ilyenkor a pontdiagram pontjai a regresszió-vonalhoz illeszkednek, azaz a regresszióvonal körül nincs szóródás.

Pozitív korreláció Általában a regressziógörbe körül van szóródás. A regressziógörbe alakja a korreláció tartalmát fejezi ki. Ha nagyobb X értékekhez általában nagyobb Y értékek tartoznak, vagyis a tényezőváltozó növelése az eredményváltozó nagyságát növeli.

Pozitív korreláció Y = -8. 6 E -0 + 0. 6 9 0 8 6 X 3 R -S q = 6. 5 % 1 0-1 - - 3-3 - - 1 0 1 3 P o z i t ív k o r r e l á c i ó

Negatív korreláció Az előbbi kapcsolat ellentéte természetesen a negatív korreláció, amelyet a regressziófüggvény ugyancsak szemléletesen jelez.

Negatív korreláció Y = 5. 0 7 E - 0-0. 6 4 7 8 7 X 3 R - S q = 7 0. 9 % 1 0-1 - - 3-3 - - 1 0 1 3 N e g a t ív k o r r e lá c i ó

Görbevonalú kapcsolat A lineáristól eltérő típust görbe vonalú (nemlineáris) kapcsolatnak nevezzük. A nemlineáris kapcsolatok egy részénél továbbra is van értelme pozitív, vagy negatív irányzatról beszélni, feltéve, hogy a görbe monoton növekvő, illetve csökkenő irányzatot mutat az értelmezési tartományon belül. Nem lehet azonban pozitív vagy negatív irányról beszélni, ha a regresszió irányt változtat.

Görbevonalú kapcsolat Y = 1. 0 9 5 8 + 6. 0 7 6 8 4 X + 1. 1 6 6 8 6 X * * 4 0 R - S q = 8 8. 4 % 3 0 0 1 0 0-3 - - 1 0 1 3 N e m l i n e á r i s k o r r e lá c i ó

A kapcsolat szorosságának mérőszámai

A kovariancia Az X és Y mennyiségi változók közötti kapcsolat irányát mutatja meg. A megfelelő átlagtól vett ( x - x) és ( y - y) eltéréseken alapszik. C = d x d n -1 y = xy n -1 - x y C r s x s y

Kovariancia tulajdonságai A kovariancia nulla, ha a pozitív és a negatív előjelű eltérésszorzatok összege kiegyenlíti egymást. Kovariancia előjele a kapcsolat irányát mutatja. A kovariancia abszolút mértékének nincs határozott felső korlátja. A kovariancia a két változóban szimmetrikus, X és Y szerepe a formulában felcserélhető.

Dolgozó Egy vállalat dolgozóinak keresete és havi megtakarítása Bér (Ft/fő) Havi megtakarítás (Ft/hó) d x d y d x d y d x d y 1 10000 13000-13000 -3010 39130000 169000000 9060100 90000 10000-43000 -6010 58430000 1849000000 3610100 3 0000 35000 87000 18990 165130000 7569000000 36060100 4 150000 18000 17000 1990 33830000 89000000 3960100 5 100000 1000-33000 -4010 13330000 1089000000 16080100 6 115000 1500-18000 -3510 63180000 34000000 130100 7 160000 0000 7000 3990 107730000 79000000 1590100 8 130000 13800-3000 -10 6630000 9000000 4884100 9 145000 14000 1000-010 -410000 144000000 4040100 10 100000 11800-33000 -410 138930000 1089000000 1774100 Összesen 1330000 160100 0 0 40800000 1360000000 48079000

Kovariancia C = d x d n -1 y = xy n -1 - x y 40800000 9 67577777,8 Értelmezés: a dolgozók keresete és a havi megtakarított összege közötti kapcsolat pozitív irányú.

A korrelációs együttható A korrelációs együttható a lineáris korreláció szorosságának legfontosabb mérőszáma. A kapcsolat hiányát (korrelálatlanság) az r = 0 érték jelzi. Az r előjele a korreláció irányát mutatja. Tökéletes (függvényszerű) lineáris kapcsolatnak - az iránytól függően - az r = +1, illetve r = -1 értékek felelnek meg. A szélsőséges helyzetek között az együttható abszolút értéke a kapcsolat szorosságáról tájékoztat.

Korrelációs együttható d d = xy - n x y x y d = x n x x d = y n y y ) )( ( y x y x y x y n y x n x y x xy- n d d d d C = r s s

Korrelációs együttható Dolgozó Bér (Ft/fő) Havi megtakarítás (Ft/hó) d x d y d x d y d x d y Összesen 1330000 160100 0 0 40800000 1360000000 48079000 r = s x C dxd y s y dx d y 40800000 1360000000 48079000 0,954 Értelmezés: a dolgozók keresete és a havi megtakarított összege közötti kapcsolat pozitív irányú és erős.

Determinációs együttható A determinációs együttható megmutatja, hogy a magyarázóváltozó hány %-ban befolyásolja az eredményváltozó szóródását. Jele: r A determinációs együttható jellemzi: A regressziós függvény illeszkedését, A modell magyarázó erejét.

Determinációs együttható r 0,954 0,9098 90,98% Értelmezés: a dolgozók keresete 90,98%- ban befolyásolja a havi megtakarított összeg szóródását.

A rangkorreláció Létezhetnek a statisztikai sokaság egységeinek olyan kvantitatív jellegű tulajdonságai, amelyek számszerűen egyáltalán nem, vagy csak nehezen mérhetők. A mutatószám értéke r-hez hasonlóan természetesen -1 és 1 között helyezkedik el. Ha a kétféle rangsorszám rendre megegyezik, akkor = 1, ha a sorszámok a két ismérv szerint következetesen ellentétesen alakulnak, akkor = -1. 6di = 1- n(n 1)

Rangkorreláció Egy régió vállalatainak gazdálkodására vonatkozó adatok Régió 1 3 4 5 6 7 8 9 10 Árbevétel (MFt) 34 30 5 1 10 1 8 31 0 Nyereség (MFt) 16 10,5 10 1 7 4 1 9 11 x 10 8 7 6 5 3 1 9 4 y 10 7 6 9 4 3 1 5 8 d 0 1-1 -3 1-1 1 0 4-4 d 0 1 1 9 1 1 1 0 16 16 6di 646 = 1-1 0,71 n(n 1) 1010 1 Értelmezés: a vállalatok árbevétele és nyeresége között közepesnél szorosabb, pozitív irányú kapcsolat van.

A korrelációs hányados A görbevonalú kapcsolatok szorosságának mérőszáma. A mutatószám kialakításának gondolatmenete: csoportosítjuk a megfigyelt értékeket a tényezőváltozó értékei vagy osztályközei szerint, és kiszámítjuk az eredményváltozó részátlagait az egyes csoportokban. S K (y) B (y) 1 1 S K(y) y/x (y) (y) ( y) S S B (y) (y)

A korrelációs hányados A korrelációs hányados négyzetét definiáltuk, mivel az csupán a kapcsolat intenzitását jelzi, irányát nem. Megoszlási viszonyszám jellegénél fogva a korrelációs hányados négyzete mindig nulla és egy közé esik. Előjelét nem értelmezzük, megállapodásszerűen pozitív számként kezeljük. A korrelációs hányadost nem szokták százalékos formában kifejezni. Általában y/x x/y tehát nem szimmetrikus az X és Y változókban. X csupán mint csoportképző ismérv szerepel.

Köszönöm a figyelmet strolsz@uni-miskolc.hu