Kvantitatív statisztikai módszerek

Hasonló dokumentumok
Korrelációs kapcsolatok elemzése

Sztochasztikus kapcsolatok

A statisztika alapjai - Bevezetés az SPSS-be -

Korreláció számítás az SPSSben

A statisztika alapjai - Bevezetés az SPSS-be -

Bevezetés az SPSS program használatába

Bevezetés a Korreláció &

Statistical Dependence

Függetlenségvizsgálat, Illeszkedésvizsgálat

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Diszkriminancia-analízis

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Korreláció-számítás. 1. előadás. Döntéselőkészítés módszertana. Dr.

Regresszió számítás az SPSSben

Regressziós vizsgálatok

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

[Biomatematika 2] Orvosi biometria

GVMST22GNC Statisztika II.

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

2. előadás. Viszonyszámok típusai

Kvantitatív elemzési módszerek

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Statisztika I. 2. előadás: Statisztikai táblák elemzése. Kóczy Á. László. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem

Segítség az outputok értelmezéséhez

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Korreláció és lineáris regresszió

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Varianciaanalízis 4/24/12

(Independence, dependence, random variables)

Bevezető Mi a statisztika? Mérés Csoportosítás

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

[GVMGS11MNC] Gazdaságstatisztika

Statisztika. Dr Gősi Zsuzsanna. Egyetemi adjunktus. Sportmenedzsment Tanszék

Van-e kapcsolat a változók között? (példák: fizetés-távolság; felvételi pontszám - görgetett átlag)

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Többváltozós Regresszió-számítás

Nem. Cumulative Percent 1,00 férfi ,9 25,9 25,9 2,00 nı ,1 73,1 99,0 99,00 adathiány 27 1,0 1,0 100,0 Total ,0 100,0

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

TANTÁRGYI ÚTMUTATÓ. Statisztika 1.

Megoldások. Az ismérv megnevezése közös megkülönböztető szeptember 10-én Cégbejegyzés időpontja

Korreláció és Regresszió

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Többváltozós lineáris regressziós modell feltételeinek tesztelése II.

GRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Statisztikai alapfogalmak

Lineáris regressziószámítás 1. - kétváltozós eset

MINDEN FELADATOT A FELADATOT TARTALMAZÓ LAPON OLD- JONMEG!

Matematikai statisztikai elemzések 5.

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

A mérési eredmény megadása

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Matematikai statisztikai elemzések 5.

Regressziós vizsgálatok


Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Emlékkonferencia Farkas Ferenc tiszteletére Tudomány napi konferencia, november 15. MAGYAR TUDOMÁNYOS AKADÉMIA

Geokémia gyakorlat. 1. Geokémiai adatok értelmezése: egyszerű statisztikai módszerek. Geológus szakirány (BSc) Dr. Lukács Réka

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Logisztikus regresszió

Többváltozós lineáris regressziós modell feltételeinek

Fogalom STATISZTIKA. Alkalmazhatósági feltételek. A standard lineáris modell. Projekciós mátrix, P

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Faktoranalízis előadás. Kvantitatív statisztikai módszerek

E-tananyag Matematika 9. évfolyam Függvények

Mérési adatok illesztése, korreláció, regresszió

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Változók közötti kapcsolat III.: a folytonos eset. Regresszió és korreláció.

A sokaság/minta eloszlásának jellemzése

Q1 = 1575 eft Me = 2027,7778 eft Q3 = 2526,3158 eft

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Matematikai geodéziai számítások 6.

[Biomatematika 2] Orvosi biometria

A L Hospital-szabály, elaszticitás, monotonitás, konvexitás

Logisztikus regresszió

Adatok statisztikai értékelésének főbb lehetőségei

Descartes-féle, derékszögű koordináta-rendszer

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Matematikai geodéziai számítások 6.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet

Sorozatok határértéke SOROZAT FOGALMA, MEGADÁSA, ÁBRÁZOLÁSA; KORLÁTOS ÉS MONOTON SOROZATOK

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

Ökonometriai modellek paraméterei: számítás és értelmezés

Statisztikai alapfogalmak

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Biostatisztika VIII. Mátyus László. 19 October

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Hipotézis vizsgálatok

Gyakorló feladatok a kétváltozós regresszióhoz 2. Nemlineáris regresszió

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének

Átírás:

Kvantitatív statisztikai módszerek 1. konzultáció tárgyjegyző Dr. Szilágyi Roland

Mérési skálák Számok meghatározott szabályok szerinti hozzárendelése jelenségekhez, bizonyos tulajdonságokhoz. 4 féle szabály alapján (erősségi fokozat szerint): - nominális skála - sorrendi skála - intervallum skála (különbség skála) - arány skála

1. Nominális skála (névleges) Számok kötetlen hozzárendelése Területi, minőségi ismérvek megfigyelésekor A szám csak azonosító Pl. rendszám, irányítószám Pl: kódolás: Szőke: 1, barna:, vörös: 3, fekete: 4 Férfi: 1, nő:

. Ordinális, sorrendi skála A sokaság egyedeinek egy közös tulajdonság alapján való sorba rendezése. A skálán az egyes egyedek nem feltétlen egyforma távolságra helyezkednek el egymástól. Pl. hallgatók osztályzata, országok hitelképességének sorrendje

3. Intervallum skála A két adat különbsége értelmezett, valós adat. Zérus pontja önkényes. A zérus pont nem jelenti azt, hogy az adott egyed nem rendelkezik az adott tulajdonsággal. De: nem értelmezhető a két adat összege, aránya, különbsége. Pl. Celsius fok

4. Arány skála A legerősebb mérési skála Zérus pontja természetesen adódik Bármely két érték aránya független a mértékegységtől Értelmezhető a két adat összege, aránya is Pl. hosszúság, pontszám

Összefüggés vizsgálat

Két változó közötti kapcsolat Független: Az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az Y szerinti hovatartozásról. Sztochasztikus: Az egyik ismérv hatással van a másikra, de nem határozza meg egyértelműen annak értékeit/változatait. Függvényszerű (determinisztikus): A vizsgált egységek X szerinti hovatartozásának ismeretében egyértelműen megmondható azok Y szerinti hovatartozása is.

Sztochasztikus kapcsolatok fajtái Asszociáció (mindkét ismérv minőségi/területi ismérv, nominális skálán mérve). Vegyes (egyik ismérv mennyiségi, másik területi/minőségi, intervallum/arány és nominális skálán mérve. Korreláció (mindkét ismérv mennyiségi, intervallum/arány skálán mérve). Rangkorreláció (mindkét változó sorrendi skálán mérhető).

Az összefüggés vizsgálat eszközei Két nominális változó közötti kapcsolatot az asszociációs mérőszámokkal jellemezzük. Ordinális típusú változók összefüggését a rangkorrelációs mutatók mérik. Arány skála típusú változók összefüggését korreláció- és regresszió-analízissel elemezzük. Intervallum/arány és nominális skálán mért változók közötti összefüggést H;

A kapcsolatszorossági mutatókkal szemben támasztott követelmények Egyértelmű definíció Zárt intervallumban mozogjon Célszerű, ha: 0 < mutató < 1 0: teljes függetlenség 1: függvényszerű (determinisztikus) a kapcs. Monotonitás

Cramer asszociációs együttható B P A P B A P n f f f f f f χ 1 t 1 s n χ T j i * i r 1 i * i * i i A függetlenség feltételezésével számított gyakoriságokból indul ki. Csuprov mutató

T max 4 s 1 s t t 1 Cramer mutató C T T max n χ s 1

Egy vállalat dolgozóinak szakképzettség szerinti csoportosítása Szakképzettség Férfiak (fő) Nők (fő) Összesen (fő) Clerical 06 157 363 Custodial 0 7 7 Manager 10 74 84 Összesen 16 58 474

Output Symmetric Measures Nominal by Nominal N of Valid Cases Phi Cramer's V a. Not assuming the null hy pothesis. b. Value Approx. Sig.,409,000,409,000 474 Using t he asy mptotic standard error assuming the null hy pothesis. 0 C 0,3 gyenge kapcsolat 0,3 C 0,7 közepesen erős kapcsolat 0,7 C 1 erős kapcsolat Közepesen erős a kapcsolat a nem és a munka típusa között.

Output A nők 4,6%-a menedzser. A dolgozók 33,1%-a férfi hivatalnok. Minden custodial férfi. Elemszám (itt: dolgozói létszám)

Vegyes kapcsolatok szorosságának elemzése Szóráshányados: a kapcsolat szorosságának mérőszáma S k σk Szórásnégyzet-hányados: A mennyiségi ismérv szóródását mennyiben befolyásolja a csoportosító ismérv szerinti hovatartozás. H=H =0 függetlenség H=H =1 függvényszerű (determinisztikus) kapcsolat H H S Sk S σ σ σ k

H SS SS K σ σ K Szóráshányados: a kapcsolat szorosságát 0-1 közötti értékkel méri Vegyes kapcsolat vagy Ahol: H = H = 0 - függetlenség (nincs kapcsolat) H = H = 1 - függvényszerű kapcsolat 0 H 1 - sztochasztikus kapcsolat 0 H 0,3 gyenge kapcsolat 0,3 H 0,7 közepesen erős kapcsolat 0,7 H 1 erős kapcsolat 0 H 1 H SS SS K σ σ K Megmutatja, hogy a csoportosító (minőségi/területi) ismérv milyen hányadban, hány százalékban magyarázza a vizsgált mennyiségi ismérv szóródását.

Output Current Salary Gender Female Male Total Report Mean N Std. Dev iation $6,031.9 16 $7,558.01 $41,441.78 58 $19,499.14 $34,419.57 474 $17,075.661 Ez a táblázat a függő változó (current salary) középértékeit & szóródási mutatóit mutatja a független változó (nem) szerint csoportosítva. ANOVA Table Current Salary * Gender Between Groups Within Groups Total (S) (S B ) (Combined) (S K ) Sum of Squares df Mean Square F Sig.,8E+010 1,79E+010 119,798,000 1,1E+011 47 33046530,5 1,4E+011 473 Measures of Association Current Salary * Gender Közepesen erős a kapcsolat a nem és a jelenlegi fizetés között. H Eta Eta Squared,450,0 H S S K %; hány százalékban magyarázza a független változó (nem) a függő változó (fizetés) szóródását

Korrelációs kapcsolat elemzése Van-e összefüggés az ismérvek között? Milyen irányú az összefüggés? Mennyire szoros a kapcsolat? Az egyik ismérv változása milyen hatással van a másik ismérv változására?

Alapfogalmak I. A mennyiségi ismérvek közötti kapcsolatot korrelációnak nevezzük. A korrelációszámítás: a mennyiségi ismérvek közötti kapcsolat szorosságának mérése. A regressziószámítás: a mennyiségi ismérvek egymásra gyakorolt hatásának számszerűsítésével, e hatások irányának és mértékének megállapításával foglalkozik.

Alapfogalmak II. Ha a korreláció mögött egyirányú okozati összefüggés állapítható meg: az ok szerepét betöltő ismérvet tényezőváltozónak, magyarázó-, független változónak (X), az okozat szerepét játszó ismérvet pedig eredményváltozónak, függő változónak (Y) nevezzük.

A korreláció fontosabb típusai

Korreláció hiánya A regresszió-függvény bármely X helyen azonos (közel azonos) értéket vesz fel. A függvény képe vízszintes vonal. ( Y független X-től, X nem befolyásolja Y értékét.)

A korreláció hiánya Y = - 7. 4 E - 0 + 0. 0 8 3 4 8 X 3 R - S q = 3. 4 % 1 0-1 - - 3 - - 1 0 1 N i n c s k o r r e lá c i ó

Függvényszerű kapcsolat A korreláció hiányának logikai ellentéte a függvényszerű kapcsolat. Egy adott X értékhez csupán egyetlen Y érték tartozhat. Ilyenkor a pontdiagram pontjai a regresszió-vonalhoz illeszkednek, azaz a regresszióvonal körül nincs szóródás.

Pozitív korreláció Általában a regressziógörbe körül van szóródás. A regressziógörbe alakja a korreláció tartalmát fejezi ki. Ha nagyobb X értékekhez általában nagyobb Y értékek tartoznak, vagyis a tényezőváltozó növelése az eredményváltozó nagyságát növeli.

Pozitív korreláció Y = -8. 6 E -0 + 0. 6 9 0 8 6 X 3 R -S q = 6. 5 % 1 0-1 - - 3-3 - - 1 0 1 3 P o z i t ív k o r r e l á c i ó

Negatív korreláció Az előbbi kapcsolat ellentéte természetesen a negatív korreláció, amelyet a regressziófüggvény ugyancsak szemléletesen jelez.

Negatív korreláció Y = 5. 0 7 E - 0-0. 6 4 7 8 7 X 3 R - S q = 7 0. 9 % 1 0-1 - - 3-3 - - 1 0 1 3 N e g a t ív k o r r e lá c i ó

Görbevonalú kapcsolat A lineáristól eltérő típust görbe vonalú (nemlineáris) kapcsolatnak nevezzük. A nemlineáris kapcsolatok egy részénél továbbra is van értelme pozitív, vagy negatív irányzatról beszélni, feltéve, hogy a görbe monoton növekvő, illetve csökkenő irányzatot mutat az értelmezési tartományon belül. Nem lehet azonban pozitív vagy negatív irányról beszélni, ha a regresszió irányt változtat.

Görbevonalú kapcsolat Y = 1. 0 9 5 8 + 6. 0 7 6 8 4 X + 1. 1 6 6 8 6 X * * 4 0 R - S q = 8 8. 4 % 3 0 0 1 0 0-3 - - 1 0 1 3 N e m l i n e á r i s k o r r e lá c i ó

A kapcsolat szorosságának mérőszámai

A kovariancia Az X és Y mennyiségi változók közötti kapcsolat irányát mutatja meg. A megfelelő átlagtól vett ( x - x) és ( y - y) eltéréseken alapszik. C = d x d n -1 y = xy n -1 - x y C r s x s y

Kovariancia tulajdonságai A kovariancia nulla, ha a pozitív és a negatív előjelű eltérésszorzatok összege kiegyenlíti egymást. Kovariancia előjele a kapcsolat irányát mutatja. A kovariancia abszolút mértékének nincs határozott felső korlátja. A kovariancia a két változóban szimmetrikus, X és Y szerepe a formulában felcserélhető.

Dolgozó Egy vállalat dolgozóinak keresete és havi megtakarítása Bér (Ft/fő) Havi megtakarítás (Ft/hó) d x d y d x d y d x d y 1 10000 13000-13000 -3010 39130000 169000000 9060100 90000 10000-43000 -6010 58430000 1849000000 3610100 3 0000 35000 87000 18990 165130000 7569000000 36060100 4 150000 18000 17000 1990 33830000 89000000 3960100 5 100000 1000-33000 -4010 13330000 1089000000 16080100 6 115000 1500-18000 -3510 63180000 34000000 130100 7 160000 0000 7000 3990 107730000 79000000 1590100 8 130000 13800-3000 -10 6630000 9000000 4884100 9 145000 14000 1000-010 -410000 144000000 4040100 10 100000 11800-33000 -410 138930000 1089000000 1774100 Összesen 1330000 160100 0 0 40800000 1360000000 48079000

Kovariancia C = d x d n -1 y = xy n -1 - x y 40800000 9 67577777,8 Értelmezés: a dolgozók keresete és a havi megtakarított összege közötti kapcsolat pozitív irányú.

A korrelációs együttható A korrelációs együttható a lineáris korreláció szorosságának legfontosabb mérőszáma. A kapcsolat hiányát (korrelálatlanság) az r = 0 érték jelzi. Az r előjele a korreláció irányát mutatja. Tökéletes (függvényszerű) lineáris kapcsolatnak - az iránytól függően - az r = +1, illetve r = -1 értékek felelnek meg. A szélsőséges helyzetek között az együttható abszolút értéke a kapcsolat szorosságáról tájékoztat.

Lineáris korrelációs együttható (Pearson) d d = xy - n x y x y d = x n x x d = y n y y ) )( ( y x y x y x y n y x n x y x xy- n d d d d C = r s s

Lineáris korrelációs együttható Dolgozó Bér (Ft/fő) Havi megtakarítás (Ft/hó) d x d y d x d y d x d y Összesen 1330000 160100 0 0 40800000 1360000000 48079000 r = s x C dxd y s y dx d y 40800000 1360000000 48079000 0,954 Értelmezés: a dolgozók keresete és a havi megtakarított összege közötti kapcsolat pozitív irányú és erős.

Determinációs együttható A determinációs együttható megmutatja, hogy a magyarázóváltozó hány %-ban befolyásolja az eredményváltozó szóródását. Jele: r A determinációs együttható jellemzi: A regressziós függvény illeszkedését, A modell magyarázó erejét.

Determinációs együttható r 0,954 0,9098 90,98% Értelmezés: a dolgozók keresete 90,98%- ban befolyásolja a havi megtakarított összeg szóródását.

A rangkorreláció Létezhetnek a statisztikai sokaság egységeinek olyan kvantitatív jellegű tulajdonságai, amelyek számszerűen egyáltalán nem, vagy csak nehezen mérhetők. A mutatószám értéke r-hez hasonlóan természetesen -1 és 1 között helyezkedik el. Ha a kétféle rangsorszám rendre megegyezik, akkor = 1, ha a sorszámok a két ismérv szerint következetesen ellentétesen alakulnak, akkor = -1. 6di = 1- n(n 1)

Rangkorreláció Egy régió vállalatainak gazdálkodására vonatkozó adatok Régió 1 3 4 5 6 7 8 9 10 Árbevétel (MFt) 34 30 5 1 10 1 8 31 0 Nyereség (MFt) 16 10,5 10 1 7 4 1 9 11 x 10 8 7 6 5 3 1 9 4 y 10 7 6 9 4 3 1 5 8 d 0 1-1 -3 1-1 1 0 4-4 d 0 1 1 9 1 1 1 0 16 16 6di 646 = 1-1 0,71 n(n 1) 1010 1 Értelmezés: a vállalatok árbevétele és nyeresége között közepesnél szorosabb, pozitív irányú kapcsolat van.

Köszönöm a figyelmet! roland.szilagyi@uni-miskolc.hu