Van-e kapcsolat a változók között? (példák: fizetés-távolság; felvételi pontszám - görgetett átlag)

Hasonló dokumentumok
Valószínűségszámítás összefoglaló

Nemparaméteres próbák

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

BIOMATEMATIKA ELŐADÁS

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Matematikai geodéziai számítások 6.

Segítség az outputok értelmezéséhez

Matematikai geodéziai számítások 6.

Többváltozós lineáris regressziós modell feltételeinek

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Korrelációs kapcsolatok elemzése

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Többváltozós Regresszió-számítás

Eloszlás-független módszerek 13. elıadás ( lecke)

Kvantitatív statisztikai módszerek

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

(Independence, dependence, random variables)

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Eloszlások jellemzése. Momentumok. Medián és kvantilis. Karakterisztikus függvény

Korreláció számítás az SPSSben

Függetlenségvizsgálat, Illeszkedésvizsgálat

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

A Statisztika alapjai

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Varianciaanalízis 4/24/12

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

GVMST22GNC Statisztika II.

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

A leíró statisztikák

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Fraktálok. Hausdorff távolság. Czirbusz Sándor ELTE IK, Komputeralgebra Tanszék március 14.

Faktoranalízis az SPSS-ben

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

5. előadás - Regressziószámítás

A valószínűségszámítás elemei

Principal Component Analysis

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

Abszolút folytonos valószín ségi változó (4. el adás)

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Matematikai alapok és valószínőségszámítás. Normál eloszlás

Matematikai statisztika c. tárgy oktatásának célja és tematikája

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

TANTÁRGYI PROGRAM Matematikai alapok 2. útmutató

Statisztikai módszerek a skálafüggetlen hálózatok

A valószínűségszámítás elemei

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

Gazdasági matematika II. vizsgadolgozat, megoldással,

[Biomatematika 2] Orvosi biometria

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

[Biomatematika 2] Orvosi biometria

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Operációkutatás. 4. konzultáció: Sorbanállás. Exponenciális elsozlás (ismétlés)

A maximum likelihood becslésről

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Korrel aci os egy utthat ok febru ar 29.

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

Számítógépes döntéstámogatás. Statisztikai elemzés

Faktoranalízis az SPSS-ben

Statisztika Elıadások letölthetık a címrıl

Kísérlettervezés alapfogalmak

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biometria gyakorló feladatok BsC hallgatók számára

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Tantárgy kódja Meghirdetés féléve 3 Kreditpont 4 Összóraszám (elm+gyak) 2+2

Negyedik fejezet. meglehetősen nagy, de az is lehet, hogy az X szín 5 évvel ezelőtt elő sem fordult. Tehát két. P (a ξ b, c η d)

Mérnöki alapok 11. előadás

Statisztika elméleti összefoglaló

Mérnöki alapok 2. előadás

[Biomatematika 2] Orvosi biometria

Gazdasági matematika II. tanmenet

Miért fontos számunkra az előző gyakorlaton tárgyalt lineáris algebrai ismeretek

Villamosmérnök A4 11. hét Kétdimenziós normális eloszlás, cht - Megoldások

Korreláció és Regresszió

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Regressziós vizsgálatok

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Diszkrét idejű felújítási paradoxon

Kettőnél több csoport vizsgálata. Makara B. Gábor

Átírás:

, rangkorreláció Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék 1111, Budapest, Műegyetem rkp. 3. D ép. 334. Tel: 463-16-80 Fax: 463-30-91 http://www.vizgep.bme.hu

Kérdés: Van-e kapcsolat a változók között? (példák: fizetés-távolság; felvételi pontszám - görgetett átlag)

Felvételi pontszám-görgetett átlag 10 115 110 felvételi pontszám 105 100 95 90 85 80.00 3.00 4.00 5.00 görgetett átlag 3

Kérdés: Van-e kapcsolat a változók között? Válasz: korrelációs együttható Megfigyelés sorozat: ( 1,η 1 ), (,η ), ( n,η n ), Átlagok: és η 4

: c = ( )( ) i i i η η 5

C n = η η i= 1 ( )( ) i i c < 0 i c > 0 i c > 0 c < 0 i i 6

A pontok tendenciája n ( i )( i ) C= η η> 0 i= 1 7

n ( i )( i ) C= η η< 0 i= 1 A pontok tendenciája 8

C 0 9

C függ a megfigyelések számától: n 1 n ( i )( η η i ) az változók szórásától: s s η ( )( η η) i i 1 n 1 ρη = n η η (, ) ( )( ) i i ss η tapasztalati korrelációs együttható ss η 10

Tapasztalati korrelációs együttható 1 ρη = n η η (, ) ( )( ) i i ss η r (, ) η = ( ( ) ) η ( η) ( ) M M M σσ η 11

tulajdonságai szimmetrikus: értéke: (, η) r( η, ) r = (, η) 1 1 r linearitás: (, η) = ± 1 r η = a + b Ha értéke = ±1, akkor a két változó közötti kapcsolat lineáris 1

Bizonyítás (azt akarjuk látni, hogy) r, η = ± 1 η = a + b ( ) A korrelációs együttható definíciójából: r ( η, ) ( ( ) ) η ( η) ( ) = M M M σσ η r ( η, ) ( ) M( ) M η η = M σ ση 13

Jelöljük: η= * η M( η) σ η és = * M( ) σ Ezzel (a kiinduló feltétel): standardizálás! ( * *) M η = 1 14

Belátjuk, hogy M = 0 ( * ) * = M( ) σ M * ( ) M( ) = M σ ( M( ) ) M = = σ 0 15

Belátjuk, hogy D = 1 ( * ) D ( ) D M( ) * = σ ( ) D = = 1 σ 16

( ) ( *) * ( ) = = = D 1 M M * = M M = ( * ) ( *) tudjuk: * ( ) M = 0 = M ( * ) Kaptuk, hogy ( * ) M = 1 17

Hasonló módon láthatjuk, hogy ( * ) D η = 1 és ( * ) M η = 1 18

Eddig kaptuk: Vizsgáljuk meg: ( * ) ( * ) ( * *) M = 1 M η = 1 M η = a feltétel szerint = 1 M ( * * ) η =? = M η +η = ( * * * * ) = M M η + M η = 0 ( * ) ( * *) ( * ) 19

( ) M η = 0 =η * * * * M η M η = σ σ ( ) ( ) σ σ η η η= M + M η σ σ η ( ) η= a+ b 0

Eddig azt láttuk, hogy: (, η) = ± 1 r η = a + b Visszafelé is igaz: η = a + b r(, η) = ± 1 1 A bizonyítás sokkal egyszerűbb: Indulás a korrelációs együttható definíciójából:

Tudjuk (a definició) A várhatóérték: η = a + b r ( η, ) M( η= ) M( a+ b) = ( ( ) ) η ( η) ( ) = M M M σσ η = am( ) + b A szórás: ( a b) σ = D + = η = aσ

Behelyettesítjük a kék összefüggéseket a def.-ba: r η, ( ) ( ( ) ) η ( η) ( ) = M M M σσ η r η, ( ) = ( ( )) M ( ( )) M a + b am( ) + b aσσ 3

Kapjuk: r η, ( ) = ( ( ) ) ( ) ( ) am M M aσσ r η, ( ) = M ( M( ) ) = 1 σ 4

Eddig azt láttuk, hogy (, η) = ± 1 r η = a + b A korrelációs együttható a lineáris kapcsolat szorosságát méri Ha korrelációs együttható zérus: korrelálatlanok a változók Ha korrelálatlanok és normális eloszlásúak, akkor függetlenek. 5

Ellenpélda! Legyen egyenletes (-1,1)-ben η = c j < 0 c j > 0 A kapcsolat determinisztikus, funkcionális, mégis a korrelációs együttható zérus 6-1 1

Felvételi pontszám-görgetett átlag 10 115 110 felvételi pontszám 105 100 95 90 ρ=0.65 85 80.00 3.00 4.00 5.00 görgetett átlag 7

Spearman féle rangkorreláció A megfigyelt két változó diszkrét (pl. a sorrend, a rangsorolás szubjektív) Kérdés: van e kapcsolat a két sorrend között (hogyan értékel a zsűri?). Rangszám: sorba rendezzük az adatokat Rangszám = a sorba-rendezett elem sorszáma Spearman féle rangkorreláció = korrelációs együttható a rangszámok között 8

Spearman féle rangkorreláció Minta: A B C D 1. rangszám k1 k k3 k4.. rangszám j1 j j3 j4. Rangszámok különbsége: d i = k i -j i 9 Spearman féle rangkorreláció: r 1 6 d = n n 1 i ( )

Spearman féle rangkorreláció Tulajdonságai: Ha a két sorrend azonos: r =1 Ha a két sorrend egymás ellentettje: r = -1 Ha nem sok közük van egymáshoz: r = ~0 30

Lássunk egy példát (rangkorreláció): Borversenyen vagyunk. Adott 4 féle bor. Jelöljük őket egyszerűen betűkkel. A két zsűritag más-más nedűt talál jobbnak. Hasonlítsuk össze pontjaikat, melyek a képen láthatóak. A rangszámokat vonjuk ki egymásból (d i ). Helyettesítsünk be a Spearman-képletbe. Bagó Ákos Károly 31

Lássunk egy példát (rangkorreláció): Behelyettesítés: r 1 6 d = nn 1 i ( ) 61 ( + + + 1) r= 1 = 0 44 1 ( ) 3

Lássunk egy példát (rangkorreláció): A példa eredménye: r = 0-át kaptunk eredményül. Így azt láthatjuk, nincs kapcsolat a két zsűritag véleménye közt. Újra kell kóstolni Vége... 33

korreláció Összefoglalás: r (, ) η = ( ( ) ) η ( η) ( ) M M M σσ η A változók közötti lineáris kapcsolat szorosságát méri Legfontosabb tulajdonsága: 34 r(, η) = ± 1 η = a + b

Rangkorreláció: Spearman féle rangkorreláció Két sorrend (sorba rendezett minta) összehasonlítására szolgál. Rangszámok különbsége: d i = k i -j i 35 r 1 6 d = nn 1 i ( ) Ha a két sorrend azonos: r =1 Ha a két sorrend egymás ellentettje: r = -1