[Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9
Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs együttható (Pearson koefficiens): megadja, hogy milyen szoros a két változó kapcsolata. A korrelációs együttható értelmezése: Vezessünk be egy új koordinátarendszert, amelynek tengelyei párhuzamosak az x és az y tengellyel, origója pedig a minták átlagainál van. Ebben a koordinátarendszerben a pontok távolsága az új x és y tengelyektől éppen az átlagoktól való eltérések.
Amikor két változó között nincs semmilyen kapcsolat: FONTOS! Bármilyen szoros is a korreláció két változó között, a reláció nem interpretálható úgy, hogy az egyik változó változása oka a másik változó változásának.
A korrelációs együttható (r) számítása 1 r(x,y) 1 Dimenziófüggetlenné vált az együttható, mert az eltérések szorzatának összegét elosztottuk a két változóra (X és Y) vonatkozó négyzetes eltérések szorzatának négyzetgyökével. Ha a számlálót és nevezőt egyaránt (n -1)-el elosztjuk, a következő egyszerű formulát kapjuk: ahol: Az s xy mennyiséget a két változó kovarianciájának nevezzük.
0 körüli érték gyenge, -1-hez vagy 1-hez közeli érték erős negati v, illetve poziti v korrelációs kapcsolatot jelez. Korreláció r=1 Ha valamennyi pont pontosan egy egyenesen fekszik úgy, ha x nő, és vele y is nő, ekkor r = + 1. Korreláció r=-1 Ha valamennyi pont egy egyenesen fekszik, de az egyenes meredeksége negatív, akkor r = - 1.
Néhány példa
A korrelációs együttható számítása során nem derül ki, hogy a kapcsolat lineáris vagy nemlineáris. A korrelációs együttható maradéktalanul akkor mutatja a két változó kapcsolatának szorosságát, ha a reláció a változók között lineáris. A korrelációs együtthato szimmetrikus, a két változo felcserélheto. Nem szabad részátlagokra használni, mert a kiejtett bizonytalanságok miatt a valóságosnál erősebb összefüggést mutathat. Példa: Az x és y változók közötti korrelációs kapcsolat részletezése a (-4, + 4) intervallumban, ha az adatpárok kielégítik az y = x 2 fügvényt. A táblázat utolsó oszlopának adataiból nyilvánvaló, hogy az r korrelációs együttható nulla, jóllehet a kapcsolat igen szoros a két változó között. Ha az adatok pontosan egy parabolán fekszenek, a korrelációs együttható nulla; az r együttható úgy interpretálja a kapcsolatot, mint egy struktúrálatlan sokaságot.
A korreláció könnyen félreértelmezhető! Bármilyen szoros is a korreláció két változó között, a reláció nem interpretálható úgy, hogy az egyik változó változása oka a másik változó változásának. Ha két mennyiség korrelál, akkor az egyik okozza a másikat. - Ez nem feltétlenül van így. Például, ha falvakat vizsgálva a gólyafészkek és a gyerekek száma korrelál, akkor az nem bizonyítja azt, hogy a gyereket a gólya hozza. Példa, amikor korreláció kimutatható, de nincs valódi ok-okozati kapcsolat: Az ábra a szív frekvenciája és a testhőmérséklet közötti kapcsolatot mutatja. A korrelációs együttható: r = 0.8. Merőben más eredményt kapunk, ha két mintával különkülön dolgozunk: nincs ugyanis valós kapcsolat a testhőmérséklet és a szív frekvenciája között.
A korrelációs együttható varianciája A st. dev függ függ r nagyságától. Látható: nagy korrelációs együttható a kapcsolat szorosságát jelenti, a mérési pontok szorosan az egyenes körül helyezkednek el. Mivel a standard deviáció r nagyságától függ, ezért r, mint valószínűségi változó eloszlása nem lehet normális eloszlás: az eloszlás erősen aszimmetrikus.
Probléma: A magasvérnyomás etiológiája. Egy vizsgálat során kilenc családban mérték az apának, az anyának és az elsőszülött gyermeknek a szisztolés vérnyomását. Azt feltételezték, hogy az apa és az anya vérnyomása között nincs korreláció. Egyszerű genetikai megfontolás alapján azt várjuk, hogy az anya és az elsőszülött gyyermek vérnyomása között a korrelációs együttható 0.5. Anya és első-szülött gyermeke szisztolés vérnyomása közötti kapcsolat.
A korrelációs együttható szignifikanciája Mivel a korrelációs együtthato a mintából számított becslés, ezért hibával terhelt. Akkor sem kapunk pontosan nullát, ha a két változo között nincs korrelácio, ezért el kell végeznünk az alábbi hipotézisvizsgálatot: ahol a szabadsági fokok száma n-2. Nullhipotézis H0: r(x,y)=0 Alternatív hipotézis H1: r(x,y) 0 A hipotézisvizsgálat eldönti, hogy a minta származhat-e olyan populációból, amelynek korrrelációs együtthatója nulla.
Példa 6 hallgatónak mérték az adás-vétel, a színház, a matematika és a nyelvek iránti érdeklődését. Az alábbi eredményeket kapták:
1.) A korrelációs együttható (r) számítása Számolás menete: 1.) x átlag és y átlag 2.) x és y változók átlagtól való különbsége, szorzatuk képzése és az eredmények összegzése 3.) x és y változók átlagtól való különbségének négyzete, összegzése, szorzata és annak gyökvonása 4.) A hányados képzése
A korrelációs együtthatók megmutaják a változók kapcsolatának szorosságát: 1.) Nyelv-matematika r = 0.9989 2.) Színház-matematika r = -0.01202
2.) Teszt a korrelációs együttható szignifikanciájára Statisztikai szempontból el kell tudnunk dönteni, hogy r értéke elég messze van-e 0-tól ahhoz, hogy elég nagy biztonsággal állíthassuk, hogy valóban fennáll a valós korreláció. H0: r = 0 H1: r 0 A nyelv-matematika kapcsolatra: A táblabeli kritikus érték t0.05, 4 = 2.776. Mivel 42.6 > 2.776, elvetjük H0 -at és azt állítjuk, hogy a két változó, a matematika és a nyelvtudás közötti korreláció szignifikánsan eltér 0-tól 95 % -os szinten. A színáz-matematika kapcsolatra t = 0.024, mivel Mivel 2.776 > 0.024, H0-t megtartjuk.
Lineáris regresszió számolás I.
Lineáris regresszió számolás II.