LINEÁRIS REGRESSZIÓ (I. MODELL) ÉS KORRELÁCIÓ FELADATOK 2004 november 29. 1.) Lisztbogarak súlyvesztése 9 lisztbogár-csapat súlyát megmérték, (mindegyik 25 bogárból állt, mert egyenként túl kis súlyúak lettek volna a bogarak). 6 napig éheztették őket a kísérletező által beállított különböző páratartalmú dobozokban, majd újból lemérték őket. (A súlyveszteség jó közelítéssel normál-eloszlású és azonos varianciájú az adott páratartalomtartományban.) Vizsgáljuk a súlyveszteség és a páratartalom közötti kapcsolatot! Páratart Súlyveszt 0 8,98 12 8,14 29,5 6,67 43 6,08 53 5,90 62,5 5,83 75,5 4,68 85 4,20 93 3,72
2.) Intrinsic hart rate és az életkor kapcsolata 40 különböző korú személyt választottak ki a kísérlet céljára, úgy hogy 17-től 69 évesig nagyjából egyenletesen legyen mindenféle életkorú. Mérték az intrinsic hart rate -et vagyis a pulzust szimultán szimpatikus és paraszimpatikus blokád mellett. (Az IHR jó közelítéssel normáleloszlású és azonos varianciájú az adott életkor-tartományban.) Milyen az IHR és az életkor kapcsolata? életkor IHR 17 120 17 120 17 100 17 118 18 100 18 120 19 106 19 98 22 107 23 100 25 115 26 108 26 102 27 105 30 100 31 100 32 102 33 103 34 102 35 90 36 90 39 109 40 90 40 102 41 89 42 90 42 95 43 100 44 103 45 106 46 116 47 115 52 100 54 90 57 78 58 84 61 72 68 78 69 72 69 92
3.) Szérum transzferrin és coeruloplasmin-szint összefüggése Se. tran. Se. cor. 22 10 30 60 60 11 66 22 109 22 133 14 138 20 150 34 158 30 158 83 160 42 175 38 196 60 203 71 218 41 240 47 245 108 246 38 254 59 254 70 287 52 290 66 302 31 318 50 321 81 336 92 360 47 371 85 392 80 413 96 420 120 452 100 459 149 498 128 34 random kiválasztott újszülöttön mérték a szérum transzferrin és a coeruloplasminszintet (g/cl). (Mindkét változó normál elo.) Mit mondhatunk a két változó összefüggéséről?
4.) Drozi tömeg vs denzitás Dosophila persimilisen vizsgálták a lárvakori denzitás és a felnőttkori testtömeg kapcsolatát. (A lárvakori denzitást a kísérletező állította be, a testtömeg normálelo. a vizsgált denzitástartományban.) Dens. Tömeg 1 1,356 3 1,356 5 1,284 6 1,252 10 0,989 20 0,664 40 0,475 5.) Lárvaperiódus hossza (napok) vs hőmérséklet (Farenheit) (A hőmérsékletet a kísérletező állította be, a lárvaperiódus hossza normálelo. a vizsgált hőmérséklet -tartományban.) T E 0 24,9 4 23,4 10 24,2 18 18,7 26 15,2 43 13,7 6.) Heritabilitás Zab 8 zabnövényt véletlenszerűen poroztak be, majd mérték a fül hosszát az anyanövényen illetve az utódnövények átlagos fülhosszát mm-ben. Becsüljük a heritabilitást! Milyen bizonyossággal állíthatjuk, hogy van a populációban (additív) genetikai változatosság a fülhosszra nézve? Anyanövény Utódok átl. 60 91 79 98 82 108 85 104 88 99 95 102 96 96 99 111
7.) Kétféle szérum-kalcium meghatározás kapcsolata 30 vérszérumból 2-2 mintát vettek és kétféle módszerrel meghatározták a kalciumtartalmat. (atomabsz. spektrofotom. és komplexom.) Milyen a kétféle mérési módszer által adott koncentrációadatok közötti kapcsolat? AAS Kompl 2,15 2,18 2,20 2,20 2,30 2,30 2,53 2,45 2,15 2,20 2,43 2,40 2,43 2,43 2,73 2,75 3,03 2,98 2,75 2,80 1,95 2,00 2,00 2,00 2,30 2,28 2,53 2,50 2,55 2,55 2,83 2,83 2,45 2,48 2,40 2,38 2,30 2,30 2,68 2,70 2,13 2,13 2,28 2,35 2,78 2,75 2,23 2,25 2,08 2,08 2,33 2,33 2,55 2,55 2,75 2,70 2,58 2,60 2,23 2,23
8.) Heritabilitás bábsúly Egy rovarfaj 6 hímjének mérték a bábállapotbeli súlyát, majd véletlenszerűen kiválasztott nőstényekkel párosítva őket az utódok átlagos bábsúlyát is mérték (mg). Becsüljük a heritabilitást! Milyen bizonyossággal állíthatjuk, hogy van a populációban (additív) genetikai változatosság a bábsúlyra nézve? Apa Utód átl. 2,0 2,2 2,3 2,1 2,4 2,3 2,5 2,4 2,5 2,2 2,2 2,2 9.) Ikrek IQ 10-10 egypetéjű ill kétpetéjű ikerpárt választottak véletlenszerűen és IQ tesztet készítettek velük. Interpretáljuk az eredményeket! Kétpetéjű Kétpetéjű 96 100 103 110 120 115 91 88 98 92 103 102 107 98 112 105 102 99 101 94 Egypetéjű Egypetéjű 110 98 110 106 100 91 97 90 112 105 121 110 101 88 96 86 104 95 107 98
Megoldások: 1.) Mivel a páratartalom a kísérletező által kontrollált, gyakorlatilag hiba nélkül mért és beállított, nem normális eloszlású független változó a két változó kapcsolatának vizsgálatára a lineáris regresszió I. modellje a megfelelő. b = -0,05322; 95% os konf int: [-0,06092, -0,04552] a meredekség a = 8,704; 95% os konf int: [8,251, 9,157] a tengelymetszet Az regresszió ANOVÁ-ja szerint: P<0.0001; ez azt jelenti, hogy H 0 fennállása esetén a mintavételi hiba kevesebb mint az esetek tízezred részében okozná, hogy a mintából becsült b ennyire vagy ennél jobban eltérjen a 0-tól. A függő változó (súlyveszt.) varianciájának jelentős része a regresszióból adódik Tehát az egyenes meredeksége extrém szignifikánsan eltér 0-tól, (ilyen nagy eltérést csupán a véletlen nagyon ritkán okozna) H 0 -t elvetjük, a két változó között erős negatív irányú lineáris kapcsolatot találtunk. 2.) Mivel az életkor a kísérletező által kontrollált, gyakorlatilag hiba nélkül mért és beállított, nem normális eloszlású független változó a két változó kapcsolatának vizsgálatára a lineáris regresszió I. modellje a megfelelő. b = -0,5621; 95% os konf int: [-0,7508, -0,3733] a meredekség a = 120,46; 95% os konf int: [112,90, 128,01] a tengelymetszet Az regresszió ANOVÁ-ja szerint: P<0.0001; ez azt jelenti, hogy H 0 fennállása esetén a mintavételi hiba kevesebb mint az esetek tízezred részében okozná, hogy a mintából becsült b ennyire vagy ennél jobban eltérjen a 0-tól. A függő változó (IHR) varianciájának jelentős része a regresszióból adódik. Tehát az egyenes meredeksége extrém szignifikánsan eltér 0-tól, (ilyen nagy eltérést csupán a véletlen nagyon ritkán okozna) H 0 -t elvetjük, a két változó között erős negatív irányú lineáris kapcsolatot találtunk. 3.) Mivel mindkét változó normális eloszlású független változó, nem állnak ok-okozat viszonyban a két változó kapcsolatának vizsgálatára a korrelációszámítás a megfelelő.
H 0 : ρ = 0 (A minta egy olyan alapsokaságból származik, ahol nincs lineáris korreláció a két változó között. r, a korreláció becsült értéke, csupán a mintavételi hiba, a véletlen ingadozás miatt tér el 0 -tól.) A Graphpad Instat program segítségével a korreláció-számítás és a hipotézisvizsgálat: r = 0,7841, 95%-os konf. int. : [0,6067, 0,8871] P<0,0001 A becsült r szignifikánsan eltér a 0-tól, ez azt jelenti, hogy H 0 fennállása esetén a mintavételi hiba kevesebb mint az esetek tízezred részében okozná, hogy a mintából becsült r ennyire vagy ennél jobban eltérjen a 0-tól. Az, hogy a konf. int. alsó határa messze van a 0-tól, szintén azt mutatja r nem csak a véletlen miatt tér el a 0-tól. Tehát r nagyon szignifikánsan eltér a 0-tól (ilyen nagy eltérést csupán a véletlen nagyon ritkán okozna), H 0 -t elvetjük. A két változó között erős pozitív irányú lineáris korrelációt találtunk. 4.) Mivel a denzitás a kísérletező által kontrollált, gyakorlatilag hiba nélkül mért és beállított, nem normális eloszlású független változó a két változó kapcsolatának vizsgálatára a lineáris regresszió I. modellje a megfelelő. b = -0,02462; 95% os konf int: [-0,03400, -0,01525] a meredekség a = 1,353; 95% os konf int: [1,188, 1,518] a tengelymetszet Az regresszió ANOVÁ-ja szerint: P<0.0011; ez azt jelenti, hogy H 0 fennállása esetén a mintavételi hiba kevesebb mint az esetek kb. ezred részében okozná, hogy a mintából becsült b ennyire vagy ennél jobban eltérjen a 0-tól. A függő változó (testtömeg) varianciájának jelentős része a regresszióból adódik. Tehát az egyenes meredeksége nagyon szignifikánsan eltér 0-tól, (ilyen nagy eltérést csupán a véletlen nagyon ritkán okozna) H 0 -t elvetjük, a két változó között erős negatív irányú lineáris kapcsolatot találtunk.
5.) Mivel a hőmérséklet a kísérletező által kontrollált, gyakorlatilag hiba nélkül mért és beállított, nem normális eloszlású független változó a két változó kapcsolatának vizsgálatára a lineáris regresszió I. modellje a megfelelő. b = -0,2887; 95% os konf int: [-0,4250, -0,1524] a meredekség a = 24,877; 95% os konf int: [21,847, 27,906] a tengelymetszet Az regresszió ANOVÁ-ja szerint: P<0.0042; ez azt jelenti, hogy H 0 fennállása esetén a mintavételi hiba kevesebb mint az esetek fél százalékában okozná, hogy a mintából becsült b ennyire vagy ennél jobban eltérjen a 0-tól. A függő változó (lárvaperiódus hossza) varianciájának jelentős része a regresszióból adódik. Tehát az egyenes meredeksége nagyon szignifikánsan eltér 0-tól, (ilyen nagy eltérést csupán a véletlen nagyon ritkán okozna) H 0 -t elvetjük, a két változó között erős negatív irányú lineáris kapcsolatot találtunk. 6.) A heritabilitás becslésére kiszámítjuk az utódok átlagának regresszióját az egyik szülőn majd szorozzuk 2-vel. b = 0,3067; 95% os konf int: [-0,1140, 0,7273] a meredekség a = 74.904; 95% os konf int: [38,603, 111,21] a tengelymetszet Az regresszió ANOVÁ-ja szerint: P = 0.1247; ez azt jelenti, hogy H 0 fennállása esetén a mintavételi hiba gyakran, kb. esetek 12%-ban okozná a mintából becsült b ekkora vagy nagyobb eltérését a 0-tól. A függő változó (utódok átlaga) varianciájának jelentéktelen része adódik csak a regresszióból. Tehát az egyenes meredeksége nem tér el 0-tól szignifikánsan, (a szóráshoz képest ilyen kicsi eltérést csupán a véletlen is gyakran okoz) H 0 -t megtartjuk, a két változó között nem találtunk lineáris kapcsolatra utaló evidenciát. (Nem állíthatjuk, hogy biztosan nincs lineáris kapcsolat, csak azt, hogy az adott mintából becsült statisztikák nincsenek ellentmondásban H 0 -lal, nem szolgálnak bizonyítékul arra, hogy van lineáris kapcsolat.) Az hogy a b-re vonatkozó konf. int. magában foglalja a 0-t, ugyanezt jelenti. A heritabilitásra kapott becslés: h 2 = 2 b OP = 0,6, de ez egy nagyon bizonytalan (pontatlan) becslés, a konf. int. [-0,3, 1,5] magában foglalja h 2 egész biológiai szempontból értelmes tartatományát, a [0,1]-et. Mivel b OP nem különbözött szignifikánsan a 0-tól, természetesen h 2
re ugyanez igaz, tehát nem találtunk arra nézve semmilyen bizonyítékot, hogy a populációban van genetikai változatosság. H 0 -t elfogadjuk, vagyis azt, hogy a populáció egyedei közötti különbség a fülhossz -ban csak környezeti okokra vezethető vissza, nincsenek genetikai különbségek e jelleg tekintetében. Pontosabb becsléshez csak nagyobb mintából juthatunk. 7.) Mivel mindkét változó normális eloszlású független változó, nem állnak ok-okozat viszonyban a két változó kapcsolatának vizsgálatára a korrelációszámítás a megfelelő. H 0 : ρ = 0 (A minta egy olyan alapsokaságból származik, ahol nincs lineáris korreláció a két változó között. r, a korreláció becsült értéke, csupán a mintavételi hiba, a véletlen ingadozás miatt tér el 0 -tól.) A Graphpad Instat program segítségével a korreláció-számítás és a hipotézisvizsgálat: r = 0,9931, 95%-os konf. int. : [0,9854, 0,9967] P<0,0001 A becsült r extrém szignifikánsan eltér a 0-tól, ez azt jelenti, hogy H 0 fennállása esetén a mintavételi hiba kevesebb mint az esetek tízezred részében okozná, hogy a mintából becsült r ennyire vagy ennél jobban eltérjen a 0-tól. Az, hogy a konf. int. alsó határa messze van a 0-tól, szintén azt mutatja r nem csak a véletlen miatt tér el a 0-tól. Tehát r nagyon szignifikánsan eltér a 0-tól (ilyen nagy eltérést csupán a véletlen nagyon ritkán okozna), H 0 -t elvetjük. A két változó között erős pozitív irányú lineáris korrelációt találtunk. (Ez el is várható kétféle mérési módszer esetén.) 8.) A heritabilitás becslésére kiszámítjuk az utódok átlagának regresszióját az egyik szülőn majd szorozzuk 2-vel. b = 0,2478; 95% os konf int: [-0,4059, 0,9015] a meredekség a = 1,659; 95% os konf int: [0,1405, 3,178] a tengelymetszet Az regresszió ANOVÁ-ja szerint: P = 0,3520; ez azt jelenti, hogy H 0 fennállása esetén a mintavételi hiba gyakran, kb. esetek 35%-ban okozná a mintából becsült b ekkora vagy nagyobb eltérését a 0-tól. A függő változó (utódok átlaga) varianciájának jelentéktelen része adódik csak a regresszióból. Tehát az egyenes meredeksége nem tér el 0-tól szignifikánsan, (a szóráshoz képest ilyen kicsi eltérést csupán a véletlen is gyakran okoz) H 0 -t megtartjuk, a két változó között nem találtunk lineáris kapcsolatra utaló evidenciát. (Nem állíthatjuk, hogy biztosan nincs lineáris kapcsolat, csak azt, hogy az adott mintából becsült statisztikák nincsenek
ellentmondásban H 0 -lal, nem szolgálnak bizonyítékul arra, hogy van lineáris kapcsolat.) Az hogy a b-re vonatkozó konf. int. magában foglalja a 0-t, ugyanezt jelenti. A heritabilitásra kapott becslés: h 2 = 2 b OP = 0,5, de ez egy nagyon bizonytalan (pontatlan) becslés, a konf. int. [-0,8, 1,8] magában foglalja h 2 egész biológiai szempontból értelmes tartatományát, a [0,1]-et. Mivel b OP nem különbözött szignifikánsan a 0-tól, természetesen h 2 re ugyanez igaz, tehát nem találtunk arra nézve semmilyen bizonyítékot, hogy a populációban van genetikai változatosság. H 0 -t elfogadjuk, vagyis azt, hogy a populáció egyedei közötti különbség a bábsúlyban csak környezeti okokra vezethető vissza, nincsenek genetikai különbségek e jelleg tekintetében. Pontosabb becsléshez csak nagyobb mintából juthatunk. 9.) Mivel mindkét változó normális eloszlású független változó, nem állnak ok-okozat viszonyban a két változó kapcsolatának vizsgálatára a korrelációszámítás a megfelelő. (Megj: az ikerpár 2 tagja megkülönböztethetetlen, nem egyértelmű melyiküket írjuk a bal- ill. jobboldali oszlopba, ezért a feladat nem teljesen analóg a szokásos korrelációszámítással, mert nincs két világosan megkülönböztethető változónk. De ez nem baj, az ikerpárok teljesítményének asszociáltságát, átlagtól való eltérésének egyirányúságát jól méri a korreláció.) H 0 : ρ = 0 (A minta egy olyan alapsokaságból származik, ahol nincs lineáris korreláció a két változó között. r, a korreláció becsült értéke, csupán a mintavételi hiba, a véletlen ingadozás miatt tér el 0 -tól.) A Graphpad Instat program segítségével a korreláció-számítás és a hipotézisvizsgálat: A kétpetéjűekre: r = 0,8067, 95%-os konf. int. : [0,3596, 0,9525] P = 0,0048 Az egypetéjűekre: r = 0,9467, 95%-os konf. int. : [0,7849, 0,9876] P < 0,0001 Mindkét esetben a becsült r nagyon szignifikánsan eltér a 0-tól, ez azt jelenti, hogy H 0 fennállása esetén a mintavételi hiba kevesebb mint az esetek fél százalékában ill. tízezred részében okozná, hogy a mintából becsült r ennyire vagy ennél jobban eltérjen a 0-tól. Az, hogy a konf. int. alsó határa messze van a 0-tól, szintén azt mutatja r nem csak a véletlen miatt tér el a 0-tól. Mindkét esetben r nagyon szignifikánsan eltér a 0-tól (ilyen nagy eltérést csupán a véletlen nagyon ritkán okozna), H 0 -t elvetjük. A két változó között erős pozitív irányú lineáris korrelációt találtunk. Az egypetéjűek közötti erősebb korreláció azt mutatja, hogy a közös környezeten (neveltetésen) kívül öröklött tényezők is befolyásolják az IQ-t.