Változók függőség vszoyaak vzsgálata Ismétlés: változók, mérés skálák típusa kategoráls változók Asszocácós kapcsolat számszerű változók Korrelácós kapcsolat testsúly (kg) szemüveges em ő 1 3 férf 5 3 KAD 11.11.8 testmagasság (cm) jeles (5) jó (4) közepes (3) elégséges () elégtele (1) A számszerű változó skálatípusa (vsszatérés, hátrálás; vsszafordulás) Regresszó és korrelácó (vszoy, összefüggés, kölcsöösség) kvoás értelmezett, cs pot aptár apok dszkrét tervallumskála hőmérséklet C-ba folytoos Gyakorlat megközelítés (pl.1) mey fehérje va a vérplazmába? (db, mol, g, ) mekkora a vérplazma fehérjekocetrácója? (db/l, mol/l, g/l) Nephross (súlyos vesebetegség) eseté értéke erőse lecsökke m 1 db HSA molekula háyados értelmezett, va pot fogak száma aráyskála hőmérséklet K-ba 3 drekt módszer: megszámol egy adott térfogatba levő fehérje molekulák számát(?) közvetett módszer: keres egy olya (köye) mérhető fzka meységet, amely szgorúa mooto kapcsolatba va a megsmer kívát meységgel (legegyszerűbb lye függvéy...) 4
plazma törésmutató észrevétel: a vérplazmába a féy lassabba halad, ha sok bee a fehérje (magas a fehérjekocetrácó), azaz agyobb a törésmutatója (determsztkus kapcsolat, de: mérés hba mdg va) baktérumok szaporodása a változások determsztkus és sztochasztkus része mdg együtt fordul elő plazma fehérje kocetrácó (g/l) 5 (pl.) testsúly (kg) E csoport (1994.9) tagjaak adata (összetartozó értékpárok) testmagasság (cm) mlye tedecát látuk? cm kg 16 163 53 164 168 57 169 1 66 171 59 173 58 1 57 178 181 69 183 63 184 6 19 7 eze előadásfél hosszú címe: Ugyaabba a csoportba felvett többféle kvattatív változó között kapcsolat elemzése. Korrelácó, leárs regresszó, a korrelácós koeffces fogalma 6 A korrelácószámítás két véletle számszerű változó szmmetrkus kapcsolatával foglalkozk akkor beszélük korrelácós kapcsolatról az és y véletle változók között, ha vagy ks értékekhez ks y értékek, agy értékekhez agy y értékek (poztív kapcsolat), vagy pedg ks értékekhez agy y értékek és agy értékekhez ks y értékek (egatív kapcsolat) tartozak y tt: poztív korrelácó 7 Regresszós megközelítés y függvéykapcsolatot keresük egy (vagy több) függetle változó () és egy függő változó (y) között feltételezések: és y számszerűek és folytoosak, y valószíűség változó (értékét em csak a magyarázó változók, haem a véletle s befolyásolja) A regresszós modell rögzít a függvéy típusát: leárs y (a + b) + h polomáls y a + b 1 + b +... + b + h epoecáls y ab h hatváyfüggvéyes y a b h és azt, hogy hogya hat a véletle a függő változóra: Leárs és polomáls esetbe a függetle változók értékétől függetle, addtív (+ h) hbával, epoecáls és hatváy esetbe multplkatív (. h) hbával. (a: meredekség, b: tegelymetszet) 8
A legegyszerűbb regresszós modell a leárs regresszó leárs függvéy: y (a + b) + h h y -(a + b) y y (, y ) Ha a pot (, y ) az egyees fölött va. (Hogya írható fel, ha alatta va?) a + b Legjobb egyees: hbák égyzetösszege a lehető legksebb (legksebb égyzetek módszere) 9 y 1 16 163 53 3 164 4 168 57 5 169 6 1 66 7 171 59 8 173 58 9 1 57 1 178 11 181 69 1 183 63 13 184 6 14 19 7 1. és y között leárs a kapcsolat. Az alkalmazhatóság feltétele. A mtá belül megfgyelés potok egymástól függetleek. 3. Mde rögzített értékre az y értékek eloszlása ormáls. 4. Az y értékek eloszlása mde értékre ugyaazzal a varacával redelkezk. 5. Az értékeket hba élkül lehet mér. 1 http://www.fao.org/docrep/w5449e/w5449e4.htm a (égyzetes) hbafüggvéy: Q (...) h [ y ( a + b) ] 1 m(k) a függetle változó(k)? a és b mlye a függvéykapcsolat a-ra és b-re ézve? Q h ( a, b) [ y ( a + b) ] m. 1 mdegyk változóba égyzetes a kapcsolat mlye függvéyel ábrázolhatók? külöböző tágasságú parabolákkal mmummal vagy mamummal redelkezek? grafkojuk mmummal redelkező parabola 11 Gyak. jegyzet a fej. 14. ábra 1
A mérés potokra legjobba lleszkedő egyees (y a + b) keresése Gyak. jegyzet a fej. 13. ábra a: meredekség b: tegelymetszet 13 [ y ( a + b) ] Q ( a, b hbafüggvéy mmalzása h ) 1 megoldás lehetőségek: Leárs regresszó 1. teljes égyzetté kegészítés pl. y -6+14 (-3) +5, mmum 3-ál. dfferecálszámítás dfferecálháyados: az értő ráytagese szélsőérték keresés: ahol a görbéek mmuma (vagy mamuma) va, ott az értő ráytagese zérus a szert és b szert dfferecálháyadosok zérusok, egyelet, smeretle ( smeretlees leárs egyeletredszer) 14 a legjobb meredekség: a Q y 1 Q ( )( y y ) ( ) 1 vagy (y a + b) a s y s Példa: refraktometra (smeretle kocetrácó meghatározása kalbrácós egyees segítségével) a legjobb tegelymetszet: b 1 1 y a y a ahol s y Qy : 1 kovaraca 15 16
Mlye a potok lleszkedése a regresszós egyeeshez? ehhez a korrelácószámítás yújt segítséget (két véletle változó szmmetrkus kapcsolatával foglalkozk) Példák korrelácós együtthatókra a változók között kapcsolat erősségét vzsgálja (va erős és gyege korrelácó) korrelácós együttható Qy sy r (Pearso-féle) Q Q s s a számláló megegyezk a regresszós egyees meredekségéek számlálójával (a evező mdkét esetbe poztív) a Q Q y poztív meredekség: r > (poztív korrelácó) egatív meredekség: r < (egatív korrelácó) 1 r 1 r 1 meghatározottság együttható yy y (meyre lehet az egykből a máskat előre jelez) 17 18 http://e.wkpeda.org/wk/image:correlato_eamples.pg Etrém példa: r.816, y 3 +.5 (Ascombe) A korrelácó jeleléte em (feltétleül) jelet okság kapcsolatot 19 198 dő, mt rejtett változó 19 kwfogyasztás, USA http://e.wkpeda.org/wk/ascombe%7s_quartet 19
Példa: Hatváyfüggvéyes regresszó vsszavezetése leárs regresszóra. Rötgecső sugárteljesítméyéek mérése P ~ I m, logp ~ mlogi P ~ U, logp ~ logu 1 Korrelácós t-próba cm kg E 16 53.93 1994.9 163 53 54.49 164.5 168 57 57.8 169 57.84 1 66 58.39 171 59 58.95 173 58.7 1 57 61.19 178 6.86 181 69 64.54 183 63. 184 6 66.1 19 7 69.56 a.8-36.96 b 13 19.66358 r.819.67 3.4997 14 4.36 1 t 4.935 97.1 146.3537 t 4.935 > t krt(,5) m (kg) 1, Va-e kapcsolat a két meység között? t - r 1 r.18 H : cs kapcsolat H hams (p<.5) h (cm) Asszocácós kapcsolat. Kh-égyzet teszt (1) Példa 1 em Határozzuk meg potosabba! szemüveges összese ő 8 13 Kapcsolatvzsgálat kategorkus változók között. Kh-égyzet teszt gyakorság táblázat (kotgeca táblázat): két változó közös gyakorságáak táblázatos ábrázolása X (pl. em) és Y (szemüvegesség) 48 49 97 76 14? em ő a8 b 13 férf szemüveges összese férf c48 d49 97 76 14 kérdés: külöbözk-e egy rögzített tulajdoság gyakorsága a két csoportba? 4
H : em és szemüvegesség egymástól függetleek (cs külöbség a csoportokba) mekkora lee a várt gyakorság (epected frequecy) a bal felső (a) cellába, ha a ullhpotézs gaz? a ők száma: a + b 13 a szemüveges személyek száma: a + c 76 A ullhpotézs felállítása a ők aráya a mtába: p(ő) (a + b)/ 13/ a szemüvegesek aráya a mtába : p(szemüveges) (a + c)/ 76/ a c, vagy b d a c em b d ő a8 b 13 szemüveges összese férf c48 d49 97 76 14 a megfgyelt (observed) gyakorságok táblázata 5 Várt gyakorságok. feltevés: H gaz a em és a szemüvegesség függetle tulajdoságok várt gyakorság a várt gyakorság a a + b a + c a + b b + d jobb felső cellába : c + d a + c c + d b + d jobb alsó cellába : várt gyakorság a bal felső cellába : várt gyakorság a bal alsó cellába : em ös a8 b 13 f c48 d49 97 76 14 megfgyelt (observed) kotgeca táblázat ( a + b) ( a + c) ( a + b) ( b + d ) ( c + d ) ( a + c) ( c + d ) ( b + d ) em ös 13*76/ 13*14/ 13 f 97*76/ 97*14/ 97 76 14 várt (epected) kotgeca táblázat 6 A várt gyakorságok a megfgyelt gyakorságokból em ös a8 b 13 f c48 d49 97 76 14 megfgyelt (observed) kotgeca táblázat ( várt gyakorság) em ös 13*76/ 13*14/ 13 f 97*76/ 97*14/ 97 76 14 várt (epected) kotgeca táblázat ( oszlopösszeg) ( sorösszeg) ( a mta elemszáma) 7 Ha a ullhpotézs gaz: A megfgyelt és a várt gyakorságokat tartalmazó kotgeca táblázatok megfelelő cellába levő értékek agyjából egyformák. A következő próbastatsztka (súlyozott égyzetes közép) kh-égyzet eloszlású: ( O E ), E ahol O a megfgyelt (observed) E a(z el)várt gyarságok az -dk cellába. Szabadság fok: (sorok száma 1)*(oszlopok száma 1) pl. * (égymezős-) táblázat: 1 Próbastatsztka 8
A teszt végrehajthatóságáak feltétele (a mta elemszáma) elegedőe agy: a várt gyakorságokat tartalmazó kotgeca táblázatba mde cellatartalomak 1-él agyobbak kell le a várt gyakorságokat tartalmazó kotgeca táblázatba azokak a cellákak a száma, amelyekbe a cellatartalom 1 és 5 között csak a cellák %-a lehet Specáls eset: égymezős táblázat (gyakorlat jegyzet.b.9) a vzsgált tulajdoság összese megva cs meg A csoport a b a+b B csoport c d c+d összese a+c b+d M ( ad bc) ( a + b)( c + d )( a + c)( b + d ) (pl. égymeztős táblázat: mde cellába a cellatartalomak 5-él agyobbak kell le) 9 a végrehajthatóság felétele: a két legksebb részösszeg szorzata legye agyobb, mt 5 3.5.4.3..5.4 f 1 1 f f. 1 Kh-égyzet eloszlások.3.. f 3 1 f 4 f. 3.. f 5 1 f 6 f. 5 f.: 1 f 1 ( ) f 1 (5%) f 3 1 % 95 % az eredet eloszlás 3.84-él levágott eloszlás az eredet eloszlás kmaradó terület: 5 %.3. f. 1 módusz, ha f.1 vagy f. 4 1 1 31 módusz (f.-), ha f. > f. 6 f.: 3 (5%) ( ) f 3 1 % 95 % 7.81-él levágott eloszlás kmaradó terület: 5 % 3
Példa 1 A teszt alkalmazhatóságáak feltétele: a két legksebb részösszeg szorzata legye agyobb, mt 5 em ő a8 b 13 szemüveges összese férf c48 d49 97 76 14 (8 49 48 ) 76 14 13 97 M 1.54 > krt 3,84 H hams 76*97 737 > 5* 1 a kh-égyzet teszt haszálható 1.54 va kapcsolat a em és a szemüvegesség (szemüvegvselés hajladóság!) között 33 34 (8 49 48 ) 76 14 13 97 M 1.54 1.54 > krt 3.84 H hams 1.54 > krt 6.63 H hams elvetjük a ullhpotézst, szgfkaca szt: <.1 35 számolás Ecel-lel agol magyar SUM SZUM CHITEST KHI.PRÓBA CHIDIST KHI.ELOSZLÁS CHIINV INVERZ.KHI 36
példa em ő 1 3 4 férf 5 3 8 6 6 1? 4*6 4 < 5*1 a kh-égyzet teszt em haszálható (helyette: Fsher egzakt teszt) em ös ő 1 3 4 férf 5 3 8 6 6 1 em 1 3 sz 5 3 sz em.33 1.67 sejtésük va, de em tudjuk gazol a mta elemszámáak övelése 1 ők férfak em ös ő 8 13 férf 48 49 97 em 76 14 8 sz em 48 49 sz.37.98 övelésével (1 ): a sejtés gazolható lesz 38 Példa 3 (bofzka jegyzet 1. példa). Nem artérás típusú schaemás optcus europatha skeres műtét korrekcójáról jelet meg 1989-be egy közleméy. Mthogy e betegségbe korábba semmféle hatásos kezelés módszer em volt smert, ezt a műtétet sok helye alkalmaz kezdték. Rövdese eredméytele beavatkozásokról s megjeletek beszámolók, ezért számbavették 5 klka cetrum 44 lye betegét, akk közül 119 fő elvégezték a műtétet, 15 betege em. A felmérés eredméye: megfgyelt gyakorságok várt gyakorságok műtött em m. ös műtött em m. ös javult 39 53 9 javult 45 47 9 változatla 5 56 18 változatla 53 18 romlott 8 16 44 romlott 1 3 44 összes 119 15 44 összes 119 15 44 kh (39 44.87) /44.87+(53 47.13) /47.13 +(5 5.67) /5.67+(56.33) /.33 +(8 1.46) /1.46+(16.54) /.54 5.47 Mvel 5.47 < 5.991 krt, f., ezért em vethetjük el a ullhpotézst. Azaz a mták alapjá cs okuk feltételez külöbséget a két módszer (műtét ll. em műtét) hatásossága között. 39 egydmezós kotgeca táblázatokkal kapcsolatos kérdés: a megfgyelt értékek lleszkedek-e egy feltételezett eloszláshoz? Illeszkedésvzsgálat. Kh-égyzet teszt () tszta lleszkedésvzsgálat (a gyakorságokat smert valószíűségekből kapott gyakorságokkal hasolítjuk össze) egyeletes eloszlásra törtéő.v. kockafeldobás eredméye 1 3 4 5 6 1 14 14 19 16 16 egyéb smert paraméterű eloszlásra törtéő.v. becsléses lleszkedésvzsgálat (az eloszlás típusa alapjá a megfgyelt gyakorságokból becsüljük az eloszlás paraméteret) öszszes ormaltásvzsgálat egyéb becsült paraméteres.v. 4
Egyeletes eloszlásra törtéő lleszkedésvzsgálat A megfgyelt gyakorságokat tartalmazó kotgeca táblázatot (bekeretezett rész, O) kbővítjük a várt gyakorságokat tartalmazó segéd-kotgeca táblázattal (E). Feltételezzük, hogy a kocka em ckelt (H ), ezért a 6 lehetséges eseméy egyforma gyakorságú: 1/6 16.7 a kockafeldobás eredméye 1 3 4 5 6 ös O 1 14 14 19 16 16 1 E 16.7 16.7 16.7 16.7 16.7 16.7 1 kh (1 16.7) /16.7 +(14 16.7) /16.7 + (14 16.7) /16.7+ +(19 16.7) /16.7 + (16 16.7) /16.7 +(16 16.7) /16.7.36 < 11.7 krt, f.5, a ullhpotézst megtartjuk. A kocka em ckelt. 41 Normaltásvzsgálat dszkrét számszerű változó eseté (ha em dszkrét, akkor azzá tesszük) béka vörösvérsejtek hosszabbk átmérője (4 mérés adat) 16 17 18 19 1 3 4 5 6 7 8 9 3 31 3 33 34 35 ös O 4 1 9 6 7 37 4 46 53 45 39 35 17 18 1 7 3 1 1 4 ullhpotézs: a mta ormáls eloszlású populácóból származk az eloszlás elmélet értéket a tapasztalat értékekkel becsüljük μ becslése a számta közép, avg 4.76 μm σ becslése az adatok tapasztalat szórása s 3. μm görbe alatt terület (1 ll. ): a sűrűségfv-t meg kell szoroz 4-el 16 17 18 19 1 3 4 5 6 7 8 9 3 31 3 33 34 35 ös E.78 5.17 8.91 14.3 1. 9.1 37. 44.1 48.5 49.4 46.8 41 33.4 5. 17.7 11.5 6.93 3.87.1.97 4 szabadság fokok száma : b 1, az osztályok száma, b az eloszlás paramétereek száma (1 1 18). A mamálsa méltáyolható első fajta hbáak vegyük 5 %-ot! 18 szabadság fok eseté ehhez a szgfkaca szthez tartozó a érték: 8.87. kh (4.78) /.78 + (1 5.17) /5.17 +... 1.9. Mvel 1.9 < 8.87, cs okuk a ullhpotézs elvetésére. Táblázatkezelővel: megkapjuk azt a szgfkaca sztet, amely mellett "elvetheték" a ullhpotézst, ez pedg.84 84. %. A béka vörösvérsejtjeek hosszabbk átmérője ormáls eloszlású. 4 megfgyelt gyakorságok becsült eloszlás sűrűségfüggvéy IQ függetleség Függőség vszoyok lehetősége függőség megfgyelt gyakorságok lépcsőssé tett becsült eloszlás ss. fv. megfgyelt és várt függvéyek külöbsége m testmagasság korrelácós sztochasztkus vszoy vegyes íz szíezettség asszocácós determsztkus vszoy kocetrácó kh-égyzet érték szemléletes ábrlázolása (a görbe alatt terület) 43 testmagasság számszerű ordáls omáls számszerű 44