Bevezetés a hpotézs vzsgálatba Lásd előadás ayagát. Kétoldal és egyoldal hpotézsek Hpotézsvzsgálatok Ebbe a ejezetbe egyajta határozókulcsot szereték ad a hpotézsvzsgálatba haszált próbákhoz. Először dötsük el, hogy mt szereték tesztel, majd keressük meg azt a részt és egyekét válaszolva a kérdésekre jussuk el a haszáladó próbához. A próbák részletes leírása a következő ejezetbe va. Érdemes elolvas a példákat, melyekből újabb ötleteket kaphattok, hogy mre s haszálható egy-egy próba. II. Az eloszlásra voatkozó próbák II. Eloszlás egyezése adott elmélet eloszlással - lleszkedésvzsgálat II. Két eloszlás egyezése, homogetás vzsgálat II.3 Függetleségvzsgálat Illeszkedésvzsgálatok χ próba Kolmogorov-Smrov próba Log-valószíűség próba Homogetás vzsgálat χ próba Függetleségvzsgálat χ próba Próbák leírása Illeszkedésvzsgálat χ próbával Ige gyakor adatelemzés probléma, hogy egy adott populácóból való mták alapjá eldötsük, hogy az adott populácó valamlye elmélet eloszlású-e. Az lleszkedésvzsgálatál a ullhpotézsük az, hogy a meggyelt populácó eloszlása az elméletleg várt eloszlással egyezk. A χ próba omáls skálájú valószíűség változó eseté alkalmazható, lehetőleg ge agyszámú meggyelés eseté. A próbához először meg kell ad az elmélet eloszlást, amhez a meggyelt eloszlás lleszkedését vszoyítjuk. Legye A ( =.. k) teljes eseméyredszer, és legye P(A ) = p. Végezzük meggyelést, ambe A eseméy -szer következk be. Másképpe egy meggyelt eloszlás mde eleméhez redeljük egy elmélet eloszlás F elemét.
A próbastatsztkák legye a következő: ( p ) ( F ) χ = = p F A próbastatsztka χ eloszlású k- szabadság okkal. A χ próbát csak akkor végezhetjük lleszkedésvzsgálatra, ha egyetle elmélet gyakorság sem ksebb egyél, és az elméletleg várt gyakorságok maxmum 0%-a ksebb 5-él. Yates olytoosság korrekcó: A számolt próbastatsztka csak becslése az elmélet χ eloszlásak. A becslés agyo jó, kvéve azo esetekbe, amkor k = (tehát d = ). Ekkor a Yates által ajálott korrekcóval érdemes él, azaz mde F - külöbséget 0.5-el csökketjük. A próbastatsztkák így: χ = ( F 0. ) 5 F Kolmogorov-Smrov egymtás próba lleszkedés vzsgálatra Ez a próba kmodotta jól haszálható ordáls, tervallum vagy aráy jellegű meységek eseté lleszkedésvzsgálatra. Továbbá előyösebb az alkalmazása a χ próbáál, ha a meggyelések száma alacsoy és/vagy az elméletleg várható értékek alacsoyak. A próbához először meg kell ad az elmélet eloszlást, amhez a meggyelt eloszlás lleszkedését vszoyítjuk. Legye A ( =.. k) teljes eseméyredszer, és legye P(A ) = p. Végezzük meggyelést, ambe A eseméy -szer következk be. Másképpe egy meggyelt eloszlás mde eleméhez redeljük egy elmélet eloszlás F elemét. Ezt követőe számoljuk k a kummulált meggyelt és elmélet gyakorságokat (léyegébe az eloszlásüggvéyt számoljuk k). Vegyük mde kummulált meggyelt és elmélet gyakorság külöbségéek abszolút értékét (d ). A próbastatsztkák értéke mdeze d közül a legagyobb osztva -el. max kum D = kum F max d = Függetleségvzsgálat χ próbával, kotgeca táblák Egyszerűség kedvéért vzsgáljuk most kétdmezós problémákat, azaz olyaokat, melyekbe két változó üggetleségét kell tesztelük (a próba természetese több dmezós elemzésél s hasolóa elvégezhető). Alkossuk egy olya táblázatot, amek soraak száma (r) megegyezk az első változó értékeek számával, az oszlopok száma pedg a másk változó értékeek számával (c). A mátrx j elemébe azo meggyelések száma kerül, amelyekre gaz az első változó -k értéke és a másodk változó j-k értéke. Alkossuk meg mde sorra az adott sorba levő meggyelések számáak összegét (R ), lletve egy-egy oszlopba található meggyelések értékét (C j ). R C Ameybe a két változó üggetle egymástól úgy elméletleg az Fj = (ahol az összes meggyelések száma) értékek kerüléek a kotgeca táblába. A két eloszlás egyezése - és így a üggetleség - χ próbával tesztelhető d = (r-) (c-) szabadság ok mellett. χ ( F ) = j F j j
-es kotgeca táblákra a következő egyszerűsítő képleteket alkalmazhatjuk: ( ) χ =, a szabadság ok (d) egy (). Ez esetbe a Yates éle olytoosság korrekcót R C R C alkalmazhatjuk: χ = ( / ) R C R C Példák. Növéygeetkusok elvégeztek egy keresztezést, amt követőe 3: aráyba várak sárga és zöld vrágú övéyeket. Elvégezve a kísérletet 00 övéyt vzsgálak. A 00 övéyből 84 sárga, 6 zöld vrágú volt. Igaz-e, hogy 3:-es hasadást kaptuk? A kérdést χ próba segítségével döthetjük el, hsz vsszavezethető lleszkedést vzsgáltra. Nullhpotézsük (H 0 ) az, hogy az adatok olya keresztezésből eredek, melyekbe a sárga - zöld vrágú övéyek aráya 3:- hez. Ellehpotézsük (H ) természetese az, hogy a hasadás aráy em 3:-hez. A tapasztalat eloszlás mellé el kell íruk az elmélet eloszlást s. Elvleg 00 övéyből 75 sárgát és 5 zöldet váruk. Másképpe p(zöld) = 0.5; p(sárga) = 0.75; = 00, tehát F sárga = p(sárga) = 75, és F zöld = p(zöld) = 5 Sárga Zöld meggyelt gyakorság ( ) 84 6 00 elmélet gyakorság (F ) (75) (5) ( F ) (84 75) (6 5) A próbastatsztkák: χ = = = 4.30 F 75 5 A χ eloszláshoz még hozzá tartozk a szabadság ok megállapítása, am esetükbe a kategórák (k=) száma míusz egy, tehát d =. 95%-os szgkacaszte a χ α=0.05; d==3.84, így a ullhpotézs elvetése mellett dötük.. Vzsgáljuk meg az egyk klasszkus Medel- kísérletet kmeetelét! Sárga és sma babszemű, heterozgóta (F emzedék) övéyeket utóda között a következő eotípus eloszlást tapasztaltuk: 5 sárga és sma, 39 sárga és rácos, 53 zöld és sma és 6 zöld és rácos. Klasszkus Medel- öröklődést eltételezve 9:3:3: aráyba kell kapuk a eotípusokat. Teszteljük azt a hpotézst, hogy a mta egy olya populácóból ered, ahol a eotípusok aráya 9:3:3:. Sárga, Sárga, Zöld, Zöld, sma rácos sma rácos meggyelt gyakorság 5 39 53 6 50 ( ) elmélet gyakorság (F ) (40.65) (46.65) (46.65) (5.65) A próbastatsztkák: ( F ) (5 40.65) (39 46.65) (53 46.65) (6 5.65) χ = = = F 40.65 46.66 46.66 5.66 = 0.90.33 0.800 5.99 = 8.97
A χ eloszláshoz még hozzá tartozk a szabadság ok megállapítása, am esetükbe a kategórák (k=4) száma míusz egy, tehát d = 3. 95%-os szgkacaszte a χ α=0.05; d=3=7.8, így a ullhpotézs elvetése mellett dötük. Tehát a hasadás em 9:3:3: Ameybe a ullhpotézst elogadtuk vola, úgy em vzsgálódtuk vola tovább, így azoba tovább aggatjuk adatakat. Nem tudjuk, hogy az eltérésért valamely eotípus gyakorsága okolható, vagy az hasadás markása eltér a várttól. Láthatjuk a próbastatsztka értékéhez a legagyobb hozzájárulást a egyedk tag (a mdkét gére homozgóta receszív zöld, rácos eotípus) adja. Feltehető tehát, hogy eek a eotípusak a gyakorsága tér el ayra a várttól, hogy az eredet ullhpotézst el kellet vetük. Hagyjuk el hát az adatokból ezeket az értékeket és vzsgáljuk, hogy a maradék eotípusok 9:3:3 aráyba hasadak-e? Sárga, Sárga, Zöld, sma rácos sma meggyelt gyakorság ( ) 5 39 53 44 elmélet gyakorság (F ) (46.4) (48.8) (48.8) A próbastatsztkák: ( F ) (5 46.4) (39 48.8) (53 48.8) χ = = = 0.4.968 0.36 =.543 F 46.4 48.8 48.8 A haszáladó χ eloszlás szabadság oka. 95%-os szgkacaszte a χ α=0.05; d==5.99, így a ullhpotézst elogadjuk. Tehát a hasadás 9:3:3, azaz a klógó érték téyleg a zöld rácos gyakorsága volt (ameybe tesztelék, hogy az első három eotípus kombált száma és az utolsóé 5:-hez hasad-e, úgy ezt a ullhpotézst el kée vetük. Ez megerősít azt az elképzelést, hogy az utolsó tag matt vetettük el az eredet ullhpotézst). A statsztka eyt tud moda ekük a tapasztalt eloszlással kapcsolatba, aak kderítése, hogy mért lett egy eotípusból kevesebb, mt vártuk a bológus eladata. Godolhatjuk például, hogy a homozgóta recesszív géek emcsak a mag alakra/szíre gyakorolak hatást, de a túlélőképessége s, és az lye övéyekek ksebb a rátermettsége. Esetleg valamely parazta / predátor jobba kedvel ezt a eotípust így a mtavételkor gyakorsága már ksebb, mt a többé. 3. Egy kísérletbe bogarakat helyeztük egy éygradesbe (-5, ahol a legéyesebb és 5 a legkevésbé megvlágított rész). Hagytuk őket, hogy válasszák k a számukra megelelő éy teztású helyet, ezt követőe leszámoltuk, hogy háya tartózkodak az egyes megvlágítás osztályokhoz tartozó helye. Nullhpotézsük legye, hogy a bogarak egyeletese oszlaak meg az öt éyteztás osztály között. Féyteztás osztályok 3 4 5 0 7 6 38 4 65 F 3 3 3 3 3 kum 0 7 3 5 65 kum F 3 6 39 5 65 d 3 9 6 0 max d 6 D = = = 0.40000 65 95%-os szgkacaszte a D =65 = 0.66, így a ullhpotézst elvetjük.
4. Egy oltóayag hatásosságát vzsgálták egereke. Feljegyezték, hogy mely állatok kaptak az oltásból. Továbbá eljegyezték, hogy háy állat élt tovább, és mey halt meg. Oltást kapott 49 egér, ebből 5 halt meg. Nem kapott oltást 3 egér, ebből 5 egér halt meg. Szerkesszük meg a kotgeca táblát! j túlélt? ge em oltást kapott? ge 5 44 49 (R ) em 5 7 3 (R ) 0 (C ) 6 (C ) 8 () R C Ezt követőe meg kell szerkeszteük a üggetleség eseté eálló elmélet eloszlást a Fj = képlet alapjá: F j túlélt? ge em oltást kapott? ge 0.6 38.4 49 (R ) em 9.4.6 3 (R ) 0 (C ) 6 (C ) 8 () Vegyük észre, hogy a margálsokba (a sor és oszlopösszegek) levő értékek a két táblázatba azoosak. Elmélet eloszlásuk jóságáak legalapvetőbb tesztelése, hogy megézzük, hogy a margálsok ugya azoke, mt a tapasztalat kotgeca táblázatba. A két eloszlás azoosságáak megállapítására χ próbát alkalmazuk. A próbastatsztkák értéke χ = 0.046. A haszáladó χ eloszlás szabadság oka. 95%-os szgkacaszte a χ α=0.05; d==3.84, így a ullhpotézst elogadjuk. Tehát a oltóayagak cs hatása. Feladatok. Egy bokrokba észkelő madár észkéek elhelyezkedését eljegyezték az égtájak szert: Égtáj Észak É-K Kelet D-K Dél D-Ny Nyugat É-Ny Fészkek 65 73 67 5 47 45 45 48 (a) Teszted azt a ullhpotézst, hogy cs égtáj szert preereca a észek elhelyezésébe! (b) Ha a ullhpotézs el kell vet, próbáld meg megmoda, hogy melyk ráy a ktütetett! Állításodat statsztkával gazold!. Táplálékpreerecát vzsgáltak egy emlősajál. A 6 állatot helyeztek egyekét egy ugyaolya térbe, ambe a hatéle táplálékból azoos meység volt található. A táplálékok a bejárattól azoos távolságra voltak. Feljegyezték, hogy mely állat melyk táplálékból ogyasztott először. Táplálék 3 4 5 6 Állatok 3 6 3 4 8 4 (a) Teszted azt a ullhpotézst, hogy cs táplálékpreerecája az adott ajak a hat táplálék tektetébe! (b) Ha a ullhpotézs el kell vet, próbáld meg megmoda, hogy melyk táplálékot választja preerecálsa a aj!
3. Egy tél álmot alvó deevérpopulácóba 44 hím és 54 őstéy egyed va. Teszteld a ullhpotézst, hogy a kolóába egyelő számú hím és ő található! 4. A geetka elmélet szert egy bzoyos keresztezést követőe a kék száryú és pros száryú legyek aráya :3-hoz kell, hogy legye. Egy kokrét kísérletbe 76 pros- és kékszáryú legyet kaptak. Szgkása modható, hogy az elmélet rossz? 5. Tél álmot alvó deevérekél vzsgálták a emek aráyát 4 helye. Végezze el a heterogetás vzsgálatot és, ha lehetséges az összesített adatok alapjá tesztelje az : aráyra voatkozó ullhpotézst! Hely Hím Nőstéy 44 54 3 40 3 8 4 5 6 6. A 4. példába smertetett kísérletet ötször megsmételték: Kísérlet Pros száryú Kék száryú 76 36 0 3 4 5 4 44 6 5 6 8 Teszteld, hogy a külöböző kísérletek eredméye összevohatóak-e! Ha ge, akkor az összesített adatokra végezd el a 3: aráyra voatkozó ullhpotézst. 7. Egy ízeltlábú előordulását vzsgálták a víztől való távolság üggvéyébe: Távolság (m) 0- - -4 4-6 6-0 Ízeltlábú / m 3 5 7 0 7 Vzsgáld Kolmogorov-Smrov próbával, hogy az ízeltlábúak egyeletese oszlaak el a víztől való távolságtól üggetleül. 8. Egy bzoyos madáraj abudacáját vzsgálták az év külöböző dőszakába. Vzsgáljuk meg, hogy gaz-e az, hogy mde évszakba a emaráy azoos! Nem Tavasz Nyár Ősz Tél Hím 63 35 7 43 Nőstéy 86 77 40 38 9. Két borz populácóba vzsgálták a veszettség meglétét. Az első élőhelye 43 egyedből 4 volt ertőzött, a másk élőhelye 50 egyedből volt ertőzött. Igaz-e, hogy a ertőzés előordulása mdkét helye azoos? 0. 36 ő szedett egy bzoyos gyógyszert terhessége alatt, belőlük 4 tapasztalt abormáls vérzést a szülést követőe. A kotrollcsoportba levő 340 ő (ők em szedték a gyógyszert) közül 6 tapasztalt
abormáls vérzést a szülést követőe. Tesztelje azt a ullhpotézst, hogy a gyógyszer szedése és az abormáls vérzés üggetle egymástól.