Statisztikai hipotézisvizsgálatok. Milye problémákál haszálatos? A gyakorlatba agyo gyakra szükségük lehet arra, hogy mitákból származó iformációk alapjá hozzuk sokaságra voatkozó dötéseket. Például egy töltőgép megfelelőe va-e beállítva; a cigarettába levő kátráy alatta marad-e az előírt értékekek. Ezekbe az esetekbe azt vizsgáltuk, hogy az adott mita származhat-e egy adott paraméterű sokaságból, illetve, hogy a mita egyik paramétere azoos-e egy elméleti értékkel. A sokaság adott tulajdoságát em mérhetjük le közvetleül, haem csak a sokaságból vett mita alapjá becsülhetjük. A becslés azoba véletle hibákkal terhelt, ezért számszerű eltérés a mitából számított érték (pl. átlag) és az adott érték között em szükségszerűe jeleti azt, hogy a sokaságra jellemző érték is eltér az adott értéktől. Más esetekbe két sokaság valamely paraméterét hasolítjuk össze: két populáció jövedelmi viszoyai azoosak tekithető-e; tovább élek-e a ők, mit a férfiak. Amikor dötést akaruk hozi, feltételezéseket fogalmazuk meg, melyek lehetek igazak vagy hamisak, ezeket hívjuk statisztikai hipotézisekek. Dötésüket a mita alapjá kalkulált érték segítségével tudjuk meghozi. Mivel a mitavételt a véletle befolyásolja, ezek a számolt statisztikai mutatók valószíűségi változók leszek. A statisztikai próbáak evezzük azt az eljárást, amiek a segítségével eldöthetjük, hogy az adott hipotézis elfogadható-e vagy sem. A módszer alkalmazása sorá összehasolítuk két számot: a számított próbastatisztika értékét és egy táblázatbeli (kritikus) értéket. A ullhipotézis a feltételezésük matematikai megfogalmazása. Alakja egyelőség, két érték azoosságát állítja. (Nevét oa kapta, hogy e két érték külöbsége ulla.) Például: a sokaság várható értéke (µ) megegyezik egy előre rögzített értékkel (m 0 ). H 0 : µ m 0. Ezzel szembe álló másik állítás az alteratív hipotézis. Az alteratív hipotézis lehet kétoldali alteratív hipotézis vagy egyoldali alteratív hipotézis. Az előző példáál maradva: Kétoldali alteratív hipotézis: H : µ m 0. Egyoldali alteratív hipotézis: H : µ < m 0 (baloldali) H : µ > m 0 (jobboldali). Megbízhatósági szit (kofidecia szit) (-α) a ullhipotézis elfogadására voatkozó dötés helyességéek valószíűségét fejezi ki, ameyibe a ullhipotézis igaz. A szigifikacia szit (α) a hibás dötés valószíűsége ugyacsak igaz ullhipotézis eseté. Empirikus szigifikacia szit (P érték) aak a valószíűsége, hogy a próbastatisztika a mitából kiszámított értéket veszi fel. Az empirikus szigifikaciával a statisztikai szoftverek alkalmazásáál találkozhatuk. Miél kisebb a P érték, aál agyobb a valószíűsége hogy a H 0 hipotézis hamis. A próbastatisztika értéke a ullhipotézis érvéyességétől, a kritikus érték agysága a megbízhatósági szittől függ. Mivel a mita a véletletől függ, ezért soha em lehetük biztosak abba, hogy a hipotézis igaz vagy sem. A statisztikai dötés sorá kétféle hibát követhetük el. Első fajú hiba (α) eseté a ullhipotézist elutasítjuk, pedig igaz. Az első fajú hiba elkövetéséek valószíűsége a szigifikacia szittel megegyezik. A hiba agysága a szigifikacia szit csökketésével csökkethető. Másodfajú hiba (β) eseté a ullhipotézist elfogadjuk, pedig em igaz. A hiba agysága csökke, ha öveljük a szigifikacia szitet. Ha öveljük a kritikus értéket, akkor az esetek többségébe csökketjük α-t, és egyúttal öveljük β-t. Ha
csökketjük a kritikus értéket, akkor β_ csökke, de α ő. Az α-t általába 5%-ak szokás megadi. Eze hibák együttes csökketése csak a mita elemszám övelésével érhető el. H 0 hipotézis Igaz Hamis Elfogadás Helyes következtetés Másodfajú hiba (β) Elvetés Első fajú hiba (α) Helyes következtetés Elfogadási : az az itervallum ahová ha a próbastatisztika értéke kerül, a ullhipotézist elfogadjuk. Kritikus : az az itervallum ahová ha a próbastatisztika értéke kerül, a ullhipotézist elvetjük. Kritikus érték: az a szám, amivel a próbastatisztika értékét összehasolíthatjuk, és döthetük, hogy az elfogadási vagy a kritikus ba esik. Kritikus és elfogadási egyoldali alteratív hipotézis eseté: kritikus elfogadási kritikus α/ -α α/ Kritikus és elfogadási baloldali alteratív hipotézis eseté: kritikus elfogadási α -α Kritikus és elfogadási jobboldali alteratív hipotézis eseté: elfogadási kritikus -α α A statisztikai próba algoritmusa:
A kérdés megfogalmazása, a próbastatisztika kiválasztása. A ullhipotézis és az alteratív hipotézis felállítása. A szigifikacia szit (α) megválasztása. A próbastatisztika értékéek kiszámítása. A (táblázatbeli) kritikus érték meghatározása. A dötés meghozatala a ullhipotézis elfogadásáról vagy elvetéséről. A következtetések levoása. Paraméteres statisztikai próbák Ha az eloszlás jellege ismert, és a ullhipotézisük az eloszlás valamely paraméterére voatkozik, paraméteres próbáról, ellekező esetbe emparaméteres próbáról beszélük. A paraméteres próbák alkalmazása omiális és ordiális változóko em ajálott. Középértékekre voatkozó próbák (z-próba; t-próba) Egy mitás próbák: A ullhipotézis a következő lehet: származhatott-e a mita egy adott középértékű sokaságból? z-próba (vagy u próba): Akkor haszáljuk, ha a sokaság ormális eloszlású, az alapsokaság szórása ismert vagy tetszőleges eloszlású sokaság, de a mita elemszám kellőe agy. A próbastatisztika kiszámítása: x µ z, ahol x a mita átlaga, µ a sokaság átlaga, a sokaság szórása, a mita elemszáma. Elfogadási : z < z emp krit t-próba: ormális eloszlású sokasá g eseté haszálható, amikor a szórás em ismert valamit a mita elemszám kicsi ( < 30). x µ t, a szabadsági fok száma: -, ahol s x a mita átlaga, µ a sokasági átlag, s a sokaság becsült szórása, a mita elemszáma. Elfogadási : t < t emp krit Példa: Egy kísérletbe egy új gyógyszer testtömegre gyakorolt hatását szereték leelleőrizi. Egereke tesztelik az új vegyületet. A laboratóriumi populációba geerációról geerációra az
egerek adott idős korukra 0 grammosak voltak, tömegük szórása,5 g volt. Feltételezhetjük, hogy az egerek tömege ormális eloszlású µ 0 g átlaggal és,5 g szórással. A vizsgálathoz kiválasztaak egy véletle mitát 0 egeret, és megézik, hogy mekkora lesz az adott korba a tömegük. Azt tapasztalják, hogy a 0 egér átlagosa grammosok lettek. Véletleek vagy a vegyületek köszöhető-e a változás? Felmerül a kérdés, hogy a mitavételezési hibát figyelembe véve a 0 egér tömegéek legalább mekkoráak kell leie ahhoz, hogy az új vegyületet hatásosak lehesse yilváítai. Nullhipotézis: a vegyület em okozott változást. Alteratív hipotézis: a vegyület hatással va a testtömegre. Vagyis: H 0 : µ 0; H : µ 0. Ez egy kétoldali alteratív hipotézis. A hipotézis elfogadásáról vagy elvetéséről egy ismert eloszlású ú. próbastatisztika segítségével dötük. 0 x µ zemp,6,5 0 A dötési szabályuk az, hogy H 0 -t elfogadjuk, ha a z emp kisebb, mit a,5%-hoz tartozó kritikus érték (azaz,96), elutasítjuk, ha z emp meghaladja ezt az értéket. Ez 5%-os szigifikacia szitet jelet, hisze kétoldali alteratív hipotézisük va, hisze,5% esélyt aduk aak, hogy helyteleül dötsük a pozitív effektusról, és,5%-ot aak, hogy helyteleül dötsük a egatív effektusról. Esetükbe z emp < z krit, tehát elfogadhatjuk a ullhipotézist, miszerit a vegyület em okozott változást. Megjegyzés: Mi va akkor, ha em ismerjük a szórást? Nyilvá becslést kell aduk rá. Ha agy mitából becsüljük, akkor feltételezhetjük, hogy a becslés elegedőe potos, és alkalmazhatjuk az eddig leírtakat. Ha a populáció eloszlása ormális, akkor kis mita eseté a t-eloszlás haszálatával korrigálhatjuk a módszert. Eek az lesz a hatása, hogy a kritikus értékek távolabb fogak esi a H 0 -ba feltételezett µ 0 átlagértéktől. Például, ha az egértömegek eseté em ismerjük a szórást, csak becsültük a 0 elemű mitából, és az,5-ek adódott, akkor egyoldali próba eseté a kritikus érték: 0 x µ t emp,6 s,5 0 A t krit. értéket a t-táblázat alapjá határozzuk meg. A szabadsági fok - 9, a szigifikacia szit 0,05. A kritikus értéket a táblázat α/ 0,05 részéél kell keresi a kétoldali alteratív hipotézis miatt. Így t krit.,6. Kétmitás próbák: Előző példákba azt vizsgáltuk, hogy egy új vegyület hatására változak-e az egértömegek az előző geerációk adatai alapjá megállapított, elméleti értékhez képest. Nagyo gyakra azoba em áll redelkezésükre ilye elméleti érték. Ilye esetekbe célszerű egy másik (kotroll) csoporthoz viszoyítauk az eredméyeiket. Szite midig ez az eljárás gyógyszer-hatás vizsgálatál. Gyakra előfordul az is, hogy egyszerűe csak két csoportot (populációt) szereték összehasolítai. Például, szereték megtudi, hogy vajo a doháyosok rövidebb ideig élek-e, mit a em doháyosok, a Holstei-Frízek tejtermelése agyobb-e Németországba, mit áluk A két összehasolítadó csoportak em tudjuk a populáció átlagait, csak a belőlük kiválasztott
miták átlagait tudjuk összehasolítai, és azt vizsgáljuk, hogy a kettő szigifikása külöbözik-e. A ullhipotézis a következő lehet: két mita középértéke azoosak tekithető-e? H 0 : x x z-próba: Akkor haszáljuk, ha mid a két sokaság ormális eloszlású, az alapsokaságok szórásai ismertek vagy a miták elemszámai kellőe agyok. x x z + t-próba: Normális eloszlású sokaságok eseté, amikor a szórások em ismertek, de közel azoosak. x x t, a szabadsági fok száma: + - Sp + S p ( ) s + ( ) + Példa: Két halastóból származó halak zsírtartalmát szereték összehasolítai. Az egyik tóból elemű miták va, a mita átlaga 7%, szórása 4%. A másik esetbe 5 elemű mita alapjá az átlagos zsírtartalom 4%, szórása 3%. A számok alapjá úgy tűik, hogy az első tó eseté agyobb a zsírtartalom. Kérdés, hogy ez a külöbség szigifikás-e, vagy csak a mitavételi hiba okozta a külöbséget? Nullhipotézis: ics külöbség a két zsírtartalom között H 0 : µ µ. Alteratív hipotézis: va külöbség a két zsír-tartalom között H : µ µ. Ha a mitáik elég agyok, akkor a mitaátlagok ormális eloszlásúak leszek. (Nem túl agy miták eseté, az egymitás esethez hasolóa, itt is a t-eloszlást kell haszáli a ormális eloszlás helyett.) Mitaátlag Várható értéke Szórása x µ s x µ Ha a miták függetleek, akkor a mitaátlagok külöbsége is ormális eloszlású. Ha a szórásukat ismerjük, akkor x - x várható értéke µ -µ, szórása x eloszlása N(0, (.04) ). +. Példákba x -
z emp x x + 0,7 0,4 0,006 + 0,0009 5 0,03,886 0,00008 z krit,96 a t eloszlás táblázatáak szabadsági fok sora és α/ 0,05 oszlopából, mivel kétoldali alteratív hipotézisük va. (Ez 5%-os szigifikacia szitet jelet. Esetükbe z emp > z krit, tehát elutasítjuk a ullhipotézist, az eltérés em a véletleek köszöhető. Példa: Egy vizsgálatba arra kerestek választ, hogy vajo a városi vagy a falvakba lakó kismamák maradak-e tovább ottho gyermekeikkel. Egy agyvárosba véletleszerűe 0 kismamát kérdeztek meg, a köryéke levő kisebb településeke pedig 40-et. A városiak átlagosa 6 hóapig, 3 hóap szórással, a falvakba pedig átlagosa 30 hóapig 4 hóap szórással. Szigifikás-e a külöbség a tapasztalt értékek között? Nullhipotézis: H 0 : µ falusi µ városi ; H : µ falusi > µ városi. x x A megoldáshoz a t-próbát alkalmazhatjuk: t, ahol Sp + ( ) s + ( ) s S p és a szabadsági fok száma: + -. + S p ( ) s + ( ) 39 6 + 9 9 40 + 0 795 58 t emp + s x x 30 6 Sp + 3,70 + 40 0 3,945 3,70 A szabadsági fok száma 58, és a 95%-os megbízhatósági szithez t krit,67 érték tartozik. Mivel t emp > t krit, tehát elutasítjuk a ullhipotézist, a kisebb településeke tovább maradtak ottho a kismamák. Páros t-próba Tegyük fel, hogy egy mitá vizsgáljuk valamilye kezelések a hatását. Ilye esetekbe em a mitaátlagokat hasolítjuk össze, haem a kezelés előtti és utái érték külöbségéről állapítjuk meg, hogy szigifikása külöbözik-e ullától. Példa. Egy lázcsillapító gyógyszer hatásosságát vizsgáljuk. A betegek hőmérsékletét kétszer, a lázcsillapító bevétele előtt illetve utá mérjük meg. A mért értékeket és a változást a következő táblázat tartalmazza. Lázcsillapítás Külöbség előtt utá 39, 38,6 0,6 38,7 37,,5 37,9 36,8, 38,8 37,9 0,9
39,4 38,, 38, 38,0 0, 38,6 36,9,7 38,8 37,8,0 39,0 37,9, 38,5 37,6 0,9 A hipotéziseket formálisa felírva: H 0 : µ d 0, H : µ d 0. A külöbségek átlaga: d, 0, szórása s d 0,4. Vagyis a ullhipotézis szerit a gyógyszer hatástala. Ettől kezdve midet úgy kell csiáluk, mit az egymitás próba eseté. Ezek szerit az x d mitaátlag eloszlása ormális, várható értéke 0. A szabadsági fok esetükbe - 9, az ehhez és a 95%-os valószíűséghez tartozó t érték,6. Ha igaz a ullhipotézis, akkor t emp < t krit. x µ,0 0 t emp 7,68 s 0,4 0 Ez em teljesül, ezért elutasítjuk a ullhipotézist. Tehát azt modhatjuk, hogy a lázcsillapító gyógyszer hatásos. Szórásokra, variaciákra voatkozó próbák (F-próba.) A t-próba tárgyalásáál már volt arról szó, hogy a próbát másképp kell elvégezi, ha a két sokaság szórása (szóráségyzete) megegyezik, és másképp akkor, ha em. Felmerül a kérdés, hogy hogya lehet eldötei, hogy a szóráségyzetek megegyezek-e. Legye az első, a második populáció variaciája (szóráségyzete). Ekkor a ull- és az alteratív hipotézisek a következők leszek: H 0 :, H :. Ha H 0 igaz, akkor a két populáció szóráségyzetéek háyadosa. Két mita alapjá s becsüljük ezt a háyadost. A becslést F-statisztikáak evezzük, ahol F, és s az első, s s a második mita korrigált tapasztalati szóráségyzete, ahol s > s. Ha ez az F érték elég közel va -hez, akkor azt modhatjuk, hogy az eltérést csupá a véletle mitavételből származó hiba okozta, így elfogadhatjuk a H 0 -t, egyébkét pedig elutasítjuk. Miél agyobbak a mitáik, aál jobba megközelíti a miták szóráségyzete a sokaság szóráségyzetét. Ilye esetekbe az -től csak kis eltérést egedük meg. Ha a mitáik viszoylag kicsik, akkor pedig még agyobb eltérés eseté is elfogadjuk a ullhipotézist. Az is előfordulhat, hogy az egyik mita kicsi, a másik pedig agy. Ebből is kitűik, hogy mid a két mita elemszámától függ, hogy az körüli mekkora itervallumba fogadjuk el a H 0 hipotézist. Az F-statisztika eloszlása külöböző mita elemszámok eseté más és más lesz. Hasolóa a t-statisztikához, itt is a szabadsági fok mutatja meg, hogy melyik F-eloszlást kell választauk. A két mita szabadsági foka ( -, - ), ahol az első mita, pedig a második mita elemszáma. A táblázatokat általába 5%-os szigifikacia szitre közlik a külöböző statisztika köyvek. Példa:
A jövedelmek differeciálódásával kapcsolatos felmérés alapjá azt találták hogy egy adott régióba az 000 egyéi vállalkozó adóbevallása alapjá a jövedelmek szórása 5 400 Ft volt. A következő évbe ugyaitt, egy 5 elemű véletle mita alapjá már 9 00 Ft volt. Igazolható-e statisztikailag a jövedelmek differeciálódásáról szóló elmélet? H 0 :, vagyis a szórások (szóráségyzetek) megegyezek. H :, külöbözőek a szóráségyzetek. s 900 F emp,538, a számláló szabadsági foka 4, a evezőé pedig 999. F s krit,53. 5400 Mivel F emp > F krit így a ullhipotézist elvethetjük, a jövedelmek valóba differeciálódtak. Megállapításukat 95%-os megbízhatósági szite tettük. Felhaszált irodalom Baráth Cs. Ittzés A. Ugrósdy Gy.: Biometria. Mezőgazda Kiadó 996 Kiss A. Maczel J. Pitér L. Varga K.: Statisztikai módszerek alkalmazása a mezőgazdaságba. Mezőgazdasági Kiadó 983 Kovács Istvá: Statisztika. Szet Istvá Egyetem Gazdálkodási és Mezőgazdasági Főiskolai Kar jegyzete. Gyögyös 000 Kriszt Varga Keyeres: Általáos statisztika II. Nemzeti taköyvkiadó 997. Fodor Jáos: Biomatematika http://www.uivet.hu/users/jfodor/idex_h.html Meszéa György Zierma Margit: Valószíűségelmélet és matematikai statisztika Közgazdasági és Jogi Köyvkiadó 98 Murray R. Spiegel: Statisztika. Elmélet és gyakorlat. Paem McGraw Hill 995 Szűcs Istvá: Alkalmazott statisztika. Agroiform Kiadó 00