Statisztika I. 9. előadás Előadó: Dr. Ertsey Imre
Statisztikai hipotézis vizsgálatok
elsősorban a biometriában alkalmazzák, újabban reprezentatív jellegű ökonómiai vizsgálatoknál, üzemi szinten élelmiszeripari termékek minőségi vizsgálatánál. A hipotézis vizsgálat során a minta vagy minták jellemzőit vizsgáljuk.
Feltételezzük, hogy az összehasonlítandó jellemzők között nincs különbség, ez az úgynevezett nullhipotézis. Ez a különbség vonatkozhat: átlagokra, szórásnégyzetre, eloszlásokra, az összefüggésekre és azok jellemzőire
A 0 hipotézisünk helytállóságát statisztikai próbával döntjük el. A minta jellemzői valószínűségi változók érvényes a központi határeloszlás tétele. Statisztikai biztonság: normális eloszlás esetén a megadott szórás intervallumon belül elhelyezkedő értékek valószínűsége.
Határvalószínűség vagy szignifikancia határ: a döntés valószínűség szintje, azaz normális eloszlás esetén a megadott szórás intervallumon kívül elhelyezkedő értékek valószínűsége. A statisztikai biztonság és a határvalószínűség 100%-ra egészíti ki egymást.
Szórás intervallum +1,960 +,576 +3,91 Statisztikai biztonság 95,0% 99,0% 99,9% Határvalószínűség 5,0% 1,0% 0,1%
Statisztikai próbák: szolgálnak hipotézisek ellenőrzésére - legfontosabbak: a véletlen minta átlagainak és szórásnégyzeteinek összehasonlítása. A középértékek összehasonlításakor a t próbát szórások összehasonlítása esetén az úgynevezett F próbát alkalmazzuk. Mindkét próba független, normális eloszlású alapsokaságokból származó minták jellemzőinek összehasonlítására alkalmas.
Az általunk meghatározott t értéket összehasonlítjuk a Student táblázatban az adott szabadságfokhoz és határvalószínűséghez tartozó t értékkel. Ha a számított t érték nagyobb mint a táblázatban lévő t érték a nullhipotézist elvetjük, a két átlag közötti eltérés szignifikáns, azaz nem a véletlennek köszönhető.
A t értéknél figyelembe veendő szabadságfok meghatározásához azonban meg kell határoznunk az F próbát. S1 F S 1 S S Szabadságfok (Szf): az egymástól független minták száma (elemek száma).
A nullhipotézis szerint a két sokaság szórása egyenlő azaz S 1 S. Az F próbával ellenőrizhetjük, hogy hipotézisünk igaz-e, azaz a szórásban mutatkozó eltérés csak a véletlennek tulajdonítható-e.
Az általunk számított F értéket összehasonlítjuk a táblázatban meghatározott F értékkel (a táblázatban a nevező szabadságfokát a függőleges, a számlálóét a vízszintes sorban megkeresve olvassuk le az F értéket). Ha az általunk számított F érték nagyobb a nullhipotézist elvetjük illetve a vizsgált két sokaság szórása szignifikánsan eltér egymástól.
Ha az F próba alapján a két szórás azonos, akkor a két mintasokaság szórása is azonos, így a kikeresendő t érték szf (n-1), Ha a két minta sokaság szórása különböző, akkor a t érték szf n-1.
Szignifikáns differencia: SZD t p% p% Sd Az a legnagyobb különbség amelyet az adott P valószínűségi szinten még hibának, azaz a véletlennek tulajdoníthatunk. Ha a középértékek közötti különbség nagyobb, mint a szignifikáns differenciával kifejezett hiba mértéke, akkor a nullhipotézist elvetjük.
Statisztikai hipotézis vizsgálatok Egy motorkerékpár gyártó cég a gumiabroncsok tartósságát új adalékanyaggal kívánja növelni. Az új gumiabroncs tesztelésére 15 gépjárműre elől a régi, hátul az új abroncsot szerelték fel és 500 km megtétele után mérték a kopást.
Motorkerékpár sorszám Abroncs kopás Régi x r Új x ú x r x ú 1. 0,5 0,10 0,063 0,010. 0,50 0,11 0,50 0,01 3. 0,4 0,0 0,058 0,040 4. 0,33 0,14 0,109 0,00 5. 0,5 0,11 0,063 0,01 6. 0,30 0,15 0,090 0,03 7. 0,34 0,1 0,116 0,014 8. 0,60 0,16 0,360 0,06 9. 0,4 0,0 0,176 0,040 10. 0,48 0,19 0,30 0,036 11. 0,51 0,11 0,60 0,01 1. 0,64 0,19 0,410 0,036 13. 0,34 0,13 0,116 0,017 14. 0,34 0,18 0,116 0,03 15. 0,9 0,15 0,084 0,03 Összesen 5,83,4,501 0,353 Me.: mm
Abroncskopás átlagok: x 5,83 x mm r 0, 39 n 15 x,4 x 0, 15 ú n 15 Kopáskülönbség: mm x x mm r 0,39 0,15 0, 4 ú
A régi abroncsok kopásának szórásnégyzete: S r x ( x ) 5,83,501 n 15 n 1 14 0,015 Az új abroncsok kopásának szórásnégyzete: S ú x ( ),4 x 0,353 n 15 n 1 14 0,001
A differencia véletlen hibája: S d S r + S n ú 0,015 + 0,001 15 0,033 A számított t-érték: t x r S d x ú 0,39 0,15 0,033 7,7
A kritikus t-érték meghatározásához el kell végezni az F próbát: Sr 0,015 F 15 F, 5 p 5 % S 0,001 ú a számláló és a nevező Szf14 15 >,5 tehát a két minta szórása eltérő, a kritikus t- érték meghatározásánál a szabadságfok: n-1 A kritikus t-érték: t p 5 %,145 Szf14
7,7 >,145 azaz t > t p5% tehát a két minta középértéke közötti különbség nem a véletlennek köszönhető A szignifikáns differencia értéke 95%-os valószínűségi szinten: SZD t S mm p p,145 0,033 0, 07 5 % 5% d Mivel a két minta középértéke közötti különbség nagyobb, mint a SZD p5% azaz 0,4 > 0,07 így megállapítható, hogy a különbség az eltérő adalékanyag hatásának köszönhető.