Statisztikai módszerek gyakorlat - paraméteres próbák A tanult paraméteres próbák: PRÓBA NEVE Egymintás U próba Kétmintás U próba Egymintás T próba Welch próba (Kétmintás T próba) F próba Grubbs próba Abbe próba MIRE SZOLGÁL? A val.-i vált. várható értéke egy adott szám-e? (Ismert szórás!) Két val.-i vált. várható értéke megegyezik-e? (Ismert szórás!) A val.-i vált. várható értéke egy adott szám-e? Két val.-i vált. várható értéke megegyezik-e? Két normális eloszlású val.-i vált. szórása megegyezik-e? A mérési sorozat legnagyobb vagy legkisebb eleme hozzátartozik- e a sorozathoz? A megfigyelés sorozat alatt változott-e a várható érték? 1. Feladat Egy laboratóriumi mérésen a hallgatók n=4 fős csoportokban dolgoznak. Feltételezzük, hogy a hallgatók IQ-ja is ξ=n(100,15) eloszlást követ (mint ahogy múlt gyakorlaton az emberekről általában feltételeztük). Mekkora a sugarú környezetet kell vennünk M(ξ) körül ahhoz, hogy egy véletlenszerűen kiválasztott csoport átlagos IQ-ja p=90%-os valószínűséggel ebbe a környezetbe essen? Jelölje a négyfős csoportok átlagos IQ-ját modellező valószínűségi változót. Ekkor: M( )=M(ξ) és D( )=D(ξ)/ a kiszámolása: helyett természetesen 100 is állhatna, p helyett pedig 0,9. Standardizálás után: Intervallumba esés valószínűsége, (ahol az N(0,1) eloszlásfüggvénye): Szimmetria okokból:
Tehát a értéke =INVERZ.STNORM((1+0,9)/2)*15/GYÖK(4) alapján 12,3364 Így ha kiválasztunk véletlenszerűen egy 4-fős laborcsoportot, és meghatározzuk az átlagos IQ-jukat (Jelölje ezt: ), akkor az esetek 90%-ában teljesülni fog, hogy [100-12,3364; 100+12,3364] Ugyanez behelyettesítés előtt: [M(ξ)- ; M(ξ)+ ] Átrendezve: [- ; ], ami tehát az esetek 90%-ában teljesül. 2.Feladat Az első feladat kapcsán felmerülhet bennünk, hogy a hallgatók nem reprezentatív részét képezik az emberiségnek így nem jogos rájuk is vonatkoztatni az egész emberiségre érvényes IQ-eloszlást. Vonjuk kétségbe, hogy a hallgatók IQ-ja is 100 várható értékű eloszlást követ (a szórást és a normalitást most ne vitassuk)! Mérjük meg néhány hallgató IQ-ját, és ennek alapján próbáljuk meg eldönteni, hogy jogosan vontuk-e kétségbe, hogy az IQ várható értéke hallgatókra is 100! Összesen 4 hallgatónak mérhettük meg az IQ-ját. Ezek: 117,112,115,108. Származhatnak ezek az adatok N(100,15) eloszlásból? Természetesen igen. Stratégia: Nem "túl valószínűtlen", hogy az N(100,15) eloszlásból ilyen adatok származzanak? Ez attól függ mit nevezünk "túl valószínűtlennek". (Ezt a feladat szövegének tartalmaznia kell.) Ebben a feladatban nevezzük "túl valószínűtlennek" azt, aminek a bekövetkezési valószínűsége kisebb mint 10%. Számítsuk ki a mérési sorozat átlagos IQ-ját ( =113). Ha úgy találjuk, hogy kevesebb mint 10% annak az esélye, hogy egy N(100,15)-ből származó 4-elemű sorozat átlaga ilyen messze essen 100-tól, akkor azt mondjuk, hogy a hallgatók IQ-jának várható értéke nem 100. Ekkor annak a valószínűsége, hogy rossz döntést hozunk kevesebb mint 10%.
Ha úgy találjuk, hogy több mint 10% annak az esélye, hogy egy N(100,15)-ből származó 4-elemű sorozat átlaga ilyen messze essen 100-tól, akkor elfogadjuk, hogy a hallgatók IQ-ja is N(100,15) eloszlásból származik. Ekkor nem tudjuk mekkora annak az esélye, hogy rosszul döntöttünk. Döntés: Láttuk az előző számítás eredményeként, hogy az esetek 90%-ában teljesülni fog, hogy [100-12,3364; 100+12,3364], így a 113 már "túl valószínűtlen". Döntés az átrendezett alak alapján: Az esetek 90%-ában teljesül, hogy [- ; ]. Most =1,733333 = 1,644854 mivel [- ; ] nem teljesül, elvetjük, hogy a hallgatók IQ-jának várható értéke 100. 3.Feladat A "Viscosity Characteristics of Rubber Modified Asphalts", (J. of Materials in Civil Engr., 1996: 153-156) című cikkben 18% gumi hozzáadásával készítettek aszfaltot, és ennek viszkozitását vizsgálták. Vizsgálatuk során 5 ilyen anyag tulajdonságait rögzítették, a szórás ismert. Igaz-e 95%-os biztonsággal, hogy az átlagos viszkozitás várhatóan 2900 cp (centipoise)? Egymintás U próbát alkalmazunk H0: A viszkozitás várható értéke (p=95) 2900. Írjuk be az adatokat tetszőlegesen választott mezőkbe. (a0, p, n) Számoljunk átlagot. ( ) Számoljuk ki U akt értékét. U krit értékét a standard normális eloszlásból kapjuk (p+1)/2-höz pl.: =INVERZ.STNORM((p+1)/2) U krit =1,96 Mivel - U krit < U akt < U krit a H0 hipotézisünket megtartjuk, tehát az adatok nem mondanak ellent annak, hogy a viszkozitás várható értéke 2900 cp.
4.Feladat A mozgásszervi nyak-váll problémák igen gyakoriak azon munkavégzők esetében, akik ismétlésszerű, vizuális kijelző kezelői munkát végeznek. Az Upper-Arm Elevation During Office Work c. cikk (Ergonomics, 1996: 1121-1230) egy 16 egyénen végzett kísérlet eredményeit ismerteti. A kísérletben kétszer figyelték meg a dolgozókat, az első alkalommal úgy, hogy a kézmozgásra max. 30 -os szögben volt lehetőségük, a második esetben -18 hónappal későbbúgy, hogy közben javítottak a munkakörnyezeten, és így a dolgozóknak nagyobb tartományban és változatosságban volt lehetőségük karjukat mozogatni. A munkavégzés hatékonyságát úgy mérték le, hogy egy adott munkafolyamatot kellett a dolgozóknak elvégezni egy adott limitidő alatt, és azt nézték, hogy a limitidő hány százalékát használták fel a feladatmegoldásra. Első alkalommal korlátozott kézmozgással, majd második alkalommal kiterjesztett kézmozgással, vagyis jobb körülmények mellett. A 16 dolgozó két alkalommal mért eredményei vannak a következő táblázatban. Alátámasztják-e az adatok a kijelentést 95%-os biztonsággal, miszerint a nagyobb mozgástér biztosítása nem változtatott a munkavégzés hatékonyságán? Egymintás T-próba a minták különbségére H0: A minták különbségének várható értéke 0 (p=95%). Számoljuk ki a két adatsor különbségét a következő oszlopban. Számoljuk a különbség átlagát, korrigált tapasztalati szórását és a mintaelemek számát. (, s*, n) a 0 =0 Számoljuk ki t akt értékét. értékét az n-1 szabadságfokú Student féle T eloszlás inverzéből kapjuk, kiszámítása Excelben: =INVERZ.T(1-p;n-1) =2.13 Mivel -t krit < t akt < t krit nem igaz, azt kell mondanunk, hogy a nagyobb mozgástér változtatott a hatékonyságon.
5.Feladat A következő adatok hegesztéssel ill. hegesztés nélkül készült polimer csövek húzófeszültségét mutatják. ( Effect of Welding on High-Density Polyethylene Liner, J. of Materials in Civil. Eng., 1996:94-100) Egyetért-e a kutatókkal, akik azt állítják, hogy a csövek húzófeszültségén az új technológia nem változtatott? A szignifikancia szintet válasszuk 98%-ra. Welch-próba H0: a minták várható értéke megegyezik (p=98%). Számoljuk ki a két adatsorra az átlag, korrigált tapasztalati szórás és minta elemszám adatokat tetszőlegesen választott mezőkbe ( ). Számoljuk ki értékét. ahol: értékét az f szabadságfokú Student féle T eloszlás inverzéből kapjuk, kiszámítása Excelben: =INVERZ.T(1-p;f) w krit =2.60 Mivel -w krit < w akt < w krit igazelfogadjuk, hogy a húzófeszültségén az új technológia nem változtatott. F (Fisher)-próba H0: A minták szórása megegyezik (p=95%). Az egyes minták szórásait a feladat a) részében már kiszámoltuk. Számoljuk ki f akt értékét. =1.86 f krit értékét F eloszlásból (táblázatból) kereshetjük ki (1-p); (n ξ -1) és (n η -1)-hez. =INVERZ.F(1-p; -1; -1) f krit =3.68 Mivel f akt < f krit teljesül, a hipotézist, miszerint a szórás megegyezik, elfogadjuk.
6. Feladat A sarkvidékeken a leesett hó rétegeket képez, és egy idő után jéggé alakul át a rárakódó újabb rétegek nyomásának hatására. A vastag jég megfúrása és elemzése által múltbeli eseményekre lehet következtetni. Egy fúrásmintában 20 réteget sikerült elkülöníteni és elemezni. Ezek kémhatását tartalmazza az alábbi táblázat. Állítható-e 95%-os biztonsággal, hogy a legsavasabb (legkisebb ph-jú) érték nem magyarázható a véletlen ingadozással, hanem valamilyen rendkívüli esemény (például vulkánkitörés) következménye? Grubbs próba H0: A minimális elem is része az eloszlásnak (p=0.95). Számoljunk átlagot, szórást, illetve keressük meg a minta maximumát és minimumát. A minimum tűnik kiugró értéknek, ezért erre végezzük el a próbát. Számoljuk ki G_akt értékét: 7.Feladat A kritikus értéket a mellékelt táblázatból kell kikeresni az elemszámhoz. (Megj.: nagyobb minta elemszám esetén nem is alkalmazható ez a próba, azért nem nagyobb a táblázat!) G krit =2.56 Mivel G akt > G krit, a nullhipotézis elutasítom. Egy palackokat fröccsöntő gépen rendszeresen ellenőrzik a gép beállításait. Ennek érdekében 40 egymás után fröccsöntött termék tömegét sorozatban mérték. Az adatok alapján megváltozott a gép adagolójának működése (p=95%)? Abbe próba H0: Az adagoló beállításai nem változtak(p=0.95). Képezzük a korr. tap-i szórást. különbség négyzeteket a D oszlopban. (i=1,2,,n-1-ig). Számoljunk Számoljuk ki a köv. mennyiséget: A próba aktuális értéke: A kritikus értéket a próbához tartozó táblázatból nézhetjük ki. (www.hds.bme.hu/mota/sm/abbe.pdf)
r krit =0.746 Mivel r akt > r krit, a nullhipotézist elfogadjuk.