Gyakorló feladatok_alapok a Kísérletek tervezése és értékelése c tárgyból Eloszlások 3 Normális eloszlás 3 példa 3 példa 3 3 példa 3 4 példa 4 5 példa 4 t-eloszlás 4 6 példa 4 7 példa 5 8 példa 5 Khi-négyzet eloszlás 5 9 példa 5 példa 6 példa 6 példa 6 3 példa 6 4 példa 7 F-eloszlás 7 5 példa 7 Hipotézisvizsgálat 7 z-próba 7 6 példa 7 t-próba 8 7 példa 8 8 példa 8 9 példa 9 Khi-négyzet próba 9 példa 9 példa F-próba példa 3 példa 4 példa Kétmintás t-próba 5 példa 6 példa 3 7 példa 4 Páros t-próba 5 8 példa 5 9 példa 5 3 példa 6 Diszkrét eloszlások és közelítésük normális eloszlással 6 3 példa 6 3 példa 7 33 példa 7 34 példa 8
Vegyes feladatok az eloszlások és próbák témakörből 8 35 példa 8 36 példa 8 37 példa 9 38 példa 9 39 példa 9 4 példa 9 4 példa 9 4 példa 43 példa 44 példa
Eloszlások Normális eloszlás példa Egy 35 várható értékű és 4 varianciájú normális eloszlásból 9 elemű mintát veszünk Számítsuk ki, milyen szimmetrikus intervallumban lesz 95 %-os valószínűséggel a minta átlagértéke! a f 95 P x x x x x x n n n z z 96 a f 95 a f P P z z z a z f z f x z n 975 a a 35 96 3 343 ; x f P 343 x 357 95 példa 35 96 3 357 A 3 mm névleges hosszúságú dobozokat gyártó gépsoron készült dobozok hosszmérete 995 mm körül ingadozik, varianciájának négyzetgyöke 8 mm Elfogadva, hogy a dobozok méretének eloszlása normális, a dobozok hány %-ának nem megfelelő a mérete (selejt), ha a tűréshatár 3 mm? P x A z-eloszlás táblázata a P35 z 98 3 9696 34 valószínűséget nem tartalmazza (z=39 a legnagyobb érték a táblázatban), ezért a számolás során azzal a közelítéssel élünk, hogy P 3 x P 35 z 3 példa Egy régóta gyártott elektromos kondenzátor élettartama normális eloszlásúnak tekinthető, = 5 h Véletlenszerűen kivéve 3 elemű mintát, az átlagos élettartamra 475 h adódott Adjuk meg a várható élettartam 99%-os konfidencia intervallumát P 35 535 99 A példák megoldásánál az intervallumok megadásakor az egyenlőség jelet az egyszerűség kedvéért elhagyjuk Ezt azért tehetjük meg, mert folytonos eloszlású véletlen változókról van szó 3
4 példa Feltételezhetjük, hogy a névlegesen kg-os csomagolású kristálycukor tényleges súlyeloszlása közelítőleg normális, várható értéke kg, és = kg A cukorral töltött zacskók hány százalékának lesz a súlya 985 kg alatt? z 5 668 P ( x 985) P 5 példa A 6 mm névleges átmérőjű golyókat gyártó gépsoron készült golyók átmérőjének várható értéke 5998 mm, varianciájának négyzetgyöke,6 mm Elfogadva, hogy a golyók átmérőjének eloszlása normális, a golyók hány %-ának nem megfelelő a mérete (selejt), ha a tűréshatár 69 mm? F833 9664 F67 F67 8784 6 A selejtarány: 9664 6 336 6 55 t-eloszlás 6 példa Egy normális eloszlásból vett 9 elemű minta elemeinek átlagértéke x 85, szórásnégyzete s 35 Milyen szimmetrikus intervallumban van 95 %-os valószínűséggel a 4 sokaság várható értéke? (Adjunk 95 %-os konfidencia-intervallumot a várható értékre!) P t t t ; 5; n 8 x Pt t s n P x t s n x t s n 4 35 36 t 5 8 36 9 P 85 85 95 P 8488 85 95 4
7 példa Az MM-Liner karton négyzetmétertömegére az alábbi mérési adatokat kapták (5, egymástól független mintavétel) 38 g/m ; 36 g/m ; 99 g/m ; 97 g/m ; 34 g/m Elfogadva, hogy az adatok normális eloszlásúak, adja meg a négyzetmétertömeg várható értékének 95%-os konfidencia intervallumát! P 97 386 95 8 példa Ismételt méréseket végeztünk egy szállítmány hatóanyagtartalmának meghatározására: 488; 49; 467; 5; 58 Elfogadva, hogy az adatok normális eloszlásúak, adja meg, hogy a tényleges hatóanyagtartalom mely érték felett található 95%-os valószínűséggel! P 4753 95 Khi-négyzet eloszlás 9 példa 4 Számítsuk ki, hogy egy 35 várható értékű és varianciájú normális eloszlásból 9 elemű minta korrigált tapasztalati szórásnégyzete milyen alsó és felső határ közé esik 95 %-os szimmetrikus valószínűséggel! P s s s 95 a f sa s s f P 95 ; n P 95 a f f 975 f 58 7 535 5 8 8 F ; F a a 975 8 ; 8 75 5 P s 9 4 95 4 a 5 s a 75 4 f 7535 4 s f 9 8 A fejezet néhány feladatában a khi-négyzet eloszlás mellett, a z- és t-eloszlást is kell használni 5
példa Négy egymástól független hajlítási merevség mérés eredménye: 7; 78; 8,; 77 Elfogadva, hogy az adatok normális eloszlásúak, adja meg a várható érték () 99%-os és 95%- os konfidencia intervallumát 668 867 99 P P 37 69 95 példa Egy karton hajlítási merevségére szálirányban tíz, egymástól független mérést végeztek A mérés átlaga és a szórás: x 35; s 4 Elfogadva, hogy az adatok normális eloszlásúak, adja meg a várható érték () 9%-os és 95%-os konfidencia intervallumát 37 373 9 P P 757 5333 95 példa Egy kartonpapír négyzetmétertömegének várható értéke 5 g/m, varianciája g/m Feltételezve, hogy a négyzetmétertömeg normális eloszlású, milyen intervallumban lesz 95%-os valószínűséggel egy 5 elemű, véletlen minta a) számtani középértéke, b) korrigált tapasztalati szórásnégyzete? a) xa 49 x 59 b) s 786 f f s a 3 példa Négy egymástól független ph mérés eredménye: 79, 794, 79 és 793 Elfogadva, hogy a mérési hiba normális eloszlású a) adjon 95%-os felső határt a ph mérés várható értékére! b) adjon 9%-os alsó határt a ph mérés varianciájára! a) P 794 95 4 b) P 67 * 9 6
4 példa Egy szerves oldat nedvességtartalmát tíz, egymástól független méréssel határoztuk meg A mérés átlaga és a szórás: x 55 g/kg, s = 37 g/kg A mérési hiba normális eloszlásúnak tekinthető a) Milyen valószínűséggel lesz a nedvességtartalom a 59 g/kg-os érték felett? b) Milyen értek alatt van a nedvességtartalom varianciája 95%-os valószínűséggel? P P 59 5 37 95 F-eloszlás 5 példa Egyazon normális eloszlású sokaságból két mintát veszünk Az első 6 elemű, a második elemű Milyen szimmetrikus intervallumban lesz a két szórásnégyzet hányadosa 9 %-os valószínűséggel? a f 9 P F F F ; 5 ; 9 s PFa F 9 f s Ff F 5 9 5 348, F a F F 95 5, 9 9, 5 4 77 s P 3 48 s 5 Hipotézisvizsgálat A hipotézisvizsgálathoz kapcsolódó példák két csoportra oszthatók Az egyik példatípusnál a feladat szövege egyértelműen közli, hogy mi a vizsgálandó nullhipotézis A másik, öszszetettebb feladattípusnál a szakmai problémát írjuk le, ott az olvasó feladat eldönteni, hogy mi kerüljön a nullhipotézisbe z-próba 6 példa Ismert varianciájú ( 6 ) normális eloszlású sokaságból vett 64 elemű minta elemeinek középértéke 365 Megvizsgálandó -os szignifikanciaszinten az a nullhipotézis, hogy a sokaság várható értéke 3 7
: H: 3 H: 3 x 365 3 z 3 ; zkrit z995 58 ; n 6 64 Elfogadási tartomány: zkrit z zkrit Elfogadjuk a nullhipotézist, mivel zkrit z zkrit teljesül Az adatok nem mondanak ellen annak a feltételezésnek, hogy a sokaság várható értéke 3 t-próba 7 példa A 3 m névleges vastagságú kartonpapírból 5 mintát vettek A mért vastagságok számtani középértéke 378 m, szórása m Elfogadva, hogy a kartonpapír vastagságának eloszlása normális, megvizsgálandó = 5 szignifikanciaszinten az a nullhipotézis, hogy a papír vastagság várható értéke legalább 3 m! : H: 3 H: 3 x 378 3 t 34 ; tkrit t5 (4) 3 ; s n 5 Elfogadási tartomány: tkrit t Elutasítjuk a nullhipotézist, mivel t az elfogadási tartományon kívül esik Tehát az adatok 5%-os szignifikanciaszinten ellentmondanak annak, hogy a papír vastagság várható értéke legalább 3 m Az adatok 5%-os szignifikanciaszinten azt bizonyítják, hogy a papírvastagság várható értéke 3 m alatt van 8 példa Egy készítmény hatóanyagtartalmát négy ismételt méréssel határozták meg A tapasztalati szórásnégyzet 5476, a négy mérési eredmény számtani középértéke pedig 45% Alátámasztják-e ezek az eredmények azt a gyanút, hogy a készítmény hatóanyagtartalma kevesebb mint 5%? =5 szignifikanciaszinten vizsgálja a kérdést! H: 5 H: 5 (baloldali ellenhipotézis) t t t 3 3 353 krit 5 Elfogadási tartomány: tkrit t, elutasítási tartomány: t tkrit, tehát a nullhipotézist elfogadjuk Az adatok nem bizonyítják, hogy a hatóanyagtartalom 5% alatt van 8
9 példa Egy bizonyos oldat szennyeződését vizsgálva, az oldatból vett 7 db minta elemzési eredményei a következők (%-ban): 78, 77, 7, 73, 74, 75 és 76 A megengedett szennyeződés max 73% Elfogadva, hogy az adatok normális eloszlásúak, 5 szignifikanciaszinten vizsgálja azt a nullhipotézist, hogy az oldat szennyeződése a határérték alatt van H: 73 H: 73 (jobboldali ellenhipotézis) t 45 t 5 6 943 krit t Elfogadási tartomány: t 943, elutasítási tartomány: 943 t Tehát a nullhipotézist elutasítjuk Az adatok 5%-os szignifikanciaszinten bizonyítják, hogy a szennyezés túllépte a határértéket A fordítva feltett nullhipotézist ( H: 73 ) elfogadnánk Ez még önmagában nem bizonyítaná azt, hogy a szennyezés túllépte a határértéket (Ez alapján még nem lenne jogos megbírságolni azt a céget, aki kibocsátotta a szennyvizet) Csak annyit tudnánk mondani, hogy nem bizonyítható, hogy a szennyezés koncentrációja a határérték alatt volt Khi-négyzet próba példa Normális eloszlású sokaságból vett 7 elemű minta szórásnégyzete 4 Megvizsgálandó = 5 szignifikanciaszinten az a nullhipotézis, hogy a variancia értéke legfeljebb 8 H : 8 H : 8 46 33 8 s 46 ; ha H 8 8 igaz, 8 jobbra eltolódik, tehát egyoldali fölső határa van a nullhipotézis elfogadási tartományának: 6 696 krit 5 Elfogadási tartomány: krit Elfogadjuk a nullhipotézist, mivel kit teljesül Az adatok nem mondanak ellent annak a feltételezésnek, hogy a sokaság varianciája legfeljebb 8 9
példa Egy szerves anyag víztartalmát ismételt méréssel meghatározva a mérések átlaga: x 45 g/kg, a szórás: s = 37 (g/kg) Elfogadva, hogy az adatok közelítőleg normális eloszlásúak, a) vizsgálja meg 5%-os szignifikanciaszinten azt a nullhipotézist, hogy a víztartalom nem haladja meg a 5 g/kg értéket; b) vizsgálja meg 5%-os szignifikanciaszinten azt a nullhipotézist, hogy a víztartalom mérési módszerének varianciája ( ) nem nagyobb, mint 6 (%) a) H: 5 H: (jobboldali ellenhipotézis) t 4 t 5 9 833 krit t Elfogadási tartomány: t 833, elutasítási tartomány: 833 t, tehát a nullhipotézist elfogadjuk Tehát az adatok nem bizonyítják, hogy a víztartalom meghaladja a 5%-ot b) H : 6 77 krit H : (jobboldali ellenhipotézis) 9 699 5 Mivel krit, ezért elfogadjuk a nullhipotézist Az adatok nem mondanak ellent annak a feltételezésnek, hogy a variancia 6 (%) alatt van F-próba példa Két független, normális eloszlásból vett mintánk van, az egyik elemű, korrigált tapasztalati szórásnégyzete 76; a másik 4 elemű, szórásnégyzete 38 Megvizsgálandó = 5 szignifikanciaszinten az a nullhipotézis, hogy az első minta mögött álló sokaság varianciája legfeljebb akkora, mint a másik sokaság varianciája H : H : F 76 38 Fkrit F5,3 67 ; Elfogadási tartomány: F Fkrit Elfogadjuk a nullhipotézist, mivel F Fkrit teljesül Tehát az adatok nem mondanak ellent annak a feltételezésnek, hogy az első sokaság varianciája legfeljebb akkora, mint a másodiké (Vagy: az adatok nem bizonyítják, hogy az első sokaság varianciája nagyobb, mint a másodiké) 3 példa Két független, normális eloszlásból vett mintánk van, az egyik 9 elemű, szórásnégyzete 44; a másik 6 elemű, szórásnégyzete 5 Megvizsgálandó -es szignifikanciaszinten, hogy a varianciák egyenlők-e vagy nem
H : H : F 5 4 4 44 F 5 5, 8 369 ; Elfogadási tartomány: F95 5, 8 F F5 5, 8 Elfogadjuk a nullhipotézist, mivel F F (5,8) 5 3 Az adatok nem mondanak ellent annak a feltételezésnek, hogy a két sokaság varianciája megegyezik 4 példa Egy automata gépen készülő alkatrészek jellemző méretére a következő adatokat mérték (zárójelben az előfordulások száma): 3 (); 35 (6); 38 (9); 44 (7); 45 () Az előírás szerint a gyártás bizonytalanságára jellemző variancia nem haladhatja meg a értéket Felmerült a gyanú, hogy a variancia meghaladja az előírt értéket Bizonyítják-e az adatok ezt a gyanút 5-os szignifikanciaszinten? s 975; 5 4 ; H : s H : 9754 474 ; 975 4 ; ha H igaz, jobbra eltolódik, tehát egyoldali fölső határa van a nullhipotézis elfogadási tartományának: 4 3645 Elfogadási tartomány: krit krit 5 Elutasítjuk a nullhipotézist, mivel krit, az adatok,5 szignifikanciaszinten vizsgálva ellentmondanak a nullhipotézisnek Az adatok 5-os szignifikanciaszinten alátámasztják azt a gyanút, hogy a variancia meghaladja a határértéket Ez azt jelenti, hogy kisebb mint 5% annak az esélye, hogy ilyen (975) vagy ennél még nagyobb szórásnégyzetű mérési eredményeket kapunk, ha 4 Minél kisebb ez a valószínűség 5%-nál, annál inkább kételkedhetünk az kezdeti feltételezésünk (nullhipotézis) teljesülésében F 5, 8 biztos kisebb mint (az F-eloszlás 95 természetéből adódóan) és a próbastatisztikát úgy írtuk fel, hogy az nagyobb legyen, mint (Részletes magyarázat található az F-eloszlás használatáról a honlapról letölthető könyvkivonatban) 4 Szoftverrel számolva ennek a valószínűségnek (elsőfajú hiba elkövetésének valószínűsége) a pontos értéke is 3 Az alsó határnak való megfelelés biztos teljesül, mivel megadható (p érték)
Kétmintás t-próba 5 példa Két független minta (x és y) adatai a következők (zárójelben az előfordulások száma): x: 34 (); 35 (3); 37 (4); 39 () y: 3 (); 34 (); 36 (8); Vizsgáljuk meg 5-es szignifikanciaszinten, hogy a két minta mögött álló sokaság várható értéke egyenlő-e vagy nem x 36 ; y 35 ; s x 67 ; s 545 Kétmintás t-próbát kell alkalmazni, de először F-próbát kell végezni a varianciák egyenlőségére! F-próba H : x y H : x y 67 F 49 ; 5 9, 9 545 F Elfogadási tartomány: F 9, F F 9, 95 5 y Mivel a próbastatisztika felírásából következően F, elég csak a felső határt ellenőrizni (Ld a 3 példa) F F 9, 5, tehát elfogadjuk a feltételezést, hogy a két minta mögött álló sokaság varianciája megegyezik Az egyesített szórásnégyzet: 67 9 545 s 6 9 Kétmintás t-próba H : x y H : x y t x y 36 35 448 s n x n y 6 tkrit t5 43 Elfogadási tartomány: tkrit t tkrit Elfogadjuk a nullhipotézist, mivel tkrit t tkrit teljesül Az adatok 5-es szignifikanciaszinten vizsgálva nem mondanak ellent annak, hogy a két sokaság várhatóértéke megegyezik
6 példa Az MCM 3 g/m négyzetmétertömegét 5 mintavételből határozták meg Az 5 mérés számtani középértéke 373 g/m, szórása 8 g/m A Grafopack 3 g/m kartonpapír szállítmányból 6 mintát véve az átlag 334 g/m, a szórás 6 g/m Elfogadva, hogy az adatok normális eloszlású sokaságból származnak, 5%-os szignifikanciaszinten vizsgálja meg, hogy a két szállítmány négyzetméter tömegének várható értéke különbözik-e egymástól? x M 373; x G 33 4; s M 64 ; s G 36 Kétmintás t-próbát kell alkalmazni, de először F-próbát kell végezni a varianciák egyenlőségére! F-próba : H M G H : M G; F 64 78 F5 4,5 59 ; Elfogadjuk a feltételezést, miszerint a két minta 36 mögött álló sokaság varianciája megegyezik Az egyesített szórásnégyzet: 644 365 s 484 5 4 Kétmintás t-próba H : M G H : M G xm xg 373 334 t 95 s n M n G 484 5 6 t 5 9 6 krit t Elfogadási tartomány: tkrit t tkrit Elutasítjuk a nullhipotézist, mivel a próbastatisztika értéke (95) kívül esik a tkrit tkrit elfogadási intervallumon Az adatok alapján elutasítjuk azt a feltételezést, hogy a két szállítmány négyzetméter tömegének várható értéke megegyezik 3
7 példa Egy kémiai reakciót alkalommal az A receptúra szerint, alkalommal pedig a továbbfejlesztett B receptúra szerint hajtottak végre Az alábbi kitermelés adatokat kapták: A recept B recept 546 749 458 783 574 84 4 587 563 68 55 647 57 665 645 735 56 8 486 737 Az elvárások szerint a javított (B) recept szerinti reakcióvezetés minimálisan 5 egységgel nagyobb kitermelést eredményez! Alátámasztják ezt a mérési adatok, ha a vizsgálatot 5 szignifikanciaszinten végezzük? Kétmintás t-próbát kell alkalmazni, de először F-próbát kell végezni a varianciák egyenlőségére! F-próba : H A B; H : A B; F 5338 89 F 5 9,9 38 krit F Elfogadjuk a feltételezést, miszerint a két 449 minta mögött álló sokaság varianciája megegyezik Az egyesített szórásnégyzet: 53389 4499 s 494 9 9 Kétmintás t-próba H : 5 B A B A H : 5 B A B A (baloldali ellenhipotézis) xb xa B A 798 55 t 5, tkrit t5 8 734 s n n 494 / / A B Elfogadási tartomány: t 734, elutasítási tartomány: 734 t, a nullhipotézist tehát elfogadjuk, mivel t az elfogadási tartományba esik Az adatok nem bizonyítják (5 szignifikanciaszinten), hogy a javított (B) recept szerinti reakcióvezetés 5 vagy több egységgel nagyobb kitermelést eredményez 4
Páros t-próba 8 példa 8 különböző mintát elemeztek kétféle módszerrel Az egyes mintákra kapott eredmények az alábbi táblázatban találhatók Minta sorszáma 3 4 5 6 7 8 x (első módszer) 5 6 4 4 8 y (második módszer) 5 4 5 9 6 4 Megvizsgálandó 5-os szignifikanciaszinten, hogy a két módszerrel kapott eredmények különböznek-e! di yi xi d s d 39 7 H : E d t H : E d (kétoldali ellenhipotézis) d 567 ; t 5 s / n 39 8 7 365 krit t ; d Elfogadási tartomány: tkrit t tkrit Elutasítjuk a nullhipotézist, mivel t t krit Az eredmények ellentmondanak annak a feltételezésnek, hogy a két módszerrel kapott eredmények várhatóértékei megegyeznek Vagy: az eredmények azt bizonyítják (5-os szignifikanciaszinten), hogy a két módszerrel végzett elemzés várhatóértéke különböző 9 példa A kartonpapír vastagságának mérését végző laboratóriumban két személy dolgozik (A és B) A beérkező kartonpapír szállítmányból vett minta vastagságát mindkét személy megméri A 7 véletlenszerűen kiválasztott minta mért vastagságát (m) az alábbi táblázat tartalmazza: minta A B 3954 3965 3648 366 3 7 743 4 557 56 5 3856 3876 6 35 345 7 387 3333 Elfogadva, hogy az adatok normális eloszlású sokaságból származnak, 5%-os szignifikanciaszinten vizsgálja meg, hogy a két személy által mért adatok szignifikánsan különböznek-e egymástól? 5
di Bi Ai d 96 s d 348 6 t 3847 ; t 5 6 447 krit t ; Elfogadási tartomány: tkrit t tkrit Elutasítjuk a nullhipotézist, mivel a próbastatisztika értéke (384) kívül esik a tkrit tkrit elfogadási intervallumon A két személy méréseinek várhatóértéke szignifikánsan különbözik 3 példa Két laboratórium (A és B) munkáját úgy hasonlították össze, hogy 4 csomag dohány nikotintartalmát mindkét laboratóriummal megmérették Minden esetben a csomagból kivett mintát megfelezve, felét az A laborba, másik felét pedig a B laborba küldték vizsgálatra Az eredményeket a következő táblázat tartalmazza (kódolt egységben) Dohány Labor a b c d A 6 4 8 7 B 8 3 3 9 Megvizsgálandó =5 szignifikanciaszinten, hogy a két labor torzít-e egymáshoz képest! H : E d t 68 t t H : E d (kétoldali ellenhipotézis) 3 38 krit 5 Elfogadási tartomány: tkrit t tkrit Mivel tkrit t tkrit teljesül, ezért a nullhipotézist elfogadjuk Az adatok nem bizonyítják, hogy a két labor torzít egymáshoz képest Diszkrét eloszlások és közelítésük normális eloszlással 5 3 példa Minimálisan hány elemű mintákat kell vennünk, ha azt akarjuk, hogy 99% valószínűséggel találjunk legalább hibás darabot, vagyis P(D>)99, amennyiben a sokaságban a selejtarány 3% (p=3)? 5 Nem lesz a zárthelyiben 6
A binomiális eloszlás összefüggéseivel számolunk: P n n n D PD 3 97 97 99 n Tehát a szükséges mintaelemszám 5 3 példa ln 5 ln 97 Tételezzük fel, hogy a gyártott papírdobozokon átlagosan nyomdai hiba van Hány doboz tartozzék egy mintába, hogy a mintában 95%-os valószínűséggel legalább hibát találjunk? A Poisson-eloszlás összefüggéseivel számolunk Jelölje r az egy mintába tartozó dobozok számát r 33 példa P k Pk 95 e r r, Pk e! e 95, ln 95 r, ln 5,9957 r 498 r = esetén P k e 83 987 Egy gyártási folyamatból n=5 elemű mintát vettek, a mintában 3 selejtes darabot találtak Egy későbbi időpontban szintén történt mintavétel, az n=4 elemű mintában a selejtes darabok száma 4 volt Eldöntendő, hogy megváltozott-e a folyamat selejtaránya, vagy csak a véletlen ingadozás okozza a különbséget H : p = p; H : p p A két mintában a tapasztalati selejtarány és az egyesített becslés: 3 4 3 4 p 6 ; p 5 ; p 89 4 5 4 z 6 97 8989 5 4 Az elfogadási tartomány 5 kétoldali szignifikanciaszinten (-96, 96), a próbastatisztika kiszámított értéke ezen belül van, bár közel az elutasítási határhoz, tehát elfogadjuk a nullhipotézist Az eltérő selejtarány a véletlen ingadozásnak tulajdonítható 7
34 példa Egy gyártási folyamatból alkalommal vettek elemű mintát A mintából számított selejtarány számtani középértéke (az átlagos selejtarány), a selejtarány korrigált tapasztalati szórásnégyzete A gyártás későbbi szakaszában 8 alkalommal vettek mintát, a minták elemszáma minden esetben volt A 8 mintából számított átlagos selejtarány 8, a selejtarány korrigált tapasztalati szórásnégyzete 85 Döntsük el 5-os szinten, hogy a selejtarány a két szakaszban azonos-e! H p Ep ; H : Ep Ep : E I II A két szakasz több mintából áll, a több mintából kiszámolható átlagos selejtarány a centrális határeloszlási tétel értelmében akkor is jó közelítéssel normális eloszlású, ha az egy minta selejtaránya még nem lenne elég közel a normális eloszláshoz (p kicsi vagy nagy, n nem elég nagy) Ráadásul itt a varianciát sem kell az ismeretlen p paraméter mintabeli becsléséből számolnunk, hanem több ismétlés lévén, tapasztalati szórásnégyzetet használhatunk Ekkor viszont nem u-, hanem t-próbát végzünk t p p 85 8 I 8 I II s s n I n II II 33 A 8 6 szabadsági fokszámhoz és =5 szignifikanciaszinthez tartozó kritikus érték Mivel a próbastatisztika talált értéke ez alatt van, elfogadjuk a nullhipotézist, mely szerint a két szakaszban a selejtarány csak a véletlen ingadozás miatt különbözik Vegyes feladatok az eloszlások és próbák témakörből A fejezetben szereplő példák megoldása a fejezet végén található A *-gal jelölt feladatok kicsit összetettebbek a többinél Ehhez hasonló számolásra zárthelyin nem kell számítani, de megértésük segíti az anyag megértését 35 példa Egy profi futócipő súlya 34g körül ingadozik g varianciával (a) Mi a valószínűsége annak, hogy egy cipő nehezebb, mint 37g? (b) Mekkora lehet a megengedett variancia a gyártás során, ha azt kívánjuk elérni, hogy a cipők 999%-a könnyebb legyen 37g-nál? (c) Ha a variancia g marad, mekkora legyen a várhatóérték, ha azt kívánjuk elérni, hogy a cipők 999%-a könnyebb legyen 37g-nál? 36 példa Egy printerrel nyomtatott festékpont átmérője normális eloszlást követ 5 mm várhatóértékkel és -4 mm varianciával (a) Mi a valószínűsége annak, hogy egy pont átmérője nagyobb lesz, mint 65 mm? (b) Mi a valószínűsége annak, hogy egy pont átmérője 4 és 65 mm közé esik? (c) Milyen intervallumban lesz a pontok 99%-ának átmérője? 8
37 példa Egy kémiai reakcióban a kitermelés normális eloszlást követ Előzetes adatokból ismert, hogy az ingadozás szigmája 3 Az elmúlt öt nap során a gyártás az alábbi kitermelésekkel ment: 96, 8875, 98, 8995 és 93 Adjon 95%-os konfidencia intervallumot a kitermelés várhatóértékére 38 példa Autó motorjába használt tömítőgyűrűket gyártanak A tömítőgyűrűk átmérője normális eloszlást követ, a szigma mm 5 tömítőgyűrűt megvizsgálva azt találták, hogy az átlagos átmérő 7436 mm (a) Adjon 99%-os kétoldali konfidencia intervallumot a tömítőgyűrű átmérőjére! (b) Adjon 99%-os alsó határt a tömítőgyűrű átmérőjére! Hasonlítsa össze a számított értéket az (a) feladatrészben kapott alsó határral 39 példa A TV képcsöveket úgy ellenőrzik, hogy mérik a rajtuk átfolyó áramerősséget képcső lemérésével kapott átlagos áramerősség 37 μa, a szórás 57 μa (a) Adjon 99%-os konfidencia intervallumot az áramerősségre Kell-e bármilyen feltételezésnek teljesülnie a számoláshoz az áramerősség értékek eloszlásával kapcsolatban? (b) Igazolják-e az adtok 5%-os szignifikanciaszinten, hogy az áramerősség várhatóértéke meghaladja a 3 μa-t? 4 példa Őszibarack konzervekben használt szirup cukortartalma normális eloszlást követ konzerv cukortartalmát megmérve az találták, hogy az átlagos cukortartalom 34 g, a szórás 8 g (a) Adjon 9%-os felső határt a cukortartalom várhatóértékére (b) Adjon 9%-os felső határt a cukortartalom varianciájára 4 példa Egy bizonyos elemtípus élettartama közelítőleg normális eloszlást követ, az ingadozás szigmája 5 óra elem élettartamát megmérve az átlagos élettartam 45 órának adódott (a) Ezek a mérési eredmények bizonyítják-e azt az állítást, hogy az elemtípus várható élettartama meghaladja a 4 órát? A kérdés 5%-os szignifikanciaszinten vizsgálandó (b)* Mekkora a statisztikai próbához tartozó p-érték? (c)* Mekkora a másodfajú hiba valószínűsége az (a) feladatrészben, ha az élettartam várhatóértéke 4 óra? (d)* Magyarázza meg, hogyan lehetett volna válaszolni az (a) feladatrész kérdésére a megfelelő konfidencia intervallum kiszámolása alapján! 9
4 példa A Medicine and Science in Sports and Exercise cikke egy olyan kísérletről számol be, amelyben elektrostimuláció hatását vizsgálták jégkorong játékosok teljesítményére Megmérték, hogy a kísérletben résztvevő 7 játékos mennyi idő alatt korcsolyázik le métert Az eredmények szórása 9 s volt Előzetes tanulmányokból ismert, hogy a m megtételéhez szükséges idő szigmája elektrostimuláció nélkül 75 s A kísérlet eredményei alapján állíthatjuk-e azt 5%-os szignifikanciaszinten, hogy az elektrostimuláció hatására csökken a játékosok teljesítményének ingadozása? 43 példa Egy szakaszos reaktorban kétféle katalizátorral végzik el ugyanazt a reakciót sarzsot gyártanak az A katalizátorral, az átlagos kitermelés 86%, a szórás 3% 5 sarzsot gyártanak a B katalizátorral, az átlagos kitermelés 89% a szórás % Bizonyítják-e az adatok azt a feltételezést, hogy a B katalizátorral nagyobb a kitermelés? 5%-os szignifikanciaszinten végezzük el az elemzést 44 példa Klinikai kísérletek során egypetéjű ikerpárok intelligenciahányadosát vizsgálták (Brain size, head size, and intelligence quotient in monozygotic twins, Neurology, 998, Vol 5, pp 46 5) Az alábbi táblázat tartalmazza a kísérleti eredményeket: Ikerpár sorszáma Születési sorrend: Születési sorrend: 68 573 6 58 3 799 84 4 744 684 5 648 643 6 799 876 7 63 63 8 76 76 9 63 659 75 767 Az adatok alapján %-os szignifikanciaszinten mondhatjuk-e azt, hogy az intelligencia függ a születési sorrendtől? Milyen feltételnek kell teljesülnie a választott statisztikai módszer alkalmazhatóságához? ok 35 példa (a) 69 (b) 948 g (c) 364 g
36 példa (a) 668 (b) 775 (c) 4 758 37 példa 8785, 93 38 példa (a) 74353 74367 (b) 7435 39 példa (a) 36, 33334 (b) H: μ μ=3; t=346> 833, elutasítjuk H-t 4 példa (a) 3387 (b) 7 4 példa (a) H: μ μ=4; z =6 <65, elfogadjuk H-t, nem látjuk bizonyítva, hogy az élettartam nagyobb mint 4 óra (b)* 38 (c) 35 (d)* 3985 µ 4 példa H: σ 75, χ =3<796 Elutasítjuk H-t, az adatok 5%-os szignifikanciaszinten bizonyítják, hogy csökken az ingadozás mértéke 43 példa F=5<57=F(,4), a varianciák egyesíthetők; H: µb-µa, t=3>78, elutasítjuk a nullhipotézist, az adatok bizonyítják, hogy B katalizátorral nagyobb a kitermelés 44 példa t=-366; -35<-366<35, elfogadjuk a nullhipotézist, az adatok nem bizonyítják, hogy az intelligenciahányados függ a születés sorrendjétől