Gyakorlat (Statisztika alapjai) 2018. december 2.
Statisztika alapjai 1 A mérnökinformatikus hallgatók zárthelyi dolgozatot írtak, ahol a maximális pontszám 50 pont volt. Véletlenszer en megnéztük 5 hallgató dolgozatát és a következ eredményeket kaptuk: 38, 21, 49, 11, 35. Határozzuk meg a minta átlagát, a korrigált szórását! Rajzoljuk fel a minta empirikus eloszlásfüggvényét! MATLAB segítségével ellen rizzük a számításokat, és rajzoltassuk ki az empirikus eloszlásfüggvényt!
Statisztika alapjai Az ecdf(adatsor) paranccsal kirajzoltathatjuk az adott mintarealizációnkhoz tartozó empirikus eloszlásfüggvényt: y=[38 21 49 11 35]; mean(y) std(y) [f,x]=ecdf(y) ecdf(y)
Statisztika alapjai 2 Generáljunk MATLAB segítségével egy, az (1, 2) intervallumon egyenletes eloszlású 8 elem mintát. (a) Határozzuk meg a minta átlagát, a korrigált szórását! (b) Rajzoltassuk ki a minta empirikus eloszlásfüggvényét és tényleges eloszlásfüggvényét!
Statisztika alapjai A cdf(eloszlás típusa, alappontok, paraméterek) paranccsal az eloszlásunkhoz tartozó eloszlásfüggvény értékeit számolhatjuk ki a megadott alappontokban: y1=rand(1,8)+1; [f,x]=ecdf(y1); disp(['atlag: ', num2str(mean(y1))]) disp(['korrigalt szoras: ', num2str(std(y1))]) figure; ecdf(y1) x1=0:0.01:3; y2=cdf('uniform',x1,1,2); hold on; plot(x1,y2,'r') ylim([0 1.1]);
Leíró statisztika 3 Egy, a (0, 1) intervallumon egyenletes eloszlású véletlenszám generátor az alábbi 8 számot generálta. 0.18, 0.57, 0.82, 0.55, 0.63, 0.12, 0.91, 0.31. Határozza meg a mintaátlagot, a korrigált tapasztalati szórást, valamint rajzolja fel a minta empirikus eloszlásfüggvényét és a tényleges eloszlásfüggvényt! 4 Egy ötelem minta esetén a mintaelemek összege 155, a mintaelemek négyzeteinek összege 4837. Határozza meg a mintaátlagot és a korrigált tapasztalati szórást!
Leíró statisztika 5 Generáljunk egy 1000 elem, 3 várható érték, 4 szórásnégyzet normális eloszlású mintát. (a) A mintához készítsünk hisztogramot, úgy, hogy az x-tengelyen a "Meggyelt értékek" szerepel, míg az y -tengelyen a "Bekövetkezések száma". (gure(1)) (b) Készítsük hisztogramot úgy, hogy 30 intervallumra osztjuk a számegyenest!(gure(2)) (c) Készítsük hisztogramot úgy, hogy a részintervallumok a következ k legyenek: [ 4, 3], [ 3, 2],..., [9, 10]! (gure(3)) (d) Készítsünk végül úgy hisztogramot, hogy az adatokat legjobban közelít normális eloszlás s r ségfüggvényét is kirajzoltatjuk! (gure(4))
Leíró statisztika (a) A histogram(adatsor) parancs segítségével: y=3+2*randn(1000,1); figure(1); histogram(y) xlabel('megfigyelt ertekek'); ylabel('bekovetkezesek szama'); (b) A histogram(adatsor, osztályok száma) paranccsal megadható, hogy hány csoportba szeretném szétosztani az adatokat: figure(2); histogram(y,30)
Leíró statisztika (c) A histogram(adatsor, részintervallumok végpontjai) segítségével lerögzíthet ek az osztályok végpontjai: alapp=-4:10; figure(3); histogram(y,alapp) (d) A histt(adatsor) segítségével: figure(4); histfit(y)
Leíró statisztika 6 Generáljunk egy 1000 elem, [ 2, 2] intervallumon egyenletes eloszlású mintát! Adjuk meg a minta átlagát, korrigált szórását, varianciáját (korrigált szórás négyzetét)! y=4*rand(1,1000)-2; mean(y) std(y) var(y)
u-próba 7 Egy teherautórakománnyi félliteres üdít italból 10 palackot véletlenszer en kiválasztva és lemérve azok rtartalmát az alábbi, milliliterben kifejezett értékeket kaptuk: 499, 525, 498, 503, 501, 497, 493, 496, 500, 495. Ismert, hogy a palackokba töltött üdít ital mennyisége normális eloszlású 3 ml szórással. 95%-os, illetve 99%-os döntési szintet használva vizsgálja meg a gyártó azon állítását, hogy a palackokba átlagosan fél liter üdít italt töltöttek! Adja meg a várható értékre vonatkozó kondenciaintervallumot! A fenti kérdéseket MATLAB segítségével is válaszoljuk meg!
u-próba y=[499 525 498 503 501 497 493 496 500 495]; N=length(y); mu0=500; sigma=3; Els megoldásként csak a standard normális eloszlás eloszlásfüggvényének inverzét használjuk (norminv(szintt l függ valószín ség)): alpha=0.05; u=norminv(1-alpha/2); atlag=mean(y); kint=[atlag-u*sigma/sqrt(n) atlag+u*sigma/sqrt(n)] if abs(atlag-mu0)< u*sigma/sqrt(n) disp('h0-t elfogadjuk') else disp('h0-t elutasítjuk') end
u-próba Az u-próbára beépített parancsot is használhatunk (ztest(adatsor,feltételezett várható érték, ismert szórás): [H,P,KInt]=ztest(y,mu0,sigma) Továbbá, ha a próba szintjén változtatni szeretnénk [H,P,KInt]=ztest(y,mu0,sigma,'alpha',0.01)
u-próba, egyoldali ellenhipotézis 8 Az Ezt idd teát 200 grammos dobozokban árulják, a csomagológép szórása 4 gramm. A Fogyasztóvédelmi Felügyel ség lemérte öt véletlenszer en kiválasztott teásdoboz tömegét, melyekre az alábbi grammban kifejezett értékek adódtak: 196, 202, 198, 197, 190. Hipotéziseit pontosan megfogalmazva és feltételezve, hogy a teásdobozok tömege normális eloszlást követ, döntsön 98%-os szinten, hogy az átlagos tölt tömeg tényleg 200 gramm, avagy kevesebb annál!
u-próba, egyoldali ellenhipotézis A ztest parancsban a 'tail', 'right', vagy 'tail', 'left' segítségével rendre jobb-, illetve baloldali ellenhipotézis is vizsgálható: y=[196 202 198 197 190]; N=length(y); mu0=200; sigma=4; alpha=0.02; u=norminv(1-alpha); atlag=mean(y); if atlag<mu0-u*sigma/sqrt(n) disp('h0-t elutasítjuk') else disp('h0-t elfogadjuk') end Az u-próba közvetlenül: [H,P]= ztest(y,mu0,sigma,'tail','left','alpha',0.02)
t-próba 9 Egy üzem gyártósorán az egyik szerelési feladatra megadott szintid 9 perc. Az e ponton dolgozó alkalmazottak már több kérvényben kérték a szintid felemelését, mivel véleményük szerint az nem elegend a feladat elvégzésére. Az üzem vezet sége egy ellen rt küldött ki, aki 12 véletlenszer en kiválasztott alkalommal megmérte a feladat elvégzéséhez szükséges id t. Az eredmények az alábbiak: 9.4, 8.8, 9.3, 9.1, 9.4, 8.9, 9.3, 9.2, 9.6, 9.3, 9.3, 9.1. Hipotéziseit és az adatokra vonatkozó feltételeit pontosan megfogalmazva döntsön 99%-os szinten, igazuk van-e a munkásoknak!
t-próba y=[9.4 8.8 9.3 9.1 9.4 8.9 9.3 9.2 9.6 9.3 9.3 9.1]; N=length(y); mu0=9; Els megoldásként csak a t-eloszlás eloszlásfüggvényének inverzét használjuk (tinv(szintt l függ valószín ség, szabadsági fok)): korr_sz=std(y); alpha=0.01; atlag=mean(y); t=tinv(1-alpha,n-1); if atlag>mu0+t*korr_sz/sqrt(n) disp('h0-t elutasítjuk') else disp('h0-t elfogadjuk') end
t-próba A t-próbára beépített parancs is létezik: ttest(adatsor,feltételezett várható érték), mely esetén a próba szintje szint ugyanúgy változtatható, mint a ztest esetén. [H,P]=ttest(y,mu0,'tail','right','alpha',0.01)
t-próba 10 Az atlétikai világbajnokságon résztvev kokszföldi csapat néhány versenyz je arra panaszkodott, hogy a leadott doppingtesztjeiket nem megfelel en analizálták és az egyik szernek túlságosan magas koncentrációját mutatták ki, minek következtében a versenybíróság törölte az eredményeiket. A Kokszföldi Atlétikai Szövetség a laboratóriumot tesztelend nyolc mintát küldött, melyek mindegyikében a kérdéses anyag koncentrációja pontosan 0.500 g/l volt. A laboratórium az alábbi eredményeket szolgáltatta: 0.485, 0.518, 0.460, 0.530, 0.560, 0.550, 0.490, 0.575. A laboratórium mérési hibáját normálisnak tételezve fel döntsön 95%-os szinten, igazuk van-e az atlétáknak!
t-próba y=[0.485 0.518 0.46 0.53 0.56 0.55 0.49 0.575]; N=length(y); mu0=0.5; korr_sz=std(y); alpha=0.05; atlag=mean(y); t=tinv(1-alpha,n-1); if atlag>mu0+t*korr_sz/sqrt(n) disp('h0-t elutasítjuk') else disp('h0-t elfogadjuk') end [H,P]=ttest(y, mu0,'tail','right')
Irodalom Baran Sándor: feladatok, Feladatgy jtemény. Denkinger Géza: Valószín ségszámítási gyakorlatok, Nemzeti Tankönyvkiadó Rt. 2000. Stahel Andreas: Statistics with MATLAB/Octave, BFH-TI, Biel.