ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika Reprezentatív mintavétel alapján a sokaság jellemző paramétereinek becslése. Minta alapján az alapsokaságra vonatkozó feltételezések, hipotézisek igazolása. Összefüggés vizsgálatok sztochasztikus modellekkel 3/62 Mi a modell? A modell összetett, bonyolult természeti képződmények, objektumok működésének megismerésére létrehozott egyszerűsített helyettesítő. Modellformák: Mechanikus analógok, elektromos analógok, fizikai, kémiai, matematikai modellek, stb. 4/62 Binomiális eloszlás Visszatevéses mintavételezés n = minta száma k = sikeres esemény száma p = sikerese esemény valószínűsége E=np D 2 =np(1-p) Binomiális eloszlás sűrűségfüggvény 5/62 6/62 1
Binomiális eloszlás gyakorlati alkalmazása Érme feldobása, a születendő gyerek neme, betegség kimenetele, környezetszennyezés Binomiális tesztek: két csoport relatív gyakoriságának összehasonlítása 300 dobás 7/62 8/62 Egyenletes eloszlás sűrűségfüggvénye Egyenletes eloszlás eloszlásfüggvénye 1/(b-a) 0 a b 9/62 10/62 Egyenletes eloszlás Egy valószínűségi változót az (a, b) intervallumon belül egyenletes eloszlású, ha eloszlásfüggvénye: Háromszög eloszlás Két egyenletes eloszlás összege Értelmezési tartományuk azonos Három jellemző érték: Minimum Módusz Maximum 11/62 12/62 2
Háromszög eloszlás sűrűségfüggvénye Sűrűségfüggvény a c b 13/62 14/62 Eloszlásfüggvény Jellemző értékek 15/62 16/62 Gyakorlati alkalmazás 300 dobás 6 dobókocka Üzleti szimuláció Projekt menedzselés Stb. 17/62 18/62 3
6 dobókocka, variációk száma Normális eloszlás felfedezői Abraham de Moivre fedezte fel és közölte le 1733-ban Pierre-Simon Laplace Carl Friedrich Gauss 19/62 20/62 Abraham de Moivre (1667-1754) Pierre-Simon Laplace (1749-1827) 21/62 22/62 Carl Friedrich Gauss (1777-1855) Számtani sorozat összege 23/62 24/62 4
A normális eloszlás mint modell A természetben nagyon sok mért paraméter normális eloszlással írható le, mint például az egyének magassága, vérnyomása, súlya, stb. Ez a modell jól leírja a mérési értékeknek a középérték (várható érték) körüli szóródását. A normális elnevezés arra utal, hogy a mért adatainktól ezt várjuk, mert ez a természetes viselkedésük. 25/62 6 dobókocka, variációk száma 26/62 Normális eloszlás sűrűségfüggvénye Normális eloszlás sűrűségfüggvénye 1 27/62 28/62 Eloszlásfüggvény Valószínűségek átlag 29/62 30/62 5
Normális eloszlás jelölése Standard normális eloszlás jelölése N(μ, σ) N(0, 1) 31/62 32/62 Standardizálás Standard normáleloszlás sűrűségfüggvénye μ, medián, módusz 33/62 34/62 Standard normális eloszlás eloszlásfüggvénye Standard normáleloszlás eloszlásfüggvénye 0,84 0,16 0,68 35/62 36/62 6
Standard normáleloszlás 68%-os valószínűsége A normál eloszlás nevezetes értékei Megbízhatóság % z 68 1 95 1,96 0,68 99 2,58 99,9 3,29 37/62 38/62 Konfidencia-intervallum Alapvető összefüggések μ ± z % S.E. 39/62 40/62 Az eloszlás alakjának jellemzése Ferdeség számítása Ferdeség (skewness, normális eloszlás=0 körüli érték) Csúcsosság (kurtosis, normális eloszlás=0 körüli érték) Aszimmetria mérőszáma Értéke: mínusz és plusz tartomány Nulla esetén szimmetrikus eloszlás 41/62 42/62 7
Balra ferde eloszlás Jobbra ferde eloszlás 43/62 44/62 Mikor ferde az eloszlás? Statisztikailag igazolt ferdeség, ha a ferdeségi mutató értéke meghaladja a ferdeségi érték szórásának kétszeresét. Az eloszlás nem szimmetrikus Egyéb aszimmetria mutatók Aszimmetria hányados Pearson-mutató Bowley-mutató F-mutató 45/62 46/62 Csúcsos és lapos eloszlás Csúcsosság számítása 47/62 48/62 8
A csúcsossági érték értelmezése Kolmogorov-Smirnov teszt Nulla esetén normális eloszlás Pozitív érték esetén az adatok szélesebb csoportban helyezkednek el Negatív érték esetén az adatok szűkebb csoportban helyezkednek el. Statisztikailag igazolt eltérés: a csúcsosság értéke meghaladja a szórásának kétszeresét 49/62 50/62 Kolmogorov-Smirnov teszt eredménye Egyéb normalitás vizsgálat Kolmogorov-Smirnov és Shapiro-Wilk próba 51/62 52/62 Grafikus normalitás vizsgálat 1. Grafikus normalitás vizsgálat 2. 53/62 54/62 9
Összefoglalás NORM.ELOSZLÁS NORM.ELOSZL(x;középérték;szórás;eloszlásfv) X: Az az érték, amelynél az eloszlást ki kell számítani. Középérték: Az eloszlás középértéke (várható értéke). Szórás: Az eloszlás szórása. Eloszlásfv: Logikai érték. Ha értéke IGAZ, akkor a NORM.ELOSZL függvény az eloszlásfüggvény értékét számítja ki, ha értéke HAMIS, akkor a sűrűségfüggvényét. 55/62 56/62 Példa 1. Átlag: 100 kg Szórás: 10 kg NORM.ELOSZL(x;100;10;hamis) Példa 2. Átlag: 100 kg Szórás: 10 kg NORM.ELOSZL(x;100;10;igaz) 57/62 58/62 Átlag: 100 kg Szórás: 10 kg Példa 3. Mi a valószínűsége, hogy 80 kg-nál kisebb lesz? 2% 59/62 INVERZ.NORM INVERZ.NORM(valószínűség;középérték;szórás) Valószínűség: A standard normális eloszláshoz tartozó valószínűség. Középérték: Az eloszlás középértéke (várható értéke). Szórás: Az eloszlás szórása. Megjegyzés Ha bármelyik argumentum értéke nem szám, akkor az INVERZ.NORM az #ÉRTÉK! hibaértéket adja vissza. Ha valószínűség < 0 vagy valószínűség > 1, akkor az INVERZ.NORM eredménye a #SZÁM! hibaérték lesz. Ha szórás 0, akkor az INVERZ.NORM a #SZÁM! hibaértéket adja eredményül. Az INVERZ.NORM a standard normális eloszlást használja, ha középérték = 0 és szórás = 1 (lásd INVERZ.STNORM). 60/62 10
STNORMELOSZL Z: Az az érték, amelynél az eloszlást ki kell számítani. Megjegyzés Ha a z argumentum értéke nem szám, akkor a STNORMELOSZL az #ÉRTÉK! hibaértéket adja eredményül. 61/62 INVERZ.STNORM INVERZ.STNORM(valószínűség) Valószínűség: A standard normális eloszláshoz tartozó valószínűség. Megjegyzés Ha a valószínűség értéke nem szám, akkor az INVERZ.STNORM az #ÉRTÉK! hibaértéket adja eredményül. Ha valószínűség < 0 vagy valószínűség > 1, akkor az INVERZ.NORM eredménye a #SZÁM! hibaérték lesz. Az INVERZ.STNORM függvény adott valószínűségértékkel olyan z értéket keres, amelynél STNORMELOSZL(z) = valószínűség. Így az INVERZ.STNORM pontossága függ az STNORM.ELOSZL pontosságától. Az INVERZ.STNORM függvény iterációs keresési eljárást alkalmaz. Amennyiben a keresés nem konvergál 100 lépés után, a függvény #HIÁNYZIK hibaértékkel tér vissza. 62/62 11