STATISZTIKA 10. Előadás Megbízhatósági tartományok (Konfidencia intervallumok) Sir Isaac Newton, 1643-1727 Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687) A Föld pályája a Nap körül TAVASZI TÉL TAVASZ NAPÉJEGYENLŐSÉG Márc. 21. NAP TÉLI NAPFORDULÓ Dec. 21. NYÁRI NAPFORDULÓ Jún. 22. ŐSZ NYÁR ŐSZI NAPÉJEGYENLŐSÉG Szept. 23. Pierre-Simon Laplace (1749-1827) Tudományos determinizmus Werner Karl Heisenberg, 1901-1976. 1
Határozatlansági reláció, 1927. Nem mérhető meg egyszerre pontosan egy részecske térbeli helye és impulzusa Impulzus = tömeg * sebesség Isten nem vet kockát Határozatlansági elv gyakorlati eredményei Pontbecslés intervallumbecslés A relatív gyakoriság A relatív gyakoriság megbízhatósági tartománya 1. Binomiális eloszlást feltételezve Nem túl kicsi n mintanagyság, és nem túl szélsőséges p relatív gyakoriság (np>5 és n(1-p)>5) Várható érték: E(x) = np Szórás: D(x) = Közelítés normális eloszlás segítségével Binomiális eloszlást feltételezve Nem túl kicsi n mintanagyság, és nem túl szélsőséges p relatív gyakoriság (np>5 és n(1-p)>5) 2
Dohányzás relatív gyakorisága n = 100 k = 30 p = 30/100 = 0,3 Várható érték = 30 95%-os megbízhatósági tartománya Szórás = Alsó széle: 0,205 Felső széle: 0,385 A relatív gyakoriság megbízhatósági tartománya 2. A π-re vonatkozó pontosabb érték, különösen np<5, vagy n(1-p)<5 esetén, az F-eloszlás segítségével bal oldalon: F-eloszlás Két adathalmaz varianciájának összehasonlítsa Az F-érték a két variancia hányadosa Számláló szabadságfoka = DF 1 Nevező szabadságfoka = DF 2 jobb oldalon: F=var 1 /var 2 3
Sir Ronald Aylmer Fisher 1890-1962 4
Excel F.ELOSZLÁS függvény Szintaxis F.ELOSZLÁS(x;szabadságfok1;szabadságfok2) X: Az az érték, amelynél a függvény értékét ki kell számítani. A relatív gyakoriság megbízhatósági tartománya 2. A π-re vonatkozó pontosabb érték, különösen np<5, vagy n(1-p)<5 esetén, az F-eloszlás segítségével bal oldalon: Szabadságfok1: Szabadságfok2: A számláló szabadságfoka. A nevező szabadságfoka. jobb oldalon: 95%-os megbízhatósági tartomány alfa = 0,05 Baloldali nű1 = 142 nű2 = 60 F = 1,45 C.I. 95% = 0,22 Jobboldali nű1 = 62 nű2 = 140 F = 1,41 C.I. 95% = 0,38 A medián megbízhatósági tartománya x 1, x 2, x 3,, x n nagyság szerint növekvő sorrendbe rendezett Normális eloszlás nem feltétel z=1,63; 1,96; 2,58 h csak egész szám lehet 95%-os megbízhatósági tartomány A számtani átlag eloszlása n = 101 Me = 51. adat értéke h = 40 C.I. 95% alsó = 41. adat értéke C.I. 95% felső = 61. adat értéke 5
A középérték megbízhatósági tartománya Student-féle t-eloszlás Ismert σ: Ismeretlen σ: t-eloszlás sűrűségfüggvénye William Sealy Gosset, 1876-1937. ahol: f=n-1 szabadságfok K: a minta elemszámától (n) függő konstans Student, 1908 A középérték 68%-os megbízhatósági tartománya σ ismert ±1 S.E. távolság 6
±1 S.E.-nyi tartományba esés valószínűsége 84 A középérték 95%-os megbízhatósági tartománya σ ismert 16 68 ±1,96 S.E.-nyi távolság ±1,96 S.E.-nyi tartományba esés valószínűsége 97,5 95 2,5 A középérték 99%-os megbízhatósági tartománya σ ismert ±2,58 S.E.-nyi távolság 7
±2,58 S.E.-nyi tartományba esés valószínűsége 99,5 Gyakorlati alkalmazás Minősítő vizsgálatok Szabvány teljesítése Etalonhoz hasonlítás Teljesíti-e az előírást? 99 0,5 Kefir zsírtartalma 3% n=30 átlag= 3,2% σ=0,5% Őszi búza hektolitertömege 80 kg n=30 átlag=75 kg σ= 15 kg A középérték megbízhatósági intervalluma véges sokaságban Véges korrekciós faktor Ha n/n>0,05 8
A középérték megbízhatósági intervalluma véges sokaságban Sokaság középértéke: 59 075 kg A középérték megbízhatósági intervalluma véges sokaságban Véletlen 121 elemű minta Minta középértéke: 61 155 kg Minta szórása: 72 658 kg Minta S.E.: 6 605 kg Minta fpc: 0,9264 Sokaság középértéke: 59 075 kg A szórás megbízhatósági tartománya 1. A szórás-négyzet eloszlása A khi-négyzet eloszlás A khi-négyzet eloszlást szokták Pearsonféle eloszlásnak, ill. Helmert-féle eloszlásnak is nevezni. A khi-négyzet eloszlás származtatása a normális eloszlásból Használjuk normális és nem normális eloszlású mintaelemek esetén 9
Excel KHI.ELOSZLÁS függvény Szintaxis A szórás megbízhatósági tartománya 1. KHI.ELOSZLÁS(x;szabadságfok) X: Az az érték, amelynél az eloszlást ki kell számítani. Szabadságfok: A szabadságfokok száma. Szórás 95%-os megbízhatósági tartomány 1. n 1000 alfa 0,05 z 1,959 szórás 10 A szórás megbízhatósági tartománya 2. Közelítés normális eloszlással C.I.alsó 9,580 C.I.felső 10,459 10
Szórás 95%-os megbízhatósági tartomány 2. n 1 000 alfa 0,05 z 1,959 szórás 10 A variancia megbízhatósági tartománya C.I.alsó 9,579 C.I.felső 10,458 Variancia 95%-os megbízhatósági tartománya n =1000 alfa = 0,025 z = 1,959963 variancia =100 C.I.alsó 91,937 C.I.felső 109,612 11