földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Hasonló dokumentumok
Statisztika Elıadások letölthetık a címrıl

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

egyetemi jegyzet Meskó Balázs

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Bevezetés a hipotézisvizsgálatokba

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

[Biomatematika 2] Orvosi biometria

Normális eloszlás paramétereire vonatkozó próbák

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis vizsgálatok

Hipotézis vizsgálatok

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Statisztika elméleti összefoglaló

A konfidencia intervallum képlete: x± t( α /2, df )

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Biometria gyakorló feladatok BsC hallgatók számára

A Statisztika alapjai

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Dr. Karácsony Zsolt. Miskolci Egyetem november

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Normális eloszlás tesztje

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

4. A méréses ellenırzı kártyák szerkesztése

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Nemparaméteres próbák

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

1. Két pályázat esetén a nyerési esélyeket vizsgálják. Mintát véve mindkét pályázat esetén az egyik. (b) Mit nevezünk másodfajú hibának?

KÖVETKEZTETŐ STATISZTIKA

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

Többváltozós lineáris regressziós modell feltételeinek

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József

V. Gyakorisági táblázatok elemzése

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

y ij = µ + α i + e ij

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Valószín ségszámítás és statisztika Gyakorlat (Statisztika alapjai)

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

0,1 P(X=1) = p p p(1-p) Egy p vszgő esemény bekövetkezik-e.

Baran Ágnes. Gyakorlat MATLAB. Baran Ágnes Gyakorlat 1 / 70

Variancia-analízis (VA)

Matematikai statisztika

Matematikai statisztikai elemzések 4.

Matematikai statisztikai elemzések 4.

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK EMELT SZINT Statisztika

Matematikai statisztika szorgalmi feladatok

Ismétlı áttekintés. Statisztika II., 1. alkalom

BIOMATEMATIKA ELŐADÁS

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Informatikai Intézet

10. Mintavételi tervek minısítéses ellenırzéshez

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Valószín ségszámítás és statisztika

Kísérlettervezés alapfogalmak

A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet

11. Matematikai statisztika

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Biomatematika 13. Varianciaanaĺızis (ANOVA)

A mérési eredmény megadása

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

III. Képességvizsgálatok

Kísérlettervezés alapfogalmak

Excel segédlet Üzleti statisztika tantárgyhoz

Poisson-eloszlás Exponenciális és normális eloszlás (házi feladatok)

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Statisztika. Politológus képzés. Daróczi Gergely április 24. Politológia Tanszék

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Biostatisztika Összefoglalás

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Átírás:

Matematikai statisztika elıadás, földtudományi BSc (geológus szakirány) 2014/2015 2. félév 6. elıadás

Konfidencia intervallum Def.: 1-α megbízhatóságú konfidencia intervallum: Olyan intervallum, mely legalább 1-α valószínőséggel tartalmazza a keresett paramétert. P ( T ( ) T ( )) 1, < < Θ ξ ξ ϑ α ϑ ϑ 1 2

Példa (normális eloszlás) A Gyorskenyér Kft automata kenyérsütı készülékei egyszerre 100 kenyeret sütnek ki. Ezek tömegei grammban mérve N(m,10 2 ) eloszlással közelíthetıek, ahol m a kezelı beállításától függ. Egy ellenırzésnél megmérték mind a 100 kenyér tömegét. Az átlag 990 g volt. Készítsünk 95%-os megbízhatóságú konfidencia intervallumot m-re!

Konfidencia intervallum normális eloszlás várható értékére (ismert szórás esetén) ξ ξ σ σ 1 2,..., ~ N ( m, ), ismert, Φ ( u ) = y n y σ σ P ξ u < m < ξ + u 1 α, 1 α 1 α = 2 n 2 n σ ξ α P m > u = 1, 1 α n σ P m < ξ + u = 1 α 1 α n

Konfidencia intervallum várható értékre (ismert szórás esetén) ξ 2 2 1,..., ξ n, E ξ i = m, D ξ i = σ, σ ismert 1 σ 1 σ P ξ < m < ξ + 1 α. α n α n α 1 u 1 α 2 α 10% 1,64 3,16 5% 1,96 4,47 2,50% 2,24 6,32 1% 2,58 10,00

Konfidencia intervallum sok megfigyelés esetén ξ ξ ξ = σ 1 2 2,..., n, D i ismert σ σ P ξ u m u ~ 1. 1 α < < ξ + α 1 α 2 n 2 n

Példák (milyen valószínőséggel születik fiúgyermek?) Svájcban 1871 és 1900 között a 2.644.757 megszületett gyermekbıl 1.359.671 fiú és 1.285.086 lány volt. Fiúk relatív gyakorisága így 0,5141. 1 p (1 p ) 4 u u P ξ < p < ξ + ~ 2 Φ ( u ) 1 2 n 2 n Esetünkben 0,9973 valószínőséggel 0,5132 p 0,5150

Konfidencia intervallum normális eloszlás várható értékére (ismeretlen szórás esetén) Ha a szórás nem ismert, becsüljük Tétel (biz. nélkül): normális eloszlású minta esetén a mintaátlag és a tapasztalati szórás független n-1 szabadságfokú t (Student) eloszlás: X 0, X X X n ( ) X +... + X 2 2 1 1,..., 0 független n / n ~ t n N (01),

Konfidencia intervallum normális eloszlás várható értékére (ismeretlen szórás esetén) (folyt.) 2 2 1 1 ( ξ ) n 1 n 1, y ( ( ) 2 ( ) 2 ) ξ,..., ξ ~ N ( m, σ ), ɶ σ = ξ ξ +... + ξ ξ / ( n 1) n n n m ~ t 2 n 1 ɶ σ P ( t < t ) = y ɶ σ ɶ σ P ξ t m t 1, n 1,1 α < < ξ + n 1,1 α α = 2 n 2 n ɶ σ P m > ξ t n 1,1 α = 1 α, n ɶ σ P m < ξ + t n 1,1 α = 1 α n

Példa (kenyér. folyt.) Tegyük fel most, hogy nem ismerjük Gyorskenyér Kft kenyereinek szórását. Az átlag 990 g volt. Ismert 10 szórásnál 991,6 g volt a 95%- os megbízhatóságú felsı konfidencia határ. Amennyiben a korrigált tapasztalati szórás is 10, akkor ez a határ csak kis mértékben változik (991,8 g). Azonban 50-es korrigált tapasztalati szórásnál ez az érték 999 g-ra változik.

u és t együtthatók összehasonlítása 1 5% 1,64 ( (1,64) 95%) u = Φ = n t n 1,1 5% 2 6,31 3 2,92 4 2,35 5 2,13 10 1,83 20 1,73 50 1,68 100 1,66 1000 1,65

Mindenhol azt olvasni, hogy a napi/heti/havi bad beat nem számít, sokkal fontosabb a hosszútáv, amikor a matematikai esély érvényesül. Jelenlegi eredményeink mennyire reálisak? Mikor ésszerőbb inkább felhagyni a pókerrel? Mikor lehetünk optimisták? Mekkora játékszám szükséges ennek megállapítására? Most bemutatok egy idevágó táblázatot, amely 95% pontossággal megadja a jelenlegi játékszámod és nyerési %-od alapján, hogy a jelen eredményeid mennyire lehetnek valósak. (Pl. Ha 60%-os vagy 100 játék után, akkor a valós nyerési százalékod igen nagy (95%-os) valószínőséggel 50,4-69,6% között van.) Igaz, csak három - 50-55- 60 %-os - mutatóval dolgozik, de attól még igencsak hasznos a jövıbeni tervek megalapozottságához. http://www.pokerakademia.com/poker_blogok/hideyoshi/mi_szamit_hosszutavnak_a_hu_sng_ban/ A táblázat helyességét nem ellenıriztem! /AM/

After polling 1000 eligible voters, the Star-Tribune Newspaper reported that 55% of Americans would vote for James Bean and 45% for John F Daniels +/- 3%.

Hipotézisvizsgálat H 0 nullhipotézis (jelezni akarjuk, ha nem igaz) H 1 ellenhipotézis Gyakran paraméterekkel fogalmazzuk meg: H : ϑ Θ 0 0 H : ϑ Θ 1 1 Θ Θ = Θ 0 1

Példák Igaz-e, hogy 0,5 valószínőséggel születik fiúgyermek? H 0 : 0,5 valószínőséggel születik fiúgyermek H 1 : nem 0,5 valószínőséggel születik fiúgyermek H : p = 0,5 0 H : p 0,5 1

Kárszám Vezetık száma Példák (folyt.) Mi lehet egy vezetı által okozott károk számának eloszlása? H 0 : a kárszám Poisson eloszlású H 1 : a kárszám nem Poisson eloszlású 0 1 2 3 4 5 6 7 >7 Összesen 129524 16267 1966 211 31 5 1 1 0 148006

Ki tanul jobban? 2009. január 5-ei vizsga H 0 : A nık jobban tanulnak Jegy Férfi Nı Összesen 1 47 4 51 2 11 1 12 3 11 2 13 4 9 2 11 5 8 2 10 Összesen 86 11 97 Átlag 2,1 2,7 2,1

Lehetséges hibák Elsıfajú hiba: H 0 igaz, de elutasítjuk Másodfajú hiba: H 0 hamis, de elfogadjuk Döntésünknek a megfigyelésektıl kell függnie. Mintateret 2 részre osztjuk: elfogadási és elutasítási tartományra.

Alapfogalmak Emlékeztetı: mintatér: a minta lehetséges értékeinek halmaza. X e U X k X k : azon lehetséges értékek halmaza, amelyek megfigyelése esetén elutasítjuk a nullhipotézist. Gyakran statisztika segítségével határozzuk meg: T ( x ) = 1, 0, x X x X k k

Döntés: Lehetséges hibák Elsıfajú hiba: H 0 igaz, de elutasítjuk Másodfajú hiba: H 0 hamis, de elfogadjuk Aktuális helyzet A nullhipotézis igaz A nullhipotézis hamis Elfogadjuk a nullhipotézist Helyes döntés Másodfajú hiba Elutasítjuk a nullhipotézist Elsıfajú hiba Helyes döntés

Alapfogalmak Emlékeztetı: X mintatér: a minta lehetséges értékeinek halmaza. X = X e U X k X k : azon lehetséges értékek halmaza, amelyek megfigyelése esetén elutasítjuk a nullhipotézist. Gyakran statisztika segítségével határozzuk meg: T ( x ) = 1, 0, x X x X k k

Elsıfajú hiba valószínősége α a próba terjedelme, ha minden ϑ Θ -ra P ϑ ( ) 0 X α a próba szignifikanciaszintje (másképp: a próba pontos terjedelme), sup P ξ X = ϑ Θ ξ ϑ k α ( ) k α 0

Példa (egyetlen megfigyelés) H 0 : a megfigyelés N(4,1) eloszlású

Példa (sörök megkülönböztetése) Ki tudják-e választani a különbözı sört? 24 emberen kísérleteztek. H : p = 1, H : p > 1 0 3 1 3

Az eloszlás H 0 esetén

Kritikus tartomány megválasztása

Másodfajú hiba valószínősége ( ξ X ), Θ e 1 P ϑ ϑ

Példa (sörös) p=0.5 esetén a másodfajú hiba valószínősége

Erıfüggvény A próba erıfüggvénye β ( ϑ )= P ϑ ξ X = 1- P ϑ ξ X, ϑ Θ ( ) ( ) k e 1

U-próba ξ 1 ξ n N m σ m σ H : m = m 2,..., ~ (, ), ismeretlen, ismert. 0 0 H : m m (kétoldali ellenhipotézis) 1 0 H ': m < m (egyoldali ellenhipotézis) 1 0 H '': m > m (egyoldali ellenhipotézis) 1 0 0 U = n σ H U ~ N (0,1) 0 ξ m m m 0 H 1 U ~ N n,1 σ

U próba (kétoldali ellenhipotézis) Φ ( u ) = y y x m 0 x n u 1 α σ 2 X k = : ( ) ( ) ( ) ( ) ξ X 1 1 α 1 α 1 α P = P U u = Φ u + Φ u = m k m 0 0 ( ) ( ) α α α = 1 1 + 1 1 =. 2 2 2 2 2 ( ) ( ) ξ 1 α β ( m ) = P X = P U u = m k m ( ) 2 ξ m m m 0 1 P m u 1 1 α < U < u P 1 α = m u n n u 1 α < + < 1 α = 2 2 2 σ σ 2 m m 0 ξ m m m 0 1 P m u 1 α n < n < u n 1 α = 2 2 σ σ σ 1 m m 0 m m 0 Φ u n u n 1, m m 1 α + Φ 2 1 α 2 n σ σ 0