Valószín ségszámítás és statisztika
|
|
- Gizella Péter
- 5 évvel ezelőtt
- Látták:
Átírás
1 Valószín ségszámítás és statisztika Informatika BSc, esti tagozat Backhausz Ágnes 2016/2017. tavaszi félév
2 Valószín ségi vektorváltozó Deníció Az X = (X 1,..., X n ) : Ω R n függvény valószín ségi vektorváltozó, ha tetsz leges a i < b i (i = 1, 2,..., n) valós számokra teljesül, hogy {ω Ω : a 1 < X 1 (ω) b 1, a 2 < X 2 (ω) b 2,..., a n < X n (ω) b n } A. Ha X valószín ségi vektorváltozó, akkor az X i valószín ségi változó eloszlását az X i. peremeloszlásának nevezzük. Az X valószín ségi vektorváltozó diszkrét, ha értékkészlete véges vagy megszámlálhatóan végtelen. Példa. X i : egy adott weboldalt az i. órában hányan töltenek be (i = 1, 2,..., 24). (X 1,..., X 24 ) valószín ségi vektorváltozó. Y i : a Duna vízállása az i. napon.
3 Valószín ségi vektorváltozó: példa 1. ábra. X 1 = 106, X 2 = 133,..., X 20 = 186
4 A kovariancia Deníció (Kovariancia) Legyenek X és Y olyan valószín ségi változók, melyeknek szórása létezik. Ekkor az X és Y kovarianciája: cov(x, Y ) = E [ (X E(X )) (Y E(Y )) ]. Állítás Legyenek X, Y, Z, X 1,..., X n olyan valószín ségi változók, melyek szórása létezik. Ekkor a következ k teljesülnek. A kovariancia kiszámítása. cov(x, Y ) = E(X Y ) E(X )E(Y ). Szimmetria. cov(x, Y ) = cov(y, X ). Kapcsolat a szórásnégyzettel. cov(x, X ) = D 2 (X ).
5 A kovariancia tulajdonságai Állítás Konstanssal való kovariancia. cov(x, c) = 0, ha c R. Linearitás. Egyrészt cov(x + Y, Z) = cov(x, Z) + cov(y, Z), másrészt tetsz leges c R számra cov(cx, Y ) = c cov(x, Y ). Függetlenséggel való kapcsolat. Ha az X és Y valószín ségi változók függetlenek, akkor cov(x, Y ) = 0. Összeg szórásnégyzete. D 2 (X + Y ) = D 2 (X ) + D 2 (Y ) + 2cov(X, Y ). Továbbá ( n ) n D 2 X i = D 2 (X i ) + 2 cov(x, Y ). i=1 Különbség szórásnégyzete D 2 (X Y ) = D 2 (X ) + D 2 (Y ). i=1 i<j
6 Korrelálatlanság Példa. Legyen X Poisson-eloszlású valószín ségi változó 2 paraméterrel. Ekkor cov(x + 3, 2 X ) (e) = 2cov(X + 3, X ) (e) = 2cov(X, X ) + 2cov(3, X ) = (c,d) = 2D 2 (X ) = 2 2 = 4.
7 Korrelálatlanság Példa. Legyen X Poisson-eloszlású valószín ségi változó 2 paraméterrel. Ekkor cov(x + 3, 2 X ) (e) = 2cov(X + 3, X ) (e) = 2cov(X, X ) + 2cov(3, X ) = (c,d) = 2D 2 (X ) = 2 2 = 4. Deníció (Korrelálatlanság) Ha az X, Y valószín ségi változók kovarianciája 0, akkor azt mondjuk, hogy X és Y korrelálatlanok. Állítás (Függetlenség és korrelálatlanság) Ha az X és Y valószín ségi változók függetlenek és szórásuk létezik, akkor korrelálatlanok. A korrelálatlanságból nem következik a függetlenség. Legyen X és Y két szabályos kockadobás, ezek függetlenek. Legyen továbbá U = X + Y, V = X Y. Ekkor, bár X + Y és X Y nem függetlenek: cov(x + Y, X Y ) (e,d) = D 2 (X ) cov(x, Y ) + cov(x, Y ) D 2 (X ) (f ) = 0.
8 Korrelációs együttható Deníció Legyenek X és Y olyan valószín ségi változók, melyek szórásnégyzete létezik. Ekkor X és Y korrelációs együtthatója: { cov(x,y ) D(X )D(Y ), ha D(X ) > 0, D(Y ) > 0; R(X, Y ) = 0, ha D(X ) = 0 vagy D(Y ) = 0.
9 Korrelációs együttható Deníció Legyenek X és Y olyan valószín ségi változók, melyek szórásnégyzete létezik. Ekkor X és Y korrelációs együtthatója: { cov(x,y ) D(X )D(Y ), ha D(X ) > 0, D(Y ) > 0; R(X, Y ) = 0, ha D(X ) = 0 vagy D(Y ) = 0. Állítás Legyenek X és Y olyan valószín ségi változók, melyek szórása létezik. (i) Ekkor teljesül, hogy R(X, Y ) 1. (ii) Legyen a > 0 valós szám, b tetsz leges valós szám. Ekkor R(X, ax + b) = 1 és R(X, ax + b) = 1. (iii) Tegyük fel, hogy R(X, Y ) = 1. Ekkor léteznek olyan a és b valós számok, hogy az Y = ax + b egyenlet 1 valószín séggel teljesül.
10 Lineáris regresszió 2. ábra. A CFC-12 (freon) gáz koncentrációja az Antarktiszon és az adatokra illesztett egyenes
11 Lineáris regresszió Egyenes illesztése a legkisebb négyzetek módszerével: Állítás (Lineáris regresszió) Legyenek (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ) adott számpárok. Azokat az a és b együtthatókat keressük, melyre a h 2 = 1 n n [y i (ax i + b)] 2 i=1 mennyiség minimális. Ennek megoldása: n i=1 â = (x i x)(y i y) n k=1 (x ; ˆb = y âx. k x) 2 A példában: â = 1, 11; ˆb = 21890
12 Lineáris modell Deníció (Lineáris modell) Legyenek X 1, X 2,..., X n, Y 1,..., Y n valószín ségi változók, és tegyük fel, hogy valamely a, b valós számokra Y i = ax i + b + ε i, ahol ε 1,..., ε n független N(0, σ 2 ) eloszlású valószín ségi változók. Az így kapott (X i, Y i ) párok együttes eloszlását lineáris modellnek nevezzük. Az X i valószín ségi változókat magyarázó változóknak, az ε i valószín ségi változókat hibának szokták nevezni.
13 Becslések a lineáris modellben Állítás A lineáris modellben az a, b együtthatók ML-becslése a következ képpen írható: â = n i=1 (X i X )(Y i Y ) n k=1 (X k X ) 2 ; ˆb = Y âx. Továbbá, ezek a becslések torzítatlan becslései az a és b paramétereknek. A hiba szórásának becslése: ˆσ 2 = 1 n (Y i âx i n ˆb) 2. 2 j=1 A becslések szórása: D(â) = σ n j=1 (X j X ) 2 ; D(ˆb) = σ 1 n + X 2 n j=1 (X j X ). 2
14 El rejelzés a lineáris modellben Állítás Legyen x adott szám. A lineáris modellb l kapott el rejelzés az Y véletlen folyamat x pontban felvett értékére: âx + ˆb. Az el rejelzés szórása: D(âx + ˆb) 1 = σ n + (x X ) 2 n j=1 (X j X ). 2 Az el rejelzés szórásának becslésekor a σ értéket gyakran ˆσ-val helyettesítik.
15 El rejelzés a lineáris modellben 3. ábra. A CFC-11 és CFC-12 (freon) gáz koncentrációja (forrás: elte.promt.hu)
16 Reziduálisok A teljes ingadozás (total sum of squares): n j=1 (Y j Y ) 2. Deníció A megmagyarázott ingadozás részaránya (coecient of determination): R 2 = [ n i=1 (X i X )(Y i Y ) ] 2 [ n k=1 (X k X ) 2][ n k=1 (Y k Y ) 2]. Az R 2 értéke 0 és 1 közé esik. Értelmezés: minél közelebb van 1-hez, annál inkább jó közelítést ad a lineáris modell. Ugyanakkor R érzékeny a kiugró értékekre. A példában: R 2 = 0, 9951, vagyis jól illeszkedik a lineáris modell.
17 Statisztikai alapfogalmak Deníció Egy X = (X 1, X 2,..., X n ) : Ω H R k valószín ségi vektorváltozót (n elem ) mintának nevezünk. Itt H a mintatér, n a minta elemszáma vagy nagysága. Az X i koordináták a minta elemei. Azt mondjuk, hogy a minta független, ha az X 1, X 2,..., X n valószín ségi változók függetlenek. Deníció A mintatéren megadott T : H R k függvényt, illetve a T = T (X ) valószín ségi változót (k-dimenziós) statisztikának nevezzük. Példa. mintaátlag (mean) n X = 1 n j=1 X j
18 Statisztikai alapfogalmak Deníció Egy X = (X 1, X 2,..., X n ) : Ω H R k valószín ségi vektorváltozót (n elem ) mintának nevezünk. Itt H a mintatér, n a minta elemszáma vagy nagysága. Az X i koordináták a minta elemei. Azt mondjuk, hogy a minta független, ha az X 1, X 2,..., X n valószín ségi változók függetlenek. Deníció A mintatéren megadott T : H R k függvényt, illetve a T = T (X ) valószín ségi változót (k-dimenziós) statisztikának nevezzük. Példa. mintaátlag (mean) n X = 1 n j=1 X j medián: a nagyság szerinti középs mintaelem, vagy a középs kett átlaga.
19 Leíró statisztikák mintaátlag (mean): X = 1 n n j=1 X j. tapasztalati szórásnégyzet: s 2 n = 1 n n (X j X ) 2 = 1 n j=1 n j=1 X 2 j X 2. tapasztalati szórás: s n = s 2 n. korrigált tapasztalati szórásnégyzet (variance): s 2 n = 1 n 1 n (X j X ) 2 = n n 1 j=1 ( 1 n n j=1 X 2 j X 2 ). korrigált tapasztalati szórás (standard deviation, sd): s n = s 2 n.
20 Leíró statisztikák minimum: a legkisebb mintaelem, azaz min(x 1, X 2,..., X n ). maximum: a legnagyobb mintaelem, azaz max(x 1, X 2,..., X n ). terjedelem (range): a legnagyobb és legkisebb mintaelem különbsége, azaz max(x 1, X 2,..., X n ) min(x 1, X 2,..., X n ). medián: a nagyság szerinti középs mintaelem, vagy a középs kett átlaga (ha n páros). módusz (mode): a leggyakrabban el forduló mintaelem.
21 Példa: az adatok elemzése Egy boltban a naponta vásárlók száma:
22 Példa: az adatok elemzése Egy boltban a naponta vásárlók száma: a mintaelemek száma: n = 20 minimum: 99, maximum: 218, terjedelem: = 119 átlag: 149,9, medián: 141,5 korrigált tapasztalati szórás: 38,55
23 Példa: az adatok elemzése Egy boltban a naponta vásárlók száma: a mintaelemek száma: n = 20 minimum: 99, maximum: 218, terjedelem: = 119 átlag: 149,9, medián: 141,5 korrigált tapasztalati szórás: 38,55 5 napon volt 115-nél kevesebb vásárló (a napok egynegyedén), és 3 napon jöttek 200-nál többen (a napok 15%-án).
24 Példa: alapstatisztikák mintaelemszám: n = 20 minta: X 1 = 106, X 2 = 133,..., X 20 = 186. átlag: X = 149, 9 tapasztalati szórásnégyzet: s 2 n = 1412, 09 tapasztalati szórás: s n = 37, 58 korrigált tapasztalati szórásnégyzet: s 2 n = 1486, 411 korrigált tapasztalati szórás: s n = 38, 55
25 Példa: hisztogram A vásárlók számának hisztogramja
26 Példa: hisztogram Választunk egy intervallumot, mely magában foglalja a mérési adatokat. Az intervallumot egyenl nagyságú részekre osztjuk. Az egyes kis intervallumokba es mérési adatok számát ábrázoljuk.
27 Momentumok Deníció Legyen X valószín ségi változó, k 1 egész szám. Ekkor az X valószín ségi változó k. momentuma: E(X k ), ha ez a várható érték létezik. Legyen X 1, X 2,..., X n minta. Ekkor a minta k. tapasztalati momentuma: 1 n n j=1 X k j.
28 Rendezett minta Rendezett minta: a mintaelemeket nagyság szerint növekv sorrendbe állítjuk. Jelölés: (X 1, X 2,..., X n ). Vagyis {X 1, X 2,..., X n } = {X 1, X 2,..., X n } és X 1 X 2... X n. A minimum X 1, a maximum X n. A k. legkisebb mintaelem X k.
29 Rendezett minta Rendezett minta: a mintaelemeket nagyság szerint növekv sorrendbe állítjuk. Jelölés: (X 1, X 2,..., X n ). Vagyis {X 1, X 2,..., X n } = {X 1, X 2,..., X n } és X 1 X 2... X n. A minimum X 1, a maximum X n. A k. legkisebb mintaelem X k. Példa: a vásárlók számáról kapott húszelem adatsor rendezett mintája: X 1 = 99, X 2 = 102, X 3 = 106,..., X 6 = 120,..., X 10 = 135 X 11 = 148,..., X 14 = 171,..., X 20 = 218.
30 Medián Minta: (X 1, X 2,..., X n ), mintaelemszám: n. Deníció (medián) Ha n páratlan: a rendezett minta középs, (n+1)/2. elemét, azaz X (n+1)/2 -t a minta mediánjának nevezzük. Ha n páros: a rendezett minta n/2. és n/ elemének átlagát, azaz a X n/2 + X n/2+1 mennyiséget a minta mediánjának nevezzük. 2 Megjegyzés: páros n esetén a teljes [ X n/2, X n/2+1] intervallumot (vagy annak bármely elemét) is a minta mediánjának lehet hívni. Példa: a vásárlók számáról kapott húszelem minta mediánja: 1 2 (X 10 + X11) = 1 ( ) = 141, 5. 2
31 Az átlag és a medián összehasonlítása Normális eloszlás 500 elem független minta: X 1, X 2,..., X 500 függetlenek, eloszlásuk normális eloszlás m = 1 várható értékkel és σ = 1 szórással Min. 1st Qu. Median Mean 3rd Qu. Max Exponenciális eloszlás 500 elem független minta: Y 1, Y 2,..., Y 500 függetlenek, eloszlásuk exponenciális eloszlás b = 1 paraméterrel. E(Y k ) = 1 és D(Y k ) = 1 minden k = 1, 2,..., 500-ra. Min. 1st Qu. Median Mean 3rd Qu. Max
32 A normális eloszlású minta hisztogramja
33 Az exponenciális eloszlású minta hisztogramja
34 Az átlag és a medián összehasonlítása Az átlag több információt használ érzékenyebb a kiugró adatokra nem szimmetrikus esetben eltérhet a leggyakrabban meggyelt értékekt l A mediánt is érdemes használni, ha vannak kiugró (esetleg hibás) adatok; az eloszlás nem szimmetrikus.
35 Tapasztalati eloszlásfüggvény Legyen X tetsz leges valószín ségi változó. Ennek eloszlásfüggvénye az az F : R [0, 1] függvény, melyre minden t R-re. F (t) = P(X t)
36 Tapasztalati eloszlásfüggvény Legyen X tetsz leges valószín ségi változó. Ennek eloszlásfüggvénye az az F : R [0, 1] függvény, melyre minden t R-re. F (t) = P(X t) Deníció (Tapasztalati eloszlásfüggvény) Legyenek X 1, X 2,..., X n valószín ségi változók. Ennek a mintának az eloszlásfüggvénye az az ˆFn : R [0, 1] függvény, melyre ˆF n (t) = t-nél nem nagyobb mintaelemek száma. n
37 Példa: tapasztalati eloszlásfüggvény A vásárlók számának tapasztalati eloszlásfüggvénye
38 Példa: boxplot A vásárlók számának boxplotja a húsznapos adatsorból
39 Boxplot Deníció (Tapasztalati kvantilis) Legyen X 1, X 2,..., X n minta, és z [0, 1] adott szám. Ekkor a minta tapasztalati z-kvantilise a tapasztalati eloszlásfüggvény z-kvantilise, vagyis: ˆq z = min{t : ˆFn (t) z}. A boxplot készítéséhez szükséges adatok: minimum: a legkisebb mintaelem (99); els kvartilis: a z = 1/4-hez tartozó kvantilis (118,2); medián (141,5); harmadik kvartilis: a z = 3/4-hez tartozó kvantilis (181,5); maximum: a legnagyobb mintaelem (218). terjedelem: maximum - minimum (119).
40 Példa: boxplot 4. ábra. Forrás: theansweris27.com
41 QQ-plot A QQ-plot két minta eloszlásának az összehasonlítására szolgál, a kvantilisek összehasonlításával. Minél inkább egyezik a két minta eloszlása, annál közelebb lesz a QQ-plot a (0, 0)-t és (1, 1)-t összeköt egyenes szakaszhoz. Deníció Az X és Y valószín ségi változók azonos eloszlásúak, ha minden a < b-re P(a < X b) = P(a < Y b). Egész érték esetben: minden k egészre P(X = k) = P(Y = k). Példa: két szabályos kockadobás azonos eloszlású.
42 QQ-plot: azonos eloszlások 5. ábra. Két azonos egyenletes eloszlás (n = 200)
43 QQ-plot: különböz eloszlások 6. ábra. Egyenletes és normális eloszlás (n = 200)
44 Az átlag várható értéke Állítás Legyen X 1,..., X n független azonos eloszlású minta, és m = E(X i ) <. Ekkor E(X ) = m.
45 Az átlag várható értéke Állítás Legyen X 1,..., X n független azonos eloszlású minta, és m = E(X i ) <. Ekkor E(X ) = m. Bizonyítás. ( ) X X n E(X ) = E = 1 n n E(X X n ) = 1 nm = m. n Felhasználtuk a várható érték linearitását, és hogy csak eloszlástól függ: E(cX ) = ce(x ), ha c R; E(Y + Z) = E(Y ) + E(Z); ha Y és Z eloszlása megegyezik, akkor E(Y ) = E(Z)
46 Az átlag szórása Állítás Legyen X 1,..., X n független azonos eloszlású minta, és σ = D(X i ) <. Ekkor D(X ) = σ/ n.
47 Az átlag szórása Állítás Legyen X 1,..., X n független azonos eloszlású minta, és σ = D(X i ) <. Ekkor D(X ) = σ/ n. Bizonyítás. D(X ) = D ( ) X X n n = D(X X n ) n = nσ 2 n = σ n. Felhasználtuk a szórás alábbi tulajdonságait: D(cX ) = c D(X ), ha c R; D 2 (Y + Z) = D 2 (Y ) + D 2 (Z), ha Y és Z függetlenek; ha Y és Z eloszlása megegyezik, akkor D(Y ) = D(Z)
48 Az átlag konvergenciája 7. ábra. A [0, 1] intervallumon egyenletes eloszlásból vett minta átlaga n = 500-ig
49 A nagy számok törvénye Tétel (A nagy számok er s törvénye) Legyenek X 1, X 2,... valószín ségi változók, melyek függetlenek és azonos eloszlásúak. Tegyük fel még, hogy m = E(X 1 ) <. Ekkor X n = X 1 + X X n n E(X 1 ) = m teljesül 1 valószín séggel n esetén.
50 A nagy számok törvénye Tétel (A nagy számok er s törvénye) Legyenek X 1, X 2,... valószín ségi változók, melyek függetlenek és azonos eloszlásúak. Tegyük fel még, hogy m = E(X 1 ) <. Ekkor X n = X 1 + X X n n E(X 1 ) = m teljesül 1 valószín séggel n esetén. Tétel (A nagy számok gyenge törvénye) Legyenek X 1, X 2,... olyan valószín ségi változók, melyek függetlenek és azonos eloszlásúak. Tegyük fel, hogy D(X 1 ) <. Ekkor minden ε > 0 esetén P( X n E(X 1 ) > ε) 0 (n ), azaz X n E(X 1 ) sztochasztikusan.
51 Normális eloszlások átlaga Legyenek X, Y függetlenek, normális eloszlásúak: N(m 2, σ2 2 ). Ekkor a következ k igazak: X N(m 1, σ 2 1 ), Y X + b eloszlása normális, m 1 + b várható értékkel és σ szórással; ax eloszlása normális am 1 várható értékkel és a σ szórással; X + Y eloszlása normális, m 1 + m 2 várható értékkel és σ1 2 + σ2 2 szórással. Emlékeztet : E(X + Y ) = E(X ) + E(Y ), és ha X és Y függetlenek, akkor D 2 (X + Y ) = D 2 (X ) + D 2 (Y ).
52 Normális eloszlások átlaga Legyenek X, Y függetlenek, normális eloszlásúak: N(m 2, σ2 2 ). Ekkor a következ k igazak: X N(m 1, σ 2 1 ), Y X + b eloszlása normális, m 1 + b várható értékkel és σ szórással; ax eloszlása normális am 1 várható értékkel és a σ szórással; X + Y eloszlása normális, m 1 + m 2 várható értékkel és σ1 2 + σ2 2 szórással. Emlékeztet : E(X + Y ) = E(X ) + E(Y ), és ha X és Y függetlenek, akkor D 2 (X + Y ) = D 2 (X ) + D 2 (Y ). Ebb l következik: ha X 1,..., X n független normális eloszlásúak m várható értékkel és σ szórással, akkor ) X X n N (m, σ2 n n
53 Centrális határeloszlástétel Deníció (Eloszlásbeli konvergencia) Legyen X 1, X 2,... valószín ségi változók sorozata, X i eloszlásfüggvénye F i. Az Y valószín ségi változó eloszlásfüggvénye F. Az (X n ) n N sorozat tart Y -hoz eloszlásban, ha F n (t) F (t) (n ) teljesül minden olyan t R-re, melyre F folytonos t-ben. Tétel (Centrális határeloszlástétel) Legyenek X 1, X 2,... független azonos eloszlású valószín ségi változók, melyekre E(X 1 ) = m és D(X 1 ) = σ <. X 1 + X X n n m σ n N(0, 1) eloszlásban n esetén.
54 Centrális határeloszlástétel Legyenek X 1, X 2,... független azonos eloszlású valószín ségi változók, melyekre E(X 1 ) = m és D(X 1 ) = σ <. Ekkor ( lim P a X ) 1 + X X n n m n σ < b = 1 b e x2 /2 dx. n 2π a A határértéket Φ(b) Φ(a) = P(a Y b) alakban is írhatjuk, ahol Y N(0, 1).
55 Centrális határeloszlástétel Legyenek X 1, X 2,... független azonos eloszlású valószín ségi változók, melyekre E(X 1 ) = m és D(X 1 ) = σ <. Ekkor ( lim P a X ) 1 + X X n n m n σ < b = 1 b e x2 /2 dx. n 2π a A határértéket Φ(b) Φ(a) = P(a Y b) alakban is írhatjuk, ahol Y N(0, 1). Így is átfogalmazható a tétel állítása: P(nm + aσ n X 1 + X X n < nm + bσ n) Φ(b) Φ(a). Ez azt jelenti, hogy az X n átlag eloszlása közel van egy m várható érték, σ/ n szórású normális eloszláshoz.
56 Az átlag mint a várható érték becslése X 1, X 2,..., független azonos eloszlású valószín ségi változók, várható értékük: E(X 1 ) = m. Ekkor az X n = 1 n (X X n ) a következ tulajdonságokkal rendelkezik: Torzítatlan becslése m-nek: E(X n ) = m. Konzisztens becslése m-nek: X n m teljesül 1 valószín séggel. Aszimptotikusan normális becslése m-nek: (X n m) n normális eloszláshoz konvergál. A n j=1 a jx j alakú torzítatlan becslések közül ennek a legkisebb a szórása, vagyis a lineáris becslések között ez a leghatásosabb.
57 A szórás becslése Állítás X 1, X 2,..., független azonos eloszlású valószín ségi változók, σ = D(X j ) szórással. Ekkor E(s 2 n ) = σ 2, vagyis az s 2 n = 1 n 1 n i=1 (X i X ) 2 korrigált tapasztalati szórásnégyzet torzítatlan becslése a szórásnégyzetnek.
58 A szórás becslése Állítás X 1, X 2,..., független azonos eloszlású valószín ségi változók, σ = D(X j ) szórással. Ekkor E(s 2 n ) = σ 2, vagyis az s 2 n = 1 n 1 n i=1 (X i X ) 2 korrigált tapasztalati szórásnégyzet torzítatlan becslése a szórásnégyzetnek. Sem s n, sem s n nem torzítatlan becslése a szórásnak: E(s n) σ, E(s n) σ. Másrészt s n σ és s n σ is 1 valószín séggel teljesül, vagyis mind a tapasztalati szórás és a korrigált tapasztalati szórás is konzisztens becslése a szórásnak.
59 Statisztikai mez Deníció Az (Ω, A, P) hármast statisztikai mez nek nevezzük, ha minden P P-re (Ω, A, P) Kolmogorov-féle valószín ségi mez. Deníció Ha valamilyen Θ R q halmazra a P halmaz felírható {P ϑ : ϑ Θ} alakban, akkor paraméteres statisztikai problémáról beszélhetünk. Ilyenkor a Θ halmazt paramétertérnek nevezzük.
60 Statisztikai mez Deníció Az (Ω, A, P) hármast statisztikai mez nek nevezzük, ha minden P P-re (Ω, A, P) Kolmogorov-féle valószín ségi mez. Deníció Ha valamilyen Θ R q halmazra a P halmaz felírható {P ϑ : ϑ Θ} alakban, akkor paraméteres statisztikai problémáról beszélhetünk. Ilyenkor a Θ halmazt paramétertérnek nevezzük. Deníció (Minta) Legyen (Ω, A, P) statisztikai mez. Egy X = (X 1, X 2,..., X n ) : Ω H R n valószín ségi vektorváltozót (n elem ) mintának nevezünk. Itt H a mintatér, n a minta elemszáma vagy nagysága. A minta független, ha az X 1, X 2,..., X n valószín ségi változók függetlenek.
61 Kondenciaintervallumok Legyen X = (X 1,..., X n ) független azonos eloszlású minta, (Ω, A, P) pedig statisztikai mez, P = {P ϑ : ϑ Θ}, és tegyük fel, hogy ϑ valós paraméter, vagyis Θ R. Deníció Azt mondjuk, hogy a (T 1 (X ), T 2 (X )) intervallum legalább 1 α megbízhatósági szint kondenciaintervallum ϑ-ra, ha minden ϑ R esetén teljesül, hogy P ϑ (T 1 (X ) < ϑ < T 2 (X )) 1 α. A kondenciaintervallum megbízhatósági szintje: inf ϑ Θ {P ϑ (ϑ (T 1, T 2 ))}.
62 Kondenciaintervallum a várható értékre A Φ a standard normális eloszlás eloszlásfüggvénye, azaz ha Z N(0, 1): Φ(t) = P(Z t) = 1 2π t e s2 /2 ds. Állítás (Kondenciaintervallum a várható értékre, ismert szórás) Tegyük fel, hogy X 1,..., X n független azonos eloszlású normális eloszlású valószín ségi változók, melyek szórása, σ ismert. Ekkor a ( (T 1, T 2 ) = (X Φ 1 1 α ) σ n (, X + Φ 1 1 α ) ) σ n 2 2 intervallum 1 α megbízhatósági szint kondenciaintervallum az eloszlás várható értékére.
63 Kondenciaintervallum a várható értékre Legyenek Z 0, Z 1,..., Z n független N(0, 1) eloszlásúak, és t f,q melyre az alábbi teljesül: ( q = P(Y t f,q ) = P Z 0 Z Z 2 f t f,q ). az a szám, A hányados eloszlása f szabadsági fokú t-eloszlás. Állítás (Kondenciaintervallum a várható értékre, ismeretlen szórás) Tegyük fel, hogy X 1,..., X n független N(m, σ 2 ) normális eloszlású valószín ségi változók (m, σ ismeretlenek). Ekkor a ( (T 1, T 2 ) = X t n 1,1 α/2 s n n, X + t n 1,1 α/2 sn ) n intervallum 1 α megbízhatósági szint kondenciaintervallum az eloszlás várható értékére.
64 Hipotézisvizsgálat Legyen (Ω, A, P) paraméteres statisztikai mez, azaz P = {P ϑ : ϑ Θ} valamilyen Θ paramétertérrel. A paraméterteret bontsuk fel két diszjunkt halmaz uniójára: Θ = Θ 0 Θ 1, ahol tehát Θ 0 Θ 1 =. Nullhipotézis. H 0 : ϑ Θ 0. Ellenhipotézis. H 1 : ϑ Θ 1.
65 Hipotézisvizsgálat Legyen (Ω, A, P) paraméteres statisztikai mez, azaz P = {P ϑ : ϑ Θ} valamilyen Θ paramétertérrel. A paraméterteret bontsuk fel két diszjunkt halmaz uniójára: Θ = Θ 0 Θ 1, ahol tehát Θ 0 Θ 1 =. Nullhipotézis. H 0 : ϑ Θ 0. Ellenhipotézis. H 1 : ϑ Θ 1. A minta X = (X 1,..., X n ), a mintatér legyen B (vagyis (X 1,..., X n ) a B R n halmaz egy véletlen eleme). A mintateret is felbontjuk két diszjunkt halmaz uniójára: B = B 0 B 1, ahol B 0 B 1 =. Elfogadási tartomány: B 0. Ha (X 1,..., X n ) B 0, akkor H 0 -t elfogadjuk. Elutasítási (kritikus) tartomány: B 1. Ha (X 1,..., X n ) B 1, akkor H 0 -t elutasítjuk.
66 Hipotézisvizsgálat Els fajú hibát vétünk, ha H 0 igaz, és elutasítjuk. A próba terjedelme: α = sup ϑ Θ 0 P ϑ (X B 1 ). Másodfajú hibát vétünk, ha H 0 nem igaz, és elfogadjuk. A próba er függvénye az alábbi β : Θ 1 [0, 1] függvény: β(ϑ) = P ϑ (X B 1 ) (ϑ Θ 1 ).
67 Hipotézisvizsgálat Els fajú hibát vétünk, ha H 0 igaz, és elutasítjuk. A próba terjedelme: α = sup ϑ Θ 0 P ϑ (X B 1 ). Másodfajú hibát vétünk, ha H 0 nem igaz, és elfogadjuk. A próba er függvénye az alábbi β : Θ 1 [0, 1] függvény: β(ϑ) = P ϑ (X B 1 ) (ϑ Θ 1 ). p-érték: a legnagyobb olyan terjedelem, ami mellett H 0 -t elfogadjuk. p < α: szignikáns eltérés H 0 -tól, statisztikai bizonyíték H 1 -re. p α: nincs szignikáns eltérés H 0 -tól. Az α terjedelem leggyakrabban használt értéke: α = 0, 05.
68 Egymintás u-próba A próba a normális eloszlás várható értékére vonatkozik ismert szórás mellett. X 1, X 2,..., X n N(m, σ 2 ), ahol m ismeretlen paraméter, σ > 0 ismert. Próbastatisztika (eloszlása standard normális H 0 mellett): u = X m 0 σ n. Kétoldali ellenhipotézis (two-sided): H 0 : m = m 0 ; m 0. H 1 : m Ha u > Φ 1 (1 α/2), akkor elvetjük a nullhipotézist, különben elfogadjuk. A p-érték ilyenkor 2 2Φ( u ). Φ a standard normális eloszlásfüggvény: Φ(t) = t 1 e x2 /2 dx. 2π p < 0, 05: a várható érték szignikánsan eltér m 0 -tól. p 0, 05: nincs szignikáns eltérés m 0 -tól.
69 Egymintás u-próba Feltételezés: a testmagasság normális eloszlású. Az európai férak átlagos testmagassága 177, 6 cm. Megmértük 10 magyar fér testmagasságát, a magasságok átlaga 173,8 cm lett. A szórást 8 cm-nek feltételezve mondhatjuk-e, hogy a magyar emberek testmagassága szignikánsan eltér az európai átlagtól?
70 Egymintás u-próba Feltételezés: a testmagasság normális eloszlású. Az európai férak átlagos testmagassága 177, 6 cm. Megmértük 10 magyar fér testmagasságát, a magasságok átlaga 173,8 cm lett. A szórást 8 cm-nek feltételezve mondhatjuk-e, hogy a magyar emberek testmagassága szignikánsan eltér az európai átlagtól? H 0 : m = 177, 6; H 1 : m 177, 6. u = X m 0 σ n 173, 8 177, 6 = 10 = 1, α = 0, 05 terjedelem mellett Φ 1 (1 α/2) = 1, 96. p = 0, 133 > 0, 05. u < Φ 1 (1 α/2), elfogadjuk a nullhipotézist. A testmagasság nem tér el szignikánsan az átlagos európai értékt l az adatok alapján.
71 Egymintás u-próba A próba a normális eloszlás várható értékére vonatkozik ismert szórás mellett. X 1, X 2,..., X n N(m, σ 2 ), ahol m ismeretlen paraméter, σ > 0 ismert. Próbastatisztika (eloszlása standard normális H 0 mellett): u = X m 0 σ n. Egyoldali ellenhipotézis (one-sided): H 0 : m m 0 ; H 1 : m > m 0. Ha u > Φ 1 (1 α), akkor elvetjük a nullhipotézist, különben elfogadjuk. A p-érték ilyenkor 1 Φ(u). p < 0, 05: a várható érték szignikánsan több m 0 -nál. p 0, 05: a várható érték nem több szignikánsan m 0 -nál.
72 Egymintás u-próba Feltételezés: a testmagasság normális eloszlású. Az európai férak átlagos testmagassága 177, 6 cm. Megmértük 15 holland fér testmagasságát, a magasságok átlaga 183,7 cm lett. A szórást 8 cm-nek feltételezve mondhatjuk-e, hogy a hollandok testmagassága szignikánsan több az európai átlagnál?
73 Egymintás u-próba Feltételezés: a testmagasság normális eloszlású. Az európai férak átlagos testmagassága 177, 6 cm. Megmértük 15 holland fér testmagasságát, a magasságok átlaga 183,7 cm lett. A szórást 8 cm-nek feltételezve mondhatjuk-e, hogy a hollandok testmagassága szignikánsan több az európai átlagnál? H 0 : m 177, 6; H 1 : m > 177, 6. u = X m 0 σ n 183, 7 177, 6 = 15 = 2, α = 0, 05 terjedelem mellett Φ 1 (1 α) = 1, 645, így u > Φ 1 (1 α). p-érték: 1 Φ(2, 95) = 0, 0016 < 0, 05. Elutasítjuk a nullhipotézist. Az adatok statisztikailag bizonyítják, hogy a holland férak testmagasságának várható értéke szignikánsan több 177,6 cm-nél.
74 Kétmintás párosítatlan kétoldali u-próba (two-sample unpaired two-sided u-test) X 1, X 2,..., X n1, Y 1,..., Y n2 független normális eloszlású valószín ségi változók, ahol X i N(m 1, σ1 2), Y i N(m 2, σ2 2). Itt m 1, m 2 ismeretlen paraméterek, σ 1, σ 2 ismertek. Próbastatisztika (eloszlása standard normális H 0 mellett): u = X Y. σ1 2/n 1 + σ2 2/n 2 Kétoldali ellenhipotézis (two-sided): H 0 : m 1 = m 2 ; H 1 : m 1 m 2. Ha u > Φ 1 (1 α/2), akkor elvetjük a nullhipotézist, különben elfogadjuk. A p-érték (p-value) ilyenkor 2 2Φ( u ). p < 0, 05: a várható értékek szignikánsan eltérnek. p 0, 05: a várható értékek nem térnek el szignikánsan.
75 Kétmintás párosítatlan egyoldali u-próba (two-sample unpaired one-sided u-test) X 1, X 2,..., X n1, Y 1,..., Y n2 független normális eloszlású valószín ségi változók, ahol X i N(m 1, σ1 2), Y i N(m 2, σ2 2). Itt m 1, m 2 ismeretlen paraméterek, σ 1, σ 2 ismertek. Próbastatisztika (eloszlása standard normális H 0 mellett): u = X Y. σ1 2/n 1 + σ2 2/n 2 Egyoldali ellenhipotézis (one-sided): H 0 : m 1 m 2 ; H 1 : m 1 > m 2. Ha u > Φ 1 (1 α), akkor elvetjük a nullhipotézist, különben elfogadjuk. A p-érték (p-value) ilyenkor 1 Φ(u). p < 0, 05: az els eloszlás várható értéke szignikánsan nagyobb a második eloszlásénál.
76 Egymintás kétoldali t-próba (one-sample two-sided t-test) A normális eloszlás várható értékére, ismeretlen szórás esetén. X 1, X 2,..., X n N(m, σ 2 ), ahol m, σ ismeretlen paraméterek. Próbastatisztika (eloszlása t-eloszlás/student-eloszlás H 0 mellett): t = X m 0 sn n. Kétoldali ellenhipotézis (two-sided): H 0 : m = m 0 ; H 1 : m m 0. Ha t > t n 1,1 α/2, akkor elvetjük a nullhipotézist, különben elfogadjuk. Akkor vetjük el a nullhipotézist, ha p < α; ez azt jelenti, hogy a várható érték szignikánsan eltér m 0 -tól. A kritikus érték: t f,q az f szabadsági fokú (degree of freedom) t-eloszlás q-kvantilise, vagyis az a szám, melyre az alábbi teljesül: ( Z 0 q = P(Y t f,q ) = P t f,q ), Z Z q 2 ahol Z 0, Z 1,..., Z q független standard normális eloszlásúak.
77 Példa: Egymintás t-próba Egy gyógyszer hatóanyagtartalma a csomagolás szerint 10 mg. Harminc tabletta hatóanyag-tartalmát megmérve a mérések átlaga 9, 4, korrigált tapasztalati szórása 0, 62 lett. α = 0, 05 terjedelem mellett a mérési adatok alapján eltér-e szignikánsan a hatóanyag-tartalom várható értéke a 10 mgtól?
78 A kritikus érték: t 29,0,975 = 2, 045 t = 5, 3 > 2, 045, szignikáns eltérés van. p-érték: p = 0, < 0, 05. Példa: Egymintás t-próba Egy gyógyszer hatóanyagtartalma a csomagolás szerint 10 mg. Harminc tabletta hatóanyag-tartalmát megmérve a mérések átlaga 9, 4, korrigált tapasztalati szórása 0, 62 lett. α = 0, 05 terjedelem mellett a mérési adatok alapján eltér-e szignikánsan a hatóanyag-tartalom várható értéke a 10 mgtól? n = 30; X = 9, 4; s n = 0, 62 Egymintás kétoldali t-próbát végezhetünk, normális eloszlást feltételezve. H 0 : m = 10; H 1 : 10; α = 0, 05; f = n 1 = 29. t = X m 0 s n n = 9, , = 5, 3.
79 Egymintás egyoldali t-próba (one-sample one-sided t-test) A normális eloszlás várható értékére, ismeretlen szórás esetén. X 1, X 2,..., X n N(m, σ 2 ), ahol m, σ ismeretlen paraméterek. Próbastatisztika (eloszlása t-eloszlás H 0 mellett): t = X m 0 s n n. Egyoldali ellenhipotézis (one-sided): H 0 : m m 0 ; H 1 : m > m 0. Ha t > t n 1,1 α, akkor elvetjük a nullhipotézist, különben elfogadjuk. Akkor vetjük el H 0 -t, ha p < α; ez azt jelenti, hogy a várható érték szignikánsan több m 0 -nál. A kritikus érték: t n 1,1 α az f = n 1 szabadsági fokú t-eloszlás 1 αkvantilise, vagyis az f = n 1 szabadsági fokú t-próba kritikus értéke α terjedelem mellett.
80 Példa: egymintás egyoldali t-próba Százszor megmértük egy szerver válaszidejét (ms-ban). Az átlagos válaszid 0, 52 lett, a korrigált tapasztalati szórás 0, 18. A terjedelmet α = 0, 05-nek választva állíthatjuk-e, hogy a szerver válaszideje szignikánsan meghaladja az 50 ms-ot?
81 Példa: egymintás egyoldali t-próba Százszor megmértük egy szerver válaszidejét (ms-ban). Az átlagos válaszid 0, 52 lett, a korrigált tapasztalati szórás 0, 18. A terjedelmet α = 0, 05-nek választva állíthatjuk-e, hogy a szerver válaszideje szignikánsan meghaladja az 50 ms-ot? n = 100; X = 0, 52; s n = 0, 18 Mivel elég sok mérési adatunk van, használhatjuk az egymintás egyoldali t-próbát akkor is, ha a válaszid nem normális (hanem például exponenciális) eloszlású: H 0 : m 50; H 1 : m > 50. t = X m 0 s n n = 0, 52 0, = 1, 11. 0, 18 Az f = n 1 = 99 szabadsági fokú egyoldali t-próba kritikus értéke α = 0, 05 terjedelem mellett 1, 66. Mivel t < t 99,0,95, elfogadjuk a nullhipotézist, a válaszid várható értéke nem haladja meg szignikánsan az 50 ms-ot. A p-érték: p = 0, 13 0, 05.
82 Kétmintás párosítatlan t-próba (Student-próba) (two-sample unpaired t-test) Független normális eloszlások várható értékének összehasonlítására, ha a a szórások egyenl k, de nem ismertek. X 1, X 2,..., X n1, Y 1,..., Y n2 független normális eloszlású valószín ségi változók, ahol X i N(m 1, σ 2 ), Y i N(m 2, σ 2 ). Itt m 1, m 2, σ ismeretlen paraméterek (feltételezzük, hogy a két szórás megegyezik). Próbastatisztika (eloszlása t-eloszlás H 0 mellett): X Y t = (n 1 1)sn 2 1 (X ) + (n 2 1)sn 2 2 (Y ) n 1 n 2 (n 1 + n 2 2) n 1 + n 2. Kétoldali ellenhipotézis (two-sided): H 0 : m 1 = m 2 ; H 1 : m 1 m 2. Ha t > t n1 +n 2 2,1 α/2, akkor elvetjük a nullhipotézist, különben elfogadjuk. A kritikus érték az f = n 1 + n 2 2 szabadsági fokú (degree of freedom) kétoldali t-próba kritikus értéke. p < 0, 05: elutasítjuk H 0 -t, a várható értékek szignikánsan eltérnek.
83 Példa: kétmintás t-próba Az A és B szerverek válaszideje (ms) néhány mérés során: átlag szórás A ,875 11,12 B ,1 15,8 A terjedelmet α = 0, 05-nek választva, szignikánsan eltér -e a két szerver válaszidejének várható értéke az adatok alapján?
84 Példa: kétmintás t-próba Az A és B szerverek válaszideje (ms) néhány mérés során: átlag szórás A ,875 11,12 B ,1 15,8 A terjedelmet α = 0, 05-nek választva, szignikánsan eltér -e a két szerver válaszidejének várható értéke az adatok alapján? Kétmintás kétoldali t-próbát alkalmazva: H 0 : m A = m B ; H 1 : m A m B excel: = T.TEST(C2:C9; D2:D9; 2; 2) (2: kétoldali; 2: kétmintás, párosítatlan, azonos szórás): 0, 158 0, 05, elfogadjuk a nullhipotézist, nincs szignikáns eltérés
85 Példa: kétmintás t-próba Az A és B szerverek válaszideje (ms) néhány mérés során: átlag szórás A ,875 11,12 B ,1 15,8 A terjedelmet α = 0, 05-nek választva, szignikánsan eltér -e a két szerver válaszidejének várható értéke az adatok alapján? Kétmintás kétoldali t-próbát alkalmazva: H 0 : m A = m B ; H 1 : m A m B excel: = T.TEST(C2:C9; D2:D9; 2; 2) (2: kétoldali; 2: kétmintás, párosítatlan, azonos szórás): 0, 158 0, 05, elfogadjuk a nullhipotézist, nincs szignikáns eltérés excel: = T.TEST(C2:C9; D2:D9; 2; 3): 0, 161 0, 05 (2: kétoldali; 3: párosítatlan, eltérhetnek a szórások; Welch-próba)
86 Kétmintás párosítatlan t-próba (two-sample unpaired t-test) Normális eloszlások várható értékének összehasonlítására, ha a két minta független és a szórások egyenl k, de nem ismertek. X 1, X 2,..., X n1, Y 1,..., Y n2 független normális eloszlású valószín ségi változók, ahol X i N(m 1, σ 2 ), Y i N(m 2, σ 2 ). Itt m 1, m 2, σ ismeretlen paraméterek (feltételezzük, hogy a két szórás megegyezik). Próbastatisztika (eloszlása t-eloszlás H 0 mellett): X Y t = (n 1 1)sn 2 1 (X ) + (n 2 1)sn 2 2 (Y ) n 1 n 2 (n 1 + n 2 2) n 1 + n 2. Egyoldali ellenhipotézis (one-sided): H 0 : m 1 m 2 ; H 1 : m 1 > m 2. Ha t > t n1 +n 2 2,1 α, akkor elvetjük a nullhipotézist, különben elfogadjuk. A kritikus érték az f = n 1 + n 2 2 szabadsági fokú egyoldali t-próba kritikus értéke α terjedelem mellett. p < 0, 05: az els várható érték szignikánsan nagyobb a másodiknál.
87 F -próba Független normális eloszlású minták szórásának összehasonlítására. Legyenek most X 1, X 2,..., X n1, Y 1,..., Y n2 független normális eloszlású valószín ségi változók, ahol X i N(m 1, σ1 2), Y i N(m 2, σ2 2 ). Itt m 1, m 2, σ 1, σ 2 ismeretlen paraméterek. Próbastatisztika (eloszlása F -eloszlás H 0 mellett): F = s 2 n 1. sn 2 2 Kétoldali ellenhipotézis: H 0 : σ 1 = σ 2 ; H 1 : σ 1 σ 2. Ha F > F n1 1,n 2 1(1 α/2) vagy F < F n1 1,n 2 1(α/2), akkor elvetjük a nullhipotézist, különben elfogadjuk. A kritikus érték: q = P(W F d1,d 2 (q)), ahol W = d 2(U 2 1 +U U2 d 1 ) d 1 (V 2 1 +V V 2 d 2 ), és az U i, V i -k mind független standard normális eloszlású valószín ségi változók. p < 0, 05: a szórások szignikánsan eltérnek.
88 Normális eloszlásra vonatkozó próbák Az alábbiakat kell ellen rizni u, t, F -próba alkalmazásánál: A minta normális eloszlású, vagy a mintaelemszám elég nagy (a centrális határeloszlástétel alapján az átlag közel normális eloszlású).
89 Normális eloszlásra vonatkozó próbák Az alábbiakat kell ellen rizni u, t, F -próba alkalmazásánál: A minta normális eloszlású, vagy a mintaelemszám elég nagy (a centrális határeloszlástétel alapján az átlag közel normális eloszlású). Kétmintás esetben: a két minta egymástól független (unpaired eset). Ha a két minta természetes módon párosítható, párosított (paired) próba alkalmazható. Példa: megmérjük húsz ember vérnyomását egy adott napon reggel és este. Igaz-e, hogy a reggeli érték jelent sen eltér az estit l?
90 Normális eloszlásra vonatkozó próbák Az alábbiakat kell ellen rizni u, t, F -próba alkalmazásánál: A minta normális eloszlású, vagy a mintaelemszám elég nagy (a centrális határeloszlástétel alapján az átlag közel normális eloszlású). Kétmintás esetben: a két minta egymástól független (unpaired eset). Ha a két minta természetes módon párosítható, párosított (paired) próba alkalmazható. Példa: megmérjük húsz ember vérnyomását egy adott napon reggel és este. Igaz-e, hogy a reggeli érték jelent sen eltér az estit l? A két minta szórása megegyezik: ez F -próbával ellen rizhet. Különböz szórás esetén a Welch-féle t-próbát lehet használni.
91 χ 2 -próba: illeszkedésvizsgálat Legyen A 1, A 2,..., A r teljes eseményrendszer, p 1, p 2,..., p r pedig olyan nemnegatív számok, melyek összege 1. H 0 : P(A i ) = p i minden i = 1, 2,..., r-re. H 1 : P(A i ) p i valamelyik i = 1, 2,..., r-re. n független meggyelést végzünk. N i : hányszor következett be A i. Ha van i, hogy N i < 4: néhány osztályt össze kell vonnunk, hogy a próbát alkalmazhassuk (vagyis A i és A j helyett A i A j -t és p 1 + p 2 -t tekintjük). Próbastatisztika: T = r i=1 (N i n p i ) 2 n p i.
92 χ 2 -próba Adott A i teljes eseményrendszer (i = 1,..., r), és 0 p i számok: r i=1 p i = 1. H 0 : P(A i ) = p i minden i = 1, 2,..., r-re. H 1 : a nullhipotézis nem igaz Próbastatisztika: T = r i=1 (N i n p i ) 2 n p i. χ 2 -próba: H 0 -t elfogadjuk, ha T < c, ahol c az f = r 1 szabadsági fokú, α terjedelm χ 2 -próba c kritikus értéke. Pontosabban: P(Z Z Z 2 f < c) = 1 α, ahol Z 1,..., Z f független standard normális eloszlású valószín ségi változók. T > c vagy p < α: elutasítjuk H 0 -t, az eloszlás szignikánsan eltér (p k )-tól. T c vagy p α: elfogadjuk H 0 -t, az eloszlás nem tér el szignikánsan (p k )-tól.
93 χ 2 -próba: példa Példa: r = 6, dobókockával dobunk, A i : a dobás értéke i. p 1 = p 2 =... = p 6 = 1/6 (szabályos a dobókocka). A próba terjedelmének α = 0, 05-öt választjuk. n = 100 dobásból az alábbi értékek adódtak: érték gyakoriság
94 χ 2 -próba: példa Példa: r = 6, dobókockával dobunk, A i : a dobás értéke i. p 1 = p 2 =... = p 6 = 1/6 (szabályos a dobókocka). A próba terjedelmének α = 0, 05-öt választjuk. n = 100 dobásból az alábbi értékek adódtak: érték gyakoriság Chi-squared test for given probabilities data: kocka1 X-squared = 7.52, df = 5, p-value = Ekkor T = 7, 52 < c = 11, 1, illetve a p-értékre 0, 1847 > 0, 05. Tehát elfogadjuk a nullhipotézist, nincs szignikáns eltérés a szabályossághoz képest. (Minden szám legalább 4-szer el fordult, nem kellett a beosztáson módosítani.)
95 χ 2 -próba: példa Ha ezerszer dobunk, és az alábbi eredmények adódnak: érték gyakoriság Chi-squared test for given probabilities data: kocka2 X-squared = , df = 5, p-value = Továbbra is α = 0, 05 terjedelem mellett számolva: T = 11, 684 > c = 11, 1, tehát elutasítjuk a nullhipotézist, statisztikai bizonyítékunk van arra, hogy a dobókocka nem szabályos. A p-érték 0, < 0, 05, szignikáns eltérés van a szabályossághoz képest.
96 Becsléses illeszkedésvizsgálat A 1, A 2,..., A r teljes eseményrendszer. N i : hányszor következik be A i egy n elem független mintában. Adott p i (s) minden s S-re. H 0 : van olyan s S, melyre P(A i ) = p i (s) minden r = 1, 2,..., r-re. H 1 : nincs olyan s S, melyre P(A i ) = p i (s) minden r = 1, 2,..., r-re teljesülne. Az s paramétervektor (d dimenziós) maximumlikelihood-becslése legyen ŝ, és legyen ˆp i = p i (ŝ). Számítsuk ki az alábbi mennyiséget: T = r i=1 (N i n ˆp i ) 2 n ˆp i. Legyen f = r d 1. A H 0 -t α terjedelem mellett elfogadjuk, ha T < c, ahol c az f szabadsági fokú kritikus értéke α terjedelem mellett. H 0 -t elutasítjuk, ha T > c (azaz p < α), ilyenkor a minta szignikánsan eltér az S által megadott eloszláscsaládtól.
97 Becsléses illeszkedésvizsgálat: példa Példa. Az egy futballmérk zésen l tt gólok száma a világbajnokság n = 95 mérk zésén: gólok száma mérk zések száma Poisson-esetben az s paraméter maximumlikelihood-becslése: ŝ = X = = 1, 379. Mivel vannak olyan osztályok, ahova 4-nél kevesebb meggyelés esik, a beosztást módosítjuk: gólok száma mérk zések száma
98 Becsléses illeszkedésvizsgálat: példa H 0 : az eloszlás Poisson-eloszlásból származik, valamely s > 0 paraméterrel (most d = 1). H 1 : az eloszlás nem Poisson-eloszlás. ˆp = 1, 379 a paraméter maximumlikelihood-becslése. gólok száma mérk zések száma Poisson(ˆp)-eloszlás 23,92 32,99 22,75 10,46 4,88 Ebben az esetben T = 1, 04, f = = 3, a kritikus érték 7, 81. T < c: elfogadjuk, hogy a minta Poisson-eloszlásból származik.
99 Függetlenségvizsgálat Két szempont szerint soroljuk osztályokba a meggyeléseket. Els szempont: A 1,..., A r. Második szempont: B 1,..., B s. H 0 : a két szempont független egymástól, azaz P(A i B j ) = P(A i ) P(B j ) minden i, j-re. H 1 : a nullhipotézis nem igaz, a két szempont összefügg. N ij : hány olyan meggyelés van, melyre A i és B j teljesül. N i = s j=1 N ij (azaz az A i gyakorisága); N j = r i=1 N ij (azaz B j gyakorisága); n pedig az összes meggyelés száma. Ekkor a próbastatisztika: T = r i=1 j=1 ( s Nij N i N j N i N j n n ) 2.
100 Függetlenségvizsgálat H 0 : a két szempont független egymástól. Próbastatisztika: T = r i=1 j=1 ( s Nij N i N j N i N j n n ) 2. A szabadsági fok f = (r 1)(s 1). c: az f szabadsági fokú χ 2 -próba kritikus értéke α terjedelem mellett. T < c (azaz a p α): elfogadjuk H 0 -t, nem találtunk szignikáns összefüggést a szempontok között. T > c (azaz a p < α): elutasítjuk H 0 -t, az adatok szignikáns összefüggést mutatnak. Ha r = s = 2, a próbastatisztika az alábbi egyszer bb alakra hozható: T = n( N 11 N 22 N 12 N 21 ) 2 N 1 N 2 N 1 N 2.
101 Függetlenségvizsgálat: példa H 0 : a h mérséklet és a csapadékmennyiség független; H 1 : a h mérséklet és a csapadékmennyiség nem független. n = 100, f = 2 2 = 4, α = 0, 05: meleg átlagos hideg es s átlagos száraz data: ido X-squared = , df = 4, p-value = , 917 > c krit = 9, 49, illetve p < α = 0, 05 elutasítjuk a nullhipotézist, szignikáns összefüggés van a két szempont között.
102 Pozitív korreláció Tekintsük a függetlenségvizsgálatot abban az esetben, ha mindkét szempont szerint két osztály van. H 0 : a két szempont között nincs pozitív korreláció H 1 : a két szempont között pozitív korreláció van, azaz P(A 1 B 1 ) > P(A 1 )P(B 1 ). A próbastatisztika: u = n N 11N 22 N 12 N 21 N1 N 2 N 1 N 2 Ha u > Φ 1 (1 α), akkor elutasítjuk H 0 -t, különben elfogadjuk. A p-érték: 1 Φ(u).
103 Pozitív korreláció: példa. Példa. Vérnyomás-sz r vizsgálatnál a 40 évesnél id sebbek közül 24-nek magas, 62-nek megfelel volt a vérnyomása, a 40 évesnél nem id sebbek közül 12-nek volt magas, 88-nak megfelel. Állíthatjuk-e α = 0, 05 terjedelem mellett, hogy a 40 évesnél id sebbek között gyakoribb a magas vérnyomás?
104 Pozitív korreláció: példa. Példa. Vérnyomás-sz r vizsgálatnál a 40 évesnél id sebbek közül 24-nek magas, 62-nek megfelel volt a vérnyomása, a 40 évesnél nem id sebbek közül 12-nek volt magas, 88-nak megfelel. Állíthatjuk-e α = 0, 05 terjedelem mellett, hogy a 40 évesnél id sebbek között gyakoribb a magas vérnyomás? A 1 : 40 évesnél nagyobb életkor; A 2 = A 1. B 1 : magas vérnyomás; B 2 = B 1. H 0 : P(A 1 B 1 ) P(A 1 )P(B 1 ). N 11 = 24; N 12 = 62; N 21 = 12; N 22 = 88; n = 186. u = n N 11N 22 N 12 N 21 = , N1 N 2 N 1 N és 2, 74 > Φ 1 (0, 95) = 1, 645, így elutasítjuk a nullhipotézist. A nagyobb életkor és a magas vérnyomás között szignikáns pozitív korreláció van. p-érték: 0, 003 < 0, 05.
105 Homogenitásvizsgálat Legyenek X, Y valószín ségi változók. R-t bontsuk fel diszjunkt halmazok uniójára: A 1,..., A r. H 0 : az X és Y valószín ségi változók eloszlása megegyezik, azaz P(X A i ) = P(Y A i ) minden i = 1, 2,..., r-re. H 1 : az X és Y valószín ségi változók eloszlás eltér, azaz van legalább egy i, melyre P(X A i ) P(Y A i ). X 1,..., X n, Y 1,..., Y m független minta úgy, hogy X 1,..., X n X, Y 1,..., Y n Y. N i az A i gyakorisága az X mintában; M i az A i gyakorisága az Y mintában. A próbastatisztika: T = r i=1 ) M i 2 m n m. N i + M i ( Ni n
106 Homogenitásvizsgálat A próbastatisztika: T = r i=1 ( Ni n ) M i 2 m n m. N i + M i A szabadsági fok: f = r 1. c: az f szabadsági fokú χ 2 -próba kritikus értéke α terjedelem mellett. T < c (azaz a p α): elfogadjuk H 0 -t, nem találtunk szignikáns eltérést az eloszlások között. T > c (azaz a p < α): elutasítjuk H 0 -t, az eloszlások szignikáns eltérést mutatnak.
107 Hipotézisvizsgálat A lineáris tag együtthatójára vonatkozó hipotézisvizsgálati feladat a következ (a terjedelem α): H 0 : a = 0 H 1 : a 0 vagy H 1 : a > 0 vagy H 1 : a < 0. A nullhipotézis mellett az alábbi mennyiség n 2 szabadsági fokú t-eloszlású: (n 2) n i=1 t = (X i X ) 2 â n i=1 (Y i âx i ˆb). 2 Kétoldali ellenhipotézis, H 1 : a 0. Ha t > t n 2 (1 α/2), akkor elutasítjuk H 0 -t (az együttható szignikánsan eltér 0-tól), különben elfogadjuk. Egyoldali ellenhipotézis, H 1 : a > 0. Ha t > t n 2 (1 α), akkor elutasítjuk H 0 -t (az együttható szignikánsan nagyobb 0-nál), különben elfogadjuk. Kétoldali ellenhipotézis, H 1 : a < 0. Ha t < t n 2 (α), akkor elutasítjuk H 0 -t (az együttható szignikánsan kisebb 0-nál), különben elfogadjuk.
108 Torzítatlan becslés (Ω, A, P) statisztikai mez ; P = {P ϑ : ϑ Θ) valamely Θ halmazzal (Θ a paramétertér); ψ : Θ R függvény. Cél: olyan T statisztika keresése, amire a T (X ) valószín ségi változó és a ψ(ϑ) érték valamilyen értelemben közel esnek egymáshoz.
109 Torzítatlan becslés (Ω, A, P) statisztikai mez ; P = {P ϑ : ϑ Θ) valamely Θ halmazzal (Θ a paramétertér); ψ : Θ R függvény. Cél: olyan T statisztika keresése, amire a T (X ) valószín ségi változó és a ψ(ϑ) érték valamilyen értelemben közel esnek egymáshoz. Deníció (Torzítatlanság) A T : H R statisztika torzítatlan becslés ψ-re, ha minden ϑ Θ-ra E ϑ (T (X 1,..., X n )) = ψ(ϑ). A T statisztika torzítása a b T (ϑ) = E ϑ (T (X 1,..., X n )) ψ(ϑ) függvény. Példa. X 1, X 2,..., X n független minta a [0, ϑ] intervallumon egyenletes eloszlásból. Ekkor 2X torzítatlan becslés ψ(ϑ) = ϑ-ra.
110 Torzítatlan becslések Állítás (A várható érték torzítatlan becslése) Legyen X 1,..., X n független azonos eloszlású minta. Legyen ψ(ϑ) = E ϑ (X 1 ), azaz a mintának a P ϑ eloszlás szerinti várható értéke. Ekkor a T (X 1,..., X n ) = X statisztika, vagyis a mintaátlag torzítatlan becslés ψ- re. Állítás (A szórásnégyzet torzítatlan becslése) X 1,..., X n független azonos eloszlású minta. Legyen ψ(ϑ) = Dϑ 2(X 1), azaz a mintának a P ϑ eloszlás szerinti szórásnégyzete. Ekkor a T (X 1,..., X n ) = sn 2 statisztika, vagyis a korrigált tapasztalati szórásnégyzet torzítatlan becslés ψ-re. Bizonyítás: a következ oldalakon.
111 Az átlag várható értéke Állítás Legyen X 1,..., X n független azonos eloszlású minta, és m = E(X i ) <. Ekkor E(X ) = m.
112 Az átlag várható értéke Állítás Legyen X 1,..., X n független azonos eloszlású minta, és m = E(X i ) <. Ekkor E(X ) = m. Bizonyítás. ( ) X X n E(X ) = E = 1 n n E(X X n ) = 1 nm = m. n Felhasználtuk a várható érték linearitását, és hogy csak eloszlástól függ: E(cX ) = ce(x ), ha c R; E(Y + Z) = E(Y ) + E(Z); ha Y és Z eloszlása megegyezik, akkor E(Y ) = E(Z) Tehát a mintaátlag torzítatlan becslés a várható értékre.
113 Az átlag szórása Állítás Legyen X 1,..., X n független azonos eloszlású minta, és σ = D(X i ) <. Ekkor D(X ) = σ/ n.
114 Az átlag szórása Állítás Legyen X 1,..., X n független azonos eloszlású minta, és σ = D(X i ) <. Ekkor D(X ) = σ/ n. Bizonyítás. D(X ) = D ( ) X X n n = D(X X n ) n = nσ 2 n = σ n. Felhasználtuk a szórás alábbi tulajdonságait: D(cX ) = c D(X ), ha c R; D 2 (Y + Z) = D 2 (Y ) + D 2 (Z), ha Y és Z függetlenek; ha Y és Z eloszlása megegyezik, akkor D(Y ) = D(Z)
115 A tapasztalati szórásnégyzet Állítás (A tapasztalati szórásnégyzet másik alakja) s 2 n = 1 n [ n k=1 X 2 k ] X 2. Bizonyítás. Átrendezéssel kapjuk, hogy n n [ (X k X ) 2 = X 2 k 2X k X + X 2 ] = k=1 = k=1 n X 2 k n X 2. k=1 n X 2 k 2nX X + n X 2 = k=1 Ebb l adódik, hogy sn 2 = 1 [ n ] (X k X ) 2 = 1 [ n n n k=1 a tapasztalati szórásnégyzet deníciója alapján. k=1 X 2 k ] X 2,
116 A korrigált tapasztalati szórásnégyzet Ennek a várható értékét szeretnénk kiszámítani: sn 2 = n n 1 s2 n = n [ [ n ] ] 1 X 2 k X 2 = 1 [ n n 1 n n 1 k=1 k=1 X 2 k ] n n 1 X 2. Az els tag várható értéke: ( n ) n E ϑ X 2 k = E ϑ (X 2 k ) = n E ϑ(x 2 1 ) = n [D ϑ 2 (X 1) + E ϑ (X 1 ) 2]. k=1 k=1
117 A korrigált tapasztalati szórásnégyzet A második taghoz az átlag szórását kell kiszámítani: ( ) Dϑ 2 (X ) = X X n D2 ϑ = 1 n n 2 D2 ϑ (X X n ) = 1 n D 2 n 2 ϑ (X k) = = 1 n 2 n D2 ϑ (X 1) = 1 n D2 ϑ (X 1). k=1
118 A korrigált tapasztalati szórásnégyzet A második taghoz az átlag szórását kell kiszámítani: ( ) Dϑ 2 (X ) = X X n D2 ϑ = 1 n n 2 D2 ϑ (X X n ) = 1 n D 2 n 2 ϑ (X k) = = 1 n 2 n D2 ϑ (X 1) = 1 n D2 ϑ (X 1). k=1 Így a második tag várható értéke: E ϑ ( X 2) = D 2 ϑ (X 2 ) + E ϑ (X ) 2 = 1 n 2 D2 ϑ (X 1) + E ϑ (X 1 ) 2. Az összeg lesz a korrigált tapasztalati szórásnégyzet várható értéke: E ϑ (sn 2 ) = n [ D 2 n 1 ϑ (X 1 )+E ϑ (X 1 ) 2] n [ ] 1 n 1 n D2 ϑ (X 1)+E ϑ (X 1 ) 2 = Dϑ 2 (X 1). Tehát s 2 n torzítatlan becslés a szórásnégyzetre.
119 Hatásosság Deníció (Hatásosság) Legyenek T 1, T 2 torzítatlan becslései a paraméter ψ(ϑ) függvényének. T 1 hatásosabb T 2 -nél, ha Dϑ 2(T 1) Dϑ 2(T 2) teljesül minden ϑ Θ-ra. A T 1 becslés hatásos ψ(ϑ)-ra, ha ψ(ϑ) minden torzítatlan becslésénél hatásosabb (és maga is torzítatlan). Nem mindig létezik hatásos becslés, és lehetséges, hogy T 1 és T 2 közül egyik sem hatásosabb a másiknál.
120 Hatásosság Deníció (Hatásosság) Legyenek T 1, T 2 torzítatlan becslései a paraméter ψ(ϑ) függvényének. T 1 hatásosabb T 2 -nél, ha Dϑ 2(T 1) Dϑ 2(T 2) teljesül minden ϑ Θ-ra. A T 1 becslés hatásos ψ(ϑ)-ra, ha ψ(ϑ) minden torzítatlan becslésénél hatásosabb (és maga is torzítatlan). Nem mindig létezik hatásos becslés, és lehetséges, hogy T 1 és T 2 közül egyik sem hatásosabb a másiknál. Állítás Legyen (X 1,..., X n ) független azonos eloszlású minta véges szórású eloszlásból. Ekkor ψ(ϑ) = E ϑ (X i )-re a mintaátlag hatásosabb minden n j=1 c jx j alakú becslésnél, ahol 0 c j és n j=1 c j = 1. Az állítás a számtani és négyzetes közepek közötti egyenl tlenségb l adódik. Ugyanakkor a mintaátlag nem minden esetben hatásos becslése a várható értéknek, csak a lineáris kombinációknál hatásosabb.
121 Konzisztencia Deníció A T n = T n (X 1,..., X n ) konzisztens becsléssorozat ψ(ϑ)-ra, ha minden ϑ Θ-ra (T n (X 1,..., X n )) ψ(ϑ) n esetén sztochasztikusan, azaz minden ϑ Θ és ε > 0-ra teljesül, hogy ( P ϑ Tn ψ(ϑ) > ε ) 0 (n ). Példa. X 1, X 2,... független azonos eloszlású minta. Ekkor T n = X 1+X X n n konzisztens becsléssorozat E ϑ (X 1 )-re, hiszen a nagy számok gyenge törvénye szerint T n E ϑ (X 1 ) sztochasztikusan. Továbbá, ha például X 1, X 2,... függetlenek és N(m, σ 2 ) eloszlásúak, akkor az átlag konzisztens m-re, s n pedig σ-ra (s n is konzisztens σ-ra).
122 Egyenl tlenségek Állítás (Markov-egyenl tlenség) Legyen t > 0 tetsz leges pozitív szám, X pedig olyan véges várható érték valószín ségi változó, mely csak nemnegatív értékeket vesz fel, vagyis melyre X 0 teljesül. Ekkor P(X t) E(X ). t
123 Egyenl tlenségek Állítás (Markov-egyenl tlenség) Legyen t > 0 tetsz leges pozitív szám, X pedig olyan véges várható érték valószín ségi változó, mely csak nemnegatív értékeket vesz fel, vagyis melyre X 0 teljesül. Ekkor P(X t) E(X ). t Állítás (Csebisev-egyenl tlenség) Legyen X véges szórású valószín ségi változó, s > 0 pozitív szám. Ekkor P( X E(X ) s) D2 (X ) s 2.
124 Egyenl tlenségek Állítás (Markov-egyenl tlenség) Legyen t > 0 tetsz leges pozitív szám, X pedig olyan véges várható érték valószín ségi változó, mely csak nemnegatív értékeket vesz fel, vagyis melyre X 0 teljesül. Ekkor P(X t) E(X ). t Állítás (Csebisev-egyenl tlenség) Legyen X véges szórású valószín ségi változó, s > 0 pozitív szám. Ekkor Következmény P( X E(X ) s) D2 (X ) s 2. Legyen X véges szórású valószín ségi változó, s > 0 pozitív szám. Ekkor P( X E(X ) < s) 1 D2 (X ) s 2.
125 A nagy számok gyenge törvénye Legyenek X 1,..., X n független azonos eloszlású véges szórású valószín ségi változók. Legyen m = E(X 1 ) és σ = D 2 (X 1 ). A korábbiak szerint E(X ) = m; D(X ) = σ2 n.
126 A nagy számok gyenge törvénye Legyenek X 1,..., X n független azonos eloszlású véges szórású valószín ségi változók. Legyen m = E(X 1 ) és σ = D 2 (X 1 ). A korábbiak szerint E(X ) = m; D(X ) = σ2 n. A Csebisev-egyenl tlenség szerint minden ε > 0-ra P( X m > ε) D2 (X ) ε 2 = σ2 ε 2 n 0 (n ). Tehát X m = E(X 1 ) sztochasztikusan, vagyis az átlag konzisztens becslés a várható értékre.
127 Maximumlikelihood-módszer Deníció (Likelihood-függvény) Legyen Y 1,..., Y n minta. Ha ezek abszolút folytonosak, és Y j s r ségfüggvénye (a P ϑ -re vonatkozóan) f j,ϑ, akkor a minta likelihood-függvénye: n L n,ϑ (t 1,..., t n ) = f j,ϑ (t j ) j=1 (t 1,..., t n R). Ha a minta diszkrét, akkor a minta likelihood-függvénye: n L n,ϑ (k 1,..., k n ) = P j,ϑ (Y j = k j ) j=1 ((k 1,..., k n ) H).
128 Maximumlikelihood-módszer Deníció (Maximum-likelihood becslés) A ϑ maximumlikelihood-becslése (ML-becslése) az X 1,..., X n mintából ˆϑ, ha ˆϑ maximalizálja a ϑ L n,ϑ (X 1,..., X n ) függvényt, ahol L n,ϑ a minta likelihood-függvénye. Azaz, ha L n, ˆϑ (X 1,..., X n ) L n,ϑ (X 1,..., X n ) minden ϑ Θ-ra. Példa. X 1,..., X n függetlenek, eloszlásuk exponenciális eloszlás ϑ > 0 paraméterrel. Ekkor L n,ϑ (X 1,..., X n ) = amib l ˆϑ = 1 X. n f j,ϑ (X j ) = j=1 n j=1 [ ] ϑ exp( ϑx j )I(X j > 0),
129 ML-becslés: exponenciális eloszlás X 1,..., X n függetlenek, eloszlásuk exponenciális eloszlás ϑ > 0 paraméterrel. Ekkor L n,ϑ (X 1,..., X n ) = n f j,ϑ (X j ) = j=1 n j=1 L n,ϑ (X 1,..., X n ) = ϑ n exp [ ] ϑ exp( ϑx j )I(X j > 0). ( ϑ n X j ). j=1
130 ML-becslés: exponenciális eloszlás X 1,..., X n függetlenek, eloszlásuk exponenciális eloszlás ϑ > 0 paraméterrel. Ekkor L n,ϑ (X 1,..., X n ) = n f j,ϑ (X j ) = j=1 n j=1 L n,ϑ (X 1,..., X n ) = ϑ n exp [ ] ϑ exp( ϑx j )I(X j > 0). ( ϑ ln L n,ϑ (X 1,..., X n ) = n ln ϑ ϑ n X j ). j=1 n j=1 X j
131 ML-becslés: exponenciális eloszlás X 1,..., X n függetlenek, eloszlásuk exponenciális eloszlás ϑ > 0 paraméterrel. Ekkor L n,ϑ (X 1,..., X n ) = n f j,ϑ (X j ) = j=1 n j=1 L n,ϑ (X 1,..., X n ) = ϑ n exp [ ] ϑ exp( ϑx j )I(X j > 0). ( ϑ ln L n,ϑ (X 1,..., X n ) = n ln ϑ ϑ n X j ). j=1 n j=1 ϑ ln L n,ϑ(x 1,..., X n ) = n nx > 0 ϑ < 1/X. ϑ X j
132 Az ML-becslés tulajdonságai Nem minden statisztikai mez n létezik ML-becslés. Az ML-becslés nem feltétlenül egyértelm. A ψ(ϑ) függvény ML-becslése ψ( ˆϑ), ahol ˆϑ ML-becslés ϑ-ra. Megfelel feltételek (er s regularitási feltételek mellett) az ML-becslés aszimpotikusan torzítatlan, és aszimptotikusan normális eloszlású, azaz n( ˆϑn ϑ) normális eloszláshoz konvergál eloszlásban n esetén (a P ϑ valószín ségre vonatkozóan). Az alábbi egyenlet a maximumlikelihood-egyenlet: ϑ ln L n,ϑ(x 1,..., X n ) = 0. Megfelel feltételek mellett az ML-becslés a maximumlikelihood-egyenlet megoldása (ha az ML-becslés nem számítható ki, de az egyenlet megoldható, gyakran az egyenlet megoldásával helyettesítik az MLbecslést).
133 ML-becslés: normális eloszlás X 1,..., X n függetlenek, eloszlásuk normális eloszlás m, σ > 0 paraméterekkel. Ekkor L n,m,σ (X 1,..., X n ) = n f j,ϑ (X j ) = j=1 n [ 1 exp( (X j m) 2 /2σ ]. 2 2πσ j=1
134 ML-becslés: normális eloszlás X 1,..., X n függetlenek, eloszlásuk normális eloszlás m, σ > 0 paraméterekkel. Ekkor L n,m,σ (X 1,..., X n ) = n f j,ϑ (X j ) = j=1 n [ 1 exp( (X j m) 2 /2σ ]. 2 2πσ j=1 L n,m,σ (X 1,..., X n ) = ( 1 2πσ ) n exp ( n ) (X j m) 2. 2σ 2 j=1
135 ML-becslés: normális eloszlás X 1,..., X n függetlenek, eloszlásuk normális eloszlás m, σ > 0 paraméterekkel. Ekkor L n,m,σ (X 1,..., X n ) = n f j,ϑ (X j ) = j=1 n [ 1 exp( (X j m) 2 /2σ ]. 2 2πσ j=1 L n,m,σ (X 1,..., X n ) = ( 1 2πσ ) n exp ( n ) (X j m) 2. 2σ 2 j=1 ln L n,m,σ (X 1,..., X n ) = n ln( 2π) n ln σ n j=1 (X j m) 2 2σ 2. Rögzített σ mellett ez akkor maximális, ha n j=1 (X j m) 2 = n j=1 X 2 j 2 n j=1 X jm + nm 2 minimális ˆm = X.
136 ML-becslés: normális eloszlás ln L n,σ (X 1,..., X n ) = n ln( 2π) n ln σ A σ szerinti parciális derivált: dσ ln L n,σ(x 1,..., X n ) = n n σ + j=1 n j=1 (X j X ) 2 σ 3. Ez pontosan akkor pozitív, ha σ 2 < 1 n n j=1 (X j X ) 2 = s 2 n. (X j X ) 2 2σ 2. Tehát az ML-becslés: ˆm = X ; ˆσ = s n.
137 ML-becslés: egyenletes eloszlás X 1,..., X n függetlenek, eloszlásuk egyenletes eloszlás az [a, b] intervallumon. Ekkor L n,a,b (X 1,..., X n ) = n f j,ϑ (X j ) = j=1 n 1 I(a X j b) b a. j=1 ( 1 L n,a,b (X 1,..., X n ) = b a ) ni(a min j X j és max X j b). j
138 ML-becslés: egyenletes eloszlás X 1,..., X n függetlenek, eloszlásuk egyenletes eloszlás az [a, b] intervallumon. Ekkor L n,a,b (X 1,..., X n ) = n f j,ϑ (X j ) = j=1 n 1 I(a X j b) b a. j=1 ( 1 L n,a,b (X 1,..., X n ) = b a ) ni(a min j X j és max X j b). j Ebb l: â = min X j ; ˆb = max X j. j j Az els tényez legyen minél nagyobb (vagyis b a minél kisebb) úgy, hogy a második tényez nem nulla.
139 ML-becslés: Poisson-eloszlás X 1,..., X n függetlenek, Poisson-eloszlás λ > 0 paraméterrel. Ekkor L n,λ (X 1,..., X n ) = n j=1 λ X j X j! e λ. L n,λ (X 1,..., X n ) = λ n j=1 X j e nλ n j=1 1 X j!.
140 ML-becslés: Poisson-eloszlás X 1,..., X n függetlenek, Poisson-eloszlás λ > 0 paraméterrel. Ekkor L n,λ (X 1,..., X n ) = n j=1 λ X j X j! e λ. L n,λ (X 1,..., X n ) = λ n j=1 X j e nλ ln L n,λ (X 1,..., X n ) = ln λ n j=1 n X j nλ ln j=1 1 X j!. n j=1 1 X j!
141 ML-becslés: Poisson-eloszlás X 1,..., X n függetlenek, Poisson-eloszlás λ > 0 paraméterrel. Ekkor L n,λ (X 1,..., X n ) = n j=1 λ X j X j! e λ. L n,λ (X 1,..., X n ) = λ n j=1 X j e nλ ln L n,λ (X 1,..., X n ) = ln λ n j=1 n X j nλ ln j=1 n λ ln L j=1 n,λ(x 1,..., X n ) = X j λ Ezért az ML-becslés: ˆλ = X. 1 X j!. n j=1 1 X j! n > 0 λ < X.
142 Momentummódszer Legyen X 1,..., X n független azonos eloszlású minta. 1 Az eloszlás k. momentuma: µ k,ϑ = E ϑ (X k 1 ). 2 Legyen ˆµ k = 1 n n j=1 X k az eloszlás k. tapasztalati momentuma. j 3 Írjuk fel az alábbi egyenleteket a legkisebb olyan k-ig, amire az egyenletrendszer egyértelm en meghatározza ϑ-t (bár nincs mindig ilyen k): E ϑ (X 1 ) = 1 n X j ; n E ϑ (X 2 1 ) = 1 n... E ϑ (X k 1 ) = 1 n j=1 n j=1 n j=1 X 2 j ; X k j. 4 A ϑ momentummódszerrel kapott becslése az a ˆϑ, ami megoldása a fenti egyenletrendszernek.
143 Momentummódszer: Poisson és exponenciális eloszlás X 1,..., X n független Poisson-eloszlásúak λ > 0 paraméterrel. A k = 1-hez tartozó egyenlet: E λ (X 1 ) = X. Mivel a λ paraméter Poisson-eloszlás várható értéke λ: ˆλ = X.
144 Momentummódszer: Poisson és exponenciális eloszlás X 1,..., X n független Poisson-eloszlásúak λ > 0 paraméterrel. A k = 1-hez tartozó egyenlet: E λ (X 1 ) = X. Mivel a λ paraméter Poisson-eloszlás várható értéke λ: ˆλ = X. X 1,..., X n független exponenciális eloszlásúak λ paraméterrel. A k = 1- hez tartozó egyenlet: E λ (X 1 ) = 1 ϑ = 1 n n X j = X. j=1 Ez egyértelm en oldható meg λ-ra: ˆλ = 1/X.
145 Momentummódszer: normális eloszlás X 1,..., X n független N(m, σ 2 ) eloszlású minta (azaz normális eloszlású m várható értékkel és σ szórással). A k = 1-hez és k = 2-höz tartozó egyenletek: E m,σ (X 1 ) = m = X ; E m,σ (X 2 1 ) = σ 2 + m 2 = 1 n Xj 2. n A másodikba beírva az els t: σ 2 = 1 n n j=1 X j 2 X 2 = sn 2 (a tapasztalati szórásnégyzet). Tehát az els két egyenlet együtt egyértelm en oldható meg, a momentummódszerrel kapott becslés: ˆm = X ; ˆσ = s n. j=1
146 Az egyenletes eloszlás várható értéke és szórása Az egyenletes eloszlás s r ségfüggvénye: f (x) = 1, ha a x b, és 0 b a különben. A várható értéke: E(X ) = x f (x)dx = = b2 a 2 2(b a) = a + b 2. b a [ x b a dx = x 2 2(b a) ] b x=a
147 Az egyenletes eloszlás várható értéke és szórása Az egyenletes eloszlás s r ségfüggvénye: f (x) = 1, ha a x b, és 0 b a különben. A várható értéke: E(X ) = x f (x)dx = = b2 a 2 2(b a) = a + b 2. b a [ x b a dx = x 2 2(b a) ] b x=a A négyzetének a várható értéke: E(X 2 ) = x 2 f (x)dx = b = b3 a 3 3(b a) = a2 + ab + b 2. 3 a x 2 b a dx = 1 [ x 3 b a 3 ] b x=a
148 Az egyenletes eloszlás várható értéke és szórása Az egyenletes eloszlás s r ségfüggvénye: f (x) = 1, ha a x b, és 0 b a különben. A várható értéke: E(X ) = a + b 2. A négyzetének a várható értéke: E(X 2 ) = a2 + ab + b 2. 3 A szórásnégyzete: D 2 (X ) = E(X 2 ) E(X ) 2 = a2 + ab + b 2 = a2 2ab + b (b a)2 =. 12 a2 + 2ab + b 2 4
149 Momentummódszer: egyenletes eloszlás Legyen X 1,..., X n független minta az [a, b] intervallumon egyenletes eloszlásból. A k = 1-hez és k = 2-höz tartozó egyenlet: E a,b (X 2 1 ) = E a,b (X 1 ) = a + b = X ; 2 ( ) (b a)2 a + 2 b + = 1 n Xj n j=1 A másodikba beírva az els t: (b a)2 = 1 n 12 n j=1 X j 2 X 2 = sn, 2 amib l â = X 3s n ; ˆb = X + 3sn. ML-becsléssel: â = X 1 = min(x 1,..., X n ), ˆb = X n = max(x 1,..., X n ). Egyik becslés sem torzítatlan.
150 Tapasztalati momentumok Deníció Legyen k 1 egész. Ekkor a minta k. tapasztalati momentuma (kth sample moment) a mintaelemek k. hatványainak átlaga: 1 n n j=1 X k j. Ekkor a minta k. centrált tapasztalati momentuma (kth sample central moment): m k = 1 n (X j X ) k. n j=1
151 Ferdeség Deníció A tapasztalati ferdeség (sample skewness) két szokásos deníciója: γ = m 3 s 3 n = 1 n ( 1 n 1 n j=1 (X j X ) 3 n j=1 (X j X 2 ) ). 3/2 γ 1 = n 2 (n 1)(n 2) m3 s 3 n = n (n 1)(n 2) n ( ) Xj 3 X. j=1 s n
152 Lapultság Deníció A lapultság (sample kurtosis) egy lehetséges deníciója: κ = m n 4 j=1 3 = n (X j X ) 4 m2 2 ( n j=1 (X j X 2 ) ) 3. 2
153 Példa: normális eloszlás n = 500, m = 3, σ = 2 normális eloszlású minta X = 2, 9677, s n = 2, 14, ferdeség: γ = 0, 04, lapultság: κ = 0, 211.
154 Példa: exponenciális eloszlás n = 500, λ = 1/3 exponenciális eloszlású minta (szórás: 3) X = 3, 033, s n = 2, 986, ferdeség: γ = 1, 85, lapultság: κ = 4, 78.
155 Példa: egyenletes eloszlás n = 500, a = 0, b = 6 intervallumon egyenletes eloszlású minta X = 2, 93, s n = 1, 73, ferdeség: γ = 0, 0297, lapultság: κ = 1, 2.
156 Példa: Poisson-eloszlás n = 500, λ = 3 paraméter Poisson-eloszlású minta X = 2, 922, s n = 1, 64, ferdeség: γ = 0, 53, lapultság: κ = 0, 0064.
Normális eloszlás paramétereire vonatkozó próbák
Normális eloszlás paramétereire vonatkozó próbák Az alábbi próbák akkor használhatók, ha a meggyelések függetlenek, és feltételezhetjük, hogy normális eloszlásúak a meggyelések függetlenek, véges szórású
RészletesebbenAbszolút folytonos valószín ségi változó (4. el adás)
Abszolút folytonos valószín ségi változó (4. el adás) Deníció (Abszolút folytonosság és s r ségfüggvény) Az X valószín ségi változó abszolút folytonos, ha van olyan f : R R függvény, melyre P(X t) = t
RészletesebbenLeíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév
Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév A pirossal írt anyagrészeket nem fogom közvetlenül számon kérni a vizsgán, azok háttérismeretként,
RészletesebbenElméleti összefoglaló a Sztochasztika alapjai kurzushoz
Elméleti összefoglaló a Sztochasztika alapjai kurzushoz 1. dolgozat Véletlen kísérletek, események valószín sége Deníció. Egy véletlen kísérlet lehetséges eredményeit kimeneteleknek nevezzük. A kísérlet
RészletesebbenHipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58
u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58 u- t- 2/58 eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ
RészletesebbenValószín ségszámítás és statisztika
Valószín ségszámítás és statisztika Informatika BSc, esti tagozat Backhausz Ágnes agnes@cs.elte.hu 2016/2017. tavaszi félév Bevezetés Célok: véletlen folyamatok modellezése; kísérletekb l, felmérésekb
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus
RészletesebbenMatematikai statisztika szorgalmi feladatok
Matematikai statisztika szorgalmi feladatok 1. Feltételes várható érték és konvolúció 1. Legyen X és Y független és azonos eloszlású valószín ségi változó véges második momentummal. Mutassuk meg, hogy
RészletesebbenMatematikai statisztika
Matematikai statisztika Survey statisztika mesterszak + földtudomány alapszak Backhausz Ágnes agnes@math.elte.hu Fogadóóra: szerda 10 11 és 13 14, D 3-415 2018/2019. tavaszi félév Bevezetés A statisztika
Részletesebben1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása
HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat
Részletesebbenx, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:
Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Valószínűségi változó általános fogalma: A : R leképezést valószínűségi változónak nevezzük, ha : ( ) x, x R, x rögzített esetén esemény.
RészletesebbenStatisztika Elıadások letölthetık a címrıl
Statisztika Elıadások letölthetık a http://www.cs.elte.hu/~arato/stat*.pdf címrıl Konfidencia intervallum Def.: 1-α megbízhatóságú konfidencia intervallum: Olyan intervallum, mely legalább 1-α valószínőséggel
RészletesebbenVéletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.
Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza
RészletesebbenElméleti összefoglaló a Valószín ségszámítás kurzushoz
Elméleti összefoglaló a Valószín ségszámítás kurzushoz Véletlen kísérletek, események valószín sége Deníció. Egy véletlen kísérlet lehetséges eredményeit kimeneteleknek nevezzük. A kísérlet kimeneteleinek
RészletesebbenGVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet
GVMST22GNC Statisztika II. 3. előadás: 8. Hipotézisvizsgálat Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Hipotézisvizsgálat v becslés Becslés Ismeretlen paraméter Közeĺıtő
RészletesebbenHipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok
STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris
RészletesebbenHipotézis vizsgálatok
Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével
RészletesebbenBackhausz Ágnes 1. Bevezetés A valószínűség elemi tulajdonságai... 5
Valószínűségszámítás Földtudomány BSc szak, 2016/2017. őszi félév Backhausz Ágnes agnes@cs.elte.hu Tartalomjegyzék 1. Bevezetés 2 2. A Kolmogorov-féle valószínűségi mező 3 2.1. Klasszikus valószínűségi
RészletesebbenStatisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1
Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában
RészletesebbenDr. Karácsony Zsolt. Miskolci Egyetem november
Valószínűségszámítás és Matematikai statisztika Dr. Karácsony Zsolt Miskolci Egyetem, Alkalmazott Matematikai Tanszék 2013-2014 tanév 1. félév Miskolci Egyetem 2013. november 11-18 - 25. Dr. Karácsony
RészletesebbenValószín ségszámítás és statisztika
Valószín ségszámítás és statisztika Informatika BSc, esti tagozat Backhausz Ágnes agnes@math.elte.hu fogadóóra: szerda 10-11 és 13-14, D 3-415 2018/2019. tavaszi félév Bevezetés A valószín ségszámítás
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció:
RészletesebbenStatisztika elméleti összefoglaló
1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11
Részletesebbenegyetemi jegyzet Meskó Balázs
egyetemi jegyzet 2011 Előszó 2. oldal Tartalomjegyzék 1. Bevezetés 4 1.1. A matematikai statisztika céljai.............................. 4 1.2. Alapfogalmak......................................... 4 2.
RészletesebbenValószínűségi változók. Várható érték és szórás
Matematikai statisztika gyakorlat Valószínűségi változók. Várható érték és szórás Valószínűségi változók 2016. március 7-11. 1 / 13 Valószínűségi változók Legyen a (Ω, A, P) valószínűségi mező. Egy X :
RészletesebbenKét diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat
Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi fizika és statisztika I. előadás 2016.11.09 Orvosi
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
Részletesebben2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!
GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az
RészletesebbenKabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a
Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,
RészletesebbenHipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás
STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H
RészletesebbenIntervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.
Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef. Feladatok Gazdaságstatisztika 7. Statisztikai becslések (folyt.); 8. Hipotézisvizsgálat
RészletesebbenMatematikai statisztika c. tárgy oktatásának célja és tematikája
Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:
Részletesebben2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben
1 feladatsor 1 Egy dobozban 20 fehér golyó van Egy szabályos dobókockával dobunk, majd a következ t tesszük: ha a dobott szám 1,2 vagy 3, akkor tíz golyót cserélünk ki pirosra; ha a dobott szám 4 vagy
RészletesebbenA leíró statisztikák
A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az
RészletesebbenHipotézis vizsgálatok
Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével
RészletesebbenBiomatematika 2 Orvosi biometria
Biomatematika 2 Orvosi biometria 2017.02.13. Populáció és minta jellemző adatai Hibaszámítás Valószínűség 1 Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza)
Részletesebben[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.15. Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza) alkotja az eseményteret. Esemény: az eseménytér részhalmazai.
RészletesebbenA valószínűségszámítás elemei
A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:
RészletesebbenA konfidencia intervallum képlete: x± t( α /2, df )
1. feladat. Egy erdőben az egy fészekben levő tojásszámokat vizsgáltuk egy madárfajnál. A következő tojásszámokat találtuk: 1, 1, 1,,,,,,, 3, 3, 3, 3, 3, 4, 4, 5, 6, 7. Mi a mintának a minimuma, maximuma,
RészletesebbenEseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.
Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem. Elemi esemény: a kísérlet egyes lehetséges egyes lehetséges kimenetelei.
Részletesebbenföldtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás
Matematikai statisztika elıadás, földtudományi BSc (geológus szakirány) 2014/2015 2. félév 6. elıadás Konfidencia intervallum Def.: 1-α megbízhatóságú konfidencia intervallum: Olyan intervallum, mely legalább
Részletesebben1. Példa. A gamma függvény és a Fubini-tétel.
. Példa. A gamma függvény és a Fubini-tétel.. Az x exp x + t )) függvény az x, t tartományon folytonos, és nem negatív, ezért alkalmazható rá a Fubini-tétel. I x exp x + t )) dxdt + t dt π 4. [ exp x +
RészletesebbenValószínűségszámítás összefoglaló
Statisztikai módszerek BMEGEVGAT Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:
RészletesebbenA Statisztika alapjai
A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati
RészletesebbenSTATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba
Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum
RészletesebbenKészítette: Fegyverneki Sándor
VALÓSZÍNŰSÉGSZÁMÍTÁS Összefoglaló segédlet Készítette: Fegyverneki Sándor Miskolci Egyetem, 2001. i JELÖLÉSEK: N a természetes számok halmaza (pozitív egészek) R a valós számok halmaza R 2 {(x, y) x, y
RészletesebbenEgymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?
Egymintás próbák σ s μ m Alapkérdés: A populáció egy adott megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? egymintás t-próba Wilcoxon-féle előjeles
RészletesebbenBiomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision
RészletesebbenKorreláció és lineáris regresszió
Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.
RészletesebbenBevezetés a hipotézisvizsgálatokba
Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -
Részletesebbenbiometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás
Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani
RészletesebbenTöbbváltozós lineáris regressziós modell feltételeinek
Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p
RészletesebbenMatematikai statisztika I. témakör: Valószínűségszámítási ismétlés
Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés Elek Péter 1. Valószínűségi változók és eloszlások 1.1. Egyváltozós eset Ismétlés: valószínűség fogalma Valószínűségekre vonatkozó axiómák
Részletesebbenegyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk
Valószínűségszámítás 8. feladatsor 2015. november 26. 1. Bizonyítsuk be, hogy az alábbi folyamatok mindegyike martingál. a S n, Sn 2 n, Y n = t n 1+ 1 t 2 Sn, t Fn = σ S 1,..., S n, 0 < t < 1 rögzített,
RészletesebbenAdatok statisztikai értékelésének főbb lehetőségei
Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció
RészletesebbenMatematikai statisztika Tómács Tibor
Matematikai statisztika Tómács Tibor Matematikai statisztika Tómács Tibor Publication date 2011 Szerzői jog 2011 Hallgatói Információs Központ Copyright 2011, Educatio Kht., Hallgatói Információs Központ
RészletesebbenTöbbváltozós lineáris regressziós modell feltételeinek tesztelése I.
Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Kvantitatív statisztikai módszerek Petrovics Petra Többváltozós lineáris regressziós
RészletesebbenKiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.
Kiválasztás A változó szerint Egymintás t-próba Mann-Whitney U-test paraméteres nem-paraméteres Varianciaanalízis De melyiket válasszam? Kétmintás t-próba Fontos, hogy mindig a kérdésnek és a változónak
RészletesebbenBiomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 15. Nemparaméteres próbák Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date: November
RészletesebbenBiostatisztika. Sz cs Gábor. 2018/19 tavaszi félév. Szegedi Tudományegyetem, Bolyai Intézet
Biostatisztika Sz cs Gábor Szegedi Tudományegyetem, Bolyai Intézet 2018/19 tavaszi félév Bevezetés Tudnivalók, követelmények Tudnivalók, követelmények Félév tematikája: Értékelés: Valószín ségszámítás
RészletesebbenValószín ségszámítás 2.
Valószín ségszámítás 2. Csiszár Vill A kötet az Eötvös Loránd Tudományegyetem tankönyv- és jegyzettámogatási pályázatán elnyert forrás felhasználásával jelent meg. Szakmai lektor: Wintsche Gergely A kézirat
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,
RészletesebbenSTATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1
STATISZTIKAI ALAPOK Statisztikai alapok_eloszlások_becslések 1 Pulzus példa Egyetemista fiatalokból álló csoport minden tagjának (9 fő) megmérték a pulzusát (PULSE1), majd kisorsolták ki fusson és ki nem
RészletesebbenGyak. vez.: Palincza Richárd ( Gyakorlatok ideje/helye: CS , QBF10
Intervallumek Matematikai statisztika Gazdaságinformatikus MSc 1. előadás 2018. szeptember 3. 1/53 - Előadó, hely, idő etc. Intervallumek Előadó: Vizer Máté (email: mmvizer@gmail.com) Előadások ideje/helye:
RészletesebbenNemparaméteres próbák
Nemparaméteres próbák Budapesti Mőszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék 1111, Budapest, Mőegyetem rkp. 3. D ép. 334. Tel: 463-16-80 Fax: 463-30-91 http://www.vizgep.bme.hu
RészletesebbenBiostatisztika Összefoglalás
Biostatisztika Összefoglalás A biostatisztika vizsga A biostatisztika vizsga az Orvosi fizika és statisztika I. fizika vizsgájával egy napon történik. A vizsga keretében 30 perc alatt 0 kérdésre kell válaszolni
Részletesebbene (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:
Normális eloszlás ξ valószínűségi változó normális eloszlású. ξ N ( µ, σ 2) Paraméterei: µ: várható érték, σ 2 : szórásnégyzet (µ tetszőleges, σ 2 tetszőleges pozitív valós szám) Normális eloszlás sűrűségfüggvénye:
RészletesebbenSTATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.
STATISZTIKA 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 MAGY. MAT. TÖRT. KÉM. ANNA BÉLA CILI András hármas. Béla Az átlag 3,5! kettes. Éva ötös. Nóri négyes. 1 mérés: dolgokhoz valamely szabály alapján szám rendelése
RészletesebbenStatisztikai következtetések Nemlineáris regresszió Feladatok Vége
[GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell
RészletesebbenBiostatisztika Összefoglalás
Biostatisztika Összefoglalás A biostatisztika vizsga A biostatisztika vizsga az Orvosi fizika és statisztika I. fizika vizsgájával egy napon történik. A vizsga keretében 30 perc alatt 0 kérdésre kell válaszolni
RészletesebbenLINEÁRIS MODELLBEN május. 1. Lineáris modell, legkisebb négyzetek elve
BECSLÉS ÉS HIPOTÉZISVIZSGÁLAT LINEÁRIS MODELLBEN Móri Tamás ELTE TTK Valószínűségelméleti és Statisztika Tanszék 2008 május Lineáris modell, legkisebb négyzetek elve Tegyük fel, hogy egy bizonyos pl fizikai)
RészletesebbenElemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n
Elemi statisztika >> =weiszd=
RészletesebbenSTATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1
STATISZTIKAI ALAPOK Statisztikai alapok_eloszlások_becslések 1 Pulzus példa Egyetemista fiatalokból álló csoport minden tagjának (9 fő) megmérték a pulzusát (PULSE1), majd kisorsolták ki fusson és ki nem
RészletesebbenBiometria az orvosi gyakorlatban. Korrelációszámítás, regresszió
SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás
RészletesebbenSTATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás
ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 7. Előadás Egyenletes eloszlás Binomiális eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell /56 Matematikai statisztika Reprezentatív mintavétel
RészletesebbenSTATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás
ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika
RészletesebbenNagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem
agy számok törvényei Statisztikai mintavétel Várható érték becslése Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem A mérés mint statisztikai mintavétel A méréssel az eloszlásfüggvénnyel
Részletesebben0,1 P(X=1) = p p p(1-p) Egy p vszgő esemény bekövetkezik-e.
Egy kis emlékeztetı X val.változó értékek F(x) eloszlásfv. valségek P(a X
RészletesebbenStatisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat
Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat 7. lecke Paraméter becslés Konfidencia intervallum Hipotézis vizsgálat feladata Paraméter becslés és konfidencia
RészletesebbenMatematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József
Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József Matematika III. 9. : Statisztikai hipotézisek Prof. Dr. Závoti, József Lektor : Bischof, Annamária Ez a modul a TÁMOP - 4.1.2-08/1/A-2009-0027
Részletesebben[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát
RészletesebbenMatematikai statisztika feladatsor
Matematikai statisztika feladatsor Nagy-György Judit A feladatsor Bolla Marianna és Krámli András Statisztikai következtetések elmélete cím könyvének [1] elméletére épül, a fejezetek számozása és a jelölések
RészletesebbenHipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018
Hipotézisvizsgálat az Excel adatelemző eljárásaival Dr. Nyéki Lajos 2018 Egymintás t-próba Az egymintás T-próba azt vizsgálja, hogy különbözik-e a változó M átlaga egy megadott m konstanstól. Az a feltételezés,
RészletesebbenValószín ségszámítás és statisztika Gyakorlat (Statisztika alapjai)
Gyakorlat (Statisztika alapjai) 2018. december 2. Statisztika alapjai 1 A mérnökinformatikus hallgatók zárthelyi dolgozatot írtak, ahol a maximális pontszám 50 pont volt. Véletlenszer en megnéztük 5 hallgató
RészletesebbenVillamosmérnök A4 11. hét Kétdimenziós normális eloszlás, cht - Megoldások
Villamosmérnök A 11. hét Kétdimenziós normális eloszlás, cht - Megoldások Kétdimenziós normális összefoglalás Egy kétdimenziós X, Y valószínűségi változó kovariancia mátrixa: VarX CovX, Y CovX, Y VarY
RészletesebbenA maximum likelihood becslésről
A maximum likelihood becslésről Definíció Parametrikus becsléssel foglalkozunk. Adott egy modell, mellyel elképzeléseink szerint jól leírható a meghatározni kívánt rendszer. (A modell típusának és rendszámának
RészletesebbenBiometria gyakorló feladatok BsC hallgatók számára
Biometria gyakorló feladatok BsC hallgatók számára 1. Egy üzem alkalmazottainak megoszlása az elért teljesítmény %-a szerint a következı: Norma teljesítmény % Dolgozók száma 60-80 30 81-90 70 91-100 90
RészletesebbenBiometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem
Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem Előadások-gyakorlatok 2018-ban (13 alkalom) IX.12, 19, 26, X. 3, 10, 17, 24, XI. 7, 14,
Részletesebben3. Egy szabályos dobókockával háromszor dobunk egymás után. Legyen A az az esemény, hogy
Valószínűségszámítás. zárthelyi dolgozat 009. október 5.. Egy osztályba 3-an járnak. Minden fizikaórán a a többi órától függetlenül a tanár kisorsol egy felelőt, véletlenszerűen, egyenletesen, azaz mindig
RészletesebbenPopulációbecslés és monitoring. Eloszlások és alapstatisztikák
Populációbecslés és monitoring Eloszlások és alapstatisztikák Eloszlások Az eloszlás megadja, hogy milyen valószínűséggel kapunk egy adott intervallumba tartozó értéket, ha egy olyan populációból veszünk
RészletesebbenTovábblépés. Általános, lineáris modell. Példák. Jellemzık. Matematikai statisztika 12. elıadás,
Matematikai statisztika. elıadás, 9.5.. Továbblépés Ha nem fogadható el a reziduálisok korrelálatlansága: Lehetnek fel nem tárt periódusok De más kapcsolat is fennmaradhat az egymáshoz közeli megfigyelések
RészletesebbenK oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.
Középérték és variancia azonosságának próbái: t-próba, F -próba 2012. március 21. Hipotézis álĺıtása Feltételezés: a minta egy adott szempont alapján más populációhoz tartozik, mint b minta. Nullhipotézis
RészletesebbenElemi statisztika fizikusoknak
1. oldal Elemi statisztika fizikusoknak Pollner Péter Biológiai Fizika Tanszék pollner@elte.hu Az adatok leírása, megismerése és összehasonlítása 2-1 Áttekintés 2-2 Gyakoriság eloszlások 2-3 Az adatok
RészletesebbenMatematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév
Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév 1. A várható érték és a szórás transzformációja 1. Ha egy valószínűségi változóhoz hozzáadunk ötöt, mínusz ötöt, egy b konstanst,
RészletesebbenAlkalmazott statisztika feladatok
Alkalmazott statisztika feladatok 1. Leíró statisztikák és grakonok 1.1. a. Olvassuk be a Davis adatsort a car vagy a cardata csomagból! Ábrázoljuk a weight változó boxplotját, majd értelmezzük az outlier
RészletesebbenVarianciaanalízis 4/24/12
1. Feladat Egy póker kártya keverő gép a kártyákat random módon választja ki. A vizsgálatban 1600 választott kártya színei az alábbi gyakorisággal fordultak elő. Vizsgáljuk meg, hogy a kártyák kiválasztása
RészletesebbenGazdasági matematika II. vizsgadolgozat megoldása A csoport
Gazdasági matematika II. vizsgadolgozat megoldása A csoport Definiálja az alábbi fogalmakat!. Egy eseménynek egy másik eseményre vonatkozó feltételes valószínűsége. ( pont) Az A esemény feltételes valószínűsége
RészletesebbenValószín ségszámítás és statisztika gyakorlat Programtervez informatikus szak, esti képzés
Valószín ségszámítás és statisztika gyakorlat Programtervez informatikus szak, esti képzés Játékszabályok 0 + x pontot lehet szerezni a félév során: 50 pont:. ZH a félév közepén 50 pont:. ZH a félév végén
RészletesebbenValószín ségszámítás. Survey statisztika mesterszak és földtudomány alapszak Backhausz Ágnes 2018/2019.
Valószín ségszámítás Survey statisztika mesterszak és földtudomány alapszak Backhausz Ágnes agnes@cs.elte.hu 2018/2019. szi félév A valószín ségszámítás kurzus céljai a statisztika megalapozása: a véletlen
RészletesebbenA biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet
A biostatisztika alapfogalmai, hipotézisvizsgálatok Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet Hipotézisvizsgálatok A hipotézisvizsgálat során a rendelkezésre álló adatok (statisztikai
Részletesebben