1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78
1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11 Tel.: 0/453-91-78
3. Becsléselmélet Alapfogalmak, jelölések A sokaság elemszáma: N A sokaság paramétereinek általános jele: Θ A sokaság legfontosabb paraméterei: - várható érték: μ - szórás: σ - arány: P A minta elemszáma: n A mintából számított paraméterek általános jele: Θ. A mintából számított legfontosabb paraméterek: - várható érték: y - szórás: s - arány: p A becslések tulajdonságai Torzítatlanság: a mintából számított becslések várható értéke megegyezik a sokasági paraméterrel, azaz A torzítás mértéke: Bs θ = θ E θ A becslés varianciája: Var(θ ) E θ = θ Becslések összehasonlítása Két torzítatlan becslőfüggvény esetén a hatásosabbat kell választani. Két torzítatlan becslőfüggvény közül azt tekintjük hatásosabbnak, amelyiknek kisebb a varianciája. Tel.: 0/453-91-78
4 Egy torzított és egy torzítatlan becslőfüggvény közül az átlagos négyzetes hiba (MSE) alapján kell választani. Az a jobb becslés, amelynek kisebb az átlagos négyzetes hibája. MSE θ = Bs θ + Var θ Tel.: 0/453-91-78
5 3. Intervallumbecslések Mintavételi módok - FAE: független azonos eloszlású (visszatevéses) - EV: egyszerű véletlen (visszatevés nélküli) - R: rétegzett - TL: többlépcsős - CS: csoportos Általános képlet Int 1 α (θ) = θ ± φ α 1 s θ A fenti képlet a konfidencia-intervallumok általános képlete. A jelölések tartalma: 1 α: megbízhatósági szint Θ: a sokaság paramétere θ : a paraméter mintából becsült értéke (pontbecslés) φ: valószínűségi változó s θ : a paraméterbecslés standard hibája φ α 1 s θ = Δ θ : a konfidencia intervallum sugara, a becslés abszolút hibahatára Tel.: 0/453-91-78
6 Konfidencia intervallumok konkrét esetekben Sokasági átlag (várható érték, μ) FAE minta EV minta kis minta (n 30) ismert sokasági szórás (σ) y ± z 1 α y ± z 1 α σ n σ n 1 n N kis minta (n 30) ismeretlen sokasági szórás (σ) y ± t α 1 (v) s n szabadságfok: v=n-1 y ± t α 1 (v) s n 1 n N szabadságfok: v=n-1 nagy minta (n>30) y ± z 1 α y ± z 1 α s n s n 1 n N R minta - - y R ± z α 1 W s j n 1 n N σ B AR minta - - y ± z α 1 n s: a mintából becsült szórás s = (y i y ) n 1 Sokasági szórás (σ) (n 1)s Int 1 α (σ) = χ α (n 1) ; (n 1)s (n 1) χ α 1 Sokasági arány (P) nagy minta (n>30) FAE minta EV minta p(1 p) p ± z α 1 n p(1 p) p ± z α 1 1 n n N Tel.: 0/453-91-78
7 Értékösszegbecslés Int 1 α (Y ) = N Int 1 α (μ) Mintaelemszámok FAE minta EV minta Átlagbecslés z α 1 σ Δ z α 1 σ z α 1 N σ + Δ Neyman-féle optimális mintaelosztás: n j = n N jσ j N j σ j Független részminták módszere (FRM) Int 1 α (θ) = θ FRM ± t 1 α (n 1) s θ FRM θ FRM = θ i k s θ FRM = (θ i θ FRM ) k(k 1) Tel.: 0/453-91-78
8 4. Hipotézisvizsgálat Egymintás paraméteres próbák Kétoldali próbák: egyenlőséget vizsgálnak egy sokasági paraméterre vonatkozóan Egyoldali próbák: egyenlőtlenséget vizsgálnak egy sokasági paraméterre vonatkozóan a) várható értékre vonatkozó próbák - kis minta és ismert sokasági szórás, illetve nagy minta esetén Z = y μ 0 σ n - kis minta és ismeretlen sokasági szórás esetén T = y μ 0 s n b) szórásra vonatkozó próba χ = (n 1)s σ 0 c) arányra vonatkozó próba p P 0 Z = P 0(1 P 0 ) n Egymintás nemparaméteres próbák Minden esetben egyoldali, felső kritikus értékkel végrehajtandó próbák. a) Illeszkedésvizsgálat χ = (f i np i ) np i = n g i P i 1 Tel.: 0/453-91-78
9 szabadságfok: k-b-1 (k: kategóriák száma; b: a becsült paraméterek száma) b) Függetlenségvizsgálat χ = (n ij n ij ) n ij szabadságfok: (r-1)(c-1) (r: a táblázat sorainak; c: a táblázat oszlopainak száma) p-érték (empirikus szignifikancia-szint) Az a valószínűség, amely mellett a H 0 már éppen elvethető. A próbafüggvény empirikus értékéhez, mint kritikus értékhez tartozó szignifikancia-szint. Két-, és többmintás próbák Két várható értékre vonatkozó próbák: - nagy minta, vagy ismert szórások esetén: Z = y x δ 0 σ y n y + σ x n x - kis minta és ismeretlen szórások esetén: T = y x δ 0 s c 1 n y + 1 n x szabadságfok: n y + n x s c = s y n y 1 + s x (n x 1) n y + n x Két arányra vonatkozó próbák: - van feltételezett különbség (ε 0 ) a két arány közt Tel.: 0/453-91-78
10 Z = p y p x ε 0 p yq y n y + p xq x n x - nincs feltételezett különbség a két arány között p y p x Z = p q 1 n y + 1 n x Két szórásra vonatkozók próba F = s y s x Szabadságfokok: n y 1; n x 1 Több várható érték azonosságára vonatkozó próba (varianciaanalízis) F = s k s b s k = SSK M 1 s b = SSB n M SSK = n j y j y SSB = n j s j Szabadságfokok: M 1; n M Tel.: 0/453-91-78
11 5. Regresszió-számítás Kétváltozós regresszió x: ok y: okozat Az általános egyenlet: y = β 0 + β 1x + e y A paraméterek becslése β 1 = d xd y d x = xy nx y x nx d x = x i x β 0 = y β 1x Illeszkedés: s e = e n e = SSE = (y i y ) Kapcsolatszorosság r = d xd y d x d y = xy nx y ( x nx )( y ny ) r = SSR SST SSR = β 1 d x = (y y ) SST = d y = (y i y ) Rugalmasság El(y, x) = β 1x y Tel.: 0/453-91-78
1 Intervallumbecslések - paraméterekre Int 1 α (β 1 ) = β 1 ± t 1 α (n )s β 1 s e s β 1 = d x Int 1 α (β 0 ) = β 0 ± t 1 α (n )s β 0 s β 0 = s e 1 n + x d x - várható értékre Int 1 α (E(Y )) = y ± t α 1 (n )s y s y = s e 1 n + (x x ) d x Hipotézisek - paraméter szignifikanciája H 0 : β 1 = 0 H 1 : β 1 0 T = β 1 s β 1 szabadságfok: n- F = SSR SSE n Szabadságfokok: 1, n- Tel.: 0/453-91-78
13 Idősoros regresszió Durbin-Watson próba (reziduális autokorreláció) H 0 : ρ = 0 H 1 : ρ 0 Durbin-Watson segédregresszió: ε t = ρε t 1 + η t Próbafüggvény: d = (e t e t 1 ) e t Nemlineáris regresszió - exponenciális regresszió - hatványkitevős regresszió Kapcsolatszorosság y = β 0β 1x y = β 0x β 1 I = 1 SSE SST Többváltozós regresszió Általánosságban y = β 0 + β 1x 1 + β x + + β kx k Paraméterek becslése β = (X T X) 1 X T y Tel.: 0/453-91-78
14 Illeszkedés: e s e = n k 1 e = SSE = (y i y ) = e T e Kapcsolatszorosság R = SSR SST = 1 1 = r y1 + r y r y1 r y r 1 q yy 1 r 1 Parciális korreláció q yj r yj.1 k = q yy q jj Háromváltozós esetben r y1. = r y1 r y r 1 1 r y (1 r 1 ) Rugalmasság El y ; x j = β jx j y Tel.: 0/453-91-78
15 Útelemzés x 1 β 1 β 1 β 1 y x β Közvetlen hatás: β 1 és β regresszió: y = β 0 + β 1x 1 + β x Közvetett hatások: β 1 β és β 1 β 1 regressziók: x = β 0 + β 1 x 1 és x 1 = β 0 + β 1 x Teljes hatások: β 1 + β 1 β és β + β 1 β 1 regressziók: y = β 0 + β 1x 1 és y = β 0 + β x Multikollinearitás 1 < VIF j <, gyenge < VIF j < 5, erős Hipotézisek - parciális T-próba VIF j = 1 1 R j 5 < VIF j, káros H 0 : β j = 0 H 1 : β j 0 T = β j s β j szabadságfok: n-k-1 Tel.: 0/453-91-78
16 - globális F-próba (varianciaanalízis) SSR F = k n k 1 R = SSE k 1 R n k 1 szabadságfokok: k, n-k-1 ANOVA-tábla A variancia eredete Négyzetösszeg Szabadságfok Regresszió SSR k Maradék SSE n-k-1 Teljes SST n-1 Átlagos négyzetösszeg SSR k SSE n k 1 F-érték SSR k SSE n k 1 Intervallum-becslések - paraméterekre Int 1 α β j = β j ± t 1 α (n k 1)s β j s β j = s e (X T 1 X) jj - várható értékre Int 1 α (E(Y )) = y ± t α 1 (n k 1)s y s y = s e Tel.: 0/453-91-78