Statisztika elméleti összefoglaló

Hasonló dokumentumok
Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

[Biomatematika 2] Orvosi biometria

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Lineáris regressziószámítás 1. - kétváltozós eset

KÖVETKEZTETŐ STATISZTIKA

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Hipotézis vizsgálatok

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika II előadáslapok. 2003/4. tanév, II. félév

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

y ij = µ + α i + e ij

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

GVMST22GNC Statisztika II.

Többváltozós Regresszió-számítás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis vizsgálatok

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Diagnosztika és előrejelzés

Adatok statisztikai értékelésének főbb lehetőségei

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Többváltozós lineáris regressziós modell feltételeinek

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Statisztika Elıadások letölthetık a címrıl

Biostatisztika Összefoglalás

Több valószínűségi változó együttes eloszlása, korreláció

egyetemi jegyzet Meskó Balázs

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Korreláció és lineáris regresszió

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Nemparaméteres próbák

Bevezetés a hipotézisvizsgálatokba

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

A Statisztika alapjai

Eloszlás-független módszerek 13. elıadás ( lecke)

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Biostatisztika Összefoglalás

Dr. Karácsony Zsolt. Miskolci Egyetem november

Fogalom STATISZTIKA. Alkalmazhatósági feltételek. A standard lineáris modell. Projekciós mátrix, P

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Matematikai statisztikai elemzések 6.

Matematikai statisztika szorgalmi feladatok

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat

Függetlenségvizsgálat, Illeszkedésvizsgálat

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

5. előadás - Regressziószámítás

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Regressziós vizsgálatok

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Matematikai statisztikai elemzések 4.

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Bevezetés, tudnivalók, ökonometriai alapok

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Matematikai statisztikai elemzések 4.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

A többváltozós lineáris regresszió 1.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

TÖBBVÁLTOZÓS KORRELÁCIÓ- ÉS

ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

1. Példa. A gamma függvény és a Fubini-tétel.

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Kettőnél több csoport vizsgálata. Makara B. Gábor

Matematika III. 9. Statisztikai hipotézisek Prof. Dr. Závoti, József

Matematikai statisztikai elemzések 3.

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biostatisztika VIII. Mátyus László. 19 October

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

s.s. Bere Anikó Zsuzsanna

Biostatisztika 2. Dr. Dinya Elek Dr. Solymosi Róbert: Biometria a klinikumban Dr. Dinya Elek: Biostatisztika c. művei alapján

Korreláció és Regresszió

Variancia-analízis (folytatás)

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Excel segédlet Üzleti statisztika tantárgyhoz

Korreláció és Regresszió (folytatás) Logisztikus telítıdési függvény Több független változós regressziós függvények

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

A TANTÁRGY ADATLAPJA

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Átírás:

1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78

1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11 Tel.: 0/453-91-78

3. Becsléselmélet Alapfogalmak, jelölések A sokaság elemszáma: N A sokaság paramétereinek általános jele: Θ A sokaság legfontosabb paraméterei: - várható érték: μ - szórás: σ - arány: P A minta elemszáma: n A mintából számított paraméterek általános jele: Θ. A mintából számított legfontosabb paraméterek: - várható érték: y - szórás: s - arány: p A becslések tulajdonságai Torzítatlanság: a mintából számított becslések várható értéke megegyezik a sokasági paraméterrel, azaz A torzítás mértéke: Bs θ = θ E θ A becslés varianciája: Var(θ ) E θ = θ Becslések összehasonlítása Két torzítatlan becslőfüggvény esetén a hatásosabbat kell választani. Két torzítatlan becslőfüggvény közül azt tekintjük hatásosabbnak, amelyiknek kisebb a varianciája. Tel.: 0/453-91-78

4 Egy torzított és egy torzítatlan becslőfüggvény közül az átlagos négyzetes hiba (MSE) alapján kell választani. Az a jobb becslés, amelynek kisebb az átlagos négyzetes hibája. MSE θ = Bs θ + Var θ Tel.: 0/453-91-78

5 3. Intervallumbecslések Mintavételi módok - FAE: független azonos eloszlású (visszatevéses) - EV: egyszerű véletlen (visszatevés nélküli) - R: rétegzett - TL: többlépcsős - CS: csoportos Általános képlet Int 1 α (θ) = θ ± φ α 1 s θ A fenti képlet a konfidencia-intervallumok általános képlete. A jelölések tartalma: 1 α: megbízhatósági szint Θ: a sokaság paramétere θ : a paraméter mintából becsült értéke (pontbecslés) φ: valószínűségi változó s θ : a paraméterbecslés standard hibája φ α 1 s θ = Δ θ : a konfidencia intervallum sugara, a becslés abszolút hibahatára Tel.: 0/453-91-78

6 Konfidencia intervallumok konkrét esetekben Sokasági átlag (várható érték, μ) FAE minta EV minta kis minta (n 30) ismert sokasági szórás (σ) y ± z 1 α y ± z 1 α σ n σ n 1 n N kis minta (n 30) ismeretlen sokasági szórás (σ) y ± t α 1 (v) s n szabadságfok: v=n-1 y ± t α 1 (v) s n 1 n N szabadságfok: v=n-1 nagy minta (n>30) y ± z 1 α y ± z 1 α s n s n 1 n N R minta - - y R ± z α 1 W s j n 1 n N σ B AR minta - - y ± z α 1 n s: a mintából becsült szórás s = (y i y ) n 1 Sokasági szórás (σ) (n 1)s Int 1 α (σ) = χ α (n 1) ; (n 1)s (n 1) χ α 1 Sokasági arány (P) nagy minta (n>30) FAE minta EV minta p(1 p) p ± z α 1 n p(1 p) p ± z α 1 1 n n N Tel.: 0/453-91-78

7 Értékösszegbecslés Int 1 α (Y ) = N Int 1 α (μ) Mintaelemszámok FAE minta EV minta Átlagbecslés z α 1 σ Δ z α 1 σ z α 1 N σ + Δ Neyman-féle optimális mintaelosztás: n j = n N jσ j N j σ j Független részminták módszere (FRM) Int 1 α (θ) = θ FRM ± t 1 α (n 1) s θ FRM θ FRM = θ i k s θ FRM = (θ i θ FRM ) k(k 1) Tel.: 0/453-91-78

8 4. Hipotézisvizsgálat Egymintás paraméteres próbák Kétoldali próbák: egyenlőséget vizsgálnak egy sokasági paraméterre vonatkozóan Egyoldali próbák: egyenlőtlenséget vizsgálnak egy sokasági paraméterre vonatkozóan a) várható értékre vonatkozó próbák - kis minta és ismert sokasági szórás, illetve nagy minta esetén Z = y μ 0 σ n - kis minta és ismeretlen sokasági szórás esetén T = y μ 0 s n b) szórásra vonatkozó próba χ = (n 1)s σ 0 c) arányra vonatkozó próba p P 0 Z = P 0(1 P 0 ) n Egymintás nemparaméteres próbák Minden esetben egyoldali, felső kritikus értékkel végrehajtandó próbák. a) Illeszkedésvizsgálat χ = (f i np i ) np i = n g i P i 1 Tel.: 0/453-91-78

9 szabadságfok: k-b-1 (k: kategóriák száma; b: a becsült paraméterek száma) b) Függetlenségvizsgálat χ = (n ij n ij ) n ij szabadságfok: (r-1)(c-1) (r: a táblázat sorainak; c: a táblázat oszlopainak száma) p-érték (empirikus szignifikancia-szint) Az a valószínűség, amely mellett a H 0 már éppen elvethető. A próbafüggvény empirikus értékéhez, mint kritikus értékhez tartozó szignifikancia-szint. Két-, és többmintás próbák Két várható értékre vonatkozó próbák: - nagy minta, vagy ismert szórások esetén: Z = y x δ 0 σ y n y + σ x n x - kis minta és ismeretlen szórások esetén: T = y x δ 0 s c 1 n y + 1 n x szabadságfok: n y + n x s c = s y n y 1 + s x (n x 1) n y + n x Két arányra vonatkozó próbák: - van feltételezett különbség (ε 0 ) a két arány közt Tel.: 0/453-91-78

10 Z = p y p x ε 0 p yq y n y + p xq x n x - nincs feltételezett különbség a két arány között p y p x Z = p q 1 n y + 1 n x Két szórásra vonatkozók próba F = s y s x Szabadságfokok: n y 1; n x 1 Több várható érték azonosságára vonatkozó próba (varianciaanalízis) F = s k s b s k = SSK M 1 s b = SSB n M SSK = n j y j y SSB = n j s j Szabadságfokok: M 1; n M Tel.: 0/453-91-78

11 5. Regresszió-számítás Kétváltozós regresszió x: ok y: okozat Az általános egyenlet: y = β 0 + β 1x + e y A paraméterek becslése β 1 = d xd y d x = xy nx y x nx d x = x i x β 0 = y β 1x Illeszkedés: s e = e n e = SSE = (y i y ) Kapcsolatszorosság r = d xd y d x d y = xy nx y ( x nx )( y ny ) r = SSR SST SSR = β 1 d x = (y y ) SST = d y = (y i y ) Rugalmasság El(y, x) = β 1x y Tel.: 0/453-91-78

1 Intervallumbecslések - paraméterekre Int 1 α (β 1 ) = β 1 ± t 1 α (n )s β 1 s e s β 1 = d x Int 1 α (β 0 ) = β 0 ± t 1 α (n )s β 0 s β 0 = s e 1 n + x d x - várható értékre Int 1 α (E(Y )) = y ± t α 1 (n )s y s y = s e 1 n + (x x ) d x Hipotézisek - paraméter szignifikanciája H 0 : β 1 = 0 H 1 : β 1 0 T = β 1 s β 1 szabadságfok: n- F = SSR SSE n Szabadságfokok: 1, n- Tel.: 0/453-91-78

13 Idősoros regresszió Durbin-Watson próba (reziduális autokorreláció) H 0 : ρ = 0 H 1 : ρ 0 Durbin-Watson segédregresszió: ε t = ρε t 1 + η t Próbafüggvény: d = (e t e t 1 ) e t Nemlineáris regresszió - exponenciális regresszió - hatványkitevős regresszió Kapcsolatszorosság y = β 0β 1x y = β 0x β 1 I = 1 SSE SST Többváltozós regresszió Általánosságban y = β 0 + β 1x 1 + β x + + β kx k Paraméterek becslése β = (X T X) 1 X T y Tel.: 0/453-91-78

14 Illeszkedés: e s e = n k 1 e = SSE = (y i y ) = e T e Kapcsolatszorosság R = SSR SST = 1 1 = r y1 + r y r y1 r y r 1 q yy 1 r 1 Parciális korreláció q yj r yj.1 k = q yy q jj Háromváltozós esetben r y1. = r y1 r y r 1 1 r y (1 r 1 ) Rugalmasság El y ; x j = β jx j y Tel.: 0/453-91-78

15 Útelemzés x 1 β 1 β 1 β 1 y x β Közvetlen hatás: β 1 és β regresszió: y = β 0 + β 1x 1 + β x Közvetett hatások: β 1 β és β 1 β 1 regressziók: x = β 0 + β 1 x 1 és x 1 = β 0 + β 1 x Teljes hatások: β 1 + β 1 β és β + β 1 β 1 regressziók: y = β 0 + β 1x 1 és y = β 0 + β x Multikollinearitás 1 < VIF j <, gyenge < VIF j < 5, erős Hipotézisek - parciális T-próba VIF j = 1 1 R j 5 < VIF j, káros H 0 : β j = 0 H 1 : β j 0 T = β j s β j szabadságfok: n-k-1 Tel.: 0/453-91-78

16 - globális F-próba (varianciaanalízis) SSR F = k n k 1 R = SSE k 1 R n k 1 szabadságfokok: k, n-k-1 ANOVA-tábla A variancia eredete Négyzetösszeg Szabadságfok Regresszió SSR k Maradék SSE n-k-1 Teljes SST n-1 Átlagos négyzetösszeg SSR k SSE n k 1 F-érték SSR k SSE n k 1 Intervallum-becslések - paraméterekre Int 1 α β j = β j ± t 1 α (n k 1)s β j s β j = s e (X T 1 X) jj - várható értékre Int 1 α (E(Y )) = y ± t α 1 (n k 1)s y s y = s e Tel.: 0/453-91-78