Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu
Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság, melyből az alapsokaságra következtetni szeretnénk. A következtetés sosem tökéletes! Akkor miért? Költséghatékonyság Az alapsokaság nem létező elemeire is akarunk következtetni. Az alapsokaság lehet akár végtelen elemszámú is.
Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság, melyből az alapsokaságra következtetni szeretnénk. A következtetés sosem tökéletes! Akkor miért? Költséghatékonyság Az alapsokaság nem létező elemeire is akarunk következtetni. Az alapsokaság lehet akár végtelen elemszámú is.
A sokaságok fajtái áttekintés Véletlen egyed: ξ, eloszlásfüggvénye F(X) = P(ξ < X). Sokaság eloszlásfüggvény várható érték szórásnégyzet fajtája (F(X)) (M(ξ)) (D 2 (ξ)) véges X-nél kisebb egyedek N X i (X i X) 2 /N diszkrét folytonos
A sokaságok fajtái áttekintés Véletlen egyed: ξ, eloszlásfüggvénye F(X) = P(ξ < X). Sokaság eloszlásfüggvény várható érték szórásnégyzet fajtája (F(X)) (M(ξ)) (D 2 (ξ)) véges diszkrét X-nél kisebb egyedek N lépcsős X i P(ξ = X i)x i i (X i X) 2 /N M(ξ 2 ) M 2 (ξ) folytonos
A sokaságok fajtái áttekintés Véletlen egyed: ξ, eloszlásfüggvénye F(X) = P(ξ < X). Sokaság eloszlásfüggvény várható érték szórásnégyzet fajtája (F(X)) (M(ξ)) (D 2 (ξ)) véges X-nél kisebb egyedek N X i (X i X) 2 /N diszkrét lépcsős i P(ξ = X i)x i M(ξ 2 ) M 2 (ξ) folytonos (ha létezik) Xf (X)dX M(ξ2 ) M 2 (ξ)
A sokaságok fajtái áttekintés Véletlen egyed: ξ, eloszlásfüggvénye F(X) = P(ξ < X). Sokaság eloszlásfüggvény várható érték szórásnégyzet fajtája (F(X)) (M(ξ)) (D 2 (ξ)) véges X-nél kisebb egyedek N X i (X i X) 2 /N diszkrét lépcsős i P(ξ = X i)x i M(ξ 2 ) M 2 (ξ) folytonos (ha létezik) Xf (X)dX M(ξ2 ) M 2 (ξ)
Minta és konkrét minta Különbséget teszünk a minta (tulajdonképpen a mintavételi eljárás, ill. annak elméleti eredménye) és egy konkrét minta (a mintavételi eljárás egyszeri alkalmazása) között. Pl: Magyar állampolgárok vagyoni helyzetét próbáljuk felmérni két véletlenszerűen kiválasztott egyén alapján. A véletlenszerűen kiválasztott minta kb. jellemző az alapsokaságra. Egy konkrét minta bármi lehet (pl. Csányi Sándor és Kóka János) itt ebből kell majd az alapsokaságra következtetnünk. Nagy, vagy sok minta segít a becslés pontosságában (erről a 2. előadáson)
Minta és konkrét minta Különbséget teszünk a minta (tulajdonképpen a mintavételi eljárás, ill. annak elméleti eredménye) és egy konkrét minta (a mintavételi eljárás egyszeri alkalmazása) között. Pl: Magyar állampolgárok vagyoni helyzetét próbáljuk felmérni két véletlenszerűen kiválasztott egyén alapján. A véletlenszerűen kiválasztott minta kb. jellemző az alapsokaságra. Egy konkrét minta bármi lehet (pl. Csányi Sándor és Kóka János) itt ebből kell majd az alapsokaságra következtetnünk. Nagy, vagy sok minta segít a becslés pontosságában (erről a 2. előadáson)
Minta és konkrét minta Különbséget teszünk a minta (tulajdonképpen a mintavételi eljárás, ill. annak elméleti eredménye) és egy konkrét minta (a mintavételi eljárás egyszeri alkalmazása) között. Pl: Magyar állampolgárok vagyoni helyzetét próbáljuk felmérni két véletlenszerűen kiválasztott egyén alapján. A véletlenszerűen kiválasztott minta kb. jellemző az alapsokaságra. Egy konkrét minta bármi lehet (pl. Csányi Sándor és Kóka János) itt ebből kell majd az alapsokaságra következtetnünk. Nagy, vagy sok minta segít a becslés pontosságában (erről a 2. előadáson)
Minta és konkrét minta Különbséget teszünk a minta (tulajdonképpen a mintavételi eljárás, ill. annak elméleti eredménye) és egy konkrét minta (a mintavételi eljárás egyszeri alkalmazása) között. Pl: Magyar állampolgárok vagyoni helyzetét próbáljuk felmérni két véletlenszerűen kiválasztott egyén alapján. A véletlenszerűen kiválasztott minta kb. jellemző az alapsokaságra. Egy konkrét minta bármi lehet (pl. Csányi Sándor és Kóka János) itt ebből kell majd az alapsokaságra következtetnünk. Nagy, vagy sok minta segít a becslés pontosságában (erről a 2. előadáson)
Fogalmak/jellemzők Minta elemszáma (n) Az alapsokaság lehet véges, megszámlálhatóan végtelen (diszkrét), megszámlálhatatlanul végtelen (folytonos). A minta elemszáma mindig véges! Minta elemei Valószínűségi változók: ξ 1,..., ξ i,..., ξ n Mintavételi keret Az alapsokaság elemeit pontosan egyszer tartalmazza. Problémák: végtelen/változó alapsokaság Kiválasztási arány A minta és a sokaság elemeinek hányadosa: n N A minta mérete Kis vagy nagy minta. 100 felett nagy.
Fogalmak/jellemzők Minta elemszáma (n) Az alapsokaság lehet véges, megszámlálhatóan végtelen (diszkrét), megszámlálhatatlanul végtelen (folytonos). A minta elemszáma mindig véges! Minta elemei Valószínűségi változók: ξ 1,..., ξ i,..., ξ n Mintavételi keret Az alapsokaság elemeit pontosan egyszer tartalmazza. Problémák: végtelen/változó alapsokaság Kiválasztási arány A minta és a sokaság elemeinek hányadosa: n N A minta mérete Kis vagy nagy minta. 100 felett nagy.
Fogalmak/jellemzők Minta elemszáma (n) Az alapsokaság lehet véges, megszámlálhatóan végtelen (diszkrét), megszámlálhatatlanul végtelen (folytonos). A minta elemszáma mindig véges! Minta elemei Valószínűségi változók: ξ 1,..., ξ i,..., ξ n Mintavételi keret Az alapsokaság elemeit pontosan egyszer tartalmazza. Problémák: végtelen/változó alapsokaság Kiválasztási arány A minta és a sokaság elemeinek hányadosa: n N A minta mérete Kis vagy nagy minta. 100 felett nagy.
Fogalmak/jellemzők Minta elemszáma (n) Az alapsokaság lehet véges, megszámlálhatóan végtelen (diszkrét), megszámlálhatatlanul végtelen (folytonos). A minta elemszáma mindig véges! Minta elemei Valószínűségi változók: ξ 1,..., ξ i,..., ξ n Mintavételi keret Az alapsokaság elemeit pontosan egyszer tartalmazza. Problémák: végtelen/változó alapsokaság Kiválasztási arány A minta és a sokaság elemeinek hányadosa: n N A minta mérete Kis vagy nagy minta. 100 felett nagy.
Fogalmak/jellemzők Minta elemszáma (n) Az alapsokaság lehet véges, megszámlálhatóan végtelen (diszkrét), megszámlálhatatlanul végtelen (folytonos). A minta elemszáma mindig véges! Minta elemei Valószínűségi változók: ξ 1,..., ξ i,..., ξ n Mintavételi keret Az alapsokaság elemeit pontosan egyszer tartalmazza. Problémák: végtelen/változó alapsokaság Kiválasztási arány A minta és a sokaság elemeinek hányadosa: n N A minta mérete Kis vagy nagy minta. 100 felett nagy.
A mintavétel módja Visszatevéses v. visszatevés nélküli mintavétel A mintavétel módja- visszatevéses visszatevés nélküli A sokaság elemszáma A mintaelemek kapcsolata... Végtelen függetlenek függetlenek Véges függetlenek nem függetlenek
A mintavételi eljárások 1/2. Véletlen mintavételi eljárások Független, azonos eloszlású minta: Ld fent. Egyszerű véletlen mintavétel: homogén, véges sokaságból, mintavételi keretből visszatevés nélkül. Rétegzett mintavétel: csoportokba osztott sokaságból mennyit az egyes csoportokból? Egyenletes: minden rétegből n j = n M. Neyman-féle optimális: Nagyobb szórású rétegből nagyobb rétegminta.
A mintavételi eljárások 1/2. Véletlen mintavételi eljárások Független, azonos eloszlású minta: Ld fent. Egyszerű véletlen mintavétel: homogén, véges sokaságból, mintavételi keretből visszatevés nélkül. Rétegzett mintavétel: csoportokba osztott sokaságból mennyit az egyes csoportokból? Egyenletes: minden rétegből n j = n M. Neyman-féle optimális: Nagyobb szórású rétegből nagyobb rétegminta.
A mintavételi eljárások 1/2. Véletlen mintavételi eljárások Független, azonos eloszlású minta: Ld fent. Egyszerű véletlen mintavétel: homogén, véges sokaságból, mintavételi keretből visszatevés nélkül. Rétegzett mintavétel: csoportokba osztott sokaságból mennyit az egyes csoportokból? Egyenletes: minden rétegből n j = n M. Neyman-féle optimális: Nagyobb szórású rétegből nagyobb rétegminta.
A mintavételi eljárások 1/2. Véletlen mintavételi eljárások Független, azonos eloszlású minta: Ld fent. Egyszerű véletlen mintavétel: homogén, véges sokaságból, mintavételi keretből visszatevés nélkül. Rétegzett mintavétel: csoportokba osztott sokaságból mennyit az egyes csoportokból? Egyenletes: minden rétegből n j = n M. Neyman-féle optimális: Nagyobb szórású rétegből nagyobb rétegminta.
A mintavételi eljárások 2/2. Csoportos: a sokaság egy v. több csoportját teljes egészében kiválasztjuk Többlépcsős: A csoporton belül is választunk. Kombinált. Pl: Ismétlődő időbeli változást vizsgál; több mintavétel uarról a sokaságról több időpontban. Panelfelvétel ugyanaz a mintafelvétel több időpontban (pl ugyanazok az egyedek) Nem véletlen mintavételi eljárások Szisztematikus mintavétel: sorbarendezett keretből minden [ N n ] -edik elem. Kvóta szerinti Önkényes
A mintavételi eljárások 2/2. Csoportos: a sokaság egy v. több csoportját teljes egészében kiválasztjuk Többlépcsős: A csoporton belül is választunk. Kombinált. Pl: Ismétlődő időbeli változást vizsgál; több mintavétel uarról a sokaságról több időpontban. Panelfelvétel ugyanaz a mintafelvétel több időpontban (pl ugyanazok az egyedek) Nem véletlen mintavételi eljárások Szisztematikus mintavétel: sorbarendezett keretből minden [ N n ] -edik elem. Kvóta szerinti Önkényes
A mintavételi eljárások 2/2. Csoportos: a sokaság egy v. több csoportját teljes egészében kiválasztjuk Többlépcsős: A csoporton belül is választunk. Kombinált. Pl: Ismétlődő időbeli változást vizsgál; több mintavétel uarról a sokaságról több időpontban. Panelfelvétel ugyanaz a mintafelvétel több időpontban (pl ugyanazok az egyedek) Nem véletlen mintavételi eljárások Szisztematikus mintavétel: sorbarendezett keretből minden [ N n ] -edik elem. Kvóta szerinti Önkényes ma már nem igazán elfogadott.
A mintavételi eljárások 2/2. Csoportos: a sokaság egy v. több csoportját teljes egészében kiválasztjuk Többlépcsős: A csoporton belül is választunk. Kombinált. Pl: Ismétlődő időbeli változást vizsgál; több mintavétel uarról a sokaságról több időpontban. Panelfelvétel ugyanaz a mintafelvétel több időpontban (pl ugyanazok az egyedek) Nem véletlen mintavételi eljárások Szisztematikus mintavétel: sorbarendezett keretből minden [ N n ] -edik elem. Kvóta szerinti Önkényes ma már nem igazán elfogadott.
A mintajellemzők tulajdonságai jellemző sokaság minta konkrét minta ismérvértékek x 1, x 2,... ξ 1, ξ 2,..., ξ n x 1, x 2,..., x n átlag µ ˆµ x A mintaátlag tulajdonságai: várható értéke: M(ˆµ) = µ. szórása: D(ˆµ) = σˆµ = σ n (nagyobb minta, kisebb szórás!) szórása (ha nem függetlenek pl egyszerű mintavételnél): D(ˆµ) = σˆµ = σ n 1 n N (ez a korrekciós tényező) eloszlása: Normális eloszlású sokaság esetén normális. Nagy minta esetén közel normális. Egyébként nem tudjuk.
A mintajellemzők tulajdonságai jellemző sokaság minta konkrét minta ismérvértékek x 1, x 2,... ξ 1, ξ 2,..., ξ n x 1, x 2,..., x n átlag µ ˆµ x A mintaátlag tulajdonságai: várható értéke: M(ˆµ) = µ. szórása: D(ˆµ) = σˆµ = σ n (nagyobb minta, kisebb szórás!) szórása (ha nem függetlenek pl egyszerű mintavételnél): D(ˆµ) = σˆµ = σ n 1 n N (ez a korrekciós tényező) eloszlása: Normális eloszlású sokaság esetén normális. Nagy minta esetén közel normális. Egyébként nem tudjuk.
A mintajellemzők tulajdonságai jellemző sokaság minta konkrét minta ismérvértékek x 1, x 2,... ξ 1, ξ 2,..., ξ n x 1, x 2,..., x n átlag µ ˆµ x A mintaátlag tulajdonságai: várható értéke: M(ˆµ) = µ. szórása: D(ˆµ) = σˆµ = σ n (nagyobb minta, kisebb szórás!) szórása (ha nem függetlenek pl egyszerű mintavételnél): D(ˆµ) = σˆµ = σ n 1 n N (ez a korrekciós tényező) eloszlása: Normális eloszlású sokaság esetén normális. Nagy minta esetén közel normális. Egyébként nem tudjuk.
A mintajellemzők tulajdonságai jellemző sokaság minta konkrét minta ismérvértékek x 1, x 2,... ξ 1, ξ 2,..., ξ n x 1, x 2,..., x n átlag µ ˆµ x A mintaátlag tulajdonságai: várható értéke: M(ˆµ) = µ. szórása: D(ˆµ) = σˆµ = σ n (nagyobb minta, kisebb szórás!) szórása (ha nem függetlenek pl egyszerű mintavételnél): D(ˆµ) = σˆµ = σ n 1 n N (ez a korrekciós tényező) eloszlása: Normális eloszlású sokaság esetén normális. Nagy minta esetén közel normális. Egyébként nem tudjuk.
A mintajellemzők tulajdonságai jellemző sokaság minta konkrét minta ismérvértékek x 1, x 2,... ξ 1, ξ 2,..., ξ n x 1, x 2,..., x n átlag µ ˆµ x A mintaátlag tulajdonságai: várható értéke: M(ˆµ) = µ. szórása: D(ˆµ) = σˆµ = σ n (nagyobb minta, kisebb szórás!) szórása (ha nem függetlenek pl egyszerű mintavételnél): D(ˆµ) = σˆµ = σ n 1 n N (ez a korrekciós tényező) eloszlása: Normális eloszlású sokaság esetén normális. Nagy minta esetén közel normális. Egyébként nem tudjuk.
Példa: A budapesti kétszobás lakások bérleti díja 1/3. Alapsokaság:
Példa: A budapesti kétszobás lakások bérleti díja 1/3. Alapsokaság: 30 elemű minta
Példa: A budapesti kétszobás lakások bérleti díja 2/3. Az alapsokaságban µ = 105.465, σ = 51.3. (Ez általában ismeretlen)
Példa: A budapesti kétszobás lakások bérleti díja 2/3. Az alapsokaságban µ = 105.465, σ = 51.3. (Ez általában ismeretlen) A mintaátlag eloszlása:
Példa: A budapesti kétszobás lakások bérleti díja 2/3. Az alapsokaságban µ = 105.465, σ = 51.3. (Ez általában ismeretlen) A mintaátlagra x = 105.486, σ x = σ 100 = 5.13. A mintaátlag eloszlása:
6.4. gyakorló feladat Feltételezzük, hogy egy sokaság 10 elemből áll. Egy tetszőleges mennyiségi ismérv értékei a sokasági egységeknél: Sokasági ismérv egység értéke a) Határozzuk meg a A 1 4 sokaság átlagát és szórását! A 2 8 b) Határozzuk meg a A 3 10 kételemű minták átlagát! A 4 10 c) Rendezzük osztályközös A 5 12 gyakorisági sorba, A 6 12 készítsünk gyakorisági A 7 16 poligont A 8 18 d) Vizsgáljuk meg az átlag A 9 20 körüli szóródásukat! A 1 30
6.4. gyakorló feladat a) Határozzuk meg a sokaság átlagát és szórását! X = 4 + 8 + 10 + 10 + 12 + 12 + 16 + 18 + 20 + 30 10 i=1 N(X i X) 2 = 14 σ = = = = N (4 14) 2 + + (30 14) 2 10 488 10 = 48, 8 = 6, 985 =
6.4. gyakorló feladat b) Határozzuk meg a kételemű minták átlagát! Az ismétlés nélküli kételemű minták a következők: (4, 8), (4, 10), (4, 10), (4, 12), (4, 12), (4, 16),... (20, 30). Az átlagok a következők: 6, 7, 7, 8, 8, 10, 11, 12, 17, 9, 9, 10, 10, 12, 13, 14, 19, 10, 11, 11, 13, 14, 15, 20, 11, 11, 13, 14, 15, 20, 12, 14, 15, 16, 21, 14, 15, 16, 21, 17, 18, 23, 19, 24, 25.
6.4. gyakorló feladat b) Határozzuk meg a kételemű minták átlagát! Az ismétlés nélküli kételemű minták a következők: (4, 8), (4, 10), (4, 10), (4, 12), (4, 12), (4, 16),... (20, 30). Az átlagok a következők: 6, 7, 7, 8, 8, 10, 11, 12, 17, 9, 9, 10, 10, 12, 13, 14, 19, 10, 11, 11, 13, 14, 15, 20, 11, 11, 13, 14, 15, 20, 12, 14, 15, 16, 21, 14, 15, 16, 21, 17, 18, 23, 19, 24, 25.
6.4. gyakorló feladat c) Rendezzük osztályközös gyakorisági sorba, készítsünk gyakorisági poligont 45 pár, 2 5 < 45 < 2 6, tehát 6 csoport 6 és 25 között: Kategória f i 9 7 10 12 12 13 15 12 16 18 5 19 21 6 22 3 összesen 45
6.4. gyakorló feladat d) Vizsgáljuk meg az átlag körüli szóródásukat! σˆµ = = = σ = nσˆµ i=1 m(ˆµ i µ) 2 = m (6 14) 2 + + (19 14) 2 45 976 45 = 21, 7 = 4, 66 =