Leíró és matematikai statisztika Matematika alapszak, matematikai elemző szakirány Zempléni András Valószínűségelméleti és Statisztika Tanszék Matematikai Intézet Természettudományi Kar Eötvös Loránd Tudományegyetem Honlap: zempleni.elte.hu E-mail: zempleni@caesar.elte.hu Szoba: D 3-30 2. előadás Összetett viszonyszámok Adott egy sokaság és annak m része. Jelölje V i A i B i az i. részsokaságra vonatkozó viszonyszámot (i,..., m). Nevük: részviszonyszámok. Jelölje a teljes sokaságra számolt viszonyszámot V. Neve: összetett viszonyszám. A i B i V i i i Kiszámítási lehetőségek: V B i i B i i }{{} súlyozott számtani átlag A i i A i V i i }{{} súlyozott harmonikus átlag A leíró statisztikai szakirodalomban az i indexeket pongyola módon le szokták hagyni: V A B BV B A A V Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás / 23 Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 2 / 23 E5.) Egy szálloda 206-os vendégforgalmáról az alábbiakat ismerjük: Származási Vendég- Egy vendég- Egy vendégre ország éjszakák éjszakára jutó jutó vendégszerint száma szállás díja éjszakák száma a vendég (éj) (Ft/éj) (éj/fő) Belföldi 5000 6000 4 Külföldi 4000 2000 2 Összesen 9000...... Határozzuk meg a teljes hotelre vonatkozóan az egy vendégéjszakára jutó szállás díjat és az egy vendégre jutó vendégéjszakák számát! Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 3 / 23 Idősorok elemzése [leíró statisztikai eszközök] I Véges idősor: y, y 2,..., y n Az idősorok fajtái: állapotidősor: a benne lévő adatok egy-egy adott időpontra vonatkoznak (pl. egy cég raktárkészlete adott napokon); tartamidősor: a benne lévő adatok időszakra vonatkoznak (pl. egy cég havi nyereségei). Az idősor értékeiből számítható dinamikus viszonyszámok: Bázisviszonyszámok: b t yt y B, ahol t,..., n; B fix, neve: bázisidőszak (tipikusan B ); Láncviszonyszámok: l t yt y t, ahol t 2,..., n. l -et nem értelmezzük, táblázatban kihúzandó! A bázisviszonyszámokból ki lehet számítani a láncviszonyszámokat és fordítva: láncból bázis: b t l B+ l B+2... l t (t,..., n); bázisból lánc: l t bt b t (t 2,..., n). Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 4 / 23
Idősorok elemzése [leíró statisztikai eszközök] Az idősor átlagos értékének kiszámítása: tartamidősor esetén sima számtani átlaggal: y állapotidősor esetén kronologikus átlaggal: y K n y t t n 2 y + n y t + 2 yn t2 n Az idősor átlagos változásának vizsgálata (állapotidősor esetén értelmes): a fejlődés átlagos mértéke: d yn y n a fejlődés átlagos üteme: l n yn y Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 5 / 23 E6.) Egy vállalat bankszámláján lévő pénz az egyes években január -jén (millió forint): Év Pénzösszeg (M Ft) Év Pénzösszeg (M Ft) 2009 90 203 260 200 200 204 280 20 20 205 300 202 225 206 30 a.) Határozzuk meg a fent látható statisztikai sor típusát! b.) Határozzuk meg a bázisviszonyszámokat 200-es bázissal, valamint a láncviszonyszámokat! c.) 200-ben átlagosan hány forint volt a cég bankszámláján? d.) A 200. január elsejét követő 5 évben (200 és 205 között) átlagosan hány forint volt a cég bankszámláján? e.) 200. január elsejéről 206. január elsejére évente átlagosan mennyivel változott a cég pénzvagyona? Értelmezzük szövegesen az eredményt! Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 6 / 23 Érték-, ár- és volumenindexek I Index vagy indexszám: közvetlenül nem összesíthető, de gazdaságilag összetartozó adatok átlagos változását mutató összetett viszonyszám. Tegyük fel, hogy m különböző terméket értékesítünk két különböző időszakban, és az értékesítés árbevételét szeretnénk elemezni. Jelölések: q 0,j : a j. termékből eladott mennyiség a bázisidőszakban q,j : a j. termékből eladott mennyiség a tárgyidőszakban p 0,j (p,j ): az j. termék egységára a bázis- (tárgy)időszakban v 0,j : a j. termék értékesítéséből származó árbevétel (tágabb értelemben termelési érték) a bázisidőszakban, számítása: v 0,j q 0,j p 0,j v,j : a j. termék értékesítéséből származó árbevétel a tárgyidőszakban, számítása: v,j q,j p,j Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 7 / 23 Érték-, ár- és volumenindexek II Egyedi indexek mostantól a j indexeket lehagyjuk Egyedi volumenindexek: i q,j q,j q 0,j i q q q 0 Egyedi árindexek: i p,j p,j p 0,j i p p p 0 Egyedi értékindexek: i v,j v,j v 0,j q,j p,j p,j p 0,j i v v v 0 q p q 0 p 0 i p i q Összetett indexek: Bázisidőszaki Tárgyidőszaki Index fajtája súlyozású vagy súlyozású vagy Fisher-féle Laspeyres-féle Paasche-féle, Árindexek Ip 0 q0 p Ip q p q p 0 Ip F Ip 0 Ip, Volumenindexek Iq 0 q p 0 Iq q p q0 p Iq F Iq 0 Iq, Értékindex M I v q p q,j p,j j q 0,j p 0,j j Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 8 / 23
Érték-, ár- és volumenindexek III Állítás: az előző fóliákon bevezetett jelölésekkel igazak a következő összefüggések (indexek különböző átlagformulái): I v I 0 q I p I q I 0 p I 0 p I q i p q0 p q0 p ip q0 p i q q0 p q p q p iq i v q p q p iv Megjegyzés: az egyes összetett indexek a megfelelő saját egyedi indexeik súlyozott átlagai Az indexek képleteiben lévő osztások helyett különbségeket is lehet képezni, ekkor az I és i helyett K -t és k-t írunk. Például Érték-, ár- és volumenindexek IV Gyakorlati alkalmazásaik: Értékindexek: vállalatok árbevételének, forgalmának alakulása export és import értékének változása energiafelhasználás értékének változása Árindexek: fogyasztói árindex az infláció mérőszáma, a lakosság által vásárolt fogyasztási cikkek és szolgáltatások árainak átlagos változását fejezi ki cserearányindex: egy ország által exportált termékek árindexe osztva az általa importált termékek árindexével (itt tehát árindexekből számítunk további indexeket) k q q q 0 K 0 p q 0 p q 0 p 0. Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 9 / 23 Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 0 / 23 Rövid szünet Egy hír a bulvármédiából: a balkezesek 7 évvel rövidebb ideig élnek Ugyanis egy brit tudós megvizsgálta egy falu temetőjében található sírokat és mindenkinél utánajárt, hogy balkezes volt-e vagy sem Mi lehet az igazság??? Egy reklámkampány diagramjai E7.) Ágnes asszony háromféle, saját termelésű termékeket árul a Lehel téri piac őstermelői részlegén: tojásokat, krumplikat és hagymákat. Az 207-es és a 206-os áprilisi forgalmát szeretné összevetni egymással. Eladásairól a következőket jegyezte fel: Termékfajta A forgalom értéke Az árak Az eladott mennyiség 207-ben (e Ft) alakulása, 207/206 (%) Tojás 280 95 0 Krumpli 80 0 60 Hagyma 20 20 20 a.) Számítsunk érték-, ár- és volumenindexet a kofa forgalmára vonatkozóan! Értelmezzük szövegesen az egyes indexeket! b.) A forgalom értékének növekedéséből hány forint volt az ár- és a volumenváltozás hatása? Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás / 23 Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 2 / 23
Szöveges értelmezések I v -re, I p-re és I 0 q-ra: Ágnes asszony 207 áprilisában 6,%-kal több bevételre tett szert, mint 206 áprilisában. Ez két részből tevődött össze: egyrészt az eladott termékek árai 207-es eladott mennyiségekkel számolva átlagosan,%-kal csökkentek, másrészt az értékesítés volumene bázisévi árakkal számolva 7,4%-kal bővült. Szöveges értelmezések K p -re és K 0 q -ra: Az árak átlagos csökkenése 207-es eladott mennyiségekkel számolva a forgalom értékének csökkenéséhez 4.3 Ft-tal járult hozzá. Az eladott mennyiségek átlagos növekedése bázisévi árakkal számolva a forgalom értékének növekedéséhez 56.845 Ft-tal járult hozzá. Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 3 / 23 Mennyiségi sorok elemzése I ha a mennyiségi ismérv diszkrét és az ismérvváltozatok száma "kevés", akkor gyakorisági sort készítünk: Ismérvértékek Gyakoriságok x f. x k. f k a n: minta mérete k: különböző ismérvértékek száma f Összesen n i : hányszor fordul elő az i-edik ismérvérték (i,..., k) ha a mennyiségi ismérv folytonos vagy "sok" ismérvváltozat van, akkor osztályközös gyakorisági sort készítünk: Ismérvértékek Gyakoriságok x,a x,f f... x k,a x k,f f k Összesen n a x i,a : az i-edik osztályköz alsó határa x i,f : az i-edik osztályköz felső határa Minden megfigyelés pontosan egy osztályba kerüljön! Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 4 / 23 Mennyiségi sorok elemzése II Hány osztályköz legyen? Mik legyenek az osztályközök? Hüvelykujjszabály: Osztályközök száma: k log 2 n Azonos hosszúságú osztályközök, hosszuk: h xmax x min k Jelölések (osztályközös) gyakorisági soroknál: x i x i,a+x i,f 2 az i. osztályközép/ismérvérték f i gyakoriság g i f i f i i i k relatív gyak. s i x i f i értékösszeg i k i k f i i k i g i s i k i k f k kumulált gyak. g k kumulált rel. gyak. s k kum. értékösszeg z i s i i z k kumulált relatív k értékösszeg Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 5 / 23 s i relatív értékösszeg z i i Példa - magyarországi jövedelmek 205-ben Decilis jövede- Bruttó éves átlag- Személyek g i g i s i z i z i lemosztály jövedelem (e Ft) száma (e fő) (%) (%) (Mrd Ft) (%) (%) 366 965 0 0 353 3 3 2 652 967 0 20 630 5 7 3 886 970 0 30 859 6 3 4 025 964 0 40 989 7 20 5 20 97 0 50 75 8 29 6 368 964 0 60 38 9 38 7 489 969 0 70 443 0 49 8 77 965 0 80 70 2 6 9 264 967 0 90 2092 5 76 0 3470 967 0 00 3355 24 00 Összesen 440 9669 00 3924 00 Megjegyzések: A KSH (Központi Statisztikai Hivatal) háztartásokra összegezte a jövedelmeket, majd számolt átlagjövedelmet, így az átlagkeresetek gyerekekre is vonatkoznak, pedig ők nyilván nem dolgoznak. Ezek csak a legális jövedelmek, nincs bennük becslés az illegális jövedelmekre. A táblázatban lévő számok kerekített értékek. Forrás: https: //www.ksh.hu/docs/hun/xstadat/xstadat_eves/i_zhc04a.html?down634 Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 6 / 23
Mennyiségi sorok elemzése III Koncentráció: a sokasághoz tartozó teljes értékösszeg jelentős része a sokaság kevés egységére összpontosul. Legyen a sokaság n elemű, a különböző ismérvértékek x,..., x k, ezek gyakoriságai f,..., f k. k k Átlagos abszolút eltérés: m f i f j x i x j. A koncentráció mutatószámai: n(n ) i j Gini-együttható (relatív abszolút eltérés): G G 2x Ez nem más, mint a koncentrációs terület (ld. következő fólia) 2-szerese. Értéke 0 és között van; minél nagyobb, annál erősebb a koncentráció. Herfindahl-index: HI k zi 2 i Értéke k és közötti; minél nagyobb, annál erősebb a koncentráció. Mennyiségi sorok elemzése IV Lorenz-görbe a koncentráció mértékét szemléltető ábra Vízszintes tengely: g i kumulált relatív gyakoriságok Függőleges tengely: z i kumulált relatív értékösszegek A 45 fokos egyenes (átló) berajzolása Koncentrációs görbe berajzolása: (0; 0), (g ; z ), (g 2 ; z 2 ),..., (g k ; z k ), (g k ; z k ) (; ) pontok összekötésével kapott töröttvonal Koncentrációs terület: a koncentrációs görbe és az átló által közbezárt terület Erős a koncentráció, ha a koncentrációs görbe közel van a négyzet oldalaihoz. Gyenge a koncentráció, ha a koncentrációs görbe közel van az átlóhoz. Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 7 / 23 Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 8 / 23 Példa magyarországi jövedelmek 205-ben Kumulált relatív értékösszeg 0.0 0.2 0.4 0.6 0.8.0 Lorenz görbe 0.0 0.2 0.4 0.6 0.8.0 Kumulált relatív gyakoriság Kék: koncentrációs terület Piros: koncentrációs görbe (töröttvonal) L 0, 3089 HI 0, 34 0, HI Mihez viszonyítsuk a koncentráció mértékét? Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 9 / 23 Példa Lorenz-görbe A tejágazat koncentrációja különböző országokban Forrás: http://docplayer.hu/89090-a-magyar-tejagazat-helyzete-es-fejlodesenek-lehetseges-iranya.html Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 20 / 23
E8.) Egy piacon 4 azonos méretű vállalat működik (a piaci forgalomból azonos mértékben részesednek). Számszerűsítsük a Herfindahl-indexszel a piaci koncentráció változását, ha az egyik cég felvásárolja a másikat! E9.) Számoljuk ki a csoport múlt heti sportolási idejére a Lorenz görbét és a Gini index értékét! E0.) Legyen az X valószínűségi változó a.) eloszlása P(X 0) P(X 2) P(X 3) 3 ; b.) sűrűségfüggvénye f (x) (2x 2)I( < x < 2). Határozzuk meg X kvantilisfüggvényét! E.) Határozzuk meg a standard normális eloszlás móduszát, mediánját, ferdeségét és lapultságát! E2.) Határozzuk meg a standard Cauchy-eloszlás (Cauchy(0;)) és a Pareto-eloszlás várható értékét! Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 2 / 23 Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X ) p Ind(p) p p( p) P(X 0) p ( )( ) M N M k n k P(X k) ( ( )( Hipgeo(N, M, n) N n n) M n M M N N N Bin(n, p) Geo(p) NegBin(n, p) Poi(λ) k 0,,..., min(n, M) P(X k) ( n k) p k ( p) n k k 0,,..., n P(X k) p( p) k k, 2,... P(X k) ( k n ) p n ( p) k n k n, n +,... np np( p) p n p p p 2 n( p) p 2 P(X k) λk k! e λ k 0,,... λ λ Jelölése Eloszlásfüggvény Sűrűségfüggvény EX D 2 X 0 ha x a { x a ha a < x b E(a, b) ha a < x b b a a+b (b a) 2 b a 2 2 ha b < x N(m, σ 2 )... { e λx ha x 0 Exp(λ) e (x m)2 2σ { 2 2πσ x R m σ 2 λe λx ha x 0 λ λ 2 ) n N Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 22 / 23 További abszolút folytonos eloszlások Eloszlás neve Jelölése Eloszlásfüggvény Sűrűségfüggvény EX D 2 X Cauchy Cauchy(a, b) a R, b > 0 Pareto Pareto(α, β) α, β > 0 Eloszlás neve ( ) π arctg x a + b 2 { ( ) β α x ha x β 0 ha x < β [ ( πb + x a b ( ) α β α+ β ha x β x 0 ha x < β ) 2 ] x R αβ α β 2 α (α ) 2 (α 2) A Pareto-eloszlásnak akkor van véges várható értéke a képletnek megfelelően, ha α >, szórásnégyzete pedig akkor, ha α > 2. Jelölése Sűrűségfüggvény EX D 2 X LN(m, σ 2 ) m R, σ > 0 Gamma Γ(α, λ) α, λ > 0 Lognormális Béta Beta(α, β) α, β > 0 Khínégyzet Student tν ν > 0 (log x m) 2 x 2πσ e 2σ 2 ha x 0 0 hax < 0 { Γ(α) λα e λx x α ha x 0 0 ha x < 0 { Γ(α+β) Γ(α)Γ(β) xα ( x) β x [0, ] e m+σ2 /2 α λ α α+β (e σ2 )e 2m+σ 2 α λ 2 αβ (α+β) 2 (α+β+) χ 2 k k N 2 k/2 Γ(k/2) xk/2 e x/2 x R k 2k Fisher F d,d 2 d, d 2 > 0 ( ) Γ ν+ 2 ( ) πνγ ν2 ( ) ν+ + x2 2 0 (ha ν ν > ) ) d +d Γ( 2 ( 2 d ) d d 2 ( ) ( ) 2 ( d2 d22 x + d ) d +d 2 x 2 d Γ Γ 2 d 2 d 2 d 2 2 (ha d 2 > 2) ν ν 2 (ha ν > 2) 2d 2 2 (d +d 2 2) d (d 2 2) 2 (d 2 4) (ha d 2 > 2) Zempléni András (ELTE) Leíró és matematikai statisztika 2. előadás 23 / 23