Statsztka Eloszlásjellemzők
Statsztka adatok elemzése A sokaság jellemzése középértékekkel
A sokaság jellemzéséek szempotja A sokaság jellemzéséek szempotja: A sokaság tpkus értékéek meghatározása. Az adatok külöbözőségéek vzsgálata, jellemzése. A sokaság eloszlásgörbéjéek elemzése. A sokaság tpkus értékeek meghatározása középértékekkel törték. A középértékek olya mutatószámok, melyekkel a bevezetőbe megfogalmazott követelméyekek eleget téve köye, jól lehet tömöre jellemez a sokaságot vagy mtát. Középértékekkel szembe követelméyek: Egyértelműe és algebralag köye számítható legye. Tpkus, jellemző érték legye. Szemléletese, jól lehesse értelmez. Közepes helyzetet foglaljaak el.
Középértékek Csoportosítása: Számított középértékek: Harmokus átlag Mérta átlag Számta átlag Négyzetes átlag Helyzet középértékek: Módusz Medá
Számított középértékek számta átlag A számta átlag az a szám, amelyet az átlagoladó értékek helyére írva azok összege változatla marad. Jele: x Kszámítás módja: Legyeek X 1, X 2,..., X N egy sokaság eleme, ekkor a sokaság elemeek átlaga: Egyszerű számta átlag Súlyozott számta átlag x x + x +...+x 1 2 1 x f x + f x +...+ f x f + f +...+ f 1 1 2 2 k k 1 2 k x k 1 k 1 fx f
Számta átlag egyszerű gyakorság sor alapjá Egy taácsadó cég szakértő díja (eft/hó): 30, 25, 28, 32, 35, 32, 34, 32, 40, 42 x 28 + 32 +...+ 42 10 33 eft A taácsadó cég szakértő díja átlagosa 33 eft/hó.
Számta átlag osztályközös gyakorság sor alapjá Egy taácsadó cég szakértő díja (Ft/ap): Szakértő díj(ft/ap) Gyakorság (fő) Osztályközép (x ) 10.001-30.000 38 20000 30.001-50.000 84 40000 50.001-70.000 104 60000 70.001-100.000 49 85000 100.001-150.000 16 125000 150.001 200.000 9 175000 Összese 300 -
Számta átlag x f x + f x +...+ f x f + f +...+ f 1 1 2 2 k k 1 2 k k 1 k 1 fx f 38 20.000+ 84 40.000+ 104 60.000+... + 9 175.000 17.910.000 x 60.333,3 38+ 84+ 104+... + 9 300 A taácsadó cég szakértő díja átlagosa 60.333,3 Ft/ap
Számta átlag tulajdosága Az egyes elemek - átlagoladó értékek - átlagtól való eltéréseek összege 0: 1 ( ) x -x 0 Ha mde egyes elemhez hozzáaduk egy "a kostas értéket, az így kapott elemek számta átlaga éppe "a"-val tér el az eredet elemek átlagától, azaz ha x 1, x 2,..., x, átlaga x, akkor x 1 + a; x 2 + a;...; x + a átlaga x+ a lesz Ha mde egyes elemet megszorzuk egy "b" kostas értékkel, akkor az így kapott elemek átlaga éppe "b"-szerese lesz az eredet elemek átlagáak, azaz ha x 1, x 2,..., x átlaga x, akkor b x 1 ; b x 2 ;...; b x átlaga b x lesz Ha az x 1, x 2,..., x elemek átlaga x, az y 1, y 2,..., y elemek átlaga, akkor az x 1 + y 1 ; x 2 + y 2 ;...; x + y átlaga x + y lesz. y Az elemek mdegykéből egy tetszőleges "a" álladót levova eze eltérések égyzetösszege akkor lesz mmáls, ha az "a" álladó éppe az x, azaz 2 x -a mmáls, ha a x 1 ( )
Számta átlag előye A számta átlag a legtöbb ember számára vlágos, érthető fogalom, számítása egyszerű. Mde adathalmazból egyértelműe kszámítható, s ugyaakkor potosa egy va belőle. A számta átlag segítségével összehasolíthatjuk ugyaazo típusú számszerű jellemző alakulását két vagy több külöböző sokaság vagy mta eseté. A számta átlag a sokaság vagy mta mde egyes eleméek fgyelembe vételével kerül kszámításra, így "em veszítük formácót". A számta átlag kszámításához valójába em szükséges az egyed értékek smerete, elegedő azok összegét tud, s ezáltal meghatározható az átlagos érték.
Számta átlag hátráya A kugróa alacsoy vagy kugróa magas értékek hatással vaak az átlagos érték agyságára. Probléma merül fel a számta átlag számításával kapcsolatba osztályközös gyakorság sor alkalmazása eseté s. Nytott osztályközök haszálata.
Helyzet középértékek Medá A ragsorba redezett adatok közül a középső elemet medáak evezzük. Jele: Me Páratla tagszám eseté: Egy taácsadó cég szakértő díja (eft/ap) 30, 25, 28, 32, 35, 32, 34, 32, 40, 42, 43 Ragsor: 25, 28, 30, 32, 32, 32, 34, 35, 40, 42, 43 11+1 11 elem eseté a 2 6. elem lesz a medá, azaz 32 eft/ap. A taácsadó cég szakértő díjaak egyk fele 32eFt/ap-ál alacsoyabb míg a másk fele magasabb.
Helyzet középértékek Medá Páros tagszám eseté: Egy taácsadó cég szakértő díja (eft/ap) 30, 25, 28, 32, 35, 32, 34, 32, 40, 42 Ragsor: 25, 28, 30, 32, 32, 32, 34, 35, 40, 42 10 +1 10 elem eseté a 5,5. elem lesz a medá, azaz 32 eft/ap. 2 A taácsadó cég szakértő díjaak egyk fele 32e Ft/ap-ál alacsoyabb míg a másk fele magasabb.
Medá osztályközös gyakorság eseté Szakértő díj(ft/ap) Gyakorság (fő) Kumulált gyakorság (fő) Osztályközép (x ) 10.001-30.000 38 38 20000 30.001-50.000 84 122 40000 50.001-70.000 104 226 60000 70.001-100.000 49 275 85000 100.001-150.000 16 291 125000 150.001 200.000 9 300 175000 Összese 300 - -
Medá osztályközös gyakorság eseté Me me + 2 f f me me-1 h 150 122 50.000 + 20.000 104 55.385 Ft / ap m e a medát tartalmazó osztályköz alsó határa, vagy az azt megelőző osztályköz felső határa f' me-1 a medát tartalmazó osztályközt megelőző osztályköz kumulált gyakorsága, azaz hogy a medát tartalmazó osztályköz előtt háy elem található; f me a medát tartalmazó osztályközhöz tartozó gyakorság, azaz a medát tartalmazó osztályközbe összese háy elem található; h a medát tartalmazó osztályköz hossza; az elemek száma;
Medá tulajdosága Előye: A medá s - hasolóa a számta átlaghoz - egyértelműe meghatározható, azaz mde adathalmazak létezk medája és potosa egy va belőle. A medá azoba em csak meység jellemzők eseté határozható meg, haem ragsorba redezhető mőség smérvek eseté s. A medá értéke függetle a szélső értékektől, csak a középső vagy középső két elem agysága befolyásolja. Hátráya: Csak ragsorba redezett elemekből számítható. Ha egy mta alapjá akaruk következtet a teljes sokaság eloszlására, akkor a számta átlag matematka-statsztka szempotból alkalmasabb mutatószám.
Helyzet középértékek - Módusz A módusz a leggyakrabba előforduló elemet jelet. Jele: Mo Jellemző: A módusz előye, hogy em csak meység, haem mőség jellemzők eseté s meghatározható. Hasolóa a medához a módusz sem érzékey a szélső, kugró értékekre. A módusz hátráya, hogy agyo gyakra em alkalmas az eloszlás jellemzésére, ugyas em mde esetbe létezk, vagy előfordulhat, hogy több s va belőle, azaz em egyértelmű. Mtapélda: Egy taácsadó cég szakértő díja (Ft/ap) 30, 25, 28, 32, 35, 32, 34, 32, 40, 42 Ragsor: 25, 28, 30, 32, 32, 32, 34, 35, 40, 42 Módusz értéke A taácsadó cég leggyakrabba 32 eft/ap díjat számol fel.
Medá osztályközös gyakorság eseté Mo mo + k 1 k +k 1 2 h m o a móduszt tartalmazó, u. modáls osztályköz alsó határa, k 1 a modáls osztályköz és az azt megelőző osztályköz gyakorságáak külöbsége, k 2 a modáls osztályköz és az azt követő osztályköz gyakorságáak külöbsége h a modáls osztályköz hossza.
Módusz osztályközös gyakorság eseté Szakértő díj (Ft/ap) Gyakorság (fő) Osztályközép (x ) 10.001-30.000 38 20000 30.001-50.000 84 40000 50.001-70.000 104 60000 70.001-100.000 49 85000 100.001-150.000 16 125000 150.001 200.000 9 175000 Összese 300 - Mo mo + k 1 k1 104-84 h 50.000 + 20.000 + k 104-84 + 104-49 2 55.333 Ft / ap
Tovább átlagformák Mérta (geometra) átlag Alkalmazása: Akkor haszáljuk, ha az átlagoladó értékek szorzata értelmezhető. Leggyakrabba a lácvszoyszámok átlag Mérta (geometra) átlag az a szám, amelyet az egyed értékek helyére írva azok szorzata változatla marad. Jele: x g Képlete - Kszámítás módja x 1, x 2,..., x egyed értékek eseté x g π x 1 - Osztályközös gyakorság sor eseté x g π 1 x f
Mtapélda mérta átlag Magyarországo a hússertés felvásárlás áráak változása Hóap Változás (előző hóap 100%) 1997. márcus 110 áprls 105 május 110 júus 100 júlus 110 augusztus 125 Feladat: Állapítsuk meg a hav átlagos árváltozás mértékét a vzsgált dőszakba! Megoldás: x 6 g 1,1 1,05 1,1 1,00 1,1 1,25 1,097 A vzsgált dőszakba a felvásárlás ár havota átlagosa 9,7%-kal őtt.
Harmokus átlag Alkalmazása Harmokus átlagot akkor számíthatuk, ha az elemek recprokáak és a recprokok összegéek va valamlye tárgy értelme. Elsősorba teztás vszoyszámok eseté értelmezhető Harmokus átlag az a szám, amelyet az egyes átlagoladó értékek helyére írva azok recprokösszege változatla marad. Jele: x h Kszámítás módja x 1, x 2,..., x elemek eseté x h 1 1 x x h 1 f x
Mtapélda harmokus átlag Egy elektroka cég termelésére voatkozó adatok Megevezése Termelés Termelékeység Férf 180 30 Nő 225 25 Összese termelés( db) Termeléke ység( V ) létszám( fő) A B x h V 225 225 25 + 180 180 + 30 27 Tehát az üzemet jellemző átlagos termelékeység 27 db/fő.
Négyzetes átlag A égyzetes átlagot akkor haszáljuk, ha: em kívájuk fgyelembe ve az átlagoladó értékek előjelét, ha azt akarjuk, hogy az átlag a szélsőségese agy értékekre érzékeye reagáljo. A égyzetes (kvadratkus) átlag az a szám, amellyel az átlagoladó értékeket helyettesítve, azok égyzetösszege változatla marad. Jele: x q Kszámítás módja: x q 1 x 2 x q k f 1 k 1 x f 2 x q k 1 g x 2
Kvatlsek A leggyakrabba előforduló kvatlsek k A kvatls A kvatls jelölése megevezése 2 Medá Me 3 Tercls T 1, T 2 4 Kvartls Q 1 (alsó kvartls); Q 2 ; Q 3 (felső kvartls) 5 Kvtls K 1, K 2, K 3, K 4, 10 Decls D 1, D 2,, D 9, 100 Percetls P 1, P 2,, P 99 Jellemzők: A középértékek mellett fotos helyzetmutatók a kvatlsek. A kvatlsek meghatározásáál a sokaságba megkeressük azt az osztópotot, amelyél az smérvértékek fele, egyede, tzede, stb. ksebb, a több pedg agyobb értékű. A kvatlsek becsléséek meete azoos a medáál smertetett eljárással.
Mtapélda - kvartlsek Egy taácsadó cég szakértő díja (eft/óra) 30, 25, 28, 32, 35, 32, 34, 32, 40, 42 Ragsor: 25, 28, 30, 32, 32, 32, 34, 35, 40, 42 Az alsó kvartls (Q 1 ) sorszáma: 10 + 1 2, 75 4 A másodk elem értéke: 28; 28 + 30 A harmadk elem értéke: 30; Így: Q1 29 2 Tehát a taácsadó cég az esetek egyedébe (25%) 29 eft-ál kevesebb szakértő díjat számolt fel,, háromegyede (75%-a) pedg többet. 3(10 + 1) A felső kvartls (Q 3 ) sorszáma: 8, 25 4 A yolcadk elem értéke: 35; 35 + 40 A klecedk elem értéke: 40; Így: Q3 37, 5 2 Tehát a taácsadó cég az esetek háromegyedébe (75%) 37,5 eft-ál kevesebb szakértő díjat számolt fel egyede (25%-a) pedg többet.
Sokaság/mta jellemzése szóródás mutatókkal Szóródáso azoos fajta számszerű értékek külöbözőségét értjük. A legfotosabb szóródás mérőszámok: terjedelem (R) terkvartls terjedelem (IQR) átlagos eltérés (δ) szórás (σ vagy s) relatív szórás (V) átlagos (abszolút) külöbség (G)
A szóródás terjedelme A terjedelem az előforduló elemek között a legagyobb és a legksebb érték külöbsége: R x max -x m A mutatószám kfejez, hogy mekkora értékközbe gadozak az smérvértékek. Alkalmazásáak a hátráya: Osztályközös gyakorság sorból em s mdg számítható, hsze gyakra az osztályközök határa csak jelzésértékűek, vagy cseek megadva, azaz ytott osztályköz áll redelkezésükre. Nagyo érzékey a kugróa magas vagy alacsoy értékekre. Mtapélda: Egy taácsadó cég szakértő díja (eft/hó): 30, 25, 28, 32, 35, 32, 34, 32, 40, 42 R 42-2517 Tehát 17 eft aak az tervallumak a hossza, amelye belül a szakértő díjak mozogak. Azaz a legmagasabb, és a legalacsoyabb szakértő díj között külöbség 17 eft.
Iterkvartls terjedelem A gyakorlatba az elemzés sorá a szóródás terjedelme (R) mutatóál jobba haszálható az terkvartls terjedelem. Az terkvartls terjedelem a kvartls értékek között távolság, am a ragsorba redezett elemek középső tpkusak evezhető 50%-áak elhelyezkedését mutatja: Képlete: IQR Q 3 Q 1
Átlagos eltérés Az átlagos eltérés az egyed értékekek a számta átlagtól mért átlagos abszolút eltérését mutatja. Képlete: δ 1 a d, ahol, d x x Mértékegysége mdg ugyaaz, mt az alapadatoké. A gyakorlatba a szóródás jellemzésére rtká haszáljuk.
Szórás A szórás az egyed értékek átlagtól való eltéréseek a égyzetes átlaga, az átlagtól mért átlagos égyzetes eltérés. A szóródás legfotosabb mérőszáma. Jele: σ - a teljes sokaságra ézve, s a mtából meghatározva. Kszámítás módja: teljes sokaság eseté σ 1 d 2 ll. gyakorság sorból σ k 1 f k 1 d f 2 mta eseté: s 1 d 2-1 ll. gyakorság sorból s k 1 k 1 f f d 2 1
Mtapélda Taácsadó díj (eft/hó) x d x x 30-3 9 25-8 64 28-5 25 32-1 1 35 2 4 32-1 1 34 1 1 32-1 1 40 7 49 42 9 81 Összese 0 236 d 2 2 (x x) σ 1 d 2 236 10 4,86 Értelmezés: az egyes taácsadó díjak az átlagostól átlagosa 4,86 eft/hó-val tértek el.
Relatív szórás A relatív szórás a szóródás relatív mutatója, így mértékegység élkül, értéke %-os formába s megadható. Kfejez, hogy az egyed értékek átlagosa háy %-kal térek el az átlagos értéktől. Ezt a dmezó élkül mutatót haszáljuk a külöböző mértékegységű smérvek szóródásáak összehasolítására. Képlete: V σ x vagy V Mtapélda alapjá kszámítása: V 14,73% s x σ x 4,86 33 Értelmezése: az egyes taácsadó díjak az átlagostól átlagosa 14,73%-kaltértek el.
Gyakorság sorok vzsgálat latáak tovább módszerem
Az aszmmetra mérőszáma Az eloszlások következő típusaval foglalkozuk: egymóduszú eloszlás szmmetrkus, aszmmetrkus (vagy ferde); többmóduszú eloszlás. Emprkus eloszlások Szmmetrkus Egymóduszú eloszlás Asszmmetrkus Többmóduszú eloszlás - U alakú - M alakú Mérsékelte aszmmetrkus - balra ferdült - jobbra ferdült Erőse aszmmetrkus - J alakú - fordított J alakú A legjellegzetesebb eloszlástípusok
Az aszmmetra leggyakrabba haszált mérőszáma Pearso-féle mutatószám Az aszmmetra Pearso-féle mutatószáma (jele: A) a számta átlag és a módusz agyságred vszoyá alapul: A x Mo σ A mérőszám előjele az aszmmetra ráyát mutatja: Bal oldal, jobbra elyúló aszmmetra eseté A > 0, Jobb oldal, balra elyúló aszmmetra eseté A < 0. Szmmetrkus eloszlás eseté A 0. A mérőszám abszolút értékéek cs határozott felső korlátja, azoba már 1-él agyobb abszolút érték meglehetőse erős aszmmetrára utal.
Mtapélda - asszmetra Egy taácsadó cég szakértő díja (Ft/óra) 30, 25, 28, 32, 35, 32, 34, 32, 40, 42 Ragsor: 25, 28, 30, 32, 32, 32, 34, 35, 40, 42 x - Mo 33 32 A σ 4,86 0,21 Mvel A>0, a szakértő díjak eloszlása baloldal, jobbra elyúló asszmetrát mutat.
F mutató Az alsó és felső kvartls medától való eltéréséek egymáshoz vszoyított agyságá alapul. Bal oldal, jobbra elyúló aszmmetra eseté a medá az alsó (Q 1 ), míg jobb oldal aszmmetra eseté a felső (Q 3 ) kvartlshez esk közelebb. Képlete: F (Q (Q 3 3 Me) (Me Q1) Me) + (Me Q ) 1 Abszolút értékéek határozott felső korlátja va: F 1. Ugyaolya feltételek mellett ad ulla, poztív és egatív eredméyt, mt az A mutató. Az F mutató léyegese ksebb értékkel jelz a már agyfokúak tekthető aszmmetrát, mt az A.
Egymóduszú eloszlások
Köszööm a fgyelmet!