Változékonyság (szóródás) STATISZTIKA I. 5. Előadás Szóródási mutatók A középértékek a sokaság elemeinek értéknagyságbeli különbségeit eltakarhatják. A változékonyság az azonos tulajdonságú, de eltérő értéknagyságú adatok egymástól vagy középértéktől való különbözőségét méri. Leggyakrabban a számtani átlaghoz képest állapítjuk meg Minél kisebb a szóródás annál jellemzőbb, megbízhatóbb az átlag A szóródás mutatószámai A szóródás terjedelme Kvantilisek: Kvartilis eltérés Percentilis Százalékrang Középeltérés Szórás Szóródási együttható (relatív szórás) Relatív szóródási együttható Terjedelem A szóródás terjedelme a statisztikai sor legnagyobb és legkisebb eleme közötti különbség. ek Függvénykategória: Statisztikai R=MAX(adatok) MIN(adatok) Forgalom terjedelem =MAX(FORGALOM)=486133 kg/év =MIN(FORGALOM)=35 kg/év Terjedelem=486133-35 = 486 098 kg/év Ez a legnagyobb ingadozás! 1
Kvartilis eltérés Az adatok helyzeti eloszlását mutatja. Gyakoriságon alapul. A nagyság szerint rendezett adatokat négy egyenlő részre osztja. Kvartilis ábra (box-plot) maximum Q 3 Q 2 Q 1 minimum KVARTILIS(tömb;kvart) Az alsó (Q 1 ) és felső (Q 3 ) kvartilisek meghatározása nem egyértelmű A kvart értéke A KVARTILIS eredménye 0 Minimális érték 1 Első kvartilis (25%) 2 Medián (50%) 3 Harmadik kvartilis (75%) 4 Maximális érték Példa Percentilis Latin per centum = százalék Az n%-os (vagy n-edik) percentilis azt jelenti, hogy az adatok n%-a kisebb, mint ez az érték. A medián az 50%-os percentilisnek, az alsó és felső kvartilisek pedig a 25% ill. 75%-os percentilisnek felelnek meg. A percentiliseknek óriási jelentősége van a mit tekintünk normálisnak? kérdés eldöntésében. Az alsó és felső néhány percentilis közötti részt (2,5% - 97,5%, vagy 5% - 95%) szokás normális (referencia) értéknek elfogadni. 2
PERCENTILIS(tömb;k) tömb: Az egymáshoz viszonyítandó adatokat tartalmazó tömb vagy tartomány. k: A százalékosztály száma a 0-1 intervallumban, a végpontokat is beleértve. Ha a tömb üres vagy 8191 adatpontnál többet tartalmaz, akkor a PERCENTILIS eredménye a #SZÁM! hibaérték lesz. Ha a k értéke nem szám, akkor a PERCENTILIS az #ÉRTÉK! hibaértéket adja vissza. Ha k < 0 vagy k > 1, akkor a PERCENTILIS eredménye a #SZÁM! hibaérték lesz. Ha a k nem az 1/(n - 1) többszöröse, akkor a PERCENTILIS a k-adik százalékosztályt interpolációval határozza meg. Százalékrang Érték adathalmazon belül vett százalékos rangját (elhelyezkedését) mutatja. Pl. teszteredmények kiértékelése 1, 1, 1, 2, 3, 4, 8, 11, 12, 13 2 százalékrangja: 33,3% 8 százalékrangja: 66,6% Középeltérés SZÁZALÉKRANG(tömb;x;pontosság) Tömb: Az egymáshoz viszonyítandó számadatokat tartalmazó tömb vagy tartomány. x: Az az érték, amelynek a rangját meg kell határozni. Pontosság: Az eredményül kapott százalékérték értékes jegyeinek számát határozza meg, nem kötelező megadni. Ha nem adjuk meg, akkor a SZÁZALÉKRANG három tizedes jegyet használ (0,xxx). Egy statisztikai sor tagjainak a mediántól vett eltérések abszolút értékét (előjelek figyelmen kívül hagyása mellett) összeadjuk és osztjuk a sor tagjainak a számával Egyszerű formában Súlyozott formában Átlagos eltérés kevésbé használatos mértékegységgel rendelkezik az átlagtól mindkét irányban értelmezzük Egyszerű formában Súlyozott formában ÁTL.ELTÉRÉS(szám1;szám2;...) szám1, szám2...: 1 és 30 közötti számú argumentum, amelyek abszolút eltérésének átlagát keressük. Pontosvesszőkkel elválasztott argumentumok helyett egyetlen tömböt vagy erre mutató hivatkozást is használhatunk. Az argumentumok számok, számokat tartalmazó tömbök vagy számokra mutató nevek, illetve hivatkozások lehetnek. A függvény a tömbben vagy hivatkozásban szereplő értékek közül csak a számokat használja, az üres cellákat, logikai értékeket, szöveget és hibaüzeneteket figyelmen kívül hagyja, de a nullát tartalmazó cellákat számításba veszi. 3
Forgalom átlagos abszolút eltérés Számtani átlag = 59 075 kg/év Átlagos eltérés = 64 754 kg/év Szórás Az elméleti szórás jele: σ A mintából becsült szórás jele: s Minta alapján: Szórás becslése 1. Egyszerű formában: Súlyozott formában: Sokaság alapján: Szórás becslése 2. Egyszerű formában: Súlyozott formában: A szórás tulajdonságai 1. A szórás ± vagy nulla A szórás mértékegysége megegyezik az adatok mértékegységével A szórás értéke nagyon megnő, ha kiugró adat van az adatok között A szórás tulajdonságai 2. A szórások nem adhatók össze Az értékekhez ugyanazt a számot hozzáadva vagy levonva a szórás nem változik Az értékeket egy közös számmal szorozva a szórás a szám abszolút értékével szorzódik A szórás kiszámítható a négyzetes és számtani átlagból is 4
A szórás tulajdonságai 3. SZÓRÁS(szám1;szám2;...) szám1, szám2...: A statisztikai mintát reprezentáló argumentumok, számuk 1 és 30 között lehet. Az argumentumokban pontosvesszővel elválasztott értékek helyett egyetlen tömb vagy tömbhivatkozás is használható. A SZÓRÁS függvény az argumentumokat statisztikai sokaság mintájának tekinti. Ha az adatok a teljes sokaságot jelentik, akkor a szórást a SZÓRÁSP függvénnyel kell kiszámolni. A függvény a szórást a torzítatlan vagy n-1 módszerrel számítja ki. SZÓRÁSP(szám1;szám2;...) szám1, szám2...: A statisztikai sokaságot reprezentáló argumentumok, számuk 1 és 30 között lehet. Az argumentumokban pontosvesszővel elválasztott értékek helyett egyetlen tömb vagy tömbhivatkozás is használható. Forgalom szórása =SZÓRÁS(Forgalom) = 83 927 kg =SZÓRÁSP(Forgalom) = 83 877 kg A SZÓRÁSP az argumentumokat a teljes statisztikai sokaságnak tekinti. Ha az adatok a teljes sokaság mintáját jelentik, akkor a szórást a SZÓRÁS függvénnyel kell kiszámítani. Nagyméretű mintáknál a SZÓRÁS és a SZÓRÁSP megközelítőleg azonos eredmény ad. Hiba oszlopdiagram (Error Bar) Variancia vagy szórásnégyzet Összeadhatók, kivonhatók Arányosíthatók Egyszerű formában: Súlyozott formában: 5
Előnye: Variancia gyakorlati meghatározása Csak az x és x négyzetet kell tárolni és összegezni VAR(szám1;szám2;...) szám1, szám2...: A statisztikai mintát reprezentáló argumentumok, számuk 1 és 30 között lehet. A VAR függvény az argumentumokat egy statisztikai sokaság mintájának tekinti. Ha az adatok a teljes sokaságot jelentik, akkor a varianciát a VARP függvénnyel kell kiszámítani. A logikai értékeket, például IGAZ vagy HAMIS, valamint a szöveget a függvény figyelmen kívül hagyja. Ha a logikai értékeket és a szöveget is számításba szeretnénk venni, használjuk a VARA munkalapfüggvényt. VARP(szám1;szám2;...) szám1, szám2...: A statisztikai sokaságot reprezentáló argumentumok, számuk 1 és 30 között lehet. A VARP az argumentumokat a teljes statisztikai sokaságnak tekinti. Ha az adatok a teljes sokaságnak csak mintáját képezik, akkor a varianciát a VAR függvénnyel kell kiszámítani. Szórások átlagolása A csoportok közös szórása Belső szórás Pooled szórás A SZÓRÁSOKAT NEM LEHET ÁTLAGOLNI! Varianciák átlaga több mintából Szórások átlagolása 6
n 1 =n 2 =n 3 Négyzetes átlag Variációs együttható vagy relatív szórás alkalmas eltérő jelenségek szórásának összehasonlítására, az eredményt %-ban fejezzük ki, Forgalom CV 0 10% homogén, 10 20% közepesen változékony, 20 30% erősen változékony, 30% fölött szélsőségesen ingadozó, az átlag nem alkalmas a sokaság jellemzésére. Relatív variációs együttható Értéke 0-100% lehet. 7