STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Hasonló dokumentumok
A leíró statisztikák

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Elemi statisztika fizikusoknak

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Kutatásmódszertan és prezentációkészítés

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Statisztikai alapfogalmak

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Biomatematika 2 Orvosi biometria

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

[Biomatematika 2] Orvosi biometria

A valószínűségszámítás elemei

Vizsgáljuk elôször, hogy egy embernek mekkora esélye van, hogy a saját

6. Előadás. Vereb György, DE OEC BSI, október 12.

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Microsoft Excel Gyakoriság

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

[Biomatematika 2] Orvosi biometria

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

A Statisztika alapjai

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Adatsorok jellegadó értékei

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Megoldások

A sokaság/minta eloszlásának jellemzése

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Matematikai statisztika

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Hipotézis vizsgálatok

SZÁMÍTÁSOK A TÁBLÁZATBAN

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Definíció. Definíció. 2. El adás (folytatása) Az adatok leírása, megismerése és összehasonlítása fejezet. A variabilitás mér számai 3.

Matematikai statisztika c. tárgy oktatásának célja és tematikája

III. Képességvizsgálatok

Matematikai statisztikai elemzések 2.

STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés

SZÁMÍTÓGÉPES ADATFELDOLGOZÁS

Országos kompetenciamérés eredményeinek kiértékelése 6. és 8. évfolyamokon 2012

Excel Hivatkozások, függvények használata

Excel Hivatkozások, függvények használata

Statisztikai függvények

7, 6, 0, 4, 0, 1, 5, 2, 2, 16, 1, 0, 2, 3, 9, 2, 4, 10, 3, 1, 2, 12, 4, 1

MATEMATIKAI FÜGGVÉNYEK

JA45 Cserkeszőlői Petőfi Sándor Általános Iskola (OM: ) 5465 Cserkeszőlő, Ady Endre utca 1.

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

y ij = µ + α i + e ij

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Bevezetés a hipotézisvizsgálatokba

STATISZTIKA KÉSZÍTETTE: TAKÁCS SÁNDOR

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

A mérés. A mérés célja a mérendő mennyiség valódi értékének meghatározása. Ez a valóságban azt jelenti, hogy erre kell

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

STATISZTIKA. ( x) 2. Eloszlásf. 9. gyakorlat. Konfidencia intervallumok. átlag. 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% (cm)

Vargha András Károli Gáspár Református Egyetem Budapest

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

4. A méréses ellenırzı kártyák szerkesztése

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Segítség az outputok értelmezéséhez

Microsoft Excel 2010

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Számítógépes döntéstámogatás OPTIMALIZÁLÁSI FELADATOK A SOLVER HASZNÁLATA

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Mérési hibák

Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Biostatisztika Bevezetés. Boda Krisztina előadása alapján ma Bari Ferenc SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Biostatisztika VIII. Mátyus László. 19 October

ÁTLAG(tartomány) DARAB(tartomány) DARAB2(tartomány) STATISZTIKAI FÜGGVÉNYEK

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Biostatisztika Összefoglalás

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

MINTAFELADATOK. 1. Az alábbi diagram egy kiskereskedelmi lánc boltjainak forgalomkoncentrációját szemlélteti:

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Minőségirányítási rendszerek 9. előadás

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Kettőnél több csoport vizsgálata. Makara B. Gábor

KÖVETKEZTETŐ STATISZTIKA

Átírás:

Változékonyság (szóródás) STATISZTIKA I. 5. Előadás Szóródási mutatók A középértékek a sokaság elemeinek értéknagyságbeli különbségeit eltakarhatják. A változékonyság az azonos tulajdonságú, de eltérő értéknagyságú adatok egymástól vagy középértéktől való különbözőségét méri. Leggyakrabban a számtani átlaghoz képest állapítjuk meg Minél kisebb a szóródás annál jellemzőbb, megbízhatóbb az átlag A szóródás mutatószámai A szóródás terjedelme Kvantilisek: Kvartilis eltérés Percentilis Százalékrang Középeltérés Szórás Szóródási együttható (relatív szórás) Relatív szóródási együttható Terjedelem A szóródás terjedelme a statisztikai sor legnagyobb és legkisebb eleme közötti különbség. ek Függvénykategória: Statisztikai R=MAX(adatok) MIN(adatok) Forgalom terjedelem =MAX(FORGALOM)=486133 kg/év =MIN(FORGALOM)=35 kg/év Terjedelem=486133-35 = 486 098 kg/év Ez a legnagyobb ingadozás! 1

Kvartilis eltérés Az adatok helyzeti eloszlását mutatja. Gyakoriságon alapul. A nagyság szerint rendezett adatokat négy egyenlő részre osztja. Kvartilis ábra (box-plot) maximum Q 3 Q 2 Q 1 minimum KVARTILIS(tömb;kvart) Az alsó (Q 1 ) és felső (Q 3 ) kvartilisek meghatározása nem egyértelmű A kvart értéke A KVARTILIS eredménye 0 Minimális érték 1 Első kvartilis (25%) 2 Medián (50%) 3 Harmadik kvartilis (75%) 4 Maximális érték Példa Percentilis Latin per centum = százalék Az n%-os (vagy n-edik) percentilis azt jelenti, hogy az adatok n%-a kisebb, mint ez az érték. A medián az 50%-os percentilisnek, az alsó és felső kvartilisek pedig a 25% ill. 75%-os percentilisnek felelnek meg. A percentiliseknek óriási jelentősége van a mit tekintünk normálisnak? kérdés eldöntésében. Az alsó és felső néhány percentilis közötti részt (2,5% - 97,5%, vagy 5% - 95%) szokás normális (referencia) értéknek elfogadni. 2

PERCENTILIS(tömb;k) tömb: Az egymáshoz viszonyítandó adatokat tartalmazó tömb vagy tartomány. k: A százalékosztály száma a 0-1 intervallumban, a végpontokat is beleértve. Ha a tömb üres vagy 8191 adatpontnál többet tartalmaz, akkor a PERCENTILIS eredménye a #SZÁM! hibaérték lesz. Ha a k értéke nem szám, akkor a PERCENTILIS az #ÉRTÉK! hibaértéket adja vissza. Ha k < 0 vagy k > 1, akkor a PERCENTILIS eredménye a #SZÁM! hibaérték lesz. Ha a k nem az 1/(n - 1) többszöröse, akkor a PERCENTILIS a k-adik százalékosztályt interpolációval határozza meg. Százalékrang Érték adathalmazon belül vett százalékos rangját (elhelyezkedését) mutatja. Pl. teszteredmények kiértékelése 1, 1, 1, 2, 3, 4, 8, 11, 12, 13 2 százalékrangja: 33,3% 8 százalékrangja: 66,6% Középeltérés SZÁZALÉKRANG(tömb;x;pontosság) Tömb: Az egymáshoz viszonyítandó számadatokat tartalmazó tömb vagy tartomány. x: Az az érték, amelynek a rangját meg kell határozni. Pontosság: Az eredményül kapott százalékérték értékes jegyeinek számát határozza meg, nem kötelező megadni. Ha nem adjuk meg, akkor a SZÁZALÉKRANG három tizedes jegyet használ (0,xxx). Egy statisztikai sor tagjainak a mediántól vett eltérések abszolút értékét (előjelek figyelmen kívül hagyása mellett) összeadjuk és osztjuk a sor tagjainak a számával Egyszerű formában Súlyozott formában Átlagos eltérés kevésbé használatos mértékegységgel rendelkezik az átlagtól mindkét irányban értelmezzük Egyszerű formában Súlyozott formában ÁTL.ELTÉRÉS(szám1;szám2;...) szám1, szám2...: 1 és 30 közötti számú argumentum, amelyek abszolút eltérésének átlagát keressük. Pontosvesszőkkel elválasztott argumentumok helyett egyetlen tömböt vagy erre mutató hivatkozást is használhatunk. Az argumentumok számok, számokat tartalmazó tömbök vagy számokra mutató nevek, illetve hivatkozások lehetnek. A függvény a tömbben vagy hivatkozásban szereplő értékek közül csak a számokat használja, az üres cellákat, logikai értékeket, szöveget és hibaüzeneteket figyelmen kívül hagyja, de a nullát tartalmazó cellákat számításba veszi. 3

Forgalom átlagos abszolút eltérés Számtani átlag = 59 075 kg/év Átlagos eltérés = 64 754 kg/év Szórás Az elméleti szórás jele: σ A mintából becsült szórás jele: s Minta alapján: Szórás becslése 1. Egyszerű formában: Súlyozott formában: Sokaság alapján: Szórás becslése 2. Egyszerű formában: Súlyozott formában: A szórás tulajdonságai 1. A szórás ± vagy nulla A szórás mértékegysége megegyezik az adatok mértékegységével A szórás értéke nagyon megnő, ha kiugró adat van az adatok között A szórás tulajdonságai 2. A szórások nem adhatók össze Az értékekhez ugyanazt a számot hozzáadva vagy levonva a szórás nem változik Az értékeket egy közös számmal szorozva a szórás a szám abszolút értékével szorzódik A szórás kiszámítható a négyzetes és számtani átlagból is 4

A szórás tulajdonságai 3. SZÓRÁS(szám1;szám2;...) szám1, szám2...: A statisztikai mintát reprezentáló argumentumok, számuk 1 és 30 között lehet. Az argumentumokban pontosvesszővel elválasztott értékek helyett egyetlen tömb vagy tömbhivatkozás is használható. A SZÓRÁS függvény az argumentumokat statisztikai sokaság mintájának tekinti. Ha az adatok a teljes sokaságot jelentik, akkor a szórást a SZÓRÁSP függvénnyel kell kiszámolni. A függvény a szórást a torzítatlan vagy n-1 módszerrel számítja ki. SZÓRÁSP(szám1;szám2;...) szám1, szám2...: A statisztikai sokaságot reprezentáló argumentumok, számuk 1 és 30 között lehet. Az argumentumokban pontosvesszővel elválasztott értékek helyett egyetlen tömb vagy tömbhivatkozás is használható. Forgalom szórása =SZÓRÁS(Forgalom) = 83 927 kg =SZÓRÁSP(Forgalom) = 83 877 kg A SZÓRÁSP az argumentumokat a teljes statisztikai sokaságnak tekinti. Ha az adatok a teljes sokaság mintáját jelentik, akkor a szórást a SZÓRÁS függvénnyel kell kiszámítani. Nagyméretű mintáknál a SZÓRÁS és a SZÓRÁSP megközelítőleg azonos eredmény ad. Hiba oszlopdiagram (Error Bar) Variancia vagy szórásnégyzet Összeadhatók, kivonhatók Arányosíthatók Egyszerű formában: Súlyozott formában: 5

Előnye: Variancia gyakorlati meghatározása Csak az x és x négyzetet kell tárolni és összegezni VAR(szám1;szám2;...) szám1, szám2...: A statisztikai mintát reprezentáló argumentumok, számuk 1 és 30 között lehet. A VAR függvény az argumentumokat egy statisztikai sokaság mintájának tekinti. Ha az adatok a teljes sokaságot jelentik, akkor a varianciát a VARP függvénnyel kell kiszámítani. A logikai értékeket, például IGAZ vagy HAMIS, valamint a szöveget a függvény figyelmen kívül hagyja. Ha a logikai értékeket és a szöveget is számításba szeretnénk venni, használjuk a VARA munkalapfüggvényt. VARP(szám1;szám2;...) szám1, szám2...: A statisztikai sokaságot reprezentáló argumentumok, számuk 1 és 30 között lehet. A VARP az argumentumokat a teljes statisztikai sokaságnak tekinti. Ha az adatok a teljes sokaságnak csak mintáját képezik, akkor a varianciát a VAR függvénnyel kell kiszámítani. Szórások átlagolása A csoportok közös szórása Belső szórás Pooled szórás A SZÓRÁSOKAT NEM LEHET ÁTLAGOLNI! Varianciák átlaga több mintából Szórások átlagolása 6

n 1 =n 2 =n 3 Négyzetes átlag Variációs együttható vagy relatív szórás alkalmas eltérő jelenségek szórásának összehasonlítására, az eredményt %-ban fejezzük ki, Forgalom CV 0 10% homogén, 10 20% közepesen változékony, 20 30% erősen változékony, 30% fölött szélsőségesen ingadozó, az átlag nem alkalmas a sokaság jellemzésére. Relatív variációs együttható Értéke 0-100% lehet. 7