Huzsvai László. STATISZTIKA Gazdaságelemzők részére Excel és R alkalmazások

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Huzsvai László. STATISZTIKA Gazdaságelemzők részére Excel és R alkalmazások"

Átírás

1 Huzsvai László STATISZTIKA Gazdaságelemzők részére Excel és R alkalmazások SENECA BOOKS 2012

2 Szerkesztő: Huzsvai László Mide jog fetartva. Jele köyvet vagy aak részleteit a Kiadó egedélye élkül bármilye formába vagy eszközzel reprodukáli és közöli tilos. A kiadváy létrejöttét seki sem támogatta. Írták: Balogh Péter Csipkés Margit Huzsvai László Nagy Lajos Pocsai Krisztia Lektorálták: Szőke Szilvia Taróczi Tibor ISBN Ez a köyv a magyar felsőoktatásba taulási és kutatási céllal szabado felhaszálható

3 Tartalomjegyzék Előszó... 1 Bevezetés... 2 A statisztika részterületei... 4 Mitavételezés... 5 Statisztikai adatgyűjtés...6 Adatbázis A változók mérési szitjei...13 Adatábrázolás Kimutatás és kimutatás-diagram...26 Csoportosított adatok megjeleítése...29 Kimutatás-diagram átalakítása statikus diagrammá...30 Viszoyszámok Idősorok viszoyítása, bázis- és lácviszoyszámok...32 A bázis és lácviszoyszámok problémái...36 Megoszlási viszoyszámok (Vm)...37 Koordiációs viszoyszámok (Vk)...38 Tervfeladat viszoyszám (Vtf)...39 Tervteljesítési viszoyszám (Vtt)...41 Diamikus viszoyszám (Vd)...42 Kérdések Itezitási viszoyszámok...43 Középértékek Számtai átlag...45 Súlyozott számtai átlag...46 Kroologikus átlag...50 Harmoikus átlag...51 Súlyozott harmoikus átlag...53 Geometriai átlag...54 Súlyozott geometriai átlag...55 Négyzetes átlag...56 Szóródási mutatók... 58

4 Terjedelem...58 Kvatilisek...58 Százalékrag...61 Középeltérés Átlagos abszolút eltérés...63 Szórás Variacia Variációs koefficies...69 Relatív variációs koefficies...70 Az átlag stadard hibája...71 Szórások átlagolása...73 Stadard hiba átlagolása...74 Kiugró értékek...74 Kocetráció Herfidahl-Hirschma-idex...76 Idexek Értékidex Áridex...86 Volumeidex...87 Fisher-féle idexek...90 A ormális eloszlás mit modell...91 Kofideciaitervallum A relatív gyakoriság kofideciaitervalluma A mediá kofideciaitervalluma A számtai átlag kofideciaitervalluma A szórás kofideciaitervalluma A stadard hiba agysága véges sokaság eseté Hipotéziselmélet A dötésél elkövethető hibák Középérték-összehasolító próbák Egy-mitás z-próba vagy u-próba Függetle kétmitás z-próba vagy u-próba Egymitás t-próba Függetle kétmitás t-próba Kétmitás F-próba a szóráségyzetre...132

5 Párosított t-próba A t-próba ereje Variacia-aalízis Alapfogalmak A lieáris modell A variacia-aalízis alkalmazásáak feltételei A variacia-aalízis alkalmazásáak lépései A variacia-aalízis ereje Mellékletek A középértékek hibájáak (stadard hiba) öröklődési szabálya Legfotosabb függvéyek a képletek előállításához Ajálott irodalom

6 ELŐSZÓ Előszó Sok magyar yelvű matematikai statisztika köyv jelet meg hazákba az utóbbi évtizedekbe. Sajos ezek a korábbi, főkét a hetvees évekbe írt művek újított kiadásai, amelyek az azóta eltelt hatalmas számítástechikai fejlődésről megfeledkeztek. A beük található példák, a yomtatott sajtó korlátai miatt, agyo kevés elemszámmal redelkezek, valódi adatbázisról em beszélhetük. Ez még azokról a köyvekről is elmodható, amelyek CD-mellékleteket tartalmazak, mert a példák pusztá a köyvek feladataiak táblázatos formáit tartalmazzák. Az ilye táblázatos adatokból em lehet hatékoy adatelemzést, statisztikai értékelést készítei. Ezek valójába kimutatások, jeletések, és em valódi adatbázisok. Pedig egy jól megtervezett adatbázisból olya iformációk yerhetők ki, amelyeket egy kimutatásból vagy jeletésből már utólag em tuduk elkészítei. Az adatbáyászat, vagy helyesebb ikább iformációbáyászatról beszéli, csak agy adatbázis eseté yer értelmet, amelyek a sajátos techikáját meg kell tauli, ezért a köyv egyik célkitűzése eze techika megismertetése az olvasóval. A köyv a magyar felsőoktatás közgazdasági BSc képzéséhez igazodva, a statisztika alapjait, a leíró statisztikát valamit a matematikai statisztika legegyszerűbb, legalapvetőbb módszereit tárgyalja. Mide ismertetett eljárást példáko keresztül mutatuk be. A számítások sorá feltételezzük a számítógépes alapismereteket, ezért csak a statisztikához közvetleül szükséges ayagot tárgyaljuk. Melyik statisztikai programcsomagot haszáljuk? Nagyo sok va. Igyees, fizetős. Kíváatos lee a mai gazdasági helyzetbe a felsőoktatásba igyees, yílt forráskódú programokat haszáli. Ráadásul ezek között sok európai va. Az igyeesség jegyébe ez a köyv a LibreOffice Writerrel készült. A Microsoft hatalmas térhódítása miatt azoba kéyteleek vagyuk a legegyszerűbb, és leggyakrabba haszált programo bemutati az elemzéseket, amely em más, mit az Excel. Ez az alkalmazás em statisztikai program, és em is adatbáziskezelő, haem számolótábla, ezért tudomáyos igéyű elemzésekre csak korlátozotta alkalmas. Szerecsére azoba, midkét fukciót alapszite el tudja láti, és ez a képessége elegedő az alapszitű oktatásba. A köyvbe bemutatott példák egy az egybe megoldhatók igyees LibreOffice Calc-kal is. A tudomáyos elemzésekhez az R programot ajáljuk, ezért a példák megoldását ezzel is bemutatjuk, természetese a teljesség igéye élkül. Ebbe az esetbe feltételezzük az R alapszitű ismeretét. A köyv írása sorá törekedtük a tömörségre, a közérthetőségre, és midekit arra buzdítuk, hogy a köyvből elsajátított tudást miél szélesebb körbe alkalmazza, mert a statisztika szakszerű haszálata mideki számára gazdasági előyel jár. Debrece, szeptember Huzsvai László -1-

7 BEVEZETÉS Bevezetés Meyire megbízhatóak a kísérletekből és megfigyelésekből (empíria) levot következtetések? Milye agy a véletle szerepe? A választ a statisztika segítségével adhatjuk meg, valószíűségi állítás formájába. A statisztika yelvezete sajátos, mivel kijeletéseit, egy adott itervallumra voatkoztatva, valószíűségi állítás formájába fogalmazza meg. Pl. hetveöt százalék az esélye, valószíűsége aak, hogy 20 és 30 mm közötti csapadék fog esi holap. A statisztika a valóság miőségi és meyiségi iformációiak megfigyelésére, öszszegzésére, elemzésére és modellezésére iráyuló gyakorlati tevékeység és tudomáy. Gyakra hívják statisztikáak a statisztikai tevékeység eredméyekét keletkező adatokat is. A statisztikába, mit mide tudomáyba, sajátos fogalmakat haszálak, ezért éháy alapvető fogalommal meg kell ismerkedi. Alapfogalmak: Statisztika: tudomáyos módszerta és gyakorlati tevékeység, mely a valóságot tömöre, számszerűe jellemzi. A számszerű jellemzés sokszor csak becslés, becslés a mita tulajdoságai alapjá. Leíró statisztika: az adatok összegyűjtését, tárolását, egyszerű számtai műveletekkel törtéő elemzését, aggregálását és az eredméyek közérthető megjeleítését végzi. Matematikai statisztika: akkor alkalmazzuk, ha em teljes körű az adatfelvételezés, amikor csak a sokaság egy részéek megfigyelésre kerül sor, és a mitából számított eredméyek alapjá következtetük a sokaság jellemző tulajdoságaira. Sokaság: A megfigyelési egységek, egyedek összessége, amire a statisztikai megfigyelés iráyul. Adat: a statisztikai sokaság elemeiek száma, vagy a sokaság valamelyik jellemzőjéek számszerű mérési eredméye. Ezek a mérési eredméyek midig tartalmazak egyéb azoosító jellemzőket is, pl. térbeli, időbeli, stb. A statisztikai adatok csak ezek ismeretébe értelmezhetők reálisa. A statisztikai adatok hibával terheltek. Ezek a hibák az adatfelvétel, mérés, adatfeldolgozás és adatközlés sorá keletkezhetek. Ismérv: A sokaság egyedeiek tulajdosága. Mit mérek: Milye? Meyi? (mértékegység) Hol? Mikor? Egyéb metaadatok gyűjtése agyba fokozza a mita értékét. A metaadat adat az adatról. Valójába sokkal több metaadat szerepel egy adatbázisba, mit mért adat. Paraméter: Az alapsokaság jellemző értékeit paraméterek evezzük, és görög betűvel jelöljük, pl. μ és σ. A görög betűk tehát az elméleti értékeket jelölik, melyeket csak a miták alapjá becsülhetjük, de potos értéküket sohasem tudjuk meghatározi. Midig lesz egy kis bizoytalaság, határozatlaság. -2-

8 BEVEZETÉS Mita: Az empirikus megfigyelések mérések összessége. A mita adataiból az alapsokaság tulajdoságaira következtetük. A mita jósága döti el, hogy milye potosa tudjuk megbecsüli az alapsokaság jellemző paraméterét. pl. a mita középértékből becsüljük meg az alapsokaság középértékét. x -ból a μ-re következtethetük. A mita szórásából a sokaság szórására. s-ből a σ-ra következtethetük. A köyvbe zömébe egyetle adatbáziso mutatjuk be a statisztikai módszereket, ez az élelmiszer adatbázis. Ez egy kitalált, fiktív adatbázis taulási célokra készült és em szakmai következtetések levoására. Nyolc változót és 847 rekordot tartalmaz. A változók: AZ: rekordok sorszáma, csak azoosításra szolgál, omiális típusú változó. Év: közötti időszakot jelöl. Összese 11 év adatai. Régió: Magyarország hét régiójáak változója. Ez a változó is omiális típusú. Árucikk: külöböző élelmiszerek megevezését tároljuk ebbe a változóba, öszszese 11-féle árucikket. Forgalom: az adott árucikkből téylegese eladott meyiség kg mértékegységbe. Ez a változó aráyskála típusú. Ár: egységár Ft/kg mértékegységbe. Ököltség: egy kilogramm élelmiszer eladásakor felmerülő költéség, Ft/kg mértékegységbe. Terv: az adott árucikkből tervezett eladás meyisége kg mértékegységbe. Az Év és Régió változót csoportok képzésére a többi változót külöféle statisztikák számítására fogjuk felhaszáli. -3-

9 A STATISZTIKA RÉSZTERÜLETEI A statisztika részterületei A statisztika tudomáy több részterületet ölel fel. Többféleképpe is csoportosítható. Legegyszerűbb módo két részterületet oszthatjuk: leíró és matematika statisztika. Leíró statisztika vagy exploratív adatelemzés célja egy már redelkezésre álló, valóságra voatkozó empirikus adathalmaz összefoglalása, elemzése, iformációtömörítése, illetve olya iformáció kiyerése, amit a agyszámú megfigyelésből csak az adatokat szemlélve em tudák megtei. A sokaság legfotosabb jellemzőiek megismerése folyamá statisztikai módszerek alkalmazuk, amik valamilye elméleti modell algoritmizált formái. A legfotosabb leíró statisztikai módszerek közé tartozik: a gyakoriságok, kvatilis értékek, cetrális mutatók (középértékek): mediá, módusz, számított átlagok: számtai, harmoikus, mértai, égyzetes, stb. átlagok, szóródási mutatók: terjedelem, szórás, relatív szórás, stb., a viszoyszámok és idexek meghatározása. Matematikai statisztika feladata reprezetatív mitavétel alapjá a sokaság jellemző paramétereiek becslése. Mita alapjá az alapsokaságra voatkozó feltételezések, hipotézisek igazolása, valamit összefüggés-vizsgálatok sztochasztikus modellekkel. A statisztikai muka fázisai 1. Tapasztalatok gyűjtése, empirikus megfigyelések, korábbi tudomáyos eredméyek taulmáyozása (szakirodalmazás). 2. A probléma verbális megfogalmazása, mukahipotézis felállítása. 3. Modellválasztás vagy alkotás, legtöbbször valamilye eloszlás vagy függvéy. 4. Az adatgyűjtés megtervezése. Miimális mita ill. elemszám meghatározása. Mitavételi techikák. Vagy kísérlettervezés. 5. Adatgyűjtés, mitavétel vagy a kísérlet beállítása, mérés. 6. Adatbázis-készítés, ezek apjaikba relációs adatbázisok. 7. Elemzés a 3. potba választott modell alapjá. Ezt evezik szűkebb értelembe statisztikai elemzések. Az adatokból a modell paramétereiek meghatározása. 8. A modell validálása (érvéyessége), az alkalmazhatósági feltételek megvizsgálása 9. Becslés a modell segítségével. Jeletések, riportok, kimutatások készítése (statisztikai táblázatok). 10. Dötés Már többször esett szó a modellről. Eek a szóak több jeletése va. Mi a tudomáyos értelembe fogjuk haszáli. Milye defiíciót lehet adi rá? Talá az egyik legjobb meghatározás: A modell összetett, boyolult természeti képződméyek, objektumok működéséek megismerésére létrehozott egyszerűsített helyettesítő. Természetese a tudomáyba is sokféle modell létezik. A leggyakoribb modell formák a mechaikus aalógok, elektromos aalógok, fizikai, kémiai, matematikai modellek. A statisztikába a matematikai modellekek va jeletősége. -4-

10 MINTAVÉTELEZÉS Mitavételezés A mitavételt meg kell tervezi. A sokaság elemeit agybetűvel jelöljük: X1, X2 XN, lehet véges és végtele. Mitaelemek, jelölése kisbetűvel: x1, x2 x, midig véges. A véletle mita azt jeleti, hogy a mita elemek véletle kiválasztással kerülek a mitába. A véletle kiválasztás sorá mide elem egyelő valószíűséggel kerülhet a mitába. Nics protekció. Miél agyobb a véletle mita, aál potosabb a becslés, ezért a kiválasztási aráy befolyásolja az elemzések megbízhatóságát. Kiválasztási aráy : N ahol: : a mitaelemek száma N: a sokaság agysága Ameyibe 100-zal szorozzuk, százalékba kapjuk meg a kiválasztási aráyt. Természetese a kiválasztási aráyt csak véges sokaságba lehet meghatározi, végtele sokaságba eek ics értelme. A mitavétel midig hibával terhelt. Ez abból adódik, hogy em a teljes sokaságot figyeljük meg. Ráadásul a sokaság heterogé. A heterogeitás azt jeleti, hogy a sokaság elemi külöbözek egymástól. 1. ábra: A heterogé "alma sokaság" -5-

11 MINTAVÉTELEZÉS 2. ábra: A mita 3. ábra: A valóság Statisztikai adatgyűjtés Háy elemű legye a mita? Ez agyo fotos kérdés, mert a mitavétel pézbe kerül, sok mukát és időt igéyel. Ebből a szempotból a lehető legkevesebbet szereték erre költei. A másik oldal viszot a potosság és megbízhatóság, ami a lehető legagyobb mitát igéyli. A két elletétese ható téyező miatt kompromisszumot kell köti. Ezt a kompromisszum keresést evezzük a mitavételezés tervezéséek, illetve kísérlettervezések. A statisztikáak itt aktív szerepe va, iterációko keresztül határozzuk meg a céljaikak és péztárcákak megfelelő miimális mitaagyságot. Ez optimum keresés tehát egy miimalizálási feladat, amikor egy előre kiválasztott potosság és megbízhatósághoz keressük az előbb említett miimális mitát. A gyakorlatba vaak bevett szokások, ilye a közvéleméy kutatások területé haszált = és közötti mita. Ezt haszálják piackutatás sorá is. A tapasztalatok azt mutatják, hogy eél agyobb mita eseté sokszor szisztematikus torzítás lép fel. -6-

12 MINTAVÉTELEZÉS A statisztikai adatgyűjtés egyszerű csoportosítása látható a következő ábrá. S ta tis z tik a i a d a tg y ű jté s R é s z le g e s a d a tf e lv é te l T e lje s k ö r ű (c e z u s ) K ís é r le te k R e p r e z e ta tív m e g fig y e lé s (e lle ő r z ö tt) V é le tle m i ta v é te l N e m v é le tle m i ta v é te l 4. ábra: Adatgyűjtés Mukák sorá az első lépésbe, el kell dötei, hogy részleges vagy teljes körű adatfelvételezést foguk-e készítei. Teljeskörű: Természetese csak véges sokaság eseté lehetséges. Ritká vagy kis elemszámú sokaság eseté. A KSH 10 évekét épszámlálást végez. A mezőgazdaság területé, ÁMÖ általáos mezőgazdasági összeírás. Ezzel valószíűleg ritká foguk találkozi. Végtele sokaságba csak részleges adatfelvételezést készíthetük. Ez lehet adatgyűjtés, kérdőívezés és elleőrzött kísérlet. Ez utóbbi a tudomáyos kutatómukába a legfotosabb iformálódási eszköz. Korábba említettük, hogy a jó mita, a véletle mita. Milye legye tehát a véletle mita? Ehhez ismeri kell az alapsokaság jellemzőit. Soka homogé és heterogé sokaságokat külöböztetek meg. Ez elég bizoytala, mivel a sokaság elemei sohasem egyformák. Hol va az a határ, ami elválasztja egymástól a homogé és heterogé sokaságot? Kézzelfoghatóbb, ha úgy külöböztetjük meg a homogé és heterogé sokaságot, hogy tudjuk-e homogéebb csoportokba soroli a sokaság elemeit, ahol a csoporto belüli igadozás kisebb, mit a sokaság eredeti igadozása. Ameyibe tudjuk, heterogé sokaságról beszélük, ha em homogé, még akkor is, ha agy a szórása. Véletle mitavétel csoportosítása: 1. Homogé sokaság eseté FAE: függetle azoos eloszlású mita EV: egyszerű véletle mita 2. Heterogé sokaság eseté R: rétegzett mitavétel Cs: csoportos (egylépcsős) mitavétel TL: többlépcsős mitavétel Hogy mikor milye mitát kell vei, azt az döti el, hogy milye ismeretekkel redelkezük az alapsokaságról, illetve, hogy milye legye a következtetésük megbízhatósága és potossága. -7-

13 MINTAVÉTELEZÉS FAE: végtele vagy agyo agy sokaságból visszatevéssel vagy visszatevés élkül veszük mitát. Ebbe az esetbe gyakorlatilag ics külöbség a visszatevéses és visszatevés élküli mita között. Visszatevéssel mide elem azoos valószíűséggel kerül a mitába. EV: véges elemszámú sokaság eseté, visszatevés élkül. Ebbe az esetbe az elemek em azoos valószíűséggel kerülek a mitába. Hasoló a FAE-mitához, de véges és kicsi sokaság eseté ikább ezt haszáljuk. R: valamilye ismérv szerit, átfedés metese, homogé, illetve homogéebb rétegekre osztjuk a sokaságot, és a rétegeke belül EV-mitát veszük. A sokaságba a rétegek elemszámát N-vel, a mitába -vel jelöljük. A rétegek száma M. Természetese a rétegek elemszámaiak összege megegyezik a sokaság illetve mita elemszámával. A rétegzett mita lehet: egyeletes aráyos Neyma-féle optimális költség optimális Egyeletes: mide rétegből ugyaayi elemet választuk ki, függetleül az egyes részek részaráyától. j= = M Aráyos: a mita rétegeiek aráya megegyezik a sokaság rétegeiek aráyával. Matematikailag megfogalmazva: j N j = N Neyma-féle optimális: a agyobb szórású rétegekből agyobb, a kisebbekből kisebbet veszük. Ez homogeizálja a becslés potosságát. A rétegek mitaelemszáma: j= Njσj N jσ j Költség optimális: ismeri kell az egyes rétegek mitavételezéséek költségeit is. A redelkezésre álló pézt felhaszálva miimalizáli kell a becslési hibát. Ehhez ismeri kell az egyes rétegek szórásait is. Csoportos (egylépcsős) mitavétel: véges homogé sokaság eseté célravezető, ha em áll redelkezésre a sokaság elemeiek teljes listája, de agyobb csoportokra redelkezük listával. Többlépcsős mitavétel: hasoló, mit a csoportos mitavétel, azoba több lépcsőbe jutuk el a végső mitához. Leggyakrabba kétlépcsős mitavételt végzük, ahol egyszerű EV mitákat veszük. -8-

14 MINTAVÉTELEZÉS Nem véletlee alapuló kiválasztás: Szisztematikus Kvótás Hólabda Kocetrált Ökéyes Egyéb Szisztematikus mitavétel: ameyibe elemű mitát akaruk vei egy N elemű sokaságból, akkor a lépésköz a kiválasztási aráy reciproka, N/. Véletleszerűe kiválasztva a kezdőpotot, mide k-adik elem kerül a mitába. A mitavétel így automatizálható. Eek agy jeletősége va a miőség elleőrzésbe. A szisztematikus mitavétel eredméye megegyezhet az EV mita eredméyével, abba az esetbe, ha a sorred függetle megfigyeléstől. Kvótás kiválasztás: előre megkapjuk, hogy a mitáak milye összetételűek kell leie. Megbízást kapuk egy külső cégtől, hogy végezzük el eki az adatfelvételezést. Természetes a cég részéről ezt alapos előtaulmáy előzi meg, ez alapjá tudja megadi a sokaság jellemző összetételét. Hólabda mitavétel: kevés elemszámú és eheze mitázható sokaságál alkalmazhatjuk. Hasolít a piramis játékhoz. Néháy személyből kiidulva, azok ismeretségi köré folytatjuk az adatfelvételezést. Ők tovább adják a kérdőíveket az ismerősükek, és így tovább. Kocetrált adatfelvételezés: erőse kocetrált sokaságba haszáljuk, amikor éháy egyed, megfigyelési egység agy hatással bír a sokaság jellemzőire. Ebbe az esetbe ezekek agyobb esélyt aduk a mitába kerülésre. Fogyasztói áridex, ifláció számításakor agyobb esélyt aduk azokak az árucikkekek, amikek agyobb a forgalma. Ez már egy tudatos kiválasztás, ez jobba reprezetálja a valós helyzetet, mit a véletle mitavétel. Itt kap szerepet a kocetráció elemzés is, amiről a későbbi fejezetbe lesz szó. Ökéyes (szubjektív) kiválasztás: szakmai ismeretek és tapasztalatok birtokába választjuk ki a mitaelemeket. Az előbb ismertetett kiválasztási módszerek keveréke, azok előyeiek ötvözése. Amit látható, mide kiválasztási módszer azt szolgája, hogy a mita reprezetatív legye. A reprezetatív mita tulajdosága, hogy tükrözi az alapsokaság jellemzőit (lehet belőle általáosítai), és csak a mitavételi hibát tartalmazza. Ráadásul meghatározható a mitavételi hiba agysága. A em reprezetatív mitából ezzel szembe em lehet általáosítai, a mitavételi hiba mellett szisztematikus hibát is tartalmaz. Az ilye mitából levot következtetések kizárólag a megfigyelt egyedekre voatkozak. Véletle mitát véletle szám-geerátor segítségével állíthatuk elő. A számítógépek geerátorai azoba pszeudovéletle szám geerátorok, ami azt jelei, hogy valamilye -9-

15 MINTAVÉTELEZÉS algoritmus alapjá állítják elő a véletle számot, és mide bekapcsoláskor ugyaazokat a véletle számokat adják. Ezért godoskodi kell a geerátor mag véletleszerű beállításáról. A gyakorlatba ezt a számítógép bekapcsolása óta eltelt másodpercekkel szoktuk megadi. Nagyo kicsi a valószíűsége, hogy két véletle számot ugyaabba a másodpercbe akaruk előállítai. Ilye függvéy az Rd() függvéy. Az Excel Vél() függvéye. Az a-tól b-ig terjedő véletle számot így tudjuk előállítai: VÉL()*(b-a)+a A legújabb Excel-be véletle éve találjuk meg a függvéyt. Azért veszük mitát, hogy statisztikai becslést készítsük a sokaság jellemző értékeire. A becslés valamely paraméter ismeretle (feltételezett) téyleges értékéek közelítő megadása egy statisztikai függvéyel. Elvileg bármelyik statisztikai függvéy tekithető becslések, valójába csak azokat haszáljuk, amelyekek megvaak a jó becslés legfotosabb tulajdoságai. A jó becslés kritériumai Torzítatlaság (várható érték) Hatásosság (szórás) Kozisztecia Torzítatla az olya becslés, amelyek várható értéke az igazi paraméter. Ez azt jeleti, ha sokszor veszük mitát, a mitaátlagok átlaga agyo közel lesz a sokaság valódi átlagához. Hatásos az a becslés, amiek a szórása a lehető legkisebb, határértékbe ulla. Vegyük egy véges sokaságot, becsüljük meg a számtai átlagát. Ameyibe teljes körű az adatfelvételezés, a becslés szórása ulla lesz. Kozisztes az olya becslés, amely a mita elemszámáak övekedésével a paraméter igazi értékéhez kovergál sztochasztikusa (erős kozisztecia eseté 1 valószíűséggel). A torzítatlaság és hatásosság a kis miták, a kozisztecia a agy mitáktól elvárt jó tulajdoság. A kísérlet, mit a tudomáyos kutatás egyik legfotosabb módszere, csak akkor célravezető, ha redelkezik a jó kísérlet tulajdoságaival. A jó kísérlet a kezeléshatások mellett csak a véletle hibát, igadozást tartalmazza. Erről a két hatásról számszerű becslést készíthetük. A rossz kísérlet a kezeléshatások és véletle hiba mellett még szisztematikus hibát is tartalmaz. A szisztematikus hiba agyságát em tudjuk becsüli, ics róla számszerű értékük. Ez a hiba összekeveredik a kezeléshatással, és hamis hatásokat foguk kimutati

16 ADATBÁZIS Adatbázis A mita adatait adatbázisba kell redezi. Napjaikba ez számítógépes adatbázist jelet, ami egy témakör vagy cél köré csoportosuló iformáció. Az adatbázist is meg kell tervezi, amiek eredméyekét az adattárolás és kiyerés hatékoy lesz, az adatbázis egyértelműe fog viselkedi. A rosszul megtervezett adatbázis időzített bomba! 5. ábra: A rossz adatbázis időzített bomba Adatbázis tervezés sorá tisztázi kell,hogy milye iformációt akaruk kiyeri? Milye elkülöülő tématerületeke szereték az adatokat tároli? Hogya kapcsolódak ezek egymáshoz? Az egyes területeke belül milye adatokat kell tároli? Mi az adat? Mide iformáció, amit tároli kell. szám szöveg dátum hag kép, stb. A mértékegységgel redelkező adatokat a helyes mértékegységgel kell tároli. Nagyo sok félreértéstől megkíméljük magukat. Let látható, ismétléskét, a mértékegységek többszörösei. A mértékegységek többszörösei SI (Systém Iteratioal d Uités) kilo- k 103 mega- M 106 giga- G 109 tera- T 1012 peta- P 1015 exa- E

17 ADATBÁZIS Adatbázisba az adatokat táblákba tároljuk. A tábla felépítése, az Excelt redszerese haszálókak már ismerős. Oszlopokból és sorokból áll. Az oszlopok tartalmazzák a megfigyelések ismérveit, tulajdoságait. Ezeket változóak vagy mezőek (field) evezzük. A sorok a megfigyelési egységeket, szubjektumot tartalmazzák. A sorokat rekordak (record) evezzük. A jó adatbázis kritériumai: 1. mide mezőek egyedi eve va 2. a mezők elemi iformációt tartalmazak 3. em lehet két egyforma sora 4. a sorok és oszlopok sorredje tetszőleges 5. e tartalmazzo származtatott, kiszámított adatot (redudacia) 6. egy mező megváltoztatása em hathat ki más mezőkre 7. mide szükséges adatot tartalmaz 8. va elsődleges kulcsa Az egyedi év azt jeleti, hogy em lehet két egyforma mezőév. Az elemi iformáció egyetle tulajdoságot takar, pl. tömeg. Nem lehet évbe mért tömeg a mező eve, mert ez már két elemi iformációt tartalmaz. Az ilyet két külö mezőbe kell tároli. Ameyibe két egyforma sorra lee szükségük, akkor is csak egyet szabad az adatbázisba tároli, és egy gyakorisági mezőbe jelöli kell, hogy háy va belőle. A sorok a sorokkal, az oszlopok az oszlopokkal cserélhetők fel. Itt em traszpoálásról va szó. Olya kiszámított adatot, amit a többi mezőből egyértelműe meg tuduk határozi tilos tároli. Egy adatbázis em számítódik újra automatikusa, ez em egy számolótábla, mit az Excel. Ezért egy mező megváltoztatása em befolyásolhatja a többit. Az elsődleges kulcs a rekordok egyértelmű azoosítására szolgál. Ez legtöbbször egy automatikus sorszámozást jelet. Ez az egész szám azoba csak azoosításra szolgál, em szabad vele matematikai műveleteket végezi

18 A VÁLTOZÓK MÉRÉSI SZINTJEI A változók mérési szitjei Ez a fejezet a változók mérési szitjeit, illetve a mérési szitekbe sorolás jeletőségét és gyakorlati haszát tárgyalja. A változók mérési szitje is egy modell, ami megköyíti a helyes statisztika mutatók meghatározását. Napjaikba egyesek megkérdőjelezik eek a modellek a létjogosultságát, de sok számítógépes statisztikai programcsomag is haszálja. Véleméyük szerit is jól haszálható, és megvéd olya alapvető hibák elkövetésétől, amikor szakmailag és statisztikailag értelmezhetetle mutatókat határozak meg. A mérési modell alapjá a változók az alábbi típusba tartozhatak: Nomiális (kategorikus és diszkrét) Ordiális Itervallum skála Aráyskála A feti égy típust két kategóriába lehet összevoi: magas és alacsoy mérési szitű adatok. A magasba az itervallum és aráyskála, az alacsoyba a omiális és ordiális adatok tartozak. Milye az átjárhatóság eze adatok között? Lehet-e egyiket a másikba kovertáli? Ige. Azoba be kell tartai egy szabályt. Magas mérési szitű változóból lehet alacsoyt csiáli, de fordítva em. Aak elleére sem, hogy a gyakorlatba sokszor elkövetik ezt a hibát. Ameyibe alacsoy mérési szitű változóból magasat szereték csiáli, boyolult statisztikai eljárást kell alkalmazi, ami elvégzi a skálázást. Azoba ez a skálázás em egzakt, csak becslés, becslési hibával terhelt. Az így előállított skála em egyeragú a valódi skálával. 6. ábra: Nomiális típusú változók

19 A VÁLTOZÓK MÉRÉSI SZINTJEI Nomiális változó: a omiális skálá mért változók csak miőségi iformációt hordozak, arra alkalmasak, hogy egymástól jól elkülöülő kategóriákat hozzaak létre. Tipikus omiális változó a em, a rassz, a város, a kezelés helyszíe. Legjellemzőbb értéke a módusz vagy sűrűsödési középpot, amiek a jele: Mo. ez a mitavétel sorá leggyakrabba előforduló érték. Az adatbázisba a omiális változót két oszlopba tároljuk: az első a kategória evet, a második a gyakoriságot tárolja. Nomiális változó jellemzői: Megszámlálható Távolság és aráy em értelmezett a kategóriák között Számítások a gyakorisági értékekkel Az ilye típusú változók elemzésekor tisztába kell lei, hogy mit lehet kiszámítai belőlük. Milye kérdéseket lehet megfogalmazi? Példa : hajszí X=y. ugyaayi bara, mit szőke. X em egyelő y. Egyik szíből több vagy kevesebb va. Háyszor több a bara hajszí, mit a szőke? A később ismertetett viszoyszámok meghatározása: megoszlási viszoyszám, koordiációs viszoyszám. A omiális típusú változókat oszlop vagy kördiagramo ábrázolhatjuk szőke b ar a f e k e te vö rö s egyéb 7. ábra: A hajszí ábrázolásai Ordiális változó: Sorrede alapuló változó Az egyes kategóriák kvatitatív alapo sorba redezhetők Az objektumok közötti eltérés mértéke em ismert Jellemző értéke: mediá, Me

20 A VÁLTOZÓK MÉRÉSI SZINTJEI A 8. ábra egy ordiális változót szemléltet, pl. egy édesség kóstolás eredméyét. A világoskék cukor ízlett a legkevésbé, a piros kicsit jobba, és így tovább. 8. ábra: Ordiális változó Itervallumskála: Az egyes kategóriák kvatitatív alapo sorba redezhetők Az objektumok közötti eltérés mértéke ismert Nics abszolút ulla pot Legjellemzőbb értéke: számított középérték Itervallumskála típusú változó például a hőmérsékletmérés (Celsius- vagy Fahreheit skála). Vaak olya fizikai meyiségek, amelyeket eleve csak itervallumskálá érdemes méri, aráyskálá em. Például ilyeek a szíek. A pszichológiai meyiségek közül például az itelligecia tartozik ezek közé. Az itelligeciáak jóformá lehetetle egy abszolút ullapotját értelmezi, de az reális célkitűzés lehet, hogy itervallumskálá mérjük. Az itervallumskála ullapotjáak és egységpotjáak a meghatározása is megállapodás kérdése. Itt már számolhatuk átlagot, mivel a ullapot eltolása em változtatja meg az átlag relatív helyét az átlagolt számok között. Azokívül az itervallumskála értékei közötti külöbségképzések is va értelme. Egyedül az aráyszámítást em végezhetjük el, em modhatjuk, hogy 40 Celsius fok kétszer melegebb, mit 20 Celsius fok. A termodiamika törvéye szerit ez em igaz. Ezért is haszáljuk a Kelvi-skálát tudomáyos vizsgálatokba. Aráyskála: Az itervallumskála jellemzőivel redelkezik Abszolút ullapottal redelkezik Jellemző értéke: számított középérték Az aráyskála az itervallumskála jellemzőivel redelkezik, emellett tartalmaz egy abszolút ullapotot is. A darabszámmal vagy itezitással redelkező meyiségek tipikus aráyskálát képviselek. Az aráyskálára a számokra voatkozó összes művelet

21 A VÁLTOZÓK MÉRÉSI SZINTJEI alkalmazható. Az aráyskálá a ullapot természetese rögzítve va. Ugyaakkor a skála egysége itt is szabado megválasztható: például mérhetjük méterbe vagy yardba, ez a két távolság aráyát em befolyásolja. Egy fizikai meyiség a törtéelem sorá, a tudomáy fejlődéséek köszöthetőe többféle mérési szitbe is tartozhat. Elidul az alacsoy szitről és később akár skála típusú adat is lehet belőle. Amikor az emberek még csak érzékelés révé ismerték a hőmérsékletet, amikor az egyik dolog csak melegebb vagy hidegebb volt, mit a másik, a hőmérséklet az ordiális skálák osztályához tartozott. Úgy lett belőle itervallumskála típusú adat, hogy kifejlődött a hőmérésta, majd amikor a termodiamika felhaszálta a gázok kiterjedési aráyát a zérushoz való extrapolációhoz, aráyskálává vált. (Az utolsó modat az abszolút, kelvi-fokokra mért hőmérsékletre voatkozik. Mérő o.)

22 ADATÁBRÁZOLÁS Adatábrázolás Az adatok illetve az azokból számított jellemző értékek szakszerű ábrázolása hozzáértést igéyel. Az adatábrázolás em lehet ökéyes, em az ízléstől és divattól függ, hogy milye grafikot készíthetük. A külöböző mérési szitű változókat más és más diagramo ábrázolhatjuk. Oszlopdiagram Kvalitatív változók gyakorisági eloszlásáak ábrázolását végezhetjük el az oszlopdiagrammal. A diagram vízszites tegelyé az osztályok, függőleges tegelyé az abszolút vagy relatív gyakoriságokat ábrázoljuk. Skála típusú adatokat is ábrázolhatuk így, ha valamilye csoportképző ismérv alapjá kategóriákba tudjuk redezi az adataikat. Ilyekor vízszites tegelye a kategóriák, a függőleges tegelye a jellemző értékek helyezkedek el Gyakoriság (db) Hétfő Kedd Szerda Csütörtök Pétek 9. ábra: Oszlopdiagram (LibreOffice Calc) Halmozott oszlopdiagram Az ábrázoladó adatok köre megegyezik az oszlopdiagramál ismertetettekkel. Egy oszlopo belül külöbözőféle, de logikailag összetartozó meyiség halmozódását ábrázolhatjuk. A 10. ábra a apota eladott külöböző élelmiszer meyiségét mutatja. Egy oszlopo belül az eladott áruk belső összetételéről kapuk iformációt

23 ADATÁBRÁZOLÁS Eladott áru (kg) Kedd Szerda Csütörtök Pétek 10. ábra: Halmozott oszlopdiagram (LibreOffice Calc) A következő diagramo évekét ábrázoltuk az eladott élelmiszerek meyiségét. Egyegy oszlopo belül a régiók részesedése látszik. Az x-tegely mértékegysége kg. 11. ábra: Területi adatok halmozott oszlopdiagramja (MS Excel)

24 ADATÁBRÁZOLÁS Halmozott százalék oszlopdiagram Keddtől pétekig eladott árucikkek megoszlásáak (megoszlási viszoyszámok) ábrázolása. Természetese a vizsgálatba vot élelmiszerek halmozott megoszlása 100%. 100% 90% 80% Eladott áru (kg) 70% 60% 50% 40% 30% 20% 10% 0% Kedd Szerda Csütörtök Pétek 12. ábra. Halmozott százalék oszlopdiagram (LibreOffice Calc) Sávdiagram Az oszlopdiagram tegelyeiek felcserélésével lehet előállítai. Szakmailag idokolt esetbe jobba szemléltetheti a modaivalókat. Sávdiagramkét állítható elő a ormál, halmozott és halmozott százalék oszlopdiagram. Pétek Csütörtök Szerda Kedd Eladott áru (kg) 13. ábra. Sávdiagram (LibreOffice Calc)

25 ADATÁBRÁZOLÁS Kördiagram Egy sokaság eloszlását, megoszlási viszoyszámait mutatja Egy kördiagramba midig csak egy adatsor ábrázolható. Illik a körcikkek összegéek 100%-t adi. Hétfő Kedd Szerda Csütörtök Pétek 14. ábra: Kördiagram (LibreOffice Calc) Hétfő Kedd Szerda Csütörtök Pétek 15. ábra: Kördiagram a leggyakoribb kategória jelölve(libreoffice Calc) A kördiagramok közé soroljuk a fák és robbatott fák diagramokat

26 ADATÁBRÁZOLÁS Területdiagram Két árucikk eladott meyiségéek ábrázolása külö-külö. Az x tegely mértékegysége kg Eladott áru (kg) Kedd Szerda Csütörtök Pétek 16. ábra. Területdiagram (LibreOffice Calc) Halmozott területdiagram A apota eladott élelmiszerek meyiségéek halmozott értékeit ábrázolhatjuk a halmozott területdiagrammal Eladott áru (kg) Kedd Szerda Csütörtök 17. ábra. Halmozott területdiagram (LibreOffice Calc) Pétek

27 ADATÁBRÁZOLÁS Halmozott százalék területdiagram Megoszlási értékek vagy viszoyszámok időbeli alakulását mutatja. Az időbeli változásról feltételezzük, hogy folyamatosa megy végbe. 100% 90% 80% Eladott áru (kg) 70% 60% 50% 40% 30% 20% 10% 0% Kedd Szerda Csütörtök Pétek 18. ábra. Halmozott százalék területdiagram (LibreOffice Calc) Voaldiagram Akkor alkalmazhatjuk,ha az adatok közötti átmeet értelmezhető, pl. folytoos jeleségek eseté. A vizsgált jeleség meetét, időbeli alakulását mutatja Hőmérséklet (Celsius) Hétfő Kedd Szerda Csütörtök 19. ábra: Voaldiagram (LibreOffice Calc) Pétek

28 ADATÁBRÁZOLÁS Potdiagram Összetartozó érték-párok ábrázolása. Sokszor XY-grafikoak is evezik Sörfogyasztás (l) Hőmérséklet (Celsius) 20. ábra: Potdiagram (LibreOffice Calc) Regressziós diagram Párokét összetartozó skálatípusú adatok ábrázolására szolgál, amely ki va egészítve a két változó összefüggését leíró regressziós görbével és az összefüggést leíró egyelettel valamit az R2-tel, azaz a determiációs együtthatóval. A 21. ábra a sörfogyasztást mutatja a hőmérséklet függvéyébe. 40 f(x) = 1, x - 14, R² = 0, Sörfogyasztás (l) Hőmérséklet (Celsius) 21. ábra: A sörfogyasztás alakulása a hőmérséklet függvéyébe (LibreOffice Calc) Ebbe az esetbe a lieáris regresszió eredméye látható az ábrá. A determiációs együttható egyhez közeli értéke agyo szoros összefüggést mutat a két változó között

29 ADATÁBRÁZOLÁS ezer Ft millió Ft Árfolyamdiagram Ezt az ábrát előszeretettel haszálják a pézügyi világba, pl. a tőzsdei kereskedések api jellemzésére. A 22. ábrá egyszerre öt jellemzőt ábrázolhatuk. A kék oszlopok a apota eladott részvéyek összes forgalmi értékét mutatják millió Ft-ba, az érték a baloldali y-tegelyről olvasható le. 0 Hétfő Kedd Szerda Csütörtök Pétek 22. ábra: Árfolyamdiagram (LibreOffice Calc) Az ábra többi része a jobboldali y-tegelyhez tartozik. A fekete ill. fehér égyzet mutatja a api yitó és záró árakat. Fekete, ha a záró ár alacsoyabb, mit a yitó. A fekete égyzet alja tehát a záró árat, a teteje a yitó árat jeleti ( fekete csütörtök ). Fehér, ha a záró ár magasabb, mit a yitó, ilyekor a égyzet teteje a záró árat, az alja a yitó árat mutatja. A piros voalak a api legmagasabb és legalacsoyabb árakat mutatják. Ameyibe a api yitó és/vagy záró ár egybe a legmagasabb illetve a legalacsoyabb, akkor a megfelelő piros voal hiáyzik. Ilye esetet mutat a szerdai ap, ahol a yitó és záró ár egybe a legkisebb és legmagasabb ár is. Itt midkét piros voal hiáyzik. Hisztogram A kvatitatív változók gyakorisági eloszlását mutatja. A hisztogram vízszites tegelyé a agyság szerit sorba redezett értékosztályok helyezkedek el. Függőleges tegelye az egyes osztályokhoz tartozó gyakoriságok vagy relatív gyakoriságok. Iformatív lehet, ha a hisztogramo feltütetjük a feltételezett elméleti eloszlás görbéjét is. Ez a grafikus illeszkedésvizsgálat egyik módszere. A feltétezett eloszlás leggyakrabba a ormális eloszlás

30 A z e g y h e k t á r r a ju tó e r ő g é p e k s z á m á a k ADATÁBRÁZOLÁS m e g o s z lá s a a v i z s g á lt g a z d a s á g o k b a S t d. D e v =,1 7 M e a =,46 N = 56,00 0 d b /1 0 0 h a 23. ábra: Hisztogram (R) Kvartilis ábra Ezt az ábrát dobozdiagramak is evezik, az agol megfelelője box-plot. Az x-tegelye miőségi kategóriák, csoportok találhatók, az y-tegelye meyiségek. A ábra három talajművelési változatba mutatja a kukorica elmúlt húszéves termésátlagaiak alakulását. A legalsó vízszites voal a miimális értéket, a piros doboz alja az első kvartilist, a dobozba lévő vízszites voal a mediát, a doboz felső széle a harmadik kvartilist és a legfelső vízszites voal a maximális értéket mutatja. 24. ábra. Kvartilis ábra (R) A kvartilisek részletes ismertetése a köyv későbbi fejezetébe lesz

31 KIMUTATÁS ÉS KIMUTATÁS-DIAGRAM Kimutatás és kimutatás-diagram Ez a lehetőség az Excelbe Adatok meü, kimutatás meübe érthető el. Ezzel a lehetőséggel olya iteraktív kimutatást, jeletést vagy diagramot lehet készítei, amellyel egyszerre több szempot alapjá vizsgálhatjuk meg adataikat. Az adatbázisukból háromdimeziós kimutatásokat lehet előállítai. Ezt agolul OLAP CUBE-ak vagy Pivot táblázatak is evezik. Magyarul szerecsés lee a háromdimeziós kombiációs táblázat vagy rövide kombiációs táblázat megevezést haszáli. A három dimezió: sor oszlop réteg A réteg az egymás mögötti lapokat jeleti. A három dimezió csoportképző változó, ami legtöbbször omiális változót jelet. Tehát egy skála típusú adatból, pl. forgalom (kg/év) egyszerre több ismérv alapjá tuduk kimutatást, jeletést készítei. Az ilye kimutatásba "drag ad drop, húzd és dob" techikával bármelyik dimezió felcserélhető egymással, vagy egymás mellé tehető. Ezt midig az határozza meg, hogy mit akaruk kihagsúlyozi, mit tartuk fotosak. A kombiációs táblázat másik fotos feladata az adatbázis szerkezetéek átstrukturálása, megváltoztatása az alkalmazadó statisztikai módszerek megfelelőe. Az Excel statisztikai függvéyei és eljárásai ilye átstrukturált adatbázisból futak szívese. 1. táblázat: Adatbázis Az Excel kimutatás-varázsló logikus lépéseke keresztül vezeti végig a felhaszálót a kimutatás elkészítésekor. A harmadik lépés utá kész va a kimutatás, és két új eszköztárat kapuk. Az egyik a Kimutatás a másik Kimutatás mezőlista. A kettő közül a hierarchiába a kimutatás eszköztár a magasabb, eek az egyik eszköze a kimutatás mezőlista. A kimutatás eszköztáro az alábbi eszközök találhatók: kimutatás, kimutatás formázása, diagramvarázsló, részletek elrejtése, részletek mutatása, adatfrissítés, rejtett elemek elrejtése összegekbe, elemek megjeleítése, mezőbeállítások, mezőlista megjeleítése. Az utolsóra klikkelve kapjuk az alábbi eszközt

32 KIMUTATÁS ÉS KIMUTATÁS-DIAGRAM 25. ábra: Kimutatás mezőlista eszköztár A kimutatás mezőlista tartalmazza az adatbázisuk összes mezőiek elevezését. A legördülő ablakból választhatuk, hogy az adott változót a kimutatásba hol szereték megjeleítei. Négy választási lehetőségük va: sor, oszlop, oldal (réteg) és adatterület. Az első három területre omiális, ill. csoportképző változót érdemes elhelyezi. Az adatterületre kerül az a változó, amit be szereték mutati. Ezt a változót külöbözőképpe aggregálhatjuk, a leggyakrabba az átlag és összeg függvéyt haszáljuk. Az adatterülete haszálható további függvéyek: darab, maximum, miimum, szorzat, számdarab, szórás, szórásp, variacia, variaciap. Az adatok megjeleítése ilyekor ormálisa törtéik. Egyéb lehetőségük is va az adatok megjeleítésére. Sokszor egymáshoz akarjuk viszoyítai őket, eltéréseket, viszoyszámokat, gögyölített összeget vagy idexeket szereték bemutati. Az Excel ezeket a fukciókat is támogatja. A kimutatás eszköztáro, ha a mezőbeállítások ikot választjuk, beállíthatjuk a mezőstatisztikát

33 KIMUTATÁS ÉS KIMUTATÁS-DIAGRAM 26. ábra: Kimutatás eszköztár Készítsük el az első kimutatásukat a forgalmazott meyiségekről a régiók és időszakok alapjá. 2. táblázat: Részlet a kimutatásból Ebbe a kimutatásba a forgalom összegei szerepelek, ami azt jeleti, hogy az összes eladott árucikk, áruféleség került összeadásra. A darab függvéy megmutatja, hogy adott régióba és évbe háyféle árucikket forgalmaztak. Adatbázisukba ez 11. Kimutatás-diagram

34 KIMUTATÁS ÉS KIMUTATÁS-DIAGRAM 27. ábra: Kimutatás-diagram A leíró statisztikába a legegyszerűbb eljárás a hasolítás, viszoyítás. A hasolítás sorá arra vagyuk kívácsiak, hogy az egyik adatuk meyivel több vagy kevesebb, mit a másik. A viszoyításkor a statisztikába a háyszor agyobb vagy háyad része fogalmakat haszáljuk. Az előzőek szerit tehát hasolításkor külöbségeket, viszoyításkor háyadosokat képezük. Ezeket a háyadosokat viszoyszámokak evezzük. Viszoyítai legtöbbször idő és területi sorokat szoktuk. Csoportosított adatok megjeleítése Néha szükségük lehet arra, hogy hosszabb időszak adatait e apota, havota, évete, haem hosszabb időre csoportosítva jeleítsük meg. Az alábbi kimutatás évete jeleíti meg az áruházlác forgalmi értékeit. 3. táblázat: Évekéti kimutatás a forgalomról

35 KIMUTATÁS ÉS KIMUTATÁS-DIAGRAM Készítsük olya kimutatást, ami háromévete jeleíti meg a forgalmat. Az Év mezőt evezzük át Hároméves időszak mezőre. Ehhez ki kell jelöli a mezőt és be kell íri az új evet. A forgalom háromévekéti csoportosításához kattitsuk a jobb egérgombbal a Hároméves időszak mezőre, válasszuk a Tagolás és részletek megjeleítése paracsra és kattitsuk a Csoportba foglalás elemre. A párbeszéd ablakot állítsuk be az alábbiak szerit. 28. ábra: Csoportosítás párbeszédablak Az új, csoportosított kimutatás a leti táblázatba látható, amit egy kicsit korrigáli érdemes. 4. táblázat: Háromévekéti kimutatás a forgalomról Mivel a valóságba csak a évig va adatuk, az utolsó előtti sort ki kell javítai re, és a magyarázó szövegbe feltüteti, hogy csak két év adataiak öszszesítését tartalmazza. Kimutatás-diagram átalakítása statikus diagrammá Kattitsuk a kimutatás diagramhoz tartozó kimutatásra. A Kimutatás eszköztáro klikkeljük a Kimutatás gombra, és válasszuk a Választás, majd a Teljes táblázat paracsot. Ezzel kijelöljük az egész kimutatást. Amikor az egész ki va jelölve, yomjuk meg a Delete billetyűt. Ezzel kitöröljük a kimutatás és megszűik a diagram és jeletés közötti kapcsolat. A statikus diagramról eltűek a sor, oszlop és réteg jelölők

36 KIMUTATÁS ÉS KIMUTATÁS-DIAGRAM 29. ábra: Statikus diagram Ezt a diagramot a továbbiakba már em tudjuk módosítai. Új diagramhoz új kimutatást kell készítei. R statisztika xtabs(forgalom~ev+regio) Az összes forgalom év és régió szerit. 2. táblázat. xtabs(~ev+regio)vagy ftable(ev,regio) A megfigyelések gyakorisága. A példába az árucikkek száma. barplot(xtabs(forgalom~ev+regio)) Az összes forgalom év és régió szeriti ábrázolása oszlopdiagramo. 22. ábra. rowpercets(xtabs(forgalom~regio+ev) ) Forgalom kimutatása a sor százalékába, azaz a régió szerit. Területi megoszlás. colpercets(xtabs(forgalom~regio+ev) ) Forgalom kimutatása az oszlop százalékába, azaz év szerit. Időbeli megoszlás. tapply(forgalom, list(arucikk, Regio, Ev), mea, a.rm=true) Az átlagos forgalom kimutatása az árucikkek, a régiók és az évek függvéyébe. A statisztikai mutatót szabado változtathatjuk

37 VISZONYSZÁMOK Viszoyszámok Idősorok viszoyítása, bázis- és lácviszoyszámok Válasszuk a kimutatásmező, adatok megjeleítése legördülő listából az eltérés lehetőséget. A viszoyítási mező legye az év, a viszoyítási tétel év. Jól látszik, hogy évbe ics adat, mivel a külöbség ulla, ez a bázis év. A leti ábra az időbeli változás mértékét mutatja kg/év mértékegységbe. 30. ábra: A forgalom évekéti változásáak mértéke (kg/év) Ezzel a módszerrel derivált sort is tuduk képezi, ami a változás ütemét mutatja az eredeti mértékegységbe. A derivált sorba a külöbséget midig az aktuális és előző adat differeciája adja. Pozitív érték övekedést, egatív érték, csökkeést jelet. A viszoyítási tételbe a év helyett válasszuk az (előző) lehetőséget

38 VISZONYSZÁMOK 31. ábra: A forgalom évekéti változásáak üteme (kg/év), derivált sor A bázisviszoyszámok meghatározásához válasszuk az adatok megjeleítése legördülő listából a százalékot, a viszoyítási mező maradjo az év és év. 32. ábra: Bázisviszoyszámok

39 VISZONYSZÁMOK A lácviszoyszámok meghatározásához válasszuk az adatok megjeleítése legördülő listából a százalékot, a viszoyítási mező maradjo az év, de év helyett válasszuk az (előző) lehetőséget. 33. ábra: Lácviszoyszámok Itt az Excelbe va egy kis hiba. Az első lácviszoyszám szerite 100%. A valóságba ez em értelmezett, hisze egy ismeretle adathoz em lehet viszoyítai. A felhaszálók figyelmét fel kell hívi erre. A bázis és lácviszoyszám em lehet egatív. Bázisviszoyszám képlete: VB = i Xi i=1, 2, Xb Lácviszoyszám képlete: V L= i Xi i=1, 2, X i 1 Összefüggés a bázis és lácviszoyszám között: V L= i VB VB i i=2, 3, V B =V L V L V L i 2 3 i i 1 Az előző két viszoyszámot százalékos eltéréskét is meghatározhatjuk, ebbe az esetbe azt mutatják, hogy háy százalékkal csökket vagy övekedett a forgalom. Negatív esetbe csökkeés, pozitív eseté övekedés áll fe. A leti ábrá a császárszaloa

40 VISZONYSZÁMOK bázisviszoyszámaiból képzett százalékos eltéréseket láthatók. A egatív értékek a évhez képesti csökkeést jelzik. 34. ábra: Bázisviszoyszámok százalékos eltérései (%) 35. ábra: Lácviszoyszámok százalékos eltérései (%)

41 VISZONYSZÁMOK R statisztika b=xtabs(forgalom~ev) b/b[1]*100 Bázisviszoyszám. Bázis időszak az első év. b=xtabs(forgalom~ev) b[2:11] / b[1:10] Lácviszoyszám. A két vektor hosszáak meg kell egyezie. Az első vektor a második időszaktól az utolsó ig, a második vektor az első időszaktól az utolsó előtti időszakig tart. b[2:legth(b)] / b[1: (legth(b)-1)] Lácviszoyszám számítása egy kicsit általáosabb formulával. Ebbe az esetbe em kell ismeri a vektor hosszát. A legth() függvéy a vektor hosszát adja meg. A bázis és lácviszoyszámok problémái A százalékos értékek haszálat kéyelmes, köye áttekithető kimutatást eredméyez, azoba ezek az értékek sokszor em adak iformációt a téyleges változás agyságáról. Nem lehet eldötei, hogy a 200%-os változás az egyről kettőre, vagy százról kétszázra törtéő változást jellemzi-e. További probléma, hogy a ulláról iduló változást em lehet velük értelmezi. Pl. az első évbe em sikerült egyetle darabot sem eladi egy bizoyos termékből. A következő évbe viszot már tíz darabot. Ebbe az esetbe meyi a bázis és lácviszoyszám értéke? Mivel midkét esetbe ullával kellee osztai, eek ics értelme, tehát em lehet meghatározi ezzel a módszerrel a változást. Ilyekor a jól bevált külöbségképzés a járható út. Ugyaez a probléma áll fe akkor is, ha valamelyik termék eladása az egyik időpotba ullára esik vissza. Ebbe az esetbe, ha bázis viszoyszámot számítuk, és bázis időszakak egy ullától külöböző időszakot választuk, elvégezhető az osztás, de az eredméy ulla lesz. A változás mértéke ezek szerit ulla? Nem. Ilyekor a viszoyszámok tévese iformálak. Itt is az egyszerű külöbségképzés, vagy, ha a változás ütemére vagyuk kívácsiak, a derivált sor a megoldás. Ameyibe a változás jellegére vagyuk kívácsiak, pl. egyeletese, lieárisa ő-e a forgalom, a bázis viszoyszámokból tuduk erre következteti. A bázisviszoyszámok egyeletes, azoos agyságú övekedése ezt mutatja. A lácviszoyszámokkal azoba óvatosa kell bái. Godolhatjuk azt, ha mide évbe ugyaolya ütembe ő a forgalom, akkor a övekedés egyeletes. Ebbe az esetbe a lácviszoyszámok mide évbe egyformák. A övekedés üteme azoba em lieáris, mert az előző időszak megövekedett forgalma fog a következő évbe tovább ői. Olya ez, mit a kamatos kamat. A következő évbe a kamat is kamatozi fog. Mivel egy adott időszak bázisviszoyszámát úgy is meghatározhatjuk, hogy a megelőző időszak lácviszoyszámait összeszorozzuk, ezért azoos lácviszoyszámok eseté a övekedés expoeciális lesz. VLx, ahol az x az időszakok számát jeleti

42 VISZONYSZÁMOK Ameyibe potosa jellemezi akarjuk a változás ütemét, a derivált sor meghatározását kell elvégezi. A derivált adatok ábrázolásával megbízhatóa következtethetük a változás jellegére. Megoszlási viszoyszámok (Vm) A megoszlási viszoyszámok a statisztikai sokaság részeiek az egészhez viszoyított aráyát fejezik ki. A vizsgált sokaság összetételéek, belső szerkezeteiek feltárását segítik elő. Megmutatja, hogy az egyik rész milye részesedéssel redelkezik az egészhez viszoyítva, pl. piaci részesedés. Megoszlási viszoyszám képlete: Vm= i Xi i=1, 2, Xi i=1 A evezőbe a teljes sokaság, a számlálóba a részsokaság áll. A területi megoszlási viszoyszámok meghatározásához készítsük egy újabb kimutatást. A sorok legyeek a régiók, az árucikk maradjo a császárszaloa. Az adatok megjeleítése legördülő listából válasszuk az oszlop százalék lehetőséget. Az OK utá az alábbi ábrát kapjuk. A kördiagramhoz az eredeti kimutatás-diagram mitáját állítsuk át kördiagramra. Az egyéb formázást a megszokott módo végezhetjük. 36. ábra: Megoszlási viszoyszámok (%) A feti diagram a császárszaloa-forgalom területi megoszlását szemlélteti. Megoszlási viszoyszámok ábrázolását célszerű kördiagramo bemutati. A kör az egészet (100%) reprezetálja, a körcikkek a belső struktúráról, felépítésről yújtaak tájékoztatást

43 VISZONYSZÁMOK A megoszlási viszoyszámok átlagát agyo egyszerűe határozhatjuk meg, egyszerűe csak az egyet kell osztauk -el. Megoszlási viszoyszámok átlaga: V m= 1 A feti képlet pl. az átlagos piaci részesedést jellemzi. R statisztika prop.table(xtabs(forga- lom~ev+regio),1) Megoszlási viszoyszám. A forgalom területi, régiók szeriti, megoszlása évekét. Ebbe az esetbe a sorok összege 100%. Ameyibe a kifejezést megszorozzuk százzal, százalékba kapjuk meg az eredméyt. prop.table(xtabs(forga- lom~ev+regio),2) Megoszlási viszoyszám. A forgalom időbeli megoszlása régiók szerit. Ebbe az esetbe az oszlopok összege 100%. Ameyyibe a kifejezést megszorozzuk százzal, százalékba kapjuk meg az eredméyt. ftable(prop.table(xtabs(forgalom~ev+ Regio),1)) Tetszetősebb táblázatot kapuk az ftable() függvéy haszáltával. ftable() flat table. Koordiációs viszoyszámok (Vk) Ezek a viszoyszámok ugyaazo sokasághoz tartozó két részsokaság aráyát mutatják. A koordiációs viszoyszám képlete: Vk= i Xi Xj A számlálóba a viszoyított részsokaság, a evezőbe a viszoyítás alapjául szolgáló részsokaság áll. Ameyibe arra vagyuk kívácsiak, hogy egy kiló keyérre háy kiló sokaértékesítés jut, akkor koordiációs viszoyszámot határozuk meg. Az alapsokaság az árucikkek. A mita adatbázisba 11 áruféleség szerepel. Készítsük egy új kimutatást. A sorokba tegyük az árucikk változót, az oszlopokba a régiót. Az adatterület maradjo a fogalom (kg/év). Ameyibe az oldalmezőek megadjuk az év változót, lehetőségük va évekét, vagy az évek külöböző kombiációjába kimutatásokat készítei. Az alapesetbe az összes év forgalmi adatai szerepeli fogak a kimutatásba. Az új kimutatás részlete let látható

44 VISZONYSZÁMOK 5. táblázat: Keyér és szedvics kimutatás Készítsük el a koordiációs viszoyszámokat. A kimutatásmező eszközablakba az adatok megjeleítéséhez válasszuk a százalékot. A viszoyítási mező legye az árucikk, a viszoyítási tétel a keyér. Az új kimutatás az alábbiak szerit alakul. 6. táblázat: Koordiációs viszoyszámok A szedvicssoka sor mutatja, hogy a régiókba mide eladott keyérre 7% soka jutott (tömegre vetítve). Hétközapi megfogalmazásba mide kiló keyérhez 7dkg szedvics sokát vettek az emberek. R statisztika b=xtabs(forgalom~arucikk+regio) Kimutatás készítése. Sorokba az árucikkek, oszlopokba a régiók szerepelek. vsz=b[10,]/b[5,]*100 Koordiációs viszoyszámok előállítása. A tizedik sorba a soka, az ötödik sorba a keyér található. Az idexbe a soridex utá ics oszlop idex (a vessző utá üres). Ez azt jeleti, hogy az oszlop mideegyes elemé hajtsa végre az osztást, esetükbe mide régióba számítsa ki a koordiációs viszoyszámokat. barplot(vsz,mai="koordiációs viszoyszámok",ylab="%") Koordiációs viszoyszámok ábrázolása oszlopdiagramo. Tervfeladat viszoyszám (Vtf) Ez a viszoyszám megmutatja, hogy a bázis időszakhoz képest milye iráyba és mértékbe változott a téyidőszak terve. Meyire vették figyelembe az előző időszak tapasztalatait, az elkövetkező időszakba pesszimista vagy optimista tervet készíteek. Pesszimista, ha a tervfeladat viszoyszám jóval kisebb, mit 100%. Optimistáak evez- 39 -

45 VISZONYSZÁMOK hetjük a 100%-ál agyobb értéket, ha ez em túlzotta rugaszkodik el a valóságtól, és em vakmerőséget jelet. Tervfeladat viszoyszám képlete: V tf = X terv X téy A számlálóba a téyidőszak terve, a evezőbe a bázisidőszak téyadata áll. Készítsük egy újabb kimutatást. Az oszlopok legyeek az Év változó, az adatterületre húzzuk Terv_forgalom változót és ugyaide a Forgalom változót is. Adatok Összeg/ Terv_Forgalom (kg/év) Összeg/Forgalom (kg/év) Év táblázat: Részlet a kimutatásból Az évek közül az időszak két utolsó időpotját szűrjük le. Év Adatok Összeg / Terv_Forgalom (kg/év) Összeg / Forgalom (kg/év) táblázat: Az utolsó két időszak terv és téyadatai Egy egyszerű osztással / *100=102,8%. megkapjuk a tervfeladat viszoyszámot:

46 VISZONYSZÁMOK R statisztika terv=xtabs(terv~ev) Kimutatás készítése évek szerit a tervadatokról. tey=xtabs(forgalom~ev) Kimutatás készítése évek szerit a téyadatokról. vsz=terv[2:legth(terv)]/tey[1: (legth(tey)-1)]*100 Tervfeladat viszoyszámok meghatározása. A tervadatok a második évtől kezdődek, ezért az idexbe kettőtől -ig kell figyelembe vei az adatokat. A legth(terv) függvéy megadja a megfigyelések számát. A téyadatok az első évtől kezdődek, de az utolsó előtti évig tartaak. Tervteljesítési viszoyszám (Vtt) Ez a viszoyszám tájékoztat beüket, hogy a tervük meyire volt reális, meyire tudtuk megközelítei vagy etá túlszáryali azt. Tervteljesítési viszoyszám képlete: V tt = X téy X terv A számlálóba a tárgyidőszak téyadata, a evezőbe a tárgyidőszak tervadata áll. 37. ábra: Számított mező előállítása

47 VISZONYSZÁMOK A 7. táblázat kimutatása jó kiidulása a tervteljesítési viszoyszám meghatározásáak. Mivel ez a mutatószám a tárgyidőszak téy és tervadatáak háyadosa, egyszerűe képezzük a háyadosukat. A Kimutatás eszköztáro válasszuk a Kimutatás legördülő listából a Képletek lehetőséget és klikklejük a Számított mező beszúrására. Adjuk meg az új, számított mező evét, pl.: Tervteljesítés. Képletek, pedig adjuk meg a téy és tervadatok háyadosát. Ezt a Mező beszúrása gombbal kéyelmese elvégezhetjük. Utáa a Felvesz gombbal előállítjuk az új mezőt, ami megjeleik a Mezők ablakba a legutolsó helye. Az Ok utá a kimutatásuk utolsó sorába láthatjuk a tervteljesítési viszoyszámot. Állítsuk át az adatok számformátumát százalékra. Kimutatásmező/Számforma /Kategória/Százalék. Adatok Összeg / Terv_Forgalom (kg/év) Összeg / Forgalom (kg/év) Összeg / Tervteljesítés ,00% ,12% ,89% ,64% ,48% ,64% 9. táblázat: Tervteljesítési viszoyszámok R statisztika terv=xtabs(terv~ev) Kimutatás készítése évek szerit a tervadatokról. tey=xtabs(forgalom~ev) Kimutatás készítése évek szerit a téyadatokról. vsz=tey/terv*100 Tervteljesítési viszoyszámok meghatározása. A 100-s szorzó a százalékos forma miatt szerepel. barplot(vsz,mai="tervteljesítési viszoyszámok",ylab="%") Tervteljesítési viszoyszámok ábrázolása. Diamikus viszoyszám (Vd) A diamikus viszoyszám összefoglaló elevezése a bázis illetve lácviszoyszámokak. Meghatározása tökéletese megegyezik a lác illetve bázisviszoyszám meghatározásával, amit a 32. oldalo kezdődő fejezetbe tárgyaltuk. Ez a mutatószám tájékoztat beüket, hogy a bázis évi forgalomhoz képest a tárgyidőszak forgalma milye mértékbe változott. A diamikus viszoyszám képlete: V d= X téy X bázis

48 VISZONYSZÁMOK Kérdések Igazak-e az alábbi állítások (tervteljesítési viszoyszámok)? Az áruházlác mide évbe túlteljesítette a tervét országos szite. Mide régió a 11év átlagába túlteljesítette a tervet. A régiók mide évbe túlteljesítették a tervüket. A 11 év alatt Észak-Magyarország tervteljesítése volt a legmagasabb. Itezitási viszoyszámok Az itezitási viszoyszámokat külöemű adatok háyadosakét határozzuk meg. Kifejezési formájuk együtthatós. Ezekek a viszoyszámokak mértékegységük va, és megmutatják, hogy az egyik jeleség milye gyakra, ill. sűrű fordul elő a másikhoz képest. Midig azzal a meyiséggel osztuk, amelyek az egységére voatkoztatjuk a másik meyiséget. A megevezések is az osztó az alapja. Sűrűségmutatók: (területi vagy térfogati sűrűséget jellemezek) épsűrűség, fő/km2 vagy fő/ha gépsűrűség, db/km2 vagy db/ha illetve db/gazdaság stb. Aráyszámok: - elsősorba a épességstatisztikába haszálják, születési-, halálozási aráyszám, stb. Átlagos értéket kifejező mutatószámok: termésátlagok, t/ha átlagkereset Ft/fő, Ft/vállalat, Ft/régió átlagos tejhozam l/tehé, l/gazdaság stb. A termésátlagok valójába területi sűrűségmutatók. A gazdálkodás hatékoyságát kifejező mutatószámok: termelékeység, mukatermelékeység ráfordítások hatékoysága ököltség, Ft/db, Ft/szolgáltatás stb. hozam ráfordítás Miél agyobb a gazdálkodás hatékoyságát jellemző egyees mutatószám értéke, aál hatékoyabb a tevékeység. Pl. egy mukaóra alatt előállított termék száma, egy forit ráfordításra kapott eredméy. Az ököltségél, csak az ököltséget figyelembe véve em lehet egyértelműe megítéli a gazdálkodás hatékoyságát. Az ilye egyees hatékoysági mutatók átlagolásakor legtöbbször súlyozott számtai átlagot kell számítai. Fordított itezitási viszoyszámok:

49 VISZONYSZÁMOK Ezeket igéyességi mutatókak is evezzük. Megmutatja, hogy egy termék, szolgáltatás meyi ráfordítást igéyel. A ráfordítás lehet aturális meyiség, pl. mukaóra, vagy pézbeli. Ilyek a fordított teljesítméy mutatók és a fordított sebesség mutatók, stb. ráfordítás hozam A fordított hatékoysági mutatókak miél agyobb az értékük, aál hatékoytalaabb a tevékeység, mivel az igéyességi mutatók egy termékre vagy szolgáltatásra jutó mukaórát, ráfordítást, stb. jellemezek. Ezek átlagolásakor körültekitőe kell eljári, mert legtöbbször súlyozott harmoikus átlagot kell alkalmazi. Mikor, melyik átlagot kell meghatározi? Ezt a középértéket fejezetbe fogjuk részletese tárgyali

50 KÖZÉPÉRTÉKEK Középértékek Számtai átlag Határozzuk meg a régiók átlagos éves forgalmát árucikkekét. Mit mutatak ebbe az esetbe a sor és oszlop összegek valamit jobb alsó sarokszám? Elleőrizzük le, hogy a magyarázatuk helyes-e. 10. táblázat: Átlagos forgalmi értékek Az adatmező egy adata azt mutatja, hogy az adott árucikkből a régióba éves átlagba eyi kg-t forgalmaztak. Pl. baá Dél-alföldi régió kg/év. Ezt az átlagot szorozva a vizsgált évek számával, megkapjuk az összes forgalom értékét: kg/év* 11 év = kg. Mit mutatak az oszlopok Végösszeg adatai? Szité a Dél-Alföld adata. Ezt úgy kell értelmezi, hogy ebbe a régióba a tizeegy év és tizeegy árucikk átlagába eyi volt a forgalom. A régió összes forgalmát úgy kapom meg, hogy az kg/ (év*árucikk) * 11 év * 11 árucikk = kg. A mértékegységeket midig tütessük fel, mert ez agyba segít az értelmezésbe, és így em lehet eltévesztei. Mit mutatak a sorok Végösszeg adatai? Vegyük a baá adatát. Eek a magyarázata: a baá forgalom átlagos értéke a tizeegy év és hét régió átlagába eyi volt. A baá összes forgalmát úgy kapom meg, hogy kg/(év*régió) * 11 év * 7 régió = kg. És végezetül hogya kell értelmezi a sarokszám értékét. Ez azt jeleti, hogy eyi volt az átlagos forgalom az évek, árucikkek és régiók átlagába. Az országos forgalmat úgy kapom meg eek az adatak a birtokába, hogy kg/(év*árucikk*régió) * 11 év * 11 árucikk * 7 régió = kg. A téyleges forgalmi adat az eredeti alapadatok alapjá kg. Az eltérés abból adódik, hogy az átlagértékeket kerekítettük. A számtai átlag képlete: = X xi A számtai átlag sok jó tulajdosággal redelkezik, ezek közül a legfotosabbak:

51 KÖZÉPÉRTÉKEK Ha az átlaggal helyettesítjük az alapadatokat, az értékösszeg em változik. A gyakorlatba ez azt jeleti, ha a számtai átlagot megszorozzuk az adatok számával, az értékösszeget kapjuk. Ez egy agyo kéyelmes és jól haszálható tulajdoság. Az alapadatok számtai átlagtól vett eltéréseiek összege ulla. A számtai átlagtól vett eltérések égyzetösszege a legkisebb. Bármelyik más adattól vett eltérés-égyzetösszeg eél agyobb. Excel függvéy ÁTLAG(szám1;szám2;...) Szám1, szám2...: Legfeljebb 30 szám, amelyek átlagát keressük. Megjegyzés Az argumetumok számok, számokat tartalmazó tömbök vagy számokra mutató evek, illetve hivatkozások lehetek. A függvéy a tömbbe vagy hivatkozásba szereplő értékek közül csak a számokat haszálja, az üres cellákat, logikai értékeket, szöveget és hibaüzeeteket figyelme kívül hagyja, de a ullát tartalmazó cellákat számításba veszi. R statisztika mea(forgalom) A forgalom számtai átlaga. mea(forgalom,0.05) 5%-s trimmelt átlag. A megfigyelések 5%-a em szerepel a számítai átlag kiszámításakor. A szélsőségese kis és agy adatok torzító hatásáak kiküszöbölése. mea.data.frame(adat) Az adat evű adatbázis változóiak számtai átlagai. A em umerikus változókra természetese em számítódik. mea.data.frame(adat, 0.05) Adatbázis trimmelt számtai átlagai. mea.data=aggregate(forgalom~arucikk+regio,adat,mea) Adatbázis aggregálása. Az aggregáló függvéy a számtai átlag. Csoportképző téyezők az árucikk és régió. ftable(tapply(forgalom, list(arucikk, Regio), mea, a.rm=true)) Számtai átlag kimutatásba flat table formátumú megjeleítés. ftable(tapply(forgalom, list(arucikk, Regio, Ev), mea, a.rm=true)) Többdimeziós kimutatás flat table formátumú megjeleés. Súlyozott számtai átlag Számítsuk ki az áruházlác eladott élelmiszereiek átlagárait évekét. Itt az egyszerű számtai átlag hamis eredméyt ad, mert az átlagár függ az eladott meyiségtől. Az árakat ebbe az esetbe súlyozi kell az eladott meyiségekkel. A súlyozást leg

52 KÖZÉPÉRTÉKEK egyszerűbb módo az adatbázis eredeti adatai tudjuk elvégezi. Defiiáljuk egy új mezőt (oszlopot), és evezzük el Árbevétel -ek. Szorozzuk össze az Ár és Forgalom változókat. Az új mező az adott élelmiszer árbevételét fogja mutati. Az adatbázisuk ebbe az esetbe elveszíti a ormális adatbázis kíváalmait, mivel származtatott meyiséget is fog tartalmazi. Ez most em probléma, mivel csak ideigleese va rá szükség, a számítások utá yugodta ki lehet töröli. 11. táblázat: Az árbevétellel bővített adatbázis részlete Ameyibe összegezzük az árbevétel oszlopot, megkapjuk a tizeegy év országos árbevételét. Térjük vissza az átlagárak kimutatásához. Készítsük egy új kimutatást évekét és árucikkekét. Az adatmezőbe helyezzük el az árbevétel és forgalom változókat. 12. táblázat: Kimutatás részlet

53 KÖZÉPÉRTÉKEK Az Összeg/Árbevétel (Ft) sorok tehát a forgalommal súlyozott árakat tartalmazzák. Az alatta lévő forgalom változó pedig az összes forgalmat jeleti, azaz a súlyok összegét. Képezzük a kettő háyadosát, hogy megkapjuk a súlyozott számtai átlagot. (Kimutatás/Képletek/Számított mező ). 38. ábra: Számított mező beszúrása 13. táblázat: Részlet az átlagár kimutatásból Az átláthatóság érdekébe csak az átlagárakat jeleítsük meg, a másik két sor jelölőégyzeteit töröljük

54 KÖZÉPÉRTÉKEK 14. táblázat: Az átlagár kimutatása A év baá cellája a hét régió átlagába mutatja a baá átlagárát. Mértékegysége Ft/(kg*régió). Az oszlop végösszeg cellája mutatja a év átlagárát a régiók és árucikkek átlagába. Mértékegysége Ft/(kg/régió/árucikk). A sarokszám 484 értéke a főátlag, mide téyező átlagába eyi volt az átlagár. Mértékegysége Ft/ (kg*év*régió*árucikk). A vizsgált időszakba az összes árbevétel úgy kapjuk meg, hogy beszorozzuk az adatok számával, 847-tel, vagyis 11*7*11-vel. A sor és oszlop végösszegekből hasoló módo határozhatjuk meg az árbevételt. Midig ayival kell szorozi, aháy adatból átlagoltuk. Ameyibe em vagyuk biztosak abba, hogy háy adatból átlagoltuk, kattitsuk a Kimutatás eszköztáro a Részletek megjeleítése ikora (zöld kereszt). Ekkor egy új mukalapo megkapjuk azokat a rekordokat, amikből az átlagok lettek meghatározva. Kérdezheték va-e jeletős külöbség, ha em súlyozzuk az átlagokat, és csak egyszerű számtai átlagot határoztuk vola meg. Ige. A helytele számítás a főátlagra 803 Ft/kg-t eredméyez, ez pedig agyo-agy külöbség. A súlyozott számtai átlag képlete: = X f i xi fi Nagyo fotos, hogy egy kimutatásból, jeletésből em lehet további számításokat készítei! A táblázat alapjá a évbe eladott élelmiszerek átlagárait em lehet egyszerű számtai átlaggal átlagoli, és vári, hogy az eredméy megegyezze a végösszeg (394 Ft/kg) értékével. A számtai átlagolás helyteleül 661 Ft/kg-t eredméyez. Ekkor ugyaazt a hibát követék el, mitha em súlyoztuk vola az eredeti alapadatokat. Mide új kimutatást az eredeti adatokból állítsuk elő. Ritká előfordulak olya kimutatások, amikből lehet további számításokat végezi, ezek főkét extezív meyyiségek részátlagolásakor fordulak elő

55 KÖZÉPÉRTÉKEK Az Excel mukalapjá súlyozott számtai átlagot két függvéy segítségével tuduk számítai. Az egyik a SZORZATÖSSZEG() a másik a SZUM() függvéy. A szorzatösszeg függvéy két adatsor szorzatáak összegét számolja ki. Súlyozott számtai átlagál ez a számláló. A szum függvéy az adatok összegzésére szolgál. Esetükbe a súlyok összegzésére, és ez fog szerepeli a evezőbe. súlyozott = SZORZATÖSSZEG f ; x X SZUM f A feti példába az f a forgalmat, az x az árat jeleti. R statisztika ar.bvtl=ar*forgalom Árbevétel meghatározása, ar.bvtl oszlopvektorba. adat=data.frame(adat,arbevetel=ar.bv tl) Az adat evű adatbázis bővítése az Arbevetel evű változóval. Itt látható a változók átevezéséek módja. attach(adat) A bővített adatbázis változó eveiek öszszekapcsolása. Így egyszerűe hivatkozhatuk a változókra, a változó evéek megadásával. xtabs(arbevetel~arucikk+ev)/xtabs(fo rgalom~arucikk+ev Az eladott árucikkek átlagáraiak kiszámítása két ismérv, csoportképző téyező függvéyébe. sum(as.umeric(arbevetel))/sum(forgalom) Globális átlagár. Az as.umeric függvéyre agy számok eseté va szükség. Az összes árbevétel osztva az összes forgalommal. sum(as.umeric(ar*forgalom))/sum(for galom) A globális átlagár másik meghatározási módja. weighted.mea(ar,forgalom) A globális átlagár legegyszerűbb meghatározási módja. Súlyozott számtai átlag. tárolása az Kroologikus átlag Az időbe folyamatosa változó meyiségekről, mit a raktárkészlet, egyelő időközökbe szoktak kimutatást, leltárt készítei. Raktárkészlet esetébe ez havota törtéik. Havi gyakoriságál feltételezzük, hogy a yitóállomáy készlete az előző havi zárókészlettel egyezik meg. A február elsejei yitó készlet megegyezik a jauár 31-i zárókészlettel. A havi átlagos raktárkészlet egyelő a yitó és zárókészlet számtai átlagával. A leti összefüggés ezt mutatja. Ha jól megézzük, akkor ez egy súlyozott számtai átlag

56 KÖZÉPÉRTÉKEK x 1 x 2 x 2 x 3 x x X k = 1 A feti képletet átredezve kapjuk a kroologikus átlag függvéyét: 1 x1 x i=2 x i k= 2 2 X 1 Az áruházlác baá raktárkészlete az alábbiak szerit alakult. Meyi volt a havi átlagos raktárkészlet. 15. táblázat: A raktárkészlet alakulása Az időszak első és utolsó adata fele súllyal (0,5), a többi adat egy súllyal szerepel az át lagképzésbe. A súlyok összege -1-t ad. A tizehárom súly összege 12. Ezek szerit az átlagos havi raktárkészlet 2 037,5 kg/hó volt. Harmoikus átlag Az egyik élelmiszerszállító jármű km-ről hozza a baát. Az út első felét 50 km/hs, a második felét 100 km/h-s átlagsebességgel teszi meg. Milye agy az átlagsebessége az km-s úto? Meyi a meet ideje? Az út első fele 500 km, a második is ugyaeyi. Az út első felét tehát 500 km/50 km/h = 10 óra alatt, a második felét 500 km/100 km/h = 5 óra alatt tette meg a kamio. A meet ideje tehát 15 óra. Az átlagsebesség eek ismeretébe már köye meghatározható: km/15 óra = 66,67 km/h. Ebbe az esetbe itezív meyiségek átlagát kellett meghatározi, sebességekét. Az ilye típusú változók kiegyelítődi szeretek és em összeadódi, ezért egyszerű számtai átlagolást csak külöleges feltételek megléte eseté szabad alkalmazi. A fel

57 KÖZÉPÉRTÉKEK adatba az itezív meyiségél a számlálóba lévő úthosszt ismerjük, ezért harmoikus átlagot kell számítai. A harmoikus átlag képlete: X h = 1 = 1x x1 i=1 i i=1 i A feladatra alkalmazva: v = 2 =66, A fet említett külöleges feltétel az jeleti, hogy csak akkor szabad a sebességeket számtai átlagoli, ha a részsebességek egyelő időközökre voatkozak. Pl. va egy sebességmérő műszer az autóba, ami órákét rögzíti az átlagsebességet. Az egész útra voatkoztatott átlagsebességet ilyekor számtai átlaggal kell meghatározi. Ezt vegyük figyelembe a GPS készülékek által szolgáltatott adatok további elemzéséél, mert em midegy, hogy a mért adatok egyelő úthosszra vagy egyelő időközökre voatkozak. Excel függvéy HARM.KÖZÉP(szám1;szám2;...) Szám1, szám2...: Azok a számok, amelyek harmoikus középértékét ki szereték számítai (legfeljebb 30 argumetum adható meg). Egymástól potosvesszővel elválasztott értékek helyett tömböt vagy tömbhivatkozást is haszálhatuk. Megjegyzés Az argumetumok számok, számokat tartalmazó tömbök vagy számokra mutató evek, illetve hivatkozások lehetek. A függvéy a tömbbe vagy hivatkozásba szereplő értékek közül csak a számokat haszálja, az üres cellákat, logikai értékeket, szöveget és hibaüzeeteket figyelme kívül hagyja, de a ullát tartalmazó cellákat számításba veszi. Ha bármelyik argumetum 0, akkor a HARM.KÖZÉP a #SZÁM! hibaértéket adja eredméyül. A harmoikus közép értéke midig kisebb, mit a mértai közép, ami viszot midig kisebb, mit a számtai közép. R statisztika 1/mea(1/Ar) Az Ar változó harmoikus átlaga. A reciprok értékek átlagáak reciproka

58 KÖZÉPÉRTÉKEK Súlyozott harmoikus átlag Az árbevétel és az élelmiszer árak ismeretébe számoljuk ki az értékesített élelmiszerek átlagárait. Ez egy kicsit hasolít a súlyozott számtai átlagos példára, azoba va egy léyeges külöbség. Az átlagár, még egyszer hagsúlyozzuk, egy viszoyszám, amelyet külöemű adatokból állítuk elő. A evezőbe a tömeg, potosa az eladott áruk tömege, a számlálóba az ár szerepel. Abba az esetbe, ha számlálót tekitjük súlyak a viszoyszámok átlagolásakor, súlyozott harmoikus átlagot kell számoli. A súlyozott harmoikus átlag képlete: X h = fi i=1 f i x1 i=1 i A háyados számlálója tehát az összes árbevétel. A evezője szité tört, és ez em más, mit az eladott árucikk árbevételéek és áráak háyadosa, azaz az eladott meyyiség. Az árbevétel és ár ismeretébe meghatároztuk a téyleges forgalmat. Ezek utá már egyszerű osztással kapjuk meg az áruházlác által forgalmazott élelmiszerek átlagárát. Az Excel mukalapjá súlyozott harmoikus átlagot szité két függvéy segítségével tuduk számítai. Az egyik a SZORZATÖSSZEG() a másik a SZUM() függvéy. A szorzatösszeg függvéy két adatsor szorzatáak összegét számolja ki. Súlyozott harmoikus átlagál ez a evező. A szum függvéy az adatok összegzésére szolgál. Esetükbe a súlyok összegzésére, és ez fog szerepeli a számlálóba. X h, súlyozott= SZUM ( f ) SZORZATÖSSZEG ( f ; 1/ x ) A feti példába az f az árbevételt, az x az árat jeleti. Az Excel képlete: =SZUM(I2:I848)/SZORZATÖSSZEG(I2:I848;1/F2:F848) A gyakorlati életbe a legtöbbször a súlyozott számtai és harmoikus átlaggal találkozuk. A gazdasági elemzésekbe gyakra kell itezív meyiségek átlagát képezi. Mi döti el, hogy az ilye meyiségek átlagolásakor súlyozott számtai vagy harmoikus átlagot számoljuk. Létezik egy egyszerű szabály. Mivel ezek a meyiségek háyadosok, két tagja va, a evező és számláló. Ameyibe a evezőt tekitjük súlyzó téyezőek (erről vaak adataik), akkor súlyozott számtai átlagot kell számítai. Ameyibe a számlálót tekitjük súlyak, akkor súlyozott harmoikus átlagot kell számítai. Ilyekor ez ad helyes eredméyt

59 KÖZÉPÉRTÉKEK R statisztika sum(as.umeric(arbevetel))/(sum(arbevetel/ar)) Ameyibe az eladott árucikkek árbevétele és az eladási ára ismert, akkor az átlagár meghatározásakor súlyozott harmoikus átlagot kell számítai. Az Arbevetel/Ar kifejezés valójába a forgalmi adatok meghatározását jeleti. Geometriai átlag Határozzuk meg a lácviszoyszámok átlagát. Mit jelet az így kapott mutatószám? Év VL 102,23% 102,31% 102,37% 102,43% 102,50% 102,57% 102,62% 102,68% 102,73% 102,79% 16. táblázat: Lácviszoyszámok A diamikus viszoyszám az előző időszakhoz képest mutatja a változást, a övekedést vagy csökkeést. A tárgyidőszak övekedéséek agysága függ az előző időszak agyságától. Lácviszoyszámból bázisviszoyszámot úgy kapuk, hogy a megelőző időszak lácviszoyszámait összeszorozzuk. Mivel a bázisviszoyszám felfogható matematikai egyszerűsítések, valójába az adott időszak meyiségét kapjuk meg a lácviszoyszámok összeszorzásával. A változás átlagos ütemét tehát úgy kell meghatározi, hogyha helyettesítjük vele az eredeti lácviszoyszámokat, a szorzatuk e változzo. Az ilye tulajdosággal redelkező átlagot evezzük geometriai átlagak. Mivel lácviszoyszámból eggyel kevesebb va, mit az időszakok száma, ezért -1 tag szerepel a szorzatba, és -1-dik gyököt kell voi. Lácviszoyszámok mértai átlagáak képlete: V L= 1 V L2 V L3 V L= 1 i=2 V Li A lácviszoyszámok átlaga a táblázat adatai alapjá 1,0223*1,0231*1,0237*1,0243*1,0250*1,0257*1,0262*1,0268*1,0273*1,0279=1,

60 KÖZÉPÉRTÉKEK Azaz 102,522%. Ez azt jeleti, hogy évete átlagosa 2,5%-kal ő az élelmiszer-fogyasztás. Ez hasolít a kamatos kamat fogalmához, amikor a második évbe a kamattal övelt tőke kamatozik tovább. Mértai átlag képlete: x g= x 1 x2 x A geometria átlag tulajdosága, ha helyettesítjük vele az alapadatokat a szorzat változatla marad. A gyakorlatba ez azt jelei, hogy a geometriai átlag -edik hatváya megegyezik az alapadatok szorzatával. Excel függvéy MÉRTANI.KÖZÉP(szám1;szám2;...) Szám1, szám2...: Azok a számok, amelyek mértai középértékét ki szereték számítai (legfeljebb 30 argumetum adható meg). Egymástól potosveszszővel elválasztott értékek helyett tömböt vagy tömbhivatkozást is haszálhatuk. Megjegyzés Az argumetumok számok, számokat tartalmazó tömbök vagy számokra mutató evek, illetve hivatkozások lehetek. A függvéy a tömbbe vagy hivatkozásba szereplő értékek közül csak a számokat haszálja, az üres cellákat, logikai értékeket, szöveget és hibaüzeeteket figyelme kívül hagyja, de a ullát tartalmazó cellákat számításba veszi. Ha bármelyik argumetum 0, akkor a MÉRTANI.KÖZÉP a #SZÁM! hibaértéket adja eredméyül. R statisztika prod(x)^(1/legth(x)) A prod() függvéy összeszorozza az adatokat, a ^ jel a hatváyozás jele. A legth() függvéy megadja az x-értékek számát. Súlyozott geometriai átlag Egy áruházlác forgalma az év első két hóapjába az előző havihoz viszoyítva 5%kal, a rákövetkező öt hóapba 7%-kal őtt. Az év hátralévő hóapjaiba viszot havota 8%-kal csökket. Meyi volt a változás átlagos üteme? Hogya kell értelmezi a kiszámított eredméyt? Az 5%-os övekedés azt jeleti, hogy az előző havi forgalom 1,05-szorosára ő, a 7% 1,07. A 8%-os csökkeés az előző havi forgalom 0,92-szeres változását jeleti. Ezekek az átlaga: 1,052 1,075 0,925=1, Átlagba az áruházlác forgalma havota 0,1582%-kal őtt. A változás átlagos üteme (lácviszoyszám) 100,1582% volt

61 KÖZÉPÉRTÉKEK A súlyozott geometria átlag képlete: X g= fi i=1 Ahol: : az x adatok száma fi: az x-hez tartozó időszakok száma i=1 fi xi R statisztika x=c(1.05,1.07,0.92) Lácviszoyszámok megadása és tárolása az x oszlopvektorba. h=c(2,5,5) Hóapok tárolása a h oszlopvektorba. prod(x^h)^(1/sum(h)) Súlyozott geometriai átlag, a változás átlagos üteme. Négyzetes átlag Az áruház hűtőpultjáak áramellátásával problémák voltak. Az elvégzett milliszekudumos mérések az alábbi feszültségértékeket mutatták. Határozzuk meg az effektív (téyleges) feszültséget. Téyleg az áramellátással va probléma? 39. ábra: Feszültségértékek (V) Mivel az egy másodperces mérés ezer adatot tartalmaz, helyhiáy miatt csak az adatok egy részéről készült diagramot mutatom be. A égyzetes átlag képlete: X q = x2i i=1

62 KÖZÉPÉRTÉKEK Az adatokat égyzetre kell emeli és összegezi. A égyzetösszeget el kell osztai az adatok számával és gyököt voi. A váltakozó feszültség értékei pozitív és egatív értéket veszek fel. A égyzetre emelés utá már csak pozitív értékeik leszek, ezeket kell összegezi. A feszültségértékek égyzetes átlaga 230 V körüli eredméyt ad, tehát em az áramellátással va probléma. Az Excelbe ics külö égyzetes átlag függvéy. Azoba egyéb függvéyek felhaszálásával köye készíthetük. Ehhez a gyök() és égyzetösszeg() függvéyt kell felhaszáli. Excel függvéy GYÖK(NÉGYZETÖSSZEG(adatok)/DARAB(adatok)) A égyzetes átlagot is meg lehet határozi súlyozott formába. Abba az esetbe, ha egyforma mért értékek is szerepelek az adatsorba, az előfordulásuk gyakoriságával kell súlyozi. Napjaikba eek ics agy jeletősége, hisz a tárolási kapacitás em korlátja az adattárolásak. A súlyozott égyzetes átlag meghatározásáak a szóródási mutatók számításáál lesz agy jeletősége. A súlyozott égyzetes átlag képlete: X q = k f i x 2i i=1 k fi i=1 Excel függvéy GYÖK(SZORZATÖSSZEG(súlyok; adatok^2)/szum(súlyok)) R statisztika sqrt(sum(x^2)/legth(x)) Egyszerű égyzetes átlag. Az sqrt() függvéy a égyzetgyököt jeleti. legth(x) függvéy az adatok számát adja vissza. sqrt(sum(f*x^2)/sum(f)) Súlyozott égyzetes átlag. Az f változó tartalmazza a súlyokat

63 SZÓRÓDÁSI MUTATÓK Szóródási mutatók A sokaság elemei egymástól midig külöbözek, variabilitást mutatak. E változékoyság agyságát külöböző mutatószámokkal jellemezhetjük. A mutatók az adatok egymástól, vagy valamilye középértéktől számított eltérést jellemezek. A korábba tárgyalt középértékek megbízhatósága függ az adatok szóródásától. Miél agyobb a szórás, aál bizoytalaabb az átlag sokaságot jellemző tulajdosága. Terjedelem A legegyszerűbb szóródási mutató. Az adatsor legagyobb és legkisebb értéke közötti külöbség. Jelölése: R, az agol rage kifejezés első betűje alapjá. Az adatok legagyobb igadozását jellemzi, eél agyobb szóródási érték em határozható meg egyik mutatóval sem. A terjedelem képlete: R=x max x mi Az Excel max() és mi() függvéyéek segítségével agy adatbázis eseté is köye meghatározhatjuk a terjedelmet. R statisztika R=max(x)-mi(x) Terjedelem. rage(x) Terjedelem, a legkisebb és legagyobb értéket határozza meg. Kvatilisek A kvatilisek a agyság szerit sorba redezett adatokat, gyakoriság szerit, egyelő részekre osztják, k darab osztályközre. Így az adatok helyzeti eloszlásáról kapuk képet. Sokféle kvatilis létezik, attól függőe, hogy háy egyelő részre osztjuk fel az adatsort. A leggyakrabba kettő, három, égy, öt, tíz és százfelé osztuk. Az osztópotokat mediáak (Me), tercilisek (T), kvartilisek (Q), kvitilisek (K), decilisek (D) és percetilisek (P) evezzük. Osztópotból midig k-1 létezik, tehát három kvartilis, kilec decilis és így tovább. Kvartilisek A agyság szerit redezett adatokat égy egyelő részre osztja. Így mide egyedbe az adatok 25-25%-a található. A agyság szerit sorba redezett adatokba meg kell határozi az adat ragszámát, azaz hogy háyadik a sorba. Az adott sorszámú adat értéke fogja megadi a keresett kvartilist. A kvartilisek jelölése: Q. Az értéke egytől háromig terjed

64 SZÓRÓDÁSI MUTATÓK A kvartilisek meghatározásak módja: középső kvartilis: Q = 2 3 (+ 1) felső kvartilis: Q = 4 iterkvartilis terjedelem: Qi=Q3 Q1 Q Q 1 kvartilis eltérés: Qe = 3 2 alsó kvartilis: Q = A kvartilisek tehát sorredbe az adatok 25, 50 és 75%-t jelölik. A Q 2 kvartilis egybe a mediá is, mivel az adatok 50% kisebb, mit a mediá. Az iterkvartilis terjedelem a mediá körül elhelyezkedő adatok 50% jeleti. A kvartilis eltérés eek a fele. Szimmetrikus eloszlás eseté ez jól mutatja az átlagos igadozást a mediá körül. Az iterkvartilis terjedelmet dobozak is evezik (box). A kvartilis ábra szemléletese mutatja az adatok elhelyezkedését. A statisztikai programok kiugró értékek (kör vagy csillag) jelölik a doboztól 1,5 IQRél agyobb távolságra elhelyezkedő adatokat (Q3+1,5IQR, illetve Q1-1,5IQR). Excel függvéy: KVARTILIS(tömb;kvart) A kvart értéke A KVARTILIS eredméye Miimális érték Első kvartilis (25%) Mediá (50%) Harmadik kvartilis (75%) Maximális érték Q1 páros páratla Eljárás Miitab Tukey (Hoagli et al., 1983) Moore ad McCabe (2002) Medehall ad Sicich (1955) Freud ad Perles (1987) Q3 páros páratla táblázat: Az alsó és felső kvartilisek meghatározása Az alsó (Q1) és felső (Q3) kvartilisek meghatározása em olya egyértelmű, ezért több módszer is létezik, amelyek eltérő eredméyt szolgáltatak. A legfotosabb eljárásokat a 17. táblázat foglalja össze

65 SZÓRÓDÁSI MUTATÓK A szögletes zárójel a legközelebbi egészre kerekítést jeleti a feti táblázatba. Az ismertetett eljárásokról részletesebb leírások találhatók az alábbi publikációkba: Freud, J. ad Perles, B. "A New Look at Quartiles of Ugrouped Data." America Stat. 41, , Hoagli, D.; Mosteller, F.; ad Tukey, J. (Ed.). Uderstadig Robust ad Exploratory Data Aalysis. New York: Wiley, pp. 39, 54, 62, 223, Keey, J. F. ad Keepig, E. S. "Quartiles." 3.3 i Mathematics of Statistics, Pt. 1, 3rd ed. Priceto, NJ: Va Nostrad, pp , Medehall, W. ad Sicich, T. L. Statistics for Egieerig ad the Scieces, 4th ed. Pretice-Hall, Moore, D. S. ad McCabe, G. P. Itroductio to the Practice of Statistics, 4th ed. New York: W. H. Freema, Whittaker, E. T. ad Robiso, G. The Calculus of Observatios: A Treatise o Numerical Mathematics, 4th ed. New York: Dover, pp , Az Excel a Freud-Perles eljárást haszálja az alsó és felső kvartilis meghatározására. Ebbe az eljárásba a páros és páratla adatszám eseté az algoritmus megegyezik. Ameyibe a kapott szám em egész, a legközelebbi két adat iterpolációjával határozza meg az adott kvartilist. Az SPSS program a Medehall-Sicich eljárást haszálja. Ez is iterpolációt alkalmaz, ha em egész szám jö ki, azoba az iterpoláció algoritmusa más, mit az Excelé. A leti táblázatba bemutatjuk éháy számpéldá keresztül az Excel, SPSS és R program közötti külöbséget. 1,2,3,4 1,2,3,4,5 1,2,3,4,5,6 Eljárás Q1, Q3 Q1, Q 3 Q1, Q3 Excel 1,75 3,25, 2,4 2,25, 4,75 SPSS 1,25 3,75, 1,5, 4,5 1,75, 5,25 R 1,75 3,25, 2,4 2,25, 4, táblázat: Alsó és felső kvartilisek az Excelbe, SPSS-be és R-be

66 SZÓRÓDÁSI MUTATÓK R statisztika summary(forgalom) Mi. 1st Qu. Qu. Max. Media Mea 3rd Az összesítő statisztika megadja a miimális, első kvartilis, mediá (második kvartilis), számtai átlag, harmadik kvartilis és a maximális értékeket. IQR(Forgalom) Iterkvartilis terjedelem. Q3-Q1. Percetilisek A percet a lati per cetum = százalék fogalomból ered. A agyság szerit redezett adatsort száz egyelő részre osztjuk. Az %-os (vagy -edik) percetilis azt jeleti, hogy az adatok %-a kisebb, mit az adott érték. A mediá az 50%-os percetilisek, az alsó és felső kvartilisek pedig a 25% ill. 75%-os percetilisek felelek meg. A percetilisekek óriási jeletősége va a mit tekitük ormálisak? kérdés eldötésébe. Az alsó és felső éháy percetilis közötti részt (2.5% % vagy 5% 95%) szokás ormális (referecia) értékek elfogadi. Excel függvéy: PERCENTILIS(tömb;k) tömb: Az egymáshoz viszoyítadó adatokat tartalmazó tömb vagy tartomáy. k: A százalékosztály száma a 0-1 itervallumba, a végpotokat is beleértve. Megjegyzés Ha a tömb üres vagy 8191 adatpotál többet tartalmaz, akkor a PERCENTILIS eredméye a #SZÁM! hibaérték lesz. Ha a k értéke em szám, akkor a PERCENTILIS az #ÉRTÉK! hibaértéket adja vissza. Ha k < 0 vagy k > 1, akkor a PERCENTILIS eredméye a #SZÁM! hibaérték lesz. Ha a k em az 1/( - 1) többszöröse, akkor a PERCENTILIS a k-adik százalékosztályt iterpolációval határozza meg. R statisztika quatile(forgalom, seq(0,1,0.25)) A seq() függvéybe határozhatjuk meg, hogy milye részletességű legye a kiíratás. A példába 0-tól 100%-ig, 25%-os lépésközzel kapjuk meg az eredméyeket. Százalékrag A százalékrag egy adott érték adathalmazo belüli százalékos ragját, elhelyezkedését mutatja. Pl. az alábbi teszteredméyek születtek egy vizsgá:

67 SZÓRÓDÁSI MUTATÓK 1, 1, 1, 2, 3, 4, 8, 11, 12, 13 2 százalékragja: 33,3% 8 százalékragja: 66,6% A 2 százalékragja azért 33,3%, mert három adat kisebb, mit 2, és a kettőt em számítva kilec adatuk va. 3/9 egyelő 33,3%. A yolccal ugyaez a helyzet. Hat adat kisebb, és 6/9 egyelő 66,6%. Excel függvéy SZÁZALÉKRANG(tömb;x;potosság) Tömb: Az egymáshoz viszoyítadó számadatokat tartalmazó tömb vagy tartomáy. x: Az az érték, amelyek a ragját meg kell határozi. Potosság: Az eredméyül kapott százalékérték értékes jegyeiek számát határozza meg, em kötelező megadi. Ha em adjuk meg, akkor a SZÁZALÉKRANG három tizedes jegyet haszál (0,xxx). R statisztika aa=c(1,1,1,2,3,4,8,11,12,13) # data vector percetrak <- fuctio(x) { var=sort(x) Az R programba ics előre defiiált százalékrag függvéy, azoba egy egyszerű felhaszálói függvéy segítségével köyye készíthetük ilye eljárást. p.rak=1:legth(var)/legth(var)*100 dd=cbid(var,p.rak) } pr <- percetrak(aa); pr Középeltérés Egy statisztikai sor tagjaiak a mediától mért eltéréseiek abszolút értékét (előjelek figyelme kívül hagyása mellett) összeadjuk és osztjuk a szabadságfokkal. A szabadságfok sokaság eseté megegyezik a megfigyelések számával, mita eseté a megfigyelések száma míusz eggyel. Az eltérést a mediá midkét oldalá értelmezzük. Mértékegysége megegyezik az alapadatok mértékegységével. Középeltérés képlete, egyszerű forma: d= x i Me i =1 1 Középeltérés képlete, súlyozott forma:

68 SZÓRÓDÁSI MUTATÓK f i x i Me d= i=1 f i 1 i=1 R statisztika sum(abs(forgalom-media(forgalom)))/ (legth(forgalom)-1) Egyszerű középeltérés. sum(f*abs(forgalommedia(forgalom)))/(sum(f)-1) Súlyozott középeltérés. Átlagos abszolút eltérés Egy statisztikai sor tagjaiak a számtai átlagtól vett eltéréseiek abszolút értékét (előjelek figyelme kívül hagyása mellett) összeadjuk és osztjuk a sor tagjaiak a számával. A szóródás jellemzésére kevésbé haszált mutató. Az eltérést a számtai átlag midkét oldalá értelmezzük. Mértékegysége megegyezik az alapadatok mértékegységével. Átlagos abszolút eltérés képlete, egyszerű forma: x i x d= i=1 Átlagos abszolút eltérés képlete, súlyozott forma: d= f i x i x i=1 fi i=1 Excel függvéy ÁTL.ELTÉRÉS(szám1;szám2;...) szám1, szám2...: 1 és 30 közötti számú argumetum, amelyek abszolút eltéréséek átlagát keressük. Potosvesszőkkel elválasztott argumetumok helyett egyetle tömböt vagy erre mutató hivatkozást is haszálhatuk. Megjegyzés Az argumetumok számok, számokat tartalmazó tömbök vagy számokra mutató evek, illetve hivatkozások lehetek. A függvéy a tömbbe vagy hivatkozásba szereplő értékek közül csak a számokat haszálja, az üres cellákat, logikai értékeket, szöveget és hibaüzeeteket figyelme kívül hagyja, de a ullát tartalmazó cellákat számításba veszi

69 SZÓRÓDÁSI MUTATÓK R statisztika sum(abs(forgalom-mea(forgalom)))/ (legth(forgalom)-1) Egyszerű átlagos eltérés. sum(f*abs(forgalom-mea(forgalom)))/ (sum(f)-1) Súlyozott átlagos eltérés. Szórás A szórás a leggyakrabba haszált szóródási mutató. A sokaság elméleti szórásáak jele: σ, amelyet a mitából becsülük. A mita szórását s-sel jelöljük. A szórás az adatok számtai átlagtól vett eltéréseiek égyzetes átlaga. Ez egy átlagos távolság, amit a számtai átlag két oldalá, szimmetrikusa értelmezük. A szórás mértékegysége megegyezik az adatok mértékegységével. Ez a mutató agyo érzékey a kiugró adatokra, mivel az átlagtól távol eső adatok égyzete agyo agy, így ezek agyobb súllyal alakítják a szórást. A szórás becslése törtéhet a mita és a sokaság alapjá. A mita alapjá: Egyszerű forma: s= (x i x )2 i=1 1 Súlyozott forma: s= A sokaság alapjá: f i ( x i x )2 i=1 f i 1 i=1 Egyszerű forma: s= (x i x )2 i=1 Súlyozott forma: s= f i ( x i x )2 i=1 fi i=1-64 -

70 SZÓRÓDÁSI MUTATÓK A szórások egyszerű módo em adható össze és em átlagolhatók. Az átlagolásukat később tárgyaljuk. Az alapadatokhoz ugyaazt az értéket hozzáadva vagy levova a szórás em változik. s x+ A =s x Az alapadatokat egy kostassal szorozva vagy osztva a szórás a kostas abszolút értékével változik. s Bx = B s x A szórás a feti képleteke túl a égyzetes és számtai átlag segítségével is kiszámolható. s= x 2q x 2 Excel függvéyek: SZÓRÁS(szám1;szám2;...) szám1, szám2...: A statisztikai mitát reprezetáló argumetumok, számuk 1 és 30 között lehet. Az argumetumokba potosvesszővel elválasztott értékek helyett egyetle tömb vagy tömbhivatkozás is haszálható. Megjegyzés A SZÓRÁS függvéy az argumetumokat statisztikai sokaság mitájáak tekiti. Ha az adatok a teljes sokaságot jeletik, akkor a szórást a SZÓRÁSP függvéyel kell kiszámoli. A függvéy a szórást a torzítatla vagy -1 módszerrel számítja ki. SZÓRÁSP(szám1;szám2;...) szám1, szám2...: A statisztikai sokaságot reprezetáló argumetumok, számuk 1 és 30 között lehet. Az argumetumokba potosvesszővel elválasztott értékek helyett egyetle tömb vagy tömbhivatkozás is haszálható. Megjegyzés A SZÓRÁSP az argumetumokat a teljes statisztikai sokaságak tekiti. Ha az adatok a teljes sokaság mitáját jeletik, akkor a szórást a SZÓRÁS függvéyel kell kiszámítai. Nagyméretű mitákál a SZÓRÁS és a SZÓRÁSP megközelítőleg azoos eredméy ad. 19. táblázat: Az eladott élelmiszerek forgalmáak igadozásai

71 SZÓRÓDÁSI MUTATÓK Az áruházlác adatbázis alapjá számítsuk ki az eladott élelmiszerek forgalmáak igadozását régiókét és évekét. Először készítsük egy kimutatást. A sorokba az évek, az oszlopokba a régiók legyeek. A kimutatásmező mezőstatisztikáját állítsuk át szórásra. A kimutatás a 19. táblázatba látható. A kimutatás utolsó oszlopai: 20. táblázat: A kimutatás utolsó oszlopai A szórás függvéy a mita szórását becsüli, tehát az -1 módszerrel számol. Ameyibe a sokaság egészéről redelkezük iformációval, tehát teljes körű adat-felvételezést készítük, akkor a szórásp függvéyt kell alkalmazi. Ez a függvéy az eltérés-égyzetösszeget a megfigyelések számával osztja. Nagy elemszám eseté a két függvéy közötti külöbség eleyésző. Az értelmezést kezdjük a sarokszámtól (83 927). Ez az érték az áruházlác 11 év alatt forgalmazott élelmiszer-meyiségéek igadozása. Összese 847 megfigyelt adatból lett meghatározva. A dél-alföldi végösszeg csak a régió adataiból számítódik, összese 121 adatból (11*11=121). A szórás mértékegysége megegyezik az alapadat mértékegységével. Ebbe az esetbe kg. A középérték körül átlagosa kg-mal igadozik a forgalom. A részletek megjeleítésével leelleőrizhetjük, hogy téyleg 121 adatból lett meghatározva a szórás. Ezt kétféleképpe tudjuk megcsiáli: a kimutatás eszköztáro kattitsuk a zöld kereszt ikora vagy egyszerűe az adott cellára kétszer klikkeljük. 21. táblázat: Kimutatás részlet A kimutatásba az első cella szórás adata (59 295) a fetiek értelmébe 11 adat szórása. A részletek megjeleítése látható fet

72 SZÓRÓDÁSI MUTATÓK A második feladatba számoljuk ki az átlagárak szórását. Korábba már meghatároztuk az átlagárat. Mivel ez egy viszoyszám, súlyozott számtai átlagot kellett számítai. Eek ismeretébe a szórását is súlyozott formába kell meghatározi. A súlyozott szórás számításáál az átlagtól vett eltérés, a súlyozott átlagtól vett eltérést jeleti. A szórást a gyakorlatba az alábbi képlettel sokkal egyszerűbb meghatározi: s= x x 2 = x x 1 Súlyozott formába átalakítva: 2 ( fx) fx f s= f 1 2 Ehhez az Excelbe szükségük lesz a gyök(), szorzatösszeg() és szum() függvéyre. Az áruházlác adatira alkalmazva: fx 2 = SZORZATÖSSZEG(forgalom; ár^2) 2 ( fx ) = SZORZATÖSSZEG(forgalom; ár)^2 f = SZUM(forgalom) A számítások elvégzése utá az átlagár szórása: 354,14 Ft/kg, amit a súlyozott számtai átlag midkét oldalá szimmetrikusa kell értelmezi. A számítást úgy is el lehet végezi, hogy a súlyozotta kiszámított átlagárat kivojuk az árakból, égyzetre emeljük, megszorozzuk a forgalommal mit súlyzó téyező, és szummázzuk. Így megkapjuk az eltérés-égyzetösszeget. Ezt osztva a súlyok összege míusz eggyel, megkapjuk a variaciát. Ebből gyököt vova pedig a súlyozott szórást. A kétféle számítás tökéletese azoos eredméyt ad. R statisztika sd(forgalom) A forgalom szórása mita alapjá. Variacia Variacia vagy szóráségyzet. A meghatározása az alábbiak szerit törtéik:

73 SZÓRÓDÁSI MUTATÓK Egyszerű forma: s2= ( x i x )2 i=1 1 Súlyozott forma: f i ( x i x )2 s 2 = i=1 f i 1 i=1 A variacia gyakorlati meghatározása, ami a számításokat és tárolást egyszerűbbé teszi, az alábbi: 2 s2= x x 2 = x 1 2 x 1 Ez a égyzetes és számtai átlag felhaszálásával törtéő szórásbecslésél már előfordult egyszer. Excel függvéyek: VAR(szám1;szám2;...) szám1, szám2...: A statisztikai mitát reprezetáló argumetumok, számuk 1 és 30 között lehet. Megjegyzés A VAR függvéy az argumetumokat egy statisztikai sokaság mitájáak tekiti. Ha az adatok a teljes sokaságot jeletik, akkor a variaciát a VARP függvéyel kell kiszámítai. A logikai értékeket, például IGAZ vagy HAMIS, valamit a szöveget a függvéy figyelme kívül hagyja. Ha a logikai értékeket és a szöveget is számításba szereték vei, haszáljuk a VARA mukalapfüggvéyt. VARP(szám1;szám2;...) szám1, szám2...: A statisztikai sokaságot reprezetáló argumetumok, számuk 1 és 30 között lehet. Megjegyzés A VARP az argumetumokat a teljes statisztikai sokaságak tekiti. Ha az adatok a teljes sokaságak csak mitáját képezik, akkor a variaciát a VAR függvéyel kell kiszámítai. Az áruházlác adatai alapjá a variacia meghatározása hasolóképpe törtéik, mit a szórásál, csak a mezőstatisztikába válasszuk a variacia függvéyt. Az eredméyek értelmezése hasolóa törtéik. Az variacia mértékegysége azoba az adatok eredeti mértékegységéek a égyzete. Forgalom eseté kg 2. A variacia függvéy az -1 módszerrel, a varp függvéy módszerrel számol. R statisztika var(forgalom) A forgalom variaciája

74 SZÓRÓDÁSI MUTATÓK Variációs koefficies A külöböző mértékegységű és agyságú sokaságok változékoyságát százalékba érdemes kifejezi, mert így a mértékegység eltűik. A szórás ebbe az esetbe az átlaghoz viszoyítjuk, mivel midkét mutató ugyaolya mértékegységgel redelkezik. Jelölése: Vr vagy CV. Képlete: s V r =CV = 100 x A százalékos értékeket empirikus úto kategóriákba sorolták, és verbálisa miősítették a szórás agyságát: 0 10% homogé, 10 20% közepese változékoy, 20 30% erőse változékoy, 30% fölött szélsőségese igadozó 22. táblázat: Az áruházlác forgalmáak szórása és középértéke Szélsőségese igadozó sokaság eseté az átlag em alkalmas a sokaság jellemzésére, mivel az átlag körül agyo kevés adat helyezkedik el. A variációs koefficies értéke agyobb is lehet, mit 100%, mivel a sokaság átlaga és szórása két függetle tulajdoság. Határozzuk meg az áruházlác forgalmáak variációs koefficiesét. Az előbbi kimutatást felhaszálva, ahol a szórás számítottuk ki, a variációs koefficiest is meghatározhatjuk. Ehhez még egyszer vegyük fel az adatmezőbe a forgalom változót, de e az ösz

75 SZÓRÓDÁSI MUTATÓK szegét, haem az átlagát jeleítsük meg. A variációs koefficies meghatározásához a szórásra és az átlagra lesz szükség. Az új kimutatás részlete a 22. táblázatba látható. A szórást osztva az átlaggal és szorozva százzal, megkapjuk a variációs koefficies értékét százalékba. A dél-alföldi régió évi CV-je: /49 046*100 = 120,9%. A variációs koefficies ebbe az esetbe agyobb, mit 100%. A többi régió adatát ugyaígy kell meghatározi. R statisztika Variációs koefficies. sd(forgalom)/mea(forgalom)*100 Relatív variációs koefficies Mivel a variációs koefficies 100%-ál agyobb is lehet, ezért megalkották a relatív CV fogalmát, amiek az értéke maximum 100% lehet. Az s maximuma x. Ehhez viszo- yítva a CV-t, a relatív variációs koefficies értéke em lehet agyobb, mit 100%. Relatív variációs koefficies: V r % = s / x 100 s 100= x Eek az értéke tehát 0-100%-ig terjedhet, és az mutatja, hogy a vizsgált sokaság változékoysága háy százaléka az elméletileg lehetségesek. A feti képlet csak abba az esetbe helyes, ha a szórást az -1 módszerrel határoztuk meg. Csak ebbe az esetbe igaz, hogy a variációs koefficies maximális értéke. Ameyibe a szórás számításáál -el osztuk, azaz a teljes sokaság variációs koefficiesét határozzuk meg, akkor a maximális érték 1. Ez a külöbség csak kis elemszámok eseté jeletős. Számoljuk ki az áruházlác forgalmáak relatív variációs koefficiesét. A relatív variációs koefficies meghatározásához a megfigyelések számát is ismeri kell. Bővítsük ki az előbbi kimutatást a forgalom-változó adataiak számával. Vegyük fel meg egyszer a forgalom-változót (összese így már háromszor vettük fel a forgalom-változót az adatterületre). A módosított kimutatás lett látható. A mezőstatisztikába válasszuk a darab függvéyt

76 SZÓRÓDÁSI MUTATÓK 23. táblázat: A módosított kimutatás Most már mide adat redelkezésükre áll a relatív variációs koefficies meghatározásához. Szité a dél-alföldi régió évi forgalmáak CV rel: /49 046/gyök(11)*100 = 36,5%. Ez az érték azt jeleti, hogy a maximális variabilitás közel 37%-á va a jelelegi változékoyság. R statisztika Relatív variációs együttható. sd(forgalom)/mea(forgalom) /sqrt(legth(forgalom))*100 Az átlag stadard hibája A mitákból számított számtai átlagok a sokaság valódi számtai átlagáak a becslései. Ezekek a becslésekek szité va igadozása, mit az alapadatokak. A számtai átlagok igadozása, szórása az alapadatok igadozásától függ. Miél agyobb az adatok szórása, aál agyobb az átlag szórása is. Az átlag szórását a mita elemszámaiak övelése csökketi. Miél agyobb elemszámú mitával dolgozuk, a középértékek szórása aál kisebb lesz. Az összefüggés azoba em lieáris, haem égyzetes. Ameyyibe az átlag szórását felére szereték csökketei, égyszer akkora mitára lesz szükségük. Ha tizedére, akkor százszor agyobb mitát kell veük. A középértékek szórását evezik az átlag stadard hibájáak, mivel ilye potosa tudjuk megbecsüli a sokaság valódi középértékét. Jelölése: s x. Képlete: s x= s

77 SZÓRÓDÁSI MUTATÓK A gyakorlati számításokhoz felhaszált formula: s x= 2 x x 2 = x 1 2 x 1 A stadard hibák ábrázolására szolgál az ú. kofidecia itervallum 40. ábra (error bar). A leti ábrá a piros rombusz a számtai átlagot, a függőleges fekete voalak a stadard hibát jelölik. A fekete voallal jelölt itervallumba esik a sokaság valódi számtai átlaga 68%-os valószíűséggel Átlag +-Stadard Hiba Napok 40. ábra: A stadard hiba ábrázolása Az átlag stadard hibájáak meghatározásához az előbbi táblázatba már mide adat redelkezésükre áll. Az észak-alföldi régió évi forgalmáak stadard hibája: /gyök(11) = A mértékegysége megegyezik az alapadatok mértékegységével, ebbe az esetbe kg

78 SZÓRÓDÁSI MUTATÓK R statisztika stderr <- fuctio(x) sqrt(var(x)/legth(x)) Stadard hiba függvéyéek előállítása. stderr(forgalom) A forgalom stadard hibája. library(pastecs) A pastecs csomag telepítése. Ebbe számos leíró statisztikai függvéy megtalálható. stat.desc(forgalom) Az előző csomag telepítése utá, pl. a leíró statisztikai mutatók számítása. stat.desc(x, basic=true, desc=true, orm=false, p=0.95) Leíró statisztika függvéye és paraméterei. basic Ameyibe TRUE, megkapjuk a megfigyelések számát, a ullát tartalmazó valamit a hiáyzó adatok számát. Miimum, maximum, terjedelem és az adatok összege. desc Ameyibe TRUE, mediá, átlag, az átlag stadard hibája, az átlag kofideciaitervalluma, variacia, szórás és a variációs koefficies kerül meghatározásra. orm Ameyibe TRUE, a ormáliseloszlás jellemzésére haszált paramétereket kapjuk meg: ferdeség, csúcsosság, Shapiro-Wilk teszt a ormalitás vizsgálatára, és egy másik ormalitási teszt eredméyét. p Kofideciaitervallum számításához szükséges valószíűség. Alapbeállítás Szórások átlagolása Több csoport vagy réteg esetébe szükség lehet a szórások átlagára, a csoportok közös szórására. A szórások ugyaúgy átlagolhatók, ahogya ki kell őket számoli, égyzetes átlagkét. Emlékeztetőül: a szórás az adatok átlagtól vett külöbségéek égyzetes átlaga. Ameyibe a miták elemszáma em egyezik meg, súlyozott égyzetes átlagot kell számítai: s p súly = ( 1 1 ) s 21+ ( 2 1)s (k 1) s2k k Ahol =1+2+3, k a csoportok száma

79 SZÓRÓDÁSI MUTATÓK A számítás leegyszerűsödik a súlyozatla formára, ha feltételezzük, hogy 1=2= (1 1 )( s 1+ s 2+ s 3 ) s p= s p= s p= (1 1 )( s 21+ s 22+ s 23 ) 3 (1 1) s 21 + s 22 + s 23 3 Stadard hiba átlagolása A stadard hiba ugyaúgy átlagolódik, mit a szórás, égyzetes átlagkét. s p = s2 x s 2 y s 2 z 3 Kiugró értékek A szélsőségese kicsi vagy agy értékek a szóródási mutatókat agyo torzítják, ezért midig le kell elleőrizi, hogy va-e a kiugró érték az adatbázisba. A kiugró értékeket többféleképpe is kiszűrhetjük. Az egyik legegyszerűbb módszer a trimmelt átlag kiszámítása, ami egy adathalmaz középső részéek az átlaga. Ezt úgy határozzuk meg, hogy az adathalmaz felső és alsó részéek bizoyos százalékát kihagyjuk a számításból. A trimmelés leggyakrabba 5 vagy 10%. Ameyibe a trimmelt átlag jeletőse eltér a ormális átlagtól, kiugró értékek vaak az adatbázisba. Excel függvéy RÉSZÁTLAG(tömb;százalék) tömb: Az a tömb vagy tartomáy, amelyek egy részét átlagoli kell. százalék: A számításba részt em vevő adatok százalékos aráya. Ha például százalék = 0,2 (20%), akkor a 20 adatpotot tartalmazó halmazból 4 adatpot (20 x 0,2) marad ki a középérték kiszámításáál (2 a halmaz tetejé, 2 az aljá). Megjegyzés Ha százalék < 0 vagy százalék > 1, akkor a RÉSZÁTLAG eredméye a #SZÁM! hibaérték lesz. A RÉSZÁTLAG az elhagyadó adatpotok számát lefelé kerekíti 2 legközelebbi többszörösére. Ha például százalék = 0,1 (azaz 10%), akkor 30 adatpotál hármat kellee elhagyi. A szimmetria miatt a RÉSZÁTLAG az adathalmaz tetejé és aljá egy-egy értéket fog elhagyi. A kiugró értékek kiszűréséek másik módja: az átlagtól midkét iráyba három szórás távolságál agyobb adatok elhagyása. Az iterkvartilis terjedelmet is felhaszálhatjuk a kiugró értékek felderítéséhez. Ameyibe valamelyik adat agyobb, mit a Q3+1,5*IQR vagy kisebb, mit Q11,5*IQR, akkor az kiugró értékek tekithető

80 SZÓRÓDÁSI MUTATÓK R statisztika mea(forgalom, 0.05) 5%-s trimmelt átlag. A legagyobb és legkisebb értékek 2,5-2,5%-a em vesz rész az átlagszámításba. IQR(Forgalom) Iterkvartilis terjedelem

81 KONCENTRÁCIÓ Kocetráció Herfidahl-Hirschma-idex A Herfidahl-Hirschma-idexet a közgazdaságtaba a piaci kocetráció jellemzésére haszáljuk. Jelölése: HHI. Egy adott ágazat, gazdasági szektor HHI-e a piaco található vállalatok, egységek részesedéséek (Vmi) égyzetösszege. A Herfidahl-Hirschma-idex képlete HHI = V 2mi i=1 A HHI értéke 1/ és 1 között va. 1/ értéket akkor vesz fel a mutató, ha a gazdasági szereplők egyelő piaci részesedéssel redelkezek. Ameyibe sok, egyekét kicsi piaci részesedéssel redelkező szereplő va, akkor a HHI értéke ullához közelít. Egyhez közeli érték eseté egy szereplő kezébe kocetrálódik a piaci részesedés jeletős része, ekkor beszélük moopóliumról. Ebbe az esetbe a szabad piaci versey veszélybe kerülhet. A HHI idexet ezért haszálják a külöböző állami felügyeleti szervek. A HHI matematika elmélete A piaci szereplők száma legye. A részesedésüket jelöljük Vm1, Vm2,, Vm-el. A piaci részesedések megegyezek a korábba tárgyalt megoszlási viszoyszámokkal, ezért jelöltük V-vel. Itt is a részsokaságot viszoyítottuk az egészhez. A megoszlási viszoyszámok átlaga pedig 1/ volt. Ezt az összefüggést a HHI meghatározásakor is haszosítai fogjuk. Természetese a piaci részesedések egyekéti összege egyelő 1-gyel, amit az alábbi módo írhatuk fel: V mi =1 i=1 Általáosságba a szóródási mutatók az átlagtól mért eltéréséket jellemzik, amit a távolságok égyzetes átlagával becsülük. Határozzuk meg ebbe az esetbe is a piaci részesedések átlagtól vett eltérés-égyzetösszegét. Ezt haszáljuk a variacia, ill. a szórás meghatározásakor is az első lépésbe. 2 ( V mi V mi )2 = (V mi 1 ) i=1 Ez az összeg akkor egyelő ullával, ha mide szereplő piaci részesedése az átlaggal egyelő. Ameyibe em, akkor ulláál agyobb értéket eredméyez. Erős kocetrációál közelítei fog egyhez. Végezzük el a égyzetre emelést és vizsgáljuk meg a három tagot. ( V 2mi+ 1 2V mi 2 ) Az első tag = HHI, mivel az idex a piaci részesedések égyzetösszege

82 KONCENTRÁCIÓ 1 =, mivel -szer kell összeadi egy kostast A harmadik tag: V mi, mivel V mi =1, ezért ez a kifejezés egyelő -vel. A második tag: A kocetráció teljes hiáya eseté a képletük az alábbi módo alakul: 1 2 HHI + =0 1 HHI =0 1 HHI = A feti levezetés tehát igazolja, hogy a HHI miimális értéke Eszközök összese Megevezés OTP Bak Nyrt Kereskedelmi és Hitelbak Zrt Volksbak Zrt. ERSTE BANK HUNGARY Zrt Takarékszövetkezeti MKB Bak Zrt Vagyobefektető CIB Bak Zrt Bak Zrt. Raiffeise Bak Zrt OTP Jelzálogbak Zrt Lakáskassza Lakás- UiCredit Bak Hugary Zrt Import Bak Zrt. MFB Magyar Fejlesztési Bak Zrt Lakástakarékpéztá Megevezés BUDAPEST Hitelés Fejlesztési Bak Nyrt. Eszközök összese Megevezés FHB Jelzálogbak Nyrt UiCredit Jelzálogbak Zrt. Magyarországi BURGENLAND Magyar Bak Zrt. Merkatil Váltó és Bak Zrt. FHB Kereskedelmi Commerzbak Zrt. Fudameta- takarékpéztár Zrt. Magyar ExportOTP r Zrt. KDB Bak (Magyarország) Zrt. SOPRON BANK Zrt. Magyar Cetelem 1, maximuma 1 lehet. Eszközök összese Megevezés DRB DélDuátúli Regioális Bak Zrt Kiizsi Bak Zrt Mohácsi Bak Zrt Takarék Bak Alliaz Bak Zrt Hitelgaracia Deutsche Bak Zrt Közpoti Elszámolóház és Értéktár ( Budapest ) Zrt. MagNet Magyar Közösségi Bak Zrt. Baco Popolare Hugary Bak Zrt. Porsche Bak Hugaria Zrt. Bak of Chia (Hugária) Hitelitézet Zrt. Zrt. Garatiqa Zrt.* Credige Bak GRÁNIT Bak Zrt Zrt. Hawha Bak Magyarország Baif Plus Bak Zrt Eszközök összese Zrt. Szécheyi Kereskedelmi Bak Zrt. MV-Magyar Vállalkozásfia szírozási Zrt.* táblázat. Magyarországi bakok összes eszközállomáya MFt (Forrás: PSZÁF, Arayköyv) A bakok összes eszközállomáya: millió Ft

83 KONCENTRÁCIÓ Példa: Határozzuk meg a magyarországi bakok évi piaci részesedését, az összes eszközállomáy figyelembevételével. Megevezés Piaci részesedés Megevezés OTP Bak Nyrt. FHB 20,98% Jelzálogbak Nyrt. Kereskedelmi és Hitelbak Zrt. 10,85% ERSTE BANK HUNGARY Zrt. MKB Bak Zrt. CIB Bak Zrt. Magyarországi Volksbak Zrt. Magyar 9,96% Takarékszövetk ezeti Bak Zrt. Merkatil Váltó és 9,29% Vagyobefektet ő Bak Zrt. FHB 8,38% Kereskedelmi Bak Zrt. Piaci részesedés Megevezés Piaci részesedés Megevezés Piaci részesedés UiCredit 2,85% Jelzálogbak Zrt. DRB DélDuátúli 0,46% Regioális Bak Zrt. 0,13% SOPRON BANK 1,70% BURGENLAND Zrt. 0,33% Kiizsi Bak Zrt. 0,12% Mohácsi 0,29% Takarék Bak Zrt. 0,11% Garatiqa 0,26% Hitelgaracia Zrt.* 0,11% 1,28% Magyar Cetelem Bak Zrt. 0,94% Alliaz Bak Zrt. 0,90% Deutsche Bak Zrt. 0,26% Baif Plus Bak Zrt. 0,10% Raiffeise Bak Zrt. Commerzbak 8,11% Zrt. Közpoti Elszámolóház és 0,89% Értéktár ( Budapest ) Zrt. 0,23% Credige Bak Zrt. 0,07% OTP Jelzálogbak Zrt. FudametaLakáskassza 5,66% Lakástakarékpéztár Zrt. MagNet Magyar 0,86% Közösségi Bak Zrt. 0,19% GRÁNIT Bak Zrt. 0,04% UiCredit Bak Hugary Zrt. 5,29% MFB Magyar Fejlesztési Bak Zrt. BUDAPEST Hitel- és Fejlesztési Bak Nyrt. Magyar ExportImport Bak Zrt. Baco Popolare 0,66% Hugary Bak Zrt. OTP 4,02% Lakástakarékpé ztár Zrt. 0,65% KDB Bak 3,04% (Magyarország) Zrt. Bak of Chia 0,47% (Hugária) Hitelitézet Zrt. Porsche Bak Hugaria Zrt. Hawha Bak 0,17% Magyarország Zrt. Szécheyi 0,16% Kereskedelmi Bak Zrt. MV-Magyar 0,13% Vállalkozásfia szírozási Zrt.* 0,04% 0,01% 0,01% 25. táblázat. A magyarországi bakok piaci részesedése agyság szerit redezve Határozzuk meg a HHI értékét, képezzük a piaci részesedés égyzetösszegét. Eek az értéke: 0,0982 Most el kell dötei, hogy ez az érték a kocetráció milye fokát jellemzi. A HHI miimális értéke 1/. A példába 40 bak szerepel, ezért a miimális érték 0,0250. Ez akkor lee, ha mide bak azoos piaci részesedéssel bíra. A számított érték eél agyobb, azoba em éri el a 0,1-es lélektai határt. A gyakorlatba a 0,1-es érték alatt a

84 KONCENTRÁCIÓ kocetráció hiáyáról beszélhetük. A HHI kritikus értékeit a gyakorlati alkalmazás részbe ismertetjük. A HHI külöböző változatai Sokszor a piaci részesedést em 0 és 1 közötti számmal jellemzik, haem százalékosa. Ekkor a HHI értéke em 0 és 1 között, haem 0 és között alakul. A mutatja a teljes kocetráció mértékét (100*100). Példa: Határozzuk meg az előbb kiszámított HHI-t a százalékos adatok felhaszálásával. Ameyibe jól számoltuk, 982-t kell kapi. Normalizált Herfidahl-Hirschma-idex HHI HHI '= A ormalizált HHI értéke 0 és 1 között va, elletétbe a hagyomáyos HHI-vel szembe, amiek a miimális értéke 1/. 1 0,9 0,8 0,7 HHI' 0,6 0,5 0,4 0,3 0,2 0, ,2 0,4 0,6 0,8 HHI 41. ábra. A HHI és ormalizált HHI közötti összefüggés, =40 Példa: Határozzuk meg a ormalizált HHI-t

85 KONCENTRÁCIÓ 0,0982 HHI '= Eek az értéke: 0,0751 Gyakorlati alkalmazás A moder piacgazdaságokba az állam egyik gazdasági feladata az, hogy őrködjö a piaci versey szabadsága fölött. Eek egyik eszköze az, hogy az állam felügyeleti jogkörével élve visszaszorítja a túlzott piaci föléy megszerzésére iráyuló törekvéseket. A külöböző állami felügyeleti szervek gyakra haszálják a HHI-t aak objektív mérésére, hogy egy adott piaci szektor, vagy egy esetleges cégfúzió utá létrejövő piaci helyzet em túlzotta kocetrált-e. Az Egyesült Államok Igazságügyi Miisztériumáak Verseyhivatala (Atitrust Divisio of the US Departmet of Justice) például a Herfidahl Hirschma-idex segítségével hoz dötést arról, hogy jóváhagyjo-e cégegyesüléseket. Ha a tervezett cégfúziót követőe a kérdéses piaci szektorba a HHI 0,1 alatt marad, akkor a Verseyhivatal em tekiti aggályosak az egyesülést. Másrészt ha a fúzió utái HHI 0,18 fölött va, és a HHI a cégegyesülés hatására több mit 0,01-dal övekszik, akkor az egyesüli kíváó cégekek igazoliuk kell, hogy egyéb okok miatt em várható, hogy a fúzió yomá tisztességtele előyhöz jutáak (Horizotal Merger Guidelies: Cocetratio ad Market Shares U.S. Departmet of Justice ad the Federal Trade Commissio). A HHI értékéek kritikus értéke tehát 0,1. Ez csak akkor következhet be, ha tízél több piaci szereplő va a szektorba. Magyarországo a PSZÁF és elődszervezetei valamit a Magyar Nemzeti Bak a 90-es évek óta figyelemmel kísérik a bakredszer Herfidahl Hirschma-idexét, amely az 1991-es 0,1565-ről 2002-re a 0,0986-os értékig csökket (É. Várhegyi (2004.). Bak Competitio i Hugary.Acta Oecoomica Vol. 54 (4), pp o.). Példa: Ábrázoljuk az első 10 legjeletősebb bak piaci részesedését kördiagramo. Képezzük egy egyéb kategóriát is. Becsüljük meg a HHI értékét a feti adatok birtokába. Képzeljük el, hogy egy folyóiratból csak ezek az adatok állak redelkezésükre. Az első tíz bak piaci részesedése a 25. táblázatba látható, az egyéb kategória 14,44%-t képvisel. Milye potosa lehet megbecsüli a HHI-t? Mivel becslésről va szó, egy alsó és felső értéket kell meghatározuk, ami közé fog esi a téyleges HHI. Az alsó érték becslése a 10 első bak piaci részesedése alapjá számított HHI, eek az értéke: 0,0964. A felső érték becsléséhez képzeljük el, hogy az egyéb kategória 14,44%-os részesedését számú bak adja. Eze bakok piaci részesedéséek égyzetösszege maximum 0,14442/ lehet. Mivel az egyéb kategóriába tartozó bakok midegyikéek kisebb a piaci részesedése, mit 3,04%, ezért legkisebb értéke 14,44 3,04 felfelé kerekítve 5 lehet. Ezek értelmébe az egyéb kategóriába tartozó bakok piaci részesedéséek maximális

86 KONCENTRÁCIÓ égyzetösszege 0,14442/5=0,0042 lehet. A felső érték ezek szerit 0,0964+0,0042=0,1006. A valódi HHI 0,0964 és 0,1006 között va. (a téyleges érték 0,0982) OTP Bak Nyrt. ERSTE BANK HUNGARY Zrt. CIB Bak Zrt. OTP Jelzálogbak Zrt. MFB Magyar Fejlesztési Bak Zrt. Egyéb Kereskedelmi és Hitelbak Zrt. MKB Bak Zrt. Raiffeise Bak Zrt. UiCredit Bak Hugary Zrt. BUDAPEST Hitel- és Fejlesztési Bak Nyrt. 42. ábra. A tíz legjeletősebb bak piaci részesedése Példa: Vizsgáljuk meg, hogya változik a HHI az első két bak fúziója utá. Képzeljük el, hogy az OTP és a Kereskedelmi Bak egyesül (ez csak fikció). Az így létrejött fúzió utá a HHI értéke: 0,1438. Ez már aggályos mértékű, mert meghaladja a 0,1-es értéket, és a övekedés mértéke is agyobb, mit 0,01. Ezt az egyesülést az USA-ba alaposa idokoli kellee, mert felmerülhet a tisztességtele piaci előy megszerzése. A variációs együttható és a HHI közötti összefüggés A variációs koefficies (CV) és a HHI hasoló tulajdoságot jellemez, a kettő egymásba átszámítható. Ameyibe ismerjük az egyik értékét, a másik meghatározható belőle. Az alapösszefüggés: 2 CV + 1 HHI = Matematikai elmélet Már tudjuk, hogy a HHI a piaci részesedések égyzetösszege. HHI = V 2mi i =1 A variációs koefficies a szórás és a számtai átlag háyadosa. CV = S x A megoszlási viszoyszámok szórásáak képlete: S= ( V mi 1 ) 2 Mivel a piaci részesedés átlaga: x= 1 A fetiek ismeretébe írjuk fel a piaci részesedés variációs együtthatóját:

87 KONCENTRÁCIÓ CV = ( V mi 1 ) 2 1 Végezzük el az alábbi számításokat. CV = CV 2 = ( V mi ) 2 ( 2 V mi CV = 2 1 ( 1 ) ) 2 1 V mi 2 A szummás kifejezésről már korábba bebizoyítottuk, hogy egyelő HHI-1/-el, ezért: ( 1 2 CV = HHI 1 CV 2 + 1= HHI CV 2 = HHI ) Az utolsó lépesbe megkapjuk a HHI és CV közötti összefüggés képletét. 2 HHI = CV + 1 Fotos megjegyzés a számításokhoz. Csak abba az esetbe kapuk helyes eredméyt, ha sokasági szórást haszáluk a CV meghatározásakor, azaz -el osztuk. Ebbe az esetbe a CV maximális értéke: CV max= 1 Példa: Számítsuk ki a feti adatok felhaszálásával a CV értékét, és ebből határozzuk meg a HHI-t. Először a piaci részesedés átlagát és szórását kell meghatározi. A piaci részesedés átlaga egyszerű, mert 1/40 azaz 0,025. A szórása: 0,0428. Még egyszer hagsúlyozzuk, hogy a sokasági szórást kell meghatározi, tehát -el kell osztai. A variációs koefficies tehát 1,7116, százalékba kifejezve 171%. A további számításokat e a százalékos értékkel végezzük. HHI = 1, =0, Az eredméy tökéletese megegyezik a korábba kiszámolt értékkel. A következő ábra a CV és HHI közötti összefüggést mutatja

88 KONCENTRÁCIÓ 0,3 0,25 HHI 0,2 0,15 0,1 0, ,5 1 1,5 2 2,5 3 3,5 CV 43. ábra. A variációs koefficies és a HHI közötti összefüggés, =40 R statisztika a=eszköz.állomáy Az a oszlopvektor tartalmazza a bakok összes eszköz.állomáyát. V=a/sum(a) Megoszlási viszoyszámok, azaz a piaci részesedés. HHI=sum(V^2) Herfidahl-hirschma-idex

89 INDEXEK Idexek Az idexek a gazdasági elemzésbe gyakra haszált mutatók. A statisztikai idex több eltérő tulajdoságú, gyakra eltérő mértékegységbe kifejezett jeleség együttes átlagos változásáak jellemzésére alkalmas. Segítségükkel megtudhatjuk, hogy két időszak között milye változás törtét a szolgáltatások és termékek együttes átlagos értékébe. Az idex jeletése mutató, ebbe az esetbe az értékbeli változás mutatója. Megjeleési formájuk az egyemű adatokból számított viszoyszámokkal azoos (százalékos). A külöböző termékeket és szolgáltatásokat hogya lehet összehasolítai? Erre a mezőgazdaság területé a korábbiakba aturális mutatókét a számosállat és az egységhozam fogalmát haszálták. A számosállat állatteyésztési, statisztikai valamit üzemszervezési mutató il. mértékegység, amely külöböző fajú, fajtájú, korú és ivarú állatokat közös egységre hozva, együttese fejezi ki. Egy számosállat egyelő 500 kg élőtömegű állat vagy állatcsoport. Az egységhozam a övéytermesztésbe, földművelésbe haszált fogalom. Növéyi fajtól és fajtától függetleül adja meg a termést, mitha őszi búzát termesztettük vola az adott területe. Eek érdekébe egységhozam szorzókat állapítottak meg. A legkézefekvőbb összehasolítás a termékek és szolgáltatások értékéek összehasolítása, melyet az árral mérhetük, mivel az ár a legáltaláosabb értékmérő eszköz. A termék vagy szolgáltatás elleértékét leggyakrabba pézbe kell megfizeti. A termelési érték: az árucikk meyisége (volumee) szorozva az egységárral (Ft/meyiség). A meyiség lehet db, kg, liter stb. Az idexek csoportosítása: Értékidex, Iv (v = value) Áridex, Ip (p = price) Volumeidex, Iq (q = quatity) Fisher-féle idexek Jelölések: = termékek száma q0 = bázis időszak meyisége q1 = tárgy időszak meyisége p0 = bázis időszak ára p1 = tárgy időszak ára Értékidex Az értékidex szakmai szempotból összetartozó jeleségek, legtöbbször termékek vagy termékcsoportok értékbe kifejezett összességéek (termelési értékéek) együttes átlagos változását fejezi ki. Az értékidex midig az érvéybe lévő, folyó-árako számítva fejezi ki a termelés értékéek változását. Ez azt jeleti, hogy a bázis évbe bázis árako, a tárgyidőszakba tárgyévi árako kell számoli

90 INDEXEK Az értékidex képlete: q 1 p1 I V = i=1 100 q 0 p0 i=1 Példa: Határozzuk meg az Észak-alföldi régió idexeit a időszakba. Bázis év természetese a Készítsük egy új kimutatást. Az oldalpaelbe helyezzük el a Régiót. A sorok legyeek az árucikkek, az oszlopok az évek. Az adatmezőbe vegyük fel a forgalom és ár változókat. A kimutatás beállításai párbeszédablakba töröljük az Oszlopok teljes összegei és a Sorok teljes összegei jelölőégyzeteket. Ezekre most em lesz szükségük, ráadásul az ár változó eseté ics is értelme az összegek. A dimeziók redezésével alakítsuk a leti táblázatak megfelelőe a kimutatást. R é g ió Á r u c ik k B aá C s á s z á r s z a lo a C s ir k e m e ll K a lif o r ia i p a p r ik a K eyér M a rh a h ú s Ő r ö lt k á v é P a r a d ic s o m S e r té s c o m b S z e d v ic s s o k a T r a p is t a s a jt É s z a k - A lf ö ld A d a to k Ö s s z e g / F o r g a lo m ( k g É v /é v ) Ö s s z e g / Á r ( F t/k g ) táblázat: Az idexekhez szükséges adatbázis Számítsuk ki a lehetséges égy aggregátumot. Baá C s á s z á r s z a lo a C s ir k e m e ll K a lif o r ia i p a p r ik a K eyér M a rh a h ú s Ő r ö lt k á v é P a r a d ic s o m S e r té s c o m b S z e d v ic s s o k a T r a p is ta s a jt Ö sszeg: q p0 q1p q táblázat: Az aggregátumok meghatározása Értékidex: p1 q1p

91 INDEXEK I v= =111,5 % R statisztika bf.ba=sum(forgalom[év==bazis]*ár[év= =bazis]) Aggregátumok számítása. bf=bázis időszaki forgalom, ba=bázis időszaki ár. tf.ta=sum(forgalom[év==targy]*ár[év= =targy]) tf=tárgyidőszaki forgalom, ta=tárgyidőszaki ár. bf.ta=sum(forgalom[év==bazis]*ár[év= =targy]) bf=bázis időszaki forgalom, ta=tárgyidőszaki ár. tf.ba=sum(forgalom[év==targy]*ár[év= =bazis]) tf=tárgyidőszaki forgalom, ba=bázis időszaki ár. roud(tf.ta/bf.ba*100,2) Értékidex, kerekítés kéttizedes potosságra. (roud() függvéy kerekítés). Áridex Az áridex külöféle eladott termékek átlagáraiak együttes változását mutatja meg. Az aggregátum alakító téyezők közül a meyiségeket változatlaak tekitjük. Tehát változatla meyiséget feltételezve csak az átlagárváltozás hatását mutatja meg. Az értékesített termékek átlagáráak a meghatározása súlyozott számtai átlaggal törtéik. Mivel a két időszakba az értékesített szolgáltatások és termékek meyiségei eltérek, ezért kétféle időszaki súlyozású idexet lehet meghatározi. Az egyik a bázisidőszaki, a másik a tárgyidőszaki súlyozású áridex. A bázisidőszaki súlyozású áridex képlete: 0 p q0 p1 I = i=1 100 q0 p0 i=1 A meyiségek mid a számlálóba, mid a evezőbe bázisidőszaki meyiségek. A tárgyidőszaki súlyozású áridex képlete: 1 p q1 p1 I = i=1 100 q1 p0 i=1 A meyiségek mid a számlálóba, mid a evezőbe tárgyidőszaki meyiségek. Példa

92 INDEXEK Áridex, bázisidőszaki: 0 I p= =109,5 % Áridex, tárgyidőszaki: 1 I p= =109,5 % R statisztika bf.ba=sum(forgalom[év==bazis]*ár[év= =bazis]) Aggregátumok számítása. bf=bázis időszaki forgalom, ba=bázis időszaki ár. tf.ta=sum(forgalom[év==targy]*ár[év= =targy]) tf=tárgyidőszaki forgalom, ta=tárgyidőszaki ár. bf.ta=sum(forgalom[év==bazis]*ár[év= =targy]) bf=bázis időszaki forgalom, ta=tárgyidőszaki ár. tf.ba=sum(forgalom[év==targy]*ár[év= =bazis]) tf=tárgyidőszaki forgalom, ba=bázis időszaki ár. roud(bf.ta/bf.ba*100,2) Bázisidőszaki áridex, kerekítés kéttizedes potosságra. (roud() függvéy kerekítés). roud(tf.ta/tf.ba*100,2) Tárgyidőszaki áridex, kerekítés kéttizedes potosságra. (roud() függvéy kerekítés). Volumeidex A volumeidex a külöböző termékek meyiségi változásáak hatására bekövetkező értékbeli változást fejezi ki. A meyiség hatása az értékbeli változásra olya feltételezéssel mutatható ki, ha az aggregátumokba az értékalakító téyezők közül az árak változatlaok. A volumeidex tehát em az átlagos meyiségi változást mutatja, mivel a meyiség hatással va az értékesített termékek átlagárára is. Ez az átlagár a súlyozott számtai átlagál bemutatott módszer szerit alakul. A meyiség változása tehát az értékbeli változásra kétszerese is hat. A bázisidőszaki súlyozású volumeidex képlete: q1 p0 I 0q= i=1 q0 p0 i=

93 INDEXEK A tárgyidőszaki súlyozású volumeidex képlete: 1 q q1 p1 I = i=1 100 q0 p1 i=1 Példa: Volumeidex, bázisidőszaki: I 0q= =101,8 % Volumeidex, tárgyidőszaki: 1 I q= =101,9 % R statisztika bf.ba=sum(forgalom[év==bazis]*ár[év= =bazis]) Aggregátumok számítása. bf=bázis időszaki forgalom, ba=bázis időszaki ár. tf.ta=sum(forgalom[év==targy]*ár[év= =targy]) tf=tárgyidőszaki forgalom, ta=tárgyidőszaki ár. bf.ta=sum(forgalom[év==bazis]*ár[év= =targy]) bf=bázis időszaki forgalom, ta=tárgyidőszaki ár. tf.ba=sum(forgalom[év==targy]*ár[év= =bazis]) tf=tárgyidőszaki forgalom, ba=bázis időszaki ár. roud(tf.ba/bf.ba*100,2) Bázisidőszaki volumeidex, kerekítés kéttizedes potosságra. (roud() függvéy kerekítés). roud(tf.ta/bf.ta*100,2) Tárgyidőszaki volumeidex, kerekítés kéttizedes potosságra. (roud() függvéy kerekítés). A bázisidőszaki súlyozású idexet Erst Louis Étiee LASPEYRES ( ) vezette be, ezért a felső idexbe a ulla helyett L betűvel is jelölik az ilye idexeket. I Lp vagy I Lq

94 INDEXEK 44. ábra: Erst Louis Étiee LASPEYRES ( ) A tárgyidőszaki súlyozású idexeket Herma PAASCHE ( ) vezette be, ezért a felső idexbe az egyes helyett P betűvel is jelölik az ilye idexeket. I Pp vagy I Pq. 45. ábra: Herma PAASCHE ( ) Az érték-, ár- és volumeidexek összefüggek egymással. Az értékidexek meghatározhatók az ár- és volumeidex ismeretébe. I v =I 0q I 1p

95 INDEXEK I v =I 1q I 0p Példa: Az idexek meghatározása utá végezzük el az ismert összefüggések alapjá az elleőrzéseket: I v = I 0p I 1q =1,095 1,019=1, =111,51 % I v = I 1p I 0q =1,095 1,018=1, =111,51 % Fisher-féle idexek A kétféle időszaki súlyozással számított idexek értéke eltér egymástól, ezért idokolt az átlaguk meghatározása. Mivel az idexek viszoyszámok, ezért az átlagoláskor mértai átlagot kell számítai. Ezt először Fisher ajálotta, ezért Fisher-féle idexekek evezik őket. A Fisher-féle áridex: I Fp = I 0p I 1p A Fisher-féle volumeidex: I Fq = I 0q I 1q Az értékidexet megkapjuk, ha összeszorozzuk az ár- és volumeidexet. I v =I Fq I Fp A Fisher-féle idexek egyértelműe fejezik ki az ár és meyiség módosító hatását az értékbeli változásra. Példa: Fisher-féle áridex: I p = 109,5 109,5=109,5 % F Fisher-féle volumeidex: I q = 101,8 101,9=101,83 % F Értékidex: I v = 109,5 101,83=111,5 %

96 A NORMÁLIS ELOSZLÁS MINT MODELL A ormális eloszlás mit modell A matematikai statisztika egyik feladata, hogy, reprezetatív mitavétel alapjá, a sokaság jellemző paramétereit megbecsülje. A potos becsléshez azoba ismeri kell a sokaság tulajdoságát, azt, hogy hogya viselkedik. Mivel a sokaságot direkt módo em tudjuk megvizsgáli, csak a miták alapjá következtethetük rá. Ilyekor elképzeljük, hogya működhet. Készítük egy modellt, és eek a viselkedése alapjá előrejelzéseket teszük, és összehasolítjuk a kísérletbe kapott eredméyekkel. Ameyibe a mérési eredméyek igazolják a modell becsléseit, a modell jó. Mi tehát a modell? Összetett, boyolult természeti objektumok működéséek megismerésére létrehozott egyszerűsített helyettesítő eszköz. Sokféle modellforma létezik. A statisztikába a matematikai modelleket haszáljuk, amit a modellek királyáak is evezhetük. Ezek a modellek a matematika formayelvé vaak megfogalmazva, gyakra függvéy formájába. Vegyük egy egyszerű példát, a dobókockát. Feltételezzük, hogy egy szabályos hatoldalú kockával dobuk 300-szor. Milye eredméyt kapuk? 1-től 6-ig fordulak elő a számok, és elméletileg mide szám előfordulási valószíűsége 1/6. Ezzel az egyszerű modellel megjósolhatjuk a dobások eredméyét. Háromszáz dobás utá tehát darab 1, 2, 3, 4, 5 és 6-ost kell kapi. Elméletileg! Végezzük el a gyakorlatba, és az eredméyt ábrázoljuk egy oszlopdiagramo. Az alábbi eredméyt kaptuk. 46. ábra: Egy dobókocka dobásaiak eredméye Természetese a kísérlet eredméye em egyezik meg tökéletese a modell által becsült értékekkel, de em is tér el tőle jeletőse. A modell által előre jelzett értékek körül igadozik. Hogya? Midegyik felette vagy alatta va? Nem, az egyik alatta, a másik felette. Va valamilye szabályosság az igadozásba? Nics. Azt is modhatjuk, hogy az

97 A NORMÁLIS ELOSZLÁS MINT MODELL igadozás véletleszerű, em lehet potosa előre jelezi a mértékét. Csak azt tudjuk megmodai, hogy milye valószíűséggel vesz fel egy bizoyos értéket. Lesz egy határozatlasági tartomáy, amit em tuduk ullára csökketei. Egyetle kockával kísérleteztük, és megállapítottuk, hogy dobások eredméye egyeletes eloszlást követ, mivel a lehetséges eseméyek valószíűsége egyforma. Vegyük hat dobókockát, tegyük bele egy pohárba, és dobjuk velük háromszázszor, és jegyezzük fel a kockák összegét. Vajo most mik a lehetséges eseméyek? A hat kocka legkisebb összege hat, a legagyobb harmichat. E két érték között bármelyik előfordulhat. Most ezek a lehetséges eseméyek. Milye valószíűséggel? Ezek valószíűségei is egyelők? Végezzük el a kísérletet és szité készítsük egy oszlopdiagramot. Az eredméy teljese máskét éz ki, mit az előbb. A közepé gyakrabba fordulak elő értékek, és a két széle felé haladva egyre ritkábba. Eek az oka, hogy a kis és agy értékeket kevés számú variációból lehet előállítai. Pl. hatot csak egyféleképpe tuduk dobi. Mide kockáak egyest kell mutati. Eek a valószíűsége elég kicsi, 1/6 a hatodiko. A harmichattal ugyaez a helyzet. A legtöbb variációval a 21 összeg állítható elő. Hat dobókocka összegéek alakulásába egy dobókocka már kisebb súllyal vesz részt. Miél több téyező, miél kisebb súllyal alakít egy jeleséget, aál ikább hasolít a 48. ábrára. 47. ábra: Hat dobókocka dobásaiak eredméye A következő ábra a hat dobókocka variációiak számát mutatja

98 A NORMÁLIS ELOSZLÁS MINT MODELL 48. ábra: Hat dobókocka variációiak száma Ez egy szép szimmetrikus eloszlás, a 21-s érték körül jobbra-balra megegyezek az értékek. Ez már agyo hasolít a Gauss-féle haraggörbére, ami a ormális eloszlás sűrűségfüggvéye. 49. ábra: Abraham de Moivre ( )

99 A NORMÁLIS ELOSZLÁS MINT MODELL A ormális eloszlás görbéjét először egy fracia matematikus, Abraham de Moivre fedezte fel és közölte le 1733-ba. A ormális eloszlást tudomáyosa két matematikuscsillagász, a fracia Pierre-Simo Laplace és a émet Carl Friedrich Gauss alapozta meg. Többe úgy vélik, hogy Laplace hozzájárulása a ormális eloszlás tulajdoságaiak tisztázásához jeletősebb volt, mit Gaussé, mégis Gauss utá evezték el a ormális eloszlást Gauss eloszlásak, miutá Gauss volt az első, aki a ormális eloszlást égitestek mozgására alkalmazta. 50. ábra: Pierre-Simo Laplace ( ) A természetbe agyo sok mért paraméter ormális eloszlással írható le, mit például az egyéek magassága, véryomása, súlya, stb. Ez a modell jól leírja a mérési értékekek a középérték (várható érték) körüli szóródását. A ormális elevezés arra utal, hogy a mért adataiktól ezt várjuk, mert ez a természetes viselkedésük. Mit említettük, a matematikai modelleket gyakra függvéy formájába adják meg. A ormális eloszlás sűrűségfüggvéye: 1 f ( x) e 2 x 2 ahol π: 3,14 e: természetes alapú logaritmus alapja, 2, x: a vizsgált érték μ: a sokaság valódi számtai átlaga

100 A NORMÁLIS ELOSZLÁS MINT MODELL 51. ábra: Carl Friedrich Gauss ( ) 52. ábra: A ormális eloszlás sűrűségfüggvéye

101 A NORMÁLIS ELOSZLÁS MINT MODELL Az 52. ábra egy 50 cm várhatóértékű sütőtök sűrűségfüggvéyét mutatja. Az ábrá jól látható, hogy az átlagál jóval kisebb vagy agyobb sütőtökök előfordulási valószíűsége egyre kisebb és kisebb. Becslésre azoba em ez, haem az itegrált alakja alkalmas, amelyet eloszlás függvéyek evezük. A ormális eloszlás eloszlásfüggvéye: x 1 F( x )= e σ 2π ( x μ )2 2σ2 dx 53. ábra: A ormális eloszlás eloszlásfüggvéye Az eloszlásfüggvéy megadja, hogy egy adott x értékél kisebb értékek előfordulásáak mekkora a valószíűsége. A feti ábrá az 50-él kisebb értékek előfordulási valószíűsége 0,5. Valószíűleg ez lehet a mediá, mivel a mediá egyik tulajdosága, hogy a megfigyelések fele kisebb, mit a mediá. A ormális eloszlás jelölése: N(μ, σ) Eek az eloszlásak két paramétere va, a mű a sokaság középértéke, számtai átlaga és szigma a sokaság szórása. A két paraméter függetle egymástól. Ameyibe valamilye összefüggés léteze közöttük, akkor elég lee csak egy paraméter. A mű értékét a matematika köyvek várható értékek evezik. A középérték és szórás mértékegységgel redelkezik, mely megegyezik az alapadatok mértékegységével. Normális eloszlású sokaságál a várhatóérték a mediá és a módusz megegyezik. Ezért lehetséges a várhatóértéket a mediá és módusz tulajdoságaival felruházi. Nem szimmetrikus, pl. jobbra vagy balra ferde eloszlás eseté a várhatóérték, mediá és módusz három külöböző érték, ezért a számtai átlag em redelkezik a mediá és módusz tulajdosá- 96 -

102 A NORMÁLIS ELOSZLÁS MINT MODELL gaival. Sokszor itt szoktak visszaéli a statisztikával, és olya dolgokat állítaak az átlagról, amely em igaz. Külöböző tulajdoságú jeleségek összehasolításakor azoba jó lee, ha a mértékegységek és agyságredek megegyezéek, és a külöbségek em ezekből adódáak. Hogya lehete stadardizáli az adatokat? Erre a statisztikába az alábbi eljárást alkalmazzák: x zi i A képlet számlálójába egy skála-eltolás szerepel. Mide egyes mérési adatból kivojuk a számtai átlagot. Ameyibe em ismerjük a sokaság téyleges középértékét, akkor a mitából becsült értéket haszáljuk. Ezzel az eljárással a stadardizált értékek várható értéke ulla lesz. Miért? Mert a számtai átlagtól vett eltérések összege ulla, ha a jeleség ormális eloszlású. A evezőbe skála traszformáció törtéik. Az előző külöbséget elosztjuk a szórással. Ameyibe em ismerjük a sokaság valódi szórását, akkor ezt is a mitából becsüljük. Ezzel az eljárással a stadardizált értékek szórása egy lesz. Tehát a z-értékek várható értéke ulla, szórása pedig egy lesz. A stadardizált értékekek ics mértékegysége. A stadardizálás sorá a mita eredeti jellemzői em változak, csak uiformizálódak. Ezek az értékek szité ormális eloszlásúak, és stadard ormális eloszlásak evezzük. Jelölése: N(0, 1) Ezt az eloszlást haszáljuk a statisztikába a külöböző eljárások és tesztek sorá. A stadard ormális eloszlás sűrűségfüggvéye: 2 x 1 ( x ) e

103 A NORMÁLIS ELOSZLÁS MINT MODELL 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0, ábra. A stadard ormál-eloszlás sűrűségfüggvéye: A maximuma: 1 2, ami egybe a számtai átlag, a mediá és a módusz is. A stadard ormális-eloszlás szimmetrikus. Differeciálással meggyőződhetük róla, hogy az f(x) függvéyek két iflexiós potja va, mégpedig a µ - σ és µ + σ helyeke. Normális eloszláscsaládba tartozó függvéyek alakja hasoló, egyik a másikba átszámolható, az x tegely meti elhelyezkedésüket a µ, a szélességét pedig a σ paraméter határozza meg. A µ változtatása a Gauss görbe eltolását jeleti az x tegely meté. A σ (szigma) megváltoztatása a görbe laposságát befolyásolja, miél agyobb a σ, aál laposabb és szélesebb a görbe. Mide esetbe, (így a σ megváltoztatásáál is) a görbe alatti terület midig egyforma, 1-gyel egyelő, a biztos eseméy valószíűségét adja meg. A sűrűségfüggvéy kumulálásával (itegrálásával) kapjuk az eloszlásfüggvéyt. Valójába a statisztikai tesztekbe ezt haszáljuk a valószíűségek meghatározásakor. A stadard ormális eloszlás eloszlásfüggvéye: ( x) x e x2 2 dx

104 A NORMÁLIS ELOSZLÁS MINT MODELL 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0, ábra: A stadard ormális eloszlás eloszlásfüggvéye Az eloszlásfüggvéyről leolvashatjuk egy adott x értékél kisebb értékek előfordulási valószíűségét (x-től balra eső értékek). A hipotézisvizsgálatokba leggyakrabba kétoldali szimmetrikus feltételezéssel élük, ezért egy adott tartomáyba esés valószíűségét kell meghatározi. Az itegrálási szabályokak megfelelőe a agyobbik érték valószíűségéből kivojuk a kisebbik érték valószíűségét. Mi aak a valószíűsége, hogy egy stadard ormális eloszlású változó -1 és 1 közötti értéket vegye fel? Az 1-él kisebb értékek előfordulási valószíűsége 84%. A -1-él kisebb értékek előfordulási valószíűsége 16%. A kettő külöbsége 68%. Ezek szerit a középérték körül egy szórásyi távolságra az adatok 68%, durva közelítéssel 2/3-a található. Mide három megfigyelésből kettő ide esik. 1 0,84 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,16 0,2 0, ábra: Egy szórásyi távolság a középérték körül

105 A NORMÁLIS ELOSZLÁS MINT MODELL A ormális eloszlás evezetes értékei: Megbízhatóság % z , ,58 99,9 3,29 A feti táblázatba a z értékét a számtai átlag körül két oldalo szimmetrikusa kell értelmezi, jelölése: μ ± z. Miél agyobbra öveljük az átlag körüli itervallumot, aál agyobb a valószíűsége, hogy a megfigyelés beleesik. Példa: Számoljuk ki, hogy mi a valószíűsége aak, hogy kg-ál kisebb értéket mérük egy kg várható értékű, 552 kg szórású ormál-eloszlású sokaságba. Az első lépésbe stadardizáli kell az adatokat. Ezt a MS Excel programba a ormalizálás függvéyel tudjuk megtei. NORMALIZÁLÁS(1081;1500;552) ez em más mit a zi=( )/552=-0, Mi a valószíűsége, hogy egy stadard ormális eloszlású sokaságba eél kisebb értéket kapjuk? Ezt az Excelbe a stormeloszl() függvéyel tudjuk meghatározi. STNORMELOSZL(-0,75906)=0,22391 Megközelítőe tehát 22% a valószíűsége, hogy eél kisebb értéket kapuk. Mi a valószíűsége, hogy eél agyobbat? 100%-22%=78%. A ormális eloszlás modellükkel becsülhetjük a jövőbeli eseméyek valószíűségét. Ez a tudomáy egyik legfotosabb feladata. A modell jóságáak elleőrzése kísérlettel törtéik, amit ebbe az esetbe tágabba kell értelmezi. Ez a kísérlet lehet megfigyelés vagy téyleges, elleőrzött körülméyek között végrehajtott kísérlet. Ameyibe a kísérlet igazolja becsléseket, a modell jó. Ha em, akkor újabb modellt kell választai vagy készítei. A ormális eloszlás alapvető összefüggései: x F( x )= f (x ) dx Az eloszlásfüggvéy az x és míusz végtele tartomáyba esés valószíűségét adja meg. + F( x )= f (x ) dx=1 A plusz-míusz végtele tartomáyba esés valószíűsége 1, azaz 100%. lim F( x )=0 x Ameyibe az x érték tart a míusz végtelebe, az előfordulás valószíűsége tart a ullához

106 A NORMÁLIS ELOSZLÁS MINT MODELL lim F( x )=1 x + Ameyibe az x érték tart a plusz végtelebe, az eél kisebb értékek előfordulási valószíűsége tart az egyhez. A ormális eloszlás jellemzésére mutatószámokat haszáluk. Az egyik a ferdeség (skewess), a másik a csúcsosság (kurtosis) mutatója. A ferdeség meghatározása: β 1= 1 2 i=1 x i x s 3 Ez az aszimmetria mérőszáma. Értéke míusz és plusz tartomáyba eshet. Nulla eseté az eloszlás szimmetrikus. Ilye a ormális eloszlás. Ebbe az esetbe a mediá, módusz és a számtai átlag megegyezik. Amikor a módusz a mediá baloldalára csúszik, az eloszlásak hosszú jobboldali része, farka lesz (right tail), ekkor jobbra ferde az eloszlás, ilyekor pozitív ferdeséggel redelkezik. Amikor a mediá jobb oldalára kerül a módusz, baloldalo lesz hosszú farka az eloszlásak, ilyekor egatív ferdeségről beszélük, balra ferdül az eloszlás. Ameyibe a ferdeség értéke agyobb, mit egy, az eloszlás em ormál. A ferdeség stadard hibáját is érdemes meghatározi. Abba az esetbe, ha a ferdeség értéke meghaladja a stadard hiba kétszeresét, akkor az eloszlás szigifikása em szimmetrikus. Léyegébe a ferdeség megítélése a módusz alapjá a legegyszerűbb. Meg kell vizsgáli, hogy a módusz a mediá melyik oldalára kerül. Amelyik oldalo található, a másik oldalo ferde az eloszlás. Az aszimmetriát egyéb mutatóval is mérhetjük, ilyeek az: aszimmetria háyados, Pearso-féle mutató, Bowley-mutató és az F-mutató. 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0, ábra: Pozitív ferdeség, jobbra ferde eloszlás

107 A NORMÁLIS ELOSZLÁS MINT MODELL Az adatok középpot körüli csoportosulását a csúcsossági mutatóval (kurtosis) mérhetjük. Ez az elevezés megtévesztő, mert valójába em a csúcsosságot, haem a ormális eloszlás alakját jellemzi. Ezért jobb, ha a kurtózis kifejezést haszáljuk, és em a félreértelmezett csúcsosságot. Normál eloszlás eseté az értéke eek is ulla. A kurtózis pozitív értéke azt mutatja, hogy az adatok keskeyebb csoportba helyezkedek el, a módusz jobba kiemelkedik, mit a ormális eloszlásál. Negatív kurtózis esetébe szélesebb csoportba helyezkedek el az adatok, a módusz közelebb kerül az x-tegelyhez, az eloszlás két farka vastag lesz. Az 58. ábra két ormális eloszlást mutat. A kék eloszlás szórása agyobb, az adatok szélesebb csoportba helyezkedek el. Eek elleére a két eloszlás kurtózis értéke ulla, mivel midkettő ormális eloszlású. 0,7 0,6 0,5 0,4 lapos csúcsos 0,3 0,2 0, ábra: Két ormális eloszlás lapos és csúcsos eloszlás, a kurtózis=0 midkettőél { A kurtózis képlete: } x i x 1 β 2= i=1 s A kurtózis értékek értelmezése: ulla eseté ormális eloszlású a sokaság, pozitív érték eseté a módusz jobba kiemelkedik, mit a ormális eloszlásál, egatív érték eseté a módusz közelebb kerül az x-tegelyhez, mit ormális eloszlás eseté. Statisztikailag igazolt (szigifikás) eltérés: a kurtózis értéke meghaladja a stadard hibájáak kétszeresét. Egy sokaság eloszlásáak megállapításához illeszkedésvizsgálatot kell végezi. Eek a léyege, hogy az elméleti és tapasztalati gyakoriság meyire hasolít egymásra. Ilyekor feltételezzük, hogy a kettő tökéletese megegyezik (H 0). Ameyibe ezt em tudjuk megerősítei a statisztikai teszttel, akkor az eloszlás em ormális, ill. az általuk

108 A NORMÁLIS ELOSZLÁS MINT MODELL elképzelt eloszlástól jeletős mértékbe eltér. Az egyik leggyakrabba haszált umerikus módszer a Kolmogorov-Smirov teszt. Ezt a tesztet az R programcsomag segítségével tudjuk elvégezi. R statisztika ks.test(x, porm, mea(x), sd(x)) Kolmogorov-Smirov teszt. X a vizsgált valószíűségi változó. porm a ormális eloszlás eloszlásfüggvéye, mea() a mitából becsült számtai átlag, sd() a mitából számolt szórás. Ezek a ormális eloszlás paraméterei. data: residuals(model) D = 0.033, p-value = alterative hypothesis: two-sided 28. táblázat:a Kolmogorov-Smirov teszt eredméye data: a valószíűségi változó, alapadatok, D: a teszt statisztikája, p-value: az elsőfajú hiba elkövetéséek valószíűsége, az alteratív hipotézis kétoldali. Az elsőfajú hiba valószíűsége (0,6743*100%) jócská meghaladja a 10%-t, ezért ebbe a példába a vizsgált sokaság ormális eloszlásúak tekithető. Az elsőfajú hibáról és a hipotézis vizsgálatokról a 120. oldalo kezdődő Hipotéziselmélet fejezetbe lesz részletese szó. Egyéb ormalitásvizsgálat is létezik, pl. Shapiro-Wilk teszt. Ez kis elemszám, kevesebb, mit 50 eseté jobba haszálható, mit a Kolmogorov-Smirov. R statisztika Shapiro-Wilk teszt. x a vizsgált valószíűségi változó. shapiro.test(x) Shapiro-Wilk ormality test data: residuals(model) W = 0.991, p-value = táblázat:a Shapiro-Wilk teszt eredméye data: a valószíűségi változó, alapadatok, W: a teszt statisztikája, p-value: az elsőfajú hiba elkövetéséek valószíűsége, az alteratív hipotézis kétoldali. Az elsőfajú hiba valószíűsége (0,00509*100%), ez sokkal kisebb, mit 10%, ezért ebbe a példába a vizsgált sokaság em tekithető ormális eloszlásúak

109 A NORMÁLIS ELOSZLÁS MINT MODELL 59. ábra:qq ábra az R statisztikai programcsomaggal Grafikus ormalitás vizsgálatokál az elméleti és tapasztalati értékeket ábrázoljuk egy koordiáta redszerbe. Az x-tegelye a megfigyelt, az y-tegelye az elméleti értékek láthatók. A Q-Q diagram a megfigyelt értékek függvéyébe mutatja az elméleti, potosabba a stadardizált elméleti értékeket. Ahol az y-érték egyelő ullával, ott va a megfigyelt értékek számtai átlaga. A zöld átlós voal mutatja a tökéletes illeszkedést, a körök az elméleti értékeket. Miél jobba az átlós voalo helyezkedek el, aál tökéletesebb az illeszkedés. Természetese tökéletes illeszkedést e várjuk. A ormális eloszlásról taultakat a 60. ábra foglalja össze. Az ábra a z-érték függvéyébe mutatja az előfordulás valószíűségét

110 A NORMÁLIS ELOSZLÁS MINT MODELL 0,45 0,4 0,35 0,3 0,25 0,2 0,15 34,1% 0,1 34,1% 13,6% 13,6% 0, ábra: A stadard ormális eloszlás összefoglalása Excel függvéyek: NORM.ELOSZL(x;középérték;szórás;eloszlásfv) X: Az az érték, amelyél az eloszlást ki kell számítai. Középérték: Az eloszlás középértéke (várható értéke). Szórás: Az eloszlás szórása. Eloszlásfv: Logikai érték. Ha értéke IGAZ, akkor a NORM.ELOSZL függvéy az eloszlásfüggvéy értékét számítja ki, ha értéke HAMIS, akkor a sűrűségfüggvéyét. Példa Ábrázoljuk az alábbi jellemzőkkel redelkező mitát. Tételezzük fel, hogy ormális eloszlású. Jellemző értékek: átlag 100 kg, szórás 10 kg. Ehhez az Excel táblázatkezelő programba a NORM.ELOSZL(x;100;10;hamis) függvéyt kell választai. Az 61. ábra a sűrűségfüggvéyt, az 62. ábra az eloszlásfüggvéyt mutatja. Az 62. ábra segítségével gyakorlati problémákat oldhatuk meg, pl.: Mi a valószíűsége, hogy 80 kg-ál kisebb lesz a következő véletleül kiválasztott mitaelem? Húzzuk egy függőleges voalt 80-ál, és ahol metszi a aracs szíű görbét olvassuk le az y-tegely értékét. Ez adja meg a kérdésre a választ. A valószíűség közelítőe 2%. Mit jelet ez? Azt, hogy száz próbálkozásból várhatóa kétszer kapuk kisebbet, mit 80. Az 62. ábrát itervallumbecslésre is haszálhatjuk. Ilyekor a agyobb érték valószíűségéből le kell voi a kisebb érték valószíűségét

111 A NORMÁLIS ELOSZLÁS MINT MODELL ábra: NORM.ELOSZL(x;100;10;igaz) ábra: NORM.ELOSZL(x;100;10;hamis) Excel függvéyek: INVERZ.NORM(valószíűség;középérték;szórás) Valószíűség: A stadard ormális eloszláshoz tartozó valószíűség. Középérték: Az eloszlás középértéke (várható értéke). Szórás: Az eloszlás szórása. Megjegyzés Ha bármelyik argumetum értéke em szám, akkor az INVERZ.NORM az #ÉRTÉK! hibaértéket adja vissza

112 A NORMÁLIS ELOSZLÁS MINT MODELL Ha valószíűség < 0 vagy valószíűség > 1, akkor az INVERZ.NORM eredméye a #SZÁM! hibaérték lesz. Ha szórás 0, akkor az INVERZ.NORM a #SZÁM! hibaértéket adja eredméyül. Az INVERZ.NORM a stadard ormális eloszlást haszálja, ha középérték = 0 és szórás = 1 (lásd INVERZ.STNORM). STNORMELOSZL(z) Z: Az az érték, amelyél az eloszlást ki kell számítai. Megjegyzés Ha a z argumetum értéke em szám, akkor a STNORMELOSZL az #ÉRTÉK! hibaértéket adja eredméyül. INVERZ.STNORM(valószíűség) Valószíűség: A stadard ormális eloszláshoz tartozó valószíűség. Megjegyzés Ha a valószíűség értéke em szám, akkor az INVERZ.STNORM az #ÉRTÉK! hibaértéket adja eredméyül. Ha valószíűség < 0 vagy valószíűség > 1, akkor az INVERZ.NORM eredméye a #SZÁM! hibaérték lesz. Az INVERZ.STNORM függvéy adott valószíűségértékkel olya z értéket keres, amelyél STNORMELOSZL(z) = valószíűség. Így az INVERZ.STNORM potossága függ az STNORM.ELOSZL potosságától. Az INVERZ.STNORM függvéy iterációs keresési eljárást alkalmaz. Ameyibe a keresés em kovergál 100 lépés utá, a függvéy #HIÁNYZIK hibaértékkel tér vissza. R statisztika dorm(x, mea=0, sd=1, log=false Normáliseloszlás sűrűségfüggvéye. A példába stadard ormál-eloszlás. mea=számtai átlag, sd=szórás. log=logaritmus porm(x, mea=0, sd=1, lower.tail=true, log.p=false) Normáliseloszlás eloszlásfüggvéye. A példába stadard ormál-eloszlás.lower.tail=true az eloszlás baloldalát határozza meg.p[x<=x]. qorm(p, mea=0, sd=1, lower.tail=true, log.p=false) Iverz ormáliseloszlás. Az adott p valószíűséghez tartozó z-érték meghatározása. rorm(, mea=0, sd=1) Normáliseloszlású véletleszám-geerátor. =véletleszámok száma

113 KONFIDENCIAINTERVALLUM Kofideciaitervallum Mivel a természetbe a jeleségek em veszek fel midig potosa ugyaolya értéket (sztochasztikus jeleségek), ezért érdemes meghatározi azt a tartomáyt, ahová bizoyos valószíűséggel esek. Ez a bizoytalaság a fizikába határozatlasági elvkét ismert. A statisztikába is az értékek egy átlag körül igadozak. A következő kísérletbe em tudjuk potosa előrejelezi, hogy milye értéket fog felvei, csak azt tudjuk meghatározi, korábbi tapasztalataik alapjá, hogy milye valószíűséggel esik egy bizoyos tartomáyba. E határozatlasági elv gyakorlati alkalmazása apjaikba az elektroikába és számítástechikába csúcsosodik ki. Ezek a statisztikus fizika kézzelfogható eredméyei. A potbecslés tehát em járható út, ezért át kell téri a itervallumbecslésre. A statisztikába az alapsokaság ismeretle jellemzőiek (paraméterek) valódi értékeit a mitából becsüljük, ezért ezek a becsült jellemzők is valószíűségi változók, az értékük mitáról-mitára változik. Ilye jellemző pl. a relatív gyakoriság, számtai átlag, szórás, stb. Azt a tartomáyt amibe adott valószíűség mellett megtaláljuk a sokaság jellemzőiek valódi értékeit (számtai átlag, szórás, relatív gyakoriság, stb.) kofideciaitervallumak evezzük. Az eljárás sorá meghatározzuk a becsült paraméter alsó és felső korlátját. A kofideciaitervallumot megbízhatósági tartomáyak is hívják, ezért a továbbiakba a két fogalmat szioimkét fogjuk haszáli. A relatív gyakoriság kofideciaitervalluma Vegyük a legegyszerűbb példát, amikor egy eseméyek csak két kimeetele lehet. Például a emek. Vagy ő, vagy férfi. Ezt biomiális eloszlással lehet modellezi. Ezzel az eloszlással a visszatevéses mitavétel ragadható meg, vagyis olya helyzeteket lehet vele modellezi, ahol egy véletle kísérletet tetszőlegese sokszor lehet megismételi ugyaolya körülméyek között, miközbe azt figyeljük meg, hogy az ismétlés sorá háyszor következett be a vizsgált eseméy. Jelölje ezt k. Ameyibe az eseméyek számát elosztjuk a kísérletek számával, megkapjuk a becsült relatív gyakoriságot. Miért becsült? Azért, mert a mitából becsüljük. Relatív gyakoriság: p= k A feti képletbe tehát az eseméy bekövetkezéséek gyakoriságát k-val jelöljük. A p kalap csak 0 < p < 1 közötti értéket vehet fel. Példa az egyetemista láyokról: Mi aak a valószíűsége, hogy az egyetem hallgatói közül véletleül kiválasztott százelemű mitába 80 láy lesz? Vegyük elő a biomiális eloszlás sűrűségfüggvéyét. A biomiális eloszlás sűrűségfüggvéye: () k k P( x=k)= p (1 p), k=0,1, 2, 3,, k

114 KONFIDENCIAINTERVALLUM Hogya kell olvasi a képletet? P jeleti a valószíűséget. A zárójelbe található a feltétel, x egyelő k-val. Esetükbe k egyelő 80-al. A képlet baloldala tehát mi aak a valószíűsége, hogy x (a sikeres eseméyek száma) egyelő lesz 80-al. Háyféleképpe tuduk kiválasztai százból yolcvaat? N alatt a k. Mit jelet a p? A p a láyok valószíűsége. Ez egy ormális populációba megközelítőe 0,5. A fiúk valószíűsége 1-p, ami ebbe az esetbe szité 0,5. Aak a valószíűsége, hogy egymásutá 80 láy kerül a mitába 0,5 a yolcvaadiko szorozva 0,5 a huszadikoal. A képletbe behelyettesítve: 4,23*10-10-t kapuk. Ez egy agyo kicsi szám, gyakorlatilag alig fordulhat elő, hogy a véletleül kiválasztott száz emberből yolcva ő legye. Előfordulhat, csak agyo ritká. Melyik érték előfordulásáak a legagyobb a valószíűsége? Az *p értékek. Azaz 100*0,5 egyelő 50. Ez a biomiális eloszlás várható értéke: E(x) = p. Mi aak a valószíűsége, hogy potosa 50 láy lesz a mitába? A biomiális eloszlás sűrűségfüggvéye szerit, 0,0795 azaz megközelítőe 8%. A fet bemutatott példa olya szakokra voatkozik, ahol a fiuk és láyok száma megegyezik. A láyos és fiús szakok eseté természetes em 0,5 a valószíűsége a láy választásáak. 0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,02 0, ábra: Biomiális eloszlás, láyok száma A biomiális eloszlású változó szórása: D(X )= p (1 p) A relatív gyakoriság kofideciaitervallumát többféleképpe is becsülhetjük. Közelíthetjük ormál-eloszlással és F-eloszlással

115 KONFIDENCIAINTERVALLUM A ormál-eloszlást akkor alkalmazzuk, ha a mita em túl kicsi, és a relatív gyakoriságok em túlságosa szélsőségesek. Ebbe az esetbe teljesülie kell, hogy p>5 és (1p)>5. A relatív gyakoriság 95%-s kofideciaitervalluma: x 0,5 p 1 p x 0,5 p 1 p 1,96 π 1,96 Az 1,96 a stadard ormális eloszlás 95% valószíűségéhez tartozó z-érték. Más valószíűséghez a hozzátartozó z-értéket kell a képletbe helyettesítei. Példa: A doháyzás relatív gyakoriságáak becslése egy em valós felmérés alapjá. = 100 k = 30 p = 30/100 = 0,3 Várható érték = 30 Szórás = 100 0,3 (1 0,3) 95%-s megbízhatósági tartomáy féléek a szélessége: 1,96 0,3 (1 0,3) =0, Ezt az értéket kell levoi, ill. hozzáadi a relatív gyakorisághoz. Így az alsó széle: 0,205, a felső széle: 0,385 adódik. Tehát 95%-s valószíűséggel a sokaság valódi relatív gyakorisága eze itervallumo belül helyezkedik el. A π-re voatkozó potosabb érték, külööse p<5, vagy (1-p)<5 eseté, az F-eloszlás segítségével. A relatív gyakoriság kofideciaitervalluma: x 1 F ν1, ν2, α x π x x 1 F ν1, ν2, α x x 1 F ν1, ν2,α Ez a kofideciaitervallum em szimmetrikus, ezért a bal és jobboldali szabadságfokok külöbözőek. Az F-eloszlás szabadságfokait em v-vel, haem űvel jelöljük, ami kicsit hasolít a v betűre. A szabadságfokokat szokták még FG 1-gyel illetve FG2-vel is jelöli. bal oldalo: ν 1=2( x + 1), ν 2=2x jobb oldalo: ν 1=2( x+ 1), ν 2 =2( x) A becslés sorá szóba került az F-eloszlás. Ez az eloszlás em szimmetrikus, mit a ormális eloszlás. Három külöböző F-eloszlás látható az 64. ábrá

116 KONFIDENCIAINTERVALLUM 1 0,9 0,8 0,7 0,6 FG1=30, FG2=30 FG1=7, FG2=31 FG1=1, FG2=1 0,5 0,4 0,3 0,2 0, ábra: F-eloszlások A jelmagyarázatba az FG rövidítés az eloszlás szabadságfokait jeleti. Ezt az eloszlást a taköyv második kötetébe tárgyaljuk részletese. A 95%-os megbízhatósági tartomáyhoz tartozó alfa valószíűség egyelő 0,05-dal. Az alfa az elsőfajú hiba valószíűsége, ami egyelő (1-megbízhatósági valószíűség). Számítsuk ki újból a relatív gyakoriság kofideciaitervallumát. Baloldali ű1 = 142 ű2 = 60 F = 1,45 C.I. 95% = 0,22 Jobboldali ű1 = 62 ű2 = 140 F = 1,41 C.I. 95% = 0,38 Az F-eloszlás segítségével 95%-s valószíűséggel a sokaság valódi relatív gyakorisága 0,22 és 0,38 között va. Ez em sokkal tér el a ormális eloszlással kapott kofideciaitervallumtól. Hogya lehete csökketei ezt az itervallumot? A megfigyelések számáak övelésével

117 KONFIDENCIAINTERVALLUM R statisztika dbiom(x, size, prob, log=false Biomiális eloszlás sűrűségfüggvéye. x=vektor, alapadatok. size=próbálkozáso száma, prob=a sikeres eseméyek valószísége. pbiom(x, size, prob, lower.tail=true, log.p=false) Biomiális eloszlás eloszlásfüggvéye. lower.tail=true az eloszlás baloldalát határozza meg.p[x<=x]. qbiom(p, size, prob, lower.tail=true, log.p=false) Iverz biomiális eloszlás. Az adott p valószíűséghez tartozó biomiális-érték meghatározása. rbiom(, size, prob) Biomiális eloszlású véletleszám-geerátor. =véletle számok száma. A mediá kofideciaitervalluma Mediát legalább ordiális tulajdosággal redelkező változók eseté szabad meghatározi. Tehát x1, x2, x3,, x agyság szerit sorredbe redezhető. A mediá megbízhatósági itervallumáak meghatározásához a ormális eloszlás em feltétel. A mediá kofideciaitervalluma: x h 1 Me x h h= 1 z 2 h csak egész szám lehet, egyszerű kerekítéssel kapjuk meg. z evezetes értékei 68%, 95% és 99%-os valószíűség mellett 1,63; 1,96 és 2,58. Példa: Számítsuk ki egy 101 elemű mita mediájáak 95%-os megbízhatósági tartomáyát. Tehát, = 101 és a Me = 51. adat értékével. A feti képletet alkalmazva, ahol z egyelő 1,96-tal, h = 40. Ebből adódóa: C.I. 95% alsó = 41. adat értéke C.I. 95% felső = 61. adat értéke Azaz 95%-s valószíűséggel a valódi mediá a 41. és 61. adat között helyezkedik el

118 KONFIDENCIAINTERVALLUM R statisztika media(x) A mita mediája. qorm(p, mea=0, sd=1, lower.tail=true, log.p=false) Iverz ormális-eloszlás. Az adott p valószíűséghez tartozó z-érték meghatározása. A számtai átlag kofideciaitervalluma A számtai átlag megbízhatósági itervallumáak becslését két agy csoportra bothatjuk: 1. A sokaság valódi szórása, σ ismert 2. A sokaság valódi szórása, σ ismeretle, a mitából kell becsüli Ameyibe a sokaság valódi szórása ismert, akkor a stadard ormális eloszlás z-értékeit haszálhatjuk a becsléshez, mivel egy ismert várhatóértékű (µ) és szórású (σ) ormális eloszlásból vett véletleszerű mita empirikus várható értékével számított u paraméter stadard ormális eloszlást követ. A számtai átlag megbízhatósági tartomáya: P x z α /2 s s μ x z α / 2 =1 α A feti képlet értelmezése: aak a valószíűsége, hogy a sokaság valódi középértéke az adott itervallumba esse potosa ±1 szórásyi távolságo belülre 1-α. Ismeretle σ eseté a sokaság szórását a mitából kell becsüli, amely szité hibával terhelt, mit a számtai átlag. Mi törtéik akkor, ha a szórást em ismerjük, és a mitából becsüljük meg a korrigált empirikus szórás (s) segítségével. Az így számított statisztika milye eloszlást követ? Ebbe az esetbe em haszálhatjuk a stadard ormális eloszlást. Helyette a Studet-féle t-eloszlást kell alkalmazi. A számtai átlag megbízhatósági tartomáya ismeretle szórás eseté: P x t α / 2 s s μ x t α /2 =1 α A feti problémát W. S. Gossett statisztikus oldotta meg, és Studet áléve közölte az eredméyeket 1908-ba. Az alábbi összefüggés alapjá számolta ki a t paramétert. x μ t= s/ Ezt a valószíűségi változót Studet t-eloszlásak hívjuk. Gossett kimutatta, hogy a teloszlás hasolít a stadard ormális eloszláshoz, de egy kissé szélesebb eloszlást mutat, azaz kevésbé csúcsos, és az eloszlás alakja függ a mita méretétől, egésze potosa (-1)-től, a mita szabadságfokától. A t-eloszlás szimmetrikus és a szabadságfok övelésével egyre ikább megközelíti a stadard ormális eloszlást

119 KONFIDENCIAINTERVALLUM A t-eloszlás sűrűségfüggvéye: Γ f x = 1 2 x2 1 π Γ ahol: = szabadságfok Γ= gamma eloszlás, ezt most em részletezzük A 65. ábra két t-eloszlást mutat, a kék szabadságfoka 100, a aracs szíűé 2. Midkét eloszlás görbe alatti területe egy, azaz az összes lehetséges eseméyek valószíűségéek összege. 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0, ábra: Studet-féle t-eloszlások A t-eloszlásak agy a gyakorlati jeletősége. Sok statisztikai teszt haszálja. A hétközapi életbe miősítő vizsgálatokál, etalohoz hasolításál, illetve teljesíti-e az előírást a termék vagy szolgáltatás típusú problémák megválaszolására haszáljuk

120 KONFIDENCIAINTERVALLUM 66. ábra: William Sealy Gosset, , alias Studet, 1908-ba Példa: Vizsgáljuk meg az áruházba kapható kefir zsírtartalmát. Az előírás 3%-t ír elő, ez va feltütetve a dobozo. A gyártás sorá a zsírtartalom szórása 0,5%. Vegyük egy harmic elemű mitát, és ézzük meg, hogy a zsírtartalom teljesíti-e a 3%-t. A mita jellemzői: =30; átlag= 3,2%; s=0,5% Vajo a 3,2%-s mitaérték tekithető-e statisztikai értelembe 3%-ak? Számítsuk ki a középérték 95%-s kofideciaitervallumát. Ehhez először határozzuk meg a stadard hibát. A stadard hiba: s x =0,091 %. A kofideciaitervallum félszélessége: 1,96 * 0,091= 0,18%. Ebből adódik, hogy az megbízhatósági szit alsó határa: 3,02%, a felső határa 3,38%. Jól látszik, hogy ebbe a tartomáyba ics bee a 3%, ezért a mita alapjá szigifikás külöbség va az előírás és a boltba árusított kefir zsírtartalma között. Másképpe megfogalmazva, a boltba kapható kefir zsírtartalma szigifikása agyobb, mit az előírás. Példa: Az őszi búza felvásárlásakor miőségi felárat fizetek, ha a hektolitertömege legalább 80 kg. Egy harmic elemű mitába az alábbi értékek adódtak:

121 KONFIDENCIAINTERVALLUM = 30 átlag =75 kg/hl s = 15 kg/hl Kaphatuk-e miőségi felárat, vagy ez a búza em tekithető statisztikai értelembe 80 kg-s hektoliter-tömegűek. Végezzük el a számításokat. A stadard hiba: s x = 15 =2,74 kg. A kofideciaitervallum félszélessége: 1,96 * 2,74= 5,37 kg. Ebből 30 adódik, hogy az megbízhatósági szit alsó határa: 69,63 kg, a felső határa 80,37 kg. Ebbe az esetbe a kofideciaitervallum körülöleli az etaloértéket, ezért em modhatjuk, hogy szigifikása eltér tőle, tehát jár a miőségi felár. A statisztikai tudás alkalmazása ebbe az esetbe gazdasági előyt jelet számukra. A feti példát az Excel táblázatkezelő programmal is ki tudjuk számoli. A kofideciaitervallum félszélességét a megbízhatóság() függvéy adja meg. Eek a függvéyek három paramétere va: a szigifikacia-szit, a mita szórása és a mita elemszáma. A szigifikacia-szit egyelő 1-megbízhatóság. Esetükbe 1-0,975=0,05. A feladat megoldására alkalmas Excel függvéy így éz ki: =megbízhatóság(0,05; 15; 30) eredméye: 5,37. Természetese ugyaazt az eredméyt kaptuk, mit a kézi számítással

122 KONFIDENCIAINTERVALLUM R statisztika library(pastecs) Ebbe a csomagba a stat.desc() függvéyel a számtai átlag kofideciaitervalluma is meghatározásra kerül. dt(x, df, cp, log=false) t-eloszlás sűrűségfüggvéye. x=vektor, alapadatok. df=szabadságfok, cp=em cetrális paraméter, ha em aduk eki értéket, akkor cetrális t-eloszlást haszál, ez az alapbeállítás. log=logaritmus. pt(x, df, cp, lower.tail=true, log.p=false) t-eloszlás eloszlásfüggvéye. lower.tail=true az eloszlás baloldalát határozza meg.p[x<=x]. qt(p, df, cp, lower.tail=true, log.p=false) Iverz t-eloszlás. Az adott p valószíűséghez tartozó t-érték meghatározása. Ezt haszáljuk a kofideciaitervallum meghatározásakor. rt(, df, cp) t-eloszlású véletleszám-geerátor. =véletle-számok száma. A szórás kofideciaitervalluma A szórás kofideciaitervallumát többféleképpe is meghatározhatjuk. A leggyakrabba ormális-eloszlással (z-eloszlás) közelítjük. A szórás kofideciaitervalluma, közelítés ormál-eloszlással s s σ z z 1 1 α/ α/ Példa: = 1000 alfa = 0,05 z = 1,959 szórás = 10 A feti összefüggést alkalmazva kapjuk meg a kofideciaitervallum alsó és felső szélét. C.I.alsó = 9,580 C.I.felső = 10,459 A szóráségyzet kofideciaitervallumát is megbecsülhetjük a ormál-eloszlással

123 KONFIDENCIAINTERVALLUM A variacia kofideciaitervalluma, közelítés ormál-eloszlással s2 1 z 1 α /2 s σ 1 z 1 α /2 2 1 Példa: = 1000 alfa = 0,025 z = 1, variacia =100 A számítások elvégzése utá: C.I.alsó = 91,937 C.I.felső = 109,612 A szórás kofideciaitervallumát khi-égyzet eloszlással is megbecsülhetjük. Ebbe az esetbe természetese a khi-égyzet eloszlást kell haszáli. A szórás kofideciaitervalluma, közelítés khi égyzet-eloszlással s 1 1 σ s 2 2 χ α / 2, 1 χ 1 α / 2, 1 R statisztika dchisq(x, df, cp=0, log=false) Khi-égyzet eloszlás sűrűségfüggvéye. x=vektor, alapadatok. df=szabadságfok, cp=em cetrális paraméter, az alapbeállítás ulla. log=logaritmus. pchisq(x, df, cp=0, lower.tail=true, log.p=false) Khi-égyzet eloszláseloszlásfüggvéye. lower.tail=true az eloszlás baloldalát határozza meg.p[x<=x]. qchisq(p, df, cp=0, lower.tail=true, log.p=false) Iverz khi-égyzet eloszlás. Az adott p valószíűséghez tartozó khi-égyzet-érték meghatározása. Ezt haszáljuk a kofideciaitervallum meghatározásakor. rchisq(, df, cp=0) Khi-égyzet eloszlású véletleszám-geerátor. =véletleszámok száma

124 A STANDARD HIBA NAGYSÁGA VÉGES SOKASÁG ESETÉN A stadard hiba agysága véges sokaság eseté Végtele agyságú sokaságál a közpoti határeloszlás alapjá a számtai átlag és a relatív gyakoriság stadard hibájáak meghatározása visszatevéses mitavételezéssel törtéik. Véges sokaság eseté azoba visszatevés élküli mitavételezést csiáluk. A véges sokaság elemszáma N. Abba az esetbe, ha a mita elemszáma em túl kicsi a sokaság agyságához viszoyítva (agyobb, mit 5%, azaz /N>5%), véges korrekciós faktort kell haszáli a stadard hiba meghatározásakor. A korrekciós téyező jele: fpc (fiite populatio correctio factor): fpc= N N 1 Ahol = mitaagyság N = sokaság elemszáma Az számtai átlag stadard hibája véges sokaságok eseté: s x= s N N 1 A relatív gyakoriság stadard hibája véges sokaságok eseté: sp = s p (1 p) N N 1 R statisztika sqrt((n-)/(n-1)) Véges korrekciós téyező

125 HIPOTÉZISELMÉLET Hipotéziselmélet A tudomáyos kutatás sorá valamiek a felfedezése egy sejtéssel idul. Feltételezhetjük, hogy a loch essi szöry létezik. Azoba ez a feltételezés sok egyéb, szite végtele számú, kérdést is felvet. Ameyibe létezik, háy va belőle, milye agy, milye hagot ad ki, mit eszik, mit iszik, stb. Ebből kifolyólag valamiek a létezését állítai yitott állításkét fogható fel, amely agyo sok egyéb kérdést vet fel. Ezért a tudomáyba valamiek a létezését idirekt módo szokták igazoli vagy megcáfoli. Vegyük a létezés komplemeter eseméyét, amely leggyakrabba az elletettjét jeleti, tehát a szöry em létezik. Ez egy zárt kijeletés, mivel további kérdések ics helye, pl. meyire em létezik, vagy milye em létezik. Valamely eseméy vagy jeleség em létezését ullhipotézisek evezzük. Példákba tehát a ullhipotézis, hogy a szöry em létezik. 67. ábra. A loch essi szöry mégis létezik A ullhipotézist midaddig igazoltak tekitjük, amíg legalább egyetleegyszer meg em cáfoljuk, azaz valaki téyleg felfedezi a szöryet és egyértelmű bizoyítékot hoz a létezéséről. A statisztikába, mit köyvük első részébe is látható volt, agyo sokszor összehasolítaak valamit vagy valamiket. Az összehasolítás törtéhet elméleti értékhez vagy összehasolíthatuk kettő vagy több mitából becsült paramétereket (várható értéket, szórást, stb.). Ebbe az esetbe is a ullhipotézis az, hogy az összehasolítadó mitákból becsült paraméterek között em létezik külöbség. A paraméterek külöbségéek várhatóértéke ulla, vagy ha aráyosítjuk, a háyadosuk várható értéke egy. Természetese potos egyezést e várjuk a ullával vagy eggyel, mivel a külöbség várható ér

126 HIPOTÉZISELMÉLET téke is valószíűségi változó, pl. ulla körül igadozik valamilye szórással. Ameyibe agy elemszámú mitáko, agyo sokszor végezzük el a vizsgálatokat, és a ullhipotézis igaz, akkor a külöbségek várható értéke egy ulla középértékű ormális-eloszlású változó lesz. Ebből kifolyólag a ormális-eloszlás tulajdoságai alkalmazhatók, és meghatározhatjuk, hogy a külöbség milye valószíűséggel vehet fel adott értéket. Meghatározhatjuk az adott valószíűséghez tartozó kofideciaitervallumát. Láthatjuk, hogy a sokaságokra felállított hipotézist miták alapjá erősítjük vagy vetjük el. Ezt evezzük statisztikai próbáak. Statisztikai próba: Olya eljárás, amely a miták alapjá döt a sokaság vagy sokaságokra felállított hipotézisről. Megerősíti vagy megcáfolja azt. A hipotézisvizsgálat első lépése a modell kiválasztása. Ameyibe em létezik a számukra megfelelő modell, akkor csiáli kell egyet. A statisztikába agyo sokféle modell létezik, ezért agyo kicsi a valószíűsége aak, hogy em találuk megfelelőt. Ezek a modellek legtöbbször elméleti eloszlásfüggvéyek, pl. ormális eloszlás, t-eloszlás, F-eloszlás, stb. A modell kiválasztása sorá meg kell vizsgáli, hogy az általuk taulmáyozott jeleség téyleg jól helyettesíthető-e a modellel. Második lépésbe választai kell egy szigifikacia-szitet, azaz elsőfajú hibát. Ameyyibe a ullhipotézis igaz, maximum ilye valószíűséggel utasíthatjuk vissza tévese, azaz maximum ilye valószíűséggel hibázhatuk. A harmadik lépésbe elő kell állítai a próbafüggvéyt, és a segítségével meghatározi a próbastatisztika értékét. Valójába ez a statisztikai teszt kiválasztását és alkalmazását jeleti. Godosa kell eljári, csak az alkalmazhatósági feltételekek megfelelő tesztet haszáljuk. A próbafüggvéy kiszámított értéke az elméleti eloszlás x-értéke. Normáleloszlás eseté a z-érték, F-eloszlásál az F-érték, t-eloszlásál a t-érték, stb. Ezekhez az értékekhez megadható egy p valószíűség, amely megmutatja, hogy milye valószíűséggel vehet fel a próbafüggvéy a kiszámítottal azoos vagy agyobb értéket, ha a ullhipotézis igaz. Ameyibe ez a valószíűség kisebb, mit a szigifikacia-szit, akkor elutasíthatjuk a ullhipotézist, mert a hibázási valószíűség kisebb, mit az előre választott megegedhető maximális érték. Gyakorlatilag egy statisztikai próba meete az alábbi lépésekből áll: 1. Mukahipotézis felállítása Ha. Ez em igazolható közvetle úto. 2. Nullhipotézis felállítása H0. 3. Statisztikai teszt választása az alkalmazhatósági feltételek figyelembe vételével. A modell validálása. 4. Szigifikacia-szit választása. 5. Próbastatisztika értékéek kiszámítása. 6. Dötés. 7. A modell utólagos validálása. Sok statisztika tesztél a validálást csak az eljárás alkalmazása utá tudjuk elvégezi, pl. amelyekél az alkalmazhatósági feltételek a maradéktagokra voatkozak

127 HIPOTÉZISELMÉLET Elsőfajú hiba: Akkor követhetjük el, ha a ullhipotézis igaz. A mita alapjá tévese elvetjük a ullhipotézist, és em létező külöbséget állapítuk meg. Az elsőfajú hiba jelölése: a. Ezt szigifikacia-szitek is hívják. Ezt az értéket a statisztikai próba elvégzése előtt kell megválasztai. Szokásos értékei, a hagyomáyokhoz igazodva, 10, 5, 1 ritká 0,1%. Ez még abból a korból maradt rák, amikor em volt számítógép, és a kritikus értékeket táblázatból kellett meghatározi. Maapság mide statisztikai programcsomagba megtalálhatók ezek a függvéyek, tehát a szigifikacia-szitet elméletileg bármekkorára választhaták. Csak elméletileg, mert a gyakorlatba eek korlátai vaak. Az egyik legagyobb korlát a másodfajú hiba, ugyais az elsőfajú hiba csökketésével öveljük a másodfajú hibát. Emiatt em lehet az elsőfajú hibát agyo kicsire választai. Az elsőfajú hibát az agol szakirodalomba Type I. error -ak evezik. Elsőfajú hiba valószíűsége: a=p(igaz H0 eseté a statisztikai teszt alapjá H0-t tévese visszautasítjuk) Másodfajú hiba: Akkor követhetjük el, ha a ullhipotézis hamis, em igaz. A mita alapjá tévese elfogadjuk a ullhipotézist, és a létező külöbséget em mutatjuk ki. A másodfajú hiba jelölése: b. Eek a agyságát em tudjuk megválasztai a teszt elvégzése előtt, ezt midig csak utólag tudjuk meghatározi. A másodfajú hiba agysága függ a valódi külöbség mértékétől. Miél agyobb a valódi külöbség, aál kisebb a másodfajú hiba. A másodfajú hiba az elsőfajú hibától is függ, mégpedig fordított összefüggés va közöttük, ezért modtuk, hogy az elsőfajú hibát em lehet agyo kicsire választai. Miél kisebb az elsőfajú hiba, aál agyobb a másodfajú, és fordítva. A másodfajú hiba előre megválasztása a kísérlet vagy vizsgálat tervezése sorá törtéhet, amikor a mita miimális elemszámát határozzuk meg. Ekkor megadhatjuk a másodfajú hiba agyságát is. A másodfajú hibát az agol szakirodalomba Type II. error -ak evezik. Másodfajú hiba valószíűsége: b=p(hamis H0 eseté a statisztikai teszt alapjá H0-t tévese elfogadjuk) Térjük vissza az elsőfajú hibára. Ez a hiba megadható kétoldali szimmetrikus, és egyoldali aszimmetrikus feltételkét is. Kétoldali szimmetrikus feltételél a kritikus érték az eloszlást három részre osztja fel. Egy baloldali elutasítási, egy középső elfogadási, és egy jobboldali szité elutasítási tartomáyra. Egyoldali aszimmetrikus feltételél a kritikus érték két részre osztja az eloszlást, egy elfogadási és elutasítási tartomáyra. Egyoldali vagy kétoldali próbát válasszuk? Előzetes iformációk hiáyába midig kétoldalit haszáljuk, ez a gyakoribb. Ameyibe logikailag tudjuk igazoli, hogy csak egyelő vagy agyobb, illetve egyelő vagy kisebb lehet a külöbség, akkor egyoldali próbát válasszuk. Va külöbség a két próba között? Ige. Az egyoldali próbáak agyobb az ereje

128 HIPOTÉZISELMÉLET 68. ábra. Kétoldali szimmetrikus 5%-os elsőfajú hiba 69. ábra. Egyoldali aszimmetrikus 5%-os elsőfajú hiba A statisztikai próba ereje: A valódi külöbség kimutatásáak valószíűsége. Meghatározása: 1-b. Gyakorlatilag egy igaz mukahipotézis elfogadásáak valószíűsége

129 HIPOTÉZISELMÉLET Az elsőfajú és másodfajú hiba összefügg, mégpedig fordította, ha az egyik ő, a másik csökke. Azoba az összefüggés em lieáris, azaz, ha az egyik egy százalékkal csökke, a másik em egy százalékkal ő. Az összefüggést a 70. ábra mutatja. Tételezzük fel, hogy két sokaság várható értéke közötti valódi külöbség 3. Ez bármilye mértékegységgel redelkezhet, ez most em fotos. Válasszuk egy kétoldali szimmetrikus tesztet 5%-s elsőfajú hibával. Ábrázoljuk a ullhipotézist. Ezt a baloldali világoskék eloszlás mutatja. A jobboldali piros rész a 3 várhatóértékű eloszlást ábrázolja. Jól látszik, hogy a két eloszlás egymásba lóg. A kritikus érték 1,96. Ez választja szét az elfogadási és elutasítási tartomáyt. Ameyibe 1,96-ál kisebb lesz a számított próbastatisztika értéke, a ullhipotézist megtartjuk, ha agyobb, akkor elvetjük, és ki tudjuk mutati a meglévő 3 külöbséget. 70. ábra. Alfa kétoldali szimmetrikus 5%, valódi külöbség 3 Hiába létezik a 3 valódi külöbség, ha a miták alapjá 1,96-ál kisebb próbastatisztika értéket határozzuk meg, akkor a ullhipotézist kell elfogadi. Ekkor követjük el a másodfajú hibát (b). Milye agy eek a valószíűsége? Ki kell számítai, hogy mi aak a valószíűsége, hogy egy 3 várhatóértékű ormális eloszlás eseté 1,96-ál kisebb értéket kapuk. Ez közel 15%. A másodfajú hiba ezek szerit háromszor akkora, mit az elsőfajú. A statisztikai próba ereje 100%-15%=85%. 85%-s valószíűséggel tudjuk kimutati a 3 valódi külöbséget egy 5%-s kétoldali szimmetrikus teszttel. Korábba azt állítottuk, hogy a másodfajú hiba emcsak az elsőfajútól, haem a valódi külöbség agyságától is függ. Miél agyobb a valódi külöbség, aál kisebb a másodfajú hiba elkövetéséek valószíűsége. Az előbbi példába legye a valódi külöbség 4, ezt mutatja a 71. ábra

130 HIPOTÉZISELMÉLET 71. ábra. Alfa kétoldali szimmetrikus 5%, valódi külöbség 4 Milye agy a másodfajú hiba elkövetéséek valószíűsége ebbe az esetbe? Határozzuk meg a 4 várható értékű ormális eloszlású változó 1,96-ál kisebb értékéhez tartozó valószíűséget. Ez csak 2%. A statisztikai próba ereje 98%. Száz próbálkozásból várhatóa kilecveyolcszor ki tudjuk mutati a 4 valódi külöbséget. Az ábrá jól látható, hogy az elsőfajú hiba kétoldali szimmetrikus, a másodfajú hiba viszot egyoldali aszimmetrikus. Ezt midig figyelembe kell vei a kritikus értékek meghatározásakor, illetve a valószíűségek megállapításáál. Hogya lehet csökketei az első és másodfajú hibát? A mita elemszámáak övelésével. Potosabb mitavételezéssel. Megfelelő statisztikai teszt kiválasztásával. A mita elemszámáak övelése csak a véletle mitavételezés eseté csökketi a hibákat. Szisztematikusa hibás mitavételezési eljárás eseté hiába öveljük az elemszámot, akkor is hamis eredméyt kapuk. A dötésél elkövethető hibák Egy statisztikai teszt elvégzése sorá elkövethető hibák összefoglalását mutatja a leti táblázat. Az oszlopok a valóságot mutatják, melyre csak a mitákból következtethetük. A sorok a miták alapjá hozott dötéseket jellemzik. Jól látható, hogy kétféle helyes és kétféle helytele dötést hozhatuk. A helyes és helytele dötések valószíűsége azoba em egyezik meg, em ötve-ötve százalék. Arra törekszük, hogy a helyes

131 HIPOTÉZISELMÉLET dötéseik valószíűsége miél agyobb legye. Természetese sohasem lesz 100%, midig lesz tévedési hiba. Dötés a mita alapjá A valóság H0 igaz H0 hamis H0-t elfogadjuk Helyes dötés (1-a) Másodfajú hiba (b) H0-t elutasítjuk Elsőfajú hiba (a) Helyes dötés (1-b)

132 KÖZÉPÉRTÉK-ÖSSZEHASONLÍTÓ PRÓBÁK Középérték-összehasolító próbák Egy-mitás z-próba vagy u-próba A mita középértékéek összehasolítása egy feltételezett középértékkel. Származhat-e az X középértékű mita egy μ0 középértékű populációból? H0 hipotézis: x =μ0 Ellehipotézis, kétoldali szimmetrikus: x μ0 Alkalmazhatósági feltételek: Normális eloszlású populáció Ismert szórás A gyakorlatba alkalmazzák tetszőleges eloszlású populációk eseté is, ha >30. A mita alapjá számított X középérték stadardizált értéke felírható az alábbi formába, amely stadard ormális eloszlású: Egy-mitás z-próba statisztikája: z= Ahol: z X μ 0 X σ / a próbastatisztika mita alapjá meghatározott értéke a mita középértéke, a populáció feltételezett középértéke (adott középérték), a populáció (ismert) szórása, a mita elemszáma. A mita abba az esetbe származhat az μ0 középértékű populációból, ha a mita alapjá meghatározott z próbastatisztika értéke kisebb az adott valószíűségi szithez tartozó kritikus z-értékél. Egyoldalú hipotézis eseté a-ál, kétoldalú hipotézis eseté a/2-él kell meghatározi a kritikus z-értéket. Elfogadjuk a ullhipotézist, ha z < kritikus z. Példa: Egy kefir szabváy szeriti zsírtartalma 3% 0,5%-s szórással. Vizsgáljuk meg 30 elemű mitát véve, hogy az áruházakba kapható kefir teljesíti-e a szabváyt. A H0: a kefir zsírtartalma 3%. Válasszuk a szigifikacia szitet 5%-ak (0,05). H a: a kefir zsírtartalma em egyelő 3%-kal, tehát az alteratív hipotézis kétoldali szimmetrikus. Méréseik eredméye: =30 átlag= 3,2% =0,5%

133 KÖZÉPÉRTÉK-ÖSSZEHASONLÍTÓ PRÓBÁK A számításokat elvégezve az alábbi eredméyt kapjuk: z= μ 0 3,2 3 X = =2,1978 σ / 0,5 / 30 Határozzuk meg a kritikus z-értéket. Mivel az alteratív hipotézis kétoldali, ezért a kritikus értéket a/2-él kell keresi, azaz 2,5%-ál. 72. ábra. Stadard ormális-eloszlás 95%-s kritikus értékei Jól látszik, hogy a számított z-érték (2,2) az elutasítási tartomáyba esik, ezért az áruházakba a kefirek em teljesítik a szabváyelőírást, tehát szigifikása 3%-ál több zsírt tartalmazak. Függetle kétmitás z-próba vagy u-próba Ameyibe két függetle azoos szórású ormális-eloszlású mitát kivouk, vagy összeaduk, és a ullhipotézis igaz, akkor az így kapott adatok várhatóértéke ulla, a szórása pedig: s d =s Ahol: sd s 2 két ormális eloszlás külöbségéek szórása a mita szórása

134 KÖZÉPÉRTÉK-ÖSSZEHASONLÍTÓ PRÓBÁK a mita elemszáma A függetle kétmitás t-próbával megvizsgálhatjuk, hogy származhat-e a két függetle megfigyelés, mita azoos középértékű populációból? H0 hipotézis: x 1= x2 A próbastatisztika z-eloszlást követ, DF = szabadságfokkal: Függetle kétmitás z-próba: z= Ahol: z x1 x2 1 2 x 1 x σ1 σ a próbastatisztika mita alapjá meghatározott értéke az első mita középértéke a második mita középértéke az első populáció ismert szórása a második populáció ismert szórása a mita elemszáma Valójába a feti összefüggés a Welch által kostruált statisztika, amely alkalmas azoos és külöböző szórások eseté a z-érték potos meghatározására. Alkalmazhatósági feltételek: Normális eloszlású függetle sokaságok A szórások ismertek A gyakorlatba tetszőleges eloszlású mitákra is alkalmazzák, ha midkét mitába >30. Az X1 és X2 középértékek külöbsége akkor ormális, ill. közelítőleg ormális eloszlású, ha a sokaságok amelyekből a miták származak ormális eloszlásúak, illetve tetszőleges eloszlásúak, de a mitaelemek száma midkét populációba agyobb, mit 30. A két populáció középértéke, amelyekből a miták származak, abba az esetbe tekithetők azoosak, ha: z z * Ahol: z* a szigifikacia-szithez tartozó ormál-eloszlás értéke A próbastatisztika kritikus z-értékét kétoldali alteratív hipotézis eseté a/2-él, egyoldali alteratív hipotézis eseté, a-ál kell meghatározi. Egymitás t-próba Az egymitás t-próbával tesztelhetjük, hogy a valószíűségi változók értéke megegyezik-e egy kokrét értékkel. Hasoló az egymitás z-próbához, azoba a szórás ismeret

135 KÖZÉPÉRTÉK-ÖSSZEHASONLÍTÓ PRÓBÁK le, a mitából kell becsüli. Emiatt a próbastatisztika em ormális eloszlású, haem t-eloszlású, -1 szabadságfokkal. A próbastatisztika az alábbi: Egymitás t-próba: t= μ0 X s / Alkalmazhatósági feltételek: Normális eloszlású populáció A szórás ismeretle A mita elemszámáak övekedésével a t eloszlás egyre jobba közelíti a stadard ormális eloszlást, és 30 elemszám eseté agyo hasoló a két eloszlás. Az X középértékű mita abba az esetbe származhat a középértékű populációból ha t próbastatisztika abszolút értéke kisebb, mit az adott valószíűséghez tartozó kritikus t érték. A próbastatisztika kritikus t-értékét kétoldali alteratív hipotézis eseté a/2-él, egyoldali alteratív hipotézis eseté, a-ál kell meghatározi. Függetle kétmitás t-próba A kétmitás t-teszttel megvizsgálhatjuk, hogy származhat-e a két függetle megfigyelés, mita azoos középértékű populációból? Azoosak tekithető-e a két populáció középértéke, amelyekből a miták származak? A két populáció, amelyekből a miták származak, 1, ill. 2 várható értékéek becslésére a miták középértékei szolgálak, E X 1 =μ1, ill. E X 2 =μ 2. H0: μ1 = μ2 A középértékek összehasolítására szolgáló statisztikai próbák eltérőek attól függőe, hogy az alappopulációk szórása egyelőek tekithető-e. Ameyibe a szórások megegyezek az alábbi próbastatisztikát haszáljuk, az eloszlás t-eloszlású, DF = szabadságfokkal: Függetle kétmitás t-próba (szórás azoos) t= x 1 x sp 1 2 A evezőbe az sp a két mita összevot variaciájáak (pooled variace) égyzetgyökét jeleti, melyet a két mita összevot szórásáak evezzük. Alkalmazhatósági feltételek: Két függetle mita, Normális eloszlású sokaságok, A szórások ismeretleek, de azoosak

136 KÖZÉPÉRTÉK-ÖSSZEHASONLÍTÓ PRÓBÁK Az ismeretle közös szórást a mitákból számított szóráségyzetekből becsülhetjük az alábbi képlet szerit: Az összevot szórás képlete: (1 1) s21 + (22 1) s22 s p= A két populáció középértéke, amelyekből a miták származak, abba az esetbe tekithetők azoosak, ha: t t * A próbastatisztika kritikus t értékét kétoldali alteratív hipotézis eseté a/2-él, egyoldali alteratív hipotézis eseté, a-ál kell a táblázatból meghatározi. Ha a két populáció ismeretle szóráségyzete korábbi ismeretek, ill. a mitákból számított szóráségyzetek alapjá em tekithető azoosak, akkor a t próba helyett a Welch-próbát kell alkalmazi, mely ige hasoló a t-próbához, a külöbség a szabadságfokok meghatározásába va. Welch-próba: t= x 1 x s1 s2 1 2 A t-teszt alkalmazásakor előre tudi kell, hogy a két csoport szórása megegyezik-e, tehát teszteli kell a csoportok szórását (F-próba). Ameyibe a szórások egyelők, akkor a vizsgálatba vot összes csoportból kell a variaciát becsüli (pooled variace). A próba valószíűségi változója t-eloszlású, így a középértékek külöbségéek szigifikaciája a kritikus t-érték alapjá állapítható meg. Ameyibe a két csoport szórása szigifikása külöbözik, ilyekor a két összehasolítadó csoport variaciáját súlyozi kell a variacia becsléséhez (separate variacia). A próba valószíűségi változója ebbe az esetbe em t-eloszlású, ezért a szabadságfokokat Boferroi módszerével korrigáli kell, és ezt kell haszáli a középértékek külöbözőségéek elbírálásakor. A szabadságfokok korrekciója (Boferroi): df = ( s21 s ) 2 ( ) ( ) s s

137 KÖZÉPÉRTÉK-ÖSSZEHASONLÍTÓ PRÓBÁK Kétmitás F-próba a szóráségyzetre F=var1/var2 vagy F=var2/var1 A ullhipotézis: a variaciák egyelők, azaz a miták variaciái homogéek. Ameyibe az F-érték agyobb, mit 1,00, akkor a valószíűséget 1-alfakét kell értelmezi. Egyél kisebb számított F-értékél a baloldali valószíűség alfát adja. Midkét számításak ugyaazt az eredméyt kell adia. Példa: var1=143,67 var2=89,29 DF1=6 DF2=6 F=143,67/89,29=1,61 Végezzük el a számítást az R programmal. >1-pf(143.67/89.29,6,6) [1] F=89,29/143,67=0,62 > pf(89.29/143.67,6,6) [1] Mid a két számítással alfára 28,9%-ot kaptuk, ezért a variaciák homogeitását igazoltuk. Párosított t-próba Párosított t-próbát akkor haszáluk, ha a két mita elemei párokét összefüggek, pl. ugyaazo egyede két külöböző időpotba mérük egy tulajdoságot, vagy valamilye csoportképző tulajdoság alapjá párokat tuduk képezi. A két mita középértékéek azoossága helyett a párosított miták d külöbségéek (előjeles) várható értékére fogalmazzuk meg a H0 hipotézist. H0: d =0 Az előző eljárásokhoz hasolóa itt is z-, ill. t-próbát alkalmazhatuk attól függőe, hogy ismert-e a d külöbségek eloszlása és szórása, illetve mekkora a mita elemszáma? Alkalmazhatósági feltételek: A d külöbségek eloszlása ormális

138 KÖZÉPÉRTÉK-ÖSSZEHASONLÍTÓ PRÓBÁK d ismeretle (a mitából számított) A párosított t-próba statisztikája: t= d sd / A próba t-eloszlású, DF=-1 szabadságfokú. A képletbe sd a párosított miták külöbségéek szórása, amelyet a mita alapjá becsülük. Példa: Egymitás t-próba a korábba bemutatott kefir adatoko. Nullhipotézis a kefir zsírtartalma 3%. Szigifikacia szit 5%. R paracs: t.test(zsir, mu=3, alterative='two.sided', cof.level=0.95). Eredméy: Oe Sample t-test data: zsir t = , df = 29, p-value = alterative hypothesis: true mea is ot equal to 3 95 percet cofidece iterval: sample estimates: mea of x A teszt alapjá el kell veti a ullhipotézist, mert a p-érték kisebb mit a vállalt elsőfajú hiba, ami 5% volt. Példa: Függetle kétmitás t-próba a kefir adatbáziso. Nullhipotézis: a két kefir márka ára megegyezik. Szigifikacia szit 5%. Először meg kell vizsgáli, hogy a két csoport variaciája megegyezik-e. Erre F-próbát haszálhatuk. Az F-próba R paracsa: var.test(ar[marka== Daoe ], ar[marka== Milli ], ratio = 1, alterative = "two.sided", cof.level = 0.95) A paracsba beállítottuk a két csoportot, Daoe és Milli, amelyek árait hasolítjuk össze. A ratio értéke egy, mivel feltételezzük az egyelőséget. Az alteratív hipotézis kétoldali, a kofidecia-szit 95%. Eredméy: F = , um df = 119, deom df = 119, p-value =

139 KÖZÉPÉRTÉK-ÖSSZEHASONLÍTÓ PRÓBÁK alterative hypothesis: true ratio of variaces is ot equal to 1 95 percet cofidece iterval: sample estimates: ratio of variaces Az F-próba megerősíti a ullhipotézist, mivel a számított elsőfajú hiba (p-value) jóval agyobb, mit 5%. erre a variaciák háyadosáak 95%-os kofideciaitervalluma is ráerősít, mivel ez a tartomáy körülöleli az egyet. Ezutá tehát függetle kétmitás t-próbát végezhetük egyelő szórásokkal. R paracs: t.test(ar[marka== Daoe ],ar[marka== Milli ],var.equal = TRUE, cof.level = 0.95) Eredméy: Two Sample t-test t = , df = 238, p-value = alterative hypothesis: true differece i meas is ot equal to 0 95 percet cofidece iterval: sample estimates: mea of x mea of y A függetle kétmitás t-próba igazolja a ullhipotézist. A p-érték agyobb, mit 5%. A két mita középérték külöbség 95%-os kofideciaitervalluma körülöleli a ullát, tehát a külöbség várható értéke 5%-os szigifikacia-szit mellett ulláak tekithető. Ameyibe az F-próba szigifikás lett vola, tehát a két mita variaciája külöbözik, akkor a függetle kétmitás t-próbát em egyelő variaciával kell elvégezi. Ezt az R paracsba a var.equal=false beállítással érhetjük el

140 KÖZÉPÉRTÉK-ÖSSZEHASONLÍTÓ PRÓBÁK R statisztika t.test(x,y,alterative,mu, paired,var.equal,cof.level) Studet-féle t-teszt. A függvéy egyik formája. x az adatok oszlopvektora y az adatok oszlopvektora alterative szöveges változó, amely megadja az alteratív hipotézist. pl. alterative = c( two.sided, less, greater ). Ezek közül lehet választai. Ameyibe em aduk meg semmit, alapbeállítás a kétoldali szimmetrikus alteratív hipotézis. mu A várhatóérték igaz értéke. pl. egymitás t-próbáál az elméleti vagy szabváy érték. Kétmitás t-próbáál a két mita átlagáak valódi külöbsége. paired logikai változó, értéke TRUE vagy FALSE. Ezzel lehet beállítai a párosított t-próbát. var.equal A két mita belső variaciája egyelő? Logikai változó, értéke TRUE vagy FALSE. cof.level Kofideciaitervallum, azaz 1-a. Alapbeállítás t.test(formula,data,subset,a.actio) Studet-féle t-teszt. A függvéy másik formája. formula pl. ár~régió. Az ár egy umerikus oszlopvektor, a régió faktor, amelyek csak két szitje va. Ameyibe több szitje létezik, szűri kell kettőre. data Opcioális változó. Az adatbázis eve. subset Nem kötelező megadi. Az adatbázis kisebb, szűrt része. a.actio A hiáyzó adatok részt vegyeek az elemzésbe? Alapbeállítás a hiáyzó adatok em veszek részt a számításkba

141 KÖZÉPÉRTÉK-ÖSSZEHASONLÍTÓ PRÓBÁK A t-próba ereje A statisztikai próba ereje a korábba defiiáltak szerit: a valódi d külöbség kimutatásáak valószíűsége. Ezt 1-b val jelöltük. Aál erősebb egy statisztikai próba, miél agyobb valószíűséggel mutatja ki a valódi hatást. A t-próbáál a t-érték valójába egy stadardizált hatás (Es, stadardised effect), amelyél két csoport átlagáak külöbségét osztjuk a külöbség várható értékéek szórásával. A stadardizált hatás agysága alapjá: kicsi 0,2 közepes 0,5 agy hatás 0,8 feletti Ameyibe a két csoport várható értéke megegyezik, a külöbségük várható értéke ulla körül mozog. Tehát, ha H0 igaz, t várható értéke ulla. A d valódi külöbség létezésekor a hatás kimutatásáak valószíűsége függ: a mita elemszámától a d agyságától a szórástól az elsőfajú hiba agyságától, azaz a szigifikacia-szittől a t-próba típusától (egymitás, kétmitás, párosított) alteratív hipotézistől (egyoldali vagy kétoldali) A feti téyezők zömét az aalízis megkezdése előtt tudjuk beállítai. Ilye a mita elemszáma, szigifikacia-szit, t-próba típusa, alteratív hipotézis. A szórás a vizsgált jeleség tulajdosága, ezt csak megbecsüli lehet. A valódi külöbség agyságáról csak előzetes iformációik lehetek, pl. korábbi szakirodalmi adatok alapjá. Vizsgálataik sorá agyo fotos előre tudi, hogy adott külöbséget mekkora valószíűséggel lehet kimutati. Ekkor tervezzük meg a kísérletet, felmérést, a miimális mitaelemszámot. Ebbe a fázisba kell eldötei, hogy egyáltalá érdemes-e hozzáfogi a vizsgálathoz. Ehhez először a másodfajú hiba agyságát kell meghatározi. Hogya? Meg kell határozi a d középértékű t-eloszlásál egy adott értékél kisebb értékek előfordulási valószíűségét. Mit jelet az adott érték? A kritikus t-értéket. Ha a kritikus t-értékél kisebb számított t-értéket kapuk, a ullhipotézist kell elfogadi akkor is, ha a d külöbség valóba létezik. Azt modhatjuk, hogy a ullhipotézis erősebb

142 KÖZÉPÉRTÉK-ÖSSZEHASONLÍTÓ PRÓBÁK 73. ábra. A ullhipotézis (kék) és a mukahipotézis (piros) A statisztikai próba erejét az R programba tudjuk megbecsüli. A programba a teloszlás függvéybe találuk egy cp (em cetrális paraméter) argumetumot. Ez a t-eloszlás közepét jeleti, eek segítségével tudjuk megbecsüli a másodfajú hibát. >pt(q, df, cp, lower.tail = TRUE, log.p = FALSE) Példa: Egy kísérletbe két csoportot hasolítaak össze, a miták elemszáma 30, szórásuk 2. Korábba tisztáztuk, ha a H0 igaz, akkor a t-érték várhatóa ulla, mivel a két csoport külöbségéek várható értéke ulla. Először számítsuk ki a kritikus t-értéket, szabadságfok 1+2-2=58. R paracs: >qt(1-0.05/2, 58) Azért 0,05/2, mert kétoldali szimmetrikus tesztet alkalmazuk. 2,00 értéket kapuk. Csak abba az esetbe fogjuk visszautasítai a H 0 hipotézist, ha eél agyobb számított t-értéket kapuk. Határozzuk meg az 1 valódi külöbség kimutatásáak valószíűségét. Először számítsuk ki a a t-statisztika értékét. 1/(s*gyök(2/))=1/(2*gyök(2/30))=1,

143 KÖZÉPÉRTÉK-ÖSSZEHASONLÍTÓ PRÓBÁK Aak a valószíűsége, hogy egy 1,94-es középértékű t-eloszlásál 2-él kisebb értéket kapuk (R paracs): >pt(2, 58, cp=1.94) Az eredméy 0.522, ez a másodfajú hiba valószíűsége, tehát a próba ereje 10,522=0,478, azaz 48%-s valószíűséggel lehet kimutati a valódi 1 külöbséget a két csoport között. Ez agyo kicsi érték, ezért em érdemes elvégezi a vizsgálatot, eleve kudarcra va ítélve. 74. ábra. A t-próba ereje a stadard hatások függvéyébe, kék voal kritikus térték A 74. ábrá jól látszik, hogy 3 feletti érték eseté a próba ereje 80%-ál agyobb. Háromál agyobb stadard hatás kimutatását már érdemes elvégezi. Mit kell tei, ha az eredeti 1,94 stadard hatást ki szereték mutati? A mitaelemszámot kell öveli. Ameyibe legalább 80%-os valószíűséggel szereték igazoli, ahhoz miimum 64 elemű mitát kell vei midkét csoportból. Az R statisztikába a próba erejéek meghatározására külö paracs létezik. A példákra alkalmazva: >power.t.test( = 30, delta = 1, sd = 2, sig.level = 0.05, type =c("two.sample"), alterative = c(two.sided"), strict = FALSE)

144 KÖZÉPÉRTÉK-ÖSSZEHASONLÍTÓ PRÓBÁK Eredméy: Two-sample t test power calculatio delta sd sig.level power alterative = = = = = = two.sided NOTE: is umber i *each* group A paracs hat paramétere közül, ha ötöt megaduk, a hatodik kiszámításra kerül. A statisztikai próba ereje a power felirat mellett található. Ez az érték tökéletese egyezik a korábba kiszámítottal. 75. ábra. A t-próba ereje a valódi külöbség függvéyébe

145 VARIANCIA-ANALÍZIS Variacia-aalízis A variacia-aalízis a t-próba kiterjesztése kettőél több mita esetére. Tehát három vagy több mitával redelkezük. Midegyik mita egy csoportképző ismérv egy-egy szitjét reprezetálja. Pl. külöböző kefir márkák. A márkáko belül egy skála típusú változó várható értékét vizsgálhatjuk. Megvizsgálhatjuk, hogy a külöböző kefirek várható eladási árai, zsírtartalmai, fehérjetartalmai, stb. megegyezek-e. Ez azt jeleti, hogy a skála típusú változó em függ a omiális, csoportképző változótól. A függőváltozó a variacia-aalízis modellbe midig valamilye skála típusú, a függetle változó(k) omiális mérési szitűek. Ameyibe az árak, stb. em egyezek meg a külöböző kefirekél, akkor összefüggés va közöttük, és a márkákkal részbe magyarázhatjuk a külöbségeket. A magyarázat a függő változó teljes heterogeitásáak 1 két részre botását jeleti. A teljes heterogeitás egyik része az, amelyek okai a függetle változók, a másik heterogeitás-rész pedig az, amelyek okait az egyéb, általuk em vizsgált téyezők tartalmazzák. Ez utóbbit sokszor a véletle hatásakét is emlegetik. A heterogeitás mérésére korábba többféle mérőszámot ismertettük, ismétléskét a legfotosabbak az alábbiak: (1) terjedelem (rage); a legagyobb és legkisebb érték közötti távolság 1 N xi x ; i 1 (2) átlagos eltérés; δ N N 1 (3) szórás; σ N xi x ; i 1 2 (4) variacia- vagy szóráségyzet; σ N xi x. N i 1 Alapfogalmak Nézzük át azokat az alapfogalmakat, amelyeket a variacia-aalízis sorá haszáluk. a) Faktor: Faktorak evezzük a vizsgálatba bevot függetle változókat, pl. külöböző kezeléseket, téyezőket, ilye a kefir márka. Kísérletekbe ikább kezelésekek hívjuk. b) Faktor szit: A faktor értékkészletéek az eleme, mely beállítása mellett vizsgálhatjuk meg a függő változókat. A kezelések szitjei, pl. kefir márká belül Daoe, Milli, Müller, stb. Kísérletbe pl. műtrágyaadagok. c) Kvalitatív és kvatitatív faktorok: Ha a faktorszitek em umerikusak vagy itervallum skálájúak, akkor kvalitatív, ellekező esetbe kvatitatív faktorokról beszélük. d) Cellák: Egyfaktoros modellekbe a cellák megfelelek a faktorok szitjeiek, többfaktoros esetbe a figyelembe vett faktorok szitjeiből előálló kombiációk a cellák. Pl. amikor a 2 faktor műtrágyaadagok és ötözési módok, akkor a cellák a (műtrágyaadagok, ötözési módok) összes lehetséges kombiációjából állak. 1 A változó heterogeitása azt jeleti, hogy az adott változó em kostas

146 VARIANCIA-ANALÍZIS e) Iterakció: Két függetle változó kapcsolatába akkor áll fe iterakció (kölcsöhatás), ha x1 változó hatása függ az x2 változó szitjétől és fordítva. f) Egyszempotos variacia-aalízis: Variacia-aalízis, ahol csak egy faktor va. Egyutasak is evezik g) Többszempotos variacia-aalízis: Variacia-aalízis, ahol kettő vagy több faktor va. h) Egyváltozós variacia-aalízis: amelybe csak egy függő változót vizsgáluk. i) Többváltozós variacia-aalízis: amelybe kettő vagy több függő változót elemzük. A lieáris modell Alkossuk meg az egytéyezős variacia-aalízis matematikai modelljét. Egy kísérletbe k számú kezeléssel vagy populációval és r számú ismétléssel redelkezük. Az adataik száma tehát =k*r. Mide mért adat yij felbotható három összetevőre, amelyek: a kísérlet főátlaga ( ), a kezeléshatás (Ai), és a meg em magyarázott rész, a maradék (eij). A maradéktagokat hibáak is evezik (error). Az egytéyezős lieáris modell: y ij = μ A i e ij Valójába a kezeléshatás az és Ai összege. Ez a kettő adja a lieáris modellel becsült értéket, azaz a modellezett értéket. Az Ai a kísérlet főátlagtól vett eltérést jeleti (kezeléshatás-főátlag). A korábba taultak szerit az alapadatok átlagtól vett eltéréseiek összege ulla. Ez a lieáris modellre is igaz, a kezeléshatások összege ulla, vagyis a kezelések szimmetrikusak a főátlagra. Az eij maradéktagok tulajdoságai agyo fotosak, amelyek egybe megegyezek a variacia-aalízis alkalmazhatósági feltételeivel, melyeket a következőkbe ismertetük. A variacia-aalízis alkalmazásáak feltételei Az alkalmazhatósági feltételek a maradéktagokra voatkozak: (a) Az egyes kezelésekhez tartozó maradékokak függetleekek kell leiük a blokk, a kezeléshatástól és a függő változótól. Ezt legikább a kísérleti elredezéssel, radomizálással biztosíthatjuk. A függetleség azt jeleti, hogy a maradékok agyságát em befolyásolhatja a kezelés. Ameyibe hatással va rá, akkor ez keveredhet a kezeléshatással, és torz becslést kapuk, helytele becsült értékeket foguk előállítai. (b) Az e ij maradék ormális eloszlású, ulla várható értékű valószíűségi változó. Attól, hogy egy ormál-eloszlású mitához egy kostas értéket hozzáaduk, vagy abból levouk, az eloszlás és a mita szórása em változik. A ormalitást korábba ismertetett módszerek valamelyikével elleőrizhetjük. (Megjegyezzük, hogy a matematikai-statisztikai kéziköyvek az ANOVA-t robusztus eljárásak tekitik, s azt állítják, hogy a függő változóak em kell ormális eloszlásúak leie). Ha matematikailag korrekt módo akarjuk az ANOVA-t haszáli, akkor a függő változót ormális eloszlásúvá traszformálhatjuk. Azért kell

147 VARIANCIA-ANALÍZIS ormáliseloszlásúak leie, mert a hatások megítélésekor a ormál-eloszlás tulajdoságait haszáljuk fel, az eloszlás evezetes értékeit. (c) A maradékok szóráségyzetei a kezeléskombiációko belül azoosak σ12 σ σ 2, azaz homoszkedasztikus a modell. (Az R programba ezt a homogeitást a Levee teszt alapjá tesztelhetjük.) A variacia-aalízis alkalmazásáak lépései A variacia-aalízis modell felállítása Szigifikacia-szit megválasztása A variacia-aalízis kiszámítása, az F-próba A modell érvéyességéek elleőrzése Ameyibe az F-próba szigifikás, középértékek többszörös összehasolítása A középértékre voatkozó hipotézisek a következők: H 0 : azokak a populációkak a középértékei, amelyekből a miták származak azoosak: μ1 μ 2... μ k H A : létezik legalább egy olya középérték pár, ahol a középértékek em tekithetők azoosak, legalább egyszer: μi μ j. Az aalízis megkezdése előtt ábrázoli kell az alapadatokat. Olya ábrát érdemes készítei, amelybe a várhatóérték mellett a középérték hibáját (se) is ábrázoljuk (76. ábra). Erre azért va szükség, mert ha csak az átlagokat tütetjük fel az y-tegely léptékétől függőe agyo kicsi külöbségeket is fel lehet agyítai, és a jeletős külöbségeket is el lehet tüteti. A stadardizált hatások, amit az agol szakirodalomba stadard effect éve emlegetek, em más mit a kezeléshatás osztva a szórással, igadozással. Ez azt mutatja, hogy a kezeléshatás, hogya aráylik a szóráshoz, azaz a véletle igadozáshoz. Az így meghatározott stadard hatások agyságát a korábba ismertetett módo ítélhetjük meg

148 VARIANCIA-ANALÍZIS 76. ábra. Kezelésátlagok és a középértékek hibái (se) 1. A variacia-aalízis modell felállítása A módszer alapgodolata szerit a modellbe a mérési, megfigyelési értékeket összegkét képzeljük el. Az megfigyelés midegyikére a korábba ismertetett modellegyelet írható fel, amelyek alapjá a mitaelemeke mért, ill. megfigyelt yij értékek felbothatók a modell által meghatározott részekre és a hibára. A modell által meghatározott rész a szisztematikus hatásokat tartalmazza, a hibakompoes pedig a véletle hatást jeleti. A variacia-aalízis legegyszerűbb modelljébe a vizsgálatba szereplő k számú populációból egyszerűe r elemű véletle mitát veszük, majd a mitákéti középértékeket hasolítjuk össze, ezt evezzük egyszempotos variacia-aalízisek (kísérlet eseté teljese véletle elredezések). Az elredezés modellegyelete: y ij = μ A i e ij ahol Xij az i -edik mita j -edik eleme i 1,..., j 1,..., ri ; a kísérlet vagy mita főátlaga; Ai az i-edik mitához tartozó populáció hatása (övelheti vagy csökketheti a főátlagot); eij véletle hatás. Ebbe a modellbe a modell által meghatározott rész, csak az i -edik mitához tartozó populáció várható értékét tartalmazza, tehát szisztematikus külöbséget csak a populációk várható értékei között tételezhetük fel. A véletle okozta hatásokat a hibakompoes tartalmazza. Ameyibe teljesülek a variacia-aalízis alkalmazásáak feltételei, akkor Ai összege ulla, és eij ormális eloszlású ulla várhatóértékű sokaság, és függetle a blokk és kezeléshatástól, valamit a modell homoszkedasztikus. 2. Szigifikacia-szit megválasztása A szigifikacia-szit agyságát leggyakrabba 5%-ak választják. Ez az érték szerepel legtöbb statisztikai programba is kezdeti értékkét. Ameyibe túl szigorúak ítéljük ezt, választhatuk 10%-os szitet is. Ebbe az esetbe a kezelés okozta valódi hatások kimutatásáak agyobb a valószíűsége. Természetese az elsőfajú hiba ilyekor 5-ről 10%-ra ő. A szigifikacia-szitet választhatjuk 1 vagy 0,1%-ak is. Ezek már agyo

149 VARIANCIA-ANALÍZIS szigorú feltételek, alig követük el elsőfajú hibát, de aál agyobb a valószíűsége a másodfajú hibáak. Elméletileg bármilye szigifikacia-szitet választhatuk, ha szakmailag meg tudjuk idokoli. Ameyibe eldötöttük az elsőfajú hiba agyságát, meg tudjuk határozi a kritikus F-értéket. A kritikus F-érték az a legagyobb érték, amelyet a véletle igadozás mellett kaphatuk. Eél kisebb érték eseté a H 0-t kell elfogadi. 3. A variacia-aalízis kiszámítása, az F-próba Az Excel táblázatkezelő eredméytáblázatába az alábbi fogalmakkal találkozuk (a számításhoz szükséges beállításokat a példába ismertetjük): Téyezők: a variacia okai Eltérés-égyzetösszegek (SS) Csoportok között: kezelésátlagok eltérés-égyzetösszegei * r. Csoporto belüli: kezeléseke belül az eltérés-égyzetösszegek összege Összes: alapadatok eltérés-égyzetösszegei Szabadságfokok: Csoportok között: k-1 Csoporto belül: -k Összese: -1 Variaciák: eltérés-égyzetösszegek osztva a szabadságfokokkal. F-próba F= MS cs.között MScs.belül Az F-eloszlás sűrűségfüggvéyét mutatja a 77. ábra. Az x-tegelye az F-értékek, az ytegelye a valószíűségek láthatók. A függőleges kék voal mutatja a kritikus F-értéket. Ezt a szigifikacia-szit és a két szabadságfok ismeretébe tudjuk meghatározi. Korábba említettük, ha eél kisebb a számított F, akkor a ullhipotézist kell elfogadi. Az ábrá a függőleges piros voal a számított F-értéket mutatja. Ez jóval agyobb, mit a kritikus, ezért már em tekithető a véletle igadozás hatásáak, a ullhipotézist vissza kell utasítai. Mi az elsőfajú hiba elkövetéséek valószíűsége ebbe az esetbe? Az 5,84 értékél agyobb értékek előfordulási valószíűsége. Példákba ez em éri el a 0,1%-t sem, ezért yugodta elvethetjük a ullhipotézist. Mikor szigifikás az F-próba? Ameyibe szakmailag teljese korrektek akaruk lei, akkor azt kell válaszoli, ha létezik legalább egy szigifikás kotraszt a csoportok között. A kotraszt egy lieáris összehasolító függvéy. A függvéy együtthatóiak összege ulla

150 VARIANCIA-ANALÍZIS 77. ábra. F-eloszlás sűrűségfüggvéye R statisztika model=aov(ar~marka, data=kefir) Egytéyezős variacia-aalízis modelljéek megalkotása. Skála típusú változó ár, csoportképző a márka. Adatbázis a kefír. summary(model) A variacia-aalízis eredméytáblázata. model.tables(model,"meas", se=t) Margiális átlagok számítása. model.tables(model,"effects", se=t) Kezeléshatások becslése, azaz az Ai-k számítása, valamit a stadard hiba. residuals(model) Maradékok. A variacia-aalízis eredméy táblázata Df Sum Sq Mea Sq F value Pr(>F) *** marka Residuals --Sigif. codes: 0 *** ** 0.01 * Az R programba először a szabadságfokok, eltérés-égyzetösszegek, variaciák, majd a számított F-érték és az ehhez tartozó valószíűség kerülek meghatározásra. A Pr(>F)

151 VARIANCIA-ANALÍZIS kifejezést úgy olvashatjuk: mi aak a valószíűsége, hogy véletleül a számított Fértékél agyobbat kapuk? 0,06%, ezért yugodta visszautasíthatjuk a ullhipotézist. A szigifikás hatást szimbólumokkal is jelölik. ***=0,1%, **=1%, *=5%,.=10% szigifikacia-szitek felel meg. Margiális átlagok, a csoport átlagokat mutatják. Tables of meas Grad mea marka Daoe Jogobella Milli Muller A középérték külöbségek hibáit mutatja a leti táblázat. Meghatározása: gyök(2*ms error/r). A példába: gyök(2*22,61/120)=0,6137. Az LSD teszt ezt haszálja. Stadard errors for differeces of meas marka replic. 120 A kezeléshatások a főátlagtól vett eltéréseket jeletik. Ezek összegéek ulláak kell lei. Értelmezésük: az átlagos kefir árakhoz képest a márkák árai hogya alakulak. Az előjelekre figyeli kell. Pl. a Milli 1,18 Ft-tal olcsóbb az átlaghoz viszoyítva. Tables of effects marka marka Daoe Jogobella Milli Muller A hatások stadard hibája. Stadard errors of effects marka replic A modell érvéyességéek elleőrzése Függetleség vizsgálatot a maradékok leíró statisztikájáak és ábrázolásáak segítségével végezhetjük el. Számítsuk ki a maradékok átlagát és variaciáját kezelésekét. A maradékok ábrázolása szemléletese mutatja az alkalmazhatósági feltétel teljesülését. Az R programba az alábbi utasítást haszálhatjuk: >boxplot(residuals(model)~marka, ylab="maradék ár (Ft)")

152 VARIANCIA-ANALÍZIS 78. ábra. Maradékok a kezelés függvéyébe Ábrázoljuk a maradékokat a megfigyelt és becsült értékek függvéyébe. >plot(ar, residuals(model)) 79. ábra. Maradékok a megfigyelt értékek függvéyébe

153 VARIANCIA-ANALÍZIS A 79. ábra a függő változó és a maradékok közötti összefüggést mutatja. Jól látszik, hogy szoros lieáris összefüggés áll fe. Az ár övekedésével, ő a modell hibája, tehát a függetleség em teljesül. Mi lehet eek az oka? Vagy a modell em jó, vagy em alkalmazható a variacia-aalízis erre a problémára. 80. ábra. Maradékok hisztogramja Akkor em jó a modell, ha valamilye egyéb fotos téyezőt em vettük figyelembe. Lehet, hogy a márkák hatásá kívül egyéb ok is erőse befolyásolja a kefir árát, pl. hogy melyik boltba vásároltuk. Ameyibe ez így va, akkor már em elég az egyszempotos variacia-aalízis, a modellt módosítai kell, kétszempotos variacia-aalízist kell alkalmazi. Normális eloszlás tesztelését grafikusa és umerikusa végezzük. Grafikus ormalitás vizsgálatál hisztogramot és Q-Q ábrát haszálhatuk. A 80. ábra alapjá a maradékok ormális eloszlásúak ézek ki. A leggyakoribb értékek a ulla körül helyezkedek el, és ettől balra és jobbra szimmetrikusa egyre kisebb gyakorisággal fordulak elő az abszolút értékbe agy maradékok. A Q-Q ábra is megerősíti az előbbi feltételezést. Az elméleti átlós zöld voal meté helyezkedek el a maradékok, jeletős eltérés em tapasztalható

154 VARIANCIA-ANALÍZIS 81. ábra. Normál kvatilis ábra Numerikus ormalitás vizsgálatál Kolmogorov-Smirov és Shapiro-Wilk tesztet lehet haszáli. Az előző tesztet agyszámú adat, míg az utóbbit 50 alatti megfigyelés eseté haszálhatjuk. Példákba több száz megfigyeléssel redelkezük, ezért a KolmogorovSmirov tesztet alkalmazzuk. Kolmogorov-Smirov teszt az R-be: >ks.test(residuals(model),"porm",mea(residuals(model)), sd(residuals(model))) Oe-sample Kolmogorov-Smirov test data: residuals(model) D = , p-value = alterative hypothesis: two-sided A teszt a ullhipotézist megerősíti, a maradékok eloszlása em tér el szigifikása a ormál-eloszlástól. A p-érték 0,3085, amely jóval agyobb, mit az előre vállalt elsőfajú hiba agysága. Homoszkedasztikusság vizsgálata sorá a kezeléskombiációko belüli variaciát hasolítjuk össze. Nullhipotézisük, hogy a maradékok variaciái egyelők. Erre többféle teszt is létezik, mi a Levee-tesztet fogjuk haszáli. A leti példa egy kéttéyezős variacia-aalízis homoszkedasztikusságáak vizsgálatát mutatja be. Ebbe az esetbe a kezeléskombiációko belül kell a variaciákak egyelőekek lei. A csoportok szabadságfoka: kezeléskombiációk-1. Esetükbe égy kefir márka és égy bolt eseté 15. A számított F-érték egy körüli, 1,0195, ami a véletleek tudható be

155 VARIANCIA-ANALÍZIS >leveetest(residuals(model)~marka*bolt, ceter=mea) Levee's Test for Homogeeity of Variace (ceter = mea) Df F value Pr(>F) group A teszt megerősíti a ullhipotézist, a maradékok variaciái egyelők. Ameyibe a Levee-teszt szigifikás külöbséget mutat a maradékok variaciái között, em haszálhatuk klasszikus variacia-aalízist. Helyette robusztus tesztet kell választai, pl. Welch-próbát vagy Brow-Forsythe tesztet. Ameyibe az előbb tárgyalt három alkalmazhatósági feltétel közül az egyik em teljesül, em végezhetük variacia-aalízist. Ebbe az esetbe más statisztikai eljárást kell választai. Mi lehet az oka a feltételek em teljesüléséek? A ormalitás és homoszkedasztikusság sokszor a kiugró értékek miatt em teljesül. Ezért a számítások megkezdése előtt feltétleül elleőrizi kell őket. 5. Ameyibe az F-próba szigifikás, középértékek többszörös összehasolítása Ameyibe a variacia-aalízis a kezelésátlagok közötti egyelőséget em igazolja, meg kell határozi, hogy mely kezelések között va szigifikás külöbség. Párokét össze kell hasolítai a kezeléskombiációkat. A középérték-összehasolító tesztekek kétféle típusa létezik: előzetes u. a priori kotrasztok az aalízis utá számítható, post hoc tesztek Ezek közül csak a post hoc teszteket tárgyaljuk. Ezekek is két agy csoportja létezik. Ameyibe a csoportok szórásai megegyezek, haszálhatjuk az alábbiakat: LSD Tukey Boferroi Scheffe Duett Studet-Newma-Keuls Duca Ameyibe a csoportok szórásai külöbözek, haszálhatjuk a Tamhae tesztet, vagy a korábba említett Welch-próbát vagy Brow-Forsythe tesztet. A fet bemutatott teszteke kívül még sok egyéb is létezik, midegyik más-más alkalmazhatósági feltétel mellett haszálható. Köyvük keretébe csak az LSD és Tukey tesztet tárgyaljuk részletese. Az LSD, azaz legkisebb szigifikás differecia hazákba az egyik leggyakrabba haszált középérték összehasolító teszt. Meghatározása a hiba MS (a maradékok variaciája) alapjá törtéik. Mikor haszálhatjuk ezt a tesztet? Abba az esetbe, ha a számítások előtt kiválasztuk két kombiációt, és azokat hasolítjuk össze. Az LSD tesztél az elsőfajú hiba párokét rögzített. Ameyibe több párokéti összehasolítást végzük egyszerre, azaz szimultá, akkor a teljes vizsgálat so

156 VARIANCIA-ANALÍZIS rá az elsőfajú hiba ői fog. A hiba aál agyobb lesz, miél több összehasolítást végzük. Ezzel párhuzamosa a másodfajú hiba csökkei fog. Eek hatására agyo sokszor tévese kezeléshatásokat állapítuk meg, amelyek a valóságba em létezek. Szigifikás differecia képlete (5%): SzD 5% =t 5% 2MShiba r A feti képlet az 5%-s szigifikás differeciát mutatja, ameyibe 10 vagy 1%-ost szereték meghatározi, akkor a t-értéket az adott szigifikacia-szit mellett kell meghatározi. A gyökjel alatti r az ismétlések száma. Az SzDp% tehát az a legagyobb távolság két csoport átlaga között, amely még a véletle igadozásak tudható be. Ameyibe eél kisebb a két középérték külöbsége, akkor a középértékek statisztikailag egyformáak tekitedők. A ullhipotézist csak akkor utasíthatjuk vissza, ha az SzD p%-ál agyobb külöbséget kapuk. A feti képletbe a gyökjel alatti kompoesek a variacia-táblázatba találhatók meg, a t-érték meghatározása az Excelbe az iverz.t(szig; szf) függvéy segítségével törtéhet. Tukey-teszt: studetizált terjedelme alapuló teszt, az r- elemű részcsoportokat ugyaazzal a kritikus értékkel hasolítja össze. Itt a teljes vizsgálat elsőfajú hibája rögzített (familywise error), és az egyes összehasolítások elsőfajú hibája k övekedésével csökke, s így a másodfajú ő. Példa az Excelbe: 82. ábra: Az egytéyezős variacia-aalízis párbeszédablaka Az Excel táblázatkezelő programba a variacia-aalízist az Adatelemzés modulo keresztül érhetjük el. Ez a modul a 2003-as verzióba az Eszközök, a 2007-es és későbbi verziókba az Adatok meü alatt található. Ameyibe em látjuk, akkor telepítei kell a beépülőt (Eszközök, Bővítméykezelő, Aalysis ToolPak). Az Adatelemzés párbeszédablakba külöböző eljárások találhatók, mi ezek közül a legelsőt, az Egytéyezős variaciaaalízist fogjuk haszáli

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x

Részletesebben

Kutatói pályára felkészítı modul

Kutatói pályára felkészítı modul Kutatói pályára felkészítı modul Kutatói pályára felkészítı kutatási ismeretek modul Tudomáyos kutatási alapayag feldolgozása, elemzési ismeretek KÖRNYEZETGAZDÁLKODÁSI MÉRNÖKI MSc TERMÉSZETVÉDELMI MÉRNÖKI

Részletesebben

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum) Az átlagra voatkozó megbízhatósági itervallum (kofidecia itervallum) Határozzuk meg körül azt az itervallumot amibe előre meghatározott valószíűséggel esik a várható érték (µ). A várható értéket potosa

Részletesebben

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak Valószíűségszámítás és statisztika előadás ifo. BSC/B-C szakosokak 6. előadás október 16. A matematikai statisztika tárgya Következtetések levoása adatok alapjá Ipari termelés Mezőgazdaság Szociológia

Részletesebben

STATISZTIKA I. x ÁR. x ÁR. x ÁR. x ÁR. Számosállat. Egységhozam. Termelési érték, árbevétel. Az ár. Hogyan lehet ezeket összehasonlítani?

STATISZTIKA I. x ÁR. x ÁR. x ÁR. x ÁR. Számosállat. Egységhozam. Termelési érték, árbevétel. Az ár. Hogyan lehet ezeket összehasonlítani? Hogya lehet ezeket összehasolítai? STATSZTKA. 8. Előadás dexek, adatábrázolás 2/22 Számosállat Egységhozam Állatteyésztési, statisztikai, valamit üzemszervezési mértékegység, amely külöböző fajú, fajtájú,

Részletesebben

BIOMATEMATIKA ELŐADÁS

BIOMATEMATIKA ELŐADÁS BIOMATEMATIKA ELŐADÁS 10. A statisztika alapjai Debrecei Egyetem, 2015 Dr. Bérczes Attila, Bertók Csaád A diasor tartalma 1 Bevezetés 2 Statisztikai függvéyek Defiíció, empirikus várható érték Empirikus

Részletesebben

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje. 24. tétel valószíűségszámítás elemei. valószíűség kiszámításáak kombiatorikus modellje. GYORISÁG ÉS VLÓSZÍŰSÉG meyibe az egyes adatok a sokaságo belüli részaráyát adjuk meg (törtbe vagy százalékba), akkor

Részletesebben

Matematikai statisztika

Matematikai statisztika Matematikai statisztika PROGRAMTERVEZŐ INFORMATIKUS alapszak, A szakiráy Arató Miklós Valószíűségelméleti és Statisztika Taszék Természettudomáyi Kar 2019. február 18. Arató Miklós (ELTE) Matematikai statisztika

Részletesebben

STATISZTIKA I. Mintavétel fogalmai. Mintavételi hiba. Statisztikai adatgyűjtés Nem véletlenen alapuló kiválasztás

STATISZTIKA I. Mintavétel fogalmai. Mintavételi hiba. Statisztikai adatgyűjtés Nem véletlenen alapuló kiválasztás Mintavétel fogalmai STATISZTIKA I.. Előadás Mintavétel, mintavételi technikák, adatbázis A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x n, mindig

Részletesebben

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet A biostatisztika alapfogalmai, kofideciaitervallum Dr. Boda Krisztia PhD SZTE ÁOK Orvosi Fizikai és Orvosi Iformatikai Itézet Mitavétel ormális eloszlásból http://www.ruf.rice.edu/~lae/stat_sim/idex.html

Részletesebben

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika BIOSTATISZTIKA ÉS INFORMATIKA Leíró statisztika Első közelítésbe a statisztikai tevékeységeket égy csoportba sorolhatjuk, de ezek között ics éles határ:. adatgyűjtés, 2. az adatok áttekithetővé tétele,

Részletesebben

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai 05..04. szórások vizsgálata z F-próba Hogya foguk hozzá? Nullhipotézis: a két szórás azoos, az eltérés véletle (mitavétel). ullhipotézishez tartozik egy ú. F-eloszlás. Szabadsági fokok: számláló: - evező:

Részletesebben

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya Matematikai statisztika előadás survey statisztika MA szakosokak 206/207 2. félév Zempléi Adrás. előadás: Bevezetés Irodalom, követelméyek A félév célja Matematikai statisztika tárgya Törtéet Alapfogalmak

Részletesebben

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük. Statisztikai módszerek. BMEGEVGAT01 Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudomáyi Egyetem Gépészméröki Kar Hidrodiamikai Redszerek Taszék 1111, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:

Részletesebben

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia Valószíűségszámítás és statisztika előadás ifo. BSC/B-C szakosokak 6. előadás október 5. Megjegyzések. A tétel feltételei gyegíthetőek: elég, ha a függetle, azoos eloszlású változók várható értéke véges.

Részletesebben

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat Kísérlettervezés - biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert u-próba Feltétel: egy ormális eloszlású sokaság σ variaciájáak számszerű értéke ismert. Hipotézis: a sokaság µ várható értéke

Részletesebben

Statisztika 1. zárthelyi dolgozat március 21.

Statisztika 1. zárthelyi dolgozat március 21. Statisztika 1 zárthelyi dolgozat 011 március 1 1 Legye X = X 1,, X 00 függetle mita b paraméterű Poisso-eloszlásból b > 0 Legye T 1 X = X 1+X ++X 100, T 100 X = X 1+X ++X 00 00 a Milye a számra igaz, hogy

Részletesebben

A matematikai statisztika elemei

A matematikai statisztika elemei A matematikai statisztika elemei Mikó Teréz, dr. Szalkai Istvá szalkai@almos.ui-pao.hu Pao Egyetem, Veszprém 2014. március 23. 2 Tartalomjegyzék Tartalomjegyzék 3 Bevezetés................................

Részletesebben

Matematika B4 I. gyakorlat

Matematika B4 I. gyakorlat Matematika B4 I. gyakorlat 2006. február 16. 1. Egy-dimeziós adatredszerek Va valamilye adatredszer (számsorozat), amelyről szereték kiszámoli bizoyos dolgokat. Az egyes értékeket jelöljük z i -vel, a

Részletesebben

Rudas Tamás: A hibahatár a becsült mennyiség függvényében a mért pártpreferenciák téves értelmezésének egyik forrása

Rudas Tamás: A hibahatár a becsült mennyiség függvényében a mért pártpreferenciák téves értelmezésének egyik forrása Rudas Tamás: A hibahatár a becsült meyiség függvéyébe a mért ártrefereciák téves értelmezéséek egyik forrása Megjelet: Agelusz Róbert és Tardos Róbert szerk.: Mérésről mérésre. A választáskutatás módszertai

Részletesebben

Statisztikai hipotézisvizsgálatok

Statisztikai hipotézisvizsgálatok Statisztikai hipotézisvizsgálatok. Milye problémákál haszálatos? A gyakorlatba agyo gyakra szükségük lehet arra, hogy mitákból származó iformációk alapjá hozzuk sokaságra voatkozó dötéseket. Például egy

Részletesebben

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér 13. www.u-szeged.hu www.palyazat.gov.

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér 13. www.u-szeged.hu www.palyazat.gov. Pályázat címe: Új geerációs sorttudomáyi kézés és tartalomfejlesztés, hazai és emzetközi hálózatfejlesztés és társadalmasítás a Szegedi Tudomáyegyeteme Pályázati azoosító: TÁMOP-4...E-5//KONV-05-000 Sortstatisztika

Részletesebben

Statisztika 1. zárthelyi dolgozat március 18.

Statisztika 1. zárthelyi dolgozat március 18. Statisztika. zárthelyi dolgozat 009. március 8.. Ismeretle m várható értékű, szórású ormális eloszlásból a következő hatelemű mitát kaptuk:, 48 3, 3, 83 0,, 3, 97 a) Számítsuk ki a mitaközepet és a tapasztalati

Részletesebben

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat. Zavar és mita Zavar (cofoudig): akkor lép fel egy kísérletbe, ha a kísérletet végző em tudja megkülöbözteti az egyes faktorokat. Zavar és mita Zavar (cofoudig): akkor lép fel egy kísérletbe, ha a kísérletet

Részletesebben

2. Hatványsorok. A végtelen soroknál tanultuk, hogy az. végtelen sort adja: 1 + x + x x n +...

2. Hatványsorok. A végtelen soroknál tanultuk, hogy az. végtelen sort adja: 1 + x + x x n +... . Függvéysorok. Bevezetés és defiíciók A végtele sorokál taultuk, hogy az + x + x + + x +... végtele összeg x < eseté koverges. A feti végtele összegre úgy is godolhatuk, hogy végtele sok függvéyt aduk

Részletesebben

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet): A umerikus sorozatok fogalma, határértéke (A TÁMOP-4-8//A/KMR-9-8 számú projekt keretébe írt egyetemi jegyzetrészlet): Koverges és diverges sorozatok Defiíció: A természetes számoko értelmezett N R sorozatokak

Részletesebben

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések! ORVOSI STATISZTIKA Az orvos statsztka helye Életta Aatóma Kéma Lehet kérdés?? Statsztka! Az orvos dötéseket hoz! Mkor jó egy dötés? Meyre helyes egy dötés? Mekkora a tévedés lehetősége? Példa: test hőmérséklet

Részletesebben

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Statisztika

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Statisztika Statisztika A statisztika adatok gyűjtésével, redszerezésével, illetve adatsorok elemzésével, szemléltetésével foglalkozik. Adatok redszerezése DEFINÍCIÓ: (Populáció) Populációak (statisztikai sokaságak)

Részletesebben

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk;

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk; Statisztika Tegyük fel, hogy va egy halmazuk, és tekitsük egy vagy több valószíűségi változót, amelyek a halmaz mide elemé felveszek valamilye értéket. A halmazt populációak vagy sokaságak evezzük. Példák:

Részletesebben

A statisztika részei. Példa:

A statisztika részei. Példa: STATISZTIKA Miért tauljuk statisztikát? Mire haszálhatjuk? Szakirodalom értő és kritikus olvasásához Mit állít egyáltalá a cikk? Korrektek-e a megállaítások? Vizsgálatok (kísérletek és felmérések) tervezéséhez,

Részletesebben

PÉLDATÁR A SZÁMÍTÓGÉPES TESZTHEZ. Írta Dr. Huzsvai László

PÉLDATÁR A SZÁMÍTÓGÉPES TESZTHEZ. Írta Dr. Huzsvai László PÉLDATÁR A SZÁMÍTÓGÉPES TESZTHEZ Írta Dr. Huzsvai László Debrece 2012 Tartalomjegyzék Bevezetés...1 Viszoyszámok...1 Középértékek (átlagok)...2 Szóródási mutatók...4 Idexek...7 Furfagos kérdések...8 Bevezetés

Részletesebben

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet Függetleségvizsgálat Virág Katali Szegedi Tudomáyegyetem, Bolyai Itézet Függetleség Függetleség Két változó függetle, ha az egyik változó megfigyelése a másik változóra ézve em szolgáltat iformációt; azaz

Részletesebben

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes

Részletesebben

Ingatlanfinanszírozás és befektetés

Ingatlanfinanszírozás és befektetés Nyugat-Magyarországi Egyetem Geoiformatikai Kar Igatlameedzser 8000 Székesfehérvár, Pirosalma u. 1-3. Szakiráyú Továbbképzési Szak Igatlafiaszírozás és befektetés 2. Gazdasági matematikai alapok Szerzı:

Részletesebben

Statisztika. Eloszlásjellemzők

Statisztika. Eloszlásjellemzők Statsztka Eloszlásjellemzők Statsztka adatok elemzése A sokaság jellemzése középértékekkel A sokaság jellemzéséek szempotja A sokaság jellemzéséek szempotja: A sokaság tpkus értékéek meghatározása. Az

Részletesebben

Az új építőipari termelőiár-index részletes módszertani leírása

Az új építőipari termelőiár-index részletes módszertani leírása Az új építőipari termelőiár-idex részletes módszertai leírása. Előzméyek Az elmúlt évekbe az építőipari árstatisztikába egy új, a korábba haszálatos költségalapú áridextől eltérő termelői ár alapú idexmutató

Részletesebben

kismintás esetekben vagy olyanokban, melyeknél a tanulóalgoritmust tesztadatokon szeretnénk

kismintás esetekben vagy olyanokban, melyeknél a tanulóalgoritmust tesztadatokon szeretnénk ÚJRAMINTAVÉTELEZÉSI ELJÁRÁSOK A jackkife (zsebkés) és bootstrap (cipőhúzó a saját kallatyújáál fogva) eljárások agol elevezése is arra utal, hogy itt ad hoc eljárásokról va szó, melyek azoba agyo haszosak

Részletesebben

Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X = 1) = p Ind(p) P(X = 0) = 1 p. Leíró és matematikai statisztika

Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X = 1) = p Ind(p) P(X = 0) = 1 p. Leíró és matematikai statisztika Leíró és matematikai statisztika Matematika alapszak, matematikai elemző szakiráy Zempléi Adrás Valószíűségelméleti és Statisztika Taszék Matematikai Itézet Természettudomáyi Kar Eötvös Lorád Tudomáyegyetem

Részletesebben

Hiba! Nincs ilyen stílusú szöveg a dokumentumban.-86. ábra: A példa-feladat kódolási változatai

Hiba! Nincs ilyen stílusú szöveg a dokumentumban.-86. ábra: A példa-feladat kódolási változatai közzétéve a szerző egedélyével) Öfüggő szekuder-változó csoport keresése: egy bevezető példa Ez a módszer az állapothalmazo értelmezett partíció-párok elméleté alapul. E helye em lehet céluk az elmélet

Részletesebben

STATISZTIKA Mezőgazdászok részére

STATISZTIKA Mezőgazdászok részére Huzsvai László STATISZTIKA Mezőgazdászok részére Debrecen 2011 SENECA BOOKS Szerkesztő: Huzsvai László Minden jog fenntartva. Jelen könyvet vagy annak részleteit a Kiadó engedélye nélkül bármilyen formában

Részletesebben

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben Propositio 1 (Jese-egyelőtleség Ha f : kovex, akkor tetszőleges ξ változóra f (M (ξ M (f (ξ feltéve, hogy az egyelőtleségbe szereplő véges vagy végtele várható értékek létezek Bizoyítás: Megjegyezzük,

Részletesebben

Huzsvai László. STATISZTIKA Gazdaságelemzők részére Excel és R alkalmazások

Huzsvai László. STATISZTIKA Gazdaságelemzők részére Excel és R alkalmazások Huzsvai László STATISZTIKA Gazdaságelemzők részére Excel és R alkalmazások SENECA BOOKS 2012 Szerkesztő: Huzsvai László Minden jog fenntartva. Jelen könyvet vagy annak részleteit a Kiadó engedélye nélkül

Részletesebben

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása A változók mérési szintjei STATISZTIKA I. 3. Előadás Az adatok mérési szintjei, Viszonyszámok A változók az alábbi típusba tartozhatnak: Nominális (kategorikus és diszkrét) Ordinális Intervallum skála

Részletesebben

V. Deriválható függvények

V. Deriválható függvények Deriválható függvéyek V Deriválható függvéyek 5 A derivált fogalmához vezető feladatok A sebesség értelmezése Legye az M egy egyees voalú egyeletes mozgást végző pot Ez azt jeleti, hogy a mozgás pályája

Részletesebben

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1. Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,

Részletesebben

SZÁMELMÉLET. Vasile Berinde, Filippo Spagnolo

SZÁMELMÉLET. Vasile Berinde, Filippo Spagnolo SZÁMELMÉLET Vasile Beride, Filippo Spagolo A számelmélet a matematika egyik legrégibb ága, és az egyik legagyobb is egybe Eek a fejezetek az a célja, hogy egy elemi bevezetést yújtso az első szite lévő

Részletesebben

Cserjésné Sutyák Ágnes *, Szilágyiné Biró Andrea ** ismerete mellett több kísérleti és empirikus képletet fel-

Cserjésné Sutyák Ágnes *, Szilágyiné Biró Andrea ** ismerete mellett több kísérleti és empirikus képletet fel- ACÉLOK KÉMIAI LITY OF STEELS THROUGH Cserjésé Sutyák Áges *, Szilágyié Biró Adrea ** beig s s 1. E kutatás célja, hogy képet meghatározásáak kísérleti és számítási móiek tosságáról, és ezzel felfedjük

Részletesebben

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik. Számsorozatok 2015. december 22. 1. Alapfeladatok 1. Feladat: Határozzuk meg az a 2 + 7 5 2 + 4 létezik. sorozat határértékét, ha Megoldás: Mivel egy tört határértéke a kérdés, ezért vizsgáljuk meg el

Részletesebben

Matematika I. 9. előadás

Matematika I. 9. előadás Matematika I. 9. előadás Valós számsorozat kovergeciája +-hez ill. --hez divergáló sorozatok A határérték és a műveletek kapcsolata Valós számsorozatok mootoitása, korlátossága Komplex számsorozatok kovergeciája

Részletesebben

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2. Itervallum Paraméteres Hipotézisek Nemparaméteres Statisztika Hipotézisvizsgálat Székely Balázs 2010. december 2. Itervallum Paraméteres Hipotézisek Nemparaméteres Előadás vázlat 1 Itervallumbecslések

Részletesebben

? közgazdasági statisztika

? közgazdasági statisztika Valószíűségszámítás és a statsztka Valószíűség számítás Matematka statsztka Alkalmazott statsztka? közgazdaság statsztka épesség statsztka orvos statsztka Stb. Példa: vércsoportok Az eloszlás A AB B Elem

Részletesebben

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1. Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,

Részletesebben

Kalkulus II., második házi feladat

Kalkulus II., második házi feladat Uger Tamás Istvá FTDYJ Név: Uger Tamás Istvá Neptu: FTDYJ Web: http://maxwellszehu/~ugert Kalkulus II, második házi feladat pot) Koverges? Abszolút koverges? ) l A feladat teljese yilvávalóa arra kívácsi,

Részletesebben

Gyakorló feladatok II.

Gyakorló feladatok II. Gyakorló feladatok II. Valós sorozatok és sorok Közgazdász szakos hallgatókak a Matematika B című tárgyhoz 2005. október Valós sorozatok elemi tulajdoságai F. Pozitív állítás formájába fogalmazza meg azt,

Részletesebben

Statisztika. Földtudomány szak, geológus szakirány, 2015/2016. tanév tavaszi

Statisztika. Földtudomány szak, geológus szakirány, 2015/2016. tanév tavaszi Statisztika Földtudomáy szak, geológus szakiráy, 015/016. taév tavaszi félév Backhausz Áges (ELTE TTK Valószíűségelméleti és Statisztika Taszék)1 Tartalomjegyzék 1. Bevezetés 3 1.1. Példa: az adatok elemzése....................

Részletesebben

Sorozatok A.: Sorozatok általában

Sorozatok A.: Sorozatok általában 200 /2002..o. Fakt. Bp. Sorozatok A.: Sorozatok általába tam_soroz_a_sorozatok_altalaba.doc Sorozatok A.: Sorozatok általába Ad I. 2) Z/IV//a-e, g-m (CD II/IV/ Próbálj meg róluk miél többet elmodai. 2/a,

Részletesebben

VII. A határozatlan esetek kiküszöbölése

VII. A határozatlan esetek kiküszöbölése A határozatla esetek kiküszöbölése 9 VII A határozatla esetek kiküszöbölése 7 A l Hospital szabály A véges övekedések tétele alapjá egy függvéy értékét egy potba közelíthetjük az köryezetébe felvett valamely

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

AZ ÖSSZETÉTEL OPTIMALIZÁLÁSA A VOLUMETRIKUS ASZFALTKEVERÉK- ELLENÕRZÉS MÓDSZERÉVEL

AZ ÖSSZETÉTEL OPTIMALIZÁLÁSA A VOLUMETRIKUS ASZFALTKEVERÉK- ELLENÕRZÉS MÓDSZERÉVEL 36 MIXCONTROL AZ ÖSSZETÉTEL OPTIMALIZÁLÁSA A VOLUMETRIKUS ASZFALTKEVERÉK- ELLENÕRZÉS MÓDSZERÉVEL Subert Istvá deformáció-elleálló keverékvázat lehet létrehozi. Kiidulási feltétel az alkalmazás helyéek

Részletesebben

A brexit-szavazás és a nagy számok törvénye

A brexit-szavazás és a nagy számok törvénye Mûhely Medvegyev Péter kadidátus, a Corvius Egyetem egyetemi taára E-mail: peter.medvegyev@uicorvius.hu A brexit-szavazás és a agy számok törvéye A 016. év, de vélhetőe az egész évtized legfotosabb politikai

Részletesebben

7. el adás Becslések és minta elemszámok. 7-1. fejezet Áttekintés

7. el adás Becslések és minta elemszámok. 7-1. fejezet Áttekintés 7. el adás Becslések és mita elemszámok 7-1. fejezet Áttekités 7-1 Áttekités 7- A populáció aráy becslése 7-3 A populáció átlag becslése: σismert 7-4 A populáció átlag becslése: σem ismert 7-5 A populáció

Részletesebben

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó. I. Függelék A valószíűségszámítás alapjai I.1. Alapfogalamak: Véletle jeleség: létrejöttét befolyásoló összes téyezőt em ismerjük. Tömegjeleség: a jeleség adott feltételek mellett akárháyszor megismételhető.

Részletesebben

Elemi statisztika fizikusoknak

Elemi statisztika fizikusoknak 1. oldal Elemi statisztika fizikusoknak Pollner Péter Biológiai Fizika Tanszék pollner@elte.hu Az adatok leírása, megismerése és összehasonlítása 2-1 Áttekintés 2-2 Gyakoriság eloszlások 2-3 Az adatok

Részletesebben

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA A VALÓSZÍNŰSÉGI SZEMLÉLET ALAPOZÁSA 1-6. OSZTÁLY A biztos, a lehetetlen és a lehet, de nem biztos események megkülünböztetése Valószínűségi játékok, kísérletek események

Részletesebben

Átfolyó-rendszerű gázvízmelegítő teljesítményének és hatásfokának meghatározása Gazdaságossági számításokhoz

Átfolyó-rendszerű gázvízmelegítő teljesítményének és hatásfokának meghatározása Gazdaságossági számításokhoz Átfolyó-redszerű gázvízmelegítő teljesítméyéek és hatásfokáak meghatározása Gazdaságossági számításokhoz Szuyog Istvá 005 Készült az OTKA T-0464 kutatási projekt keretébe A Gázipari oktatási laboratórium

Részletesebben

VÉLETLENÍTETT ALGORITMUSOK. 1.ea.

VÉLETLENÍTETT ALGORITMUSOK. 1.ea. VÉLETLENÍTETT ALGORITMUSOK 1.ea. 1. Bevezetés - (Mire jók a véletleített algoritmusok, alap techikák) 1.1. Gyorsredezés Vegyük egy ismert példát, a redezések témaköréből, méghozzá a gyorsredezés algoritmusát.

Részletesebben

Nevezetes sorozat-határértékek

Nevezetes sorozat-határértékek Nevezetes sorozat-határértékek. Mide pozitív racioális r szám eseté! / r 0 és! r +. Bizoyítás. Jelöljük p-vel, illetve q-val egy-egy olya pozitív egészt, melyekre p/q r, továbbá legye ε tetszőleges pozitív

Részletesebben

Pl.: hányféleképpen lehet egy n elemű halmazból k elemű részhalmazt kiválasztani, n tárgyat hányféleképpen lehet szétosztani k személy között stb.?

Pl.: hányféleképpen lehet egy n elemű halmazból k elemű részhalmazt kiválasztani, n tárgyat hányféleképpen lehet szétosztani k személy között stb.? Dr. Vicze Szilvia A kombiatorika a véges halmazokkal foglalkozik. A véges halmazokkal kapcsolatba számos olya probléma vethető fel, amely függetle a halmazok elemeitől. Pl.: háyféleképpe lehet egy elemű

Részletesebben

1. A radioaktivitás statisztikus jellege

1. A radioaktivitás statisztikus jellege A radioaktivitás időfüggése 1. A radioaktivitás statisztikus jellege Va N darab azoos radioaktív atomuk, melyekek az atommagja spotá átalakulásra képes. tegyük fel, hogy ezek em bomlaak tovább. Ekkor a

Részletesebben

VII.Valószínűségszámítási, statisztikai, gráfelméleti alapfogalmak

VII.Valószínűségszámítási, statisztikai, gráfelméleti alapfogalmak VII.Valószíűségszámítási, statisztikai, gráfelméleti alapfogalmak VII..A valószíűségszámítás elemei A valószíűségszámítás a véletle tömegjeleségeket taulmáyozó, kb. 300 éves tudomáy. Véletle jeleség: em

Részletesebben

A figurális számokról (IV.)

A figurális számokról (IV.) A figurális számokról (IV.) Tuzso Zoltá, Székelyudvarhely A továbbiakba külöféle számkombiációk és összefüggések reprezetálásáról, és bizoyos összegek kiszámolásáról íruk. Sajátos összefüggések Az elekbe

Részletesebben

18. Differenciálszámítás

18. Differenciálszámítás 8. Differeciálszámítás I. Elméleti összefoglaló Függvéy határértéke Defiíció: Az köryezetei az ] ε, ε[ + yílt itervallumok, ahol ε > tetszőleges. Defiíció: Az f függvéyek az véges helye vett határértéke

Részletesebben

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő.

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő. 3. SOROZATOK 3. Sorozatok korlátossága, mootoitása, kovergeciája Defiíció. Egy f : N R függvéyt valós szám)sorozatak evezük. Ha A egy adott halmaz és f : N A, akkor f-et A-beli értékű) sorozatak evezzük.

Részletesebben

MÉRÉSMETODIKAI ALAPISMERETEK FIZIKA. kétszintű érettségire felkészítő. tanfolyamhoz

MÉRÉSMETODIKAI ALAPISMERETEK FIZIKA. kétszintű érettségire felkészítő. tanfolyamhoz MÉRÉSMETODIKAI ALAPISMERETEK a FIZIKA kétszitű érettségire felkészítő tafolyamhoz A fizika mukaközösségi foglalkozásoko és a kétszitű érettségi való vizsgáztatásra felkészítő tafolyamoko 004-009-be elhagzottak

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai Változékonyság (szóródás) STATISZTIKA I. 5. Előadás Szóródási mutatók A középértékek a sokaság elemeinek értéknagyságbeli különbségeit eltakarhatják. A változékonyság az azonos tulajdonságú, de eltérő

Részletesebben

Populáció nagyságának felmérése, becslése

Populáció nagyságának felmérése, becslése http:/zeus.yf.hu/~szept/kuzusok.htm Populáció agyságáak felméése, becslése Becsült paaméteek: N- az adott populáció teljes agysága (egyed, pá, stb) D- dezitás (sűűség), egységyi felülete/téfogata számított

Részletesebben

( a b)( c d) 2 ab2 cd 2 abcd 2 Egyenlőség akkor és csak akkor áll fenn

( a b)( c d) 2 ab2 cd 2 abcd 2 Egyenlőség akkor és csak akkor áll fenn Feladatok közepek közötti egyelőtleségekre (megoldások, megoldási ötletek) A továbbiakba szmk=számtai-mértai közép közötti egyelőtleség, szhk=számtaiharmoikus közép közötti egyelőtleség, míg szk= számtai-égyzetes

Részletesebben

Feladatok és megoldások a 11. heti gyakorlathoz

Feladatok és megoldások a 11. heti gyakorlathoz Feladatok és megoldások a. het gyakorlathoz dszkrét várható érték Építőkar Matematka A. Egy verseye öt ő és öt férf verseyző dul. Tegyük fel, hogy cs két azoos eredméy, és md a 0! sorred egyformá valószíű.

Részletesebben

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika

Részletesebben

6. feladatsor. Statisztika december 6. és 8.

6. feladatsor. Statisztika december 6. és 8. 6. feladatsor Statisztika 200. december 6. és 8.. Egy = 0 szervert tartalmazó kiszolgáló mide szervere mide pillaatba 0 < p < valószíűséggel foglalt, a foglaltságok szerverekét függetleek. Tehát a foglaltak

Részletesebben

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H

Részletesebben

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június GAZDASÁGSTATISZTIKA GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi

Részletesebben

Komplex számok (el adásvázlat, 2008. február 12.) Maróti Miklós

Komplex számok (el adásvázlat, 2008. február 12.) Maróti Miklós Komplex számok el adásvázlat, 008. február 1. Maróti Miklós Eek az el adásak a megértéséhez a következ fogalmakat kell tudi: test, test additív és multiplikatív csoportja, valós számok és tulajdoságaik.

Részletesebben

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.

Részletesebben

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Gyakorisági sorok Mennyiségi ismérv jellemző rangsor készítünk. (pl. napi jegyeladások száma) A gyakorisági sor képzése igazából tömörítést jelent Nagyszámú

Részletesebben

Matematikai statisztika gyakorlat 2018/2019 II. félév

Matematikai statisztika gyakorlat 2018/2019 II. félév Matematikai statisztika gyakorlat 018/019 II. félév 1. Táblázatok Viszoyszámok: V = A, ahol A: a viszoyítás tárgya (amit viszoyítuk); B B: a viszoyítás alapja (amihez viszoyítuk) Megoszlási: a sokaság

Részletesebben

Segédanyag a Leíró és matematikai statisztika tantárgyhoz március 1.

Segédanyag a Leíró és matematikai statisztika tantárgyhoz március 1. Segédayag a Leíró és matematikai statisztika tatárgyhoz 06 március Közgazdasági értelembe a statisztika a valóság tömör, számszer jellemzésére szolgáló tudomáyos módszerta, illetve gyakorlati tevékeység

Részletesebben

Diszkrét matematika II., 3. előadás. Komplex számok

Diszkrét matematika II., 3. előadás. Komplex számok 1 Diszkrét matematika II., 3. előadás Komplex számok Dr. Takách Géza NyME FMK Iformatikai Itézet takach@if.yme.hu http://if.yme.hu/ takach/ 2007. február 22. Komplex számok Szereték kibővítei a valós számtestet,

Részletesebben

Eseményalgebra, kombinatorika

Eseményalgebra, kombinatorika Eseméyalgebra, kombiatorika Eseméyalgebra Defiíció. Véletle kísérletek evezük mide olya megfigyelést, melyek több kimeetele lehetséges, és a véletletől függ, (azaz az általuk figyelembevett feltételek

Részletesebben

Eseme nyalgebra e s kombinatorika feladatok, megolda sok

Eseme nyalgebra e s kombinatorika feladatok, megolda sok Eseme yalgebra e s kombiatorika feladatok, megolda sok Szűk elméleti áttekitő Kombiatorika quick-guide: - db. elemből db. sorredjeire vagyuk kívácsiak: permutáció - db. elemből m < db. háyféleképp rakható

Részletesebben

A FUNDAMENTÁLIS EGYENLET KÉT REPREZENTÁCIÓBAN. A függvény teljes differenciálja, a differenciális fundamentális egyenlet: U V S U + dn 1

A FUNDAMENTÁLIS EGYENLET KÉT REPREZENTÁCIÓBAN. A függvény teljes differenciálja, a differenciális fundamentális egyenlet: U V S U + dn 1 A FUNDAMENÁLIS EGYENLE KÉ REPREZENÁCIÓBAN A differeciális fudametális egyelet A fudametális egyelet a belső eergiára: UU (S V K ) A függvéy teljes differeciálja a differeciális fudametális egyelet: U S

Részletesebben

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre Statsztka I. 4. előadás Előadó: Dr. Ertsey Imre KÖZÉPÉRTÉKEK A statsztka sor általáos jellemzésére szolgálak, a statsztka sokaságot egy számmal jellemzk. Számított középértékek: matematka számítás eredméyekét

Részletesebben

MATEMATIKA I. KATEGÓRIA (SZAKKÖZÉPISKOLA)

MATEMATIKA I. KATEGÓRIA (SZAKKÖZÉPISKOLA) O k t a t á s i H i v a t a l A 5/6 taévi Országos Középiskolai Taulmáyi Versey első forduló MATEMATIKA I KATEGÓRIA (SZAKKÖZÉPISKOLA) Javítási-értékelési útmutató A 5 olya égyjegyű szám, amelyek számjegyei

Részletesebben

Kidolgozott feladatok a nemparaméteres statisztika témaköréből

Kidolgozott feladatok a nemparaméteres statisztika témaköréből Kidolgozott feladatok a emparaméteres statisztika témaköréből A tájékozódást mideféle szíkódok segítik. A feladatok eredeti szövege zöld, a megoldások fekete, a figyelmeztető, magyarázó elemek piros szíűek.

Részletesebben

5. Kombinatorika. 8. Legfeljebb hány pozitív egész számot adhatunk meg úgy, hogy semelyik kettő összege és különbsége se legyen osztható 2015-tel?

5. Kombinatorika. 8. Legfeljebb hány pozitív egész számot adhatunk meg úgy, hogy semelyik kettő összege és különbsége se legyen osztható 2015-tel? 5. Kombiatorika I. Feladatok. Háyféleképpe olvashatók ki az alábbi ábrákról a PAPRIKAJANCSI, a FELADAT és a MATEMATIKASZAKKÖR szavak, ha midig a bal felső sarokból kell iduluk, és mide lépésük csak jobbra

Részletesebben

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága Sorozatok, határérték fogalma. Függvéyek határértéke, folytoossága 1) Végtele valós számsorozatok Fogalma, megadása Defiíció: A természetes számok halmazá értelmezett a: N R egyváltozós valós függvéyt

Részletesebben

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben

GAZDASÁGI MATEMATIKA 1. ANALÍZIS

GAZDASÁGI MATEMATIKA 1. ANALÍZIS SZENT ISTVÁN EGYETEM GAZDASÁGI, AGRÁR- ÉS EGÉSZSÉGTUDOMÁNYI KAR Dr. Szakács Attila GAZDASÁGI MATEMATIKA. ANALÍZIS Segédlet öálló mukához. átdolgozott, bővített kiadás Békéscsaba, Lektorálták: DR. PATAY

Részletesebben