Dr. Tóth Zsuzsanna Eszter Dr. Jónás Tamás Erdei János. Gazdaságstatisztika. II. rész A matematikai statisztika alapjai

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Dr. Tóth Zsuzsanna Eszter Dr. Jónás Tamás Erdei János. Gazdaságstatisztika. II. rész A matematikai statisztika alapjai"

Átírás

1 Budapest Műszak és Gazdaságtudomáy Egyetem Gazdaság- és Társadalomtudomáy Kar Üzlet Tudomáyok Itézet Meedzsmet és Vállalatgazdaságta Taszék Dr. Tóth Zsuzsaa Eszter Dr. Jóás Tamás Erde Jáos Gazdaságstatsztka II. rész A matematka statsztka alapja Oktatás segédayag a Gazdálkodás és meedzsmet (BA), Műszak meedzser (BSc), Nemzetköz gazdálkodás (BA), valamt az Alkalmazott közgazdaságta (BA) alapszakok részére Budapest, 06

2 Tartalom. BEVEZETŐ FOGALMAK A MATEMATIKAI STATISZTIKA TÁRGYA MINTAVÉTEL, MINTAVÉTELI HIBA SOKASÁGOK CSOPORTOSÍTÁSA ISMÉRVEK MÉRÉSI SKÁLÁK Névleges (omáls) skála Sorred (ordáls) skála Itervallumskála (külöbségskála) Aráyskála (abszolút skála).... LEÍRÓ STATISZTIKA.... A LEÍRÓ STATISZTIKA TÁRGYA.... A STATISZTIKAI LEÍRÁS CÉLJA, MÓDSZEREI..... Adatgyűjtés Az adatok ábrázolása TAPASZTALATI ELOSZLÁSOK Meység smérv szert redezés és osztályozás Meység sorok grafkus ábrázolása TAPASZTALATI ELOSZLÁSOK JELLEGZETESSÉGEI Helyzetmutatók (középértékek) Választás a középértékek között Kvatlsek Szóródás mutatók FOGALMAK GYAKORLÓ FELADATOK Feladat Feladat ELMÉLETI KÉRDÉSEK RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA RÉSZ- ÉS FŐÁTLAGOK RÉSZ- ÉS FŐSOKASÁGOK VARIANCIÁJA ÉS SZÓRÁSA ISMÉRVEK KÖZÖTTI KAPCSOLAT FOGALMAK GYAKORLÓ FELADATOK Feladat Feladat ELMÉLETI KÉRDÉSEK MINTAVÉTEL ÉS BECSLÉS MINTAVÉTEL Mtavétel módok PARAMÉTEREK BECSLÉSE A BECSLÉS TULAJDONSÁGAI Torzítatla becslés Hatásos becslés Kozsztes becslés Elégséges becslés A PONTBECSLÉS MÓDSZEREI INTERVALLUMBECSLÉS Kofdeca-tervallum a ormáls eloszlás várható értékére Kofdeca-tervallum a ormáls eloszlás várható értékére, ha az elmélet szórás smeretle Sokaság aráy becslése Sokaság varaca becslése, A mtaagyság meghatározása FOGALMAK GYAKORLÓ FELADATOK... 75

3 4.7. Feladat Feladat Feladat Feladat Feladat Elmélet kérdések HIPOTÉZISVIZSGÁLAT A HIPOTÉZISVIZSGÁLAT CÉLJA, ESZKÖZEI A vzsgáladó hpotézs megfogalmazása A próbafüggvéy Krtkus tartomáy A hpotézsvzsgálat lépése A hpotézsvzsgálat sorá elkövethető hbák FOGALMAK ELMÉLETI KÉRDÉSEK STATISZTIKAI PRÓBÁK NEMPARAMÉTERES PRÓBÁK Illeszkedésvzsgálat -próbával Homogetásvzsgálat -próbával Függetleségvzsgálat -próbával NEMPARAMÉTERES PRÓBÁK ÖSSZEFOGLALÁS PARAMÉTERES PRÓBÁK Egymtás próbák Kétmtás próbák Több függetle mtás próbák FOGALMAK TÍPUSFELADATOK Feladat Feladat Feladat Feladat Feladat ELMÉLETI KÉRDÉSEK KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS KAPCSOLATOK JELLEGE A KORRELÁCIÓS KAPCSOLAT SZEMLÉLTETÉSE KORRELÁCIÓ- ÉS REGRESSZIÓELEMZÉS ALAPJAI A kétváltozós regresszós modell Korrelácós mérőszámok Itervallumbecslés A regresszófüggvéy eredméyeek elleőrzése: hpotézsvzsgálatok Példák korrelácó és regresszószámítása FOGALMAK TÍPUSFELADATOK Feladat Feladat Feladat Feladat ELMÉLETI KÉRDÉSEK IDŐSOROK ELEMZÉSE, AZ IDŐSORELEMZÉS ESZKÖZEI IDŐSOROK KOMPONENSEINEK VIZSGÁLATA Tred becslése mozgó átlagok segítségével Szezoaltás vzsgálata Idősorok szezoáls kgazítása Auto- és keresztkorrelácó dősorok elemzéséél

4 8.3 FOGALMAK ELMÉLETI KÉRDÉSEK TÍPUSFELADATOK Feladat Feladat

5 . Bevezető fogalmak. A matematka statsztka tárgya A matematka statsztka a valószíűségszámítás öálló fejezete, amely a gyakorlat számára ge agy jeletőségű. Eredet motvácóját az olya véletle tömegjeleségek, rövde kísérletek meység, gyakorság vszoyaak vzsgálata adta, melyek egyrészt tetszőlegese sokszor smétlődhetek (ezért tömegjeleségek), és mde megsmétlődésük többféle eredméyel kmeetellel járhat. Mdemellett em tudjuk (esetleg em akarjuk, mert em ér meg utáajár) potosa megmoda, kszámíta, melyk smétlődés alkalmával melyk kmeetel következk be (ettől determsztkus a tömegjeleség). Példa lye kísérletre egy pézérme feldobása: tetszőlegese sokszor feldobhatjuk, de em tudjuk határozotta megjósol, hogy éppe melyk oldalára esk. Nagy számba végbemeő tömegjeleség pl. az atom bomlás, sokszor megsmételhető tömegjeleség pl. a szerecsejáték. A levoható törvéyszerűségek statsztka jellegűek, azaz agyszámú végrehajtás sorá átlagosa érvéyes törvéyek. A matematka statsztka léyegét foglalja össze az. ábra. Sohasem a teljes sokaságot, haem az abból alkalmas módo kvett mtát vzsgáljuk, és a mta jellemző alapjá kíváuk következtetést levo a teljes sokaságra voatkozóa. Hagsúlyozzuk, hogy em a mta, haem a teljes sokaság tulajdoságara vagyuk kívácsak, és következtetéseket részleges megfgyelések eredméyere alapozzuk. Sokaság Következtetés Mta Mtavétel. ábra: Mtavétel alapelvek. Mtavétel, mtavétel hba Statsztka sokaság: A vzsgálat tárgyát képező egységek összességét, halmazát statsztka sokaságak, vagy rövde sokaságak evezzük. Statsztka sokaságot alkotak valamely ország lakosa, családja, egy vállalat mukavállaló, ha mdegyküket pl. életkorukkal, az egy főre jutó átlagjövedelmükkel, vagy a mukába eltöltött évek számával együtt vesszük tektetbe. Ugyaígy statsztka sokaságot alkotak egy üzem egy dőegységre voatkozó termelés adata, darabszámba vagy fortba, vagy a 5

6 mezőgazdaság terméseredméyek (övéy fajtákét vagy területegységekét). Ez utóbb esetbe az éppe realzálódó értékek sok ksebb vagy agyobb mértékbe ható véletle téyezőtől s függek, s így a megvalósulásra szóba jöhető értékek összessége a kokrét esetek ge széles körét ölelhet fel. Statsztka sokasággal álluk szembe mde olya esetbe, ahol mérésről, megfgyelések gyűjtéséről va szó. Így statsztka sokasággal találkozuk a társadalm-gazdaság vzsgálódások sorá ugyaúgy, mt a műszak vagy természettudomáy kutatások esetébe. Ameybe egy számszerűsíthető tulajdosággal redelkező statsztka sokaságból véletle kválasztással egyed elemet emelük k, eredméyül egy véletletől függő meységet, azaz egy valószíűség változót kapuk. A kapott változó eloszlását a statsztka sokaság eloszlásáak evezzük. Ha a statsztka sokaságból formácószerzés céljából véletleszerűe egyed elemeket emelük k, mtavételről beszélük. Ha a sokaság bármely eleme egyelő valószíűséggel kerülhet bele a mtába, egyszerű véletle mtavételről beszélük. Statsztka mta: A statsztka mta valamely valószíűség változóra voatkozó véges számú függetle kísérlet vagy megfgyelés (mérés) eredméye: véges sok, azoos eloszlású függetle valószíűség változó együttese. Az egyes megfgyelés eredméyeket a mta elemeek, a megfgyelések számát a mta agyságáak vagy elemszámáak evezzük. A mta eleme az alapsokaság eloszlásával megegyező eloszlású valószíűség változók. Mt a felvezetésbe láttuk, a matematka statsztka léyege, hogy a sokaságak csak egy részét, vagys a mtát vzsgáljuk, ezért a statsztka módszerek alkalmazásakor sohasem lehetük bztosak a dötésükbe (kvéve természetese a 00%-os mtavételt, de az már em matematka statsztka). Következtetésük természetese alapvetőe a mtá, a mtából meghatározott jellemzőkö alapul. Ugyaakkor m em a mta, haem az egész sokaság tulajdoságara vagyuk kívácsak, azaz a részleges megfgyelések eredméyeből következtetük a teljes sokaságra. A statsztka mtavételek és az ebből származó adatokat felhaszáló elemzések, következtetések tehát mdg tartalmazak hbákat. A hba szó jeletése ebbe az esetbe kssé eltér a hétközap szóhaszálatba megszokottól. A statsztka hba em jelet szükségképpe valamlye tévedést, em megfelelő mukavégzést, fgyelmetleséget stb., hsze a leggodosabba elvégzett mtavétel és elemzés s tartalmaz hbákat, melyek egy része elkerülhetetle. A statsztka hba, amelyek egy része a módszerta sajátosságaból (mtavétel, tömörítés, közelítés, becslés stb.) adódk, a statsztka szükségszerű velejárója. A mtavétellel felmerülő hbák alapvetőe két agy csoportba sorolhatók. Nem mtavétel hba: A statsztka hbák közül a mtával kapcsolatos teedőkhöz, az adatgyűjtéshez kapcsolódó hbát em mtavétel hbáak evezzük. A em mtavétel hba függetle attól, hogy teljes körű vagy részleges-e az adatgyűjtés. Ilye hbák adódhatak abból, hogy a vzsgál kívát sokaságot em tudjuk teljese vagy helyese áttekte, potatla az adatgyűjtés (kérdőív, a mérés stb.), hbása rögzítk az adatokat stb. Ezek agy része elsősorba ember fgyelmetleségből, em kellő körültektésből, hbából (a szó hétközap értelmébe), félreértésből stb. származk. Az lye hbák tehát függetleek attól, hogy a teljes sokaságot vzsgáljuk-e, vagy mtavételt alkalmazuk, ezért ezeket em mtavétel hbáak evezzük. 6

7 Mtavétel hba: A statsztka hba azo része, amely részleges vzsgálatok (mtavétel) eseté abból adódk, hogy em a teljes sokaságot fgyeljük meg. A sokaság teljes megfgyeléséről való lemodás ára. A mtavétel tervezésekor em lebecsülve a em mtavétel hba jeletőségét elsősorba a jól mérhető, számszerűsíthető mtavétel hbából duluk k, és olya eljárásokat keresük, amelyek mellett a mtavétel hba a lehető legksebb. A mtavétel hba a sokaság jellegé, az alkalmazott mtavétel eljáráso és a szóba forgó mutatószám mlyeségé túlmeőe alapvetőe a mtaagyságtól függ (. ábra): mtavétel hba. ábra: A mtaagyság és a mtavétel hba kapcsolata Az ábrából látható, hogy a potosság és az olcsóság (kcs mtaszám) egymásak elletmodó követelméyek: a mtavétel hba csökketéséek útja a mtaagyság övelése. A mtavételek tervezéséek éppe ez a kdulópotja..3 Sokaságok csoportosítása mtaagyság A statsztka sokaságokak többféle típusát külöböztethetjük meg. Egyrészt létezek álló és mozgó sokaságok, másrészt dszkrét és folytoos sokaságok. Álló sokaság: Az álló sokaság állapotot fejez k, adata dőpotra értelmezhetőek. Álló sokaságak tekthető például a Budapest Műszak és Gazdaságtudomáy Egyetem foglalkoztatottjaak vagy hallgatóak létszáma 03. jauár -jé. Mozgó sokaság: A mozgó sokaság folyamatot fejez k, dőtartamra értelmezhető. Mozgó sokaság például a BME-él törtéő mukaerő-felvétel vagy az új hallgatók száma 03 folyamá, vagy például a lakosság gázfogyasztás 0 decemberébe. Dszkrét sokaság: A dszkrét sokaság elkülöülő egységekből áll. Az elkülöülő egységek lehetek például vállalatok, hallgatók, foglalkoztatottak stb. Folytoos sokaság: A folytoos sokaság olya tömegből áll, amelyek egységet ökéyese határozzuk meg. 7

8 Folytoos sokaság pl. a gázfogyasztás, kőolajtermelés, búza vetésterülete stb. A statsztka sokaság tartalmazhat véges vagy végtele számosságú egyedet. A társadalmgazdaság jeleségek vzsgálatakor általába véges sokaságokkal va dolguk, e megfgyelések ugyas térbe és dőbe potosa lehatárolt egyedek összességére voatkozak. Végtele sokaságokkal a kísérletek tervezése és elemzése sorá, lletve külöböző folyamatok modellezéséél találkozuk..4 Ismérvek A sokasággal összefüggő fogalom az smérv. Ismérv: Olya szempot(ok), amely(ek) alapjá a sokaságot megfgyeljük, a sokaság egységeek jellemzője. Így smérv pl. foglalkoztatottakál a jövedelem agysága, a em, a betöltött mukakör, részvéyekél a hozam vagy az árfolyam. A sokaság egysége bzoyos jellemzők szert egyformák, ezek a közös smérvek. Más jellemzők tektetébe külöbözek, ezek a megkülöböztető smérvek. Így például, ha Magyarország területé működő felsőoktatás tézméyek képezk a megfgyelt sokaságot (03. jauár -jé), a közös smérvek például a terület megjelölés (Magyarország), a tevékeység jellege (felsőoktatás), és az dőpot megjelölés ( ). Megkülöböztető smérvek például a foglalkoztatottak száma, a szakok száma, a hallgatók száma, a tőkeállomáy agysága, az tézméy létesítéséek éve stb. Ismérv változat: Az smérv lehetséges kmeetelet smérv változatak (tulajdoságak) evezzük. Alteratív smérv: A két változattal redelkező smérvet alteratív smérvek evezzük. Például épesség vzsgálata eseté a emhez való tartozás: férf, ő, vagy legyártott termékek vzsgálata eseté: selejtes, em selejtes. Meység smérv: Méréses jellemző, kvattatív változó. A sokaság egységere voatkozó számszerű megjelölést jelet, egy számmal írható le, amellyel matematka műveletek végezhetők. Meység smérv például foglalkoztatottak esetébe a kereset agysága, vagy az életkor, gazdálkodó szervezetek esetébe például a tőkeállomáy. Nem meység smérv: A sokaság egységere voatkozóa valamlye kategórát rögzít, típusa szert lehet dőbel, terület és mőség smérv. Az dőbel smérv a sokaság egységere voatkozó dőpot vagy dőtartam megjelölést jelet: pl. egy vállalat létesítéséek éve vagy működéséek dőtartama. A terület smérv a sokaság egységere ézve földrajz elhatárolást fejez k (így pl. az egyes felsőoktatás tézméyeket megkülöböztető terület smérv, hogy melyk megyébe találhatók). A mőség smérv (mősítéses jellemző) a sokaság egységeek valamlye mőség 8

9 tulajdoság szert megjelölése (pl. a foglalkoztatottak em, vagy mukakör szert hovatartozása). Az smérvek külöböző típusaval összefüggésbe foglalkoz kell azok méréselmélet kérdésevel. E szempotok fgyelme kívül hagyásával előfordulhat, hogy em megfelelőe választjuk meg az alkalmazható módszereket, lletve műveleteket..5 Mérés skálák A mérés sorá bzoyos hozzáredelés szabályok alapjá szmbólumokat, számokat redelük dolgokhoz, tulajdoságokhoz. Ezek a hozzáredelés szabályok, lletve a mérés sorá alkalmazott számsoroktól elvárt tulajdoságok határozzák meg a mérés skálát. Eek alapjá égy külöböző skálatípust külöböztetük meg:. évleges (omáls) skálát,. sorred/ragsor (ordáls) skálát, 3. tervallumskálát és 4. aráyskálát. A mérés skálákat, a mérés sztjét a hozzáredelés szabályok határozzák meg. Mdegyk skálát varacájáak mértékével lehet jellemez, vagys azokkal a traszformácókkal, amelyek a skála struktúráját változatlaul hagyják. Melőtt az egyes skálákat részletesebbe smerteték, a számokból alkotható formáls redszerek éháy léyeges voását kell megvzsgáluk. A számok külöféle relácók és műveletek szert alkothatak formáls redszert. A redszert alkotó relácók és műveletek közül az egyelőség, a sorredség és az addtvtás mősül léyegesek a mérés skálák meghatározása szempotjából. Az egyelőséget, a sorredséget és az addtvtást a következő axómák szert írhatjuk le: l. vagy A=B vagy AB. ha A=B, akkor B=A 3. ha A=B és B=C, akkor A=C 4. ha AB, akkor B<A 5. ha AB és BC, akkor AC 6. ha A=P és B0, akkor A+BP 7. A+B=B+A 8. ha A=P és B=Q, akkor A+B=P+Q 9. (A+B)+C=A+(B+C) Az.-3. axóma az egyelőség, a 4-5. a sorredség, a 6-9. az addtvtás (összeadás) axómá. Ezeket az axómákat haszáljuk a mérés skálák megkülöböztetésére, vagys a hozzáredelés szabályok a fet axómákba fejeződek k... Névleges (omáls) skála A évleges mérés szt a legegyszerűbb mérés forma. A évleges skálá az objektumokhoz redelt szmbólumok, számok csak az objektumok, vagy azok bzoyos osztályaak azoosítására szolgálak. A hozzáredelés teljese kötetle, a jelölésre bármlye szmbólum, szám alkalmazható. A skálá a megkülöböztethetőséget követeljük meg, csak az egyelőség relácó értelmezhető, ez azt jelet, hogy két objektum egyelő vagy külöböző. A évleges számhozzáredelések tehát két típusát smerjük: 9

10 - az egyed objektumok azoosító számozása; - osztályok azoosítása (az egyes osztályoko belül lévő objektumok azoos számot kapak). A jelölésre tehát bármlye szám megfelel. A hozzáredelés szabály ebbe az esetbe a következő: e redeljük azoos számokat külöböző osztályokhoz (dolgokhoz) vagy külöböző számokat azoos osztályokhoz (dolgokhoz, jeleségekhez, személyekhez stb.). Névleges mérés sztet jelet pl. a termékek azoosító számozása, az útlevélszám, repülőjárat-számok, sportba a mezszámok. Osztályok eseté meghatározható az egyes osztályokba tartozó egységek száma (tehát a gyakorság), ll. meghatározható a legagyobb gyakorsággal redelkező osztály (modáls osztály), és így a módusz... Sorred (ordáls) skála A évleges skála továbbfejlesztéséek legegyszerűbb lépése, ha két dolgot valamlye közös tulajdoság alapjá hasolítuk össze. A gyakorlatba számos olya eset va, amkor a megfgyeledő dolgokat valamlye közös tulajdoságuk alapjá hasolítjuk össze és állítjuk sorredbe vagy másképpe kfejezve ragsort készítük. Hagsúlyozuk kell, hogy a sorred skálá mért dolgokak egy közös tulajdoság szert kell összehasolíthatókak és traztívak le. A sorred skála az egységek vszoylagos helyét s meghatározza, redez azokat, így az egyelőség axómákat a sorredségét tükröző 4. és 5. axómával egészítjük k, vagys e skála a ksebb (<) és agyobb () relácókat s tartalmazza. A sorred skálá mért dolgok cseek egymástól egyelő távolságra, vagys az egymást követő tervallumok em azoos agyságúak. Ezért a sorred skála számaval csak azokat a műveleteket végezhetjük, amelyek em tételezk fel az tervallumok azoosságát. Bármlye sorredmegőrző traszformácó a skálát változatlaul hagyja, ezért bármelyk mooto övekvő függvéy szert traszformálhatuk. A statsztka műveletek közül alkalmazhatjuk a évleges mérésre egedélyezett műveleteket, továbbá számíthatuk medát, kvatlseket és ragkorrelácós együtthatót. Például a két közsmert statsztka jellemzőt a számta átlagot és szórást szgorúa véve em számíthatjuk k a sorred mérés sztjé yert számokból. A sorredet jelölő mdegyk számhoz hozzáadhatuk egy álladó számot vagy vehetjük a sorszámok logartmusát, égyzetét, stb., ezek a sorredmegőrző traszformácók. Ordáls mérés sztek felel meg a termékek mőség osztályba sorolása, kérdőíves felmérésekél egy-egy kérdésre adott válasz 3, 5, vagy 7 fokozatú skálá törtéő mérése. Megjegyezzük, hogy jeleleg számos gazdaság, társadalomtudomáy jeleséget csak sorred skálá mérhetük. Az így kapott számok gyakra magasabb sztű mérések tűek, s ezért sajos gyakor a em egedélyezett műveletek alkalmazása, amelyek eredméye a homályos vagy félrevezető értelmezés. A ragkorrelácós együttható tárgyalása em témája jegyzetükek. Rövde ayt jegyezék meg, hogy a ragkorrelácós együttható két sorred skálá mérhető smérv között kapcsolat szorosságát mér, szembe a jegyzetbe a későbbekbe tárgyal kívát korrelácós együtthatóval, amely aráyskálá mért smérvek között kapcsolat szorosságát képes mér. 0

11 ..3 Itervallumskála (külöbségskála) Az tervallumskála redelkezk a sorred skála tulajdoságaval, továbbá a skálá lévő bármelyk két pot között külöbség, távolság (a külöbségek összege és aráya) s értelmezhető. Az tervallumskálát a közös és álladó mértékegység jellemz és a számokat eek alapjá redeljük a sorba redezett dolgokhoz. Az tervallumskálá cs rögzített ullpot, a skála ullpotját és mértékegységét ebbe az esetbe szabado választhatjuk meg. A skála bármlye leárs traszformácója megegedett. A hőmérsékletet véve példakét: ha egyk yár apo reggel + C, 4 órakor +36 C hőmérsékletet mértek, e két értéket em lehet összead és az összegét értelmez, vagy em lehet azt moda, hogy 4 órakor háromszor olya meleg volt, mt reggel. A külöbség vszot, a +4 C hőmérséklet-emelkedés értelmezhető. (Ráadásul, ha a hőmérsékletet em Celsus-fokba, haem Fahrehet fokba fejezzük k, egésze más értéket kapuk). Itervallumskálá mérjük a aptár dőt, a tegerszt felett magasságot, bzoyos pszchológa, pszchofzka jeleségeket, az tellgecát, a szélesség-hosszúság köröket, a vízállást stb. Az tervallumskálá yert adatokból a mérta átlag és a relatív szórás kvételével valamey statsztka jellemző és mutató számítható...4 Aráyskála (abszolút skála) Az aráyskála redelkezk az előbb skálák összes tulajdoságával, valamt a 6-9. axómákba megfogalmazott addtvtás tulajdosággal s. Az aráyskáláak valód ullpotja va és bármelyk két potjáak aráya függetle a mértékegységtől. Az aráyskáláak mdg va abszolút ullpotja még akkor s, ha ezt gyakorlatlag em lehet elér. Az aráyskála számszerű értéke egy kostas értékkel való szorzással traszformálhatók. Tömeget, hosszúságot, vllamos elleállást, és általába a klasszkus műszak tulajdoságokat aráyskálá mérjük. Így az aráyskálák a műszak és természettudomáyokba gyakorak, míg a gazdaság-, társadalomtudomáyok területé rtká haszálatosak. Az aráyskálá kapott számokkal az összes artmetka és statsztka művelet elvégezhető. A mérés skálák égy sztje herarchkusa épül egymásra, mde skála redelkezk az őt megelőző skála tulajdoságaval s. Az smérvek és a skálák között kapcsolatot szemléltet az alább ábra (3. ábra). Ismérv Terület Mérés skála Nomáls skála Mőség Sorred skála Meység Itervallum skála Időbel Aráyskála 3. ábra: Az smérv típusok és a mérés skálák között kapcsolat (forrás: Kerékgyártóé et al., 00)

12 . Leíró statsztka. A leíró statsztka tárgya A számszerű formácó, aak mérése és elemzése alapvető szerepet játszk a társadalm és gazdaság jeleségek elemzésébe. E számszerű adatok a legtöbb esetbe azzal a sajátossággal redelkezek, hogy a megfgyelésük, a feldolgozásuk, elemzésük és az elemzés eredméyeek felhaszálása tudomáyos módszereket géyel. A statsztka kfejezést többféle értelmezésbe s haszálják. A két legáltaláosabb értelmezés:. statsztka adatok, lletve azok előállításával kapcsolatos gyakorlat tevékeység;. statsztka módszerta. Így statsztkáak evezzük a tömegese előforduló jeleségek adatat, az ú. statsztka számayagot, de azt a tevékeységet s statsztkáak hívjuk, amely az adatok gyűjtését, redezését, tömörítését, elemzését foglalja magába. A módszerta pedg az a statsztka gyakorlat tevékeység, amely a statsztka következtetések elméletével, módszerevel foglalkozk (Kerékgyártóé et al., 00). A statsztka módszertaak többféle ágát szokás megkülöböztet. Az általáos statsztka módszertao belül külöbséget teszük leíró (deskrptív) és következtető statsztka között. A jegyzet e részébe a leíró statsztka eszközevel és módszerevel smerkedük. A leíró statsztka célja a vzsgálat tárgyát képező jeleség tömör, számszerű jellemzése az adatok redezése és elemzése alapjá. Nem lép túl a megfgyelése, de a megfgyelt adatok legjobb megértésére, bemutatására, összefoglaló jellemzésére törekszk gazdag eszköztára segítségével. Ezzel szembe a következtető statsztka célja a mtából törtéő következtetés és általáosítás a teljes sokaságra voatkozóa (pl. éháy ezer háztartás jövedelm adataból megfelelő potossággal megbecsülhető, hogy a magyar lakosság körébe mlye jövedelm külöbségek vaak, vagy a gyártósorról lekerülő termékekből vett mta alapjá következtethetük a gyártás bzoyos jellemzőre), vagys a jeleségekre, folyamatokra voatkozóa olya megállapításokat tehetük, amelyek em csak a közvetle megfgyelése alapulak. A ma boyolult társadalm-gazdaság jeleségek vzsgálatakor a mtavételes eljárások a gyakorbbak, mert a jeleségek teljes körű felmérése erőforrás-géyes feladat. A leíró statsztka a megfgyelt adatok bemutatását, összefoglaló jellemzését tűz k célul, és ehhez az elemzéshez sokoldalú eszköztárt kíál, ebbe a fejezetbe céluk eek az eszköztárak a bemutatása.. A statsztka leírás célja, módszere Ahogy azt fetebb s összefoglaltuk, a leíró statsztka a umerkus formácók összegyűjtését, az formácók összegzését, tömör jellemzését szolgáló módszereket foglalja magába, legfotosabb területe: adatgyűjtés adatok ábrázolása adatok csoportosítása, osztályozása adatokkal végzett egyszerűbb artmetka műveletek eredméyek megjeleítése

13 .. Adatgyűjtés Az egyed mérésekből származó adatok (meység smérvek) lehetek dszkrétek és folytoosak. Egy dszkrét meység smérv csak véges vagy megszámlálhatóa sok, egymástól jól elkülöíthető értéket vehet fel. Például háztartások agysága, téves telefohívások száma, balesetek száma, adott dőszak alatt bekövetkező gépmeghbásodások száma stb. Egy folytoos meység smérv valamely adott tervallumo belül bármlye értéket felvehet. Például háztartások hav jövedelme, lakások alapterülete, átmérő, yúlás, gépkocs abrocsok futásteljesítméye, edvességtartalom... Az adatok ábrázolása. Táblázat Képzés terület Összes hallgató (fő) Ebből ő, % Taárképzés, oktatástudomáy , Művészetek ,9 Humá tudomáyok , Társadalomtudomáyok ,0 Gazdaság és ráyítás , Jog ,7 Természettudomáyok , Iformatka 79 0,8 Műszak tudomáyok ,3 Mezőgazdaság ,5 Egészségügy, szocáls godoskodás , Szolgáltatás ,3 Összese ,8 4. ábra: Példa oszlopdagramra 3

14 5. ábra: Példa kördagramra 6. ábra: Példa sávdagramra 7. ábra: Példa voaldagramra 4

15 8. ábra: Adatok ábrázolása pktogram segítségével.3 Tapasztalat eloszlások.3. Meység smérv szert redezés és osztályozás Ebbe a fejezetbe olya X meység smérvekkel dolgozuk, melyekek a megfgyelt sokaság egységeel fellépő X változata külöbség vagy aráyskálá mért, valamlye mértékegységgel redelkező számértékek, mvel osztályozáso túlmeő elemzésre csak így yílk lehetőség. Az lye meység smérvet ezutá legtöbbször változóak, az X smérvértékeket pedg többyre (smérv)értékekek evezzük. Az X smérvértékek számszerű jellegébe rejlő egyk legkézefekvőbb lehetőség a sokaság egységeek sorba redezése az X változó agysága szert. Ezt redszert mooto emcsökkeő módo szokás véghezv. A sorbaredezés eredméyét ragsorak evezzük. A ragsor a megfgyelés egységekek és/vagy azokhoz tartozó X smérvértékekek mooto emcsökkeő sorredbe törtéő felsorolása. A ragsor gyakra kzárólag abból a célból készül, hogy megköyítse a sokaság egységeek X változó szert osztályozását. Az osztályozás már egyértelműe az X alapadatokba rejlő formácó sűrítését jelet. Az X szert körültektő osztályozás eredméye és aak grafkus ábrája sok formácót szolgáltat a vzsgált jeleség természetéről. Az osztályozás eredméyét gyakorság sorak vagy gyakorság eloszlásak evezzük. Általáos sémáját mutatja az alább ábra. 5

16 Az X szert képzett osztály Osztályközép abszolút relatív alsó felső gyakorság határa X 0 X X * f g X 0 X X * f g X 0 X X * f g X k0 X k X k * f k g k Összese N 9. ábra: Gyakorság sor A táblázatba látható alsó és felső határok az X smérv szert képzett osztályok elhatárolására szolgálak. Az egyes osztályok X 0 alsó és X felső határa bzoyos esetekbe egybeesek, máskor em. Ez utóbb esetbe osztályközös gyakorság sorról beszélük. Az f gyakorságok redre azt mutatják, hogy a sokaságak háy egysége tartozk az X változó szert -edk osztályba. A belőlük képzett g gyakorságok a relatív gyakorságok: g f A g relatív gyakorságok redre azt mutatják, hogy a sokaságak háy %-a tartozk az X változó szert -edk osztályba, vagys mlye a sokaság megoszlása az egyes osztályok között. Az X *-gal jelölt osztályközepek arra szolgálak, hogy a később részletezedő esetekbe az - edk osztályba sorolt összes smérvértéket helyettesítsék. Az -edk osztály osztályközepét az -edk osztály alsó és felső határáak egyszerű számta átlagakét adjuk meg: X ( X 0 X ) Térjük vssza az X smérv szert képzett osztályok elhatárolásáak kérdésére. Két esetet célszerű megkülöböztet:. Az X változó dszkrét, és az általa felvehető értékek száma kcs. Ebbe az esetbe a megfgyelt sokaság egységeek X szert osztályozása ge egyszerű. Ay osztályt képezük, aháy külöböző X érték lehetséges, és az egyes osztályok a sokaság azo egységeből állak, melyekél az X smérvek egy-egy adott értéke lép fel. Ekkor az - edk osztály esetébe feáll az alsó és felső osztályhatár egybeesése.. Az X változó folytoos, vagy dszkrét ugya, de az általa felvehető külöböző értékek száma agy. Ebbe az esetbe X lehetséges értékeek tartomáyát alkalmas osztópotok kjelölése útjá egymást át em fedő tervallumokra, ú. osztályközökre botjuk, és az -edk osztályközbe a sokaság azo egységet soroljuk be, melyekre ézve X 0 X X áll fe. Mvel az egymást követő osztályközök em fedhetk át egymást, az -edk osztályköz X felső határa em eshet egybe az (+)-dk osztályköz X +,0 alsó határával. Az X 0 legalsó és X k legfelső határ megadása vszot em kötelező, mert magához az X változó szert osztályozáshoz e két érték smerete em feltétleül szükséges. 6

17 Osztályközhosszúságak a h X X 0 külöbséget szokás tekte. M olya esetekkel foglalkozuk, ahol az egyes osztályok osztályközhosszúsága megegyezk. Még egy léyeges kérdés va: hogya döthető el, hogy adott esetbe háy osztályt képezzük, lletve mlye hosszúságú osztályközöket alakítsuk k? Ezzel kapcsolatba csak meglehetőse általáos útmutatást lehet ad: mdg ay és olya hosszúságú osztályközt képezzük, hogy a kapott gyakorság sor: köye áttekthető legye; hagyja megmutatkoz a sokaság egységeek az X változó agysága szert megoszlásába mutatkozó szabályszerűséget; előyös, ha az osztályközök határa és/vagy hosszúsága és/vagy az osztályközepek kerek számok. Mdez a tömörítés és részletezés között kompromsszumok kereséséről szól. Az osztályozás egyrészről formácóveszteséggel jár, hsze az egységek egyed tulajdoságara voatkozó smeretek elveszek. Ugyaakkor egy jó osztályozás jeletőse megköyít a vzsgált jeleség egészéek áttektését, am vszot bzoyos többletformácó az alapadatokhoz képest. Ezért mde osztályozás sorá töreked kell az osztályozás révé előálló formácóveszteség és formácóyereség bzoyos egyesúlyára. A túl kevés osztályköz agy formácóveszteséghez vezethet, túl sok osztály eseté pedg em tud érvéyesül a gyakorságok alakulásába többyre jelelévő szabályszerűség. Az osztályok ésszerű számát lletőe jó támpot lehet k azo legksebb k 0 értéke, amelyre már k0 N áll fe. Ha osztályközös gyakorság sor képzésére va szükség, és egyelő hosszúságú osztályközöket kíváuk kalakíta, akkor a k 0 -ak megfelelő osztályközhosszúság X max X m h0 k0 ahol X m, ll. X max az X változó legksebb, ll. legagyobb előforduló értéke. Semmképpe sem merev szabályról va szó, hsze teljese elfogadott gyakorlat a h 0 érték agyvoalú kerekítése s. A legmegfelelőbb megoldás érdekébe célszerű többféle osztályközszámmal és/vagy hosszúsággal s kísérletez, és az osztályozás eredméyeket grafkusa s ábrázol és összehasolíta. A gyakorlat tapasztalatok szert egy osztályozás akkor megfelelő, ha az osztályok számáak és határaak egy bzoyos sávo belül változtatása em agyo befolyásolja a grafkus képet. A gyakorlatba ehhez 5-5 osztály haszálata szte mdg elegedő. Eddg egyelő hosszúságú osztályközökről esett szó, de ezek alkalmazása em mdg kötelező és em s mdg célszerű. Ha az X smérv legagyobb és legksebb értéke között külöbség agy, és a sokaság egysége em egyeletese helyezkedek el az adott tervallumo belül, haem aak valamely szakaszára tömörülek, akkor célszerűbb egyelőtle hosszúságú osztályközöket haszál..3. Meység sorok grafkus ábrázolása Az adatok ábrázolásáak általáos lépése a következők:. Osztályba sorolás (folytoos adatok és agyszámú dszkrét megfgyelés eseté);. gyakorságok (f ) megállapítása; 3. relatív gyakorságok (g ) megállapítása: 7

18 Relatív gyakorság GAZDASÁGSTATISZTIKA II. rész. A matematka statsztka alapja f g, ahol a megfgyelt elemek száma; 4. összegzett (kumulált) gyakorságok (f ), lletve összegzett relatív gyakorságok (g ) megállapítása; 5. gyakorság táblázat készítése (f, g, f, g adataból); 6. gyakorság (relatív gyakorság), lletve összegzett gyakorság (relatív gyakorság) hsztogramok (folytoos adatok eseté a polgo és az ogva) felvétele (tapasztalat eloszlások elkészítése); 7. grafkus ábrázolás. A meység sorok közül elsősorba a (relatív) gyakorság és a kumulált (relatív) gyakorság sorokat szokás ábrázol voal-, ll. oszlopdagramok segítségével. A gyakorság sor oszlopdagramját hsztogramak, voaldagramját pedg gyakorság polgoak evezk. A vízsztes tegelyre mdg az X smérv értéke kerülek, a függőleges tegelye pedg a (relatív) gyakorságok, ll. kumulált (relatív) gyakorságok szerepelek. Példa (kevés számú dszkrét adat) A Gazdaságstatsztka c. tárgyat a 0 ősz félévbe teljesíte kíváó 760 hallgató végső érdemjegyeek gyakorságát és relatív gyakorságát foglalja össze az alább táblázat.. Táblázat: A Gazdaságstatsztka c. tárgyat a 0 ősz félévbe felvett hallgatók érdemjegyeek gyakorság táblázata Érdemjegy Tapasztalat gyakorság (f ) Relatív gyakorság (g ) 68 0, , , , ,06 Összese 760 A relatív gyakorságok ábrázolás módja lye dszkrét adatok esetébe: 0,400 0,350 0,368 Pálckadagram 0,36 0,300 0,50 0,00 0,50 0,00 0,089 0,0 0,06 Érdemjegyek relatív gyakorság értéke 0,050 0, Érdemjegyek 0. ábra: Relatív gyakorságok ábrázolása dszkrét adatok eseté 8

19 Kevésféle értéket felvevő dszkrét meység smérvek esetébe csaks az ábrázol kívát (relatív) gyakorságokkal aráyos hosszúságú, valamlye feltűő módo megjelölt végpotú egyees szakaszokkal törtéhet az ábrázolás. Az lye ábrát pálckadagramak evezk. A kumulált (összegzett) gyakorság táblázat és hsztogram: 3. Táblázat: Gyakorság táblázat Tapasztalat Relatív Kumulált tapasztalat Kumulált relatív Érdemjegy gyakorság (f ) gyakorság (g ) gyakorság (f ' ) gyakorság (g ' ) 68 0, , , , ,36 6 0, ,0 73 0, ,06 760,000 Összese 760. ábra: Kumulált relatív gyakorságok ábrázolása dszkrét adatok eseté Példa (agyszámú folytoos adat) Mt később taulmáyak (pl. Vállalat pézügyek) sorá lát fogják, a gazdaság elemzésekél gyakra szükség va a részvéyektől elvárt hozam becslésére. (A részvéyek elvárt hozama dőbe vszoylag stabl, így a jövőre voatkozó becsléseket múltbel adatakra alapozhatjuk). A Budapest Értéktőzsde Részvéydexéek (BUX) 005 márcusától 03 júuság tartó dőszak hav hozamaak értéket az alább táblázatba foglaltuk össze. Tektve, hogy a 008. október adat (-33,44%) a több adatot tektve erőse kugróak számít, így ezt az adatot elemzésükből elhagyjuk, és a maradék 99 adat alapjá végezzük el a leíró statsztka elemzést. 9

20 4. Táblázat: BUX dex hav hozamadatok hóap hozam hóap hozam hóap hozam hóap hozam 005. márcus -7,88% 007. áprls 8,00% 009. május 4,878% 0. júus -,963% 005. áprls -4,360% 007. május 4,97% 009. júus,533% 0. júlus -4,857% 005. május 3,85% 007. júus 7,997% 009. júlus,038% 0. augusztus -5,73% 005. júus 0,9% 007. júlus,5% 009. augusztus,50% 0. szeptember -5,778% 005. júlus 0,053% 007. augusztus -6,569% 009. szeptember 4,3% 0. október 0,947% 005. augusztus 4,0% 007. szeptember 3,66% 009. október,698% 0. ovember 0,96% 005. szeptember 6,8% 007. október -3,696% 009. ovember,3% 0. december -3,87% 005. október -,59% 007. ovember -6,3% 009. december,999% 0. jauár 0,699% 005. ovember 3,% 007. december,836% 00. jauár,808% 0. február,07% 005. december -,857% 008. jauár -,6% 00. február -,66% 0. márcus -3,433% 006. jauár 6,599% 008. február 0,% 00. márcus 3,04% 0. áprls -,73% 006. február 4,480% 008. márcus -7,97% 00. áprls,9% 0. május -,454% 006. márcus -0,669% 008. áprls 3,986% 00. május -,369% 0. júus 7,47% 006. áprls 5,447% 008. május -0,057% 00. júus -4,88% 0. júlus 0,385% 006. május -3,67% 008. júus -0,6% 00. júlus 5,6% 0. augusztus 0,606% 006. júus 0,764% 008. júlus 8,558% 00. augusztus,30% 0. szeptember 5,956% 006. júlus 5,398% 008. augusztus -5,564% 00. szeptember,963% 0. október 3,343% 006. augusztus -,07% 008. szeptember -0,735% 00. október -0,40% 0. ovember -5,098% 006. szeptember -,73% 008. október -33,440% 00. ovember -,464% 0. december -0,505% 006. október,883% 008. ovember -6,9% 00. december 3,76% 03. jauár 6,368% 006. ovember,6% 008. december -3,634% 0. jauár 6,80% 03. február -,950% 006. december 8,34% 009. jauár -6,0% 0. február,946% 03. márcus -5,70% 007. jauár -3,0% 009. február -,33% 0. márcus -0,44% 03. áprls,37% 007. február -,90% 009. márcus 8,98% 0. áprls 4,667% 03. május 5,03% 007. márcus 0,% 009. áprls 5,066% 0. május -3,304% 03. júus -,47% A fet példák alapjá a gyakorság táblázat: 5. Táblázat: Bux dex hav hozamadataak gyakorság táblázata alsó határ felső határ f f g [%] g [%] -0,00% -5,00%,0%,0% -5,00% -0,00% 9 9,09%,% -0,00% -5,00% 9 0 9,09% 0,0% -5,00% 0,00% ,3% 43,43% 0,00% 5,00% ,3% 75,76% 5,00% 0,00% ,5% 90,9% 0,00% 5,00% ,08% 98,99% 5,00% 0,00% 99,0% 00,00% összese 99 00,00% Osztályközös gyakorság sorok esetébe egymás mellé állított oszlopokkal törtéhet a gyakorságok vagy kumulált gyakorságok ábrázolása. Voaldagramok esetébe az egymás utá következő oszlopok felső éleek középpotját kötjük össze egyees szakaszokkal. Ez utóbb esetbe a legelső és a legutolsó középpotot szokás összeköt az X tegely azo potjaval, amelyek az első osztályközt megelőző, lletve az utolsó osztályközt követő, e két osztályközzel azoos hosszúságú fktív osztályköz középpotjáak felelek meg. Oszlopdagram ábrázolásáál az oszlopok területe kell, hogy aráyos legye az ábrázol kívát gyakorsággal vagy más adattal. 0

21 Relatív gyakorság Relatív gyakorság GAZDASÁGSTATISZTIKA II. rész. A matematka statsztka alapja 50% 40% 30% 0% 0% 0%,0% 9,09% 9,09% 3,3% 3,3% 5,5% 8,08%,0% -7,50%-,50% -7,50% -,50%,50% 7,50%,50% 7,50% Osztályközép. ábra: Relatív gyakorság voaldagramja Folytoos meység smérv eseté, ha a gyakorság hsztogramot úgy alakítjuk k, hogy az oszlopok összterülete, a kapott ábrát az X változó szert emprkus sűrűségfüggvéyek szokás evez. 50% 40% 30% 3,3% 3,3% 0% 0% 0% 5,5% 9,09% 9,09% 8,08%,0%,0% -7,50% -,50% -7,50% -,50%,50% 7,50%,50% 7,50% Osztályközép 3. ábra: Emprkus sűrűségfüggvéy (relatív gyakorság hsztogram) Emprkus eloszlásfüggvéy: A kumulált relatív gyakorság sor oszlopdagramja. Ezek az elevezések a valószíűségszámítás és a matematka statsztka között szoros kapcsolatra hívják fel a fgyelmet.

22 Kumulált relatív gyakorság Kumulált relatív gyakorság GAZDASÁGSTATISZTIKA II. rész. A matematka statsztka alapja A kumulált relatív gyakorság voaldagramja: 00% 80% 98,99% 00,00% 90,9% 75,76% 60% 40% 43,43% 0% 0% 0,0%,%,0% -7,50% -,50% -7,50% -,50%,50% 7,50%,50% 7,50% Osztályközép 4. ábra: Kumulált relatív gyakorság voaldagramja Kumulált relatív gyakorság hsztogram (tapasztalat eloszláskép, emprkus eloszlásfüggvéy): 00% 90% 80% 70% 60% 50% 40% 30% 0% 0% 0% 98,99% 00,00% 90,9% 75,76% 43,43% 0,0%,%,0% -7,50% -,50% -7,50% -,50%,50% 7,50%,50% 7,50% Osztályközép 5. ábra: Emprkus eloszlásfüggvéy (kumulált relatív gyakorság hsztogram) Ha elképzeljük, hogy a vzsgált sokaság végtele agy, és oly módo ábrázoljuk a hozzá tartozó gyakorság sort, hogy a haszált osztályközök hossza egyre ksebb, azaz 0-hoz tart, akkor a gyakorság polgo folytoos görbébe megy át, amt az X smérv gyakorság görbéjéek evezük. A gyakorság görbe a gyakorság polgo (hsztogram) elmélet határesete, egyfajta matematka modellje. A gyakorság görbe ugyas mdg megadható az smérvértékek valamlye függvéyekét. A folytoos adatok eloszlásfüggvéyét folytoos voallal s összeköthetjük, és az így kapott görbét ogváak evezzük. Ez azt mutatja meg, hogy megközelítőe mlye lee a tapasztalat eloszlásfüggvéy, ha az osztályközöket mde határo túl csökketeék, az osztályközökbe eső adatok számát pedg mde határo túl övelék.

23 Kumulált relatív gyakorság GAZDASÁGSTATISZTIKA II. rész. A matematka statsztka alapja 00,00% 80,00% 60,00% 40,00% 0,00% 0,00% 6. ábra: Példa ogvára Az ogvát felhaszálhatjuk egy adott értékél ksebb értékek számáak vagy relatív gyakorságáak meghatározására. Fordítva s eljárhatuk, vagys megállapíthatjuk azt az értéket, amelyk alá adott relatív gyakorsággal esek az adatok. Az lye értékeket kvatlsekek evezzük (lásd.4.3 alfejezet)..4 Tapasztalat eloszlások jellegzetessége.4. Helyzetmutatók (középértékek) A középérték mutatók a gyakorság eloszlás helyzetét egyetle, az adatokkal azoos mértékegységű számértékkel jellemzk. E középértékekkel kapcsolatos elvárásak, hogy legyeek: közepes helyzetűek, tpkusak, egyértelműe meghatározhatóak, köye értelmezhetőek. Ezekek az elvárásokak az egyes középérték-mutatók külöféle módoko teszek eleget. A középérték-mutatókak két agy csoportja smeretes: Helyzet középértékek: az adatok között elhelyezkedésükél fogva jellemzk a vzsgált gyakorság eloszlás helyzetét. o Medá o Módusz Számított középértékek: az adatokkal kapcsolatos számszerű összefüggésük révé jellemzk a vzsgált gyakorság eloszlás helyzetét. o Számta átlag o Mérta átlag o Harmokus átlag o Négyzetes átlag 3

24 .4..a Medá (Me) Jellemző: helyzet középérték, közepes helyzetű elvárásak tesz a legjobba eleget. A medá a változó azo számértéke, amelyél az összes előforduló számérték fele ksebb, fele pedg agyobb, így a ragsorba állított sokaság számértékeket két egyelő gyakorságú osztályra botja. Mdg egyértelműe meghatározható, valód középérték, érzéketle a szélsőértékekre, és em függ a több smérvértéktől sem. Ha az adathalmazukba sok az egyforma smérvérték, akkor haszálata em taácsos. Rövde: a agyságred szert redezett adatok középső értéke (páros számú adat eseté a két középső érték átlaga). A medá említésre méltó tulajdosága, hogy N X A m, ha A Me Ez a tulajdoság úgy értelmezhető, hogy ha mde smérvértéket a medáal helyettesíteék, akkor ezzel összességébe a lehető legksebb hbát követék el, ameybe ezt a hbát mde esetbe előjeltől elvoatkoztatva, az X Me módo mérjük. Példa 6, 8, 4, 9, 7, 3, 5, 3, 4, 5, 6, 7, 8, 9 Me=6 4, 9, 7, 8,, 5, 4, 5, 7, 8, 9, Me=7,5 7, 9, 3, 0, 5,, 5,, 3, 5, 5, 7, 9, 0 Me=5 Ha a BUX dex korább, 99 hav hozamadatat vesszük alapul, akkor e 99 adatot sorba állítva, a ragsor 50. tagja lesz a medá, hsze eél 49 ksebb, és 49 agyobb érték lesz a ragsorba, ez pedg,3%. -5,778% -0,6% -4,88% -,950% -0,44%,5%,533% 4,0% 6,8% 0,053% -5,73% -7,97% -4,857% -,90% -0,40%,30%,808% 4,3% 6,80% 0,9% -3,67% -7,88% -4,360% -,66% -0,057%,698%,883% 4,480% 6,368% 0,699% -,454% -6,569% -3,87% -,73% 0,%,836%,963% 4,667% 6,599% 0,947% -,33% -6,9% -3,696% -,07% 0,96%,946% 3,% 4,97% 7,47%,50% -,464% -6,3% -3,634% -,857% 0,%,999% 3,85% 5,03% 7,997%,038% -,369% -6,0% -3,433% -,73% 0,385%,07% 3,76% 5,398% 8,00% 3,04% -,59% -5,564% -3,304% -,47% 0,606%,9% 3,343% 5,447% 8,34% 4,878% -,6% -5,70% -3,0% -0,669% 0,764%,6% 3,66% 5,6% 8,98% 5,066% -0,735% -5,098% -,963% -0,505%,3%,37% 3,986% 5,956% 8,558% Osztályközös gyakorság sor eseté a medá az alább formulával becsülhető: N ' fme Meˆ X me,0 hme fme ahol me aak a legelső osztályközek a sorszáma, amelyre gaz, hogy N f ' me és X me,0 az me sorszámú osztályköz alsó határa, és a h me pedg eek az osztályak az osztályközhosszúsága, am egyszerűe a felső és alsó osztályhatár értékéek a külöbsége. 4

25 Példa Vegyük a korább BUX-dexes példákat, és tegyük fel, hogy csak a gyakorság táblázat áll redelkezésükre, és em smerjük egyekét az összes hozamadatot. Nézzük meg, hogy lye esetbe hogya becsülhető a medá! alsó határ felső határ f f g [%] g [%] -0,00% -5,00%,0%,0% -5,00% -0,00% 9 9,09%,% -0,00% -5,00% 9 0 9,09% 0,0% -5,00% 0,00% ,3% 43,43% 0,00% 5,00% ,3% 75,76% 5,00% 0,00% ,5% 90,9% 0,00% 5,00% ,08% 98,99% 5,00% 0,00% 99,0% 00,00% összese 99 00,00% ' N f me N/=49,5 a medát tartalmazó osztály az ötödk osztály: 0,00% x < 5,00%. N ' f me 49,5 43 M eˆ X me, 0 hme 0,00 (5,00 0,00),063% f 3 A medá becsült értéke,063%..4..b Módusz (Mo) me A módusz helyzet középérték, a tpkus smérvérték megtestesítője. Dszkrét smérv eseté a módusz a leggyakrabba előforduló smérvérték, folytoos smérv eseté a gyakorság görbe maxmumhelye. A módusz em mdg határozható meg egyértelműe, és em s mdg létezk. Ugyaakkor előye, hogy érzéketle a szélsőértékekre, em függ sem az összes, sem a kugró smérvértékektől. Példa Korább dszkrét, a 0 ősz félév érdemjegyeek alakulását vzsgáló példákba az elégséges érdemjegy gyakorsága a legagyobb (80 db), így a módusz értéke. Érdemjegy Tapasztalat gyakorság (f ) Relatív gyakorság (g ) 68 0, , , , ,06 Összese 760 Folytoos változó eseté a medához hasoló módo osztályközös gyakorság sorból s becsülhető. Moˆ X mo, 0 d a d d a f h mo 5

26 Ebbe a képletbe mo a móduszt tartalmazó osztályköz sorszáma, és f f d f f d a mo mo f mo mo A móduszt mdg az az osztályköz tartalmazza, amelykhez a hsztogram legmagasabb oszlopa tartozk. Példa alsó határ felső határ f f g [%] g [%] -0,00% -5,00%,0%,0% -5,00% -0,00% 9 9,09%,% -0,00% -5,00% 9 0 9,09% 0,0% -5,00% 0,00% ,3% 43,43% 0,00% 5,00% ,3% 75,76% 5,00% 0,00% ,5% 90,9% 0,00% 5,00% ,08% 98,99% 5,00% 0,00% 99,0% 00,00% összese 99 00,00% Folytoos smérv eseté a móduszt a legagyobb gyakorságú osztály tartalmazza: M d (3 3) 0,00 (5,00 0,00) (3 3) (3 5) a oˆ X mo, 0 hmo d a d f Bux dexes példákba a módusz becsült értéke,73%..4..c Számta átlag,73077% A leggyakrabba haszált középértékmutató: az átlag, a medáal és a módusszal szembe, amelyek helyzet középértékek, a számta átlag számított középértékfajta. Számta átlag: Az a szám, amellyel az átlagoladó számértékeket helyettesítve azok összege változatla marad. Bármely alapadathalmazból egyértelműe meghatározható, mde alapadatot felhaszál. A hátráya, hogy érzékey a szélsőértékekre. Számítása: X X X X... X N X N N N A képlet harmadk tagját felhaszálva és átredezve azt kapjuk, hogy N N X X. Ez azt jelet, hogy az X összegbe mde X helyébe az átlagot téve potosa az smérvértékek összegét kapjuk. E defícó következméye: N ( X X ) 0 Ez azt jelet, hogy ha mde smérvértéket a számta átlaggal helyettesítük, akkor az e helyettesítéssel elkövetett d X X Megjegyzés: éha a módusz becsléséek egyszerűe a móduszt tartalmazó osztályköz osztályközepét tektk (példákba ez,50 % lee), ezt yers móduszak hívják. Bárhogya s határozzuk meg a móduszt, az arra kapott közelítő érték esetleges, mert függ az osztályközök számától és hosszától. 6

27 előjeles hbák összességükbe potosa kegyelítk egymást. Bzoyítható, hogy N ( X A) eltérés-égyzetösszeg éppe akkor mmáls, ha A X. Ez pedg úgy s érthető, hogy az smérvértékekek a számta átlaggal való helyettesítése emcsak egymást összességükbe kegyelítő előjeles hbákkal jár, haem még mmálssá s tesz az e helyettesítéssel elkövetett hbák égyzetösszegét. A számta átlagot ge gyakra em az egyekét smert X alapadatokból kdulva számítjuk, haem sok esetbe egy gyakorság sor adataból. Az alább formulát súlyozott számta átlag formuláak evezk: X r f r ahol: X = az. tag számértéke X * = az. osztály osztályközepe f = az. osztály tapasztalat gyakorsága g = az. osztály relatív gyakorsága r = osztályok száma Mt látható, egy súlyozott számta átlag agyságát két téyező határozza meg: az X értékek sorozata (vagys az átlagoladó értékek agysága), lletve az X értékekhez tartozó f súlyszámok egymás között aráya, azaz relatív agysága. Dszkrét példa x f X f r Érdemjegy Tapasztalat gyakorság (f ) Relatív gyakorság (g ) 68 0, , , , ,06 Összese 760 f x ,7 760 E példa érdekessége, hogy a számta átlagszámítás eredméyekét olya értéket kaptuk, amely a valóságba em fordulhat elő, hsze sek em kaphat lye érdemjegyet. Folytoos példa Vegyük smét a korább BUX-dexes példákat! Ha a redelkezésre álló 99 egyed adatukból számítjuk k a számta átlagot, 0,37%-ot kapuk. g X 7

28 x 99 x 99 5,778 ( 5,73) ( 3,67)... 3,04 4,878 5,066 36,870 0,37% alsó határ felső határ f f g [%] g [%] -0,00% -5,00%,0%,0% -5,00% -0,00% 9 9,09%,% -0,00% -5,00% 9 0 9,09% 0,0% -5,00% 0,00% ,3% 43,43% 0,00% 5,00% ,3% 75,76% 5,00% 0,00% ,5% 90,9% 0,00% 5,00% ,08% 98,99% 5,00% 0,00% 99,0% 00,00% összese 99 00,00% A BUX dexes példához tartozó osztályközös gyakorság táblázatukat alapul véve s becsülhetjük a számta átlagot a tapasztalat gyakorságok vagy a relatív gyakorságok segítségével: x 8 8 ( 7,50) 9 (,50) 9 ( 7,50) 3 (,50) 99 3,50 5 7,50 8,50 7,50 0,37879% 99 x 8 f g f x x 0,00 ( 7,50) 0,0909 (,50) 0,0909 ( 7,50) 0,33 (,50) 0,33,50 0,55 7,50 0,0808,50 0,007,50 0,37879% Ebbe az esetbe a két eredméy (az egyekét értékek smeretébe számított 0,37% és a súlyozott formulával számított 0,37879%) között eltérés összefüggésbe va a sokaság számosságával, az osztályközök hosszával, és az osztályközepek megválasztásával..4..d Egyéb átlagfajták Harmokus átlag: Az a szám, amellyel az átlagoladó értékeket helyettesítve azok recprokaak összege változatla marad. Számítása (súlyozatla, majd súlyozott formula): X h N N X r r f f X Leggyakrabba akkor haszáljuk, ha az értékek recprokaak összege értelmezhető. Ilye esetekkel elsősorba a leíró statsztka vszoyszámok és dexek számításáál találkozuk. 8

29 Mérta átlag: Az a szám, amellyel az átlagoladó értékeket helyettesítve azok szorzata változatla marad. Számítása (súlyozatla, majd súlyozott formula): N f N r f N g X X X A mérta átlagot akkor haszáljuk, ha az értékek szorzata értelmezhető, lletve az átlagoladó értékek expoecálsa őek vagy csökkeek. Leggyakrabba az dőbel fejlődés átlagos üteméek vzsgálatakor haszáljuk. Idősorok elemzése sorá (pl. termelés évekét alakulása, tőzsdedex hav változása, stb.) általába az dőszakról dőszakra bekövetkezett övekedést, vagy csökkeést vzsgáljuk. Négyzetes átlag: Az a szám, amellyel az átlagoladó értékeket helyettesítve azok égyzetösszege változatla marad. k Számítása (súlyozatla, majd súlyozott formula): X q N X N r f r X f Természetéél fogva a égyzetes átlag a kugróa magas értékekre reagál érzékeye. A égyzetes átlag alkalmazására legkább akkor kerül sor, amkor az értékek között poztív és egatív értékek egyarát előfordulak, de az előjelekek a vzsgálat szempotjából cs jeletőségük, az értékek abszolút agyságát kívájuk a középértékekkel jellemez. Tpkus alkalmazás területe a szórásszámítás..4. Választás a középértékek között Bebzoyítható, hogy ugyaazo poztív x értékekből számított külöböző fajta átlagok között a következő agyságred relácó áll fe: X X X X X m h g q X max A harmokus és a mérta átlag a agyo alacsoy, a égyzetes átlag a magas értékekre mutat fokozott érzékeységet. Az átlagoladó értékek jellege, és az átlag számításához redelkezésre álló formácó együttese határozza meg, hogy mlye esetbe melyk átlagfajtát célszerű haszál. A választás sorá érdemes mérlegel a következőket: Egyértelműe meghatározható-e? Az összes redelkezésre álló adattól függ-e vagy sem? Meyre érzékey a szélsőségese agy vagy kcs értékekre? Mekkora és mlye módo értelmezhető hbával képes helyettesíte az alapadatokat? 9

30 .4.3 Kvatlsek Eddg egyelő osztályköz-hosszúságú gyakorság sorokat képeztük, az lye osztályközök relatív gyakorsága eltértek egymástól. Lehetőség va a ragsorba olya osztópotok (osztályhatárok) keresésére, amelyek egyelő relatív gyakorságokat fogak közre. Az lye osztályközök általába em egyelő hosszúságúak. Eze osztályhatárok megállapításához haszáljuk a kvatlseket. Kvatls: Az X /k -edk k-ad redű kvatls az a szám, amelyél az összes előforduló smérvértékek /k-ad része ksebb, (-/k)-ad része pedg agyobb, ahol k és =,,, k-. A mdg 0 és közé eső /k háyadost p-vel s szokás jelöl, a megfelelő X p kvatlst pedg p-ed redű kvatlsek s szokás hív. Meghatározásuk úgy törték, hogy adatakat agyság szert övekvő sorredbe redezzük (ragsort készítük), majd az értékeket k számú egyelő gyakorságú csoportra osztjuk, és az egyes csoportok felső határá lévő smérvértékeket vesszük. Ezek leszek a kvatls értékek. A külöböző számú csoportba redezéshez a kvatlsek kokrét elevezése tartozak. Ha az adatokat két részre osztjuk, akkor a medát (Me) kapjuk. Négy részre való osztásál kvartlseket (Q, =,,3) ad, öt rész eseté kvtlseket (K, =,, 3, 4), tíz rész eseté declseket (D, =,,,9) száz részre való osztásál percetlseket (P, =,,3,,99) yerük. Ha például az egyetemre jeletkezők potszámát értékelve 3 pot a hatodk decls érték, ez azt jelet, hogy a jeletkezők hatva százaléka 3 potál kevesebbel, 40%-a pedg 3 pottal, vagy aál többel redelkezk. k 6. Táblázat: A leggyakrabba haszált kvatlsek Elevezés Általáos lehetséges Lehetséges jelölés értéke kvatlsek Medá - Me 4 Kvartls Q,,3 Q, Q, Q 3 5 Kvtls K,,3,4, K, K, K 3, K 4 0 Decls D,,,9 D, D, D 9 00 Percetls P,,,99 P, P,,P 99 Számítása: Ragsorba redezett adatak /k-k tagja. s / k ( N ) Értéke: ) k ( X / k X s s / / / k k X s X k s / k (Megjegyzés: a [ ] az egészrészt, a { } a zárójelbe levő meység törtrészét jelöl.) Példa A BUX-dexes példák alapjá számítsuk k az alsó és felső kvartlst, ll. az alsó és felső declst! 30

31 -5,778% -0,6% -4,88% -,950% -0,44%,5%,533% 4,0% 6,8% 0,053% -5,73% -7,97% -4,857% -,90% -0,40%,30%,808% 4,3% 6,80% 0,9% -3,67% -7,88% -4,360% -,66% -0,057%,698%,883% 4,480% 6,368% 0,699% -,454% -6,569% -3,87% -,73% 0,%,836%,963% 4,667% 6,599% 0,947% -,33% -6,9% -3,696% -,07% 0,96%,946% 3,% 4,97% 7,47%,50% -,464% -6,3% -3,634% -,857% 0,%,999% 3,85% 5,03% 7,997%,038% -,369% -6,0% -3,433% -,73% 0,385%,07% 3,76% 5,398% 8,00% 3,04% -,59% -5,564% -3,304% -,47% 0,606%,9% 3,343% 5,447% 8,34% 4,878% -,6% -5,70% -3,0% -0,669% 0,764%,6% 3,66% 5,6% 8,98% 5,066% -0,735% -5,098% -,963% -0,505%,3%,37% 3,986% 5,956% 8,558% Alsó kvartls: s / 4 ( 99) 5 4 Az alsó kvartls a ragsorba redezett 99 db hav hozamadat 5.-k tagja: -3,696%. Értelmezése: a ragsorba redezett adatok /4-e ksebb, mt -3,696%, és 3/4-e pedg agyobb. Felső kvartls: 3 s 3/ 4 ( 99) 75 4 A felső kvartls a ragsorba redezett 99 db hav hozamadat 75.-k tagja: 4,97%. Értelmezése: a ragsorba redezett adatok 3/4-e ksebb, mt 4,97%, és /4-e pedg agyobb. Alsó decls s /0 ( 99) 0 0 Az alsó decls a ragsorba redezett 99 db hav hozamadat 0. tagja: -0,735%. Értelmezése: a ragsorba redezett adatok /0-e ksebb, mt -0,735, és 9/0-e pedg agyobb. Felső decls: 9 s 9 /0 ( 99) 90 0 Az alsó decls a ragsorba redezett 99 db hav hozamadat 90. tagja: 8,558%. Értelmezése: a ragsorba redezett adatok 9/0-e ksebb, mt 8,558, és /0-e pedg agyobb. A kvatlsek meghatározására olyakor s szükség lehet, amkor az smérvértékek ragsora helyett osztályközös gyakorság sor áll redelkezésükre. Ilyekor az X /k kvatls a következő képlettel becsülhető: hq Xˆ / k X q0 N f ' q k f ahol q aak a legelső osztályközek a sorszáma, amelyre már gaz, hogy f ' q N k A keresett kvatlst eze osztályközö belül a becslés képlet azo egyszerű feltételezés mellett helyez el, hogy az smérvértékek az osztályközö belül egymástól egyelő távolságra vaak. Vegyük újra a BUX dexes példákhoz tartozó gyakorság táblázatot, és becsüljük az előzőleg kszámított kvatlseket! 3 q

32 alsó határ felső határ f f g [%] g [%] -0,00% -5,00%,0%,0% -5,00% -0,00% 9 9,09%,% -0,00% -5,00% 9 0 9,09% 0,0% -5,00% 0,00% ,3% 43,43% 0,00% 5,00% ,3% 75,76% 5,00% 0,00% ,5% 90,9% 0,00% 5,00% ,08% 98,99% 5,00% 0,00% 99,0% 00,00% összese 99 00,00% Alsó kvartls becslése: Keressük meg azt az osztályközt, amelyk az alsó kvartlst tartalmazza a k N ,75 f ' q N képlettel. k A legelső osztály, amelyél a kumulált tapasztalat gyakorság agyobb, vagy egyelő mt 4,75, a 4. osztály, ahol a kumulált tapasztalat gyakorság 43. Behelyettesítve a becslés képletbe: h4 5,00 Q X N f ' 5, ,97% 40 4 k f4 4 3 Eek aalógájára végezzük el a több kvatls becslését. Felső kvartls becslése: 3 N 99 74,5 k 4 A legelső osztály, amelyél a kumulált tapasztalat gyakorság agyobb, vagy egyelő, mt 74,5, az 5. osztály, ahol a kumulált tapasztalat gyakorság 75. h5 3 5,00 Q 3 X 50 N f ' ,88% k f5 4 3 Alsó decls becslése: N 99 9,9 k 0 A legelső osztály, amelyél a kumulált tapasztalat gyakorság agyobb, vagy egyelő mt 9,9, a. osztály, ahol a kumulált tapasztalat gyakorság. h 5,00 D X 0 N f ' 5, ,6% k f 0 9 Felső decls becslése: 9 N 99 89, k 0 A legelső osztály, amelyél a kumulált tapasztalat gyakorság agyobb, vagy egyelő mt 89, a 6. osztály, ahol a kumulált tapasztalat gyakorság 90. h6 9 5,00 D X 60 N f ' 6 5, ,7% k f

33 .4.4 Szóródás mutatók A redelkezésre álló adathalmazukba szereplő értékek változékoysága, szóródása kétféleképpe s megragadható: az egyes értékek egymás között külöbsége, vagy pedg az egyes értékekek egy ktütetett értéktől (középérték) való eltérése keresztül. Egy másk csoportosítás lehetőség szert létezek abszolút és relatív gadozásmutatók. Az abszolút szóródás mutatók mértékegysége ugyaaz, mt az alapadatoké. A relatív szóródás mutatók elvoatkoztatak az eredet mértékegységtől, és külöböző smérvértékek szóródásáak az összehasolítását szolgálják..4.4.a Terjedelem (R) Terjedelem: Az adathalmazba szereplő legagyobb és legksebb adat külöbsége. Számítása: R X max X m Előye a köyű számítás, hátráya, hogy csak a két legszélsőségesebb smérvértéktől függ, eek kküszöbölésre haszálják az terkvatls terjedelemmutatót, amely csökket a véletle szélsőértékeket alakító szerepét. Iterkvatls terjedelem: Az adathalmaz két szélső k-adredű kvatlséek külöbsége. Számítása: X X, k> R ( k) / k / k k A fet képletek megfelelőe az terkvartls terjedelemmutató a felső és alsó kvartls külöbségekét adódk: R Q / 3 Q Példa Korább dszkrét, érdemjegyeket vzsgáló példák esetébe: Érdemjegy Tapasztalat gyakorság (f ) Relatív gyakorság (g ) 68 0, , , , ,06 Összese 760 R 5 4 Példa Vegyük smét a korább BUX-dexes példákat, és számítsuk k a terjedelmet: R 5,066% ( 5,778%) 30,844% Az terkvartls terjedelem a felső (Q 3 ) és alsó (Q ) kvartls külöbségekét: R / 4,97% ( 3,696%) 8,63% Az terdecls terjedelem a felső (D 9 ) és alsó (D ) decls külöbségekét: R 8,558% ( 0,735%) 9,93% 8/0 33

34 .4.4.b Átlagos abszolút külöbség (G) Átlagos abszolút külöbség: A mde lehetséges módo párba állított smérvértékek külöbségeek abszolút értékéből számított számta átlag. Ez a G-vel jelölt gadozásmutató azt mutatja meg, hogy az X smérv értéke átlagosa meyre külöbözek egymástól. Mértékegysége ugyaaz, mt az alapadatoké. Számítása: N N G X X j N( N ) j ahol N az adatok számát jelet. Specáls felhaszálás területe a kocetrácóelemzés, hátráya, hogy számítása meglehetőse kéyelmetle. Alkalmazását egy egyszerűbb példá mutatjuk be. Példa Véletleszerűe kválasztuk 5 hallgatót, és kszámítjuk a Gazdaságstatsztka tárgy zh-já elért eredméyük átlagos abszolút külöbségét. Az elért potok: 45, 5, 76, 87, G 5,8, azaz az 5 hallgató zh- elért potja átlagosa 5,8 pottal tér el 5(5 ) egymástól..4.4.c Átlagos abszolút eltérés () Az átlagos abszolút eltérés az gadozásmutatók azo csoportjába tartozk, amelyek a szóródást az értékekek egy ktütetett értéktől való eltérésere támaszkodva jellemzk. Átlagos abszolút eltérés: Az egyes smérvértékek és a számta átlag külöbségeek abszolút értékeből számított számta átlag. Számítása: d, ahol: d X X Ez a mutató s becsülhető osztályközös gyakorság sorból a tapasztalat gyakorságok felhaszálásával. Ebbe az esetbe a d eltérések számításáál az osztályközepeket kell alapul veük. A súlyozott formula: 34

35 r f r Példa Korább dszkrét, érdemjegyeket vzsgáló példák esetébe: Érdemjegy Tapasztalat gyakorság (f ) Relatív gyakorság (g ) 68 0, , , , ,06 Összese 760 f d 68,7 80, , Az érdemjegyek átlagosa 0,8-gyel térek el az átlagtól. 0,8 Példa A BUX-dexes példák átlagos abszolút eltérése. (Az egyed adatokból számított számta átlagot (0,37%) felhaszálva) d 5,779 0,37 5,37 0, ,066 0,37 99 Azaz az egyes hozamadatok átlagosa 5,3776%-kal térek el a számta átlagtól. 5,3776% Osztályközös gyakorság sorból becsülve (az ugyacsak becsült számta átlaggal (0,379%) számolva és a gyakorságokkal súlyozva): 7,500,3799,500, ,50 0,379 6,3% 99 Azaz az egyes hozamadatok átlagosa 6,3%-kal térek el a számta átlagtól..4.4.d Tapasztalat szórás (s), korrgált tapasztalat szórás (s*) Ahogy a számta átlag az átlag, úgy a tapasztalat és a korrgált tapasztalat szórás a szórás. A szórás az adathalmazuk változékoyságáak legfotosabb mérőszáma. Nagyo hasolít az előbb mutatóhoz, és jeletése s hasoló: ayba tér el, hogy a d eltérések előjelét em abszolút érték képzésével, haem égyzetre emeléssel oldja meg, majd a égyzetre emelést gyökvoással tesz jóvá. A szórás az egyes X smérvértékek átlagtól vett d eltéréseek égyzetes átlaga. Azt mutatja, hogy az egyes értékek átlagosa meyre térek el a számta átlagtól. Tapasztalat szórás számítása (súlyozatla és súlyozott formulák): 35

36 N X X s N Korrgált tapasztalat szórás számítása: * s N d N N X X N r f ( X X ) r f Példa Korább dszkrét, érdemjegyeket vzsgáló példák esetébe: Érdemjegy Tapasztalat gyakorság (f ) Relatív gyakorság (g ) 68 0, , , , ,06 Összese f 68 (,7) 80 (,7) (5,7) d s 5 f 760 Az érdemjegyek átlagosa db-bal térek el az átlagos értéktől. Példa BUX-dexes példák szórása az egyed adatokból számolva (az egyekét adatokból számított számta átlagtól (0,37%) való átlagos eltérést mérve): 99 X 0,37 s 99 5,779 0,37 5,37 0, ,066 0, ,77% s 99 X 0, ,779 0,37 5,37 0, ,066 0, ,806% Az egyes hozamadatok 6,77%-kal, lletve korrgált esetbe 6,806%-kal térek el átlagosa az átlagtól. 36

37 Osztályközös gyakorság sorból becsülve: alsó határ felső határ f f g [%] g [%] -0,00% -5,00%,0%,0% -5,00% -0,00% 9 9,09%,% -0,00% -5,00% 9 0 9,09% 0,0% -5,00% 0,00% ,3% 43,43% 0,00% 5,00% ,3% 75,76% 5,00% 0,00% ,5% 90,9% 0,00% 5,00% ,08% 98,99% 5,00% 0,00% 99,0% 00,00% összese 99 00,00% Gyakorság sorból becsült számta átlaggal (0,379%): s 8 8 f d f ( 7,50 0,379) 9 (,50 0,379) (7,50 0,379) 7,3% Az egyes hozamadatok átlagosa 7,3%-kal térek el az átlagtól..4.4.e Relatív szórás (v) Relatív szórás: A szórás és a számta átlag háyadosa. Elsősorba külöböző sokaságok vagy smérvek szóródásáak összehasolítására haszálják. Úgy s értelmezhető, mt az értékek átlagtól vett átlagos eltérése, ezért mél ksebb a relatív szórás, a számta átlag aál jobba jellemz az alapadatokat. Számítása csak poztív értékű smérvekre: s v X 00 %.5 Fogalmak Statsztka sokaság Nem mtavétel hba Álló sokaság Dszkrét sokaság Ismérv Alteratív smérv Nem meység smérv Sorred skála Aráyskála Leíró statsztka Folytoos meység smérv Gyakorság Pálcka dagram Emprkus eloszlásfüggvéy Medá Számta átlag Statsztka mta Mtavétel hbaá Mozgó sokaság Folytoos sokaság Ismérvváltozat Meység smérv Nomáls skála Itervallumskála Dszkrét meység smérv Ragsor Relatív gyakorság Emprkus sűrűségfüggvéy Ogva Módusz Harmokus átlag 37

38 Mérta átlag Kvatls terkvatls terjedelem Átlagos abszolút eltérés Relatív szórás Négyzetes átlag Terjedelem Átlagos abszolút külöbség (Korrgált) tapasztalat szórás.6 Gyakorló feladatok.6. Feladat Egy teretszolgáltató vállalkozásál 80 apo keresztül vzsgálták az ügyfelek ap reklamácóak számát. A megfgyelések eredméyeből az alább gyakorság eloszlást készítették. Reklamácók száma (reklamácó apota) Napok száma a) Készítse az adatokból gyakorság táblázatot és értelmezze mde gyakorság sorból az 5. osztályhoz tartozó értéket! b) Ábrázolja a gyakorság sort és a kumulált relatív gyakorságokat! c) Mekkora a ap reklamácók átlagos száma? d) Mekkora a ap reklamácók tpkus értéke? e) Mekkora a medá értéke? f) Mekkora az átlagtól vett eltérések égyzetes átlaga (szórás)? g) Mekkora a relatív szórás? Megoldás: a) Készítse az adatokból gyakorság táblázatot és értelmezze mde gyakorság sorból az 5. osztályhoz tartozó értéket! Reklamácók száma (reklamácó apota) f f ' g ' g 38

39 Az 5. osztályhoz tartozó gyakorság értékek jeletése: f : A megfgyelések sorá 3 apo volt a ap reklamácók száma 4. 5 f : 50 apo volt a ap reklamácók száma 4, vagy aál kevesebb. ' 5 g : Az esetek,4%-ba volt ap 4 reklamácó. 5 g :Az esetek 89,3%-ba volt a ap reklamácók száma 4, vagy aál kevesebb. ' 5 b) Ábrázolja a gyakorság sort és a kumulált relatív gyakorságokat! (Relatív) gyakorságok ábrázolása (pálcka dagram): Kumulált (relatív) gyakorságok ábrázolása: Kumulált relatív gyakorság ' g,000 0,968 0,893 0,779 0,504 0,7 0, Nap reklamácók száma c) Mekkora a ap reklamácók átlagos száma? x r r f f x , A ap reklamácók átlagos száma,475. Dszkrét adatról lévé szó, lye érték a valóságba em fordulhat elő. d) Mekkora a ap reklamácók tpkus értéke? A ap reklamácók tpkus értéke a módusz. 39

40 Reklamácók száma ' ' f (reklamácó apota) f g Dszkrét smérv eseté a módusz az smérv leggyakrabba előforduló értéke. A táblázatból látható, hogy a leggyakrabba (az összes megfgyelésből 77-szer előforduló) érték a 3. Azért ez a tpkus érték, mert ez a leggyakorbb. e) Mekkora a medá értéke? Reklamácók száma ' ' f (reklamácó apota) f g g Páros számú adat eseté a sorba redezett adatok között a két középső átlaga a medá. Esetükbe a 40. és a 4. adat a övekvő sorredbe redezett adatok között a két középső. E két adat értéke redre a és a. Ezért a medá értéke. f) Mekkora az átlagtól vett eltérések égyzetes átlaga (szórás)? Reklamácók száma ' ' f (reklamácó apota) f g ,475 45, ,475 3 S,99 80 S,56 Vagys a reklamácók száma átlagosa,56 db-bal tér el az átlagtól. g) Mekkora a relatív szórás? S,56 0,63 x,475 A relatív szórás 6,3%. Ez a mutató ömagába em formatív, másk vállalkozás hasoló adataval, vagy ugyaeze vállalkozás más dőszakba yert adataval való összehasolításkor yere gazá értelmet. 40 g g

41 .6. Feladat Egy áramszolgáltatóál 650 megfgyelést végeztek a szolgáltatásba bekövetkező áramkmaradásokra voatkozóa. A megfgyelések eredméyt az alább táblázatba rögzítették. a) Készítse az adatokból gyakorság táblázatot és értelmezze mde gyakorság sorból a 4. osztályhoz tartotó értéket! b) Ábrázolja az áramkmaradások dőtartam szert megoszlását és a tapasztalat eloszlásképet! c) Mekkora az áramkmaradások átlagos dőtartama? d) Mekkora a tpkusak tekthető áramkmaradás dőtartama? e) Becsülje meg és értelmezze a medát! f) Adjo becslést a szórásra! g) Mekkora a relatív szórás? Megoldás: a) Készítse az adatokból gyakorság táblázatot és értelmezze mde gyakorság sorból a 4. osztályhoz tartotó értéket! A egyedk osztályhoz tartozó gyakorságok értelmezése: f 4 : A megfgyelések sorá 40 esetbe volt az áramkmaradás dőtartama 30 percél hosszabb vagy azzal egyelő és 40 percél rövdebb. ' f 4 : 60 esetbe volt az áramkmaradás dőtartama 40 percél rövdebb. g 4 : Az esetek 6,%-ba volt az áramkmaradás dőtartama 30 percél hosszabb vagy azzal egyelő és 40 percél rövdebb. g : Az esetek 95,4%-ba volt az áramkmaradás dőtartama 40 percél rövdebb. ' 4 Áramkmaradás dőtartama (perc) Áramkmaradások száma [0;0) 40 [0;0) 90 [0;30) 350 [30;40) 40 [40;50) 0 [50;60) 0 Áramkmaradás dőtartama ' ' f (perc) f g g [0;0) [0;0) [0;30) [30;40) [40;50) [50;60) b) Ábrázolja az áramkmaradások dőtartam szert megoszlását és a tapasztalat eloszlásképet! Relatív gyakorság hsztogram (tapasztalat sűrűségfüggvéy): vízsztes tegelye az osztályhatárok, függőleges tegelye a relatív gyakorságok. 4

42 Kumulált relatív gyakorság hsztogram (tapasztalat eloszláskép): vízsztes tegelye az osztályhatárok, függőleges tegelye a kumulált relatív gyakorságok. c) Mekkora az áramkmaradások átlagos dőtartama? A számta átlag becslése: Áramkmaradás dőtartama ' ' (perc) f f g g x [0;0) [0;0) [0;30) [30;40) [40;50) [50;60) x r fx r f Az áramkmaradások átlagos hossza,538 perc.,538 d) Mekkora a tpkusak tekthető áramkmaradás dőtartama? Módusz: folytoos smérv eseté a gyakorsága görbe maxmum helye(). 4

43 Áramkmaradás dőtartama ' ' f f g (perc) g x [0;0) [0;0) [0;30) [30;40) [40;50) [50;60) Módusz becslése: tudjuk, hogy a 3. osztályközbe va. da Moˆ X mo, 0 d d M d d f a f d f mo mo f f a f h mo mo mo a oˆ X mo, 0 hmo da d f 3,404 A módusz becsült értéke 3,404, ez az az érték, ahol a gyakorság görbe a maxmumát vesz fel. e) Becsülje meg és értelmezze a medát! Áramkmaradás dőtartama ' ' f f g (perc) g x [0;0) [0;0) [0;30) [30;40) [40;50) [50;60) Meˆ X me,0 N f f N ' 650 fme 30 M eˆ X 0 me, 0 hme 0,74 fme 350 A medá becsült értéke,74. Ez az az érték, amelyél az összes előforduló érték fele ksebb, fele pedg agyobb. f) Adjo becslést a szórásra! Átlagtól való átlagos eltérést kell számoluk. A számta átlag becsült értéke,538 perc volt. Ez ettől az értéktől való átlagos eltérés érdekel mket: S r f r x me f ' me x h me 43

44 S 40 5, , ,95 Az átlagtól való átlagos eltérés, és így az áramkmaradás dőtartamáak szórása 8,95 perc. g) Mekkora a relatív szórás? S V x 8,95,538 0,397 39,7% Értéke 39,7%. Más dőszakba yert, vagy hasoló adatokkal való összehasolításba yerhet értelmet..7 Elmélet kérdések Áramkmaradás dőtartama ' ' f f g (perc) g x [0;0) [0;0) [0;30) [30;40) [40;50) [50;60) Ismertesse a matematka statsztka tárgyát, léyegét, a mtavétel és em mtavétel hba között külöbséget!. Mutassa be a sokaság és az smérv csoportosításáak lehetőséget, mde esetre írjo - példát! 3. Jellemezze a mérés skálák egyes típusat, írjo - példát! 4. Ismertesse a leíró statsztka tárgyát, célját és mutassa be aak eszközredszerét! M a külöbség a dszkrét és folytoos meység smérv között? 5. Foglalja össze az egy meység smérv szert osztályozás léyeges kérdéset! 6. Melyek a meység sorok ábrázolásáak főbb lépése? Rövde jellemezze az egyes lépéseket! 7. Mutassa be a legfotosabb középérték mutatók osztályozásáak szempotjat, jellemezze az alkalmazás előye és hátráya szempotjából a legfotosabb mutatókat! 8. Mutassa be az gadozásmutatók osztályozásáak szempotjat, jellemezze az alkalmazás szempotjából az egyes mutatókat! 44

45 3. Részekre botott sokaság vzsgálata A gyakorlatba sokszor előfordul, hogy olya sokaságot kell vzsgáluk, amelyek egysége olya ksebb-agyobb csoportokra sorolhatóak, melyeke belül az egységek az elemzés smérve szempotjából jellegzetese eltérő módo vselkedek, így például a budapest lakások fajlagos egy égyzetméterre vetített ára s agy külöbségeket mutat emcsak az egyes kerületek között, haem sokszor az egyes kerületeke belül s. Ezekbe az esetekbe a teljes sokaság mellett szükséges a részekre botott sokaság vzsgálata s, potosa azért, mert a teljes sokaságra voatkozó elemzés eredméyek em fedk fel az előzőekbe említett jellegzetes eltéréseket, am sok esetbe komoly formácóveszteséggel járhat együtt 3. Heterogé sokaság: A vzsgált smérv szempotjából léyegese eltérő jellegzetességeket mutató részekre botható sokaságokat az adott smérv szempotjából heterogé sokaságokak evezzük. Így mde olya esetbe, amkor felmerül a vzsgált sokaság heterogetásáak gyaúja, célszerű a sokaságot részekre botva s elemez, mert a sokaság egyes részsokaságara kapott eredméyek, és azok egymással való összehasolítása léyeg formácókat adhat a vzsgált jeleségről. A részekre botott elemzés elvégzéséhez részsokaságokat kell kalakíta, am em mdg egyszerű feladat. Olya csoportképző smérvet kell választa, amely a részsokaságok között meglévő heterogetást meg tudja ragad. Természetese emcsak egy sokaság valamely smérv szert elemzése eseté jeletkezhetek a sokaság heterogetásából fakadó problémák, haem olya esetekbe s, amkor egyszerre több sokaságot vzsgáluk vszoyszámok segítségével. Ilyekor gyakra előfordul az, hogy az együtt vzsgált sokaságok egészéek és egyes részeek egymáshoz vszoyított agysága léyegese eltérő módo alakul. Az lye elemzések céljából azoos módo kell a sokaságo belül a részsokaságokat kalakíta. A vszoyszám két egymással összefüggő statsztka adat háyadosa, amelyek általáos formulája: Vszoyszám (V)= Vszoyítadó adat (A) / Vszoyítás alap (B) A vszoyszámok három fő típusát külöböztetjük meg: megoszlás, teztás és damkus vszoyszámokat. Megoszlás vszoyszám: Olya vszoyszám, amely valamely részadatak az egészhez való vszoyát fejez k. Például yugdíjasok aráya a épessége belül, valamely cég pac részesedése egy adott termék forgalmazásába 3 Ez az formácóveszteség a sokaság meység smérv szert elemzésekor smerhető fel (pl. leíró statsztka feldolgozás sorá), mert lyekor a gyakorság eloszlás grafkus képe redszert több módusszal redelkezk. Eek következtébe egyk középérték sem jellemz jól a sokaságot, am a szórás, és a relatív szórás agy értékebe s meg fog ylvául. 45

46 Iteztás vszoyszám: Két, egymással kapcsolatba lévő, külöböző fajta adat háyadosa, melyek között vaak fajlagos mérőszámok, sűrűség, ellátottság mérőszámok, valamt aráyszámok. Például fajlagos mérőszám az egy termékre jutó ayagfelhaszálás, 00 km-re jutó üzemayag-fogyasztás, egy házorvosra jutó betegek száma, egy főre jutó GDP, egy lakosra jutó vízfogyasztás. Sűrűség, ellátottság mérőszám például a épsűrűség (fő/km ), személygépkocs sűrűség (gépkocs/000 fő). Aráyszám például a születés, halálozás aráyszám (000 (!) főre jutó születések, halálozások száma). Az lye típusú vszoyszámok elemzésével foglalkozk a stadardzálás módszere. Damkus vszoyszám: két összehasolított dőszak vagy dőpot adatáak a háyadosa, ahol a vszoyítadó adat (A) a tárgydőszak adata, a vszoyítás alap (B) pedg a bázs dőszak adata. A megoszlás és damkus vszoyszámokat azoos fajta, azoos mértékegységű adatokból számítjuk, ezért tszta számok. Ez azt jelet, hogy cs mértékegységük, kfejezhetők %-os vagy -es formába. (pl. %-os formába fejezzük k a fogyasztó árdex változását egyk dőszakról a máskra, a halálozás aráyszám változását pedg -es formába) A damkus vszoyszámok elemzésével az dexszámítás foglalkozk. 3. Rész- és főátlagok Abból duluk k, hogy adott egy m számú részre botott sokaság. A teljes sokaságot fősokaságak, a sokaság részet pedg részsokaságokak evezzük. A részsokaságok egymástól való megkülöböztetésére a j dexet haszáljuk, amelyek lehetséges értéke: j=,,, M. A továbbakba azzal foglalkozuk, hogy a részekre botott fősokaság vzsgálatával hogy gazdagíthatjuk elemzésüket, és mlye kapcsolat va a fősokaságra és a részsokaságokra voatkozó elemzés eredméyek között. Y j -vel jelöljük a vzsgált meység smérvek a j-edk részsokaság (j=,,, M) -edk (=,,., N j ) egységéél felvett értékét. A fősokaság agyságát N-el jelöljük, am N összefüggéssel fejezhető k, ahol N j a j-edk részsokaság agysága, vagys elemszáma. M N j j A j-edk részsokaságra voatkozó részátlag: N j N S j j Yj Yj, j,,..., M, ahol S j Y j, és a j-edk részsokaság értékösszegét N N jelet. j j Az egész sokaságra voatkozó főátlag M N j M Y Yj S j N N j j 46

47 Példa 4 Ismeretes, hogy budapest lakótelepeke a lakásárak külöböző téyezők következtébe léyegese eltérek egymástól. Eek llusztrálása céljából egy hrdetés újságból kgyűjtötték mdazokak az 3+ fél szobás lakásokak az árát, amelyek egy adott apo az újságba Budapest III. kerületébe meghrdetésre kerültek. A égy lakótelepről azap eladásra kíált sokaságokat egy-egy részsokaságak tektették. Az adatokat az alább táblázat tartalmazza: Békásmegyer Pók utca Óbuda Kaszásdűlő Lakásárak Mtaszám Értékösszeg Első feladatuk az, hogy határozzuk meg és hasolítsuk össze egymással az egyes részsokaságokba tartozó lakások átlagos kíálat árát, és állítsuk elő azokból az adott apo eladásra kíált 45 lakás átlagos árát. Békásmegyer lakótelep átlagára: Y, 467mFt 5 5 A másk három lakótelep átlagára redre: 373 Pók utca: Y 46, 65mFt Óbuda: Y3 3, 5mFt 36 Kaszásdűlő: Y4 3, 6mFt 0 Látható, hogy a Pók utca lakások átlagos kíálat ára a legmagasabb 46,65 mft-os átlaggal. Az összes lakás átlagára, vagys a főátlag: 4 Forrás: Huyad Vta: Statsztka közgazdászokak, KSH, Budapest, 00 alapjá készült saját példa 47

48 5, ,65 3,5 0 3,6 44 Y 3, 467mFt Ebbe az összefüggésbe az 44 mft a vzsgált lakások áráak összege, azaz a korábbakba S j -vel jelölt értékösszeg. 3. Rész- és fősokaságok varacája és szórása A szórás számítása a d Y Y átlagtól vett eltérésekből dul k. Ha a sokaságot részekre botjuk, akkor a fet d Y Y, j,,..., M,,,..., N eltérés két részre botható: belső és külső eltérésre. A belső eltérés az egyes sokaság egyedekhez tartozó smérvértékekek (Y j -kek) az adott részsokaságra az smérvértékekből számított átlagtól ( Y j ) vett eltérését mér: B Y Y, j,,..., M,,,..., N j j j A külső eltérés az egyes részsokaság átlagokak ( Y j ) a főátlagtól (Y ) vett eltérését számszerűsít: K j Y Y, j,,..., M A teljes eltérés a belső és külső eltérés összege: j d j j j B j j j K, ahol d j a teljes eltérés. A teljes eltérés azt mutatja, hogy bármely Y j smérvérték két ok matt térhet el a főátlagtól: részbe azért, mert az smérvértékek mde részsokaságo belül gadozak az adott részsokaságra jellemző részátlag körül, részbe pedg azért, mert az egyes részátlagok gadozak a főátlag körül. Az első fajta gadozás a csoportképző smérve kívül összes egyéb téyezőek, a másodk fajta gadozás pedg kzárólag a csoportképző smérvek tudható be. Ez pedg aak köszöhető, hogy a csoportképző smérv alkalmazásáak célja, hogy a fősokaságot olya részsokaságokra botsuk, amelyek eleme az adott smérv szempotjából jobba hasolítaak egymáshoz, mt más részsokaság elemehez, így az Y smérv egy-egy részsokaságo belül gadozása csaks más téyezőkek tulajdoítható. Példa A legmagasabb kíálat árú Pók utca lakás ára 59 mlló Ft korább táblázatuk szert. Ez a kíálat ár (általuk em vzsgált okok matt) 59-46,65=,375 mlló Ft-tal magasabb, mt az ugyaebbe a csoportba tartozó lakások átlagos kíálat ára. Ez az 59 mft értékű lakás belső eltérése. A Pók utca lakások átlagos kíálat ára a lakótelep egyed sajátossága matt 46,65-3,467=5,58 mlló Ft-tal magasabb, mt a III. kerület lye típusú lakások átlagos ára. Ez pedg az adott részsokasághoz (Pók utca lakótelep) külső eltérése. Így végül az adott 59 mft értékű lakás,375+5,58=7,533 mlló Ft-tal drágábba került meghrdetésre, mt egy általuk vzsgált átlagos lakótelep lakás. A háromféle eltérés alapjá háromféle szórás, lletve varaca számítható: j 48

49 Teljes szórás, lletve teljes varaca: A teljes szórás az egyes smérvértékekek a T T fősokaság átlagtól vett átlagos eltérése. A teljes varaca a teljes szórás égyzete. A teljes varaca a külső és belső varaca égyzetéek összegekét s felírható. M N j M N ( Yj Y) N j N j j M j M j T dj, lletve T ( Yj Y) d N N N j j A belső eltérések felhaszálásával egy részsokaságra voatkozó részszórás, lletve részvaraca: N j j Bj, lletve j B N j N j N j Ha a belső eltéréseket emcsak egy-egy részsokaságra, haem az egész fősokaságra voatkozóa átlagoljuk, akkor a belső szóráshoz jutuk: B M N j N j A B belső szórás azt mutatja meg, hogy a fősokaság egyes egységehez tartozó Y j smérvértékek átlagosa meyvel térek el saját részsokaság átlaguktól. A belső szórás égyzete a belső varaca ( ). B A B belső varaca a részvaracákak az egyes részsokaságok agyságával súlyozott átlaga: B M j N B N j j j j N j Külső szórás és külső varaca: A külső eltérésekből kdulva a külső szórás azt mutatja meg, hogy a részátlagok átlagosa meyvel térek el a főátlagtól. A K külső varaca a külső szórás égyzete. K M M N j ( Yj Y) N j N j N j K j K A háromféle varaca között összefüggés: T K B Másk gyakra haszált formája: SST=SSK+SSB, ahol SST a teljes eltérés-égyzetösszeg 5, SSB a belső, SSK pedg a külső eltérés-égyzetösszeg. Az Y smérv SST teljes eltérés égyzetösszegéek, változékoyságáak SSK agyságú része a részsokaságok képzésére haszált csoportképző smérvek tulajdoítható, azzal magyarázható. Ezzel szembe az SSB agyságú rész az Y smérv szóródását elődéző más, kemelte em vzsgált téyezők együttes hatásáak tudható be. 5 Az SS jelölés a statsztkába a Sum of Squares = égyzetösszeg elevezés rövdítése. 49

50 A részsokaságok képzésére haszált Y smérv aál haszosabbak tekthető, mél agyobb az SSK/SST vagys σ k /σ háyados. Példa A főátlag és a táblázatba található lakásárak alapjá a teljes szórás számítása (md a 45 lakás áráak vesszük a főátlagtól vett égyzetes eltérését és átlagoljuk): ( 3,467) (8 3,467)... (35 3,467) 430, T 9, 7766mFt T 95,58 Az első részsokaság békásmegyer lakások- σ szórása: (,467) (8,467)... (3,467) 5 (5,467) Redre a tovább lakótelep szórása: 7,34mFt 5,399mFt 3 3,304mFt 4 0,5389mFt A részsokaságok szórása egymással közvetleül eheze hasolíthatóak össze, mvel az egyes részsokaságokba a kíálat árak más-más átlag körül szóródak. A relatív szórások értéke: V 4,7s% V V 3 5,76% 6,6% V4 7,05% Ezeket összehasolítva azt látjuk, hogy a békásmegyer lakások ára a legegyötetűbbek, tt a legksebb a relatív szórás. A belső szórás: 35,08 B 7,44, lletve B 7,44 5, 4mFt 45 Ez azt jelet, hogy a kíálat lakásárak átlagosa mtegy 5,4 mft-tal térek el saját részsokaságuk átlagától, am a teljes szórásál észrevehetőe ksebb. A külső szóráségyzet és szórás: 95,58 7,44 68,4 k k B 68,4 95,58 SSK SST k 8,55 0,73, amely összefüggés úgy terpretálható, hogy a kíálat lakásárak gadozásáak mtegy 7%-a azzal magyarázható, hogy a lakás a égy lakótelep közül melyke található, 9% pedg egyéb, tt külö em vzsgált téyezőkek tulajdoítható, amely alapjá állíthatjuk azt, hogy a égy lakótelep megkülöböztetése haszos a vzsgált kíálat árak gadozásáak magyarázata szempotjából. 50

51 3.3 Ismérvek között kapcsolat Két smérv, X és Y smérv között háromféle természetű kapcsolat lehetséges: - A két smérv függetle egymástól. - A két smérv között sztochasztkus kapcsolat va. Ezt azt jelet, hogy cs egyértelmű függvéykapcsolat a két smérv értéke között, azoba feáll egy tedeca jellegű kapcsolat. - A két smérv függvéyszerű, determsztkus kapcsolatba áll egymással. Ez azt jelet, hogy az egyk smérv bármely értékéhez a másk változó egy adott értéke tartozk. A sztochasztkus kapcsolat léyege, hogy a megfgyelt sokaság egységeek X smérv szert mlyeségét, hovatartozását smerve levoható ugya bzoyos következtetés az egységek Y szert hovatartozásáról, de ez a következtetés em teljese egyértelmű. Az smérvek között kapcsolat elemzésekor a következő három kérdésre keressük a választ:. Va-e kapcsolat a vzsgált smérvek között?. Mlye szoros a kapcsolat? 3. Hogya lehet felhaszál az smérvek között kapcsolat természetéek smeretét arra, hogy egy adott egység bzoyos smérvek szert mlyeségéből következtethessük aak más smérvek szert hovatartozására? Az egydejűleg vzsgált két smérv fajtája (a változók mérés sztje, lásd.5 fejezet) szert a továbbakba a következő eseteket külöböztetjük meg 6 : - Asszocácó(s kapcsolat): az egymással kapcsolatba álló smérvek mőség vagy terület smérvek (mdkét változó omáls mérés sztű). - Vegyes kapcsolat: az egyk vzsgált smérv meység smérv, a másk terület vagy mőség smérv (azaz az egyk változó tervallum- vagy aráyskálá, a másk pedg omáls skálá mérhető). - Korrelácós kapcsolat: mdkét vzsgált smérv meység smérv (mdkét változó tervallum- vagy aráyskálá mérhető). - Ragkorrelácós kapcsolat: mdkét változó sorred skálá mérhető. Korább példákat (lakótelep példa) alapul véve tt ejtük szót a vegyes kapcsolatról. A H varaca- vagy szórásháyados mutató az Y-al jelölt smérv szóráségyzetéek az X smérv által magyarázott háyada. A vegyes kapcsolat szorosságáak mutatója; 0 H. Számítása: SST SSB SSK B K H SST SST A H mutató értékét gyakra százalékká alakítva haszálják. A H =0 eset akkor fordul elő, ha SSK K 0. Ez akkor következhet be, ha az X smérv szert képzett osztályok részátlaga md egyformák. Ez akkor fordul elő, ha X és Y függetleek egymástól. 6 Az asszocácós kapcsolatról majd a hpotézsvzsgálatokál a függetleségvzsgálat kapcsá foguk szól, a korrelácós kapcsolat bemutatásával külö fejezet foglalkozk jegyzetükbe, és e tárgyak em része a ragkorrelácó tárgyalása. 5

52 A H = eset ezzel szembe akkor áll elő, ha K T, azaz B 0. Ez pedg ayt jelet, hogy az X szert képzett csoportoko belül em szóródk Y. Ekkor az X szert hovatartozás mdet elmod Y-ról. A varacaháyados H = értéke a két vzsgált smérv függvéyszerű kapcsolatát jelz. Az óbuda lakótelepeke található lakások árát vzsgáló példákba láttuk, hogy a vzsgált két smérv közül az egyk terület (melyk lakótelepe va a lakás), a másk meység (meybe kerül). Így a két smérv között kapcsolat vegyes kapcsolatkét jellemezhető. k SSK H 0,73, azaz láttuk, hogy a kíálat lakásárak szóródását kb. 7%-ba T SST magyarázza, hogy melyk lakótelepe va a lakás, és a lakásárak szóródásáak maradék 9%- át pedg más, a példába em vzsgált téyezők, smérvek magyarázzák (pl. háyadk emelete va a lakás, mlye a lépcsőház, va-e lft, mlye a tájolása, tömegközlekedés vszoyok, a lakótelep köryékéek frastruktúrája stb.). A H varacaháyados mutatóból származtatott és H-val jelölt szórásháyados mutató két smérv között vegyes kapcsolat szorosságát mér. Értéke 0 és között mozog. Ha H=0, a két smérv függetle egymástól, míg H= a két smérv között függvéyszerű kapcsolatra utal. A H em fejezhető k százalékosa, haem kzárólag a kapcsolat szorosságáak megítélésére haszálható a 0-hoz, lletve -hez való közelségét fgyelembe véve. A példák alapjá H H 0,73 0, 844, amely érték szoros kapcsolatot mutat a lakás ára és a lakótelep elhelyezkedés között. 3.4 Fogalmak Heterogé sokaság Megoszlás vszoyszám Damkus vszoyszám Külső eltérés Belső szórás Külső szórás Teljes szórás Varacaháyados Vszoyszám Iteztás vszoyszám Belső eltérés Teljes eltérés Belső varaca Külső varaca Teljes varaca Szórásháyados 3.5 Gyakorló feladatok 3.5. Feladat Egy vállalatál megvzsgálják a férfak és a ők keresetet: Nem Bruttó kereset (ezer Ft/hó) Férf 0, 83, 65, 90, 30, 0, 30, 90 Nő 70, 65, 90, 00, 0, 30 5

53 Jellemezze a mukavállalók keresetéek homogetását, állapítsa meg, hogy mlye szoros a kapcsolat a mukavállaló eme és a bruttó keresete között! Megoldás: A kereset szert szóródást két részre kell bota, a mukavállaló eme smérvhez kapcsolódó külső szórásra és a más téyezőkhöz (pl. tapasztalat, korább beosztások, skola végzettség stb.) kapcsolható belső szóródásra az SST=SSK+SSB összefüggés alapjá. M N j M M N j ( Y j Y) N j ( Y j Y) j j j ( Y j Y j ) Az ehhez szükséges számítások: A mukavállaló eme A részátlagok: N ff Mukavállalók száma Átlagkereset Szórás (részsokaságok tapasztalat szórása) Férf 9 4 4,9 Nő 3 95,83,30 Összese 3,64 3, Y ff Yff 4, vagys a vzsgált férfak átlagkeresete 4 N 8 ff eft/hó. N ő Y ő Yő 95,83, vagys a vzsgált ők átlagkeresete 95,83 Nő 6 eft/hó. A főátlag: Y M N j M j j Y N j j ,83,64, vagys a vzsgált vállalat esetébe az átlagkereset 4 (emtől függetleül) a mta alapjá,64 eft/hó. A részszórások: ff N N ff ff ( Y ff Y ff ) (0 4) (83 4) 8... (90 4) 53,46 Ez azt jelet, hogy a férfak esetébe az átlagkeresettől való átlagos eltérés 53,46 eft/hó. ő N ő N ő ( Y ő Y ő ) (70 95,83) (65 95,83) 6... (30 95,83) 3,88 Ez azt jelet, hogy a ők esetébe az átlagkeresettől való átlagos eltérés 3,88 eft/hó. A belső varaca a részvaracák alapjá: 53

54 M N j j j 853,46 6 3,88 B 877,5 B 43, 33 N 4 Ez azt jelet, hogy a vzsgált vállalat esetébe az átlagos keresettől való átlagos eltérés (a részátlagoktól való átlagos eltérés) 43,33 eft/hó. M N j ( Y j Y) j 8 (4,64) 6 (95,83,64) K 499,67 K, 35 N 4 Ez azt jelet, hogy a emekét átlagkeresetek átlagosa,35 eft/hó-val térek el a főátlagtól. 977,5 499,67 477,9 49, 77 T K B Ez azt jelet, hogy az egyes mukavállalók keresete átlagosa 49,77 eft/hó-val tér el a főátlagtól. Botsuk fel a teljes eltérés-égyzetösszeget a példa elejé felírt módo: SST=SSK+SSB Az SSK számítása: SSK= 8 (4,64) 6(95,83,64) = 6995,4 SSB pedg a csoportokét eltérés-égyzetösszegek összege, am a szórásokból vsszaszámolható : SSB = 8 53,46 6 3,88 = 863, ,53= 685,3 A kapcsolat szorosságáak jellemzése: 6995,4 H 0, 3380,7 SST = SSK +SSB= 6995, ,3 = 3380,7 H 0, 0,458 A mukavállaló eme %-ba magyarázza a fzetésekbe megfgyelhető szóródást. A két smérv között gyege közepes kapcsolat va, erre utal a H mutató 0,458-ös értéke. Ez egyúttal azt s jelz számukra, hogy a fzetésekbe meglévő szóródás vzsgálatához a mukavállaló eme em volt gazá jó választás, hsze azt csak ksmértékbe magyarázza. Érdemes lee más csoportképző smérvvel (pl. skola végzettséggel) próbálkoz Feladat Három hallgató csoportot vzsgáluk. Az első csoportba azok a hallgatók kerültek, akk a szülekkel lakak, a másk csoportba pedg azok, akk kollégumba, míg a harmadk csoportba azok kerültek, akk albérletbe lakak. Az alább táblázat mutatja az egyes csoportokba megkérdezett hallgatók het költéset ezer Ft-ba. T 54

55 Hallgató Het költség (eft) lakhelye Szülőkél 3, 8, 0, 0, 8, 30, 3, 40 Kollégumba 5, 30, 30, 3, 33, 35, 38, 40, 40, 44, 50 Albérletbe 40, 48, 50, 50, 5 Számítsuk k az átlagos het kadást a külöböző lakáshelyzetű hallgató csoportokba! Vojuk le következtetéseket! Vzsgáljuk meg a szóródást külöböző módoko! Számítsuk k, hogy a szóródás mlye mértékbe magyarázható a lakáshelyzettel! Mlye szoros a kapcsolat a lakhely és a kadások között? Megoldás: Átlagos het kadások és szórások kszámítása: Y Y sz k N N N sz sz k N k Y Y k Hallgató Het költségek lakhelye Átlaga Szórása Szülőkél 5 3,5 Kollégumba 36 3, Albérletbe 48 4,5 Összese sz N a Y a Ya 48 Na 5 A szülőkél lakók átlagos het kadása 5 eft, a kollégstáké 36 eft, és az albérletbe lakóké 48 eft, így ez utóbb csoport esetébe a legmagasabb a het kadás. Főátlag: Y M N j M j j Y N j j ,83 4 A megkérdezett hallgatók átlagos het költsége 34,83 eft. Részszórások: sz k N N N sz sz k N k ( Y ( Y k sz Y Y k sz ) ) (3 5) (5 36) (8 5) 8 (30 36)... (40 5)... (50 36) 8, 6,9 55

56 a N k N k ( Y k Y k ) (40 48) (48 48) 5... (5 48) 4, A szülőkél lakók átlagos költése átlagosa 8, eft-tal tér el az átlagtól, az átlagtól való átlagos eltérés 6,9 eft a kollégstákál és 4, eft az albérletbe lakókál. A belső varaca: m N j j j 88, 6,9 5 4, B 47,9 N 4 B 6,9 A belső szórás értéke azt jelet, hogy a hallgatók het költése átlagosa 6,9 eft-tal tér el a saját részsokaságuk (lakhely szert számított) átlagától. M ( N j Yj Y) 8 (5 34,83) (36 34,83) 5 (48 34,83) j K 68,97 N 4 K 8,3 A külső szórás értéke szert az egyes részsokságok költéséek átlaga 8,3 eft-tal térek el a het költések főátlagától. 47,9 68,97 6,88 T T 0,8 Az egyes hallgatók het költése átlagosa 0,8 eft-tal tér el a vzsgálatba bevot hallgatók átlagos het költségétől. A teljes varaca és a külső varaca felhaszálásával a varacaháyados mutató: 68,97 H 0,59 59%, a het költések gadozását 59%-ba magyarázza a hallgató 6,88 lakhelye. A maradék 4%-y gadozást más, lakhelye kívül, most em vzsgált téyezők okozzák. H H 0,59 0,768, a két smérv (hallgató lakhelye és a het költés) között közepesél erősebb kapcsolat áll fe. 3.6 Elmélet kérdések. A belső, külső és teljes eltérése keresztül mutassa be a belső, külső és teljes varaca között összefüggést! Ismertesse a közöttük lévő kapcsolat gyakorlat jeletőségét!. Ismertesse az smérvek között kapcsolatok típusat az smérvek mérés sztjet s alapul véve! 3. Mutassa be a vegyes kapcsolat mérésére alkalmazott mutatókat! 56

57 4. Mtavétel és becslés 4. Mtavétel A bevezetőbe már tárgyaltuk, hogy a sokaságra voatkozó adatgyűjtések lehetek teljes körűek vagy részlegesek. A teljes körű felmérések a sokaság mde egységére kterjedek, míg a részleges adatgyűjtés eseté a sokaság egy alkalmasa kválasztott részét vzsgáljuk. A sokaság egy részéek kválasztását mtavételek, a sokaság így kválasztott részét pedg mtáak evezzük. Az általuk vzsgált társadalm-gazdaság jeleségek vzsgálatakor a teljes körű adatfelvétel rtka, mert dőgéyes, drága, és a legtöbb esetbe lehetetle s, cs lehetőség a sokaság teljes körű megsmerésére. Mtavételes techkával készül ugyas a legtöbb pac- és közvéleméykutatás, a demográfa vagy szocológa kutatások, sok esetbe mtavételes eljárásokra támaszkodak a Közpot Statsztka Hvatal kmutatása s, amkor a termelés, a fogyasztás, a kereskedelm forgalom, vagy az árdexek alakulását vzsgálja adott redszerességgel. Azt s hagsúlyoztuk a bevezetőbe, hogy mket em a mta kokrét jellemzése érdekel, a mta eszköz, hogy segítségével következtessük a sokaságra, és éppe ezért az s érdekes, hogy a mta meyre jó eszköz, meyre megbízható az az alapjá levot következtetés. A mtavételes eljárás első kulcsfotosságú mozzaata a sokaság helyes defálása, azaz aak rögzítése, hogy mely sokaság megfgyelésére ráyul a mtavétel. Korábba említést tettük a mtavétellel kapcsolatba említett hbák két agy csoportjára s. Újból hagsúlyozák, hogy a em mtavétel hba az ember fgyelmetleség, hbás felmérés, adatrögzítés, lekérdezés, kódolás, feldolgozás sorá keletkezk. A techka és az alkalmazott módszerek fejlődésével már sokféle módo lehet védekez a em mtavétel hbák elle, de ez ylvá valamvel költségesebbé tehet a felmérést. A mtavétel hba az előzővel elletétbe abból származk, hogy em a teljes sokaságot vzsgáljuk, haem aak csak egy részét, így az eredméyek függek attól, hogy éppe mlye mtát veszük. 4.. Mtavétel módok Az alapsokaságból többféleképpe választható k egy elemű mta. A kválasztás két agy csoportja: véletle és em véletle mtavétel módok. A véletle mtavétel olya kválasztás eljárás, melyek sorá smert vagy meghatározható a sokaság elemeek mtába kerülés esélye. A mtavétel hba számítása csak véletle mta esetébe lehetséges. A véletle mta bztosítja a reprezetatvtást. A sokaságból kvett mta egyk legfotosabb elvárt tulajdosága a reprezetatvtás. A reprezetatvtás azt jelet, hogy a mta összetétele csak a véletle hatások matt tér el a sokaságétól. A mta vzsgált smérvek szert összetétele követ a sokaságét. Ha pl. egy vzsgált sokaságba 50-50% a férfak és a ők aráya, akkor a véletle kválasztás bztosítja, hogy agyjából a mtába s fele-fele lesz a férfak-ők aráya, természetese a véletle hatása matt ettől a megoszlástól a mtabel megoszlás ksmértékbe eltérhet. 57

58 A gyakrabba alkalmazott mtavétel módok a vsszatevéses egyszerű véletle mta, a vsszatevés élkül egyszerű véletle mta, a rétegzett mta, a csoportos és a többlépcsős mta. A vsszatevéses egyszerű véletle mtavétel eseté a sokaságból egyelő valószíűséggel, a vsszatevéses techka matt egymástól függetleül veszük mtát. A gyakorlatba rtká fordul elő, kább elmélet jeletősége va, a mtavétel tulajdoságok eze keresztül mutathatóak be a legjobba. A vsszatevés élkül egyszerű véletle mtavétel sorá a sokaságból egyelő valószíűséggel veszük mtát, de egy sokaság elem csak egyszer kerülhet a mtába, így a mtaelemek egymástól em függetleek. A gyakorlatba gyakra előfordul, a sokaság egy teljes körű lstájából véletle geerátorral adott agyságú mtát geerálak. Az egyszerű véletle mták a véletleség következtébe reprezetatívak. Ilye mták esetébe a következtetés potossága két dologtól függ: mtaelemszám: mél agyobb a mta, aál megbízhatóbb a következtetés, mvel aál ksebb a véletle szerepe; eredet sokaság heterogeetása: mél heterogéebb az alapsokaság, aál agyobb a véletle szerepe, hogy mlye lesz az aktuáls mták, így ez a következtetés megbízhatóságát csökket. Egyszerű véletle mták esetébe a következtetés potossága csak a mta elemszámak övelésével érhető el. A rétegzett mta abba segít, hogy rögzített mtaelemszám mellett potosabb eredméyeket kapjuk. A rétegzett mtavétel esetébe a sokaságot egy csoportképző smérv szert átfedésmetes, az egész sokaságot lefedő rétegekre botjuk, majd mde rétegből egyszerű véletle mtát veszük. Ebbe az esetbe a következtetések megbízhatósága a rétegek heterogetásától függ, vagys olya rétegképző smérvet (lásd Részekre botott sokaság vzsgálata fejezet) érdemes választa, amely homogezálja a rétegeket, vagys amely mél erősebb sztochasztkus kapcsolatba áll a vzsgált smérvvel. Tehát alkalmazása elsősorba akkor célszerű, ha a sokaság heterogé és va előzetes formácók arról, hogy a sokaságot hogya lehet a vzsgált smérv szempotjából homogé, de legalábbs kevésbé heterogé csoportokba sorol. Az egyszerű véletle és rétegzett mták esetébe feltétel, hogy legye egy teljes lsta a vzsgált egységekről, és rétegzett mta eseté még azt s tud kell, hogy melyk egyed melyk rétegbe tartozk. Ameybe egy sokaságról em áll redelkezésre lsta vagy aak beszerzése költséges, összeállítása hosszadalmas lee, haszálható a csoportos vagy többlépcsős mtavétel. A csoportos és többlépcsős mtavétel alkalmazásakor olya ylvátartásból törték a kválasztás, amely a sokaság egységet em elkülöítve, haem természetes vagy mesterséges csoportokba tartalmazza. A sokaságot a csoportképző smérv szert átfedésmetes, a sokaságot lefedő csoportokra botjuk, majd a csoportok közül választuk egyszerű véletle mtát, majd a mtába került csoportok mde egysége bekerül a mtába. A többlépcsős eset eek általáosítása, két, három vagy több csoportosítás s végezhető. A csoportos mta aál megbízhatóbb, mél heterogéebbek a csoportok, hsze ha egy csoport homogé, akkor a csoport eleme em fogják bemutat a sokaság jellegzetességet. Az a jó, ha mde csoport ömagába s mél jobba tükröz a sokaság összetételét. 58

59 E jegyzetbe em részletezzük a emvéletle mtavétel eljárásokat, bár a gyakorlatba gyakra előfordulak egyszerűségük, olcsóságuk matt. Legfőbb hátráyuk, hogy alkalmazásukkor em számszerűsíthető a mtavétel hba agysága. 4. Paraméterek becslése A mtavétel utá a céluk a sokaság jellemzése a mta segítségével (lásd. ábra). Leggyakrabba a sokaság valamely jellemzőjére, paraméterére va szükségük. A sokaság egy paraméteréek mtából való közelítését becslések evezzük. A korább taulmáyok sorá azt s megértettük, hogy mde majdem mde elmélet eloszlásak va(ak) paramétere(), melyeket általába em smerük, azokat a -re voatkozó statsztka mtából kell közelítőleg meghatározuk, becsülük, mert csak ezek smeretébe tuduk a vzsgált jeleséggel kapcsolatos valószíűség kérdésekre válaszol. A becslés eljárásokat két agy kategórába soroljuk. Megkülöböztetük potbecslést és tervallumbecslést. A potbecslés a paramétert egy értékkel becsül. Az tervallumbecslés előre meghatározott megbízhatósággal egy tervallumot ad a keresett sokaság paraméterre. A becsül kívát paramétert általáosságba ϴ-val (ejtsd: théta) jelöljük. A leggyakrabba becsült sokaság paraméterek a várható érték, a szórás és az aráy. Ezek a sokaság számuka smeretle kostas értéke, azaz értékük em függ a véletletől. A becslés a sokaságból kvett véletle mta alapjá valósul meg, a mtaelemek függvéye, ezt többféle formulával s előállíthatjuk és becslőfüggvéyek evezzük. Véletle mta eseté az éppe aktuáls mta függ a véletletől, ezért mde mtaelem, és a függvéyükbe számított becslés s valószíűség változó. A mtából származó potbecslést általába ˆ -val jelöljük. Hagsúlyozzuk, hogy a becsül kívát sokaság paraméter kostas szám, erre a kvett mtából sokféle becslést adhatuk. A várható értéket becsülhetjük a mtaátlaggal, a medáal, a módusszal, a legksebb és legagyobb érték átlagával, esetleg egy yesett átlaggal. Éppe ezért a becslések jóságát valamlye krtérumok szert értékel kell, ezeket a becslés krtérumokat tárgyaljuk a következő alfejezetbe. Mta- Mta- Mta-3 x x x3 mtáról mtára változk maga s valósz. változó adott elmélet eloszlással, szórással stb. jellemezhető 7. ábra: A becslés elméletet 59

60 Nem arról va tehát szó, hogy a mtából kszámoljuk az smeretle paramétert. A mtából számolt mutatók értéke függek a véletletől, mtáról mtára változak, így maguk s valószíűség változóak tekthetők. A mtából számolt mutatók eloszlását mtavétel eloszlásak evezzük. Aak megítélése, hogy a mtából számolt mutató (amt mta statsztkáak vagy rövde statsztkáak s evezek) mkor tekthető az smeretle elmélet paraméter jó becsléséek, többféle szempotból törtéhet. 4.3 A becslés tulajdosága 7 Említettük, hogy az smeretle sokaság paramétereket általába több statsztkával s becsülhetjük. Így pl. a várható értéket ormáls eloszlású alapsokaság esetébe a mtaátlaggal és a medáal, a szórást a mta szórásával, de a terjedelem segítségével s becsülhetjük stb. Természetese felmerül a kérdés, hogy ezek közül melyk becslést kell választauk. Azért, hogy lye esetekbe a legmegfelelőbb becslést választhassuk, krtérumokat kell felállítauk arra voatkozólag, hogy mkor fogadjuk el egy becslést jóak, lletve mkor tartsuk jobbak egy becslést a máskál. A statsztka becslés Fsherféle krtérumat az alábbakba foglaljuk össze Torzítatla becslés A legfotosabb tulajdoság, amt egy jóak mősített becsléstől megkíváuk, hogy a becslés a szóba forgó paraméterérték körül gadozzék. Potosabba azt kívájuk meg, hogy a becslés (az llető statsztka) várható értéke éppe a megfelelő paraméterérték legye. Ha egy becslésre ez a követelméy teljesül, akkor torzítatla becslésről beszélük. E ( ) ˆ A torzítatlaság krtéruma azt jelet, hogy bár a mta függ a véletletől, ezért a külöböző mtából származó becslések eltérhetek a becsül kívát elmélet paramétertől, az eltérések középpotja az elmélet paraméter legye, e legye semmlye szsztematkus félrehúzás, torzítást. A torzítatlaság em azt jelet, hogy egy adott mtából kapott becslés egyelő az smeretle paraméterrel, sőt arra sem ad feleletet, hogy a mtából kapott becslés értéke közel, vagy távol esk-e a valód paramétertől. A torzítatlaság esetébe csupá abba lehetük bztosak, hogy cs semmféle szsztematkus, egyráyú eltérés a becslés és a becsült paraméter között. Így pl. torzítatla a becslés, ha a mtaátlagok várható értéke megegyezk az alapsokaság várható értékével: Ex E( ), vagy a korrgált tapasztalat szóráségyzet várható értéke az * elmélet varacával egyelő: E( s ) D ( ). Ez azoba em gaz a tapasztalat szóráségyzetre. A tapasztalat szóráségyzet várható értéke (az elmélet varacát az egyszerűség kedvéért -el jelölve): E ( s ). Az emprkus (tapasztalat) szóráségyzet tehát az elmélet varaca torzított becslése. Látható, hogy a torzítás mértéke függ a mtaszámtól, s a 7 Köves J.: Kvattatív módszerek, Oktatás segédayag, BME MBA Mérökökek program, Budapest, A 4.3 részbe található ábrák a STATISTICA for Wdows programmal készültek 60

61 mtaszám övekedésével csökke. Az lye tulajdoságú becsléseket aszmptotkusa torzítatla becslések evezzük. Példa Vzsgáljuk meg =3 elemű statsztka mták alapjá a kockadobás tapasztalat és korrgált tapasztalat szórását. (A valószíűségszámítás alapja részbe meghatároztuk a kockadobás elmélet szórását, s azt találtuk, hogy D(),7.) A kísérletet 50-szer megsmételve a számított tapasztalat, ll. korrgált tapasztalat szórásokat az alább ábrá (8. ábra) láthatjuk. 3.0 =3elemûmtákszórása.5.0,73.5, ábra: Tapasztalat szórások összehasolítása T_SZ3 K_TSZ3 Az ábrá folytoos voal mutatja a tapasztalat, ll. szaggatott voal a korrgált tapasztalat szórásokat a mtaszám függvéyébe. Vízsztes folytoos voallal jelöltük a kétfajta szórás (50-50 elem) átlagát. A korrgált tapasztalat szórások átlaga,73, a tapasztalat szórásoké,4. Jól látható, hogy a korrgált tapasztalat szórások az elmélet (,7) szórás körül gadozak (átlaguk közel esk az elmélet értékhez), míg a tapasztalat szórások átlaga,4, jóval agyobb az eltérés az elmélet értéktől. Ameybe a becslésük torzított, a torzítás mértékét a becslőfüggvéy várható értéke és az alapsokaság jellemző külöbségekét defáljuk: torzítás E( ˆ ) 4.3. Hatásos becslés A hatásosságot agyo fotos becslés krtérumak tektjük. A torzítatlaság csak azt bztosítja, hogy a becslések a becsül kívát paraméter körül gadozzaak, de az gadozás mértékéről em mod semmt. Mél ksebb az gadozás mértéke, aál agyobb megbízhatósággal tuduk majd egy mtára támaszkod. A becslések gadozását a becslések szórásával (stadard hba) mérjük, egy becslés aál hatásosabb, mél ksebb a szórása. 6

62 Két becslés összehasolításakor a hatásosság krtéruma alapjá dötjük el, hogy a kettő közül melyk a jobb. Két becslés közül a kevésbé gadozót evezzük hatásosabbak. Az gadozás mértéke a szórás, ezért a becslések gadozását s a szórásukkal jellemezzük. Tehát két becslés közül a ksebb szórású becslést tektjük hatásosabbak, jobbak. Ha ˆ hatásosabb becslés, mt ˆ, akkor D ( ˆ ) ( ˆ D ) Gyakra előfordul, hogy a torzítatla becslések között va olya, amelykek a szórása az összes több becslés szórásáál ksebb (adott mellett). Ekkor ezt a mmáls szórású, torzítatla becslést hatásosak evezzük, és a több becslés hatásfokát ehhez mérjük. Példa A szokott módo, tapasztalat adatokból hasolítsuk össze (=5 elemű mták alapjá) a kockadobás átlagát és medáját. A kísérletet 50-szer megsmételve, a mták átlagat és medájat a 9. ábra mutatja =5 el emû m t ák át l aga és med áj a ábra: A kockadobás átlaga és medája ATL MED Az ábrá szaggatott voallal összekötve a égyzetek a medáokat, folytoos voallal összekötve körök jelölk az egyes mták átlagat. Vízsztese behúzott folytoos voal a várható értéket mutatja (E() = 3,5). Megfgyelhetjük, hogy a medá s és az átlag s az elmélet érték körül gadozk (torzítatla becslések), ugyaakkor az átlagok eltérése, gadozása ksebb, mt a medáoké. Kszámolva a két adatsor korrgált tapasztalat * * szórásat, az eredméyek az alábbak: s 0, 794 ; s, 30. Az átlag szórása valóba átlag ksebb, mt a medáé, az adatok alapjá kb. 40%-kal. Az átlag tehát hatásosabb becslés, mt a medá Kozsztes becslés Eddg rögzített mtaelemszám mellett vzsgáltuk a becslések potosságát. Kozszteca alatt azt értjük, hogy agyobb mtából egyre potosabb becslést kapuk, így a torzítás mértéke és a becslés varacája 0-hoz tart. Kozsztesek (összetartóak) evezzük a becslést akkor, ha gadozása a becsült paraméter körül a mta elemszámáak övelésével egyre csökke. 6 medá

63 A korábbakba láttuk, hogy a számta átlag torzítatla becslése a várható értékek, s szórása. Nylvávaló, hogy eseté 0, vagys a számta átlag kozsztes x x becslése a várható értékek. Egy paraméter elemű mtákból számított ˆ becslése egy valószíűség változó sorozatot alkotak (,,... ). A valószíűségszámítás részbe megsmertük egy valószíűség változó sorozat majdem bztos ( valószíűségű) és sztochasztkus kovergecájáak fogalmát. Ezek felhaszálásával azt modhatjuk, hogy ˆ a paraméter erőse kozsztes becslése, ha ˆ majdem bztosa ( valószíűséggel) a paraméterhez tart, lletve ˆ a paraméter gyegé kozsztes becslése, ha kovergál a paraméterhez. ˆ sztochasztkusa Példa Az előző példához hasolóa kevésbé matematka módo, tapasztalat adatokból vzsgáljuk meg a kockadobás eseté a két emprkus szórás vselkedését a mtaszám övekedéséek függvéyébe. A 0. ábra mutatja a kapott eredméyeket. Az ábrá folytoos vízsztes voal jelz az elmélet értéket (D(),7). Az ábrából egyértelműe látszk, hogy a mtaszám övekedésével md a korrgált tapasztalat, md a tapasztalat szórás az elmélet érték körül gadozk (torzítatla, ll. aszmptotkusa torzítatla becslés), s az gadozás mértéke a mtaszám övekedésével egyre ksebb (kozsztes a becslés). Kockadobásszórása T_SZ_ K_T_SZ 0. ábra: A kockadobás szórása a mtaszám függvéyébe (=00) Megfgyelhetjük, hogy kb elemű mták eseté a külöbség a két szórás között már gyakorlatlag elhayagolható. Az. ábra csak az első 50 adatot ábrázolva mutatja a két szórás között külöbség alakulását. 63

64 Kockadobásszórása Elégséges becslés. ábra: A kockadobás szórása a mtaszám függvéyébe (=50) Egy becslés elégséges, ha az léyegébe mde formácót tartalmaz a paraméterre voatkozóa. Ez más szóval ayt jelet, cs más olya becslés, amelyk a paraméterről több formácót szolgáltata, mt az elégségesek mősülő becslés. 4.4 A potbecslés módszere T_SZ_ K_T_SZ A jegyzet bevezetésébe felvázoltuk a statsztka következtetés logka meetét, s aak első lépését, a mtavétel elvet és módszeret s áttektettük. A másodk lépéssel, a mtából származó adatok feldolgozásával (tömörítésével, redezésével, ábrázolásával stb.) a leíró statsztka foglalkozk, melyek eszközet és módszeret szté részletese megsmertük a. fejezetbe. Már akkor előrevetítettük, hogy a mtából számított mutatókat (átlag, szórás, stb.) a sokaság jellemzőkre való következtetésre, az smeretle paraméterek becslésére (s) haszáljuk. Ebbe az esetbe tehát a mtából meghatározuk egy számértéket, s ezt a számot tektjük az smeretle paraméter közelítő értékéek. Ezt az eljárást evezzük az előzőek értelmébe potbecslések. Az eddgek sorá s haszáltuk külöféle becslőfüggvéyeket potbecslés céljára, de ezeket csak ösztööse választottuk. Így természetese adódott, hogy pl. a várható értéket a mtából számított átlaggal vagy más középértékkel becsüljük. Ez az ú. aalóga elve, am azt jelet, hogy a mtából a becsüledő jellemzővel megegyező tartalmú mutatót számítuk k, és eek segítségével becsüljük a megfelelő sokaság jellemzőt. Létezek azoba olya általáos elvek, módszerek, amelyek segítségével olya esetekbe s tuduk jó tulajdoságú becslőfüggvéyeket készíte, amkor a megérzés vagy az aalóga már em segít. A legegyszerűbb grafkus becslést kvéve em céluk ezek részletes smertetése, csak rövde felsoroljuk, lletve smertetjük léyegüket 9,0. 9 Rema J. Tóth J.: Valószíűségszámítás és matematka statsztka, Taköyvkadó, Budapest, Huyad L. Mudruczó Gy. Vta L.: Statsztka, Aula Kadó, Budapest,

65 Maxmum-lkelhood módszer (a legagyobb valószíűség elve): az eljárás léyege az ú. lkelhood függvéy felállítása, amely em más, mt a mtaelemek együttes sűrűségfüggvéye, s az smeretle paraméter becslésére azt a statsztkát haszáljuk, melyre ez a függvéy maxmáls értéket vesz fel. Ez az egyk legjobb és leggyakrabba alkalmazott eljárás. A módszer alkalmazásához smerük kell az eredet sokaság eloszlást. Az smeretle paraméter becsléséek azt a függvéyt tektjük, amely mellett egy adott mta bekövetkezéséek valószíűsége maxmáls. Legksebb égyzetek módszere: em pusztá a statsztka becslésre szolgáló eljárás, haem alkalmazható más becslés feladatok megoldására s. A módszer léyege, hogy egy elmélet modellek (ez lehet egy eloszlás vagy sűrűségfüggvéy, de lehet egy egyszerű kostas függvéy s) a paraméteret határozza meg úgy, hogy a téyleges és a becsült paraméterekkel llesztett modellek égyzetes eltérése, azaz az eltérések égyzetösszege mmáls legye. Ezt az elvet haszáljuk majd a regresszószámítás sorá s. Mometumok módszere abba áll, hogy ha k számú paramétert akaruk becsül, akkor az eloszlás első k számú elmélet mometumát egyelővé tesszük a mtából számított tapasztalat mometumokkal. Ily módo az smeretle paraméterekre egyeletredszert yerük, amely kedvező esetbe megoldható. Grafkus paraméterbecslés: az előző matematka eljárásokhoz képest, ez kább a gyakorlat számára köyebbe kezelhető eljárás. Bár potossága természetese a grafkus ábrázolás adta lehetőségektől függ, de egyszerűsége matt sokszor jól haszálható. Léyegük, hogy valamlye módo (többyre logartmzálással) learzáljuk az eloszlásfüggvéyt, s az adatokat grafkusa ábrázolva az egyees meredekségéből és/vagy tegelymetszetéből következtetük az eloszlás smeretle paraméteré(e)re. 4.5 Itervallumbecslés A becslésről szóló eddg fejtegetések sorá az eloszlás valamely smeretle paraméterét egyetle meységgel, a mtaelemekből számított statsztka umerkus értékével, tehát egyetle számadattal becsültük, azaz potbecslést alkalmaztuk. A potbecslés csak véletleül egyezk meg a sokaság paraméterrel, általába aak köryezetébe helyezkedk el. Hogy mlye sugarú köryezetébe, az alapvetőe a mtavétel hbától függ. Az elemzés áryaltabbá tehető azzal, hogy a potbecslést tervallumbecsléssel egészítjük k, és a mtavétel hbát s fgyelembe véve adott (agy) megbízhatóságú tervallumbecslést aduk a becsül kívát sokaság paraméterre, mert ez mutatja meg, meyre megbízható a mtából számolt formácó. Az tervallumbecslés eredméyekét előálló ú. kofdeca-tervallummal (amely tervallum a becsül kívát elmélet paramétert előre megadott agy valószíűséggel tartalmazza) kapcsolatos legfotosabb kérdés, hogy az mlye széles legye, hogy lefedje a becsül kívát sokaság paramétert. A sokaságból kvett mta függ a véletletől, vagys a mtából számolt statsztka s valószíűség változó, aktuáls értéke általába eltér a becsült paramétertől. Ha sokszor (sok -es mtából) végezzük a becslést, akkor a mtastatsztka értéke torzítatla becslés eseté az elmélet érték körül szóródak. A szóródás mértéke természetese függ a mta agyságától. Olya tervallumot, am 00%-os bztosággal lefed a becsül kívát paramétert, em tuduk megad, de agy megbízhatóságra törekszük. A mtastatsztka eloszlásáak 65

66 smeretébe (ezeket eveztük mtavétel eloszlásokak) sokszor meg tuduk ad egy olya tervallumot, amely az smeretle paramétert agy valószíűséggel tartalmazza. A leggyakrabba 95%-os megbízhatóságú kofdeca-tervallum haszálata terjedt el. Az lye tervallumot az adott paraméterre voatkozó 95%-os kofdeca-tervallumak (megbízhatóság tervallumak) evezzük. A 95%-os megbízhatóság jeletése az, hogy 00 hasoló mtavétel eseté 95-ször a becsül kívát alapsokaság jellemző valóba a kofdeca-tervallumba található. A továbbakba a külöböző paraméterekre voatkozó tervallumbecsléssel foglalkozuk. A kofdeca-tervallum számításához smerük kell, hogy hogya vselkedk a sokaság paramétert becslő függvéyük. Nemcsak azt kell tuduk, hogy m a becslőfüggvéy átlaga és szórása, haem azt s, hogy a becslőfüggvéy, mt valószíűség változó mlye eloszlást követ. Ha tehát pl. a sokaság várható értékét kívájuk becsül, akkor aak becslésére felhaszált számta átlag értéke mtáról mtára változk, azaz valószíűség változó. Az tervallumbecsléshez tuduk kell, hogy a számta átlag mlye várható értékkel és szórással, mlye eloszlást követ. Az tervallumbecslés léyege, hogy smerjük potbecslésük valószíűség tulajdoságat, és ezek segítségével egy adott megbízhatóság tervallumot aduk meg a sokaság paraméterre. Rema J. Tóth J.: Valószíűségszámítás és matematka statsztka, Taköyvkadó, Budapest,

67 4.5. Kofdeca-tervallum a ormáls eloszlás várható értékére Tegyük fel, hogy a valószíűség változó N(, 0 ) eloszlású, ahol 0 szórás smert. A sokaság paramétert statsztka mtából a számta átlaggal becsüljük. Tudjuk, hogy az átlag eloszlása (mtavétel eloszlás) szté ormáls eloszlású E (x) várható értékkel, és 0 D( ) szórással. A ormáls eloszlás smert tulajdosága az ú -szabály alapjá, hogy az átlag értéke 95,44% valószíűséggel a várható érték szórás tartomáyba, vagys a , tervallumba esk: P x 0, Ha smerék tehát a várható értéket, és a számegyeese megrajzolák a fet tervallumot, akkor az elemű mták számta közepét kszámolva 00 esetből kb. 95 mtaközép ebbe az tervallumba esk. Sajos azoba értékét em smerjük (éppe ezt szereték becsül), a fet tervallumot em tudjuk megrajzol. Redezzük át az 0 0 összefüggést a következő formára: P x x 0, Eze összefüggés valószíűségelmélet értelme a következő. Az smeretle paraméter em valószíűség változó, haem egy álladó, a számegyees egy adott potja. Valószíűség 0 0 változó vszot az x, x tervallum két végpotja. Azaz aak a valószíűsége, hogy ez a véletle helyzetű tervallum tartalmazza (lefed) a potot, közelítőleg 95%. (. ábra). ábra: Kofdeca-tervallumok a várható értékre Rema J. Tóth J.: Valószíűségszámítás és matematka statsztka, Taköyvkadó, Budapest,

68 0 0 Az x, x tervallumot a ormáls eloszlás várható értékére voatkozó 95%- os (potosabba 95,44%-os) kofdeca-tervallumak evezzük. Természetese em csak 95%-os tervallumot lehet szerkeszte. Ha a sokaság elmélet szórása smert ( 0 ), akkor az átlag mtavétel eloszlása lapjá tetszőleges kcsy >0 számhoz meghatározható olya z / 0 0 meység, hogy a P x z / x z /. 0 0 Normáls eloszlás eseté tehát az x z /, x z / tervallum (-) sztű kofdeca tervallum a várható értékre. A kofdeca- tervallum sugarát adott megbízhatóság szthez tartozó maxmáls hbáak evezzük. Adott eloszlás eseté mél agyobb a megbízhatóság szt (-), aál szélesebb tervallumot kapuk. Nagy bztosággal csak vszoylag hosszabb tervallumról állíthatjuk, hogy valóba tartalmazza az smeretle paramétert. Mt látható az tervallum hossza függ még a mta agyságától és az alapsokaság ( 0 ) szórástól. Az eddgekbe csak kétoldal tervallumról beszéltük, mvel a gyakorlatba ez az elterjedtebb. Ha csak alsó vagy csak felső határokat kíváuk becsül, akkor a követedő eljárás az eddgekhez hasoló lesz. A részletek mellőzésével belátható, hogy felső korlát 0 eseté P x z kapható, ahol z a stadard ormáls eloszlás táblázatból kereshető k 3. Azaz aak a valószíűsége, hogy az smeretle sokaság paraméter az x z 0 0 érték alá esk, -. Hasoló módo az alsó korlátra a P x z összefüggést kapuk. Mutá a mtaátlag függ a véletletől, valószíűség változó, így a kofdeca-tervallum s valószíűség változó, vagys a kofdeca-tervallumok s mtáról mtára változak. A mtavétel végrehajtása utá a kofdeca-tervallum vagy tartalmazza a sokaság paramétert vagy em. Ezt em tudjuk, csak azt, hogy ameybe a mtavételt újra és újra megsmételék, és elkészíteék a kofdeca-tervallumokat, az esetek -α %-ába a sokaság jellemző a kofdeca tervallumo belül lee. A gyakorlatba általába csak egy mtát veszük, és az alapsokaság jellemző em smert, éppe ezért becsüljük a mtából. Abba reméykedük, hogy a mta alapjá szerkesztett kofdeca-tervallum tartalmazza a sokaság paramétert, de mvel a véletle szerepet játszk így cs 00%-os megbízhatóság. 95%-os megbízhatóság szt mellett 5% az esélye, hogy ez egy olya szélsőséges mta, hogy még a kofdeca-tervallummal sem skerült lefed a sokaság paramétert. 3 Huyad L. Mudruczó Gy. Vta L.: Statsztka, Aula Kadó, Budapest,

69 Példa Egy gép 000 grammos kávékvoatot tölt. A töltősúly elleőrzésére 9 elemű véletle mtát vettek a termelésből, és az alább ettó töltés tömegeket mérték grammba: 990, 004, 996, 000, 999, 005, 997, 00, 000 A gép által töltött tömeg ormáls eloszlású valószíűség változó 4,5g szórással. Határozzuk meg 95%-os megbízhatósággal a termékek várható értékéek kofdeca tervallumát! = x 999,g 9 0 =4,5g =0,95 =0,05 kétoldal becslés: /=0,05 z / =,96 behelyettesítve a fet összefüggésbe: 4,5 4,5 999,,96 999,,96, ,7 < < 00,05 Ez azt jelet, hogy 95%-os megbízhatóság szte a gép által töltött tömeg 996,7 gramm és 00,05 gramm között va. Tegyük fel, hogy a töltés techológát úgy kell beállíta, hogy a töltősúly hosszabb távo e haladja meg az 00 grammot. A mta alapjá 95%-os megbízhatósággal teljesít-e ezt a feltételt a töltőgép? =9 x 999, g 0 =4,5g =0,95 =0,05 egyoldal becslés z =, ,5 x z 999,,645 00, 58g 9 95%-os megbízhatósággal a gép teljesít a techológa elvárást. A fet godolatmeet em csak a ormáls eloszlás várható értékéek becslésére gaz, haem a mtavétel eloszlás smeretébe egyéb paraméterek kofdeca-tervallumáak meghatározására s. A továbbakba a részletes levezetés mellőzésével a legfotosabb paraméterek tervallumbecsléset mutatjuk be. 69

70 4.5. Kofdeca-tervallum a ormáls eloszlás várható értékére, ha az elmélet szórás smeretle 4 Ebbe az esetbe továbbra s feltételezzük, hogy a sokaság N(,) eloszlású, de sem -t sem -t em smerjük. A problémát ezúttal az okozza, hogy bár az átlag továbbra s ormáls eloszlású, de az elmélet szórás em smert, így kéyteleek vagyuk a szórást a mtából becsül (s*). A gyakorlatba gyakra em smerjük az eredet szórást, lyekor meg kell azt becsül a mtabel korrgált tapasztalat szórás segítségével. Ebbe az esetbe azoba az x x helyett kéyteleek vagyuk a változót haszál. * s x A változó em stadard ormáls eloszlású, hsze evezője s függ a véletletől, * s mtáról mtára változk. Ameybe a sokaság eloszlás továbbra s ormáls, ez a változó t- (Studet-) eloszlású = - szabadságfokkal. (A szabadságfokot szokták még DF-fel és éha f-fel s jelöl. M a továbbakba elsősorba majd a DF jelölést haszáljuk.) A Studet-eloszlás a ormáls eloszláshoz hasolóa szmmetrkus eloszlás, az eloszlás egy paramétere az ú. szabadságfok () jellemz. A sűrűségfüggvéye ugyaúgy szmmetrkus haraggörbe alakú, de mél ksebb értéke, aál agyobb lesz a t érték, aál tágabb kofdeca-tervallumot tuduk szerkeszte. A t-eloszlás smeretébe ézzük tehát az tervallumbecslés határaak meghatározását. Az előző esethez képest csak ay a külöbség, hogy ormáls eloszlás helyett a t-eloszlást kell alkalmazuk. * * s s P x t ( ) ( ) / x t / A t / () értéket a = - szabadságfokú t-eloszlás táblázatából kereshetjük k. Az s* - az eddgekek megfelelőe a korrgált tapasztalat szórást jelöl. A Studet-féle t-eloszlás haszálata csak ks mta esetébe fotos (de továbbra s előfeltétel a sokaság ormaltása). Ha a mtaelemszám ő, akkor eek két következméye lesz. Egyrészt feloldható az eredet eloszlásra tett feltevés. Erre a agy számok egyk törvéye ad lehetőséget, mely szert, ha elég sok azoos típusú és paraméterű eloszlást aduk össze, az összeg eloszlása tart a ormálshoz. Ez azt jelet, hogy agy mták esetébe em kell tuduk semmt az eredet eloszlásról, a mtaátlagok eloszlásáak ormaltását feltételezhetjük. A gyakorlatba 00 felett mtaelemszám agyak tekthető, sőt ha az eredet eloszlás a szmmetrkushoz közel, akkor már 30 elemű mta eseté s a mtaátlagok jó közelítéssel ormáls eloszlást követek. Másrészt agy mta esetébe a Studet-féle t- x eloszlás a ormáls eloszláshoz tart, így az változóról feltételezhető, hogy stadard * s ormáls eloszlású. 4 Huyad L. Mudruczó Gy. Vta L.: Statsztka, Aula Kadó, Budapest,

71 Példa Tegyük fel, hogy az előző töltőgépes példáál em smerjük az elmélet szórást, de továbbra s tudjuk, hogy a töltés tömeg ormáls eloszlással írható le. A klecelemű mta korrgált tapasztalat szórása s*= 4,48g, az átlag továbbra s 999,g. Adjuk becslést 95%-os megbízhatóság szte a töltőtömeg várható értékére! 5 =9 x 999, g s*=4,48g (DF)= =9 =8 = 0,95 =0,05 kétoldal becslés: /=0,05 t / =,306 4,48 4,48 999,, ,,306, ,6675g< < 00,555g 95%-os megbízhatóság szte a töltőtömeg várható értéke 995,6675g és 00,555g között található. Ha összehasolítjuk azzal a kofdeca-tervallummal, amt akkor kaptuk, amkor a sokaság alapszórást smerjük, akkor azt látjuk, hogy ebbe az esetbe szélesebb kofdeca-tervallumot kaptuk a korább magyarázatokak megfelelőe Sokaság aráy becslése 6 A sokaság aráy egy bzoyos jeleség előfordulásáak aráya a sokaságo belül. A pac- és közvéleméy-kutatásokba az egyk leggyakrabba becsül kívát paraméter, hsze olya jellegű kérdésekre lehet válaszol, hogy a választásra jogosult épesség háy %-a mee el szavaz, háy %-a vee meg egy új terméket, mlye aráyba hajladók egy szolgáltatásért fzet. Az aráy becslése egy (vsszatevéses egyszerű véletle) mta esetébe tulajdoképpe egy Beroull kísérletet jelet, az adott jeleség megvalósulását fgyelhetjük meg (egymástól) függetle esetbe. Így aak a valószíűsége, hogy esetből a vzsgált jeleség k-szor előfordul, bomáls eloszlást követ, azaz k k P k p q! ( ), ahol k k k!( k)! A vzsgált egyedek (pl. férfak aráya a épessége belül, a selejtes termékek aráya stb.) sokaság aráyát jelöljük agy P-vel. Eek torzítatla (pot)becslése a p=k/ relatív gyakorság, ahol a mtaszám, k a mtába talált kedvező esetek száma. Mvel rögzített (em valószíűség változó), k bomáls eloszlást követ, így p s bomáls eloszlású lesz, M(p)=P várható értékkel és D (p)=p( P)/ varacával. Mvel az elmélet varaca eleve smeretle, az s p =p( p)/ értékkel becsüljük. A mtából számított p smeretébe a bomáls eloszlás táblázatából köye megkaphatjuk a keresett tervallumot. Ezt az eljárást azoba a gyakorlatba rtká alkalmazzuk, mert dszkrét jellege meglehetőse potatlaá tesz. A valószíűségszámítás részbe láttuk, hogy a Movre- Laplace tétel értelmébe egy p valószíűségű eseméy relatív gyakorságáak, mt p p valószíűség változóak, az eloszlása jól közelíthető a p, paraméterű ormáls eloszlással, ha a megfgyelések száma agy. Ha például p közel va 0,5-hez, 5 Baks, J.: Prcples of Qualty Cotrol, Wley, New York, Huyad L. Mudruczó Gy. Vta L.: Statsztka, Aula Kadó, Budapest, 996 7

72 akkor már =0 elemű mta s elegedő a ormáls közelítéshez. Ezek alapjá a P sokaság aráyra a következő tervallumbecslés adható: p( p) p( p) P p z / P p z / Példa A Felvllayozzuk Kft. ap termeléséből vett = 00 elemű mtába a hbás égők száma 4 db. 95%-os megbízhatóság szt mellett adjuk tervallumbecslést a sokaság aráyra! = 00 p = 4/00 = 0, = 0,95 = 0,05 kétoldal becslés: / = 0,05 z / =,96 0, 0,88 0,,96 P 0,, ,075 < P < 0,65 0, 0, Sokaság varaca becslése 7,8 Ebbe a részbe a ormáls eloszlású sokaság szóráségyzetéek tervallumbecslését mutatjuk be, amely az eddg godolkodástól eltérőe valósítható meg. Kdulópotuk a mtabel korrgált tapasztalat szóráségyzet, am a sokaság varaca torzítatla becslése. Ha a sokaság eloszlása em ormáls, akkor még agy mták eseté sem érvéyes az tt következő tervallumbecslés. Ameybe az eredet eloszlás ormáls, akkor az ) s x x x x x ( x... összefüggés mutatja, hogy a felírt függvéy stadard ormáls eloszlások égyzetéek összege, azaz a -eloszlás (ejtsd khí-égyzet) haszálható a jellemzésére - szabadság fokkal. A -eloszlás jellemzőt, alakját egy paramétere a t-eloszláshoz hasolóa a szabadságfok határozza meg. Külöböző -eloszlásokat mutat a 3. ábra. Sajálatos módo az eddg megszokott, kéyelmes mtavétel eloszlásoktól eltérőe, a -eloszlás csak poztív értékekre va értelmezve, em szmmetrkus, de ettől eltektve ugyaúgy haszálhatjuk tervallumbecslésre, mt a stadard ormál, ll. a t-eloszlásokat. A szabadságfok övekedésével az eloszlás közelít a ormáls eloszláshoz, amt a későbbekbe a kofdeca tervallumok meghatározásáál s khaszáluk. 7 Huyad L. Mudruczó Gy. Vta L.: Statsztka, Aula Kadó, Budapest, Scch, T.:Statstcs by Example, Delle Publshg Compay, Sa Frassco, 990 7

73 f(x) 0.5 Ch-égyzet eloszlás sûrûségfüggvéye 0.4 DF= DF= 4 DF= x 6 3. ábra: -eloszlás sűrűségfüggvéye 9 Mvel az eloszlás em szmmetrkus, kétoldal becslés eseté az eloszlás alsó és felső oldalá kjelölt / valószíűség em egyforma hosszúságú tervallumokat jelet, eél fogva az előzőekbe vzsgált esetekkel elletétbe a kofdeca-tervallum em lesz szmmetrkus a potbecslésre. Normáls eloszlású valószíűség változó smeretle varacájáak megbízhatóság tervallumát az alább összefüggéssel határozhatjuk meg: P * s / s / * A / és a / értékeket a (ll. DF) = - szabadságfokú táblázatból lehet meghatároz. Ha a kofdeca-határokat az eloszlás elmélet szórására szereték voatkoztat, akkor mdkét határ poztív előjelű égyzetgyökét kell képezük. Ha a becslését a tapasztalat szórással végeztük, akkor a számlálóba (-) helyett -el szorozzuk a szórást. Példa A Felvllayozzuk Kft. karácsoyfaégőek élettartamát = 6 elemű mtából vzsgálva azt találták, hogy az élettartamok korrgált tapasztalat szórása 0 óra. Határozzuk meg az égők varacájára, ll. szórására voatkozó 95%-os kofdeca-határokat! = 6 s* = 0 óra (DF) = = 6 = 5 = 0,95 = 0,05 kétoldal becslés: / = 0,05 / = 0, ,5 54,5 < < 39,6 7,38 < < 5,5 0 6,6 9 Készült a STATISTICA for Wdows program segítségével 73

74 Nagy szabadság fok (agy mtaszám) eseté a -eloszlás közelíthető ormáls eloszlással. Ha a mtaszám >30, akkor felhaszálva azt az eredméyt, hogy a meység közelítőleg stadard ormáls eloszlású változó, adott valószíűséghez tartozó α értéke kfejezhető a stadard ormáls eloszlás u értékéből: u. 0 Példa Tegyük fel, hogy az előző példába említett vzsgálatot =50 elemű mtából végezték. 95%- os megbízhatóság szte mlye tervallumba található az elmélet szórás? =50 s*=0 óra (DF)= =50 =49 = 0,95 =0,05 kétoldal becslés: /=0,05 -/=0, ,4 68,6 < < 5, 8,8 < <,3 0 3,4 Mvel elég agy, ezért a értékeket ormáls eloszlással közelítve azt kapjuk, hogy, , 7 0,975 ll., , 0,05. Ezeket behelyettesítve a kofdeca-határok képletébe, a szóráségyzetre, ll. szórásra az alább tervallumok adódak: 70,3 < < 57,5 8,38 < <, A mtaagyság meghatározása Sokszor előfordul, hogy a megbízhatóság, potosság követelméyek alapjá kell megtervez azt, hogy mekkora mtára va szükség. A megbízhatóság követelméy a megbízhatóság szt, a potosság követelméy pedg a maxmáls hba rögzítését jelet. Ezek függvéyébe a külöböző mtavétel módok esetébe a mtaagyságra képlet adható. Vsszatevéses egyszerű véletle mtáál z /, ahol Δ az elmélet várható értéktől való maxmáls eltérés, z / pedg a stadard ormáls eloszlásfüggvéy verze az -α/ helye. 0 Spegel, Murray R.: Statsztka: Elmélet és gyakorlat, Paem McGraw-Hll, Budapest,

75 Ebből -t kfejezve: z / A szükséges mtaelemszám égyzetese aráyos a megbízhatósággal és a sokaság szórással, fordított égyzetese aráyos a maxmáls hbával. Ez azt jelet, hogy dupla potosságú becsléshez pl. 4-szer, háromszor olya potos becsléshez 9-szer akkora mtát kell ve, azaz a potosság övelése költséges dolog. 4.6 Fogalmak mtavétel hba em mtavétel hba véletle mtavétel reprezetatvtás vsszatevéses egyszerű véletle mtavétel vsszatevés élkül egyszerű véletle mtavétel rétegzett mtavétel csoportos és többlépcsős mtavétel potbecslés tervallumbecslés mta statsztka mtavétel eloszlás torzítatlaság hatásosság kozszteca elégséges becslés kofdeca-tervallum megbízhatóság szt 4.7 Gyakorló feladatok 4.7. Feladat Egy elektroka gyártósoro egy alkatrész yomtatott áramkörre törtéő beültetés pozícójáak x-ráyú koordátáját vzsgálták. Korább elemzésekből smert, hogy az x- ráyú beültetés pozícó ormáls eloszlású valószíűség változó 0,03mm szórással. 0 mérést elvégezve az x-ráyú beültetés koordáta átlaga 0,34mm-re adódott. a) Adjuk 95%-os megbízhatóság sztű tervallumbecslést az alkatrész x-ráyú beültetés koordátájáak várható értékére! b) Legalább háy elemű mtát vegyük, hogy az alkatrész x-ráyú beültetés koordátájáak várható értékét 95% valószíűséggel 0,0mm-él ksebb eltéréssel tudjuk becsül? Megoldás: a) Adjuk 95%-os megbízhatóság sztű tervallumbecslést az alkatrész x-ráyú beültetés koordátájáak várható értékére! Az x-ráyú beültetés koordáta ormáls eloszlású smeretle μ várható értékkel és smert σ 0 =3 mm elmélet szórással. =0 0,95 0,05 z ( / ) (0,975) / x 0,34 mm,96 75

76 z 0,03, / 0 0 P x z / x z / 0,086 A várható értékre voatkozó 95%-os megbízhatóság sztű kofdeca-tervallum: ( 0,34 0,086;0,34 0,086) (0,34;0,3586) 95%-os megbízhatóság szte az alkatrész x-ráyú beültetés koordátájáak várható értéke 0,34mm és 0,3586mm között va. A b) Legalább háy elemű mtát vegyük, hogy az alkatrész x-ráyú beültetés koordátájáak várható értékét 95% valószíűséggel 0,0mm-él ksebb eltéréssel tudjuk becsül? összefüggésből Keressük azt az értéket, amelyre a 0 0 P x z / x z / 0 P x z / x eltérés -α valószíűséggel ksebb az előre rögzített Δ értékél. 0 Ha értékét úgy választjuk meg, hogy z / teljesül, akkor 0 P x z / s teljesül. Tehát a várható érték -α valószíűséggel Δ-ál ksebb eltéréssel törtéő becsléséhez 0 szükséges mta agysága: z / Esetükbe 0,0mm 0 0,03mm z / ( / ) (0,975),96 0 0,03 z /,96 34,5744 0,0 Ahhoz tehát, hogy a várható értéket 95%-os valószíűséggel legfeljebb 0,0mm eltéréssel tudjuk becsül legalább 35 elemű mta szükséges Feladat Egy kávéautomata elleőrzése sorá az automata által adagolt eszpresszó kávé térfogatát vzsgálták. Korább tapasztalatok alapjá az adagolt kávé térfogata ormáls eloszlású valószíűség változóak tekthető. A vzsgálat sorá 0 mérést végeztek, a mérés 76

77 eredméyek értéke ml-be a következők voltak: 0; 97; 03; 99; 0; 98; 04; 0; 97; 00. Adjuk 95%-os megbízhatóság sztű tervallumbecslést az eszpresszó kávé adagolt térfogatára! Megoldás: Az adagolt kávétérfogat ormáls eloszlású valószíűség változó, melyek elmélet várható értékét és elmélet szórását em smerjük. A feladatuk az, hogy 95%-os megbízhatóság sztű kofdeca-tervallumot adjuk a várható értékre. Mvel az elmélet szórás smeretle, így az következő összefüggést haszálhatjuk: * * s s P x t ( ) ( ) / x t / A mtaátlag: x 00, 0 A korrgált tapasztalat szórás: s (0-00,) 0,05 DF=-=9 t,6 0,975 (97-00,) 9... (00-00,) A 95%-os megbízhatóság sztű kofdeca-tervallum: * * s s x t / ( ) ; x t / ( ),4404,4404, ,,6 ;00,,6 98,4544;0, Az eszpresszó kávé adagolt térfogata 95%-os valószíűséggel a (98,4544; 09456) tervallumba esk Feladat Egy forgácsoló üzembe esztergált tegelyek átmérőjét vzsgálták. A vzsgálat sorá 30 darab tegely átmérőjét mérték meg. A tegelyek átmérőjéek a mtából számított átlaga 55mm, korrgált tapasztalat szórása 0,mm. A tegelyek átmérőjéről feltételezhető, hogy ormáls eloszlású valószíűség változó. Adjuk 99%-os megbízhatóság sztű tervallumbecslést a.) a tegelyek várható átmérő méretére! b.) a tegelyek átmérőjéek szórására! Megoldás: Adjuk 99%-os megbízhatóság sztű tervallumbecslést a tegelyek várható átmérő méretére! A feladat az, hogy 99%-os megbízhatóság sztű kofdeca-tervallumot adjuk egy ormáls eloszlású valószíűség változó várható értékére smeretle elmélet szórás eseté. A mtából számított átlag: x 55mm 77

78 A mtából számított korrgált tapasztalat szórás: s * 0, mm 0,0 DF= -=30-=9 t t,756 0,0/ 0,995 * * s s P x t ( ) ( ) / x t / A keresett kofdeca-tervallum: 0, 0, 55,756 ;55,756 54,8994mm; 55,006mm A tegelyek átmérőjéek várható értéke 54,8994mm és 55,006mm között va. Adjuk 99%-os megbízhatóság sztű tervallumbecslés a tegelyek átmérőjéek szórására! A feladat az, hogy 99%-os megbízhatóság sztű kofdeca-tervallumot adjuk egy ormáls eloszlású valószíűség változó várható szórására. * * s s P / / s * 0, mm 0,0 DF=-=30-=9 A kh-égyzet eloszlás táblázatából: 5,335 / 0,005 / 0,995 3, A szóráségyzetre voatkozó kofdeca-tervallum: 90, 90, ; 0,0;0,0884 5,335 3, A szórásra voatkozó kofdeca-tervallum: 0,0; 0,0884 0,489mm; 0,973mm A tegelyek átmérőjéek szórása 99%-os megbízhatóság szte 0,489mm és 0,973mm között va Feladat Megbízhatóság elemzések sorá a 60W-os zzók élettartamát vzsgálták. Összese 60 darab zzó élettartamát fgyelték meg, a megfgyelések eredméyet az alább gyakorság táblázatba rögzítették. Az zzók élettartamáról feltételezhető, hogy ormáls eloszlást követ. Élettartam (hóap) Izzók száma (db) 0 t<6 5 6 t< 7 t<8 8 8 t<4 4 t< t<36 78

79 Adjuk 95%-os megbízhatóság sztű tervallumbecslést az zzók várható élettartamára! Megoldás: Az zzók élettartamáról tudjuk, hogy ormáls eloszlású valószíűség változóak tekthető, smeretle várható értékkel és smeretle szórással. A feladatuk az, hogy a várható értékre adjuk 95%-os megbízhatóság sztű kofdecatervallumot. Mvel az elmélet szórás smeretle, így a következő összefüggést haszálhatjuk. * * s s P x t ( ) ( ) / x t / Az átlagot a gyakorság táblázatból a leíró statsztkából smert módo számítjuk: x r f x r f A korrgált tapasztalat szórást a gyakorság táblázatból a leíró statsztkából smert módo számítjuk: s * r 0,05 DF=-=59 t 0,975 f ( x x) 5(37,)... (337,) 60,00 A 95%-os megbízhatóság sztű kofdeca-tervallum: * * s s x t / ( ) ; x t / ( ) 79 7, 6,8958 6,8958 6,8958 7,,00 ;7,,00 5,486 ;8, Az zzók várható élettartama 95%-os valószíűséggel a (5,486 hóap; 8,984 hóap) tervallumba esk Feladat Az előző feladat adata alapjá adjuk 95%-os megbízhatóság sztű tervallumbecslést a.) a legalább 8 hóap élettartamú zzók aráyára! b.) a hóapál rövdebb élettartamú zzók aráyára! Megoldás: a.) Adjuk 95%-os megbízhatóságú tervallumbecslést a legalább 8 hóap élettartamú zzók aráyára! A legalább 8 hóap élettartamú zzók aráya a gyakorság táblázatból (a kokrét mtából): 7 p 0,5 60

80 Kofdeca-tervallum a sokaság aráyra: p( p) p( p) P p z / P p z / 60 0,95 0,05 z / ( / ) (0,975),96 A 95%-os kofdeca-tervallum: 0,5 ( 0,5) 0,5 ( 0,5) 0,5,96 ;0,5, A legalább 8 hóap élettartamú zzók aráya 95%-os valószíűséggel a (0,3735; 0,665) tervallumba esk. b.) Adjuk 95%-os megbízhatóságú tervallumbecslést a hóapál rövdebb élettartamú zzók aráyára a gyakorság táblázatból (a kokrét mtából): 5 7 p 0, 60 Kofdeca-tervallum a sokaság aráyra: p( p) p( p) P p z / P p z / 60 0,95 0,05 z / ( / ) (0,975),96 A 95%-os kofdeca-tervallum: 0, ( 0,) 0, ( 0,) 0,,96 ;0,, A hóapál rövdebb élettartamú zzók aráya 95%-os valószíűséggel a (0,0988; 0,30) tervallumba esk Elmélet kérdések. Ismertesse a mtavétel és a em mtavétel hbák léyegét, és a véletle mtavétel szerepét!. Adjo rövd áttektést a véletle mtavétel eljárások léyegéről és főbb jellemzőkről! 3. Részletezze a becslés Fsher-féle krtérumat! 4. M a potbecslés léyege? 5. Ismertesse az tervallumbecslés, mt matematka statsztka módszer léyegét! 80

81 5. Hpotézsvzsgálat A hpotézsvzsgálat a becsléselmélet mellett, a mtából a sokaságra törtéő statsztka következtetés másk fotos területe. Az előző Becslés c. fejezetbe azt mutattuk be, hogy a mta alapjá hogya lehet közelítőleg meghatároz (becsül) a sokaság bzoyos jellemzőt. Számos esetbe azoba emcsak egy paramétert szereték meghatároz, haem modjuk két vagy több paramétert összehasolíta, kokrét szakma kérdéseket szereték eldöte a tapasztalat adatok alapjá. Így például kívácsak lehetük arra, hogy a termelés folyamat bzoyos jellemző (selejtaráy, termék tulajdosága, mérete stb.) megfelelek-e az előírásak, bármlye termék töltés térfogata, tömege, fzka paramétere azoosak-e a két (vagy több) külöböző töltő- vagy gyártósoro, vagy pl. az eladások száma valóba megőtte az új reklámkampáy hatására. Az lye jellegű kérdések mtavétel segítségével törtéő megválaszolása a statsztka hpotézsvzsgálat területe. A mtavétel eredméyekre támaszkodó következtetés, dötés természetes velejárója a bzoytalaság, a tévedés lehetősége. Ezért valaháyszor mtából yert adatokra támaszkodva kell választ aduk a példakét megfogalmazott vagy ahhoz hasoló kérdésekre, valójába aak eldötéséről va szó, hogy a mtavétel eredméye kább cáfolja vagy kább alátámasztja-e a feltett kérdésre adott gelő választ. A sokaságra voatkozó feltevésüket a sokaság(ok)ból kvett mtá(k) alapjá elleőrzzük, és azt vzsgáljuk, hogy meyre fogadható el, hhető a feltevés a sokaság(ok)ra voatkozóa az aktuáls mtá(k) smeretébe. Ebbe a fejezetbe a hpotézsvzsgálatok általáos kérdéseről, valamt éháy kokrét módszerről lesz szó. 5. A hpotézsvzsgálat célja, eszköze A sokaságra voatkozó smeretek sok esetbe háyosak és/vagy bzoytalaok. E probléma megoldásáak eszköze az lehet, ha a sokasággal kapcsolatos feltételezéseket hpotézskét fogalmazzuk meg. Hpotézs: a sokasággal kapcsolatos olya feltételezés, amelyek gazságáról a hpotézsvzsgálat sorá meggyőződük. A hpotézsek a vzsgált sokaság(ok) eloszlására vagy az adott eloszlás(ok) egy vagy több paraméterére voatkozhatak. Ilye hpotézs lehet például az, hogy egy termék két meghbásodás között átlagos hbametes működés deje em ksebb egy adott értékél, vagy a frsse végzett gazdálkodás szakos hallgatók jövedelméek hav átlagos agysága logormáls eloszlású. Ezek az állítások lehetek gazak, vagy hamsak, így az állítások helyességéről való dötés tovább vzsgálatokat géyel. Az lye állítások helyességéről kétféleképpe győződhetük meg. Ha teljes körű adatfelvételt végzük az állítás gazságáak elleőrzésére, akkor teljes bzoyossággal eldöthető, hogy a vzsgált hpotézs gaz-e vagy sem. Ha mtavétel eredméyere támaszkoduk, tehát részleges adatgyűjtést végzük, akkor mvel mtavétellel yert eredméyeket haszáluk, em lehetük teljese bztosak abba, hogy a mtavétel eredméye a hpotézst alátámasztja, vagy az elle szól. Eek magyarázatát láttuk már az előző fejezetbe: a mtavétel esetébe fellépő mtavétel gadozás következtébe egy mtavétel eredméye még akkor s eltérhet a hpotézsbe szereplő megfelelő értéktől, ha a hpotézs gaz. Ezzel együtt azt sem lehet kzár, hogy a hpotézs em gaz, de a véletle szeszélye folytá mégs a hpotézst alátámaszta látszó mtavétel eredméyt kapuk. 8

82 A gyakorlatba főleg mtavételes eljárásoko alapulak a sokaságra voatkozó hpotézsek helyességéek elleőrzésére szolgáló vzsgálatok. Eek oka, hogy a véges sokaságok teljes körű megfgyelése gyakra ayag vagy egyéb korlátokba ütközk, másrészt pedg az elleőrzedő hpotézs sok esetbe valamlye végtele sokasággal kapcsolatos (pl. egy adott gyártás folyamatból kkerülő termékek összessége). A továbbakba a hpotézsek helyességéek mtavételre alapozott elleőrzésével foglalkozuk, amt hpotézsvzsgálatak evezük. A fejezetbe végg vsszatevéses, egyszerű véletle mtákat feltételezük. Hpotézsvzsgálat: A hpotézsek helyességéek mtavétel eredméyekre alapozott vzsgálatát hpotézsvzsgálatak evezzük. A külöféle hpotézsek vzsgálatára szolgáló eljárásokat statsztka próbákak vagy tesztekek hívjuk. A hpotézsvzsgálat aak mérlegelése, hogy az adott sokaságra megfogalmazott állítás meyre hhető a mtavétel eredméyek féyébe. Ha ez a mtavétel eredméy összhagba áll a sokaságra megfogalmazott feltevéssel, akkor cs okuk arra, hogy kétségbe vojuk a feltevés helyességét. Ebbe az esetbe a sokaságra voatkozó állítást célszerű fetarta, mert az valószíűleg (de em 00%-os bztosággal!) gaz. Ha a mtavétel eredméy em áll összhagba a sokaságra voatkozó állítással, akkor pedg mde okuk megva arra, hogy megkérdőjelezzük az állítás helyességét. Ebbe az esetbe a sokaságra voatkozó állítást célszerű elvet, mert az valószíűleg em gaz. A sokaságra és a mtavétel módjára voatkozó olya kkötéseket, amelyekek a teljesülését bármlye okál fogva eleve elfogadjuk és a hpotézsvzsgálat kerete belül külö em vzsgáljuk, alkalmazás feltételekek evezzük. 5.. A vzsgáladó hpotézs megfogalmazása Mde hpotézsvzsgálat céljara két hpotézst fogalmazuk meg egyszerre: egy ullhpotézst és egy azzal szembe álló állítást, az ú. alteratív vagy ellehpotézst. Nullhpotézs: az a sokaságra voatkozó feltevés, amelyek gazságáról a hpotézsvzsgálat sorá közvetleül meg kíváuk győződ. Alteratív vagy ellehpotézs: a ullhpotézssel együtt mde lehetőséget kmerítő, azzal egymást kölcsööse kzáró hpotézs, amelyek helysségéről közvetette dötük a hpotézsvzsálat sorá. A hpotézsvzsgálat sorá e két hpotézst verseyeztetjük egymással, és a végé a kettő közül azt fogjuk gazak tekte, elfogad, amelyk a mtavétel eredméye alapjá hhetőbbek tűk a máskál. A ullhpotézs jelölésére a H 0, az alteratív hpotézs jelölésére pedg a H szmbólumot haszáljuk. A két hpotézst oly módo kell megfogalmaz, hogy azok akármelykét s tektjük majd a máskál hhetőbbek, megválaszolható legye a beüket érdeklő kérdés, és egyszerre e lehesseek gazak, de együtt mde lehetőséget kmerítseek. Az a hpotézs, amelyek a helyességéről dötük közvetleül, mdg a ullhpotézs. Ha azoba a ullhpotézs és az alteratív hpotézs kölcsööse kzárják egymást, akkor a H 0 hpotézsre voatkozó dötés közvetette mdg dötést jelet a H -ről s: a ullhpotézs elfogadása egyúttal H elvetését, H 0 elvetése pedg a H elfogadását jelet. 8

83 Példakét tegyük fel, hogy a sokaság várható értékére voatkozó feltevést szereték vzsgál, és azt a feltevést kívájuk elleőrz, hogy gaz-e, hogy egy őrölt kávét töltő gép az előírásokak megfelelőe átlagosa kg töltősúlyú csomagokat készít. Természetese a legdeálsabb az lee, ha mde csomagba potosa kg kávé lee, de cs abszolút potos gép, így a töltőtömeg émleg szóródk. A várható értékre voatkozó feltevéssel elleőrzése azt jelet, hogy azt szereték megvzsgál, hogy a töltés szsztematkusa em tolódk-e el valamelyk ráyba, mert az vagy veszteséget okoz a vállalatak, vagy a vevőket károsítja meg. Ettől a szórás akár agy s lehet, így egy-egy csomagba lehet kg-ál jóval kevesebb vagy több kávé s, de a szórásra voatkozó feltevést s lehet külö elleőrz. A ullhpotézs ebbe az esetbe a töltőtömeg várható értékére voatkozó feltevés teljesülése: H 0 : μ=kg A várható értékre voatkozó feltételezésüket többféle alteratív hpotézssel szembe vzsgálhatjuk, azt hogy melyket célszerű választa, az 5..3 alfejezetbe tárgyaljuk. Most csak bemutatjuk a három lehetőséget: H : () μ kg; () μ>kg; (3) μ<kg 5.. A próbafüggvéy A vzsgál kívát hpotézsek felállítása utá a következő feladat a hpotézs helyességéek elleőrézésére szolgáló próbafüggvéy kválasztása. A próbafüggvéyt úgy kell megválaszta, hogy a sokaságra tett bzoyos kkötések teljesülése, a mtavétel módja és a mta adott agysága, az elleőrzedő H 0 helyességéek feltételezése mellett smert legye aak valószíűség eloszlása. A próbafüggvéy a mtaelemek egy olya függvéye, amelyek valószíűség eloszlása a sokaság smert tulajdoságat tektetbe véve, H 0 gazságát pedg feltételezve potosa smert. A próbafüggvéyt eloszlásáak smerete tesz alkalmassá a H 0 helyességéek vzsgálatára. A próbafüggvéyek az előző fejezetbe megsmert becslőfüggvéyek közel rokoa, mert azokhoz hasolóa a mtából a sokaságra való következtetés céljat szolgálják. A próbafüggvéy a mtavétel előtt mtáról mtára gadozó valószíűség változó, a mtavétel utá pedg az adott valószíűség változóak egy kokrét értéke. A próbafüggvéyek kostruálása alapvetőe elv, matematka feladat egy-egy kokrét ullhpotézs és alkalmazás feltételredszer mellett. Erre a célra az elmélet statsztkusok ugyaúgy általáos módszereket dolgoztak k, mt a jó tulajdoságokkal redelkező becslőfüggvéyek készítésére, egy-egy ullhpotézs tesztelésére akár több próbafüggvéy közül s választhatuk. A próbák mősítésére s éppúgy bzoyos krtérumokat haszálak, mt a becslőfüggvéyek mősítésére és egymással való összehasolítására, de jegyzetükek em célja eek bemutatása Krtkus tartomáy A ullhpotézs és aak vzsgálatára alkalmas próbafüggvéy brtokába végrehajtható a hpotézsvzsgálat. Elfogadás és elutasítás tartomáy: A hpotézs helyességéek elleőrzése céljából a próbafüggvéy lehetséges értékeek tartomáyát alkalmas osztópotok segítségével két egymást át em fedő ú. dszjukt részre botjuk: egy elfogadás és egy elutasítás tartomáyra. E két tartomáy határat úgy választjuk meg, hogy a próbafüggvéy a 83

84 ullhpotézs feállása eseté előre megadott agy -α valószíűséggel az elfogadás tartomáyba esse. Így a próbafüggvéy értéke csak kcs α valószíűséggel kerülhet a krtkus tartomáyba. Ha ezek utá a próbafüggvéyek a redelkezésükre álló egy esetleg több mta databól származó értéke az elfogadás tartomáyba esk, akkor elfogadjuk H 0 -t, ellekező esetbe pedg elvetjük azt. Ez utóbb esetbe a H 0 elvetésével együtt elfogadjuk a vele szembe állított H alteratív hpotézst. Eek az eljárásak az az alapja, hogy egy olya eseméyek a bekövetkezése, amre H 0 gazságát feltételezve agy valószíűséggel számítuk (vagys, hogy a probafüggvéy értéke az elfogadás tartomáyba esk) megerősít a H 0 hpotézs helyességébe vetett htüket, és így hajlamosak vagyuk aak elfogadására. Ha ezzel szembe a ks valószíűséggel várt másk eseméy következk be (vagys a próbafüggvéy értéke az elutasítás tartomáyba esk), akkor ez meggatja a H 0 hpotézs helyességébe vetett htüket, s így kább vsszautasítjuk azt. Szgfkaca szt: a krtkus tartomáyba esés α valószíűségét szgfkaca sztek evezzük. A szgfkaca szt megválasztásával kapcsolatba megjegyezzük, hogy azt általába kcsek (0,05 és 0,0 között értékek) szokás választa a gyakorlatba. Az elfogadás és elutasítás tartomáy egymáshoz képest elhelyezkedése háromféle (bal vagy jobb oldal, ll. kétoldal krtkus tartomáy) lehet, ezt mutatja az alább ábra: Krtkus Elfogadás α -α Bal oldal krtkus tartomáy Krtkus érték Elfogadás Krtkus -α α Jobb oldal krtkus tartomáy Krtkus érték Krtkus Elfogadás Krtkus α/ Krtkus érték -α Krtkus érték α/ 4. ábra: A krtkus tartomáy lehetséges helyzete Két oldal krtkus tartomáy Bal vagy jobb oldal krtkus tartomáy kjelölésére olya esetekbe va szükség, amkor eleve arra számítuk, hogy a valóság meghatározott ráyú eltérést mutat egy általuk feltételezett helyzettől. Egyoldal krtkus tartomáyt dokolt kjelöl olya esetekbe s, ha valamlye feltételezett, előírt állapottól való adott ráyú eltérés a fotos számukra. A teljes krtkus tartomáyt a próbafüggvéy eloszlásáak vagy csak a bal, vagy csak a jobb szélére tesszük. Ilye esetekbe a hpotézsvzsgálat sorá azt kell megvzsgál, hogy a próbafüggvéy mtá(k)ból yert értéke elég kcs-e (vagy elég agy-e) ahhoz, hogy a H 0 helyett kább a H 0 - bel állapottól adott ráyba való eltérést kmodó alteratív hpotézs feállását legye 84

85 dokolt feltételez. Ezért lyekor a teljes krtkus tartomáyt a próbafüggvéy eloszlásáak vagy csak a bal, vagy csak a jobb szélére tesszük, ahogya az a 4. ábrá látható. Így, ha az egyoldal alteratív hpotézs feállása eseté a próbafüggvéy ksebb értéket vesz fel, mt a H 0 feállásakor, akkor bal oldal, ellekező esetbe pedg jobb oldal alteratív hpotézsről beszélük. Kétoldal krtkus tartomáy kjelölésére olya esetekbe kerül sor, amkor egyszerűe csak a ullhpotézsbe feltételezett helyzettől való eltérés téye érdekel mket, és közömbös az eltérés ráya. Kétoldal krtkus tartomáy haszálata eseté a krtkus tartomáyba esés teljes α valószíűségét egyelő aráyba szokás megoszta a krtkus tartomáy két része között (lásd 4. ábra). Kétoldal alteratív hpotézs feállása eseté a próbafüggvéy értéke akár agyobb, akár ksebb lehet, mt a H 0 feállásakor. Krtkus értékek: Az elfogadás és elutasítás tartomáyt egymástól elhatároló c a és c f értékeket alsó és felső krtkus értékek szokás evez. A krtkus értékeket mdg a krtkus tartomáy részéek tektjük. A krtkus tartomáy kjelölésére kétoldal krtkus tartomáy haszálata eseté két krtkus értékre, egyoldal krtkus tartomáy eseté pedg egy krtkus értékre va szükség. A krtkus értékek a szgfkaca szt és a próbafüggvéy eloszlásáak smeretébe egyértelműe meghatározhatóak. A krtkus értékek kereséséhez specáls táblázatok állak redelkezésre (lásd Képletgyűjteméy). A legtöbb próba md egyoldal, mt kétoldal krtkus tartomáy mellett végrehajtható. A krtkus tartomáy elhelyezkedését mdg a H 0 hpotézssel szembe álló ellehpotézsbe szereplő feltevés, potosabba e feltevés H 0 -ba feltételezett helyzettől való eltéréséek ráya határozza meg. Vegyük a korább kávétöltés példákat! Láttuk, hogy a várható értékre voatkozó feltételezésüket többféle alteratív hpotézssel szembe vzsgálhatjuk: H : () μ kg; () μ>kg; (3) μ<kg Az első esetbe a ullhpotézs kétoldal, a másodk és a harmadk esetbe pedg egyoldal. Azt, hogy melyk alkalmazása célszerű, a vzsgált gazdaság-társadalm probléma jellege döt el. Esetükbe az s rossz, ha a töltőtömeg várható értéke kg alatt, mert ebbe az esetbe a vevők károsodak, meg az s, ha kg felett, mert akkor meg a gyártó jár rosszul. Így célszerű kétoldal ellehpotézst választa. Abba az esetbe, ha azt a sokaságra voatkozó feltevést kell elleőrzük, hogy egy adott beredezés teljesít-e azt az előírást, hogy legalább 0000 órát hbametese működjö, akkor az alteratív hpotézskét a harmadk esethez hasoló relácót kell választa, hsze csak akkor utasítjuk el a ullhpotézst, ha a mta alapjá határozotta em teljesül az előírás. 85

86 5..4 A hpotézsvzsgálat lépése Összefoglalva az eddg leírtakat a hpotézsvzsgálat a következő lépésekből áll:. A H 0 hpotézs és a vele szembe álló H hpotézs megfogalmazása.. Olya próbafüggvéy készítése, lletve keresése, amelyek eloszlása H 0 helyességét feltételezve és a próba alkalmazás feltételet adottak véve egyértelműe meghatározható. 3. Az α szgfkaca szt megválasztása, és a próbafüggvéy lehetséges értéktartomáyáak ezzel és az alteratív hpotézssel összhagba lévő felosztása elfogadás és elutasítás tartomáyra. 4. A mtavétel leboyolítása, és a próbafüggvéy számszerű értékéek meghatározása a mtából. 5. Dötés a H 0 és H helyességéről: ha a próbafüggvéy értéke az előre kjelölt elfogadás tartomáyba esk, elfogadjuk H 0 -t, ellekező esetbe pedg elvetjük azt A hpotézsvzsgálat sorá elkövethető hbák Az előzőekbe leírtakat átgodolva em ehéz belát, hogy a leírt módo eljárva a H 0 hpotézs helyességéről hozott dötésük em lesz mdg feltétleül helyes. Elsőfajú hba: előfordulhat, hogy a H 0 hpotézs helyes, de a próbafüggvéyek egy adott mtából számított értéke mégs a krtkus tartomáyba esk. Ilyekor a H 0 hpotézst aak elleére utasítjuk el, hogy az valójába helyes. Ez ylvávalóa hbás dötés, és e dötés valószíűségét elsőfajú hbáak evezzük. Ilye hbás dötés az elfogadás és elutasítás tartomáy felépítését tektve α valószíűséggel fordulhat elő. Ezzel azoba em merítettük k mde hbalehetőséget. Másodfajú hba: előfordulhat, hogy a H 0 em gaz, és a próbafüggvéy értéke mégs az elfogadás tartomáyba esk. Eek az a következméye, hogy a H 0 -t elfogadjuk, pedg az valójába em gaz. Ez s hbás dötés, amt másodfajú hbáak evezek, és β-val jelölek. Nylvávaló, hogy a cél az lee, hogy mdkét fajta hba elkövetéséek a valószíűségét mél alacsoyabb szte tartsuk. A kétféle hba jeletését és az elkövetés valószíűségét foglalja össze az alább táblázat: 7. Táblázat: A hpotézsvzsgálat sorá elkövethető hbák és valószíűségek H 0 -t H 0 a valóságba gaz em gaz elvetjük elsófajú hba (α) a dötés erőssége (-β=e) elfogadjuk a dötés megbízhatósága (-α=ε) másodfajú hba (β) Összese Az elsőfajú hba elkövetés valószíűsége megegyezk a korábba megsmert szgfkaca szttel. Megbízhatóság szt: A szgfkaca sztet -re kegészítő (-α) valószíűséget, azaz aak az eseméyek a valószíűségét, hogy em vetjük el a helyes ullhpotézst, a próba megbízhatóság sztjéek evezzük, és ε-al jelöljük. 86

87 Az elsőfajú hba elkövetés valószíűségét a hpotézsvzsgálat végzője α alkalmas megválasztásával tetszés szert korlátoz tudja. A másodfajú hba esetébe ez már em áll módjába, mert a β a valóságba feálló, de általába em smert helyzettől függ. A dötés erőssége: Az (-β) komplemeter valószíűséget, vagys aak az eseméyek a valószíűségét, hogy em követjük el a másodfajú hbát (em fogadjuk el tévese a ullhpotézst), a próba erejéek evezzük, és e-vel jelöljük.. Adott mtaagyság mellett az elsőfajú és másodfajú hba elkövetés valószíűsége egymással elletétes ráyba mozog. Rögzített mtaelemszám mellett, ha az α ő, akkor β csökke, ha pedg α csökke, akkor β ő. Adott szgfkaca szt mellett a másodfajú hba elkövetéséek valószíűsége a mtaagyság övelésével mérsékelhető. Így egy-egy ullhpotézs helyességéek elleőrzéséhez olya próbát célszerű választa, amely az elsőfajú hba adott elkövetés valószíűsége mellett mmálssá tesz a másodfajú hba elkövetés valószíűségét. Gyakorlat szempotból érdekes kérdés, hogy egy kokrét hpotézsvzsgálat sorá mlye szgfkaca sztet célszerű választa. Ha a kétféle hba elkövetéséek va valamlye költségvozata, akkor ezt feltétle célszerű fgyelembe ve, és a szgfkaca sztet ezzel összhagba kell megválaszta. Ha pl. az elsőfajú hba elkövetése ge agy ayag veszteséggel jár, de a másodfajú hba elkövetése em okoz külöösebb bajt, akkor a szgfkaca sztet célszerű kcsre választa. Ez a helyzet előfordulhat pl. egy gyárba, amkor a hpotézsvzsgálattal végzett gyártásköz mőségelleőrzés célja aak eldötése, hogy beavatkozzaak-e az adott folyamatba vagy sem, és a beavatkozás költsége ge magas. Ha ugyas a ullhpotézs az, hogy a folyamat a techológa előírásokak megfelelőe zajlk, akkor az elsőfajú hba a folyamatba való fölösleges beavatkozást jelet. Ha vszot kább a másodfajú hba elkövetése elle dokolt védekez, akkor ylvá célszerű vszoylag magas szgfkaca sztet haszál, vagy ha lehetőség va rá, akkor agy mtát választa. Adott mtaagyság mellett a kétféle hba elkövetéséek valószíűsége csaks egymás rovására változtatható. E probléma áthdalásáak több módja va. Az egyk lehetőség H 0 és H oly módo törtéő megfogalmazása, hogy a hpotézsvzsgálat végzője lehetőleg H 0 elvetésébe legye érdekelt, a szgfkaca szt pedg mél ksebb legye. Ekkor ugyas kcs a hbás dötés kockázata. Ha em lehet H 0 -t úgy megfogalmaz, hogy a hpotézsvzsgálat végzőjéek H 0 elvetése álljo az érdekébe, akkor vszoylag magas szgfkaca sztet célszerű választa és/vagy vszoylag agy mta haszálatára célszerű töreked. Egy másk lehetséges megoldás az ú. p-értékek haszálata. A p-érték az a legksebb szgfkaca szt, am H 0 már épp elvethető H -gyel szembe. A p-érték tehát em más, mt a próbafüggvéy mtából yert értékéhez tartozó szgfkaca szt. E p-értékekek az a léyeges előyük az előre rögzített α szgfkaca szttel szembe, hogy a p-érték smeretébe bárk saját megítélése szert értékelhet a hpotézsvzsgálat eredméyét. Ha ugyas valak a saját szempotja alapjá adott esetbe egy α 0 szgfkaca szt haszálatát tartja dokoltak, akkor mde olya esetbe el fogja vet a H 0 -t, amkor p α 0, és mde olya esetbe el fogja fogad, amkor p>α 0. A számítógépes programcsomagok legtöbbször a p-értéket adják meg a próbák végrehajtása sorá, és a p-érték 87

88 haszálatáak agy előye, hogy a p-érték em függ a krtkus értékeket tartalmazó táblázatok részletezettségétől. Az α és β valószíűségek értelmezésével kapcsolatba megjegyezzük, hogy azok potosa úgy értedők, mt a kofdeca-tervallumokhoz kapcsolódó megbízhatóság szt: ha a hpotézsvzsgálatot adott H 0, H mellett sokszor adott agyságú, de külöböző összetételű véletle mták alapjá elvégezék, akkor átlagosa az összes eset 00α százalékába követék el az elsőfajú hbát, a másodfajú hbát pedg az összes eset 00β százalékába. Az α és a β tt s az eljárásba vetett htük fokmérője, és em egy-egy egyed esetre voatkoztatható. Példa Nézzük meg példakét kávétöltés példáko keresztül az előző lépéseket! Adott egy feltevés a sokaságról, vagys az, hogy a gép által töltött kávécsomagok átlagos tömege kg. H 0 : μ=kg H : μ kg Tegyük fel, hogy veszük egy 6 elemű mtát a töltés folyamatból (sokaság), és lemérjük a véletleszerűe kválasztott 6 kávécsomag tömegét. Tegyük fel, hogy a töltőgép ormáls eloszlás szert tölt a csomagokat, és a szórás smert: 0,05kg. A próbafüggvéy lehet a mtaátlag, mert a becslés fejezetbe leírtak alapjá smerjük a mtaátlag eloszlását és paraméteret. A mtaátlag ormáls eloszlást követ kg várható 0,05 értékkel és 0,05kg szórással, azaz x ormáls eloszlású: N(, 0,05) 4 paraméterekkel. Ha a mtaátlag potosa kg, ez szól a ullhpotézs mellett legkább, de ha émleg ksebb vagy agyobb, ez s beleférhet a véletle gadozásba, hsze az éppe aktuáls mta függ a véletletől. Mél agyobb az kg-tól való eltérés, aál kevésbé hhető a ullhpotézs. Az elfogadás tartomáy előre meghatározott valószíűséggel éppe azt a határt jelet, amíg úgy dötük, hogy az eltérés még belefér a véletlebe. A 95%-os elfogadás tartomáy (z=,96) esetükbe,960,05 kg 0,05kg (0,975kg;,05kg) Ameybe a mtaátlag ebbe az tervallumba esk, a ullhpotézst fogadjuk el, ameybe em de esk, akkor pedg az ellehpotézst. Ha esetükbe a mtaátlag,0 kg, akkor a ullhpotézs elfogadható, a mtaátlag eltérése a hpotézstől belefér a véletle gadozásba. Ha a mtaátlag egy kokrét esetbe pl.,03kg, akkor 5%-os szgfkaca szte a ullhpotézs elutasítható, a mtaátlag eltérése már túl agy a feltételezett értéktől ahhoz, hogy azt a véletle számlájára lehesse ír, vagys szgfkása külöbözk kg-tól.,5%,5% 0,975 kg kg,05 kg 5. ábra 88

89 Mt említettük, em mdg egy előre meghatározott szgfkaca szte kíváuk döte, haem az a kérdés, hogy meyre agy bztosággal utasíthatjuk el a ullhpotézst. Eek eldötésére szolgál az emprkus szgfkaca szt, vagy p-érték, amely az a szgfkaca szt, ahol elfogadásból elutasításba váltuk. A példákál maradva, ha a mtaátlag értéke,05, azt a szgfkaca sztet keressük, amely mellett a krtkus értékek -0,05=0,975, lletve +0,05=,05. Ez azt jelet, hogy a 0,975 alatt és az,05 felett területek összege p. 0,975 P( x 0975) P( x,05) 0,05 p ( 0,998) 0,06,05 (,4) ( (,4)) p 0,05 A p-érték,6%. Ez alapjá mde,6%-ál agyobb szgfkaca szte elutasítjuk, ksebb szgfkaca szte már elfogadjuk a ullhpotézst. Mél ksebb a p-érték, aál agyobb bztosággal utasítható el a ullhpotézs. 5. Fogalmak hpotézs ullhpotézs próbafüggvéy szgfkaca szt egyoldal krtkus tartomáy krtkus érték másodfajú hba dötés erőssége hpotézsvzsgálat alteratív vagy ellehpotézs elfogadás és elutasítás tartomáy p-érték kétoldal krtkus tartomáy elsőfajú hba megbízhatóság szt 5.3 Elmélet kérdések. M a hpotézsvzsgálatok célja?. M a ullhpotézs és az alteratív (elle-)hpotézs, m a szerepük a hpotézsvzsgálat sorá, és hogya kell őket megfogalmaz? 3. M a próbafüggvéy és mre haszáljuk a hpotézsvzsgálat sorá? 4. Hogya jelölhetjük k az elfogadás és elutasítás tartomáyokat? M a krtkus érték? 5. Melyek a hpotézsvzsgálatok általáos lépése? 6. Mlye hbákat lehet elkövet a hpotézsvzsgálatok sorá? Ezek a hbák mlye kapcsolatba állak egymássak, hogya csökkethetőek? 89

90 6. Statsztka próbák Az egyes hpotézsvzsgálatok az 0 alfejezetbe leírt módo hajthatók végre, és mde hpotézsvzsgálat sorá a 5..5 alfejezetbe bemutatott és jellemzett első- és másodfajú hba követhető el. Az egy-egy kokrét hpotézsvzsgálat elvégzésére haszálható próbák a következő léyeges kérdésekbe külöbözek: a vzsgálat tárgyát képező H 0 hpotézsbe az alkalmazás feltételek tektetébe, az alkalmazott próbafüggvéybe és aak eloszlásába. Az egyes hpotézsvzsgálatok elvégzéséek előfeltétele, hogy redelkezésre álljo egy vagy több függetle, azoos eloszlású mta. Egyes hpotézsvzsgálatok elvégzéséhez emellett más feltételekre s szükség lehet. A függetle, azoos eloszlású (FAE) mtákhoz vagy végtele sokaságok véges számú, véletleszerűe realzálódó eleméek megfgyelésével, vagy véges sokaságokból törtéő vsszatevéses egyszerű véletle mtavétel útjá juthatuk. Ha a próba végrehajtásához egyél több mtára va szükség, akkor még aak kkötésére s szükség lehet, hogy mlye az egyes mták egymáshoz való vszoya (függetleek-e egymástól vagy sem). A próbák többféle szempot szert csoportosíthatóak: m a ullhpotézs tárgya: o paraméteres próba: a ullhpotézs a sokaság valamely paraméterére ráyul o emparaméteres próba: a ullhpotézs a sokaság eloszlására ráyul mlye jellegűek a sokaság eloszlásával szembe támasztott feltételek: o paraméteres próbák alkalmazás feltétele között szerepelek a sokaság eloszlásáak típusára és/vagy az egyes paraméterere voatkozó kíváalmak o a emparaméteres próbák alkalmazása legfeljebb a sokaság eloszlásáak folytoosságát követel meg háy és mekkora mta szükséges a végrehajtásukhoz: o a próba végrehajtásához szükséges mták száma alapjá egy-, két-, ll. többmtás próbákat külöböztetük meg o a mták egymáshoz való vszoya alapjá pedg függetle és páros mtákat o az géyelt mták agysága szert pedg ks-, ll. agymtás próbákat (a legtöbb szakrodalom 30-ba jelöl meg a ks és agy mták elemszáma között határt). E tárgyba a céluk, hogy bemutassuk a legfotosabb paraméteres és emparaméteres próbákat az elvégzésükhöz szükséges mták száma, típusa, és a ulhpotézs tárgya szert csoportosítva. 6. Nemparaméteres próbák Nemparaméteres próba: A hpotézsvzsgálatokak azo csoportját, ahol az eloszlás típusa em smert, és a H 0 hpotézs magára az eloszlásra voatkozk, emparaméteres próbákak evezzük. 90

91 6.. Illeszkedésvzsgálat -próbával Az olya statsztka próbát, amelyek alapjá arról dötük, hogy valamely valószíűség változó F (tapasztalat) eloszlása lehet-e adott F 0 (elmélet) eloszlásfüggvéyel jellemzett eloszlás, lleszkedésvzsgálatak evezzük. H 0 : F = F 0 H : F F 0 Ha a ullhpotézs az eloszlás paramétereek smeretét s feltételez, akkor tszta lleszkedésvzsgálatról beszélük. Ha vszot hpotézsük csak az eloszlás jellegét (ormaltás, expoecaltás stb.) tételez fel, és a paramétereket a mtából kell becsülük, akkor becsléses lleszkedésvzsgálatot végzük. Az lleszkedésvzsgálatra szolgáló próbák alkotják a emparaméteres próbák egyk agy csoportját. E próbák közül legelterjedtebb a -próba és a Kolmogorov-próba, m most csak az előbbvel kíváuk foglalkoz. A -próba md dszkrét, md folytoos eloszlások esetébe alkalmazható, de agy mtaelemszámot géyel. A próba segítségével azt tudjuk eldöte, hogy adott szgfkaca szte a tapasztalat gyakorságok szgfkása eltérek-e a feltételezett elmélet gyakorságoktól, avagy az eltérés csupá a véletle következméye. A -próbával törtéő lleszkedésvzsgálatál az ú. próbastatsztkát (a számított értéket) az alább képlet szolgáltatja: r f F F DF=r l ahol: DF: a szabadságfok, az eloszlás paramétere f : a tapasztalat gyakorság F : az elmélet gyakorság : a becsült paraméterek száma r: a kategórák vagy osztályok száma 9

92 6. ábra: A -próbá alapuló dötések elve a ullhpotézst lletőe A Yates-féle korrekcó: A korább fejezetekbe láttuk, hogy amkor dszkrét adatokra folytoos eloszlások eredméyet alkalmazzuk, bzoyos folytoosság korrekcókat alkalmazhatuk. Hasoló korrekcó létezk a -eloszlás alkalmazása eseté s. Ez a korrekcó r f F 0, 5 a fet egyelet alakú módosítását géyl. Általába csak DF= F szabadságfok eseté alkalmazzuk. Nagy mták eseté ugyas a korrekcóval gyakorlatlag ugyaahhoz az eredméyhez jutuk, mt korrekcó élkül, de a krtkus értékek körül boyodalmak léphetek fel. Ksebb mták eseté, amkor a várt gyakorságok 5 és 0 közé esek, legjobb, ha a -ek md a korrgált, md a korrgálatla értékét kszámoljuk. Ha egy adott hpotézst tektve mdkét érték alapjá ugyaarra a következtetésre jutuk, akkor rtká ütközük ehézségekbe. Ha egymásak elletmodó következtetésre jutuk, akkor próbálkozhatuk a mta övelésével, vagy más módszert alkalmazhatuk. Példa dszkrét eloszlás A Tszá egy adott dőszakba levouló árhullámok számát vzsgálva az elmúlt 68 év sorá az alább eredméyeket kapták: 30 év volt, amkor em volt árhullám, 5 olya év volt, amkor árhullám voult le az adott dőszakba, 9 év volt, amkor és 4 olya év volt, amkor 3 vagy több árhullám következett be. Feltehető-e, hogy a folyó levouló árhullámok száma modellezhető Posso-eloszlással? árhullámok száma 0 3 v. több gyakorság [db] =? em smerjük a mtából kell becsülük Posso-eloszlás eseté: M()= ( x -gal becsülhető) Mvel az elmúlt 68 év sorá a kérdéses dőszakba összese 55 árhullám volt: 55/68 0,8 Nullhpotézs felállítása: H 0 = az árhullámok száma =0,8 paraméterű Posso-eloszlású H : az árhullámok száma em =0,8 paraméterű Posso-eloszlású Mtavétel, adatok feldolgozása, krtkus érték meghatározása: Ha az árhullámok száma valóba 0,8 paraméterű Posso-eloszlással írható le, akkor aak valószíűsége, hogy az adott dőszakba em lesz árhullám (Posso-eloszlás táblázatából) 0, 4493, hogy árhullám voul le: 0,3595, hogy : 0,438, s hogy 3 vagy több (-ből levova az eddgek összege): 0,0474. Az elmélet gyakorságok ebből már automatkusa adódak, hsze ha 0,4493 valószíűséggel cs árhullám az adott dőszakba, akkor ez elméletleg 68 év sorá összese 680,4493 = 30,55 alkalommal következk be. Hasoló módo a több elmélet gyakorságot kszámolva az eredméyeket az alább táblázat tartalmazza: Spegel, Murray R.: Statsztka: Elmélet és gyakorlat, Paem McGraw-Hll, Budapest, 995 Rema J. Tóth J.: Valószíűségszámítás és matematka statsztka, Taköyvkadó, Budapest, 985 9

93 DF=r--=4--= =5% k f(k) p k F(k) , ,55 5 0,3595 4,45 9 0,438 9,78 3 v. több 4 0,0474 3, táblázatból: elm.=5,99 Számított érték meghatározása: sz 30 30,55 30,55 0,55 0,78 4,45 9,78 0,78 3, 0,7 A számított és a krtkus érték összehasolítása: elm.=5,99 >> sz=0,7 Dötés a ullhpotézsről: Mvel a számított érték jóval ksebb, mt a krtkus a számított érték az elfogadás tartomáyba esk, ezért 95%-os megbízhatóság szte cs okuk a H 0 -t elutasíta. A folyó levouló árhullámok száma modellezhető =0,8 paraméterű Posso-eloszlással. Példa folytoos eloszlás 3 A lég közlekedésbe fotos fgyelemmel kísér az utasok átlagos testsúlyát, hogy egyrészt e terheljék túl a gépet, másrészt e utazzo a gép fölös kapactással. Ezért dőről dőre elleőrzk, hogy a felőtt utasok testsúlya em tér-e el a feltételezettől. A légtársaság a terhelést a 78kg-os átlagos testsúlyra és kg-os szórásra tervez. A feltételezés elleőrzése céljából megmérték 00 véletleszerűe kválasztott utas súlyát, akk között 44 ő volt. A mérés eredméye látható a következő táblázatba. A mtából számított jellemzők: x = 78,6kg s =,87kg 5%-os szgfkaca szt mellett teszteljük, hogy az utasok testsúlya ormáls eloszlású változó! 3 Keresztély, T., Sugár, A., Szarvas, B. (005): Statsztka közgazdászokak, Példatár és feladatgyűjteméy, Nemzet Taköyvkadó, 76. o. 93

94 Testsúly (kg) Ügyfelek száma (fő) Összese 00 Hpotézsek felállítása: H 0 : Az alapsokaság (78,6;,87) paraméterekkel ormáls eloszlású. H : Az alapsokaság em (78,6;,87) paraméterekkel ormáls eloszlású. Az átlag és a szórás értékeket a mta értéke alapjá becsültük, ezért becsléses lleszkedésvzsgálatról beszélhetük. Mtavétel, adatok feldolgozása, számított érték meghatározása: A mta értéket osztályokba soroltuk. A számolás egyes lépéseél kapott értékeket a következő táblázatba foglaljuk össze. Az osztályok száma r = 6. Testsúly Ügyfelek száma P F ( f F ) (kg) (fő) - f F , ,455 0, ,746 7,46 0, ,305 30,5 0, ,86 8,6 0, ,344 3,44 0, , Összese 00 ~ ~00 A P valószíűség értékek meghatározása: 60 78,6 P P( 60) F(60) (,5) (,5) 0, ,06455, ,6 P P(60 70) F(70) F(60) 0,06455 ( 0,7) 0,06455,87 (0,7) 0,06455 ( 0,7648) 0, ,3885 0, , ,6 P3 P(70 80) F(80) F(70) 0,3885 (0,) 0,3885,87 0, ,3885 0, ,6 P4 P(80 90) F(90) F(80),87 0,8639 0, ,86 0, (0,94) 0,

95 00 78,6 P5 P(90 00) F(00) F(90) 0,8639 (,76) 0,8639,87 0, ,8639 0,344 P P(00 ) F(00) 0, ,04 6 Elmélet gyakorság értékek meghatározása (lásd táblázat): F P 00 0, ,455 F P 00 0, ,46 és így tovább. A számított érték meghatározása (lásd táblázat): ( f F ) (7 6,455) 0,09 F 6,455 ( f F F ) (6 7,46) 7,46 és így tovább. 0, Eze értékek összege adja a számított értéket, vagys a próbafüggvéy értékét a mta alapjá: χ sz = 0,3038 A krtkus érték meghatározása: DF = r l = 6 = 3 χ kr = 7,85 A számított és krtkus érték összehasolítása, dötés a ullhpotézsről: Mvel a számított érték ksebb, mt a krtkus érték, ezért elfogadjuk a H 0 hpotézst, azaz a vzsgált alapsokaság eloszlása ormálsak tekthető N(78,6;,87) paraméterekkel 5%-os szgfkaca szte. 6.. Homogetásvzsgálat -próbával Homogetásvzsgálat segítségével eldöthetjük, hogy két valószíűség változó azoos eloszlásúak tekthető-e. A közösek feltételezett eloszlásfüggvéy a próbába em szerepel, s aak jellegére voatkozóa semmlye kkötésük cs. H 0 = a valószíűség változó két sokaságo belül eloszlása azoos H = a valószíűség változó két sokaságo belül eloszlása em azoos A két sokaságból kvett mta agysága em kell, hogy azoos legye, de a vzsgált változó szert mdkét mtá belül azoos osztályokat kell képez. Dszkrét valószíűség változó eseté a próba közvetleül vagy csoportképzéssel elvégezhető, míg folytoos valószíűség változó eseté az adatokat osztályokba kell soroluk. 95

96 Kotgeca táblázat: a homogetásvzsgálathoz (és majd látjuk, hogy a függetleségvzsgálathoz s) célszerű az adatokat táblázatos formába redez. A táblázat elem részet cellákak evezzük, amelyek bal felső sarkába a tapasztalat, jobb alsó sarkába az elmélet gyakorságokat szokás feltütet. A sor, ll. oszlop szert összegzett gyakorságokat margáls vagy peremgyakorságokak evezzük. Az így összeállított táblázatot kotgeca-táblázatak evezzük. Osztály (r db) 8. Táblázat: Kotgeca táblázat - homogetásvzsgálat az egyk (Y) sokaságból kvett mta C Y C Y... C... C r Összese (oszlop peremgyakorság, f j) Gyakorságok mtába a másk (X) sokaságból kvett mta X X... Y X... Yr X r Y = f Y X = f X Y Összese (sor peremgyakorsága, f ) Y + X = f Y + X = f... + = f Y X... Y r + X r = f r + X =N A próbastatsztka: r j f j F F j j ahol: f f j Fj az elmélet gyakorság N r: a sorok száma f : -edk sor peremgyakorsága (sorösszege) f j : j-edk oszlop peremgyakorsága (oszlopösszege) N: mtaszám DF = (r ) (s ), ám mvel s= mde esetbe, így DF = r Példa A személysérüléssel járó közút balesetekre voatkozak az alább, mtavételből származó adatok 003-ba. Hasolítsuk össze a Budapeste és az ország több részé törtét balesetek dősávok szert eloszlását (α=%)! 96

97 A baleset deje a ap órá szert Balesetek száma Budapeste Összese Balesetek száma az ország több részé Hpotézsek felállítása: H 0 : F BP = G egyéb H : F BP G egyéb Mtavétel, adatok feldolgozása, krtkus érték meghatározása: =00 =00 N=300 r=5 DF=r =5 =4 =0,0 krt=3,77 Sor- és oszlopösszegek kszámítása: Sorösszegek: f =4; f =59; f 3 =53 stb.; az oszlopösszegek: f =00; f =00 Elmélet gyakorságok meghatározása: F = 400/300=3,67 F = 400/300=7,33 F = 5900/300=9,67 stb., Az eredméyeket az alább kotgeca táblázat mutatja: , Számított érték meghatározása: (4 3,67) (7 7,33) (4 5,67) (53 5,33) szám... 3,67 7,33 5,67 5,33 0, , , ,0077 0, 0,05 0, ,0033 0,065 0,0543 0,9656 A számított és a krtkus érték összehasolítása: szám=0,09656 < krt=3,77 Dötés a ullhpotézsről: A számított érték az elfogadás tartomáyba esk, ezért %-os szgfkaca szte a két sokaság eloszlásáak egyezését elfogadjuk. 97

98 6..3 Függetleségvzsgálat -próbával A függetleségvzsgálat aak a ullhpotézsek a vzsgálatára szolgál, hogy két mőség smérv valamely adott sokaságo belül függetle egymástól. Ezzel szembe az az alteratív hpotézs áll, hogy a két smérv em függetle egymástól, vagys a két smérv között sztochasztkus vagy függvéyszerű kapcsolatot eged meg. H 0 = a két valószíűség változó függetle egymástól (cs sztochasztkus kapcsolat) H = a két valószíűség em függetle egymástól (közöttük sztochaszkus vagy függvéykapcsolat va) Az a kérdés, hogy két valószíűség változó között va-e sztochasztkus kapcsolat vagy sem, kotgeca táblázat segítségével és -próba alkalmazásával döthető el. A -próbával törtéő függetleségvzsgálat valójába a dszkrét mősítéses ll. csoportosított (kategorzált) folytoos változók között kapcsolat vzsgálatára haszálható. Két (v. több) folytoos valószíűség változó között kapcsolat vzsgálata, ll. a kapcsolat jellegéek meghatározása a korrelácó és regresszóelemzés területe. A próba sorá hasolóa járuk el, mt a homogetásvzsgálatál, csak a kotgeca táblázat mérete változ(hat)k, em feltétleül két oszlopból áll (homogetásvzsgálatál mdg s= volt). Újabb külöbség bár a próba elvégzésébe em okoz eltérést, hogy a homogetásvzsgálatál értelemszerűe ugyaazt a valószíűség változót (pl. rózsa ára) hasolítottuk össze két mta alapjá, míg a függetleségvzsgálatál természetese két teljese külöböző változó között kapcsolatot vzsgáluk (pl. va-e összefüggés a szem és a haj szíe között, va-e kapcsolat a szülők skola végzettsége és a gyerekek skola végzettsége között stb.). Az X szert osztályok Y C X C f X C f X C r r 9. Táblázat: Kotgeca táblázat - függetleségvzsgálat Az Y szert osztályok Y Y C C Y C... f r f f f j f s f f j s f rj f j s j f f f rs f f f j f s A kotgeca táblázatba szereplő gyakorságok most egy elemű véletle mtából származak. A kotgeca táblázat egyes celláak elmélet gyakorságat a margáls értékek felhaszálásával becsüljük. A próbastatsztka: A szabadság fok: DF=(r-) (s-) r s j f j F F j j... f r 98

99 Az elmélet gyakorságok: F j f f j, N ahol s: az oszlopok száma, A több jelölés megegyezk a homogetásvzsgálatál bemutatottakkal. Mőség smérvek asszocácója A függetleség, vagy a kapcsolat léte és szorossága a mőség smérvek között asszocácóval és az asszocácós együtthatóval vzsgálható. Egy kotgeca táblához az r módo defálhatjuk a mőség smérvek (vagy N( q ) osztályozások) között Cramer-féle asszocácós együtthatót, ahol q=m(r,s). Cramer-féle asszocácós együttható: Két mőség smérv között kapcsolat szorosságát (asszocácót) mérő mutató. Az együttható 0 és között értékeket vesz fel. Mél közelebb esk az érték a 0-hoz, aál gyegébb, mél közelebb esk -hez, aál erősebb a függés a két eseméyredszer között. Példa Egy közvéleméykutatás sorá egyk gazdaság témájú TV-műsorról a következő kép alakult k a dplomások körébe: A ylatkozó A műsor megítélése összese foglalkozása jó megfelelő rossz közgazdász jogász egyéb dplomás összese Tesztelje 5%-os szgfkaca szte a foglalkozás jellege és a TV-műsor mősítése között kapcsolatot! Határozzuk meg az asszocácós együtthatót s, jellemezzük a kapcsolat szorosságát! Hpotézsek felállítása: H 0 : A foglalkozás jellege és a TV-műsor mősítése függetle egymástól. H : A foglalkozás jellege és a TV-műsor mősítése em függetle egymástól. Kotgeca-táblázat elkészítése: A ylatkozó A műsor megítélése összese foglalkozása jó megfelelő rossz közgazdász 00=f F =50 00=f F =60 00=f 3 F 3 = jogász 00=f F =75 60=f F =80 40=f 3 F 3 =45 00 egyéb dplomás 00=f 3 F 3 =75 60=f 3 F 3 =80 40=f 33 F 33 =45 00 összese Az elmélet gyakorság értékek meghatározása a peremgyakorságok segítségével ( összese cellák): 99

100 F 50 F 60 F F 75 F 80 F F 3 75 F 3 80 F Számított érték meghatározása: (00 50) (00 75) (00 60) (60 80) szám ,66 8,33 0 5, 0,55 55,53 szám Krtkus érték meghatározása: α=5% DF=(r-)(s-)=(3-)(3-)=4 9,488 krt (00 90) 90 (40 45) 45 Dötés a ullhpotézsről: Mvel a számított érték (55,53) agyobb, mt a krtkus érték (9,488), ezért 5%-os szgfkaca szte elutasítjuk a ullhpotézst, vagys a dploma jellege és a TV-műsor megítélése között va kapcsolat, em függetleek egymástól. Asszocácós együttható: =800 szám=55,53 r=s=3 q=3 r N( q ) 55,53 800(3 ) 0,86 A dploma típusa és a TV-műsor megítélése, mt két mőség smérv között gyege az asszocácós kapcsolat. 00

101 6. Nemparaméteres próbák összefoglalás Próba típusa 0. Táblázat: Nemparaméteres próbák összefoglaló jellemző Mták Alkalmazás száma feltétele egymtás agymtás H 0 : F = F 0 r f Hpotézsek Próbafüggvéy Próbafüggvéy eloszlása F H : F F 0 F DF=r kétmtás agymtás H 0 = a valószíűség változó két sokaságo belül eloszlása azoos H = a valószíűség változó két sokaságo belül eloszlása em azoos egymtás Illeszkedésvzsgálat Homogetásvzsgálat Függetleségvzsgálat (két mőség smérv függetlesége) A kotgeca táblázat méretétől függőe agy mta H 0 = a két valószíűség változó függetle egymástól (cs sztochasztkus kapcsolat) H = a két valószíűség em függetle egymástól (közöttük sztochaszkus vagy függvéykapcsola t va) r j r s j fj F j DF = r F j j F F j DF=(r-) (s-) f j DF= (r-) (s-) 6.3 Paraméteres próbák A hpotézsvzsgálatok bevezető fejezetbe elmodottak alapjá a paraméteres próbák szgorúbb alkalmazás feltételeket géyelek (például eleve feltételezk az adott elmélet eloszlás smeretét), ezért kevésbé széleskörűe alkalmazhatók. Általába aráyos, esetleg tervallum skáláról származó adatokkal dolgozhatuk velük, vszot erősségük (a hams ullhpotézs elutasításáak valószíűsége) agyobb, mt a emparaméteres próbáké. A paraméteres próbák végrehajtásáak általáos meete, ll. az elkövethető kétféle hba s (első-, másodfajú hba) azoos az előző fejezetbe tárgyaltakkal. Egy-egy kokrét hpotézsvzsgálat elvégzésére haszálható próbák csak a vzsgálat tárgyát képező ullhpotézsbe, az alkalmazás feltételekbe, a próbafüggvéybe és aak eloszlásába térek el egymástól, így a próbák elméletéek, sajátos logkájáak megsmerése utá gyakorlatlag bármlye hpotézsvzsgálatot el tuduk végez, csak az adott próba 0

102 alkalmazás feltételere kell kellő fgyelmet fordítauk. A továbbakba eek fgyelembevételével tárgyaljuk a paraméteres próbákat. E próbák közül elsősorba a mőségügy eljárásokba leggyakrabba alkalmazott, a ormáls eloszlás paraméterere voatkozó statsztka próbákat tektjük át. A próbákat többféle szempot szert csoportosíthatjuk. Elsősorba aszert, hogy mre voatkozk a ullhpotézs (szórásra, várható értékre), háy és mekkora mta szükséges a vzsgálathoz (egy-, két- ll. többmtás próbák) és két mtás esetbe mlye a mták között kapcsolat (függetle és páros próbák) Egymtás próbák Az egymtás próbák mdg egy adott sokaság valamely jellemzőjére voatkozó feltevések helyességéek elleőrzésére szolgálak. Eek érdekébe a redelkezésre álló egyetle mtából meghatározott jellemzőt (átlag, tapasztalat szórás) valamely feltételezett, vagy kíváatosak tartott állapothoz vszoyítjuk. Az egymtás próbák aak a kérdések a megválaszolására alkalmasak, hogy az a sokaság, amelyből a mta származk, lehet-e olya, mt amlyeek m azt a ullhpotézsbe feltételezzük. Két- és többmtás próbák esetébe ettől eltérő lesz a kérdésfeltevés a A sokaság szórásra voatkozó próba A sokaság eloszlásáak varacájára (szóráségyzetére) vagy szórására voatkozó H 0 : 0 A ullhpotézst egy- és kétoldal alteratívával szembe s vzsgálhatjuk. A próba ellehpotézse az alábbak lehetek: H H : 0 : 0 : 0 H A H 0 hpotézs helyességét csak azo alkalmazás feltétel mellett vzsgáljuk, hogy aak a sokaságak az eloszlása, amelyből a mta származk, ormáls. Ekkor, H 0 feállása eseté az alább próbafüggvéy - szabadságfokú -eloszlást követ: s * sz 0 ahol a sokaságból származó mta elemszáma, s * a mta korrgált tapasztalat szórása. 0

103 . Táblázat: Egymtás szórásra ráyuló próba szóráspróba egyoldal H 0 H 0 : 0 H H : 0 ( H : 0 Próbastatsztka Elfogadás tartomáy Feltételek sz ( ) sz ) H s * sz 0 kétoldal a sokaság ormaltása : 0 / sz / Példa 4 A kert törpék pacá az elmúlt évtzedekbe a törpék átlagos magassága 0 cm volt, ugyaakkor a szórás gadozott. A kszámítható alapayag ellátás feltétele, hogy a szórás e haladja meg a 0cm-t. Egy tavaly felmérés szert egy 5 elemű véletle mta szórása cm. A magasság ormáls eloszlása smert. Elleőrzzük 95%-os megbízhatósággal, cs-e veszélybe az alapayag ellátás? Hpotézsek felállítása: Számított érték meghatározása: Krtkus érték meghatározása: α=5% DF=4 36,45 sz H H s * 0 0 : 0 : ,56 Dötés a ullhpotézsről: Mvel a számított érték ksebb, mt a krtkus érték, így 5%-os szgfkaca szte elfogadható a ullhpotézs, vagys cs szgfkás eltérés a szórás tektetébe. Példa Nézzük smét az a példát, amely a lég közlekedésbe az utasok átlagos testsúlyára és a testsúly szórására voatkozóa élt feltételezésekkel (lásd lleszkedésvzsgálat, ahol a ormaltást már gazoltuk). Emlékeztetőül: A légtársaság a terhelést 78kg-os átlagos testsúlyra és kg-os szórásra tervez. 4 Kerékgyártóé, Gy., Mudruczó, Gy., Sugár, A. (00): Statsztka módszerek és alkalmazásuk a gazdaság, üzlet elemzésekbe, Aula Kadó, 363. o. 03

104 A feltételezés elleőrzése céljából megmérték 00 véletleszerűe kválasztott utas súlyát, akk között 44 ő volt. A mérés eredméye látható a következő táblázatba. A mtából számított jellemzők: x = 78,6kg s =,87kg 5%-os szgfkaca szt mellett most teszteljük az utasok testsúlyáak szórására voatkozó feltevést! Testsúly (kg) Ügyfelek száma (fő) Összese 00 Hpotézsek felállítása: Számított érték meghatározása: sz Krtkus érték meghatározása: α=5% DF=99 4,34 s * 0 H 0 : σ=kg H : σ>kg 99,87,5 Dötés a ullhpotézsről: Mvel a számított érték ksebb, mt a krtkus érték, így 5%-os szgfkaca szte elfogadjuk a ullhpotézst, azaz a sokaság szórásra voatkozó feltételezés elfogadható b A sokaság várható értékre ráyuló próbák Az alkalmazás feltételek függvéyébe többféle próbát haszálhatuk: egymtás z-próbát és egymtás t-próbát. Nullhpotézsük mdkét esetbe: H 0 : =m 0, vagys a várható érték egy adott m 0 értékkel egyelő. Szakma feltevésüktől függőe, mdkét próba eseté alkalmazhatuk egy- vagy kétoldal ellehpotézst. H : () m 0 () > m 0 (3) < m 0 Abba az esetbe, ha smerjük az alapsokaság szórást ( 0 ), vagy ha em smerjük, de agy mtával dolgozuk (>30 és a 0 -t a korrgált tapasztalat szórással becsüljük), egymtás z- 04

105 próbával, ha em smerjük az alapsokaság szórást, és ks mták va, akkor egymtás t- próbával vzsgálhatjuk a fet ullhpotézst. A két statsztka próbával kapcsolatos alapsmereteket az alább táblázat foglalja össze:. Táblázat: Egymtás várható értékre ráyuló próbák: egymtás z- és t-próba z-próba t-próba egyoldal kétoldal egyoldal kétoldal H 0 =m 0 H >m 0 (<m 0 ) m 0 Próbastatsztka >m 0 (<m 0 ) m 0 x x x t sz (DF=-) * s s z sz * 0 Elfogadás tartomáy z sz <z (z sz >-z ) z sz >-z / vagy z sz <z / Feltételek 0 smert v. >30 sokaság ormaltása t sz <t t sz >-t / vagy (t sz >-t ) t sz <t / sokaság ormaltása, 0 em smert v. 30 Egymtás z-próba E próba alkalmazásáak feltétele, hogy a hpotézsvzsgálat céljara redelkezésre álló véletle mta smert σ 0 varacájú ormáls eloszlásból származk. E feltétel mellett a x z sz 0 stadardzált mtaátlag a mta agyságára való tektet élkül N(0;) eloszlást (stadard ormáls eloszlást) követ. Példa Nézzük smét az a példát, amely a lég közlekedésbe az utasok átlagos testsúlyára voatkozóa élt feltételezésekkel (lásd lleszkedésvzsgálat, ahol a ormaltást már gazoltuk). Emlékeztetőül: A légtársaság a terhelést 78kg-os átlagos testsúlyra és kg-os szórásra tervez. A feltételezés elleőrzése céljából megmértek 00 véletleszerűe kválasztott utas súlyát, akk között 44 ő volt. A mérés eredméye látható a következő táblázatba. A mtából számított jellemzők: x = 78,6kg s =,87kg 5%-os szgfkaca szt mellett most teszteljük az utasok testsúlyáak várható értékére voatkozó feltevést! 05

106 Testsúly (kg) Ügyfelek száma (fő) Összese 00 Egymtás z-próbát végezhetük, mvel a mtaelemszám > 30 (a sokaság szórásra már jó becslést ad a korrgált tapasztalat szórás). Elvégzéséek feltétele a sokaság ormaltása, ezt már gazoltuk az lleszkedésvzsgálatál e példa eseté. Hpotézsek felállítása: Számított érték meghatározása: Krtkus érték meghatározása: α=5% z α =,64 z sz H 0 : μ=78 H 0 : μ>78 x 78,6 78,87 / ,49 Dötés a ullhpotézsről: Mvel a számított érték (0,49) ksebb, mt a krtkus érték, így a ullhpotézst elfogadjuk, azaz 5%-os szgfkaca szte elfogadható, hogy a sokaság várható érték 78kg. Megjegyzés: a próba elvégezhető kétoldal ellehpotézssel s, ekkor a két krtkus érték: ±,96, és mvel a számított érték így s az elfogadás tartomáyba esk, így a ullhpotézst így s elfogadjuk. Egymtás t-próba Ez a próba valamelyest eyhít az előző próba szgorúak számító alkalmazás feltétele, mvel em követel meg a sokaság eloszlás szórásáak smeretét, de a sokaság ormáls eloszlását továbbra s kköt. Ebbe az esetbe H 0 helyességéek elleőrzésére a következő próbafüggvéy haszálható fel: x t sz * s ahol s * a sokaságból származó mta korrgált tapasztalat szórása, vagys a stadardzált változó - szabadságfokú Studet-féle t-eloszlású. Másképpe fogalmazva, ameybe H 0 gaz, és a sokaság eloszlása ormáls, a próbafüggvéy (t sz ) - szabadságfokú Studet eloszlást követ. Erre alapozva a próba végrehajtásához szükséges krtkus értékek kereshetőek a Studet eloszlás táblázatából a szgfkaca szt és a szabadság fok smeretébe. 06

107 Szereték arra s emlékeztet, hogy az előző két statsztkát már korábba s haszáltuk, ugyas e statsztkák smeretébe adtuk tervallumbecslést a sokaság smeretle μ paraméterére. Példa 5 Egy kozervgyárba a sűrített paradcsom töltését automata gép végz. A dobozok évleges súlya 450g, amtől csak véletleszerű eltérések megegedettek. A súly szert eloszlás ormálsak tekthető. A gyár az egyk szállítmáyból 5 elemű mtát vett, a mtába a dobozok átlagos súlya 446g volt, a szórás pedg g. Elleőrzzük a évleges töltősúlyra voatkozó hpotézst 5%-os szgfkaca szte! Mvel a mtaelemszám ksebb, mt 30 és em smert a sokaság szórás, továbbá a súly szert eloszlás ormálsak tekthető, így a sokaság várható értékére voatkozó feltevésüket egymtás t-próbával végezhetjük el. Hpotézsek felállítása: H 0 : μ=450g H : μ<450g Számított érték meghatározása: x t sz,8 * s / 5 Krtkus érték meghatározása: α=5% DF=4 t α =-,7 Dötés a ullhpotézsről: Mvel a számított érték ksebb, mt a krtkus érték, így a ullhpotézst 5%-os szgfkaca szte elutasítjuk, azaz em fogadható el a évleges töltősúlyra voatkozó feltevés, a töltősúly szgfkása eltér 450g-tól. 5 Keresztély, T., Sugár, A., Szarvas, B. (005): Statsztka közgazdászokak, Példatár és feladatgyűjteméy, Nemzet Taköyvkadó, 70.o. 07

108 6.3..c Egymtás paraméteres próbák összefoglalás Teszteledő paraméter Sokaság várható érték Sokaság varaca (szórás) Alkalmazás feltételek Sokaság eloszlás ormáls sokaság szórás smert Sokaság eloszlás ormáls sokaság szórás em smert Sokaság eloszlás ormáls Hpotézsek Próbafüggvéy Próbafüggvéy eloszlása x stadard ormáls (z) H 0 : = m 0 H : () m 0 () > m 0 (3) < m 0 H 0 : = m 0 H : () m 0 () > m 0 (3) < m 0 H 0 : σ = σ 0 H : () σ σ 0 () σ > σ 0 (3) σ < σ 0 z sz 0 x s t sz * s * sz 0 Studet t- eloszlás (DF=-) χ -eloszlás (DF=-) 6.3. Kétmtás próbák A kétmtás próbák deértve a specáls páros mtás próbákat s aak a kérdések a vzsgálatára haszálhatók, hogy két meghatározott szempotból eltérő (pl. külöböző műszakok, gépek stb.) sokaságba a vzsgált paraméterek (várható értékek, szórások) s külöbözek-e egymástól. Míg tehát az egymtás próbák valamlye feltételezett, előírt értékhez vszoyítják az egyetle sokaságot, addg a kétmtás próbák két sokaság egymással való összehasolítására szolgálak 6. Az összehasolításra kerülő sokaságok dőbe, térbe, vagy bármlye más tektetbe külöbözhetek egymástól a A sokaság szórások összehasolítására ráyuló próba Szórásokra voatkozó próbákat szóráségyzetek segítségével végezhetük. A szóráségyzetekre voatkozó próbák a ormáls alapeloszlástól való eltérésre sokkal érzékeyebbek, mt az átlagpróbák. Általáos esetbe mvel a varacák azoossága a várható értékek összehasolítására leggyakrabba alkalmazott kétmtás t-próba feltétele a szórásokra voatkozó próbákat az átlagpróbák előtt célszerű elvégez. Két függetle, smeretle várható értékű és szórású, ormáls eloszlást követő valószíűség változó varacáak azoosságára voatkozó hpotézsük: H 0 : ú. F-próbával elleőrzhető. * s F sz, ahol s * * * >s s A számítást mdg úgy kell végezük, hogy a számlálóba a agyobb varaca szerepelje. 6 Scch, T.:Statstcs by Example, Delle Publshg Compay, Sa Frassco,

109 Az F próbát ly módo mdg egyoldal próbakét végezzük, vagys ellehpotézsük: H : >. (Megjegyezzük, hogy az F-próbát baloldal és kétoldal alteratíva eseté s elvégezhetjük, de ez most em témája jegyzetükek.) Táblázatak s egyoldal próbára voatkozak (mégpedg F, DF, DF, krtkus értéket adják meg). A két alapeloszlásból vett és elemű mták * s lletve becslése az alapeloszlás, lletve varacáak. * s korrgált varacá torzítatla Ha H 0 és a kdulás feltételek teljesülek, akkor az így képzett F érték az ú. Fsher- Sedecor féle F-eloszlást követ, amely a számláló (DF ) és a evező (DF ) szabadságfokától (DF, =, -) függ. Példa Egy fodrászatba férfak és ők egyarát járak. véletleszerűe kválasztott férf és 5 véletleszerűe kválasztott ő esetébe mérjük a szolgáltatás dőtartamát, amelyek eloszlása ormáls. A férfak esetébe a szolgáltatás géybevételéek átlagos deje 35 perc, 6 perc szórással. A ők esetébe a frzura elkészítéséek átlagos deje 48 perc, 30 perc szórással. Teszteljük 5%-os szgfkaca szte, hogy va-e külöbség a szolgáltatás dő szórása között a férfak és ők esetébe! Hpotézsek felállítása: H H 0 : ő férf : ő férf Számított érték meghatározása: F sz s s * ő * férf 30 6,33 Krtkus érték meghatározása: α=5% DF ő =5-=4=DF DF férf =-==DF F krt =,7 Dötés a ullhpotézsről: Mvel a számított érték (,33), ksebb, mt a krtkus érték (,7), így a ullhpotézst 5%-os szgfkaca szte cs joguk elutasíta, vagys a férfak és ők kszolgálás dejéek szórása között cs szgfkás külöbség. Példa 7 Két flm tetszés dexét hasolítja össze egy közvéleméykutató tézet. Az első flmre, a Leáyregéy címűre 04 elemű mtát vettek, ebből 40 ő volt. A potok átlaga 65, szórása 3,6 volt a mtába. A rém c. flmre 40 elemű mtát vettek, melybe a férfak száma 96 volt, a potok átlaga tt 74 volt, a szórás pedg 4,4. A potok ormáls eloszlása mdkét csoportba feltételezhető. 7 Juhász, Gy.-é, Sádoré, K. É. (998): Példatár A Statsztka távoktatással c. köyvhöz, Pézügy és Számvtel Főskola, 94.o. 09

110 Teszteljük %-os szgfkaca szte, hogy va-e külöbség a két flmre adott potok szórása között! Mvel a flmre adott potszámok ormaltása feltételezhető, így haszálhatjuk az F-próbát a sokaság szórások egyezőségéek a vzsgálatára. -es dexszel jelöljük a A rém c. flmet, - es dexszel Leáyregéy c. flmet. Hpotézsek felállítása: Számított érték meghatározása: Krtkus érték meghatározása: α=% DF =40-=39 DF =04-=03 F krt =,53 F sz H 0 : H : s s 4,4 3,6 * *,494 Dötés a ullhpotézsről: Mvel a számított érték (,494), ksebb, mt a krtkus érték (,53), így a ullhpotézst %-os szgfkaca szte cs joguk elutasíta, vagys a két flmre adott poszámok szórása között cs szgfkás külöbség b A sokaság várható értékek összehasolítására ráyuló próbák függetle mták esete A mta függetlesége azt jelet, hogy az egyk sokaságba egy elem mtába kerülése, ll. be em kerülése semmlye módo em befolyásolja a másk sokaságba az elemek mtába kerüléséek valószíűségét. Függetle mtás esetekbe a mtaelemszámok külöbözőek lehetek. A két sokaságból külö-külö és egymástól függetleül vett mta alapjá elleőrz kívájuk a H 0 : = (vagys a két sokaság várható érték egyelő) hpotézs helyességét. Az alkalmazás feltételek függvéyébe többféle próbát haszálhatuk: kétmtás z-próbát és kétmtás t-próbát. H 0 helyessége most s attól függőe más-más próbafüggvéy segítségével vzsgálható, hogy mlye formácókkal redelkezük a sokaságról. Szakma feltevésüktől függőe mdkét próba eseté alkalmazhatuk egy- vagy kétoldal ellehpotézst. H : () μ () > μ (3) < μ Abba az esetbe, ha smerjük az alapsokaság szórásokat ( és ), vagy ha em smerjük, de agy mtával dolgozuk ( >30 és >30, s az elmélet szórásokat a korrgált tapasztalat szórással becsüljük), kétmtás z-próbával, ha em smerjük az alapsokaság szórást, de feltehető a szórások egyezése, akkor kétmtás t-próbával vzsgálhatjuk a fet ullhpotézst. 0

111 Ha mdkét sokaság ormáls eloszlású, az elmélet szórásokat em smerjük, de a szórások külöbözek egymástól, akkor a kétmtás t-próba em alkalmazható, helyette a Welchpróbát haszálhatjuk. Szakma feltevésüktől függőe, mdhárom próba eseté alkalmazhatuk egy- vagy kétoldal ellehpotézst. Kétmtás z-próba Abból duluk k, hogy mdkét sokaság ormáls eloszlású és mdkét sokaság szórása smert. A próbafüggvéy x x z sz H 0 helyessége eseté stadard ormáls eloszlást N(0,) követ. Példa Nézzük smét az előző, két flm tetszés dexét összehasolító példákat. Most teszteljük azt %-os szgfkaca szte, hogy a va-e külöbség a két flm átlagos tetszés potszáma között! Emlékeztetőül: Az első flmre, a Leáyregéy címűre 04 elemű mtát vettek, ebből 40 ő volt. A potok átlaga 65, szórása 3,6 volt a mtába. A rém c. flmre 40 elemű mtát vettek, melybe a férfak száma 96 volt, a potok átlaga tt 74 volt, a szórás pedg 4,4. A potok ormáls eloszlása mdkét csoportba feltételezhető. Mvel mdkét flm esetébe a mtaelemszám agyobb, mt 30, továbbá feltételezhető a potok ormáls eloszlása, így kétmtás z-próbát haszálhatuk (-es dex A rém c. flm, - es dex a Leáyregéy c. flm). Hpotézsek felállítása: H 0 : = H : Számított érték meghatározása: x x z sz 6,4 4,4 3,6 0,3 Krtkus érték meghatározása: α=% z α/ =±,34 40 Dötés a ullhpotézsről: Mvel a számított érték em az elfogadás tartomáyba esk, így szgfkás külöbség va %-os szgfkaca szte a két flm tetszés dexe között. Kétmtás t-próba A két sokaság eloszlása továbbra s ormáls, de a szórások em smertek. Ez a feltételredszer közelebb áll a valósághoz. Ez ks mták eseté akkor kezelhető, ha az smeretle szórásokról tudjuk, hogy azok egyelőek. Ekkor a H 0 helyessége a következő próbafüggvéyel vzsgálható: 04

112 x x t sz, s p ahol * * ( ) s ( ) s s p a két sokaság egyforma varacájáak a két mta együttes felhaszálásával yert kombált becslése. A próbafüggvéy H 0 feállása és az alkalmazás feltételek teljesülése eseté DF= + - szabadságfokú t-eloszlást követ. Példa Korább fodrászatos példák (lásd sokaság szórások egyezésére ráyuló próba) vzsgáljuk meg, hogy va-e külöbség a kszolgálás dő szórása között a férfak és a ők esetébe 5%- os szgfkaca szte! ő =5 férf = x 48 s 30 ő ő x 35 s 6 férf férf A kétmtás t-próba alkalmazás feltétele: az alapsokaságok eloszlásáak ormaltása (evezetese a szolgáltatás dő eloszlása md a férfak, md a ők esetébe ormáls, ezt feltételeztük már az F-próba elvégzéséél s) ő és férf em smert és ő <30 és férf <30 ő = férf, ezt már bzoyítottuk F-próbával korábba Hpotézsek felállítása: Számított érték meghatározása: * ) ( ő ső s p t sz H 0 : ő = férf H : ő férf * ( férf ) s férf ő x ő s p x ő férf férf férf (5 )30 ( ) , ,96 80,44,85 Krtkus érték meghatározása: Az ellehpotézs kétoldal, így két krtkus érték meghatározására va szükség: α=5% DF=5+-=5 t 0,975 =±,06 Dötés a ullhpotézsről: Mvel a számított érték az elfogadás tartomáyba esk, így a H 0 hpotézst elfogadjuk, azaz 5%-os szgfkaca szte cs külöbség a férfak és a ők kszolgálás dejéek várható értéke között. Megjegyzés: A próba elvégezhető a következő ellehpotézssel s:

113 H 0 : ő = férf H : ő > férf Ehhez az ellehpotézshez tartozó krtkus érték: t 0,95 =,708 Mvel t sz =,85<,708, így a H 0 -t elfogadjuk, azaz cs külöbség a két várható érték között 5%-os szgfkaca szte. Példa 8 Egy gépről két külöböző apo lekerülő alkatrészekből mtát vettek, és az alkatrészek tömegére a következőket kapták: 0 x 50g s 0, 0g 5 x 49, 8g s 0, 05g Külöbözk-e a két apo gyártott alkatrészek tömegéek várható értéke 5%-os szgfkaca szte? Az alkatrészek tömegéek ormaltása feltételezhető. Mvel az alapsokaság szórások em smertek, és a mtaelemszám s ksebb, mt 30, így kétmtás t-próbával kell elleőrzük a ullhpotézs helyességét: H 0 : = H : Először F-próbát kell végezük. F-próba elvégzése Először F-próbával elleőrzzük azt a hpotézst, hogy a két mta azoos varacájú sokaságból származk. H 0 : σ =σ H : σ >σ Számított érték kszámítása: Krtkus érték kszámítása: α=5% DF =9 DF =4 F krt =,65 F sz 0,0 0,05,33 Dötés a ullhpotézsről: Mvel a számított érték (,33) ksebb, mt a krtkus érték (,65), így 5%-os szgfkaca szte a szórások egyezése elfogadható. Kétmtás t-próba Számított érték meghatározása: 8 Keméy, S., Papp, L., Deák, A. (999): Statsztka mőség-(megfelelőség-) szabályozás, Műszak Köyvkadó, Magyar Mőség Társaság, Budapest, 67.o. 3

114 s p Krtkus értékek meghatározása: α=5% DF=0+5-=3 t α/ =±,069 * * ( ) s ( ) s (0 )0,0 (5 )0, x x 50 49,8 t sz 3,7 s p 0,07 f 0 5 0,07 Dötés a ullhpotézsről: Mvel a számított érték kívül esk az elfogadás tartomáyo így a ullhpotézst, vagys a várható értékek egyezését, elutasítjuk, így a két ap között külöbség 5%-os szte szgfkás. Kétmtás várható értékre ráyuló próbák függetle mták eseté - összefoglalás 3. Táblázat: Kétmtás várható értékre ráyuló próbák: kétmtás z- és t-próba z-próba t-próba egyoldal kétoldal egyoldal kétoldal H 0 = H > ( < ) Próbastatsztka z sz x x > ( < ) x x t sz s p Elfogadás tartomáy Feltételek z sz <z z sz >-z / vagy (z sz >-z ) z sz <z / mdkét sokaság ormáls eloszlású, és smert v. és >30 t sz <t t sz >-t / vagy (t sz >-t ) t sz <t / mdkét sokaság ormáls eloszlású, és em smert v. és <30 = 6.3..c A sokaság várható értékek összehasolítására ráyuló próbák páros mták esete Az eddg tárgyalt kétmtás statsztka próbák alkalmazásáál fotos feltétel volt a mták függetlesége. Ez a feltétel a gyakorlatba legtöbbször teljesül, de vaak bzoyos specáls esetek, amkor a két mta eleme között va valamlye kapcsolat. Az ú. páros mták eseté a mtaelemek em függetleek egymástól, va beük valamlye közös téyező (pl. ugya az a mérőeszköz, ugya azt az alkatrészt, embert stb. vzsgáljuk). Páros mtákál tehát az egyk mta elemeek kválasztása maga utá voja a másk mta elemeek kválasztását, s így a két mta eleme em tekthetők egymástól függetleekek. A páros mták agysága egyforma. 4

115 Az lye páros (összefüggő) sokaságokba a két sokaság (s ebből következőe természetese a mta) eleme egymással kölcsöös és egyértelmű megfeleltetésbe hozhatók. A páros elevezés oa származk, hogy a két sokaság egymáshoz redelt egységeek összessége egy elempárokból álló, egyetle sokaságak s tekthető. Ha például két skola taulóak testsúlyát szereték összehasolíta, akkor csak eheze és mesterkélte képzelhető el a taulók párokba redezése, már csak a két skola létszámáak külöbsége matt s. Ugyaakkor, ha egy új fogyókúra eljárás hatékoyságát szereték értékel, akkor célszerű ugyaazo személyek testsúlyát megmér két dőpotba, a fogyókúra előtt és utá. Ebbe az esetbe aak megítélésére, hogy valóba csökket-e a fogyókúra utá a testsúly, már em véletleszerűe választuk a fogyókúrázók közül, az első mta eleme meghatározzák a másodk mtát s. Természetese az összefüggő sokaságokból s vehetük függetle mtákat, de ez általába em célszerű, mert így elveszítjük az elempárok egyekét összehasolításával yerhető formácót. A páros mtákat általába oly módo kezeljük, hogy egymásak megfeleltethető elemek külöbségét (vagy háyadosát képezzük), majd a továbbakba e külöbségeket (vagy háyadosokat) már egyetle mta elemeek tektjük. Ha képezzük a két páros mta összetartozó elemeek d =y -x külöbséget, és tektsük e külöbségeket a továbbakba egy elemű mta elemeek. Ez léyegébe aak hallgatólagos feltételezése, hogy az a sokaság, amelyből e mta származk, bzoyos elempárok összessége. A páros mták összetartozó eleme között külöbségek vzsgálata útjá legtöbbször arra keressük a választ, hogy az elempárok tagja által kapott eltérő kezelések va-e valamlye hatása. A próbához kapcsolódó ullhpotézs: H 0 : μ =μ vagy H 0 : μ d =δ 0 (μ d tt az elempárokhoz tartozó külöbségek feltétezett várható értékét jelet, a δ 0 érték em csak 0 lehet, haem egy adott külöbség meglétét s vzsgálhatjuk.) A ullhpotézs helyessége a megfelelő bal-, két- vagy jobb oldal alteratív hpotézssel szembe vzsgálható. Képezve tehát párokét a külöbségeket (d ), majd a külöbségek átlagát ( d d ) és ( d d ) korrgált tapasztalat szórását ( sd ), a ullhpotézsüket, vagys a két várható érték egyezését az alább próbastatsztkával vzsgálhatjuk (ha <30, és a sokaság szórások em smertek): d tsz sd Ha H 0 gaz, t sz értéke DF=- szabadságfokú t-eloszlást követ. 5

116 Példa Egy specáls déta hatásosságát vzsgálják. Ehhez mde vzsgálat személy testsúlyát megmérték a déta előtt és utá. A hpotetkus kísérlet eredméye 9 kísérlet személye a következő táblázatba látható. A vzsgált személy sorszáma Testsúly a déta előtt Testsúly a déta utá Vzsgáljuk meg %-os szgfkaca szte, hogy hatásos volt-e a déta! Páros mtáról va szó, hsze ugyaazo détába résztvevő személyek testsúlyát mérték meg a déta megkezdése előtt és utá. A déta megkezdése előtt a 9 résztvevő testsúlyáak átlaga: x e 9,44 9 A déta utá a 9 résztvevő testsúlyáak átlaga: x u 86,88 9 Hpotézsek felállítása: H 0 : μ e =μ u H : μ e >μ u Számított érték meghatározása: Először képezük kell a külöbségeket párokét, majd azok átlagát és szórását kell kszámoluk. A vzsgált személy sorszáma Testsúly a déta előtt Testsúly a déta utá d d d ,56 9 6

117 s t d sz ( d d ) (5 4,56) (3 4,56)... (6 4,56) 8 d 4,56 4,547 s d 9,05 / 9 9,05 Krtkus érték meghatározása: α=% t α =,896 Dötés a ullhpotézsről: Mvel a számított érték (4,547) agyobb, mt a krtkus érték (,896), így a ullhpotézst elutasítjuk, vagys va szgfkás külöbség a pácesek testsúlyába a déta előtt és utá, így a déta hatásosak tekthető d Kétmtás paraméteres próbák összefoglalás Teszteledő paraméter Sokaság várható érték Alkalmazás feltételek mdkét sokaság ormáls eloszlású, és smert v. és >30, a mták függetleek mdkét sokaság ormáls eloszlású, és em smert v. és <30 =, a mták függetleek Hpotézsek Próbafüggvéy Próbafüggvéy eloszlása x x stadard ormáls (z) H 0 : = H : () () > (3) < H 0 : = H : () () > (3) < s p z sz x x t sz, s p ( ) s ahol * ( ) s * Studet t- eloszlás (DF= + -) Sokaság varaca (szórás) a sokaság ormáls eloszlású, páros mta Mdkét sokaság eloszlás ormáls H 0 : = (H 0 : μ d =δ 0 ) H : () (μ d δ 0 ) () > (μ d > δ 0 ) (3) < (μ d < δ 0 ) * H 0 : H : * s t sz d sd s * * F sz, ahol s > s Studet t- eloszlás (DF=-) F-eloszlás (DF = -; DF = -) 7

118 6.3.3 Több függetle mtás próbák A több függetle mtás próbák kettőél több sokaság bzoyos paramétereek vagy eloszlásáak összehasolítására szolgálak. A többmtás próbák a kétmtás próbákhoz hasolóa aak a kérdések a vzsgálatára haszálhatók, hogy több meghatározott szempotból eltérő (pl. külöböző műszakok, gépek stb.) sokaságba a vzsgált paraméterek (várható értékek, szórások) s külöbözek-e egymástól. A többmtás próbák kettőél több sokaság egymással való összehasolítására szolgálak a Több sokaság varaca egyelőségéek voatkozó próbák 30 Az F-próbát csak abba az esetbe alkalmazzuk, ha két mta szórását hasolítjuk össze. Ha több ormáls eloszlásból származó mtát kell összehasolítauk, akkor haszálhatjuk a Cochra-próbát. H 0 :... H : em mde varaca egyelő A Cochra-próba segítségével azt döthetjük el, hogy a szórások között talált legagyobb érték tekthető-e a többvel azoos eloszlásból származóak. A Cochra-próbát akkor alkalmazhatjuk, ha az alapeloszlás ormáls és a mták md azoos darabszámúak. A közös mtadarabszámot most -el jelöljük (a szabadságfok DF=-), az r darab külöböző mta korrgált tapasztalat szóráségyzetét pedg s *, s *, s * r tel. A próbastatsztka: smax g sz, s s... sr ahol smax s max * az összehasolíta kívát sokaságokból vett mták korrgált tapasztalat szóráségyzete közül a legagyobb. A ullhpotézsről való dötéshez a Képletgyűjteméy Cochra-próbához kapcsolódó táblázata szükségesek, amelyekkel meghatározható egy adott szgfkaca szthez szükséges krtkus érték. A kértékeléshez szükséges táblázatok segítségével a már smert módo eldöthetjük, hogy a legagyobb szórás jeletős mértékbe külöbözk-e a többtől. Ha a számított érték (g sz ) ksebb, mt a krtkus érték, akkor elfogadjuk a H 0 hpotézst, ellekező esetbe pedg elutasítjuk, vagys em tekthetjük az összes alapsokaságot egyelő szórásúak. Ilyekor vagy teljese elejtjük a homogetásra voatkozó feltevésüket, vagy pedg csak ezt a kugró szórással redelkező mtát (vagy ha több mta szórása lépte át a szgfkaca-határt, mdegyk lyet) kzárjuk a sokaságból és megvzsgáljuk, hogy a megmaradó sokaságra eredet feltevésük fetartható-e. Ezt tehát semm esetre sem tekthetjük természetesek, haem a megmaradó sokaságra meg kell smételük a Cochra-próbát, azaz g sz értékét a megmaradó adatokból újra k kell számíta és r új értékéek fgyelembevételével összevet az ábrával. A megmaradó sokaságot a szórás szempotjából homogéek csak akkor tekthetjük, ha az utoljára végzett Cochra-próba em szgfkás eredméyt mutat. 9 Scch, T.:Statstcs by Example, Delle Publshg Compay, Sa Frassco, Köves J.: Kvattatív módszerek, Oktatás segédayag, BME MBA Mérökökek program, Budapest, 998 8

119 Példa Egy áruházlácál megvzsgálták, hogy 3 boltjukba azoos-e az egy vásárlásál fzetett összeg. Mde boltba kválasztottak 6 véletle mtát. A vásárláskor fzetett összegeket az alább táblázat mutatja (dollárba):. bolt. bolt 3. bolt,05 5,7 9,48 3,94 8,5 6,9 4,63 9,57 0,47 5,78,4 7,63 7,5 3,59,90 8,45 0,57 5,9 Feltételezve, hogy a kfzetések ormáls eloszlásúak, va-e külöbség a szórás tektetébe a 3 üzlet között 5%-os szgfkaca szte? Hpotézsek felállítása: H 0 : 3 H : em mde varaca egyelő Számított érték meghatározása: Ehhez először k kell számítauk mdhárom üzlet esetébe a mták számta átlagát és korrgált tapasztalat szórását. x 8,73 (,05 8,73) (3,94 8,73)... (8,45 8,73) s 5 7, 96 x 8,4 (5,7 8,4) (8,5 8,4)... (0,57 8,4) s 5 9, 65 x 8,7 (9,48 8,7) (6,9 8,7)... (5,9 8,7) 5, 3 s 3 5 smax 7,96 g sz 0,653 s s... s 7,96 9,65 5, Krtkus érték meghatározása: α=5% =6 (egy-egy mta azoos elemszáma) DF=-=6-=5 r=3 (a mták száma) Cochra-táblázatból a krtkus érték: g krt =0,73 r Dötés a ullhpotézsről: Mvel a számított érték (0,653) ksebb, mt a krtkus érték (0,73), a ullhpotézst elfogadjuk 5%-os szgfkaca szte, azaz a sokaság szórások egyezése feltételezhető. 9

120 6.3.3.b Több sokaság várható értékéek az összehasolítása varacaaalízs A varacaaalízs evével elletétbe a vzsgált sokaságok (r db) várható értékéek az összehasolítására szolgál. H 0 :... r H : bármely két várható érték em egyelő egymással A próba végrehajtásáak előfeltétele, hogy ebbe az esetbe s mde sokaságból külökülö, függetleül egyszerű véletle mtákat veszük, mde sokaságról feltételezhető a vzsgált smérv szert ormáls eloszlása, és a sokaság szórások egyezősége (lásd előző Cochra próba). Feldézve a 3. Részekre botott sokaság vzsgálata c. fejezetbe taultakat, a ullhpotézs feállása azt jelet, hogy cs kapcsolat az X meység smérv és a sokaságokat megkülöböztető mőség smérv között. H feállása ezzel szembe azt jelet, hogy va kapcsolat az adott két smérv között. Ugyas arról va szó, hogy a ullhpotézsbe emcsak az r darab sokaság átlag egyelőségét feltételezhetjük, haem azt s, hogy ezek mdegyke megegyezk az r sokaság összevoása utá számolt főátlaggal. Ha a problémát úgy fogjuk fel, hogy egy sokaságot egy kategóraképző mőség smérv változata szert részsokaságra botuk, és vzsgáljuk, hogy egy X meység smérv szert megegyezek-e az átlagok, akkor ez a próba a vegyes kapcsolat teszteléséek s tekthető, a ullhpotézs elfogadás eseté a mőség smérv em befolyásolja a meység smérv alakulását, a két smérv függetle egymástól. Ezért ez a módszer s a 3. fejezetbe megsmert szóráségyzet-felbotás módszerére épül, és varacaaalízsek szokás evez. A próba elvégzéséhez mdeekelőtt (természetese a csoportok átlagáak és szórásáak meghatározása utá, amelyek már a szórások egyezéséek vzsgálatához s szükségesek) képezzük az összes megfgyelés számta átlagát ( x ), am megegyezk a mtaátlagokak ( x r r ) a mta elemszámával súlyozott számta közepével: x xj x j Ahol: az -edk mta elemszáma, az összes mta elemszáma = r. Ezek utá képezzük az összes mért értékek (x j ) az összes adat átlagától ( x ) való eltéréséek r a égyzetösszegét az ú teljes égyzetösszeget: x x összegére botható. r Az egyk az ú. csoportok között x x j j, amely két égyzetösszeg égyzetösszeg, amely a csoportok közt r eltéréseket magyarázza, mér, a másk a csoportoko belül x x j amely a csoportoko belül eltéréseket, a véletle hatásokat mutatja 3. j égyzetösszeg, A 3. Rész- és fősokaságok varacája és szórása című fejezetbe láttuk, hogy ha egy heterogé sokaságot részekre botuk, akkor az eltéréségyzet-összegek között az alább összefüggés áll fe: 3 Lukács O.: Matematka statsztka, Példatár, Műszak Köyvkadó, Budapest, 987 0

121 r j r r x x x x x x j SST=SSK+SSB j Emlékeztetőül: ez az azoosság azt fejez k, hogy az átlagtól vett teljes eltéréségyzet-összeg (SST) két részre botható: A külső eltéréségyzet-összeg (SSK) azt a részt mutatja, amelyet az egyes részsokaságba számított átlagok eltérése magyarázak, azaz ez a csoportosítás hatása a szóródásra. Értékét az SST-hez vszoyítva kaptuk a H mérőszámot, amt szté a 3. fejezetbe smertük meg. A belső eltéréségyzet-összeg (SSB), amelyek a agyságát a csoportosító smérve kívül, egyéb téyezők magyarázak. Ez a szóródásak az a része, amt a csoportosító smérv em magyaráz. A varacaaalízs éppe arra keres a választ, hogy a csoportosító smérvek köszöhető eltéréségyzet-összeg (SSK) szgfkás agyságredű-e. Ha H 0 gaz, s a kdulás feltételek s teljesülek, akkor bzoyítható, hogy a csoporto belül égyzetösszeg -eloszlású -r szabadságfokkal, s a csoportok között égyzetösszeg függetle a csoporto belül égyzetösszegtől, és szté -eloszlású r- szabadságfokkal. Ha ez gaz, akkor a égyzetösszegek és a megfelelő szabadságfokok háyadosából képzett ú külső (s k ), ll. belső (s b ) szóráségyzetek egymástól függetleek, s a közös várható értékük az smeretle, de egyelő alapsokaság szórás: E(s k )=E(s b )=. A két szórás egyezéséek vzsgálatával így elleőrzhetjük eredet hpotézsüket, a várható értékek azoosságát. Két szórás összehasolítására a korábba megsmert F-próba haszálható, képezve az F=s k /s b statsztkát, amely H 0 feállása eseté (r-, -r) paraméterű F-eloszlású 3. A képzett próbafüggvéy: F sz r r j x x /( r ) SSB /( r) x x /( r) j j SSK /( r ) Mt látható, ebbe az esetbe a számláló, és így a próbafüggvéy 0 értéke szól a ullhpotézs teljesülése mellett legkább, hsze ez azt jelet, hogy mde részátlag potosa megegyezk egymással. Mél agyobb a számláló értéke (és ezzel párhuzamosa csökke a evezőé), aál kább eltérek a részátlagok egymástól. A hpotézsvzsgálat feladata ezúttal s az, hogy meghatározza azt a krtkus értéket, amely felett a részátlagok eltérése már em tekthető véletle gadozásak. Az eddgek alapjá a varacaaalízs s egy csak jobboldal krtkus értékkel végrehajtható próba. A szgfkaca szt és a fetekbe defált szabadság fokok smeretébe a krtkus érték az F-eloszlás táblázatából meghatározható. A varacaaalízs eredméyeek összefoglalására gyakra alkalmazzák az ú. szórásfelbotó táblázatot, amt a varacaaalízs agol evéek rövdítéséből ANOVA tábláak s szokás evez. Az egyszeres osztályozású varacaaalízs ANOVA táblájáak felépítését mutatja a következő táblázat: 3 Lukács O.: Matematka statsztka, Példatár, Műszak Köyvkadó, Budapest, 987

122 Négyzetösszeg eve Csoportok között * 4. Táblázat: ANOVA tábla Négyzetösszegek Szabadságfok Szórás becslése r r- s k x x F érték s k /s b p-érték p Csoporto belül ** r xj x -r s b j r Teljes x x j j Példa Nézzük smét a Cochra-próbáál bemutatott példát. Egy áruházlácál megvzsgálták, hogy 3 boltjukba azoos-e az egy vásárlásál fzetett összeg. Mde boltba kválasztottak 6 véletle mtát. A vásárláskor fzetett összegeket az alább táblázat mutatja (dollárba):. bolt. bolt 3. bolt,05 5,7 9,48 3,94 8,5 6,9 4,63 9,57 0,47 5,78,4 7,63 7,5 3,59,90 8,45 0,57 5,9 Feltételezve, hogy a kfzetések ormáls eloszlásúak, va-e külöbség az eladások várható értékeek tektetébe a 3 üzlet között 5%-os szgfkaca szte? A varacaaalízs alkalmazás feltétele között szerepel a sokaság szórások egyezése, ezt már gazoltuk Cochra-próbával, továbbá feltételeztük az értékesítések értékéek ormaltását. Hpotézsek felállítása: H 0 : 3 H : bármely két várható érték em egyelő egymással Számított érték meghatározása: = = 3 =6 r=3 Az átlagok boltokét ( x ) : 73 x 8, 4 x 8, 7 3 Az összes adat átlaga (x) : $5, SSK r x x 6(8,735,) 6(8,4 5,) 6(8,7 5,) 378, 6 Az SSB számításáak leegyszerűsítéséhez vegyük elő azokat a korrgált tapasztalat szórásokat, amelyeket a Cochra-próbáál már kszámítottuk:

123 (,05 8,73) (3,94 8,73)... (8,45 8,73) s 7,96 5 (5,7 8,4) (8,5 8,4)... (0,57 8,4) s 9,65 5 (9,48 8,7) (6,9 8,7)... (5,9 8,7) s 3 5, 5 E korrgált tapasztalat szóráségyzetek számlálójába szereplő eltéréségyzet-összegek r összege adja a keresett SSB belső eltéréségyzet-összeget: x x SSB 7,965 9,655 5, 5 4,05 SST SSB SSK 4,05 378,4 59,45 A számításokat elvégezve, az ANOVA tábla: j Négyzetösszegeságfok becslése Szabad- Szórás F érték p érték Csoportok között 378,4 r-=3-= 89, 3,3 0,0005 Csoporto belül 4,05 -r=8-3=5 4,3 - - Teljes 59, j F sz r r j x x j x x /( r ) /( r) Krtkus érték meghatározása: =0,05 A számláló szabadságfoka (DF ) = A evező szabadságfoka (DF ) = 5 A krtkus érték: F kr =3,68 SSK /( r ) SSB /( r) 378,4 / 04,05/5 89, 3,3 4,3 Dötés a ullhpotézsrről: Mvel F sz >>F kr, a ullhpotézst 5%-os szgfkaca szte elutasítjuk, azaz az átlagok, ll. legalább egy átlag szgfkása külöbözk a többtől. Esetükbe ez értelemszerűe a 3. bolt, ahol az egy vásárlásál kfzetett összeg agysága átlagosa kevesebb, mt a fele a másk két bolt átlagáál. 3

124 6.4 Fogalmak emparaméteres próba lleszkedésvzsgálat homogetásvzsgálat Cramer-féle asszocácós együttható egymtás z-próba egymtás szóráspróba F-próba páros mta kétmtás z-próba Cochra-próba ANOVA-tábla paraméteres próba kotgeca táblázat függetleségvzsgálat egymtás próba egymtás t-próba kétmtás próba függetle mta kétmtás t-próba többmtás próbák varacaaalízs 6.5 Típusfeladatok 6.5. Feladat Egy par parkba az elmúlt 70 évbe az évete bekövetkező áramkmaradások gyakorsága az alább táblázat szert alakult. Áramkmaradások száma (évete): él több Évek száma: %-os szgfkaca szte elfogadható-e az a feltételezés, hogy az áramkmaradások száma Posso-eloszlású valószíűség változó? Megoldás: A megoldás meete: Tudjuk, hogy a ullhpotézs teljesülése eseté az áramkmaradások éves száma Posso-eloszlású valószíűség változóak tekthető. A mtából becslést aduk az eloszlás λ paraméterére. Meghatározzuk, hogy az áramkmaradások száma a feladatba megadott értékeket mekkora valószíűséggel vesz fel. Kszámítjuk az áramkmaradások számáak elmélet gyakorságat. Az elmélet és tapasztalat gyakorságok smeretébe a kh-égyzet próba alkalmazásával lleszkedésvzsgálatot hajtuk végre. Jelölje ξ az áramkmaradások éves számát, mt valószíűség változót. Ha a ullhpotézs teljesül, akkor a ξ λ paraméterű Posso-eloszlású. A λ paraméter (maxmum lkelhood) becslése a mtaátlag: , 70 Hpotézsek felállítása: A feladat szövege alapjá a következő hpotézsek fogalmazhatók meg: H 0 : az áramkmaradások éves száma Posso-eloszlást követ, paraméterrel H : az áramkmaradások éves száma em, paraméterrel követ Posso-eloszlást 4

125 A feltételezett eloszlás (Posso-eloszlás) λ paramétere em smert, ezért becsléses lleszkedésvzsgálatot hajtuk végre. Az elmélet gyakorságok meghatározásához a következő valószíűségeket kell kszámítauk (de kereshetőek a Posso eloszlás táblázatából): k pk P( k) e ( k 0,...,7) k! p P( 7) P( 7) 7 7 p k k0 A valószíűségek smeretébe az F k elmélet gyakorságok az Fk Npk összefüggés alapjá számíthatók, ahol N=70 a mta elemszáma. A következő táblázat a próba végrehajtásához szükséges tapasztalat és kszámított elmélet gyakorságokat tartalmazza. k f k 0 6 0,08 7, ,438 7, ,68 8, ,966 3, ,08 7, ,0476 3, ,074,4 7 0,0055 0, él több 0 0,000 0,384 p k F k r=9 sz r f F 6 7, ,384 F 7, ,384 4,457 Krtkus érték meghatározása: A szabadságfok: DF = r-l- = 9-- = 7 (r=9, l=, mert paramétert becsültük.) α=5% 4,067 krt 0,05 Dötés a ullhpotézsről: Mvel a számított érték ksebb, mt a krtkus érték, így a ullhpotézst elfogadjuk, azaz 5%- os szgfkaca szte elfogadható, hogy az áramkmaradások száma λ=, paraméterrel Posso eloszlást követ. 5

126 6.5. Feladat Egy fapar üzembe a méretre gyártott asztallapok vastagságát vzsgálták. 00 asztallap vastagságát megmérve az adatokat az alább táblázatba rögzítették. 5%-os szgfkaca szte elfogadható-e az a feltételezés, hogy az asztallapok vastagsága ormáls eloszlású valószíűség változó 50,mm várható értékkel és,3mm szórással? Megoldás: Hpotézsek felállítása: A feladat szövege alapjá a következő hpotézsek fogalmazhatók meg. H 0 : az asztallapok vastagsága 50,mm várható értékű,,3mm szórású ormáls eloszlást követ H : az asztallapok vastagsága em 50,mm várható értékű,,3mm szórású ormáls eloszlást követ Mvel smertek a feltételezett eloszlás elmélet paramétere, ezért tszta lleszkedésvzsgálatot hajtuk végre. Számított érték meghatározása: A feladat megoldásához meg kell határozuk az asztallap vastagságáak a megadott kategórákba esés elmélet gyakorságat. A ullhpotézs teljesülése eseté az asztallap vastagság megadott kategórákba esés valószíűséget a μ=50,mm,σ=,3mm paraméterű ormáls eloszlásfüggvéy segítségével számíthatjuk k. E valószíűségek smeretébe a megadott kategórákba esés elmélet gyakorságok kszámíthatóak. A megadott kategórákba esés valószíűségek meghatározása: p p p p 3 4 P( 47)? P(47 49)? P(49 5)? P(5 53)? Asztallap vastagsága (d) (mm) Asztallap vastagsága (d) (mm) d < d < d < 5 5 d < d Asztallapok száma (darab) d < d < d < d < d 5 p5 P(53 )? A μ=50,mm, σ=,3mm paraméterű ormáls eloszlás helyett a stadard ormáls eloszlásfüggvéyel számoluk. 6

127 p p 47 50, P( 47),3 p 3 p 4 0,93,465 0,654 0,993 0,9844 0,7308 0,534 p 5,465, , 47 50, P(47 49),3,3 0,80 0,993 0,7 5 50, 49 50, P(49 5),3,3 0,7308 0,780 0, , 5 50, P(5 53),3, , P(53 ) P( 53),3 0,993 0,007 0,93,465 0,654 0,993,538 0,654 A p valószíűségek smeretébe az F elmélet gyakorságok az meghatározhatóak, ahol N=00.,538 0,9844 0, 056 F Np összefüggéssel Asztallap vastagsága (d) (mm) f d < ,007, d < ,7 34,33 49 d < ,558 0,573 5 d < ,534 50, d 5 0,056 3,5 p F Megjegyzés: p r=5 sz r 5 f F 3, ,5 F, ,5 4,493 A krtkus érték meghatározása: A szabadságfok: DF = r-l- = 5-0- = 4 (l=0, mert em becsültük egyetle paramétert sem) 0,05 krt 0,05 9,488 Dötés a ullhpotézsről: Mvel a számított érték ksebb, mt a krtkus érték, ezért a ullhpotézst elfogadjuk, azaz 5%-os szgfkaca szte elfogadható az a feltételezés, hogy az asztallapok vastagsága ormáls eloszlású valószíűség változó 50,mm várható értékkel és,3mm szórással. 7

128 6.5.3 Feladat A csokoládé, a vaíla és az eper-fagylaltok rát preferecát vzsgálták ksskolások körébe. 4 korcsoportba, összese 89 ksskolástól kérdezték meg, hogy melyk fagylaltok kedvel a legkább. A felmérés eredméyét a következő táblázat összegz:. osztály. osztály 3. osztály 4. osztály Csokoládé Vaíla Eper %-os szgfkaca szte elfogadható-e az a feltételezés, hogy a fagylaltok rát prefereca függetle a ksskolás korától? Megoldás: Hpotézsek meghatározása: H 0 : a fagylalt íze és a korcsoport függetle egymástól H : a fagylalt íze és a korcsoport em függetle egymástól Krtkus érték meghatározása: r=3; s=4; DF=(r-)(s-)=(3-)(4-)=6; =5%,59 krtkus 0,05 Számított érték meghatározása: Csokoládé Vaíla Eper. osztály. osztály 3. osztály 4. osztály f f f 3 f 4 f f f 3 f f j Fj N F = 48*50/89 = 5,606 F = 44*50/89 = 7,6 F 34 =97*9/89=9,734 sz r s fj Fj 6 5,606 9, j F j 5,606 9,734,809 Dötés a ullhpotézsről: χ sz χ 0,05 =>a ullhpotézs elfogadható, a fagylaltok rát prefereca függetle a ksskolás korától. 8

129 6.5.4 Feladat Egy fémpar üzembe a 300mm évleges átmérőjű tárcsákat az A és B jelű műszakokba gyártják. A két műszakba gyártott tárcsák átmérőjéek hosszára voatkozóa elvégzett mérések eredméyet az alább táblázat összegz. (A gyártott tárcsák átmérőjéek hossza ormáls eloszlású valószíűség változóak tekthető.) "A" műszak "B" műszak Mta elemszáma 0 Mtából számított átlag (mm) 300, 99,6 Tapasztalat szóráségyzet 0,8944 0,7745 5%-os szgfkaca szte elfogadható-e az az állítás, hogy az A műszakba gyártott tárcsák átmérőjéek várható értéke agyobb, mt a B műszakba gyártottaké? Megoldás: A megoldás meete: Két ormáls eloszlású valószíűség változó várható értéke egyelőségét Kétmtás z-próbával tesztelhetjük, ha smertek az elmélet szórások vagy a mták elemszáma agyobb 30-ál Kétmtás t-próbával tesztelhetjük, ha az elmélet szórások smeretleek, de azok egyelősége feltételezhető Esetükbe az elmélet szórások smeretleek és a mták elemszáma 30-ál em agyobbak, ezért a kétmtás z-próba em alkalmazható F-próbát alkalmazuk az elmélet szórások egyelőségéek tesztelésére Ha az F-próba eredméyekét feltételezhető az elmélet szórások egyelősége, akkor kétmtás t-próbával teszteljük a várható értékek egyelőségét Hpotézsek felállítása: A feladat szövege alapjá a következő hpotézsek fogalmazhatók meg. H 0 : az A műszakba gyártott tárcsák átmérőjéek várható értéke egyelő a B műszakba gyártott tárcsák átmérőjéek várható értékével. H : az A műszakba gyártott tárcsák átmérőjéek várható értéke agyobb, mt a B műszakba gyártottaké A tárcsák átmérőjéek hossza ormáls eloszlású valószíűség változó, ezért a feladatuk két ormáls eloszlású valószíűség változó várható értéke egyelőségéek tesztelése. Számított érték meghatározása: F-próba H 0 : az A műszakba gyártott tárcsák átmérőjéek szórása egyelő a B műszakba gyártott tárcsák átmérőjéek szórásával. H : az A műszakba gyártott tárcsák átmérőjéek szórása agyobb, mt a B műszakba gyártottaké. s A 0,9844 F sz,548 sb 0,7745 α=5% Számlálóhoz tartozó szabadságfok: -=0 Nevezőhöz tartozó szabadságfok: 0-=9 9

130 F krt 3,4 Mvel F sz < F krt, ezért a ullhpotézst 5%-os szgfkaca szte elfogadjuk, azaz elfogadjuk az elmélet szórások egyezését, és így a várható értékek egyelőségét kétmtás t- próbával elleőrzhetjük. Kétmtás t-próba: H0: az A műszakba gyártott tárcsák átmérőjéek várható értéke egyelő a B műszakba gyártott tárcsák átmérőjéek várható értékével. H: az A műszakba gyártott tárcsák átmérőjéek várható értéke agyobb, mt a B műszakba gyártottaké. α=5% DF=+0-=9 egyoldal próba, t, 79 s t p sz s p x A x 0,95 s A A A 300, 99,6 / / 0,8376 //0 A B B,504 Dötés a ullhpotézsről: Mvel a számított érték az elfogadás tartomáyba esk, ezért 5%-os szgfkaca szte elfogadjuk a ullhpotézst, azaz az A és B műszakba gyártott tárcsák átmérőjéek várható értéke között cs szgfkás külöbség Feladat B B s B 00, ,7745 0, Egy palackozó üzembe az -es és -es gyártósoroko palackozott lter évleges űrtartalmú üdítőtalok töltés térfogatát vzsgálták. Egy-egy mtát vettek a két soro palackozott üdítőtalokból, s a mtákból meghatározták a töltés térfogatok átlagát és tapasztalat szóráségyzetét. Az eredméyeket az alább táblázatba rögzítették. (A töltés térfogat ormáls eloszlású valószíűség változóak tekthető.) -es gyártósor -es gyártósor Mta elemszáma 6 6 Mtából számított átlag,0 0,98 Tapasztalat szóráségyzet 0,045 0,05 a.) 5%-os szgfkaca szte elfogadható-e az az állítás, hogy az -es gyártósoro palackozott üdítőtalok töltés térfogatáak várható értéke agyobb, mt a -es gyártósoro palackozottaké? b.) 5%-os szgfkaca szte elfogadható-e az az állítás, hogy az -es gyártósoro palackozott üdítőtalok töltés térfogatáak szórása ksebb, mt a -es gyártósoro palackozottaké? 30

131 Megoldás: A megoldás meete: Két ormáls eloszlású valószíűség változó várható értéke egyelőségét Kétmtás z-próbával tesztelhetjük, ha smertek az elmélet szórások vagy a mták elemszáma agyobb 30-ál Kétmtás t-próbával tesztelhetjük, ha az elmélet szórások smeretleek, de azok egyelősége feltételezhető Esetükbe az elmélet szórások smeretleek és a mták elemszáma 30-ál agyobbak, ezért a kétmtás z-próba alkalmazható A kétmtás t-próba szté alkalmazható, ha az elmélet szórások egyelősége feltételezhető. Ez utóbb feltételezést F-próbával tesztelhetjük. Hpotézsek felállítása: A feladat szövege alapjá a következő hpotézsek fogalmazhatók meg. H 0 : az -es gyártósoro palackozott üdítőtalok töltés térfogatáak várható értéke egyelő a -es gyártósóro palackozott üdítőtalok töltés térfogatáak várható értékével (H 0 : ) H : az -es gyártósoro palackozott üdítőtalok töltés térfogatáak várható értéke agyobb, mt a -es gyártósoro palackozottaké (H : ) A töltés térfogat ormáls eloszlású valószíűség változó, ezért a feladatuk két ormáls eloszlású valószíűség változó várható értéke egyelőségéek tesztelése. Számított érték meghatározása: z sz x s x s,0 0,98,036 0, ,05 6 Krtkus érték meghatározása: 0,05 z ( ),65 Dötés a ullhpotézsről: A próbastatsztka értéke az elfogadás tartomáyba esk, ezért a két gyártósoro palackozott üdítőtalok várható töltés térfogatát 5%-os szgfkaca szte egyelőek tekthetjük. Nem fogadható el az az állítás, hogy az -es gyártósoro palackozott üdítőtalok töltés térfogatáak várható értéke agyobb, mt a -es gyártósoro palackozottaké. Másk lehetséges megoldás: kétmtás t-próba Hpotézsek felállítása F-próba A feladat szövege alapjá a következő hpotézsek fogalmazhatók meg. H 0 : az -es gyártósoro palackozott üdítőtalok töltés térfogatáak szórása egyelő a -es gyártósoro palackozott üdítőtalok töltés térfogatáak szórásával ( ) H : az -es gyártósoro palackozott üdítőtalok töltés térfogatáak szórása ksebb, mt a - es gyártósoro palackozottaké ( ) 3

132 A töltés térfogat ormáls eloszlású valószíűség változó, ezért a feladatuk két ormáls eloszlású valószíűség változó szórása egyelőségéek tesztelése. A szórások egyelőségéek tesztelésére F-próbát alkalmazuk. Számított érték meghatározása F-próba: Mvel s s, ezért F sz s s 0,05, 0,045 Krtkus érték meghatározása F-próba: A számlálóhoz tartozó szabadságfok: 60 A evezőhöz tartozó szabadságfok: 60 0,05,53 F krt Dötés a ullhpotézsről: Mvel a számított érték ksebb, mt a krtkus érték, a ullhpotézs 5%-os szgfkaca szte elfogadható, így eze a szgfkaca szte elfogadható a szórások egyelősége, s em fogadható el az az állítás, mszert az -es gyártósoro palackozott üdítőtalok szórása ksebb, mt a -es soro palackozottaké. Mvel 5%-os szgfkaca szte a szórások egyelősége elfogadható, így az a.) feladat kétmtás t-próbával s megoldható. H 0 : az -es gyártósoro palackozott üdítőtalok töltés térfogatáak várható értéke egyelő a -es gyártósóro palackozott üdítőtalok töltés térfogatáak várható értékével (H 0 : ) H : az -es gyártósoro palackozott üdítőtalok töltés térfogatáak várható értéke agyobb, mt a -es gyártósoro palackozottaké (H : ) Számított érték meghatározása kétmtás t-próba: s s 60 0, ,05 s p 0, t sz s x x,0 0,98 / / 0,0475 / 6/ 6 p Krtkus érték meghatározása kétmtás t-próba: DF= 6+6-=0 0,05 t,66 0,95,036 A próbastatsztka értéke az elfogadás tartomáyba esk, ezért a két gyártósoro palackozott üdítőtalok várható töltés térfogatát 5%-os szgfkaca szte egyelőek tekthetjük. Nem fogadható el az az állítás, hogy az -es gyártósoro palackozott üdítőtalok töltés térfogatáak várható értéke agyobb, mt a -es gyártósoro palackozottaké. 3

133 Megjegyzés: A kétmtás z-próbáál, valamt a kétmtás t-próbáál a próbastatsztkák és az elfogadás tartomáyok z,036 t, 036 sz sz t sz zsz,65, 66 A kapott értékek jól érzékeltetk, hogy a két próba végrehajtása a gyakorlat szempotjából azoos eredméyt hoz. 6.6 Elmélet kérdések. M a paraméteres és m a emparaméteres próbák között külöbség? Mre voatkozhatak a hpotézsvzsgálat alkalmazás feltétele?. M tekthető függetle és m páros mtáak? 3. Jellemezze a megsmert emparaméteres próbákat! (típusok, alkalmazás feltételek, ullhpotézsek) 4. Jellemezze a megsmert egymtás próbákat! (típusok, alkalmazás feltételek, ullhpotézsek) 5. Jellemezze a megsmert kétmtás próbákat! (típusok, alkalmazás feltételek, ullhpotézsek) 6. Jellemezze a megsmert többmtás próbákat! (típusok, alkalmazás feltételek, ullhpotézsek) 33

134 7. Korrelácó- és regresszószámítás 7. Kapcsolatok jellege 33 A társadalm, a műszak és a gazdaság jeleségek törvéyszerűséget emcsak ömagukba, haem a jeleségekkel szoros kapcsolatba lévő más téyezők összefüggésébe s vzsgálhatjuk. Az eddg fejezetekbe a véletle tömegjeleségek leírását mdg egy már bekövetkezett állapot valószíűségelmélet, matematka-statsztka vzsgálatával végeztük el. Az ú. összefüggés-vzsgálatok sorá arra keressük a választ, hogy egy adott állapot mlye téyezők hatására jött létre, az egyes téyezők mlye mértékbe befolyásolják a jeleség alakulását, a téyezők mlye szoros kapcsolatba vaak egymással. Két smérv között háromféle kapcsolat lehetséges:. a két smérv függetle egymástól (ha a változók között cs összefüggés, vagys az egyk smérv szert hovatartozásból em következtethetük a másk smérv változatára). a két smérv között sztochasztkus kapcsolat va 3. a két smérv között függvéyszerű (determsztkus) kapcsolat va (ha az egyk smérv változata mde esetbe a másk smérv adott változatával fordul elő, azaz az egyk smérv által felvett smérvváltozat smeretébe egyértelműe lehet következtet a másk smérv által felvett értékre) A sztochasztkus kapcsolat a függetleség és a determsztkus kapcsolat között foglal helyet. Ilye kapcsolat eseté az egyk smérv változathoz való tartozásból csak tedecaszerűe, valószíűség jelleggel következtethetük a másk smérvváltozatra. Más szóval a sztochasztkus kapcsolat léyege az, hogy a megfgyelt sokaság egységeek egyk smérv szert mlyeségét, hovatartozását smerve levoható ugya bzoyos következtetés az egységek másk smérv szert hovatartozásáról, de ez a következtetés em teljese egyértelmű (pl. a mukaélkülvé válás esélye és az skola végzettség között kapcsolat vagy a bztoság öv haszálata és a baleset súlyossága között kapcsolat). Az smérvek között kapcsolat elemzésekor a következő három kérdésre keressük a választ:. Va-e kapcsolat a vzsgált smérvek között?. Mlye szoros a kapcsolat? (a két szélsőség, vagys a függetleség és a függvéyszerű kapcsolat között hol helyezkedk el; egy kapcsolat aál lazább/gyegébb, mél közelebb va a függetleséghez, és aál erősebbek/szorosabbak modható, mél közelebb áll a függvéyszerű kapcsolathoz) 3. Hogya lehet felhaszál az smérvek között kapcsolat természetéek smeretét arra, hogy egy adott egység bzoyos smérvek szert mlyeségéből következtessük aak más smérvek szert hovatartozására? E kérdések megválaszolásáak módja attól függ, hogy a sokaság egységet egydejűleg háy smérv, lletve mlye fajta (mlye mérés szte mért változók) szert vzsgáljuk. 33 Az alfejezet Huyad L. Mudruczó Gy. Vta L.: Statsztka, Aula Kadó, Budapest, 996 felhaszálásával készült. 34

135 Most kzárólag két smérv fajtája (a változók mérés sztje) szert a következő eseteket külöböztetjük meg: asszocácós kapcsolat: az egymással kapcsolatba álló smérvek mőség vagy terület smérvek (mdkét változó omáls mérés sztű) ragkorrelácós kapcsolat: mdkét változó sorred skálá mérhető vegyes kapcsolat: az egyk vzsgált smérv meység smérv, a másk terület vagy mőség smérv (az egyk változót tervallum- vagy aráyskálá, a másk változót meg omáls skálá mértük) korrelácós kapcsolat: mdkét vzsgált smérv meység smérv (mdkét változó tervallum- vagy aráyskálá mérhető) E égy eset megkülöböztetése azért fotos, mert az smérvek között kapcsolat elemzéséek három alapvető kérdése a megjelölt esetekbe más-más eszközökkel vzsgálható. Az asszocácós kapcsolatról már szóltuk a függetleségvzsgálat sorá, a vegyes kapcsolatot elemeztük a heterogé sokaságok jellemezése kapcsá. A ragkorrelácós kapcsolat elemzése em tárgya jegyzetükek. Most a korrelácós kapcsolat bemutatása és jellemzése a következő alfejezetek tárgya. 7. A korrelácós kapcsolat szemléltetése A agyobb számítás mukát géylő matematka módszerek alkalmazása előtt a kapcsolat létezésére voatkozó szakma feltevésüket grafkus ábrázolással célszerű szemléltet. Az ú. szóródás-dagramo az x ; y értékpárok által meghatározott potdagram, lletve emprkus regresszófüggvéy szemléltet a kapcsolatot. A dagram segítségével elsődleges formácót szerezhetük a kapcsolat meglétéről vagy háyáról, a kapcsolat szorosságáról, jellegéről és ráyáról s (lásd 7. ábra). Y = -8.6E X R-Sq = 6.5 % Y = 5.07E X R-Sq = 70.9 % Poztív korrelácó Negatív korrelácó Y = -7.4E X R-Sq = 3.4 % Y = X X** R-Sq = 88.4 % Ncs korrelácó Nem leárs korrelácó 7. ábra: Potdagramok 35

136 Ha a potok voulás ráya (képzeletbel tegelye) felfelé mutat, poztív korrelácóról beszélük (övekvő x értékekhez övekvő y értékek tartozak), ellekező esetbe a korrelácó egatív. A görbevoal korrelácó azt jelz, hogy em lehet mde korrelácót egyértelműe poztívak, vagy egatívak tekte. Ha a potok közel helyezkedek el egymáshoz (ll. a kapcsolat jellegét mutató függvéyhez) szoros, ha távolabb, gyegébb kapcsolatot sejthetük az smérvek között. 7.3 Korrelácó- és regresszóelemzés alapja A korrelácó- és regresszószámítás a statsztka két, egymással szorosa összefüggő területét képez. Ebbe a fejezetbe a meység smérvek között kapcsolatvzsgálat eszközevel foguk megsmerked. A meység smérvek között sztochasztkus összefüggést korrelácóak evezzük. Ilye összefüggés va pl. a háztartások egy főre jutó jövedelme és egy főre jutó fogyasztása között, vagy pl. a termékek ára és a termék mőségét jellemző paraméterek között. A korrelácós kapcsolatok statsztka módszerekkel végzett elemzésével agymértékbe gazdagíthatjuk a jeleségekről és összefüggésekről alkotott smereteket. A korrelácószámítás tervallum-, vagy aráyskálá mért változók kapcsolataak vzsgálatával foglalkozk, elemz a kapcsolat meglétét, szorosságát és ráyát. A regresszószámítás az összefüggésekbe lévő tedecát vzsgálja, és a kapcsolat természetét valamlye függvéyel írja le. Így a kapcsolat megléte eseté aak formáját, jellegét, mőség jellemzőt vzsgálja, és alkalmas arra, hogy a változók között kapcsolat segítségével mélyebb smereteket szerezzük a vzsgált változókról, lletve hogy a kapcsolat felhaszálásával statsztka következtetéseket vojuk le. Hagsúlyoz kell azoba, hogy a korrelácós és regresszós számítás a kapcsolatot jellemz, de semmt em mod az okság vszoyról. Tehát két, vagy több változó között sztochasztkus kapcsolat megállapításából em következk, hogy a változók okság összefüggésbe vaak, azaz, hogy egyk téyező változása oka a másk téyező változásáak. Az okság kapcsolatot csak alapos szakma és statsztka vzsgálattal lehet megállapíta. Egy adott korrelácós összefüggés elemzéséél általába md a kétfajta vzsgálódásra szükség va, mvel a regresszó- és korrelácószámítással yert formácók más kérdésekre adak választ, kegészíthetk egymást. Általába megkülöböztetük kétváltozós és többváltozós eseteket. Kétváltozós esetbe két változó kapcsolatát vzsgáljuk, mely két változó közül az egyk (legye X) magyarázza a másk Y-al jelölt eredméyváltozó alakulását. A kétváltozós regresszóba így egy magyarázó változó áll szembe egy eredméyváltozóval. Többváltozós esetbe abból duluk k, hogy egy eredméyváltozót több magyarázó változó ír le. A regresszószámítás léyege az, hogy egy jól defált sokaságba két vagy több változó között sztochasztkus kapcsolatot tételezük fel, és ezt a kapcsolatot szereték leír és megragad aak érdekébe, hogy a vzsgált sokaság tulajdoságat statsztkalag jobba megsmerjük. Általába azzal a helyzettel álluk szembe, hogy a megfelelő sokaság összefüggéseket mtákból kell meghatároz. 36

137 A regresszószámítás sorá feltételezzük, hogy eredméyváltozók (Y) sztochasztkus kapcsolatba áll a magyarázó változókkal (X). Eek általáos formája: Y f ( X, X,..., X j,..., X k, ) Ebbe az esetbe k számú magyarázó változót feltételeztük, az ε maradékváltozó pedg azt fejez k, hogy a kapcsolat sztochasztkus, azaz a függvéy szerves részét képez egy valószíűség változó s. Eek az általáos függvéyformáak a leggyakorbb és legkéyelmesebbe alkalmazható formája a leárs regresszó. A többváltozós leárs regresszós függvéy általáos alakja: Y X X... X... X 0 j j k k Ebbe az alakba k számú magyarázó változó, egy eredméyváltozó és egy maradékváltozó va. A modellbe k+ számú paraméter va, hsze a legelső paraméter az egyelet kostas változójáak együtthatója. Ezt az általáos k+ változós modellt gyakra alkalmazzuk a k= esetre, amkor tehát egy magyarázó változó, egy eredméyváltozó és két paraméter jellemz a kapcsolatot. Ezt az esetet evezzük kétváltozós leárs regresszós modellek: Y 0 X Feltételezzük tehát, hogy az X magyarázó változó és az Y eredméyváltozó között leárs sztochasztkus kapcsolat va, és ez a kapcsolat a fet formulával írható le. Az összefüggés sztochasztkus jellegéből következk, hogy pl. ha egy rakomáy elszállításáál vzsgáljuk a szállítás dő és a távolság kapcsolatát, a szállítás távolság bármely rögzített értékéhez tartozó meetdők em leszek azoosak. A szállítás dejét ugyas a távolságo kívül befolyásolja pl. a rakomáy súlya, a gépkocs típusa, az dőjárás és útvszoyok, a forgalm helyzet stb. Az ε az X-szel együtt fellépő véletle hatás A kétváltozós regresszós modell A továbbakba tehát az (mtából) felépíte. Y 0 X összefüggést szereték egy elemű halmazból Az X magyarázó és Y eredméyváltozó között összefüggések léyegéek megragadásába fotos szerepet játszk a grafkus ábrázolás. Kétváltozós kapcsolat eseté köye elkészíthető az lye grafkus ábra, hsze a derékszögű koordáta-redszer vízsztes tegelyére az X magyarázó változó értéket, a függőleges tegelyére pedg az Y eredméyváltozó értéket mérjük fel. Egy lye példát mutat az alább ábra: 37

138 A futásteljesítméy és az eladás ár kapcsolata ezer Ft ábra: Példa grafkus ábrázolásra egy kétváltozós regresszós modellbe A változók (X magyarázó és Y eredméyváltozó) között összefüggés feltárásához fotos, hogy a fet ábrá látható potok voulás ráyát valamlye smert függvéyel fejezzük k, vagys léyegébe arról va szó, hogy keressük a potokra llesztett egyees egyeletét. Ha a potok voulás ráyát egy egyeessel jellemezzük, akkor a változók között összefüggést leíró függvéyt leárs regresszós függvéyek evezzük. Az ábrá a gépkocsk által megtett km (X magyarázó változó, lásd vízsztes tegely) és az eladás ár (Y eredméyváltozó, lásd függőleges tegely) közt kapcsolat látható, am alapjá ráézésre az állapítható meg, hogy a gépkocs eladás ára és a megtett km között egatív, leárs jellegű sztochasztkus kapcsolat va, azaz az árba egyéb téyezők s szerepet játszaak, melyeket tt összességébe a véletleel azoosítuk. A leárs regresszós függvéy meghatározása sorá arra törekszük, hogy olya egyeessel jellemezzük a változók között kapcsolatot, amely legjobba lleszkedk a megfgyelésből származó X, Y adatpárokhoz. A sztochasztkus kapcsolatál azoba számos egyees szóba jöhet a kapcsolat jellemzésére, ezek közül azt az egyeest célszerű választa, amelyk esetébe a potokak a regresszós egyeestől mért átlagos távolsága a legksebb. Ehhez a legksebb égyzetek becslés módszerét haszálják a leggyakrabba (lásd 4.4 A potbecslés módszere c. alfejezetet). A függő vagy eredméyváltozó (Y) és a magyarázó változó (X) kapcsolatát megfgyelésből származó adatpár alapjá vzsgáljuk. A függő és a magyarázó változó mtabel értéke: Y Y,...,,, X ezer km X,..., A mta alapjá a becsült regresszófüggvéy: Yˆ X Y 0 X A legksebb égyzetek módszeréek értelmébe keressük a regresszófüggvéy azo β 0, β paramétereek azo becslését ( ˆ 0 és ˆ ), amely mellett a megfgyelésből származó és a regresszófüggvéy alapjá becsült Y értékek külöbségéek az eltéréségyzet-összege a legksebb. 38

139 39 m ) ˆ ( Y Y A regresszófüggvéyt behelyettesítve a célfüggvéybe: m ) ˆ ˆ ( 0 X Y A 0 ˆ és ˆ paramétereket a szélsőérték-számítás szabálya alapjá lehet meghatároz. Az előző egyelet 0 ˆ és ˆ szert parcáls derváltjat vesszük, és ezeket ullával tesszük egyelővé. Így jutuk el az ú. ormál egyeletekhez. x Y 0 ˆ ˆ 0 ˆ ˆ X X Y X E ormál egyeletek megoldásával a 0 ˆ és ˆ paraméterek meghatározhatóak. Az egyeletredszer megoldása külöböző módszerekkel végezhető el. A leggyakrabba alkalmazott módszer az, hogy a fet két egyeletet úgy traszformáljuk, hogy az eredet X és Y változókat az átlaguktól vett eltérésekkel, vagys X X d x és Y Y d y eltérésekkel helyettesítjük. A ormál egyeletek e traszformált változókkal felírva: x y d d 0 ˆ ˆ 0 ˆ ˆ x x y x d d d d Mvel 0 x d y d, a ˆ paraméter: x y x d d d X X Y Y X X ) ( ) ( ) ( ˆ A 0 ˆ paraméter: Y X 0 ˆ ˆ A regresszófüggvéy: X Y 0 ˆ ˆ ˆ A ˆ regresszós együttható jeletése az, hogy a magyarázó változó egységy övekedése a becsült eredméyváltozó átlagosa háy egységy övekedésével/csökkeésével jár együtt. Az ú. tegelymetszet paraméter, vagys 0 ˆ jeletése az, hogy ha a magyarázó változó 0 értéket vesz fel, a modell szert mekkora lesz az eredméyváltozó értéke. A regresszós együtthatók természetes mértékegységbe jellemzk a két változó kapcsolatát. Előfordul azoba, hogy a kapcsolat jobba leírható olya mutatóval, amelyk azt modja meg, hogy a magyarázó változó %-os övekedése az eredméyváltozó háy %-os övekedésével/csökkeésével jár együtt. Erre a célra haszálható a rugalmasság mutatója: Y X X Y X X Y Y X Y EL ), (

140 Ezt a formát szokták ívrugalmasságak s evez, a gyakrabba haszált potrugalmasság végtele ks elmozdulás eseté vzsgálja a változók kapcsolatáak %-os formába kfejezhető mutatószámát: El( Y, X ) Kétváltozós esetbe az előző egyeletbe beírva a becsült regresszós paramétereket, a következő egyszerű formát kapjuk: dy dx X Y ˆ x El( yˆ, x) yˆ ˆ x ˆ ˆ x 0 Az eredméy értékelésekor arra kell fgyel, hogy az em álladó, haem x függvéye, azaz leárs regresszó eseté a változók kapcsolatát %-os formába kfejező rugalmasság mutató értéke attól s függ, hogy az elmozdulás mlye sztről törték. A rugalmasság együttható értelmezése: az x változó adott sztről kduló %-os övekedése mekkora övekedés jelet ŷ -ba. 34 A következő lépés az elemzés sorá a regresszós függvéyértékek meghatározása. Ez a paraméterbecslések utá adódk, hsze: yˆ ˆ ˆ 0 x Ez az egyelet valójába a mtából számított regresszós függvéyt adja meg, am maga az smeretle és keresett sokaság regresszós függvéy becslése. Csak a mtá belül maradva azoba ez a függvéy alkalmas a megfgyelés potokhoz tartozó regresszós függvéyértékek számítására. Eek tartalma az, hogy az adott megfgyelés potba (az aak megfelelő x helye) becsült modellük szert m lee a vzsgált eredméyváltozó értéke. A függvéy segítségével meghatározhatjuk az eredméyváltozó értékét olya x helyeke, amelyek belül vaak ugya a vzsgálat tartomáyá, de közvetle megfgyelés cs rájuk. Ekkor terpolácót végzük. Ha olya potokra becsülük a függvéyel, amelyek kívül esek a megfgyelés tartomáyá, akkor extrapolácóról beszélük. Ezt bzoyos esetekbe előrejelzések tektjük, am a regresszós modellszámítások fotos végeredméye. Iterpolácó Extrapolácó x Megfgyelés tartomáy 9. ábra: Iterpolácó és extrapolácó 34 Leggyakrabba kereslet, fogyasztás függvéyekél haszálják, a fogyasztás becslésekor, tervezésekor fotos mutatószám az ár-, ll. jövedelemrugalmasság együttható. 40

141 A becsült regresszós függvéy segítségével a megfgyelés potokba meghatározhatjuk a rezduumok értéket: y yˆ e A rezduumok a mtából származó megfgyelések és a regresszófüggvéy által becsült függvéyértékek között külöbséget adják. y y yˆ e y ŷ e mmum x x 30. ábra: A rezduumok szemléltetése Az e maradékok ge fotos szerepet játszaak a modellezésbe: megmutatják, hogy a modell meyre tudott közel jut a valósághoz, hsze e ks értéke jó, agy értéke pedg gyege lleszkedésre utalak, és ez egy ge fotos krtérum a modell megítélésekor. Ezért célszerű az e maradékokból egy olya mutatót képez, amelyk tömöre, egyetle számértékbe sűrítve tartalmazza az lleszkedés jellemzőt. A maradékok összege erre em alkalmas, hsze azok algebra összege 0. Leggyakrabba égyzetösszegüket képezk, am valójába az eredet megfgyelések és a becsült modellértékek eltéréséek égyzetösszege: SSE e Az lleszkedés jellemzésére eek a mutatóak a ormált alakját haszálják. Ha ezt a égyzetösszeget -el elosztjuk, akkor a mtá belül rezduáls varacát kapjuk meg, amek égyzetgyöke a rezduáls szórás: s e Rezduáls szórás (regresszós becslés abszolút hbája): ez a mutató egyfajta szóródásmutató, és a regresszós becslés sorá elkövetett hba egyk gyakra alkalmazott mérőszáma. Kfejez, hogy a regresszós becslések átlagosa meyvel térek el az eredméyváltozó megfgyelt értéketől. A rezduáls szóródás becslésére az alább torzítatla becslést s haszálják: e 4

142 s e e (y ŷ ) Az s e az Y egyed értékekek az Y regresszós függvéy szert érték körül gadozását fejez k. Értékét a gyakorlatba em smerjük, ezért a mtabel adatok alapjá becsüljük. Ebbe a képletbe e e y yˆ maradéktag, vagy más éve becsült rezduum, rezduáls égyzetösszeg, amelyek agyságát a legksebb égyzetek módszerével törtéő becslés sorá mmalzáljuk. Elmélet megfotolásból, a torzítatlaság követelméyéek teljesülése végett a égyzetösszeget a szabadságfokkal korrgáljuk, am jele esetbe (-). Így elérjük, hogy s torzítatla becslőfüggvéye lesz az alapsokaság varacáak. e Mvel az aaltkus regresszó az elmélet regresszó mtából számított becslése, ezért a regresszófüggvéy paramétere ( ˆ ˆ 0, ) a valóságos β 0 és β paraméterek becsült értéke. A mtából számított regresszós paraméterek mt mde reprezetatív mtából származó becsült paraméter szóródak az elmélet értékek körül. Ezt a szóródást az együtthatók stadard hbá fejezk k. Így a regresszós együtthatók hbá: A β 0 (vagy b 0 ) paraméter stadard hbája: A β (vagy b ) paraméter stadard hbája: s s x ˆ e 0 d x s e ˆ d x A hba másk forrása az, hogy a vzsgált smérvek között sztochasztkus kapcsolat va (lásd s ). Y-ak X szert regresszós becslése em a téyleges Y értékeket, haem aak csak az e X-től függő részét adja. A téyleges és a regresszófüggvéyel becsült értékek eltérése matt beszélhetük a regresszófüggvéy, lletve a regresszóértékek hbájáról. Az eltérések agyságát értelemszerűe befolyásolja a kapcsolat szorossága. Szoros korrelácó eseté a becsült értékek jól közelítk az eredméyváltozó értéket, laza kapcsolatál vszot a kétféle érték között az Y-t befolyásoló egyéb téyezők jeletős súlya matt agy eltérések mutatkozak. s az a 4

143 7.3. Korrelácós mérőszámok A következő lépés a kapcsolat szorosságáak és ráyáak a vzsgálata a mtá belül. Eek sorá arra keressük a választ, hogy a két változó mlye szoros és mlye ráyú kapcsolatba áll egymással a Kovaraca A mtából számított (becsült) kovaraca a magyarázó és az eredméyváltozó között: d xd y cov( x, y) A vzsgált smérvek függetlesége eseté a kovaraca 0 értéket vesz fel. Ha az smérvek poztív korrelácós kapcsolatba állak egymással, vagys X változó átlagál magasabb (alacsoyabb) értékéhez az Y változóak s általába átlagál magasabb (alacsoyabb) értéke tartozk, a kovaraca értéke poztív előjelű lesz. Negatív korrelácóál a kovaraca előjele s egatív, mert lyekor tedecájába gaz lesz, hogy ameybe X értéke átlag alatt, Y értéke átlag felett, azaz az átlagtól vett eltérések szorzata általába egatív lesz b Leárs korrelácós együttható A kovaraca mérőszáma a függetleséget s jól jelz, agyságát azoba a változók mértékegysége befolyásolja. Célszerű a kapcsolat erősségéek a mérésére ormált, 0 és tervallumba elhelyezkedő mérőszámot alkalmaz. Ilye mérőszámot kapuk, ha a kovaracát stadardzált változók alapjá számítjuk. A korábbakhoz hasolóa állíthatjuk elő a két változó mtabel varacáját: d x x s var( ) x és var( y) s y d y Ezek segítségével felírható a leárs korrelácós együttható a két változóra (ha var( x ) var( y) 0) r cov( x, y) var( x) var( y) d d x x d y d y A mtabel r korrelácós együttható olya - és + között elhelyezkedő mutatószám, amelyk -hez közel abszolút értéke szoros, közel leárs függvéyszerű kapcsolatot, 0 körül értéke a leárs kapcsolat háyát, ú. korrelálatlaságot jeletk. A korrelácós együttható poztív értéke egy ráyba mozgó, míg a egatív értéke elletétes ráyba mozgó változókat jeleteek. A korrelácós együttható a két változó kapcsolatáak mérőszáma c Determácós együttható A következő mutató a kétváltozós regresszós modell egészéek lleszkedését mér. Eek származtatásához írjuk fel a kétváltozós leárs modellre voatkozó varacafelbotást. A belső égyzetösszeg szerepét a megfgyelésekek a regresszós egyeestől vett eltéréseből számított égyzetösszeg vesz át, a külső égyzetösszeget pedg a regresszós egyees potjaak saját átlaguktól vett eltérése határozza meg. A kettő összegekét adódk a teljes égyzetösszeg. 43

144 Ebbe az esetbe a regresszós egyees az, am a csoportosítást végz: a regresszós egyeesek a megfelelő x potokhoz tartozó értéke alkotják a csoportátlagokat. Ha a megfgyelések potosa rajta vaak az egyeese, akkor a belső égyzetösszeg 0, és a teljes égyzetösszeget kzárólag a külső téyező, azaz a regresszó magyarázza. Ha ellebe a megfgyelések jócská eltérek a regresszós egyeestől, akkor a belső eltérés-égyzetösszeg agy lesz, és tektve, hogy a teljes égyzetösszeg (SST) álladó, a külső vszoylag kevesebbet magyaráz. A külső égyzetösszeget így regresszós, vagy magyarázott égyzetösszegek (SSR) s szokták evez, míg a belső égyzetösszeg az, amt em tuduk a regresszóval magyaráz, a maradék-vagy hbaégyzetösszeg (SSE). SST SSE SSR Ebből képezhető a determácós együttható, am megmutatja, hogy a regresszós modellel az y adatokba meglévő varaca (bzoytalaság) háy %-a szütethető meg: R SSR SST SSE SST Ezt a %-os értelmezésű mutatót a modell magyarázó erejéek szokás evez. Értéke 0 és között mozoghatak: agy, -hez közel értéke jó lleszkedést, agy magyarázó erőt, ks, 0- hoz közel értéke gyege modellteljesítméyt jelezek Itervallumbecslés A regresszós modell feltételeek rögzítése és a paraméterek becslőfüggvéyéek kdolgozása utá lehetővé válk, hogy összefüggést teremtsük a mtából becsült paraméterek és az elmélet, alapsokaság paraméterek között. Így módukba áll a gyakorlatba egyetle mtából következtet az alapsokaság paraméterekre. A regresszós paraméterek potbecslése utá tervallumbecslés s adható. Itervallumbecslést szoktuk ad a paraméterekre, és gyakrabba pedg a függvéyértékekre (ez utóbbaktól m eltektük). Am a paramétereket llet, a pror felírhatók a becsléselméletből smert összefüggések. It It ( ) ˆ t ( ) / sˆ ˆ ( 0 ) 0 t / ( ) sˆ 0 A kofdeca tervallumok értelmezése teljese aalóg azzal, amt korábba megsmertük: az tt számított tervallumok 95%-os megbízhatósággal lefedk az smeretle sokaság paramétert (α=5% mellett). A 95%-os megbízhatóság ayt jelet, hogy smételt mtavétel esetébe az esetek 95%-a olya tervallumot eredméyez, amelyk tartalmazza az smeretle jellemzőt. 44

145 7.3.4 A regresszófüggvéy eredméyeek elleőrzése: hpotézsvzsgálatok A regresszófüggvéy llesztéséek logka feltétele, hogy a vzsgált változók között korrelácós kapcsolat legye. Korrelácó feállása eseté a függvéy regresszós együtthatója 0-tól külöbözk. Előfordulhat azoba, hogy a korrelácó háya eseté sem kapuk potosa 0 értéket. A véletle mtából származó eredméyeket ugyas a véletle hatások s befolyásolják. E véletle hatások következtébe a regresszós együttható értéke akkor s eltérhet 0-tól, ha a két változó között semmlye kapcsolat cs. Ha az elmélet regresszót aaltkus függvéyel a mtából közelítjük, felvetődk a paraméterek hpotézselleőrzéséek godolata. Így ameybe a regresszószámítást mtavétel keretek közt értelmezzük, lehetőségük va arra, hogy a mtából elleőrzzük egy sor feltevést, amelyek a számítások eredméyéek értékelését segítk. Hpotézsvzsgálattal elleőrzhető az, hogy a magyarázó változó kapcsolatba áll-e az eredméyváltozóval, aak magyarázatához érdembe hozzájárul-e. A másk fotos kérdés, hogy a magyarázó változó elegedőe magyarázza-e az eredméyváltozót, kell-e esetleg azo godolkoz, hogy a jeleség jobb leírása érdekébe tovább változókat kell felkutat és beépíte a modellbe. E két kérdés mellett fotos azt s vzsgál, hogy vajo a modellezések a maradékváltozóra tett feltétele megerősíthetők- vagy elutasítadók-e (homoszkedasztctás, autokorrelácó metesség, ormáls eloszlás). Ezek azok az alapkérdések, amelyet mde regresszós modellbe vzsgál kell a Paraméterek szeparált tesztelése Itt arra keressük a választ, hogy a paraméterek eleget teszek-e valamféle előre meghatározott korlátozásak. Általába a hpotézsek úgy írhatók fel, hogy (0) (0) H és H 0 : (0) ahol az általuk feltételezett paraméterérték a -ba jelek meg. Ezt a próbát akkor haszálhatjuk, ha a regresszós függvéy sokaság meredekségére va elleőrz kívát feltevésük. (0) Azoba többször eél egyszerűbb a kérdés: ha ugyas azt feltételezzük, hogy 0, akkor a ullhpotézs elfogadása azt jelet, hogy a meredekség paraméter sokaság értéke lehet 0, am azt jelet, hogy X alakulása em befolyásolja Y-t, azaz a két változó között cs a sokaság szte s feálló leárs kapcsolat. Ez egybe azt s jelet, hogy a kétváltozós regresszós modell em jó, az eredméyváltozót érdemesebb a saját átlagával, mtsem az aktuáls X-szel becsül. E próba hpotézse: H0 0 : : 0 és : 0 A paraméterek tesztelése t-próbával törték. ˆ t s H0 A próba meete az, hogy mtából kszámoljuk a becsült paraméterértékeket, aak stadard hbáját, és ameybe ez a háyados a krtkus t-értékeke kívül (elutasítás) tartomáyba esk, a ullhpotézst elutasítjuk, azaz elfogadjuk a kapcsolat létét, és megerősítjük X-et magyarázó változó szerepébe. A számított értéket adott α szgfkaca szte és (-) szabadságfokhoz tartozó krtkus értékhez vszoyítjuk. Ameybe az emprkus t-érték az elfogadás tartomáyba esk, akkor cs okuk elutasíta a ullhpotézst, ez pedg azt 45

146 jelet, hogy elvetjük az X-et, mt magyarázó változót, és/vagy másk magyarázatot keresük, vagy pedg lemoduk a regresszós magyarázatról. Elvbe teljese hasoló t-próba készíthető a másk (β 0 ) paraméterre s, bár eek jeletősége ksebb, mvel em tulajdoítaak ek magyarázó erőt a modellbe, mt lleszkedést javító paramétert általába megtartják akkor s, ha sokaság értéke em külöbözk szgfkása 0- tól b Varacaaalízs alkalmazása a regresszószámításba A regresszós együttható tesztelése mellett magáak a regresszófüggvéyek a hpotézselleőrzése s elvégezhető. Ez varacaaalízssel törtéhet. A másk kérdés, amt hpotézsvzsgálattal szereték megválaszol az az, hogy vajo a regresszó mde hatást megragad-e, és a modell által adott magyarázat elégséges-e? Leárs modellek esetébe ez a kérdés általába úgy merül fel, hogy az R determácós együttható elegedőe agy-e? Mvel kétváltozós esetbe a determácós együttható a korrelácós együttható égyzetével egyelő, a determácós együttható tesztelése s ekvvales lesz aak vzsgálatával, hogy a két változó között va-e szgfkása 0-tól külöböző kapcsolat. Ez pedg azt jelet, hogy kétváltozós leárs modell esetébe ezt a feladatot a t-próba segítségével már megoldottuk. Most azoba mégs bemutatuk egy másk tesztet, am varacaaalízse alapul. Eek alkalmazása kétváltozós esetbe egyszerű, többváltozós esetbe elválk a t-próbától és a modell jóságát, az lleszkedést vzsgálja. Elsőkét írjuk fel az eredméyváltozó és a magyarázó változó között összefüggést az -edk megfgyelésre: y yˆ e y ˆ ˆ 0 x e (vagys a megfgyelt Y érték (X=x ) = az x -hez tartozó regresszós becslés + a maradéktag) Megállapíthatjuk, hogy maradéktag összege ulla, ez az első (korábba bemutatott) ormálegyelet átredezése utá belátható: Ebből következk, hogy: ( y ˆ ˆ 0 x ) yˆ 0 y ( ˆ ˆ x ) Ez azt jelet, hogy a regresszós becslések összege és ebből következőe átlaga s megegyezk az eredméyváltozó téyleges értékeek összegével és átlagával. Az duló összefüggésük, tehát az átlagtól vett eltérések alapjá s felírható: ( y ) ( ˆ ) ( ˆ y y y y y ) Ez fotos összefüggés számukra, mert kfejez, hogy az eredméyváltozó y megfgyelt értékeek átlagtól való eltérése két kompoessel magyarázható, egyrészt a becsült regresszófüggvéy szóródásával, másrészt a maradéktag gadozásával. Az eltérések összetevőkre botása az eltérés-égyzetösszegekre s felírható: ( y y) ( yˆ y) 46 e ( y yˆ ) SST SSR SSE Külöleges jeletősége va a rezduáls égyzetösszegek (SSE), mvel a megfgyelt y értékekek a regresszófüggvéy körül szóródását fejez k. Ha SSE=0, ez azt jelet, hogy a

147 függő változó teljes varacája megmagyarázható a magyarázó változó segítségével. Mde megfgyelt y érték a regresszófüggvéye helyezkedk el. Egyéb téyezőkek cs hatása az eredméyváltozóra, vagys az smérvek között kapcsolat determsztkus. Ha SSE 0, akkor a két smérv között sztochasztkus kapcsolat áll fe. Mél agyobb a rezduáls égyzetösszeg értéke, aál agyobb a becslés hbája, mert a modellbe em szereplő egyéb magyarázó változók hatása aál agyobb szerepet játszk a függő változó szóródásába. Nullhpotézsük szert a regresszó em érvéyes, a (kétváltozós esetbe egyetle) X magyarázó változó em magyarázza az eredméyváltozó alakulását, azaz paraméteréek sokaság értéke (lehet) 0. A varacaaalízs termológája szert ez azt jelet, hogy a magyarázó változó szert képzett csoportok várható értéke em térek el egymástól, azaz a magyarázó változó együtthatója 0. A hpotézsük az előzőhöz hasolóa: H0 H0 : 0 és : 0 Most azoba a vzsgálat eszköze a varacaaalízs lesz. Khaszálva, hogy a regresszós és a maradék égyzetösszegek -eloszlásúak és függetleek, felírható egy olya változó, amelyk eloszlását a ullhpotézs alatt smerjük, ezért alkalmas próbafüggvéyek: F SSR / SSE /( ) ~ F(, ) A próba végrehajtása egyszerű, hsze a regresszós számításokból átvesszük a mtából számított égyzetösszegeket, kszámoljuk a fet próbafüggvéy emprkus értékét, és azt összevetjük a megfelelő szabadság fokú és megfelelő szgfkaca szthez tartozó táblázatbel (krtkus) értékkel. Ha az F értékük agyobb, mt a krtkus érték, a ullhpotézst elutasítjuk, ellekező esetbe erre cs elég statsztka bzoyítékuk, tehát elfogadjuk. Az elutasítás így a modell megerősítését (jóságát) jelet, míg az elfogadás a modell elutasítását. A varacaaalízs elterjedt módszere a statsztkáak, így kalakult egy olya táblázata, amely segítséget yújt egyrészt a számítások elvégzéséhez, másrészt pedg az eredméyek közlését s elősegít. 5. Táblázat: Varacaaalízs a kétváltozós leárs regresszóba A varaca forrása Négyzetösszeg Szabadság fok Átlagos égyzetösszeg Regresszó SSR SSR MSR Maradék SSE - SSE (hbatéyező) MSE Teljes SST - SST MST F MSR F MSE A szabadságfokokról a következőket kell tud. Az SST szabadságfoka (-), mert számításához először a mtából az y -t, azaz egy paramétert kell számíta. A hbatéyező égyzetösszegéek (SSE) szabadságfoka (-). Eek az a magyarázata, hogy számításához 47

148 két paraméter ( ) becslése szükséges. A regresszóból becsült égyzetösszeg (SSR) 0, szabadságfoka pedg a szabadságfokok között addtív összefüggésből következk. Korábba az lleszkedés jóságát a determácós együtthatóval jellemeztük, ezért most a varacaaalízs F-próbáját s kfejezzük ezzel a mutatóval. A determácós együttható a SSR SSE regresszós és a teljes eltérés égyzetösszeg háyadosa, azaz R. Ebből SST SST egyszerű átalakításokkal adódk, hogy: MSR SSR / SST R R F ( ) ( ) MSE SSE /( ) SST ( R ) R Az első összefüggés azt mutatja, hogy ha az MSE (a belső szóráségyzet becslése) relatíve agy az MSR-hez (a külső szóráségyzet becsléséhez) képest, a regresszófüggvéy rosszul lleszkedk a pothalmazhoz, am a változók között leárs kapcsolat háyára utal, és így a ullhpotézs elfogadását támasztja alá. A fordított eset a magyarázó változó és az eredméyváltozó leárs kapcsolatára utal. Ekkor az X és Y között leárs kapcsolat háyát megfogalmazó ullhpotézsek elletmod, és így az alteratív hpotézst támasztja alá. A másodk összefüggés azt mutatja, hogy a agyobb determácós együtthatók (melyek jobb lleszkedést jelezek) agyobb F-értékeket dukálak, am pedg az előzőek alapjá a modell helyességéek a bzoyítéka. Ez az eredméy tehát teljes mértékbe kozsztes azzal a logkával, mszert a jó lleszkedés egybe a jó modell krtéruma s Példák korrelácó és regresszószámítása Az alább táblázatba lakás alapterületére és eladás árára voatkozó adatok szerepelek, ahol X, vagys a magyarázó változó az alapterület m-be, míg Y, vagys az eredméyváltozó, az eladás ár mft-ba. Lakás sorszáma Eladás ár (Y) Alapterület (X) 4, , , , , , , , , , ,3 Számítsuk k a leárs regresszófüggvéy paraméteret! Számítsuk k a 60m-hez tartozó rugalmasság együtthatót! Jellemezzük a kapcsolat szorosságát! Teszteljük a modellt! Ha ábrázolák a mta adatat, az alább képet kapák! 48

149 Eladás ár GAZDASÁGSTATISZTIKA II. rész. A matematka statsztka alapja Alapterület A feladatuk a mta adata alapjá a regresszófüggvéy előállítása: yˆ ˆ ˆ 0 x Ehhez a mta adata alapjá meg kell becsülük a regresszós paramétereket. ˆ d x d y d Ehhez a következő segédszámításokra va szükségük: Az alapterületek átlagos agysága a mta alapjá: x 60, Az eladás árak átlagos agysága a mta alapjá: 4,8 30,4 40, ,3 y 49,8 A mtaátlagok segítségével meghatározhatóak a d x és d y értékek: d x x d y y x y Az eredméyek a következő táblázatba láthatóak. ˆ d d 49 x 744,8 5457,6 x y d x 0,9 A tegelymetszet becslése: ˆ ˆ 0 y x 49,8 0,960, 3,8 A regresszós egyees egyelete: yˆ 3,8 0, 9 x A paraméterek közül a meredekség paraméter jeletése az, hogy m-ekét átlagosa 0,9 mft-tal (9 000Ft-tal) ő az eladás ár. A tegelymetszet-paraméter jeletése az, hogy modellük szert a 0 m-es lakások ára 3,8 mlló Ft. E paraméter kapcsá fotos kemel, hogy em lehet ek mde esetbe tárgy jeletést tulajdoíta.

150 Lakás sorszáma Eladás ár Alapterület d y d x d x d y d x 4,8 83-5,0-77, 96,7 5957, ,8-7, 37,8 50, 3 40,6 7-9, -43, 395,7 864,7 4 40,8 0-9,0-40, 360, 64,6 5 45,8 77-4,0 6,8-66,7 8,9 6 47,6 64 -, 3,8-8,3 4,6 7 50, 86 0,4 5,8,3 666,6 8 5, 9,3 3,8 74,3 0,4 9 56,3 9 6,5 30,8 0,4 949,8 0 74,9 33 5, 7,8 830,4 530,5 80,3 30,5 50,8 55,8 58,5 Össz. 547, ,8 5457,6 Átlag 49,8 60, Rugalmasság együttható: ˆ x ˆ x 0,9x El( yˆ, x) yˆ ˆ ˆ x 3,8 0,9x 0 Ez mde x esetébe más és más értéket ad. Ha rögzítjük az x értékét valamlye szte (pl. 60 m-be), akkor az elasztctás egy kokrét értékét kapjuk eredméykét: 0,960 El ( yˆ, x 60) 0,846 3,8 0,960 Ez azt jelet, hogy ha a 60m-es sztről kdulva %-kal öveljük a m-t, az eladás ár átlagosa 0,84 6%-kal ő. Más potokból kdulva más rugalmasság értékeket kapuk. Az elemzés következő lépése, hogy kszámítjuk a regresszós egyees potjaak értékét, majd a megfgyelt és a becsült értékek külöbözetekét a rezduumokat. Lakás sorszáma Eladás ár Alapterület d y d x d x d y d x 4,8 83-5,0-77, 96,7 5957,0 63, 7,3, ,8-7, 37,8 50, 48,5 8,8-5, 3 40,6 7-9, -43, 395,7 864,7 84,0 37, -3,4 4 40,8 0-9,0-40, 360, 64,6 80,3 38, -,7 5 45,8 77-4,0 6,8-66,7 8,9 5,7 54,7 8,9 6 47,6 64 -, 3,8-8,3 4,6 4,7 50,9 3,3 7 50, 86 0,4 5,8,3 666,6 0, 57,3 7, 8 5, 9,3 3,8 74,3 0,4 5,5 59, 7,0 9 56,3 9 6,5 30,8 0,4 949,8 4,7 58,8,5 0 74,9 33 5, 7,8 830,4 530,5 63,8 7,0-3,9 80,3 30,5 50,8 55,8 58,5 93,5 64,6-5,7 Össz. 547, ,8 5457,6 669, Átlag 49,8 60, 50 d y y e

151 Az első sorba, az ŷ oszlopba megjeleő 7,3 mft azt jelet, hogy modellük szert a 83m alapterületű lakások átlagosa lye áro kelek el. A maradék oszlopába 7,3-4,8=,5mFt áll, am azt jelet, hogy a megfgyelésükbe szereplő lakás az átlagos, modellből következő árál,5mft-tal olcsóbba kelt el, am feltehetőe egyebek közt az átlagosál rosszabb állapotáak tudható be. A rezduumok oszlopáak algebra összege 0, am azt jelet, hogy az egyeestől vett eltérések koltják egymást. Ameybe a regresszós egyeessel a megfgyelés tervallumo kívülre s szereték következtet, extrapolácót végzük. Ha pl. azt vzsgáljuk, hogy várhatóa mlye áro kelek el a 50m alapterületű lakás, akkor x=50-et behelyettesítve a regresszós egyeletbe: y ˆ 3,8 0, ,93 Tehát egy 50 m alapterületű lakás esetébe kb. 76 mft eladás árra lehet számíta. Emlékezük kell arra, hogy ezek a számítások md azzal a feltétellel készültek, hogy az eladás árat csak az alapterülettel magyarázzuk. Az árak emellett természetese egy sor egyéb összetevője lehet (pl. a lakás fekvése, közlekedés lehetőségek, parkolás, géyel-e felújítást, melyk utcába va stb.). Ezek persze léyeges téyezők, de a mosta példákba rejtve maradak és csupá a maradékváltozóba jeleek meg, mt az egyéb téyezők összetett hatása. A leárs korrelácós együttható: Az előző táblázatba szereplő számítások alapjá köye megadható a leárs korrelácós együttható kokrét értéke: r cov( x, y) var( x) var( y) d d x x d y d y 744,8 0,9 5457,6 669, Az eredméy azt mutatja, hogy a vzsgált két változó között meglehetőse szoros, poztív ráyú kapcsolat tapasztalható. A korrelácós együttható értéke közel áll a +-hez, am arra utal, hogy a regresszós egyees jól lleszkedk a megfgyelés potokhoz. A teljes eltéréségyzet-összeg két részből áll: ( y y) ( yˆ y) SST SSR SSE ( y yˆ ) A teljes égyzetösszeg SST em más, mt d 669,. Ez botható a regresszó által magyarázott (SSR) és em magyarázott (SSE) égyzetösszegekre. y 5

152 Lakás sorszáma Eladás ár Alapterület d y y e y - y (y - y ) e 4, , 7,3,5 -,4 503, 6, ,5 8,8-5, -,0 440,0 7, 3 40,6 7 84,0 37, -3,4 -,5 57,,4 4 40,8 0 80,3 38, -,7 -,7 36,0 7,3 5 45,8 77 5,7 54,7 8,9 4,9 4, 79,0 6 47,6 64 4,7 50,9 3,3,,3 0,9 7 50, 86 0, 57,3 7, 7,5 56,9 50,5 8 5, 9 5,5 59, 7,0 9,3 86,3 48,3 9 56,3 9 4,7 58,8,5 9,0 8,0 6, 0 74, ,8 7,0-3,9, 450,3 5,3 80,3 93,5 64,6-5,7 4,8 9,6 47, Össz. 547, , 0,0 55,8 509,5 Átlag 49,8 60, SSR ( 0,9) 5457,6 55,8 ( y y) és SSE e ˆ 509, 5 Látható, hogy a teljes égyzetösszeg agy háyadát tesz k a magyarázott égyzetösszeg. SSR 55,8 R 0,8 SST 669, Ez úgy értelmezhető, hogy az eladás árba tapasztalt eltérések 8%-át magyaráz tudjuk a lakások alapterületével. A modell magyarázó ereje 8%-os. Az eltérések maradék 9%-át egyéb, tt em tárgyalt téyezők befolyásolják. Itervallumbecslés: A regresszós becslés sorá elkövetett hba: SSE 509,5 s e 7,5 Ez ömagába azt jelet, hogy az egyes lakások ára átlagosa mtegy 7,5mFt-tal tér el attól, amt a regresszós modellel becsül tudák. A paraméterek stadard hbája: s ˆ0 s e s ˆ x d x s e d x 7,5 60, 5457,6 7,5 0, ,6 Ezek tehát a paraméterek mtavétel szóródását kfejező mutatók. 7,89 Ha megbízhatóságot 95%-os szte rögzítjük, akkor t, 6, a keresett kofdeca 0,975(9) tervallumok: It ˆ ( ) t / ( ) s ˆ 0,9,60,047 (0,85;0,397) 5

153 It ( ) ˆ t ( ) s 0 3,8,67,89 ( 0 0 / ˆ 4,67;,07) A paraméterek szeparált tesztelése továbbra s 5%-os szgfkaca szt mellett: A meredekség paraméter tesztelése: H0 H0 : 0 és : 0 A tegelyparaméter tesztelése: t 0,9 0,047 sz H0 0 6,9 : 0 és : 0 H0 0 3,8 t 0sz 0,403 7,89 Ezeket az értékeket a -=0 szabadság fokú t-eloszlás megfelelő redű kvatlsevel kell összehasolíta. Kétoldal próbáról va szó, így a t 0, 975(0) értéket táblázatból kell kkeres. A krtkus tartomáy határa +,6 és -,6. Az első emprkus t-értékük az elutasítás tartomáyba esk, így eze a szgfkaca szte az első regresszós paraméterre voatkozó ullhpotézst elutasítjuk. A esetébe ez azt jelet, hogy va számottevő, léyeg modellezhető kapcsolat az alapterület és az eladás ár között, tehát az alapterület, mt magyarázó változó relevás ebbe a kapcsolatba. A másodk ullhpotézst, amely a tegelymetszetre voatkozk, elfogadjuk, mvel a számított érték az elfogadás tartomáyba esk, azaz a β 0 paraméter értéke em külöbözk szgfkása 0-tól. A β 0 paraméterre voatkozó tesztelés jeletősége ksebb, mvel em tulajdoítaak ek magyarázó erőt a modellbe, de mt lleszkedést javító paramétert általába megtartják akkor s, ha sokaság értéke em külöbözk szgfkása 0-tól. Varacaaalízs: A ullhpotézsük ezúttal s: H0 H0 : 0 és : 0 A korább számításokból smertek a égyzetösszegek értéke, így a varacaaalízs táblája felírható: A Négyzetösszeg Szabadságfok varaca forrása Regresszó SSR=55,8 Maradék SSE=509,5 -=-=9 Teljes SST=665,3 -=0 Átlagos égyzetösszeg 55,8 MSR 55,8 MSR F 38, 08 MSE 56,6 509,5 MSE 9 665,5 MST 0 F A táblázatból kszámított emprkus F-értéket 5%-os szgfkaca szt eseté F 0,95(,9) 5, értékkel kell összehasolíta. Mvel az emprkus próbafüggvéy értéke 53

154 jóval meghaladja az elmélett, dötésük a ullhpotézs ge határozott elutasítása, azaz statsztkalag em támasztható alá az, hogy a külöböző alapterületű kocsk ára közt e lee szgfkás külöbség. 7.4 Fogalmak korrelácószámítás regresszószámítás függvéyszerű kapcsolat sztochasztkus kapcsolat függetle kapcsolat korrelácós kapcsolat kétváltozós regresszó többváltozós regresszó magyarázó változó eredméyváltozó regresszós paraméter rugalmasság együttható rezduum rezduáls szórás regresszós együtthatók hbája kovaraca leárs korrelácós együttható determácós együttható regresszós vagy magyarázott égyzetösszeg (SSR) maradék vagy hbaégyzetösszeg (SSE) 7.5 Típusfeladatok 7.5. Feladat Egy vállalat hav árbevétele (x) és hav üzlet eredméye (y) között kapcsolat egy 0 elemű mta alapjá az y = -9+0,x leárs regresszós függvéyel írható le. A mtába az árbevétel korrgált emprkus szórása 9,8 mlló Ft, az üzlet eredméyé, mlló Ft. Értelmezze a regresszós egyees meredekségét! Határozza meg az árbevétel és az üzlet eredméy között determácós együtthatót, és értelmezze az eredméyt! Megoldás: A regresszós egyees: y = -9+0,x. Eek meredeksége 0,. Ez azt jeleet, hogy az árbevétel egységy övekedése az üzlet eredméy átlagosa 0, egységy övekedését voja maga utá. Az árbevétel (x) és az üzlet eredméy (y) között determácós együttható meghatározása Egyrészt a determácós együttható: d xd y r d x d y Másrészt a regresszós egyees meredeksége: d x d y b d x Ez utóbb két összefüggésből a determácós együttható: 54

155 55 y x y x x d d b r d d r d b A megadott emprkus szórások felhaszálásával x d és y d meghatározható: , 9,8 0 x x x x s d d x x s 89 0,, 0 y y y y s d d y y s A determácós együttható: 0,7937 0,98 864,36, 0 y x d d b r A determácós együttható megadja, hogy az eredméyváltozó (y) varacáját mekkora háyadba magyarázza a magyarázó változó (x). Esetükbe ez azt jelet, hogy az üzlet eredméy varacáját (változékoyságát) 79,37%-ba magyarázza az árbevétel Feladat Teherhajók tömege (x) és krakodás dejük (y) között a tapasztalat leárs korrelácós együttható értéke egy 0 elemű mta alapjá 0,87. A mtába a hajótömegek korrgált tapasztalat szórása 7, toa, a krakodás dőé, óra. Háy %-ba magyarázza a krakodás dő varacáját a teherhajók tömege? Adja meg a krakodás dő és a hajótömeg között regresszós egyees meredekségét! Megoldás: A determácós együttható megadja, hogy az eredméyváltozó (y) varacáját mekkora háyadba magyarázza a magyarázó változó (x). Esetükbe a korrelácós együttható értéke 0,87. Eek égyzete 0,7569 a determácós együttható értéke, azaz a krakodás dő varacájáak 75,69%-át magyarázza a teherhajók tömege. A regresszós egyees meredekségéek meghatározása: Egyrészt a regresszós egyees meredeksége: x y x d d d b Másrészt a korrelácós együttható: y x y x d d d d r Ez utóbb két összefüggésből a regresszós egyees meredekségére: x y y x x d d r b d d r d b A megadott emprkus szórások felhaszálásával x d és y d meghatározható:

156 s y y GAZDASÁGSTATISZTIKA II. rész. A matematka statsztka alapja y d y x x d x s x d x x A regresszós egyees meredekségéről tudjuk, hogy b d y 39,69 r 0,87 d x 466,56 d y 0,54 s 0, 39, 69 y s 0 7, A teherhajók tömegéek egységy övekedése a krakodás dő átlagosa 0,54 egységy övekedését eredméyez Feladat Kísérletképpe egy áruházlác 8 azoos méretű üzletébe egy ap egy adott fajta prémum csokoládét 8 külöböző áro árultak, és fgyelték a keresletet. Bolt sorszáma Csokoládé ára (Ft/tábla) Eladott táblák száma Összese Néháy tovább adat: d 400 d x y d xd y 5535 e 6 Becsülje meg és értelmezze a leárs regresszó paraméteret! Tesztelje a β paraméter szgfkacáját 95%-os megbízhatósággal! Számítsa k és értelmezze a detemácós együtthatót! Megoldás: A leárs regresszó paramétereek meghatározása: ˆ d x d y ,08 d 400 x Ameybe a csokoládé ára táblákét Ft-tal magasabb, az eladott meység átlagosa 6,08 táblával kevesebb. ˆ y ˆ 0 x x 335 y 86,

157 ˆ ˆ 0 y x 86,375 6, ,75 Ameybe a csokoládé ára 0 Ft, az eladott meység 898,75 tábla. A β paraméter szgfkacájáak tesztelése 95%-os megbízhatósággal: : 0 és : 0 H0 H0 s e e s ˆ ( y ˆ y ) 6 6,6 8 se 6,6 0,0 d 400 x Ez az érték (0,0) azt fejez k, hogy a lehetséges becsült b paraméterek átlagosa 0,374 egységgel szóródak az alapsokaság regresszófüggvéy β paramétere körül, lehetséges összes 8 elemű mta eseté. ˆ 6,08 t sz 59,6 0,0 s Krtkus érték: t 0,975 (DF=8): ±,45 Mvel a számított érték az elutasítás tartomáyba esk, így a β paraméter szgfkás. Determácós együttható számítás és értelmezése: d xd y 5535 r 0,984 d d x y r ( 0,984) 0,968 A csokoládé táblákét ára 96,8%-ba magyarázza az eladott meység szóródását Feladat 0 véletleszerűe kválasztott gazdálkodó szervezetél megvzsgálták az éves ettó árbevételek (x) az adózott eredméyre (y) gyakorolt hatását. A felmérésből a következő részeredméyek smeretesek: x 578, 6mFt y 9, 4mFt s x 74, 8mFt Szóráségyzet forrása Négyzetösszeg Szabadságfok Átlagos égyzetösszeg Regresszó (SSR) Hbatéyező (SSE) 733, Teljes (SST) 860,0 Írjuk be a táblázat háyzó adatat! Határozzuk meg a leárs korrelácós együtthatót és értelmezzük az eredméyt! Számítsuk k a leárs regresszófüggvéy paraméteret és értelmezzük azokat! Írjuk fel a regresszófüggvéyt! Teszteljük a modell egészét! Határozzuk meg a rugalmasság együtthatót x=600 mft helye és értelmezzük az eredméyt! 57

158 Megoldás: Táblázat háyzó adataak feltöltése: Szóráségyzet forrása Négyzetösszeg Szabadságfok Átlagos égyzetösszeg Regresszó (SSR) = ,=6,9 6,9 Hbatéyező (SSE) 733, 8 9,6375 Teljes (SST) 860,0 9 A leárs korrelácós együttható meghatározása és értelmezése: 6,9 SSR 6,9 s yˆ, SST 860,0 s y 86 0,69 r 0, Közepese szoros kapcsolat va a ettó árbevétel és az adózott eredméy között. Leárs regresszófüggvéy paramétere és értelmezése: d x sx 74, 8mFt ,64 s y b s 3,64 0, ,8 y r sx b 0,0386 y b x 9,4 0, ,6 0 yˆ b0 b x 6,9 0, 0386x 6,9 Ameybe mft-tal agyobb az árbevétel, akkor átlagosa 36,6 ezerft-tal magasabb az adózott eredméy. Modell tesztelése: H0 H0 : 0 és : 0 SSR / 6,9 F sz,9 SSE /( ) 9,3675 F krt ( 5%,,8) 5,3 Mvel a számított érték agyobb, mta a krtkus érték, így a ullhpotézst elutasítjuk, a regresszófüggvéy szgfkás. Rugalmasság számítása és értelmezése x=600mft-ál ˆ x 0, El( yˆ, x) 0,77% ˆ ˆ 6,9 0, x A ettó árbevétel %-os övekedése az adózott eredméy 0,77%-os övekedését eredméyez átlagosa az x=600mft ettó árbevétel köryezetébe. 58

159 7.6 Elmélet kérdések. Mlye lehet a kapcsolat két smérv között? Jellemezze e kapcsolatokat!. Mutassa be a kétváltozós regresszós modellt! Értelmezze a regresszós paramétereket! 3. Mlye mutatókkal jellemezhető a regresszós becslés hbája? Hogya értelmezhetőek a kapcsolódó mutatók? 4. M a regresszós együtthatók tervallumbecsléséek a léyege, célja? 5. Hogya alkalmazhatóak a hpotézsvzsgálatok a regresszófüggvéy eredméyeek elleőrzésére? 59

160 8. Idősorok elemzése 35,36 A gazdálkodó egységek tevékeységéek egyk meghatározó téyezője, hogy meyre képesek a jövőbe lát, és így mlye skerrel képesek jövőre voatkozó stratéga kalakítására és az ezzel kapcsolatos stratéga dötések megalapozására. A gazdaság-társadalm életbe ktütetett szerepe va azokak az előrejelzésekek, amelyek a foglalkoztatottság, a mukaélkülség, a jövedelmek vagy az árak, lletve egy-egy vállalat esetébe a termékek rát keresletek, a készletezések, vagy az erőforrások, köztük pl. a mukaerő-szükséglet változásáak a progózsát jeletk. A jövő előrejelzésébe agy szerepük va az dőbel változások vzsgálatáak és az dősoros elemzések felhaszálásáak. Az dősorok elemezése lehetőséget teremt a múlt megértésére és megmagyarázására, és ezek alapjá a jövőre törtéő előrejelzésre. Az dősorok jövőbel értékeek előrejelzése törtéhet kvattatív és/vagy kvaltatív eszközökkel. A kvattatív módszerek a múltbel formácók (dősorok) felhaszálásával készülek vagy ömagába a vzsgált jeleségre voatkozó dősorra támaszkodva, vagy a vzsgált jeleséggel összefüggésbe lévő más változókat s bevova (regresszóra alapozva). A kvaltatív módszerek pedg szakértők által készített becslések. A fejezet célja, hogy külöböző módszereket mutasso be a múltra voatkozó összefüggések feltárásához, és egybe alapot adjo a jövőre voatkozó előrejelzések készítéséhez. Egyes dőpotokba, általába azoos dőközökét végzett megfgyelések sorozatát (tapasztalat) dősorak evezzük. Ebbe az esetbe tehát az X változó dőpotokat jelöl (továbbakba t-vel jelöljük) valójába em sztochasztkus jellegű, s eek függvéyébe vzsgáljuk a sztochasztkusa változó Y értékek alakulását. Ilye jellegű adatsorokat a gazdaság, társadalm élet jellemzésére, vzsgálatára gyakra haszáluk. Idősorokra példa a Magyarországo évete felsőfokú végzettséget szerző hallgatók száma, a BUX dex ap záró értéke, a ap maxmum hőmérséklet, egy bolt ap, het vagy hav árbevétele, egy bzoyos termék havota értékesített meysége, stb. A matematka statsztka az dősorokat sztochasztkus folyamat eredméyekét tekt. A vzsgált jeleségek mde egyes dőpotba (vagy dőtartam alatt) elméletleg külöböző értékeket vehetek fel, ugyas értéküket sok-sok egyed téyező együttes hatása alakítja. Az dőtéyezőtől függő Y valószíűség változók sorozatát elmélet dősorak evezzük. A statsztka megfgyelés a tapasztalat dősorra voatkozk, amelyet az elmélet dősor egy lehetséges realzácójáak, megvalósult értékéek, tehát mtáak kell tekte. Ez az dősor elemzés kdulópotja. 8. Az dősorelemzés eszköze Az dősorok vzsgálatáak gyakra alkalmazott eszköze: a vszoyszámok, a grafkus ábrázolás, az átlagok és a külöböző dexszámok. 35 Spegel, Murray R.: Statsztka: Elmélet és gyakorlat, Paem McGraw-Hll, Budapest, Korpás A.-é (szerk.): Általáos statsztka I., II., Nemzet Taköyvkadó, Budapest,

161 A vszoyszám két egymással összefüggő adat háyadosa. A vszoyszámok közül az ú. damkus vszoyszámok alkalmasak az dősorok elemzésére, amelyek két külöböző, összehasolíta kívát dőszak adataak háyadosa. Idősorok sajátosságaak vzsgálatáál célszerű az adatokat ábrázol. A vízsztes tegelye most a t dőpotokat (dőszakokat), a függőleges tegelye a megfelelő y értékeket ábrázoljuk. A szóródás dagramtól eltérőe azoba most voaldagramot célszerűbb készítük, ugyas így köyebbe felsmerhetőek az adatsorba meglévő szabályszerűségek. Példakét a Magyarországo felsőoktatásba tauló lletve dolgozó hallgatók/oktatók számáak 37 alakulását mutatja a következő ábra. 3. ábra: Példa dősor grafkus szemléltetésére A külöböző (jellemzőe voalas) ábrázolás módok mellett természetese dexekkel, átlagokkal s jellemezhetjük az adatokat. Ezekre részletese most em térük k, csak az átlagszámolás tartam- és állapotdősorok között külöbségére hívjuk fel a fgyelmet. Tartamdősorok 38 adata összegezhetők, így átlagolásukra s a szokásos számta átlagot haszálhatjuk. Állapotdősorok 39 egy-egy dőpotra voatkozak, összegükek cs tárgy értelme. Ebbe az esetbe az dősor átlaga az átlagos állomáyagyságot mutatja. Két dőpot eseté ez a ytó- és a záróállomáy számta átlaga. Több dőpot eseté a két-két dőpot között dőszakokra számított átlagos állomáyok számta átlaga. Az így kapott átlagot kroologkus átlagak evezzük (jelölése: Y k ), és kzárólag állapotdősorok adataak átlagolására haszáljuk. A megfgyelt dőpotok adataból (Y, Y, Y ) tehát a kroológkus átlagot az alább összefüggéssel számolhatjuk: Y Y Yt t Yk 37 Forrás: 38 Mozgó sokaságok dőbel alakulását mutatják, a sor eleme egy-egy dőtartam alatt bekövetkező eseméyek adatat mutatják. 39 Álló sokaságok dőbel változását mutatják, a sor eleme egy-egy dőpotra voatkozó állapotfelvételek eredméyet rögzítk. 6

Statisztika. Eloszlásjellemzők

Statisztika. Eloszlásjellemzők Statsztka Eloszlásjellemzők Statsztka adatok elemzése A sokaság jellemzése középértékekkel A sokaság jellemzéséek szempotja A sokaság jellemzéséek szempotja: A sokaság tpkus értékéek meghatározása. Az

Részletesebben

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések! ORVOSI STATISZTIKA Az orvos statsztka helye Életta Aatóma Kéma Lehet kérdés?? Statsztka! Az orvos dötéseket hoz! Mkor jó egy dötés? Meyre helyes egy dötés? Mekkora a tévedés lehetősége? Példa: test hőmérséklet

Részletesebben

? közgazdasági statisztika

? közgazdasági statisztika Valószíűségszámítás és a statsztka Valószíűség számítás Matematka statsztka Alkalmazott statsztka? közgazdaság statsztka épesség statsztka orvos statsztka Stb. Példa: vércsoportok Az eloszlás A AB B Elem

Részletesebben

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre Statsztka I. 4. előadás Előadó: Dr. Ertsey Imre KÖZÉPÉRTÉKEK A statsztka sor általáos jellemzésére szolgálak, a statsztka sokaságot egy számmal jellemzk. Számított középértékek: matematka számítás eredméyekét

Részletesebben

? közgazdasági statisztika

? közgazdasági statisztika ... Valószíűségszámítás és a statsztka Valószíűség számítás Matematka statsztka Alkalmazott statsztka? közgazdaság statsztka épesség statsztka orvos statsztka Stb. Példa: vércsoportok Az eloszlás A AB

Részletesebben

A sokaság/minta eloszlásának jellemzése

A sokaság/minta eloszlásának jellemzése 3. előadás A sokaság/mnta eloszlásának jellemzése tpkus értékek meghatározása; az adatok különbözőségének vzsgálata, a sokaság/mnta eloszlásgörbéjének elemzése. Eloszlásjellemzők Középértékek helyzet (Me,

Részletesebben

Megállapítható változók elemzése Függetlenségvizsgálat, illeszkedésvizsgálat, homogenitásvizsgálat

Megállapítható változók elemzése Függetlenségvizsgálat, illeszkedésvizsgálat, homogenitásvizsgálat Megállapítható változók elemzése Függetleségvzsgálat, lleszkedésvzsgálat, homogetásvzsgálat Ordáls, omáls esetre s alkalmazhatóak a következő χ próbá alapuló vzsgálatok: 1) Függetleségvzsgálat: két valószíűség

Részletesebben

Matematikai statisztika

Matematikai statisztika Matematikai statisztika PROGRAMTERVEZŐ INFORMATIKUS alapszak, A szakiráy Arató Miklós Valószíűségelméleti és Statisztika Taszék Természettudomáyi Kar 2019. február 18. Arató Miklós (ELTE) Matematikai statisztika

Részletesebben

Ismérvek közötti kapcsolatok szorosságának vizsgálata. 1. Egy kis ismétlés: mérési skálák (Hunyadi-Vita: Statisztika I. 25-26. o)

Ismérvek közötti kapcsolatok szorosságának vizsgálata. 1. Egy kis ismétlés: mérési skálák (Hunyadi-Vita: Statisztika I. 25-26. o) Ismérvek között kapcsolatok szorosságáak vzsgálata 1. Egy ks smétlés: mérés skálák (Huyad-Vta: Statsztka I. 5-6. o) A külöböző smérveket, eltérő mérés sztekkel (skálákkal) ellemezhetük. a. évleges (omáls)

Részletesebben

Statisztikai. Statisztika Sportszervező BSc képzés NBG GI866G4. Statisztika fogalma. Statisztikai alapfogalmak. Statisztika fogalma

Statisztikai. Statisztika Sportszervező BSc képzés NBG GI866G4. Statisztika fogalma. Statisztikai alapfogalmak. Statisztika fogalma Statsztka Sportszervező BSc képzés NBG GI866G4 010-011-es taév II félév Statsztka alapfogalmak Oktató: Dr Csáfor Hajalka főskola doces Vállalkozás-gazdaságta Tsz E-mal: hcsafor@ektfhu Statsztka alapfogalmak

Részletesebben

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika BIOSTATISZTIKA ÉS INFORMATIKA Leíró statisztika Első közelítésbe a statisztikai tevékeységeket égy csoportba sorolhatjuk, de ezek között ics éles határ:. adatgyűjtés, 2. az adatok áttekithetővé tétele,

Részletesebben

Matematikai statisztika elıadás III. éves elemzı szakosoknak. Zempléni András 9. elıadásból (részlet)

Matematikai statisztika elıadás III. éves elemzı szakosoknak. Zempléni András 9. elıadásból (részlet) Matematka statsztka elıadás III. éves elemzı szakosokak Zemplé Adrás 9. elıadásból részlet Y közelítése függvéyével Gyakor eset, hogy em smerjük a számukra érdekes meység Y potos értékét pl. holap részvéy-árfolyam,

Részletesebben

Tartalomjegyzék. 4.3 Alkalmazás: sorozatgyártású tűgörgő átmérőjének jellemzése

Tartalomjegyzék. 4.3 Alkalmazás: sorozatgyártású tűgörgő átmérőjének jellemzése 3 4 Tartalomegyzék. BEVEZETÉS 5. A MÉRÉS 8. A mérés mt folyamat, fogalmak 8. Fotosabb mérés- és műszertechka fogalmak 4.3 Mérés hbák 8.3. Mérés hbák csoportosítása eredetük szert 8.3. A hbák megeleítés

Részletesebben

AZ OPTIMÁLIS MINTANAGYSÁG A KAPCSOLÓDÓ KÖLTSÉGEK ÉS BEVÉTELEK RELÁCIÓJÁBAN

AZ OPTIMÁLIS MINTANAGYSÁG A KAPCSOLÓDÓ KÖLTSÉGEK ÉS BEVÉTELEK RELÁCIÓJÁBAN AZ OPTIMÁLIS MINTANAGYSÁG A KAPCSOLÓDÓ KÖLTSÉGEK ÉS BEVÉTELEK RELÁCIÓJÁBAN Molár László Ph.D. hallgató Mskolc Egyetem, Gazdaságelmélet Itézet 1. A MINTANAGYSÁG MEGHATÁROZÁSA EGYSZERŐ VÉLETLEN (EV) MINTA

Részletesebben

A MATEMATIKAI STATISZTIKA ELEMEI

A MATEMATIKAI STATISZTIKA ELEMEI A MATEMATIKAI STATISZTIKA ELEMEI Az Eötvös Lórád Tudomáyegyetem Természettudomáy Kará a Fzka Kéma Taszék évek óta kéma-szakos taárhallgatókak matematka bevezetõ elõadásokat tart. Az elõadások célja az,

Részletesebben

STATISZTIKA. ltozók. szintjei, tartozhatnak: 2. Előad. Intervallum skála. Az adatok mérési m. Az alacsony mérési m. Megszáml Gyakoriság módusz

STATISZTIKA. ltozók. szintjei, tartozhatnak: 2. Előad. Intervallum skála. Az adatok mérési m. Az alacsony mérési m. Megszáml Gyakoriság módusz A változv ltozók k mérés m sztje STATISZTIKA. Előad adás Az adatok mérés m sztje, Cetráls mutatók A változv ltozók k az alább típusba t tartozhatak: Nomáls (kategorkus és s dszkrét) Ordáls Itervallum skála

Részletesebben

Feladatok és megoldások a 11. heti gyakorlathoz

Feladatok és megoldások a 11. heti gyakorlathoz Feladatok és megoldások a. het gyakorlathoz dszkrét várható érték Építőkar Matematka A. Egy verseye öt ő és öt férf verseyző dul. Tegyük fel, hogy cs két azoos eredméy, és md a 0! sorred egyformá valószíű.

Részletesebben

A paramétereket kísérletileg meghatározott yi értékekre támaszkodva becsülik. Ha n darab kisérletet (megfigyelést, mérést) végeznek, n darab

A paramétereket kísérletileg meghatározott yi értékekre támaszkodva becsülik. Ha n darab kisérletet (megfigyelést, mérést) végeznek, n darab öbbváltozós regresszók Paraméterbecslés-. A paraméterbecslés.. A probléma megfogalmazása A paramétereket kísérletleg meghatározott y értékekre támaszkodva becsülk. Ha darab ksérletet (megfgyelést, mérést

Részletesebben

Példák 2. Teljes eseményrendszer. Tulajdonságok. Példák diszkrét valószínőségi változókra

Példák 2. Teljes eseményrendszer. Tulajdonságok. Példák diszkrét valószínőségi változókra Valószíőségszámítás és statsztka elıadás fo. BSC/B-C szakosokak 3. elıadás Szeptember 28 dszkrét valószíőség változókra X(ω)=c mde ω-ra. Elevezés: elfajult eloszlás. P(X=c)=1. X akkor 1, ha egy adott,

Részletesebben

Matematikai statisztika

Matematikai statisztika Matematka statsztka 8. elıadás http://www.math.elte.hu/~arato/matstat0.htm Kétmtás eset: függetle mták + + + = + ) ( ) ( ) ( Y Y X X Y X m m m t m Ha smert a szórás: (X elemő, σ szórású, Y m elemő, σ szórású),

Részletesebben

Tulajdonságok. Teljes eseményrendszer. Valószínőségi változók függetlensége. Példák, szimulációk

Tulajdonságok. Teljes eseményrendszer. Valószínőségi változók függetlensége. Példák, szimulációk Valószíőségszámítás és statsztka elıadás fo. BSC/B-C szakosokak 3. elıadás Szeptember 26 p 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 A bomáls és a hpergeom. elo. összehasolítása 0 1 2 3 4 5 6 7 8 9 10 k Hp.geom

Részletesebben

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük. Statisztikai módszerek. BMEGEVGAT01 Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudomáyi Egyetem Gépészméröki Kar Hidrodiamikai Redszerek Taszék 1111, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:

Részletesebben

Mérési adatok feldolgozása. 2008.04.08. Méréselmélet PE_MIK MI_BSc, VI_BSc 1

Mérési adatok feldolgozása. 2008.04.08. Méréselmélet PE_MIK MI_BSc, VI_BSc 1 Mérés adatok feldolgozása 2008.04.08. Méréselmélet PE_MIK MI_BSc, VI_BSc Bevezetés A mérés adatok külöböző formába, általába ömlesztve jeleek meg Ezeket az adatokat külöböző szempotok szert redez kértékel

Részletesebben

Azonos névleges értékű, hitelesített súlyokból alkotott csoportok együttes mérési bizonytalansága

Azonos névleges értékű, hitelesített súlyokból alkotott csoportok együttes mérési bizonytalansága Azoos évleges értékű, htelesített súlyokból alkotott csoportok együttes mérés bzoytalasága Zeleka Zoltá* Több mérés feladatál alkalmazak súlyokat. Sokszor ezek em egyekét, haem külöböző társításba kombácókba

Részletesebben

Ökonometria. /Elméleti jegyzet/

Ökonometria. /Elméleti jegyzet/ Ökoometra /Elmélet jegyzet/ Ökoometra /Elmélet jegyzet/ Szerző: Nagy Lajos Debrece Egyetem Gazdálkodástudomáy és Vdékfejlesztés Kar (1.,., 3., 4., 5., 6., és 9. fejezet) Balogh Péter Debrece Egyetem Gazdálkodástudomáy

Részletesebben

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje. 24. tétel valószíűségszámítás elemei. valószíűség kiszámításáak kombiatorikus modellje. GYORISÁG ÉS VLÓSZÍŰSÉG meyibe az egyes adatok a sokaságo belüli részaráyát adjuk meg (törtbe vagy százalékba), akkor

Részletesebben

BIOMATEMATIKA ELŐADÁS

BIOMATEMATIKA ELŐADÁS BIOMATEMATIKA ELŐADÁS 10. A statisztika alapjai Debrecei Egyetem, 2015 Dr. Bérczes Attila, Bertók Csaád A diasor tartalma 1 Bevezetés 2 Statisztikai függvéyek Defiíció, empirikus várható érték Empirikus

Részletesebben

Hipotéziselmélet. Statisztikai próbák I. Statisztikai próbák II. Informatikai Tudományok Doktori Iskola

Hipotéziselmélet. Statisztikai próbák I. Statisztikai próbák II. Informatikai Tudományok Doktori Iskola Hpotézselmélet Iformatka Tudomáyok Doktor Iskola Statsztka próbák I. 0.0.. Dr Ketskeméty László előadása Statsztka próbák II. Dötés eljárást dolgozuk k aak eldötésére, hogy a ullhpotézs gaz-e. Ha úgy kell

Részletesebben

Matematika B4 I. gyakorlat

Matematika B4 I. gyakorlat Matematika B4 I. gyakorlat 2006. február 16. 1. Egy-dimeziós adatredszerek Va valamilye adatredszer (számsorozat), amelyről szereték kiszámoli bizoyos dolgokat. Az egyes értékeket jelöljük z i -vel, a

Részletesebben

Korreláció- és regressziószámítás

Korreláció- és regressziószámítás Korrelácó- és regresszószámítás sztochasztkus kapcsolat léyege az, hogy a megfgyelt sokaság egységeek egyk smérv szert mlyeségét, hovatartozását smerve levoható ugya bzoyos következtetés az egységek másk

Részletesebben

2. Az együttműködő villamosenergia-rendszer teljesítmény-egyensúlya

2. Az együttműködő villamosenergia-rendszer teljesítmény-egyensúlya II RÉZ 2 EJEZE 2 Az együttműködő vllamoseerga-redszer teljesítméy-egyesúlya 2 A frekveca és a hatásos teljesítméy között összefüggés A fogyasztó alredszerbe a fogyasztók hatásos wattos teljesítméyt lletve

Részletesebben

BEVEZETÉS AZ SPSS ALAPJAIBA. (Belső használatra)

BEVEZETÉS AZ SPSS ALAPJAIBA. (Belső használatra) BEVEZETÉS AZ SPSS ALAPJAIBA (Belső haszálatra) TARTALOMJEGYZÉK. Statsztka alapfogalmak..... Sokaság...4.2. Ismérvek és mérés skálák...6.3. Statsztka sorok...7 2. SPSS alapfogalmak...9 3. Alapvető statsztka

Részletesebben

Változók függőségi viszonyainak vizsgálata

Változók függőségi viszonyainak vizsgálata Változók függőség vszoyaak vzsgálata Ismétlés: változók, mérés skálák típusa kategoráls változók Asszocácós kapcsolat számszerű változók Korrelácós kapcsolat testsúly (kg) szemüveges em ő 1 3 férf 5 3

Részletesebben

Adatfeldolgozás, adatértékelés. Dr. Szűcs Péter, Dr. Madarász Tamás Miskolci Egyetem, Hidrogeológiai Mérnökgeológiai Tanszék

Adatfeldolgozás, adatértékelés. Dr. Szűcs Péter, Dr. Madarász Tamás Miskolci Egyetem, Hidrogeológiai Mérnökgeológiai Tanszék Adatfeldolgozás, adatértékelés Dr. Szűcs Péter, Dr. Madarász Tamás Mskolc Egyetem, Hdrogeológa Mérökgeológa Taszék A vzsgált köryezet elemek, lletve a felszí alatt közeg megsmerése céljából számtala külöböző

Részletesebben

GEOFIZIKA / 4. GRAVITÁCIÓS ANOMÁLIÁK PREDIKCIÓJA, ANALITIKAI FOLYTATÁSOK MÓDSZERE, GRAVITÁCIÓS ANOMÁLIATEREK SZŰRÉSE

GEOFIZIKA / 4. GRAVITÁCIÓS ANOMÁLIÁK PREDIKCIÓJA, ANALITIKAI FOLYTATÁSOK MÓDSZERE, GRAVITÁCIÓS ANOMÁLIATEREK SZŰRÉSE MSc GEOFIZIKA / 4. BMEEOAFMFT3 GRAVITÁCIÓS ANOMÁLIÁK REDIKCIÓJA, ANALITIKAI FOLYTATÁSOK MÓDSZERE, GRAVITÁCIÓS ANOMÁLIATEREK SZŰRÉSE A gravtácós aomálák predkcója Külöböző feladatok megoldása sorá - elsősorba

Részletesebben

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak Valószíűségszámítás és statisztika előadás ifo. BSC/B-C szakosokak 6. előadás október 16. A matematikai statisztika tárgya Következtetések levoása adatok alapjá Ipari termelés Mezőgazdaság Szociológia

Részletesebben

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya Matematikai statisztika előadás survey statisztika MA szakosokak 206/207 2. félév Zempléi Adrás. előadás: Bevezetés Irodalom, követelméyek A félév célja Matematikai statisztika tárgya Törtéet Alapfogalmak

Részletesebben

STATISZTIKA II. kötet

STATISZTIKA II. kötet Szeged Tudomáyegyetem Gazdaságtudomáy Kar Petres Tbor Tóth László STATISZTIKA II. kötet Szerzők: Dr. Petres Tbor, PhD egyetem doces Statsztka és Demográfa Taszék Tóth László PhD-hallgató Gazdaságtudomáy

Részletesebben

Tapasztalati eloszlás. Kumulált gyakorisági sorok. Példa. Értékösszegsor. Grafikus ábrázolás

Tapasztalati eloszlás. Kumulált gyakorisági sorok. Példa. Értékösszegsor. Grafikus ábrázolás Matemata statszta elıadás III. éves elemzı szaosoa 009/00. élév. elıadás Tapasztalat eloszlás Mde meggyeléshez (,,, ) / súlyt redel. Valószíőségeloszlás! Mtaátlag éppe ee az eloszlása a várható értée.

Részletesebben

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Gyakorisági sorok Mennyiségi ismérv jellemző rangsor készítünk. (pl. napi jegyeladások száma) A gyakorisági sor képzése igazából tömörítést jelent Nagyszámú

Részletesebben

Statisztikai adatok elemzése

Statisztikai adatok elemzése Statszta adato elemzése Gazdaságstatszta A soaság jellemzése özépértéeel Eloszlásjellemző A soaság jellemzésée szempotja A soaság jellemzésée szempotja: A soaság tpus értéée meghatározása. Az adato ülöbözőségée

Részletesebben

1 k < n(1 + log n) C 1n log n, d n. (1 1 r k + 1 ) = 1. = 0 és lim. lim n. f(n) < C 3

1 k < n(1 + log n) C 1n log n, d n. (1 1 r k + 1 ) = 1. = 0 és lim. lim n. f(n) < C 3 Dr. Tóth László, Fejezetek az elemi számelméletből és az algebrából (PTE TTK, 200) Számelméleti függvéyek Számelméleti függvéyek értékeire voatkozó becslések A τ() = d, σ() = d d és φ() (Euler-függvéy)

Részletesebben

A Secretary problem. Optimális választás megtalálása.

A Secretary problem. Optimális választás megtalálása. A Secretary problem. Optmáls választás megtalálása. A Szdbád problémáa va egy szté lasszusa tethető talá természetesebb vszot ehezebb változata. Ez a övetező Secretary problem -a evezett érdés: Egy állásra

Részletesebben

MINTAVÉTEL A MARKETINGKUTATÁSBAN, KÜLÖNÖS TEKINTETTEL A DIVIZÍV ÉS AZ AGGLOMERATÍV RÉTEGZÉSRE

MINTAVÉTEL A MARKETINGKUTATÁSBAN, KÜLÖNÖS TEKINTETTEL A DIVIZÍV ÉS AZ AGGLOMERATÍV RÉTEGZÉSRE MINTAVÉTEL A MARKETINGKUTATÁSBAN, KÜLÖNÖS TEKINTETTEL A DIVIZÍV ÉS AZ AGGLOMERATÍV RÉTEGZÉSRE Molár László egyetem taársegéd 1. BEVEZETÉS A statsztkusok a mtaagyság meghatározására számos módszert dolgoztak

Részletesebben

VII. A határozatlan esetek kiküszöbölése

VII. A határozatlan esetek kiküszöbölése A határozatla esetek kiküszöbölése 9 VII A határozatla esetek kiküszöbölése 7 A l Hospital szabály A véges övekedések tétele alapjá egy függvéy értékét egy potba közelíthetjük az köryezetébe felvett valamely

Részletesebben

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet): A umerikus sorozatok fogalma, határértéke (A TÁMOP-4-8//A/KMR-9-8 számú projekt keretébe írt egyetemi jegyzetrészlet): Koverges és diverges sorozatok Defiíció: A természetes számoko értelmezett N R sorozatokak

Részletesebben

KTK. Dr. Herman Sándor Dr. Rédey Katalin. Statisztika I. PÉCSI TUDOMÁNYEGYETEM. Közgazdaságtudományi Kar. Alapítva: 1970

KTK. Dr. Herman Sándor Dr. Rédey Katalin. Statisztika I. PÉCSI TUDOMÁNYEGYETEM. Közgazdaságtudományi Kar. Alapítva: 1970 Dr. Herma Sádor Dr. Rédey Katal Statsztka I. PÉCSI TUDOMÁNYEGYETEM KTK Közgazdaságtudomáy Kar Alapítva: 97 Mde jog fetartva. Jele köyvet vagy aak részletet a szerző egedélye élkül bármlye formába vagy

Részletesebben

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos Középérték Középérték A középérték a statisztikai adatok tömör számszerű jellemzése. helyzeti középérték: módusz medián számított középérték: számtani átlag kronológikus átlag harmonikus átlag mértani

Részletesebben

A pályázat címe: Rugalmas-képlékeny tartószerkezetek topológiai optimalizálásának néhány különleges feladata

A pályázat címe: Rugalmas-képlékeny tartószerkezetek topológiai optimalizálásának néhány különleges feladata 6. év OTKA zárójeletés: Vezető kutató:kalszky Sádor OTKA ylvátartás szám T 4993 A pályázat címe: Rugalmas-képlékey tartószerkezetek topológa optmalzálásáak éháy külöleges feladata (Részletes jeletés) Az

Részletesebben

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik. Számsorozatok 2015. december 22. 1. Alapfeladatok 1. Feladat: Határozzuk meg az a 2 + 7 5 2 + 4 létezik. sorozat határértékét, ha Megoldás: Mivel egy tört határértéke a kérdés, ezért vizsgáljuk meg el

Részletesebben

2012.03.01. Méréselmélet PE_MIK MI_BSc, VI_BSc 1

2012.03.01. Méréselmélet PE_MIK MI_BSc, VI_BSc 1 Mérés adatok feldolgozása 202.03.0. Méréselmélet PE_MIK MI_BSc, VI_BSc Bevezetés A mérés adatok külöböző formába, általába ömlesztve jeleek meg Ezeket az adatokat külöböző szempotok szert redez kértékel

Részletesebben

Kutatói pályára felkészítı modul

Kutatói pályára felkészítı modul Kutatói pályára felkészítı modul Kutatói pályára felkészítı kutatási ismeretek modul Tudomáyos kutatási alapayag feldolgozása, elemzési ismeretek KÖRNYEZETGAZDÁLKODÁSI MÉRNÖKI MSc TERMÉSZETVÉDELMI MÉRNÖKI

Részletesebben

1. A radioaktivitás statisztikus jellege

1. A radioaktivitás statisztikus jellege A radioaktivitás időfüggése 1. A radioaktivitás statisztikus jellege Va N darab azoos radioaktív atomuk, melyekek az atommagja spotá átalakulásra képes. tegyük fel, hogy ezek em bomlaak tovább. Ekkor a

Részletesebben

A heteroszkedaszticitásról egyszerûbben

A heteroszkedaszticitásról egyszerûbben Mûhely Huyad László kaddátus, egyetem taár, a Statsztka Szemle főszerkesztője A heteroszkedasztctásról egyszerûbbe E-mal: laszlo.huyad@ksh.hu A heteroszkedasztctás az ökoometra modellezés egyk kulcsfogalma,

Részletesebben

Függvénygörbe alatti terület a határozott integrál

Függvénygörbe alatti terület a határozott integrál Függvéygörbe alatt terület a határozott tegrál Tektsük az üggvéyt a ; tervallumo. Adjuk becslést a görbe az tegely és az egyees között síkdom területére! Jelöljük ezt a területet I-vel! A becslést legegyszerűbbe

Részletesebben

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum) Az átlagra voatkozó megbízhatósági itervallum (kofidecia itervallum) Határozzuk meg körül azt az itervallumot amibe előre meghatározott valószíűséggel esik a várható érték (µ). A várható értéket potosa

Részletesebben

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció

Részletesebben

Ha n darab standard normális eloszlású változót négyzetesen összegzünk, akkor kapjuk a χ 2 - eloszlást: N

Ha n darab standard normális eloszlású változót négyzetesen összegzünk, akkor kapjuk a χ 2 - eloszlást: N Krály Zoltá: Statsztka II. Bevezetés A paraméteres eljárások alkalmazásához, a célváltozóra ézve szgorú feltételek szükségesek (folytoosság, ormaltás, szóráshomogetás), ekkor a hpotézseket egy-egy paraméterre

Részletesebben

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések! ORVOSI STATISZTIKA Az orvos statsztka helye Élettan Anatóma Kéma Lehet kérdés?? Statsztka! Az orvos döntéseket hoz! Mkor jó egy döntés? Mennyre helyes egy döntés? Mekkora a tévedés lehetősége? Példa: test

Részletesebben

Információs rendszerek elméleti alapjai. Információelmélet

Információs rendszerek elméleti alapjai. Információelmélet Iformácós redszerek elmélet alaja Iformácóelmélet A forrás kódolása csatora jelekké 6.4.5. Molár Bált Beczúr Adrás NMMMNNMNfffyyxxfNNNNxxMNN verzazazthatóvsszaálímdeveszteségcsaakkorfüggvéykódolásaakódsorozat:eredméyekódolássorozatváltozó:forás

Részletesebben

ÁLTALÁNOS STATISZTIKA

ÁLTALÁNOS STATISZTIKA Berzseny Dánel Főskola ÁLTALÁNOS STATISZTIKA műszak menedzser alapszak Írta: Dr. Köves János Tóth Zsuzsanna Eszter Budapest 006 Tartalomjegyzék. VALÓSZÍNŰSÉGSZÁMÍTÁSI ALAPOK... 4.. A VALÓSZÍNŰSÉGSZÁMÍTÁS

Részletesebben

Statisztika 1. zárthelyi dolgozat március 21.

Statisztika 1. zárthelyi dolgozat március 21. Statisztika 1 zárthelyi dolgozat 011 március 1 1 Legye X = X 1,, X 00 függetle mita b paraméterű Poisso-eloszlásból b > 0 Legye T 1 X = X 1+X ++X 100, T 100 X = X 1+X ++X 00 00 a Milye a számra igaz, hogy

Részletesebben

Statisztikai hipotézisvizsgálatok

Statisztikai hipotézisvizsgálatok Statisztikai hipotézisvizsgálatok. Milye problémákál haszálatos? A gyakorlatba agyo gyakra szükségük lehet arra, hogy mitákból származó iformációk alapjá hozzuk sokaságra voatkozó dötéseket. Például egy

Részletesebben

Bevezető Mi a statisztika? Mérés Csoportosítás

Bevezető Mi a statisztika? Mérés Csoportosítás Gazdaságstatisztika 1. előadás Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Oktatók Előadó Kóczy Á. László (koczy.laszlo@kgk.bmf.hu) Fogadóóra: szerda 11:30 11:55, TA125 Gyakorlatvezető

Részletesebben

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai 05..04. szórások vizsgálata z F-próba Hogya foguk hozzá? Nullhipotézis: a két szórás azoos, az eltérés véletle (mitavétel). ullhipotézishez tartozik egy ú. F-eloszlás. Szabadsági fokok: számláló: - evező:

Részletesebben

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet A biostatisztika alapfogalmai, kofideciaitervallum Dr. Boda Krisztia PhD SZTE ÁOK Orvosi Fizikai és Orvosi Iformatikai Itézet Mitavétel ormális eloszlásból http://www.ruf.rice.edu/~lae/stat_sim/idex.html

Részletesebben

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő.

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő. 3. SOROZATOK 3. Sorozatok korlátossága, mootoitása, kovergeciája Defiíció. Egy f : N R függvéyt valós szám)sorozatak evezük. Ha A egy adott halmaz és f : N A, akkor f-et A-beli értékű) sorozatak evezzük.

Részletesebben

VASBETON ÉPÜLETEK MEREVÍTÉSE

VASBETON ÉPÜLETEK MEREVÍTÉSE BUDAPET MŰZAK É GAZDAÁGTUDOMÁY EGYETEM Építőmérök Kar Hdak és zerkezetek Taszéke VABETO ÉPÜLETEK MEREVÍTÉE Oktatás segédlet v. Összeállította: Dr. Bód stvá - Dr. Farkas György Dr. Kors Kálmá Budapest,.

Részletesebben

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben Propositio 1 (Jese-egyelőtleség Ha f : kovex, akkor tetszőleges ξ változóra f (M (ξ M (f (ξ feltéve, hogy az egyelőtleségbe szereplő véges vagy végtele várható értékek létezek Bizoyítás: Megjegyezzük,

Részletesebben

4 2 lapultsági együttható =

4 2 lapultsági együttható = Leíró statsztka Egy kísérlet végeztével általában tetemes mennységű adat szokott összegyűln. Állandó probléma, hogy mt s kezdjünk - lletve mt tudunk kezden az adatokkal. A statsztka ebben segít mnket.

Részletesebben

Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X = 1) = p Ind(p) P(X = 0) = 1 p. Leíró és matematikai statisztika

Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X = 1) = p Ind(p) P(X = 0) = 1 p. Leíró és matematikai statisztika Leíró és matematikai statisztika Matematika alapszak, matematikai elemző szakiráy Zempléi Adrás Valószíűségelméleti és Statisztika Taszék Matematikai Itézet Természettudomáyi Kar Eötvös Lorád Tudomáyegyetem

Részletesebben

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia Valószíűségszámítás és statisztika előadás ifo. BSC/B-C szakosokak 6. előadás október 5. Megjegyzések. A tétel feltételei gyegíthetőek: elég, ha a függetle, azoos eloszlású változók várható értéke véges.

Részletesebben

1. előadás: Bevezetés. Irodalom. Számonkérés. A valószínűségszámítás és a statisztika tárgya. Cél

1. előadás: Bevezetés. Irodalom. Számonkérés. A valószínűségszámítás és a statisztika tárgya. Cél Valószíűségszámítás és statsztka előadás fo. BSC/B-C szakosokak 1. előadás szeptember 13. 1. előadás: Bevezetés Irodalom, követelméyek A félév célja Valószíűségszámítás tárgya Törtéet Alapfogalmak Valószíűségek

Részletesebben

4 TÁRSADALMI JELENSÉGEK TÉRBELI EGYÜTTMOZGÁSA

4 TÁRSADALMI JELENSÉGEK TÉRBELI EGYÜTTMOZGÁSA ELTE Regoáls Földrajz Taszék 005 4 TÁRSADALMI JELENSÉGEK TÉRBELI EGYÜTTMOZGÁSA 4. Általáos szempotok A terület folyamatok, a tagoltság vzsgálata szte sohasem szűkül le egy-egy jeleség (mutatószám) térbel

Részletesebben

Izsák János. ELTE TTK Állatrendszertani és Ökológiai Tanszék. Kézirat

Izsák János. ELTE TTK Állatrendszertani és Ökológiai Tanszék. Kézirat BIOSTATISZTIKAI ALAPISMERETEK Izsák Jáos ELTE TTK Állatredszerta és Ökológa Taszék Kézrat Budapest, 5 Tartalomjegyzék Előszó 4. Valószíűség vektorváltozók 6.. Bevezetés 6.. A többváltozós, specálsa kétváltozós

Részletesebben

2. METROLÓGIA ÉS HIBASZÁMíTÁS

2. METROLÓGIA ÉS HIBASZÁMíTÁS . METROLÓGIA ÉS HIBASZÁMíTÁS. Metrológa alapfogalmak A metrológa a mérések tudomáya, a mérésekkel kapcsolatos smereteket fogja össze. Méréssel egy objektum valamlye tulajdoságáról számszerű értéket kapuk.

Részletesebben

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó. I. Függelék A valószíűségszámítás alapjai I.1. Alapfogalamak: Véletle jeleség: létrejöttét befolyásoló összes téyezőt em ismerjük. Tömegjeleség: a jeleség adott feltételek mellett akárháyszor megismételhető.

Részletesebben

Regresszió és korreláció

Regresszió és korreláció Regresszó és korrelácó regresso: vsszatérés, hátrálás; vsszafordulás correlato: vszo, összefüggés, kölcsöösség KAD 01.11.1 1 (vsszatérés, hátrálás; vsszafordulás) Regresszó és korrelácó Gakorlat megközelítés

Részletesebben

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer? 01.09.18. Hpotézs vzsgálatok Egy példa Kérdések (példa) Hogyan adhatunk választ? Kérdés: Hatásos a lázcsllapító gyógyszer? Hatásos-e a gyógyszer?? rodalomból kísérletekből Hpotézsek A megfgyelt változó

Részletesebben

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Statisztika

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Statisztika Statisztika A statisztika adatok gyűjtésével, redszerezésével, illetve adatsorok elemzésével, szemléltetésével foglalkozik. Adatok redszerezése DEFINÍCIÓ: (Populáció) Populációak (statisztikai sokaságak)

Részletesebben

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága Sorozatok, határérték fogalma. Függvéyek határértéke, folytoossága 1) Végtele valós számsorozatok Fogalma, megadása Defiíció: A természetes számok halmazá értelmezett a: N R egyváltozós valós függvéyt

Részletesebben

Hiba! Nincs ilyen stílusú szöveg a dokumentumban.-86. ábra: A példa-feladat kódolási változatai

Hiba! Nincs ilyen stílusú szöveg a dokumentumban.-86. ábra: A példa-feladat kódolási változatai közzétéve a szerző egedélyével) Öfüggő szekuder-változó csoport keresése: egy bevezető példa Ez a módszer az állapothalmazo értelmezett partíció-párok elméleté alapul. E helye em lehet céluk az elmélet

Részletesebben

Backtrack módszer (1.49)

Backtrack módszer (1.49) Backtrack módszer A backtrack módszer kombatorkus programozás eljárás, mely emleárs függvéy mmumát keres feltételek mellett, szsztematkus kereséssel. A módszer előye, hogy csak dszkrét változókat kezel,

Részletesebben

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x

Részletesebben

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Alkalmazott Informatikai Tanszék

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Alkalmazott Informatikai Tanszék Mskol Egyetem Gépészmérök és Iformatka Kar Alkalmazott Iformatka Taszék 2012/13 2. félév 9. Előadás Dr. Kulsár Gyula egyetem does Matematka modellek a termelés tervezésébe és ráyításába Néháy fotosabb

Részletesebben

Valószínűségszámítás. Ketskeméty László

Valószínűségszámítás. Ketskeméty László Valószíűségszámítás Ketskeméty László Budapest, 996 Tartalomjegyzék I. fejezet VALÓSZÍNŰSÉGSZÁMÍTÁS 3. Kombatorka alapfogalmak 4 Elleőrző kérdések és gyakorló feladatok 6. A valószíűségszámítás alapfogalma

Részletesebben

A matematikai statisztika elemei

A matematikai statisztika elemei A matematikai statisztika elemei Mikó Teréz, dr. Szalkai Istvá szalkai@almos.ui-pao.hu Pao Egyetem, Veszprém 2014. március 23. 2 Tartalomjegyzék Tartalomjegyzék 3 Bevezetés................................

Részletesebben

Bevezetés a hipotézis vizsgálatba. Hipotézisvizsgálatok. Próbák leírása. Kétoldali és egyoldali hipotézisek. Illeszkedésvizsgálatok

Bevezetés a hipotézis vizsgálatba. Hipotézisvizsgálatok. Próbák leírása. Kétoldali és egyoldali hipotézisek. Illeszkedésvizsgálatok Bevezetés a hpotézs vzsgálatba Lásd előadás ayagát. Kétoldal és egyoldal hpotézsek Hpotézsvzsgálatok Ebbe a ejezetbe egyajta határozókulcsot szereték ad a hpotézsvzsgálatba haszált próbákhoz. Először dötsük

Részletesebben

PDF created with FinePrint pdffactory Pro trial version Irodalom.

PDF created with FinePrint pdffactory Pro trial version   Irodalom. r etskemétyászló matematkus http://wwwketskemetyhu laszlo@ketskemetyhu kela@sztbmehu : +36/70/3 00 5 0 egjelet az ötvös adó godozásába orgalmazza a Cytotechft egjeleés éve: 005 Jellemzők: 459 o, 94 cm

Részletesebben

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok 1999. október hó: (adott a vastagon szedett!) S i g i z i g i z i

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok 1999. október hó: (adott a vastagon szedett!) S i g i z i g i z i . konzult. LEV. 013. ápr. 5. MENNYISÉGI ISMÉRV szernt ELEMZÉS Tk. 3-8., 88-90. oldal, kmarad: 70., 74. oldal A mennység smérv (X) lehet: dszkrét és folytonos. A rangsor a mennység smérv értékenek monoton

Részletesebben

Miért pont úgy kombinálja kétfokozatú legkisebb négyzetek módszere (2SLS) az instrumentumokat, ahogy?

Miért pont úgy kombinálja kétfokozatú legkisebb négyzetek módszere (2SLS) az instrumentumokat, ahogy? Mért pot úgy kombálja kétfokozatú legksebb égyzetek módszere (2SLS az strumetumokat, ahogy? Kézrat A Huyad László 60. születésapjára készülő köyvbe Kézd Gábor 2004. júlus A Budapest Corvus Egyetem rövd

Részletesebben

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció

Részletesebben

[GVMGS11MNC] Gazdaságstatisztika

[GVMGS11MNC] Gazdaságstatisztika [GVMGS11MNC] Gazdaságstatisztika 1. előadás Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem Oktatók Előadó Kóczy Á. László (koczy.laszlo@kgk.uni-obuda.hu)

Részletesebben

Eseményalgebra, kombinatorika

Eseményalgebra, kombinatorika Eseméyalgebra, kombiatorika Eseméyalgebra Defiíció. Véletle kísérletek evezük mide olya megfigyelést, melyek több kimeetele lehetséges, és a véletletől függ, (azaz az általuk figyelembevett feltételek

Részletesebben

Matematika I. 9. előadás

Matematika I. 9. előadás Matematika I. 9. előadás Valós számsorozat kovergeciája +-hez ill. --hez divergáló sorozatok A határérték és a műveletek kapcsolata Valós számsorozatok mootoitása, korlátossága Komplex számsorozatok kovergeciája

Részletesebben

Információs rendszerek elméleti alapjai. Információelmélet

Információs rendszerek elméleti alapjai. Információelmélet Iformácós redszerek elmélet alapja Iformácóelmélet Glbert-Moore Szemléltetése hasoló a Shao kódhoz A felezőpotokra a felezős kódolás A felezőpot értéke bttel hosszabb kfejtést géyel /2 0 x x x p p 2 p

Részletesebben

( a b)( c d) 2 ab2 cd 2 abcd 2 Egyenlőség akkor és csak akkor áll fenn

( a b)( c d) 2 ab2 cd 2 abcd 2 Egyenlőség akkor és csak akkor áll fenn Feladatok közepek közötti egyelőtleségekre (megoldások, megoldási ötletek) A továbbiakba szmk=számtai-mértai közép közötti egyelőtleség, szhk=számtaiharmoikus közép közötti egyelőtleség, míg szk= számtai-égyzetes

Részletesebben

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015 A mérés problémája a pedagógiában Dr. Nyéki Lajos 2015 A mérés fogalma Mérésen olyan tevékenységet értünk, amelynek eredményeként a vizsgált jelenség számszerűen jellemezhetővé, más hasonló jelenségekkel

Részletesebben

Adatsorok jellegadó értékei

Adatsorok jellegadó értékei Adatsorok jellegadó értéke Varga Ágnes egyetem tanársegéd varga.ag14@gmal.com Terület és térnformatka kvanttatív elemzés módszerek BCE Geo Intézet Terület elemzés forgatókönyve vacsora hasonlat Terület

Részletesebben

Sta t ti t s i zt z i t k i a 3. előadás

Sta t ti t s i zt z i t k i a 3. előadás Statisztika 3. előadás Statisztika fogalma Gyakorlati tevékenység Adatok összessége Módszertan A statisztika, mint gyakorlati tevékenység a tömegesen előforduló jelenségek egyedeire vonatkozó információk

Részletesebben