STATISZTIKA II. kötet

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "STATISZTIKA II. kötet"

Átírás

1 Szeged Tudomáyegyetem Gazdaságtudomáy Kar Petres Tbor Tóth László STATISZTIKA II. kötet

2 Szerzők: Dr. Petres Tbor, PhD egyetem doces Statsztka és Demográfa Taszék Tóth László PhD-hallgató Gazdaságtudomáy Kar

3 Másodk kötet

4 Tartalomjegyzék 7. Statsztka mták módszere Általába a mtákról A véletle mtavétel 7.3. A mtajellemzők és a sokaság jellemzők kapcsolata Véletle mtavétel tervek 4 8. Mta alapjá törtéő becslések Becslőfüggvéyek és tulajdoságak Potbecslés Itervallumbecslés Itervallumbecslés FAE mta eseté Itervallumbecslés EV mta eseté Itervallumbecslés R mta eseté 6 9. Hpotézsek vzsgálata Alapfogalmak Egymtás próbák Két függetle mtás próbák Több függetle mtás próbák 86 4

5 . Damkus elemzés 93.. Egyszerű elemzés módszerek 93.. Mozgó átlagok módszere Aaltkus tredszámítás Szezoáls gadozások elemzése 33. Többváltozós regresszó- és korrelácószámítás 38.. Többváltozós regresszószámítás 38.. Többváltozós korrelácószámítás Multkolleartás, autokorrelácó, heteroszkedasztctás Általáosított legksebb égyzetek módszere Főkompoes aalízs 374 Tesztkérdések 385 Tárgymutató 396 Képletgyűjteméy 44 Statsztka táblázatok 47 Irodalom 43 5

6 7. Statsztka mták módszere 7.. Általába a mtákról Az.3. fejezetbe már smertettük, hogy mlye módszerekkel juthatuk statsztka adatokhoz. Itt említettük meg azt s, hogy az adatgyűjtés (körét tektve) lehet teljes vagy részleges, de ezekkel em foglalkoztuk részletese. A továbbakba azoba eek a témáak több fgyelmet szetelük. Teljes körű megfgyelés A teljes körű adatfelvétel klasszkus példája a épszámlálás. Népszámlálást már a Róma Brodalomba s végeztek. A cezus szó a épszámlálás szomájává vált, és azóta s mde ország statsztka hvataláak legkomolyabb (legtöbb erőforrást géylő) feladata. Magyarországo a emzetköz gyakorlatak megfelelőe általába évekét tartaak épszámlálást. (Megjegyzés: a épszámlálások között dőszakba egy ú. mkrocezust s leboyolítaak. Ez azoba em teljes körű.) Legutóbb - be volt hazákba lye összeírás. A több mllárd fortba kerülő adatfelvételt a Közpot Statsztka Hvatal (KSH). február elejé kezdte meg. A három hétg tartó mukába megközelítőleg 4 számlálóbztos vett részt. A válaszadás állampolgár kötelesség, az adatszolgáltatás megtagadása pézbírsággal bütethető. A épszámlálással kapcsolatba a parlamet külö törvéyt alkot. Részleges megfgyelés A épszámlálás példájá vlágossá vált, hogy egyes gazdaság, társadalm jeleségek teljes megfgyelése alapuló vzsgálata agyo költséges, esetleg lehetetle. A gyakorlat egyre gyakrabba alkalmazza a részleges adatgyűjtést, külöösképpe aak egyk módját, a reprezetatív megfgyelést. A reprezetatív adatgyűjtés célja, hogy a sokaság egy részéek megfgyeléséből következtessük aak egészére. Azt a sokaságot, amelyre a reprezetatív megfgyelés segítségével következtetük alapsokaságak vagy sokaságak (jelöljük pl. A-val), az alapsokaság azo részét, amelyet megfgyelük mtasokaságak vagy mtáak (jelöljük pl. a-val) evezzük. Eek megfelelő llusztrácó a 7. ábrá látható. 6

7 7.. Általába a mtákról A mtavétel grafkus modellje A a a A 7. ábra Az alapsokaság lehet véges vagy végtele, de a mtasokaság mdg véges elemszámú. Mtavétel és emmtavétel hba A mta alapjá a sokaság jellemzők, a em teljes körű megfgyelés matt, csak bzoyos hbával közelíthetőek. Fotos azoba megkülöböztetük ezt a részlegességből adódó hbát a több hbalehetőségtől, ezért ezt mtavétel hbáak fogjuk evez. Azokat a hbalehetőségeket, amelyek md a teljes, md a részleges megfgyelés sorá feállak emmtavétel hbákak evezzük. Ezek (mt például a defícós, válaszadás, végrehajtás hba) a statsztka muka mde fázsába előfordulhatak. A tervezés sorá defícós hba az, ha a kérdőív potatlaul, hbása va megszerkesztve, az adatgyűjtéssel kapcsolatos fogalmak em tsztázottak, stb. Az adatgyűjtés sorá törtéhetek válaszadás hbák, amkor az adatszolgáltató szádékosa vagy öhbájá kívül a valóságak em megfelelő adatokat szolgáltat az adatfelvétel tárgyáról, a megfgyelés egységről. Az adatfelvétel (a tervezetek) em megfelelő elvégzése végrehajtás hbát jelet. Természetese a feldolgozás fázsába s törtéhet potatlaság, például adatrögzítés hba. A mtavétel megbízhatóságát a emmtavétel és a mtavétel hba agysága együttese jellemz. A emmtavétel hbák agyságára csak előző tapasztalatok 7

8 7. Statsztka mták módszere alapjá vagy szubjektív módó következtethetük, míg a mtavétel hba elmélet megfotolásokra támaszkodva matematka-statsztka eszközökkel becsülhető. Ezzel a továbbakba majd külö s foglalkozuk. A emmtavétel hba bemutatására smertetük két részleges adatgyűjtést. Háztartás-statsztka Az egyk legagyobb elemszámú mtavételre példa a KSH háztartás-statsztka felvétele. Évete körülbelül ezer háztartást kérek fel arra, hogy bevételekről és kadásakról aplót vezesseek. A felvétel,-,3%-os mtájáak statsztka mutató természetese ksebb potosságúak, mt a teljes körű épszámlálás vagy a %-os mtájú mkrocezus adata. A mtavétel hbá kívül tovább torzítást eredméyez, hogy a háztartás költségvetés felvételek em tartalmazzák a legjobb és legrosszabb életkörülméyek között élők adatat. Ez a felvétel ugyas ökétes, így a leggazdagabb rétegek (emzetköz tapasztalatok s ezt mutatják) általába elzárkózak az adatszolgáltatástól. A lakcímmel em redelkező hajléktalaok szté em kerülek bele a felmérésbe. A részvétel megtagadása mellett a másk legagyobb torzító téyező a jövedelmek tedecózus elttkolása, általába a gazdagabb háztartásokba, de az alacsoyabb jövedelműek körébe s. Az említett jellemzők matt a háztartás-statsztka közleméyekbe a valóságosál kevesebb magas jövedelmű és több alacsoy jövedelmű háztartás szerepel. Ezt szem előtt kell tarta az adatok felhaszálása sorá. Közvéleméy-kutatás A közvéleméy- és packutatással általába erre szakosodott tézetek foglalkozak. Ezek adatakat szte kzárólag mtavételes felvétel útjá yerk. Az egyk leggyakorbb közvéleméy-kutatás téma az állampolgárok pártpreferecájára voatkozk. Eek felmérésére általába havota körülbelül főt kérdezek meg személyes megkereséssel. A mtába kerülő személyeket a szavazásra jogosult állampolgárok közül teljes véletlet bztosító módszerrel választják k úgy, hogy az alapsokaság és a megkérdezettek összetétele megegyezze. A pártpreferecák felmérése sorá több torzító téyező s előfordul, amely emmtavétel hbát eredméyez. Ilye például az, hogy a szélsőséges pártok szmpatzása általába elhallgatják véleméyüket, és bzoytalaak modják magukat a szavazatukat lletőe. 8

9 7.. Általába a mtákról A következő példáál (elletétbe ez előző kettővel) a részleges megfgyelés már em tartalmaz válaszadás hbát. Gyógyszerek hatásosságáak vzsgálata Újoa kfejlesztett gyógyszerek hatásosságáak vzsgálatára s gyakra alkalmazzák a mtavétel módszeret. Egy adott betegségbe szevedők közül kválasztaak éháyat, és kezelések vetk alá őket. Ezzel párhuzamosa megfgyelek egy olya csoportot (kotrollcsoport), amelyek tagja hatóayag élkül gyógyszert, ú. placebót kapak. Ilye esetbe a statsztka eszközevel arra kereshetjük a választ, hogy a két csoport egészség állapotába bekövetkezett változások között va-e statsztkalag jeletős, ú. szgfkás külöbség. 9

10 7. Statsztka mták módszere 7.. A véletle mtavétel Ahhoz, hogy a mtavétel hba matematka-statsztka eszközökkel kezelhető legye olya mtát kell választa, amely valamlye értelembe reprezetálja a sokaságot. Erre egy lehetséges eljárás a véletle mtavétel. A továbbakba törvéyszerűségeket foguk megfogalmaz olya mtákra voatkozóa, amelyek elemet az alapsokaságból úgy választottuk k, hogy mde sokaság elem előre adott valószíűséggel kerülhetett a mtába. (Megjegyzés: a véletle fogalmával most em foglalkozuk részletese, aak értelmezése a valószíűségszámításból smertek; véletlee valamlye valószíűséggel bekövetkező eseméyt értük.) Véletle számok előállítása és alkalmazása Ha a sokaság mde egyes tagjához egy sorszámot redelük, akkor a mtavétel véletleszerűségéek bztosításához egy olya számsort kell megaduk, amelyek eleme egyelő valószíűséggel kerültek kválasztásra. Ilye számsort háromféleképpe s kaphatuk. Sorsolás: például cédulákra felírt sorszámokat húzuk k egy urából, amelyet előtte jól megkevertük. Véletle számok táblázata: létezek olya táblázatok, amelyek ú. pszeudovéletle számsorozatokat tartalmazak. (Ezeket a számsorozatokat matematka képletekkel állították elő.) Úgy haszáljuk őket, hogy ksorsoljuk valamely sorát és oszlopát, és az ott található számtól kezdve folyamatosa kolvassuk a táblázatba szereplő számokat. Ha a táblázatba szereplő számok közül olyahoz érük, amelyk agyobb a sokaság elemszámáál, akkor azt átugorjuk. Gép sorsolás: a számológépek legtöbbjébe va beépített véletleszám-geerátor. Eek többször meghívásával készíthetjük el a mtába kerülő elemek sorszámaak sorozatát. Véletle számokat az Ecel segítségével s kaphatuk. A VÉL() paraméter élkül függvéy meghívásával -ál agyobb vagy egyelő és - él ksebb egyeletes eloszlású véletle számot kapuk. (Ezt fel kell szorozuk a sokaság elemszámával és hozzá kell aduk egyet, ahhoz hogy sorszámot kapjuk.)

11 7.. A véletle mtavétel Eél összetettebb és több beállítás lehetőséget tartalmaz az Eszközök meü Adatelemzés almeüjébe a Véletleszám-geerálás pael. Itt egy egész tartomáyt tölthetük fel egymástól függetle véletle számokkal. Az ezt megelőzőe smertetett eljárások egyeletes eloszlású véletle számokat adak, mert a leggyakrabba ezt haszáljuk. A véletleszám-geerálás párbeszédpaeljébe azoba mód va többféle eloszlás beállítására és azok paramétereek megadására. A mtajellemzők, mt valószíűség változók Egy adott sokaságból egy véletleszerűe kválasztott egyed smérvértéke (a pror) véletleek tekthető. Ezt a véletletől függő smérvértéket ezért mt valószíűség változót fogjuk tekte. Egy többelemű mta valamlye jellemző adata szté valószíűség változó. Egy adott elemszámú (azoos módo végrehajtott) mtavétel agyo sokféle mtajellemzőt eredméyezhet, a mták statsztka jellemző mtáról mtára változhatak, attól függőe, hogy mely sokaság elemek kerültek a mtába. A véletle mtavétel eredméyekét kapott részsokaságot valószíűség mtáak s evezzük. A fetekkel való összhag érdekébe azt fogjuk feltételez, hogy dszkrét sokaságak valószíűségeloszlással, míg folytoos sokaságak eloszlásfüggvéyükkel adottak. (Megjegyzés: az eddgekbe kább azt a megközelítést követtük, hogy a sokaságak elemek felsorolásával adottak. Ez természetese csak véges sokaság eseté lehetséges. Igaz persze, hogy a gyakorlatba szte kzárólag véges sokaságokkal találkozuk, ám a statsztka tárgyából adódóa ezek agy elemszámú sokaságok, gyakorlatlag végteleek tekthetőek. Ezzel szembe a mtát mdg elemeek felsorolásával adjuk meg, mert az mdg véges.) Mtaelemek kválasztása vsszatevéssel vagy vsszatevés élkül A mtavétel sorá a mtaelemek kválasztásáál két eltérő módszer létezk. Az egyk szert a már khúzott elemeket azoal vsszahelyezzük az alapsokaságba, így ugyaazo elem többször s beválogatható a mtába. Ezt a módszert vsszatevéses

12 7. Statsztka mták módszere mtavételek (leggyakrabba FAE 6) -ek) evezzük. A másk módszer szert a kválasztásra került mtaelemeket em rakjuk vssza, így mde sokaság egység csak egyszer kerülhet az adott mtába. Ezt a módszert vsszatevés élkül mtavételek (leggyakrabba EV 7) -ek) evezzük. Egy N elemszámú sokaságból vsszatevéses mtavétellel elemet k N FAE (5) féleképpe választhatuk k. Egy N elemszámú sokaságból vsszatevés élkül mtavétellel elemet N k EV (53) féleképpe választhatuk k. 58. példa A 7.. fejezetbe említett háztartás-statsztka felvétel eseté mey a lehetséges mták száma, ha az ország megközelítőe 3,8 mlló háztartásából veszük ezres elemszámú mtát? Legye N 3,8 és. 6 Az összes lehetséges FAE mták száma (5) szert: 4 k FAE ( 3,8 ) ( 3,8) ( ) ( 3,8 ) A megfelelő műveletek elvégzése utá a következő eredméyt kapjuk: k 6,9. FAE 6) Az FAE rövdítés arra utal, hogy a vsszatevéses mtavétel eseté a mtaelemek függetle és azoos eloszlású valószíűség változók, hsze a mtaelemeket egymástól függetleül választjuk k és mdg ugyaabból a sokaságból, az alapsokaságból. 7) Az EV rövdítés a vsszatevés élkül módszert haszáló mtavétel terv elevezésére, az egyszerű véletle mtavételre utal.

13 7.. A véletle mtavétel Az összes lehetséges EV mták száma (53) szert: 6 6 ( 3,8 )! ( )! 3,8! 3,8 k EV 4. Eek kszámításához felhaszáljuk az ú. STIRLING-féle összefüggést:! π e , 88 ahol > értékekre a zárójelbe levő kfejezés elhayagolható. Ezt felhaszálva: k EV π ,8 3,8 π 3,8 ( 3,8 ) e ( ) e π 3,79 ( 3,79 ) 6 3,79 e 6 3,79. A megfelelő műveletek elvégzése utá a következő eredméyt kapjuk: 33 k 4,6. EV Megjegyzés: a kapott eredméyek agyságredjéek érzékeltetése végett, összevetésül megemlítjük, hogy a Vlágegyetemük tömege megközelítőleg csak gramm! (Paul Daves: Az utolsó három perc, Kulturtrade Kadó Kft, Bp., 994.) 56 Adott alapsokaság eseté az Ecel segítségével s k tuduk választa véletle mtát. Vgyük be az alapsokaságuk adatat egy mukatartomáyba, majd az Eszközök meü Adatelemzés... almeüjébe hívjuk meg a Mtavétel meüpotot. A Bemeet tartomáy mezőbe adjuk meg az alapsokaságot tartalmazó mukatartomáyt. Két mtavétel módszer közül választhatuk: A Perodkus dőszak: választókapcsoló segítségével szsztematkus kválasztást (ezt a 7.4. fejezetbe részletesebbe smertetjük) végezhetük, míg a A Véletle mták száma: választókapcsolóval smétléses véletle mtát kapuk. Az előbb esetbe meg kell aduk a lépésközt. Ha a program az alapsokaság végére ér, akkor befejez a mtavételt. 3

14 7. Statsztka mták módszere (Megjegyzés: ez a mtavétel módszer csak bzoyos esetekbe tekthető véletle mtavétel módszerek.) A Véletle mtavétel módszert alkalmazva azt tudjuk megad, hogy a program háy véletleszerűe kválasztott cella adatát másolja a Kmeet tartomáy mezőbe. 4

15 7.3. A mtajellemzők és a sokaság jellemzők kapcsolata 7.3. A mtajellemzők és a sokaság jellemzők kapcsolata A mtákból a sokaságra voatkozó következtetések levoását evezzük statsztka dukcóak. Ezzel a statsztka következtetéselmélet foglalkozk. A továbbakba azt fogjuk megvzsgál, hogy melyek azok a törvéyszerűségek, amelyek feljogosítaak mket arra, hogy az alapsokaság egy megfelelő módo kválasztott részsokasága alapjá az alapsokaságra voatkozó állításokat fogalmazzuk meg. Elemezzük egy adott sokaság eseté az (ebből azoos módo kválasztható) elemű mták összességét. Ha mde egyes mtára kszámítjuk valamelyk mtajellemzőt, akkor az adott jellemző eloszlását kaphatjuk meg. A mtajellemzők eloszlását mtavétel eloszlásak evezzük. Vzsgáljuk most meg, hogy mlye tulajdoságokkal redelkezk az egyk legfotosabb mtajellemző, a mtából számított átlag (az ú. mtaátlag). Haszáljuk a következő jelöléseket: a sokaság elemszáma legye N, várható értéke µ, szóráségyzete σ. A mta elemszáma legye, a mtaátlag, szóráségyzete pedg v. Eek megfelelő llusztrácó a 8. ábrá látható. (Megjegyzés: ebbe a fejezetbe tehát v em a relatív szórást jelöl!) A sokaság és a mta fotosabb jellemző N µ σ v < N 8. ábra 5

16 7. Statsztka mták módszere Va-e valamlye kapcsolat a 8. ábrá feltütetett (sokaság és mta-) jellemzők között? A (54)-(56) képletek defálják ezeket a fotos összefüggéseket. A mtaátlagok mtavétel eloszlása A 8. ábrá látható mta csak egy az összes lehetséges mta közül. A mtavétel módszertől függőe ezek száma (5)-(53) szert adott. Természetese mdegykek megva a saját mtajellemzője. Az összes lehetséges mtaátlag gyakorság sorát az 5. táblázat tartalmazza. Az összes lehetséges mták átlagaak eloszlása Mtaátlagok Gyakorságok 5. táblázat f f M k Összese M f k k FAE vagy k EV A fet eloszlásak ktütetett szerepe va a statsztkába, mert ez az összekötő kapocs a mták és a sokaság között. Mt mde gyakorság sorak, eek s va átlaga és szórása. Megkülöböztetésül jelöljük ezeket a következő szmbólumokkal: σ. µ, lletve Az összes lehetséges elemű vsszatevéses mták eseté a mtabel átlagok eloszlásáak várható értéke: E ( ) µ µ (54) és szórása: σ σ. (55) 6

17 7.3. A mtajellemzők és a sokaság jellemzők kapcsolata A vsszatevés élkül mtákra feáll a következő két összefüggés: E ( ) µ µ és σ N σ. (56) N A mtajellemzők szórásával a mtavétel hbát tudjuk jellemez, amely szórásak a statsztkába külö elevezése va: ezt evezzük a mtajellemző stadard hbájáak 8). A stadard hba égyzetét mtavétel szóráségyzetek evezzük. A mtaátlagok eloszlásával kapcsolatba megemlítük éháy fotos téyt. A mtaátlagok eloszlása függ az alapsokaság eloszlásától. Ha az alapsokaság Ha ormáls eloszlású, akkor a mtabel átlagok s ormáls eloszlást követek. 3, akkor az alapsokaság eloszlásától függetleül a mtaátlagok közelítőleg ormáls eloszlásúak leszek µ várható értékkel (ez a valószíűségszámításból smert közpot határeloszlás tételéek következméye) és σ szórással. Ematt a továbbakba a 3 elemszámúál em ksebb mtákat agy mtákak, a 3-ál kevesebb elemet tartalmazó mtákat pedg ks mtákak fogjuk evez. A mtaátlagok eloszlása aál jobba közelít a ormáls eloszlást mél agyobb a mta elemszáma. Az lye típusú eloszlásokat aszmptotkusa ormáls eloszlásokak evezzük. A ormáls eloszlás Az egyk agyo fotos folytoos eloszlás az ú. ormáls eloszlás, vagy GAUSS-féle eloszlás. Eek két paramétere va, amelyeket µ -vel és σ -val jelölük. Az eloszlás sűrűségfüggvéye: 8) A statsztkába fotos szerepe matt kemeljük, hogy a stadard hba egy közöséges szórás, csak em akármelyk eloszlás szórása, haem a mtavétel eloszlás szórása! 7

18 7. Statsztka mták módszere ( ) µ σ f e. (57) σ π A (57) grafkus ábrája az ú. GAUSS-görbe. A ormáls eloszlást jellemző fotosabb mometumokat és mutatószámokat az 53. táblázat tartalmazza. A ormáls eloszlás jellemző várható érték µ 53. táblázat szórás σ ferdeség-mutató ( α 3 ) csúcsosság-mutató ( α 4 ) 3 (57) rövdebb jelölése: N( µ, σ ). Megjegyzés: egy ormáls eloszlású valószíűség változó a (, ) tervallumba bármlye értéket felvehet. A gyakorlatba (gazdaság, társadalm jeleségek vzsgálatáál) lye természetese sohasem fordul elő, de gyakra találkozuk jó közelítéssel ormáls eloszlásúak tekthető sokaságokkal. Például az emberek magasságáak, testtömegéek, értelm sztjéek, stb. gyakorság görbéje megközelítőleg GAUSS-görbe alakú. Általába mde olya jeleség megközelítőleg ormáls eloszlású, amelyet befolyásoló téyezőkre jellemzőek az alábbak: a téyezők száma agy és egymástól függetleek, egyekét hatásuk az összhatáshoz képest kcs, külöböző ráyúak és teztásúak. 8

19 7.3. A mtajellemzők és a sokaság jellemzők kapcsolata Ha ormáls eloszlású valószíűség változókat (55) szert stadardzáljuk, akkor a traszformált változó stadard ormáls eloszlású lesz. (Megjegyzés: az lye változókat a statsztkába gyakra z-vel vagy u-val jelöljük.) Eek sűrűségfüggvéye: z ϕ ( z) e, (58) π grafkoja a 9. ábrá látható. Megjegyzés: fotossága matt kemeljük a z értékhez tartozó valószíűséget. A ϕ( ),39897,4 mde átlagos (ormáls eloszlású) tulajdoság előfordulásáak valószíűségét mutatja. Mvel (az előzőek alapjá) az összes lehetséges mtaátlag s ormáls eloszlású, a sokaság várható értékével egyelő mtaátlag előfordulásáak va a legagyobb valószíűsége, körülbelül 4%. A sokaság várható értékétől jeletőse eltérő mtaátlagok előfordulásáak valószíűsége eél jóval ksebb. A stadard ormáls eloszlás sűrűségfüggvéyéek grafkoja ϕ(z),5,4,3,, -3,5 -,5 -,5 -,5,5,5,5 3,5 z 9. ábra A z stadardzált változó várható értékű és szórású ormáls eloszlású valószíűség változó, azaz 9

20 7. Statsztka mták módszere z N(,). A stadardzált változó uverzálsa haszálható (mvel mértékegység élkül), azaz külöböző típusú sokaságok eseté s alkalmazható összehasolítás céljára. A ormáls eloszlás egyk fotos tulajdosága a következő: µ m z σ (59) tervallumba található ( z,, 3 eseté) az összes (9. ábrá látható) görbe alatt terület 68,7; 95,45 és 99,73%-a. Gyakra azoba szükség va stadard ormáls eloszlású változó eloszlásfüggvéyéek értékere akkor s, ha z em egész szám. Ezekre az esetekre táblázatokat szoktuk haszál. Lásd az I. táblázatot! Ebbe a külöböző z értékek az első tzedes jegyg az első oszlopba szerepelek, míg a másodk tzedes az első sorba va. A táblázat belseje tartalmazza az eloszlásfüggvéy értékeek törtrészét. Ebből a táblázatból vsszafelé s tuduk keres: ha a lefedett terület agysága adott, akkor meg tudjuk moda az tervallumhoz tartozó z értéket. A statsztka rodalomba a (59) szert táblázatot legtöbbször em közlk. Ez azzal magyarázható, hogy az eloszlásfüggvéy (defícójából adódóa) em a (59) szert, haem a (, z) tervallumba adja meg a 9. ábrá látható görbe alatt területet. Eek megfelelő értéket a II. táblázat tartalmazza. M az összefüggés a két táblázatba közölt adatok között? Az összefüggés felírása végett, a (59) szert valószíűségre vezessük be az ( α ) jelölést. Ebből következk, hogy a kegészítő valószíűség α -val egyelő. Például z eseté a valószíűség ( α ) 95,45%; azaz α,9545, 455 ; tehát ( ) 4,55%. Fgyelembe véve a feteket, az I. táblázat közvetleül α -ra, a II. táblázat pedg α -re adja meg a (59) képlethez szükséges megfelelő z értéket. Az I. és a II. táblázat értéket az Ecel segítségével számítottuk k. A statsztka függvéyek közül a STNORMELOSZL(z) függvéy stadard ormáls eloszlású

21 7.3. A mtajellemzők és a sokaság jellemzők kapcsolata változó eloszlásfüggvéyéek értéket adja, míg verzét az INVERZ.STNORM(valószíűség) függvéy segítségével határozhatjuk meg. 59. Példa Mlye z értékre lesz a (59) által adott tervallumhoz tartozó terület az összterület legalább 9%-a? A z,96 értékhez háy százalékos részterület tartozk? Az I. táblázatba közölt elmélet értékek alapjá mdkét kérdés megválaszolható. Keressük meg a táblázatba a 9%-ak (lletve táblázatuk potossága szert,9- ek) megfelelő értéket. (Lásd a 3. ábrát.) Az I. táblázat része z M, , , M 3. ábra Legalább 9%-ak megfelelő terület a vastago szedett,96. Ebbe a sorba z-ek megfelelő szám,6; függőlegese pedg 5; ezért z értéke,65 ( z,6 +,5,65 ). A táblázatba közölt adatok alapjá a 9%-ak megfelelő potosabb értéket em tuduk megállapíta, de az Ecel INVERZ.STNORM(,95) függvéyhívás segítségével ez köye meghatározható: z,

22 7. Statsztka mták módszere Megjegyzés: az említett Ecel függvéy paraméteréél fgyelembe kell ve azt, hogy α valószíűség ( α) helyett valószíűség ( ) -t kell ve, ahol α,9. A z,96 értékhez tartozó terület agyságát szté meg tudjuk határoz az I. táblázatból és az Ecel segítségével s. A táblázatba a 3. ábrá látható módo (vastago szedett,9 és 6 számokál) keressük a megfelelő értéket. A keresett érték tehát,95; vagys z,96 -hoz 95%-os terület tartozk. Az I. táblázat része z M, , , M 3. ábra Mt már említettük, az összes lehetséges mták átlaga ormáls eloszlásúak, ezért felírható a következő összefüggés: N( µ, σ ). (6) Ezek szert, a ormáls eloszlásra voatkozó (eddg említett) tulajdoságok a mtaátlagokra s érvéyesek. A (59) alapjá, gaz a következő összefüggés: µ m z σ. (6)

23 A 3. ábra a z 7.3. A mtajellemzők és a sokaság jellemzők kapcsolata értékhez tartozó területet llusztrálja. A mtaátlagok (6) szert ábrázolása ϕ(z),5,4,3, 95,45%, < µ m σ > z 3. ábra 6. Példa Az összes lehetséges mtaátlag háy százaléka található a µ,58 σ tervallumba; lletve melyk az az tervallum, amely ezekek 99,5%-át tartalmazza? Az I. táblázatba a,58 értékek (,5 és 8 számok kereszteződésébe),99 vagy 99,%-os valószíűség felel meg. Tehát (a mtavétel módszertől függőe),99 k FAE vagy,99 kev m mtaátlag található a vzsgált tartomáyba. Az I. táblázatba a 99,5%-ál em ksebb legközelebb érték,9955. Ehhez z,8 tartozk. A keresett tervallum: µ m,8 σ. Megjegyzés: az összes lehetséges mtaátlag %-át elméletleg a tervallum tartalmazza. z értékkel adott 3

24 7. Statsztka mták módszere 7.4. Véletle mtavétel tervek Függetle, azoos eloszlású mta (FAE) Egyelő valószíűséggel vett vsszatevéses mta eseté függetle, azoos eloszlású mtát (FAE) kapuk. Végtele sokaságból vett vsszatevés élkül mta s FAE mtáak tekthető, hsze ebbe az esetbe a kválasztott elemek em befolyásolják a megmaradó sokaság eloszlását. A gyakorlatba a agy elemszámú sokaságok s (jó közelítésbe) végteleek tekthetőek. Az emprkus elemzésekél (a agy elemszámú sokaságból vett) vsszatevés élkül mtavétel módszert alkalmazzuk leggyakrabba. Egyszerű véletle mta (EV) Ha homogé, véges elemszámú sokaságból vsszatevés élkül kválasztást alkalmazuk, akkor egyszerű véletle mtát (EV) kapuk. Egyszerű véletle mta kválasztásához gyakra alkalmazzák az ú. szsztematkus kválasztást. Eek léyege az, hogyha redelkezük egy lstával a sokaság elemeről, akkor mde k-adk elemet kválasztva véletle mtához jutuk, ameybe a lsta sorba redezéséek alapjául szolgáló és a vzsgál kívát smérv függetle egymástól. N A k lépésköz értékét a k képlettel határozhatjuk meg. A kválasztás kdulópotját véletleszerűe jelöljük k, majd ettől kezdve mde k-adkat kválasztjuk. Ha a lsta végére érük, akkor folytatjuk a lsta elejéről folyamatosa. Eek a módszerek az előye egyszerűségébe va. Rétegzett mta (R) Mde mtavétel tervél felmerül a következő kérdés: hogya lehete olya módo kválaszta a mtát, hogy az mél jobba reprezetálja a sokaságot. A 4.. fejezetbe már láttuk, hogy a heterogé sokaságok (valamlye megfelelőe megválasztott csoportképző smérv szert) gyakra megközelítőleg homogé részsokaságokra bothatóak. Ezt haszáljuk k a rétegzett mtavétel eseté, amelyek végrehajtása a következőképpe törték: először a sokaságot mél homogéebb (a vzsgált smérv szempotjából ksebb szórású) részsokaságokra (átfedésmetese és hézagmetese) 4

25 7.4.Véletle mtavétel tervek botjuk szét. Ezeket a részsokaságokat evezzük rétegekek vagy sztrátumokak. A rétegeke belül ezutá egyszerű véletle mtavételt hajtuk végre. Heterogé sokaságok eseté a rétegzett mtavétel (ugyaakkora agyságú mtát feltételezve) általába ksebb mtavétel hbát eredméyez, mt az EV vagy FAE mta. Az R mta hatásossága azo múlk, hogy skerül-e megfelelőe homogé rétegeket kalakíta. A rétegzett mtavétel tárgyalásához a következőkbe smertetett jelölésredszert alkalmazzuk. A rétegek számát jelölje M, elemszámakat pedg redre: N, N,..., N M ; míg a rétegekből kválasztott elemek száma legye,,..., M. Ezek alapjá a vzsgált sokaság elemszáma: M j N j N, míg a mtaagyság: M j j. A sztrátumok és a rétegekből vett mták más jellemzőre s deeléssel utaluk. A rétegzett mtavételél döteük kell, hogy hogya osztjuk szét a mta teljes elemszámát () a rétegek között. Erre többféle elosztás terv létezk. 5

26 7. Statsztka mták módszere Egyeletes elosztás: az egyes rétegekből azoos számú elemet választuk a mtába. A j-edk sztratumból kválasztott mta elemszáma: j j,,..., M. (6) M Aráyos elosztás: a rétegek elemszámáak sokaságbel aráyát fgyelembe véve törték a kválasztás. A j-edk rétegből kválasztott mta elemszáma: N j j M j N j N j N. (63) Az aráyos elosztás több haszos tulajdosággal redelkezk, ezért a gyakorlatba gyakra alkalmazzák. Ez a mtavétel terv az egyeletes elosztáshoz hasolóa szté egyszerű, tt a sokaságba és a mtába ugyaazok a súlyaráyok szerepelek. Eek következméyekét belátható, hogy az aráyos elosztással yert mtából számított főátlag hbája (a rétegezéstől függetleül) em lehet agyobb, mt EV mta eseté. NEYMAN-féle optmáls elosztás: ha smerjük az egyes részsokaságok vzsgált smérv szert szórását, vagys az egyes rétegek heterogetásáak mértékét, akkor ezt fel tudjuk haszál arra, hogy a sokaságot jobba reprezetáló mtát válasszuk k. A NEYMAN-féle optmáls elosztás eseté a ksebb szórású rétegekből ksebb, míg a agyobb szórású rétegekből agyobb mtát veszük. A j-edk rétegből kválasztott mta elemszáma: j M N σ j j j j N σ j. (64) Ez a mtavétel a főátlagot a legksebb mtavétel hbával közelít, de a gyakorlatba mégs rtká alkalmazzuk, mert a rétegekét szórások általába smeretleek. 6

27 7.4.Véletle mtavétel tervek Csoportos mta (CS) Az eddg mtavétel tervekél feltételeztük, hogy redelkezésükre áll a sokaság összes egyedét tartalmazó lsta, am alapjá a kválasztás elvégezhető. A gyakorlatba lyeel általába em redelkezük, és elkészítése s agyo költséges esetleg lehetetle lee. Ilyekor a sokaságot agyobb összetartozó egységekre botjuk szét, amelyekél a lsta köyebbe beszerezhető. Ha eze összetartozó csoportok (pl. területleg) kocetrálta helyezkedek el, akkor egy csoport teljes körű megfgyelése olcsóbb lehet, mt a más tervek szert kválasztott em kocetrálta elhelyezkedő mtaelemek megfgyelése. A csoportos mtavétel eseté tehát a homogé sokaságot csoportokra botjuk szét (általába természetese adódó módo), és a csoportok halmazából választuk EV mtát, majd a kválasztott csoportokat teljes körűe megfgyeljük. A csoportos mtavétel általába egyszerűbbé és olcsóbbá tesz a felvételt. Potossága a csoportoko belül homogetástól függ. A csoportos mtavétel eseté a rétegzettel elletétbe az ad hatásosabb becslést, ha a csoportok heterogéek, hsze mde elemüket megfgyeljük, így homogé csoportok eseté ez redudás és rotja a hatásosságot. Fotossága matt még egyszer kemeljük, hogy a rétegzett mtavétel akkor hatásos, ha (a megfgyelt smérv szempotjából) a sokaság heterogé és a rétegek homogéek, míg a csoportos mtavétel akkor hatásos, ha a sokaság homogé és a csoportok heterogéek. Többlépcsős mta (TL) A többlépcsős mtavételt hasoló esetekbe alkalmazzuk, mt a csoportos mtavételt. Eél a mtavétel tervél több lépésbe jutuk el a megfgyelés egységekhez. A leggyakorbb a kétlépcsős mtavétel, amelyek sorá (a csoportos mtához hasolóa) csoportokat (elsődleges megfgyelés egység) választuk k a sokaságból, de em fgyeljük meg ezeket teljes körűe, haem újabb mtavételt alkalmazuk a csoportoko belül. A többlépcsős mtavétel előye, hogy az elsődleges megfgyelés egység homogetása eseté csökket a megfgyelés redudacáját, így övel a hatásosságot. A TL mta elosztásáak kérdése boyolultabb az egylépcsős mtákéál, általába arra törekszük, hogy a végső mta a sokaság aráyokak megfelelő legye. 7

28 7. Statsztka mták módszere Az említett mtavétel terveke kívül még számos más s smeretes, de köyvükbe ezekkel em foglalkozuk. A következő két fejezetbe csak az FAE, EV és R mták alkalmazásával foglalkozuk. 8

29 8. Mta alapjá törtéő becslések 8.. Becslőfüggvéyek és tulajdoságak Ahogy azt a 7. fejezetbe már megállapítottuk, céluk az, hogy mta alapjá következtessük az alapsokaságra, lletve aak valamelyk jellemzőjére. Ebbe a fejezetbe olya módszerekkel foglalkozuk, amelyek segítségével egy sokaság valamely jellemzőjét vagy eloszlását, lletve egy statsztka modell valamlye paraméterét tudjuk közelítőleg meghatároz. A becslésük tárgyát képező sokaság jellemzőt a továbbakba Θ -val jelöljük. A sokaság jellemző mtából törtéő közelítő meghatározására szolgáló statsztkát becslőfüggvéyek evezzük. Az,..., mtaelemekhez tartozó, becslőfüggvéyre a következő jelöléssel hvatkozuk: Θˆ (,,..., ) Θˆ Θˆ. A becslőfüggvéy tehát olya statsztka, amely a sokaság jellemzőt a mtajellemzők valamlye függvéyével közelít, és mvel értéke a mtaelemektől függ, vagys mtáról mtára változk, ez s valószíűség változóak tekthető. (A mtavétel végrehajtása utá természetese md a mta, md a becslőfüggvéy értéke realzálódak, tehát a posteror módo már em tekthetőek valószíűség változókak.) Először a potbecsléssel, majd az tervallumbecsléssel foglalkozuk. Potbecslés eseté (a becslőfüggvéyük segítségével) a mtához egyetle számszerű értéket redelük, és ezt tektjük a becsül kívát paraméter értékéek. Itervallumbecslés eseté azoba egy olya tervallumot határozuk meg, amely előre adott agy valószíűséggel tartalmazza a becsül kívát paramétert. Egy sokaság jellemző becslésére természetese többféle becslőfüggvéy s készíthető. A kérdés az, hogy hogya lehet ezeket a statsztkákat összehasolíta, és kválaszta közülük a legjobbat. A becslőfüggvéyeket, mt mde más valószíűség változót, kézefekvő eloszlásukkal, várható értékükkel és varacájukkal jellemez. 9

30 8. Mta alapjá törtéő becslések Torzítatlaság A legalapvetőbb krtérum a becslőfüggvéyekkel szembe, hogy értékük (a külöböző mtáko) a sokaság jellemző körül gadozzo. Torzítatlaak evezük egy becslőfüggvéyt, ha aak várható értéke a becsül kívát sokaság jellemzővel egyelő. Vagys: E ( Θ) ˆ Θ. (65) A torzítás mértékét a Bs ( Θˆ ) Θ E( Θˆ ) (66) mérőszámmal szoktuk kfejez. 9) Bzoyos statsztkákál előfordul, hogy a torzítás mértéke függ a mtaagyságtól. Ha a mtaagyság mde határo túl törtéő övelésekor a becslőfüggvéy torzítatlaá válk, vagys lm Bs ( Θˆ ), akkor azt modjuk, hogy aszmptotkusa torzítatla. A torzítatla becslőfüggvéyek természetese szté aszmptotkusa torzítatlaok. Azt már láttuk, hogy az FAE és az EV mtából számított mtaátlag a sokaság várható érték torzítatla becslése, mvel (54) szert: E ( ) µ. A 3. fejezetbe taglaltak szert, az átlag, lletve a várható érték mellett a sokaságok másk legfotosabb jellemzője a szórás, lletve aak égyzete a varaca. A mtából számított szóráségyzet, amelyet tapasztalat szóráségyzetek evezük, torzította becsül a sokaság varacát. A torzítás mértéke FAE mta eseté: σ Bs(v). 9) A torzított szó agol megfelelője: based. 3

31 8.. Becslőfüggvéyek és tulajdoságak Ha képezzük az s ( ), (67) lletve s k f ( ) (68) becslőfüggvéyt, akkor a sokaság varaca torzítatla becslését kapjuk. E ( s ) σ (69) A (67)-(68) segítségével defált mtajellemzőt korrgált tapasztalat szóráségyzetek, égyzetgyökét korrgált tapasztalat szórásak evezzük. EV mta eseté s égyzetét (7) szert még egy korrekcós téyezővel kell szorozuk, hogy torzítatla becslőfüggvéyt kapjuk. N E s σ (7) N 6. példa A. példáál a. táblázat a kötelező gépjármű-bztosítással foglalkozó társaságok díjbevételeek adatat tartalmazza 999 első egyedévére. Ugyaezeket az adatokat tartalmazza az 54. táblázat s, de most em ezer, haem mlló Ft-ba. Megjegyzés: ezt a példát csak szemléltető gazolás céljából tárgyaljuk, a valóságba lye ks elemszámú sokaságál mdg teljes körű felmérést alkalmazuk (em pedg mtavételt)! 3

32 8. Mta alapjá törtéő becslések 999 első egyedévéek díjbevétele 54. táblázat Bztosítók Díjbevételek (mlló Ft) Argosz 48 Aa Coloa 479 ÁB-Aego 986 Geeral-Provdeca Hugára 8 38 Közlekedés Bztosító Egyesület OTP-Garaca 55 Összese 5 74 Forrás: ÁBIF Az adott sokaságból származó összes lehetséges mta alapjá vzsgáljuk meg, hogy N torzítatla becslőfüggvéy-e az, a v, az s, az s és az s! N A sokaság 7 elemű: N 7. A sokaság eleme: 48, 479, 986, 3456, 838,, 55. A sokaság átlag: X 48, 86. A sokaság szórás: σ 63,4; a varaca: σ , 98. Számításakhoz vegyük pl. kételemű mtákat! Tektsük először az FAE mtákat. Az összes lehetséges kételemű FAE mták száma a (5) képlet szert: k FAE Ezeket a mtákat és a mtákból kszámított mutatókat az 55. táblázat tartalmazza (ahol,,...,49 ). 3

33 Mtaelemek 8.. Becslőfüggvéyek és tulajdoságak Az összes lehetséges kételemű FAE mta és éháy jellemzője v s 55. táblázat 48, 48 48,,,, 48, ,5 65,5 3,5 36,6 48, 986 7, 66 84, 3 68,,67 48, , 9 96, , 4, 48, , , 9 7 5, 5 45,79 48, 64, 6 896, 53 79, 3,93 48, 55 79,5 3 3, ,5 54,7 479, ,5 65,5 3,5 36,6 479, ,,,, 479, 986 3, , ,5 65,6 479, ,5 5 63, ,5 5,6 479, , , ,5 5 45,73 479, 89,5 35 9,5 7 8,5 67,99 479, 55 87, 4 44, 8 488, 478, 986, 48 7, 66 84, 3 68,,67 986, 479 3, , ,5 65,6 986, ,,,, 986, , 54 5, 8 45, 39,45 986, , , , 4 35, 986, 43, , , 333,6 986, 55 57,5 7 64, ,5 587,6 3456, 48 94, 9 96, , 4, 3456, ,5 5 63, ,5 5,6 3456, 986 7, 54 5, 8 45, 39, , ,,,, 3456, , , 96 56, 3 3, , 778, , , 373,5 3456, 55 35, , ,5 67,5 838, , , 9 7 5, 5 45,79 838, , , ,5 5 45,73 838, , , , 4 35, 838, , , 96 56, 3 3,67 838, ,,,, 838, 4 9, , , 5 683,7 838, ,5 9 57, , ,73, 48 64, 6 896, 53 79, 3,93, ,5 35 9,5 7 8,5 67,99, , , , 333,6, , , , 373,5, , , , 5 683,7,,,,,, 55 67, , ,5 746, 55, 48 79,5 3 3, ,5 54,7 55, , 4 44, 8 488, 478, 55, ,5 7 64, ,5 587,6 55, , , ,5 67,5 55, ,5 9 57, , ,73 55, 67, , ,5 746, 55, 55 55,,,, Átlag: 48, , ,98 88,49 s 33

34 8. Mta alapjá törtéő becslések Vzsgáljuk meg, hogy melyk becslőfüggvéy torzítatla, vagys melykek a várható értéke egyezk meg a becsül kívát sokaság jellemzővel. E ( ) , 86 X A vártak megfelelőe a mtaátlag torzítatlaul becsül a sokaság várható értéket. E E ( v), + 65, , , 49 σ , 98 ( s ), + 3, , , 98 σ , E ( s), + 36, , 88, 49 σ 63, Ez alapjá azt látjuk, hogy a (em korrgált) tapasztalat szóráségyzet (v) torzította, míg a korrgált tapasztalat szóráségyzet ( s ) torzítatlaul becsül a sokaság szóráségyzetet. Fotos összefüggés azoba, hogy a sokaság szórást a korrgált tapasztalat szórás s torzította becsül, tehát E (s) σ. Tektsük most az EV mtákat. Az összes lehetséges kételemű EV mták száma a (53) képlet szert: 7 k EV. Ezeket a mtákat és a mtákból kszámított mutatókat az 56. táblázat tartalmazza (ahol,,...,). 34

35 8.. Becslőfüggvéyek és tulajdoságak Az összes lehetséges kételemű EV mta és éháy jellemzője Mtaelemek 56. táblázat N s N 48, ,5 4,7 48, 986 7, 4 98,86 48, , ,86 48, , ,86 48, 64, 46 7,43 48, 55 79,5 6 5,43 479, 986 3, ,7 479, , ,7 479, ,5 5 4,43 479, 89,5 6 56,43 479, 55 87, ,86 986, , 96, 986, , 6 87,43 986, 43, 54 46,86 986, 55 57, ,7 3456, , , , 778, , , 55 35,5 69 4,7 838, 4 9, ,7 838, , ,86, 55 67,5 477,7 Átlag: 48, ,98 E ( ) 453, ,5 48, 86 X E s N N 4, , , 98 σ ,98 Hatásosság Egy torzítatla becslőfüggvéyek lehet olya agy szóródása, hogy ez haszálhatatlaá tesz. A becslőfüggvéy szórása a véletle téyező okozta hba mérőszámáak tekthető. Ezt a szórást a becslőfüggvéy, lletve a becslés stadard 35

36 8. Mta alapjá törtéő becslések hbájáak evezzük. A becslőfüggvéyel szembe tovább elvárt tulajdoság tehát, hogy szórása a lehető legksebb legye. A 7.3. fejezetbe említettekhez hasolóa, a becslőfüggvéy összes lehetséges mtá felvett értékeek szóráségyzetét mtavétel szóráségyzetek evezzük. Jelölése: var(θ) ˆ. A mtavétel szóráségyzet égyzetgyöke a becslés stadard hbája. Jelölése: Se(Θˆ ) ). Se ( Θˆ ) var( Θˆ ). A torzítatla becslőfüggvéyeket hatásosság szempotjából szóráségyzetükkel vagy szórásukkal hasolítjuk össze, a ksebb szórású statsztkát hatásosabbak (effcesebbek) evezzük. Vegyük például a következő esetet: legye a sokaság várható érték becslőfüggvéye a mdekor mta első eleme, azaz Θ ˆ. A mtaátlaghoz hasolóa ez a statsztka s torzítatlaul becsül a várható értéket, de eek stadard hbája például FAE mta eseté Se( ) σ, míg a mtaátlagé a (55) szert hogy az utóbb hatásosabb becslése a várható értékek. Se ( ) σ. Ebből következk, Bzoyos esetekbe létezk olya torzítatla becslőfüggvéy, amelyél ksebb szóráségyzetű statsztka em készíthető. Az lye becslőfüggvéyeket mmáls szóráségyzetű torzítatla vagy (abszolút) hatásos torzítatla becslőfüggvéyekek evezzük. Az aszmptotkusa torzítatla becslőfüggvéy fogalmához hasolóa haszáljuk az aszmptotkusa hatásos becslőfüggvéy elevezést. A Θˆ statsztka aszmptotkusa hatásos, ha lm Se ( Θˆ ). ) A stadard hba agolul: stadard error. 36

37 8.. Becslőfüggvéyek és tulajdoságak Bzoyos esetekbe szükség lehet olya becslőfüggvéyek hatásosságáak összehasolítására, amelyek közül legalább az egyk em torzítatla. Az átlagos égyzetes hba (Mse ) ) olya mutatószám, amely a torzítást és a szóráségyzetet s fgyelembe vesz. Defícóját a (7) képlet tartalmazza. Mse ( Θˆ ) Bs ( Θˆ ) + Se ( Θˆ ) E( Θˆ Θ) (7) Több torzított vagy legalább egy torzítatla és több torzított becslőfüggvéy közül azt tektjük kedvezőbbek, amelykek az átlagos égyzetes hbája ksebb. Kozszteca Egy becslőfüggvéyt kozsztesek evezük, ha aszmptotkusa torzítatla és aszmptotkusa hatásos. (Megjegyzés: a szakrodalomba, a fet defícó mellett, a kozsztecáak más tartalmú defícó s létezek.) Például a sokaság várható értékek a mtaátlag kozsztes becslőfüggvéye, hsze: σ Bs ( ) µ E( ) és lm Se( ) lm. Robosztusság Akkor modjuk, hogy egy becslőfüggvéy (lletve becslés eljárás) robosztus, ha az érzéketle a kduló feltételekre. Ha a sokaság eloszlást em smerjük, akkor a becslésre robosztus becslőfüggvéyt haszáluk. A robosztussággal, mt tulajdosággal általáosságba em foglalkozuk. ) Az átlagos égyzetes hba agolul: mea square error. 37

38 8. Mta alapjá törtéő becslések 8.. Potbecslés Ahogy azt már említettük, egy paraméter becslésére sokféle becslőfüggvéy készíthető. M az eddgekbe az aalóga elvét haszáltuk, amkor a sokaság várható értéket a mtaátlaggal becsültük. A továbbakba olya eljárásokat smertetük, amelyek segítségével becslőfüggvéyeket készíthetük. A legksebb égyzetek módszere (LNM) Ezzel a módszerrel az első kötetbe, a regresszószámítás tárgyalásakor már találkoztuk. A legksebb égyzetek módszerét alkalmaztuk egy statsztka modell paramétereek meghatározására, becslésére. Az LNM mdg feltételez egy modell létezését, vagys azt, hogy egy jeleség leírása valamlye összefüggés alapjá lehetséges. Előye, hogy a sokaság eloszlás smerete em kell az alkalmazásához. Az LNM szert úgy határozzuk meg a becsült paramétereket, hogy az ezeket haszáló modell alapjá kapott értékek és a téyleges értékek eltéréseek égyzetösszege mmáls legye. 6. példa Határozzuk meg a sokaság várható érték becslőfüggvéyét az LNM alapjá! Keressük tehát azt a µˆ értéket, amelyre: ( µ ˆ) m. Derválás utá ˆµ adódk. 38

39 8.. Potbecslés A mamum lkelhood módszer (MLM) A mamum lkelhood módszer már feltételez egy sokaság eloszlás smeretét, és arra alkalmas, hogy aak valamely jellemzőjére becslőfüggvéyt adjo. Alapgodolata az, hogy adott sokaság eloszlást feltételezve felírhatuk egy függvéyt, amely az smeretle sokaság paraméter (vagy paraméterek) külöböző lehetséges értéke mellett meghatározza aak valószíűségét, hogy éppe a redelkezésükre álló mta adódjo egy mtavétel eredméyeképpe. Ezt a függvéyt evezzük lkelhood függvéyek. Másképpe fogalmazva az MLM azt feltételez, hogy egy eseméy azért következk be, mert aak va a legagyobb esélye a realzálódásra. Az MLM alapjá a sokaság paramétert azzal az értékkel becsüljük, amelyk paraméterértékre a lkelhood függvéy felvesz mamumát, vagys amelyk paraméter mellett a legagyobb aak az esélye, hogy a megvalósult mtát kapjuk egy mtavétel alkalmával. Ha (egy smeretle paramétert feltételezve) felírjuk a mtaelemek együttes bekövetkezéséek valószíűségét, akkor a lkelhood függvéy a következőképpe adható meg:,,...,, ) f (, ) L( Θ Θ. Megjegyzés: f a feltételezett sokaság eloszlás sűrűségfüggvéye. Az MLM segítségével kozsztes becslőfüggvéyeket kapuk, és ha létezk mmáls szóráségyzetű torzítatla becslőfüggvéy, akkor a módszer ezt adja. 63. példa Határozzuk meg a sokaság várható érték becslőfüggvéyét az MLM alapjá, ormáls eloszlású sokaságot feltételezve! Írjuk fel a lkelhood függvéyt: µ ˆ σ L( e e,,...,, ˆ) σ π σ π µ ˆ σ µ. 39

40 8. Mta alapjá törtéő becslések A lkelhood függvéy helyett, a számítások egyszerűsítése érdekébe, gyakra aak logartmusát az ú. log-lkelhood függvéyt haszáljuk. Ebbe az esetbe a log-lkelhood mamumát keressük derválással. Természetes alapú logartmust véve: d l L d µ ˆ ( µ ˆ) egyelőséget kapjuk, e becslőfüggvéyek µˆ adódk. A mometumok módszere A mometumok módszerét s smert eloszlású sokaságok eseté tudjuk haszál. Segítségével smert eloszlástípus paraméterere adhatuk becslőfüggvéyt. Olya sokaság paraméterek becslésére alkalmas, amelyek mometumokkal felírhatóak. Léyege, hogy az elmélet mometumokat a mtából számított megfelelő emprkus mometumokkal tesszük egyelővé, am általába köye megoldható egyeletre vagy egyeletredszerre vezet. Ez a módszer s kozsztes becslőfüggvéyt eredméyez, de erőse aszmmetrkus eloszlások eseté kevésbé hatékoy. 64. példa Határozzuk meg a ormáls eloszlású sokaság paramétereek becslését a mometumok módszere alapjá! A ormáls eloszlásak két paramétere va. Ezek felírhatóak mometumok segítségével: µ M és σ M ( µ ). A mta első mometuma és másodk cetráls mometuma: m és ( ) m ( ). 4

41 8.. Potbecslés Ie: µˆ és σ ˆ v. Megjegyzés: mt tudjuk, v csak aszmptotkusa torzítatla becslése a sokaság szóráségyzetek, azaz em torzítatla a becslés: ( v) σ E. Ezért az emprkus elemzésekél em v- vel, haem s -tel számoluk! 4

42 8. Mta alapjá törtéő becslések 8.3. Itervallumbecslés A potbecslés sorá egyetle olya értéket határoztuk meg, amelyet valamlye sokaság jellemző vagy statsztka modell paramétere becsléséek tektettük. Nem határoztuk meg, hogy meyre megbízható a becslésük, vagys hogy háy százalék aak a valószíűsége, hogy a becsül kívát paraméter értéke a potbecslés által adott számadattal lesz egyelő. Ez egyébkét em s lehetséges, mert (folytoos esetbe) egy valószíűség változó egyetle kokrét értéket % valószíűséggel vesz fel. A továbbakba ezért egy tervallumot foguk meghatároz, amelyről azt állíthatjuk, hogy előre adott agy valószíűséggel tartalmazza a becsült paraméter téyleges értékét. Ezt az tervallumot kofdeca tervallumak fogjuk evez, utalva arra, hogy bízhatuk abba, hogy a becslésük helyes. A kofdeca tervallum általáos alakja az alább: ( Θˆ < Θ < Θˆ ) α Pr a( α) f ( α). (7) A fet egyeletbe Pr az argumetum valószíűségéek értékét jelöl. Olya tervallumot akaruk meghatároz, amelybe a becsült sokaság jellemző ( α) % valószíűséggel található. Az tervallum alsó és felső határát ezért α értékét fgyelembe véve kell meghatároz. Ezt az előre adott α értéket a becslésük megbízhatóság vagy kofdeca paraméteréek evezzük. Ez általába -hoz közel érték (pl., azaz %), mert így ( α ) már -hez közel, agy valószíűség lesz. 4

43 8.4. Itervallumbecslés FAE mta eseté 8.4. Itervallumbecslés FAE mta eseté Sokaság várható érték becslése Normáls eloszlású, smert szórású sokaság eseté Azt már tudjuk, hogy ha a sokaság ormáls eloszlású, akkor a mta s az. Sőt a mtaátlagok s ormáls eloszlásúak. Potosabba: σ X N( µ, σ ) N( µ, ). A szórás smeretébe elvégezhetjük a ormáls eloszlású mtaátlag stadardzálását; a Z így stadard ormáls eloszlású valószíűség változó lesz. Z µ N(,) σ / Ehhez az előző fejezetbe leírtak szert tuduk szmmetrkus tervallumot redel: µ Pr z < < z α. σ / Feladatuk most em az, hogy adott határok eseté keressük valószíűséget, haem éppe fordítva: adott valószíűség mellet keressük a megfelelő z értéket. A fet egyeletet átredezve: σ σ Pr z(p) < µ < + z(p) α, (73) α ahol: z(p) az I. táblázat szert az ( α )-hoz, míg a II. táblázat szert az ( )-höz tartozó érték. A Θˆ ˆ f ( α) Θa( α) értéket hbahatárak s szoktuk evez. 43

44 8. Mta alapjá törtéő becslések Ebbe az esetbe ez: σ z(p). (74) A kofdeca tervallum a következőképpe s felírható: m z (p) σ m. A mtavétel terv elkészítéséél lehetséges, hogy adott a hbahatár, vagys, hogy mlye potossággal akarjuk meghatároz a sokaság jellemzőt vagy paramétert. Ekkor a (75) képlet segítségével tudjuk megad a szükséges mtaagyságot. ( z σ ) (p) (75) Normáls eloszlású, smeretle szórású sokaság eseté A mtaátlagok ebbe az esetbe s ormáls eloszlásúak, de a stadardzálás végrehajtásához a sokaság szórás em áll redelkezésre. A sokaság szóráségyzetet a korrgált tapasztalat szóráségyzet segítségével becsüljük, hsze ez torzítatla becslést ad. Bár a sokaság szórást a korrgált tapasztalat szórás em becsül torzítatlaul, m mégs ezt fogjuk haszál. A stadardzált változók a következő lesz: T µ. s / Ez em ormáls eloszlású, haem t- (STUDENT-féle) eloszlású változó ν szabadságfokkal. Megjegyzés: a statsztkába egy adott megfgyelés értékhalmaz szabadságfoka egyelő a redszere belül szabado (ökéyese) megválasztható értékek számával. Például az átlagál ( ) adatot ökéyese választhatuk meg, de az -edk elemet már em, az már az előző adatok által meghatározott. A ormáls eloszlású, smeretle szórású sokaság eseté a várható érték kofdeca tervalluma a (76) egyelettel adott. 44

45 8.4. Itervallumbecslés FAE mta eseté s s Pr t(p) ( ν ) < µ < + t(p) ( ν ) α, (76) ahol: t ( ν ) a III. táblázat szert az ( α α (p) )-hoz, míg a IV. táblázat szert az ( )- höz tartozó érték. A STUDENT-féle eloszlás vagy t-eloszlás Ezt az eloszlástípust megalkotójáról W. S. GOSSETTről evezték el, ő ugyas STUDENT áléve jeletette meg mukát. A STUDENT-féle eloszlás sűrűségfüggvéye a következő: Y f ( t), ν + t + ν ahol Y ν -től függő kostas, amelyek értékét úgy választjuk meg, hogy a sűrűségfüggvéy görbe alatt területe legye. A t-eloszlás sűrűségfüggvéye a 33. ábrá látható. ) A t-eloszlás fotos tulajdosága, hogy aszmptotkusa stadard ormáls eloszlás, vagys a szabadságfokát mde határo túl övelve közelít a stadard ormáls eloszláshoz: lm t ( ν ) ( p) ν z (p). (Lásd a 33. ábrát.) ) A fet közölt STUDENT-féle eloszlás számlálójába szereplő Y érték meghatározása az Ecel GAMMALN() függvéy segítségével törtét. (Ezt az eljárást em részletezzük, mert em része a taayagak!) A statsztkába leggyakrabba alkalmazott eloszlásokról bővebbe: [Dekger, 997], [Meszéa Zerma, 98], [Spegel,995]. 45

46 8. Mta alapjá törtéő becslések A t-eloszlás sűrűségfüggvéyéek grafkoja,5,4 N(,),3 ν5, ν5, ν, - -,5 - -,5,5,5 33. ábra A gyakorlatba 3 eseté a közelítés olya mértékű, hogy ekkor már a stadard ormáls eloszlás értékevel számoluk. A t-eloszláshoz tartozó értékeket a stadard ormáls eloszláshoz hasolóa táblázatok segítségével s meg tudjuk határoz. Erre a III. vagy a IV. táblázatot haszálhatjuk. A stadard ormáls eloszlás táblázatával szembe ezek a táblázatok em a t érték függvéyébe adják meg az eloszlásfüggyvéy értékét, haem a t-eloszlás kvatls értéket tartalmazzák. Az Ecelbe a t-eloszlás kvatls értéket az INVERZ.T(valószíűség;szabadságfok) statsztka függvéy segítségével kaphatjuk meg. Itt a (76) szert kofdeca tervallum meghatározásához a valószíűség α paraméterértéket kell megaduk. Szmmetrkus eloszlású, smert szórású sokaság eseté Nagy elemszámú mta eseté a közpot határeloszlás tétele matt a mtaátlag közelítőleg ormáls eloszlású lesz, így a stadard ormáls eloszlással számolhatuk. A 46

47 8.4. Itervallumbecslés FAE mta eseté ksmtás esetbe a kofdeca tervallum meghatározásához a valószíűségszámításból smert GAUSS-féle egyelőtleséget alkalmazhatjuk. A m jelölésredszerükek megfelelőe: σ σ 4 Pr k < µ < + k α. (77) 9k Itt a k érték meghatározásához em kell táblázatot haszáluk. Aak értékét egyszerűe k tudjuk számíta α segítségével: α k. 3 α 3α Ismeretle eloszlású, smert szórású sokaság eseté A problémáak ebbe az esetbe s csak ks mták alkalmazásakor va jeletősége, hsze egyébkét a ormáls eloszlás alkalmazható. Most s egy valószíűségszámításból smert összefüggést alkalmazuk, a CSEBISEVegyelőtleséget. σ σ Pr k < µ < + k k α (78) A k értéke ebbe az esetbe: α k. α α Sokaság értékösszeg becslése A sokaság értékösszeg és a várható érték köye kapcsolatba hozható egymással, mert például dszkrét típusú változó eseté: N S X N X. Egy valószíűség változó kostassal való szorzása eseté a változó eloszlástípusa 47

48 8. Mta alapjá törtéő becslések em módosul, E( N ) N E( ) és var( N ) N var( ), ha valószíűség változó és N kostas. Sokaság értékösszeg becslését ezért úgy végezzük, hogy először meghatározzuk a várható érték kofdeca tervallumát, majd a határokat megszorozzuk a sokaság agyságával. Sokaság aráy becslése Sokaság aráy megállapítására alteratív smérv eseté va lehetőség. Ekkor smérvükek két smérvváltozata va, így BERNOULLI-féle valószíűség változóak tekthető. Eek megfelelőe végezzük skálatraszformácót az smérvértékeke és kódoljuk azokat lletve értékkel. A sokaság aráyt P-vel, míg a mtabel aráyt p-vel fogjuk jelöl. A mta abszolút és relatív gyakorság sorát az 57. táblázat tartalmazza. Az alteratív smérvek abszolút és relatív gyakorság sora 57. táblázat Ismérvváltozat () Gyakorság Relatív gyakorság f p f f q p f Összese Ezek alapjá köye kszámíthatjuk a mta átlagát f + f f p. 48

49 A mtabel aráy tehát átlagkét s értelmezhető. Az (5) képlet alapjá a mta szóráségyzete: 8.4. Itervallumbecslés FAE mta eseté v f ( p) + f ( p) p + q p p( p) pq. (Megjegyzés: a 7. fejezethez hasolóa, v ebbe a fejezetbe sem a relatív szórást jelöl!) (54)-(56) szert belátható, hogy E ( p) P és vsszatevéses mta eseté P( P) PQ σ p, lletve vsszatevés élkül mta eseté PQ N σ p. N FAE mta eseté a stadard hbát a következőképpe becsüljük: pq s p, (79) EV mta eseté pedg: pq N s p. (8) N Vsszatevéses mta eseté (vagy agyo agy alapsokaságból em vsszatevéses 49

50 8. Mta alapjá törtéő becslések mtáál) a p valószíűség változó bomáls eloszlású 3). A bomáls eloszlás azoba közelíthető ormáls eloszlással, ha p és q em -hoz közel értékű és elég agy. Ezt a feltételt egzaktabba a következőképpe szokták megfogalmaz: {, q} m p. Ha tehát a fet egyelőtleség feáll, akkor a Z p P pq valószíűség változót stadard ormáls eloszlásúak tekthetjük. Ha dszkrét eloszlást közelítük ormáls eloszlással, akkor haszál szoktuk az ú. folytoosság korrekcót és a p aráy helyett a p m értéket haszáljuk, eek azoba csak ks mták eseté va jeletősége. Az elmodottak alapjá a sokaság aráy becslésére voatkozó kofdeca tervallumot a (8) egyelőség alapjá tudjuk meghatároz. pq pq Pr p z(p) < P < p + z(p) α (8) 65. példa Egy üzembe termoszokat gyártaak. A termékek mőségvzsgálata sorá egy elemű (FAE) mtát vettek. Elleőrzték, hogy a termoszok mey deg tarják melege a beléjük helyezett adott hőmérsékletű vzet. A következő eredméyeket kapták (órába): 7,8; 7,9; 8,8; 6,9; 7,5; 8,3; 8,4; 8,7; 7,8; 7,8; 8,; 8,; 8,; 8,5; 7,6; 8,5; 8,6; 8,; 8,; 8,3. 3) Nem vsszatevéses mta eseté a p valószíűség változó hpergeometrkus eloszlású! 5

51 8.4. Itervallumbecslés FAE mta eseté Készítsük tervallumbecslést a hőtartás várható dejére 95,45%-os megbízhatósággal. ha előzetes felmérések alapjá tudjuk, hogy a termoszok hőtartás deje megközelítőleg ormáls eloszlású,4 óra szórással;. ha az eloszlás ormáls, de a szórás em smert; 3. ha az eloszlás típusa em smert csak a szórás, am,4 óra; 4. ha az eloszlásról azt tudjuk, hogy szmmetrkus és a szórás,4 óra! 5. Határozzuk meg a 8, óráál kevesebb hőtartás jellemzővel redelkező termoszok aráyát (95,45%-os megbízhatóság szte)!. A kofdeca tervallum agyságáak meghatározásához a (73) képletet haszáljuk. Becslőfüggvéyük a mtaátlag, eek az adott mtá felvett értéke: 8, óra. A szükséges z (p) értéket az I. vagy a II. táblázat, lletve az Ecel segítségével s megkaphatjuk. A hbahatár a (74) szert behelyettesítés utá:,4,8 óra. Ez alapjá a kofdeca tervallum: 8, m,8. Azt modhatjuk tehát, hogy az esetek átlagosa 95,45%-ba gaz, hogy a (7,9 óra; 8,8 óra) tervallumba található a termoszok téyleges hőtartás deje.. Ekkor a (76) képletet alkalmazzuk. Mvel a sokaság szórás em smert, ezt a mta alapjá becsüljük. A korrgált tapasztalat szórás: s,46 óra. A (76) képlethez szükséges potos t-értéket az Ecel segítségével tudjuk meghatároz INVERZ.T(-,9545;-) függvéyhívással, azaz t (9),45. ( p) 5

52 8. Mta alapjá törtéő becslések Megjegyzés: a III., lletve a IV. táblázatból ezt a t-értéket potosa em tudjuk kolvas.,46 Így a kofdeca tervallum: 8, m,45 8, m,. 3. Ebbe az esetbe robosztus becslést végzük a (78) segítségével. Ehhez szükségük va k meghatározására: k 4,69.,9545,4 Így a kofdeca tervallum: 8, m 4,69 8, m, Itt alkalmazhatjuk a (77) összefüggést. k 3, ,3,4 Így a kofdeca tervallum: 8, m 3,3 8, m, A mta alapjá p,5 vagy 5,%;,5,5 s p,47 vagy,47%. Mvel,5, a sokaság aráy becsléséhez a (8) képletet haszálhatjuk. Így a kofdeca tervallum:, 5 m,47,5 m,94. Azt modhatjuk tehát (95,45%-os megbízhatóság szt mellett), hogy a gyártott termoszok között azok aráya, amelyek 8, óráál kevesebb hőtartással redelkezek 7,6% 7,94% tervallumba található. Megjegyzés: a ks elemszámú mta matt (s) lett lye bzoytala a becslésük! 5

53 8.4. Itervallumbecslés FAE mta eseté Sokaság szóráségyzet becslése Normáls eloszlású sokaság eseté χ ( ) σ s valószíűség változó ν szabadságfokú χ eloszlást követ. Ez alapjá a kofdeca tervallum: ( ) s ( ) s Pr < σ < α. (8) χ α ( ν ) χ α ( ν ) A χ - eloszlás A χ (kh-égyzet) - eloszlás sűrűségfüggvéye a következő: ν χ f ( χ ) Y ( ) χ e, ahol Y ν -től függő kostas, amelyek értékét úgy választjuk meg, hogy a sűrűségfüggvéy görbe alatt területe legye. A χ -eloszlás sűrűségfüggvéye a 34. ábrá látható. 4) Eek az eloszlásak a gyakorság görbéje baloldal aszmmetrát mutat a ormáls eloszlás gyakorság görbéjéhez képest, ezért a (8) segítségével meghatározható kofdeca tervallum em lesz szmmetrkus a potbecslésre. A χ eloszlásfüggvéyéek értékehez tartozó kvatlseket az V. táblázat tartalmazza. Az Ecelbe a χ -eloszlás (8) képletek megfelelő kvatls értéket az INVERZ.KHI(valószíűség;szabadságfok) statsztka függvéy segítségével kaphatjuk 4) Lásd a ) lábjegyzetet! 53

54 8. Mta alapjá törtéő becslések meg. Itt a kofdeca tervallum meghatározásához a valószíűség α, lletve a valószíűség α paraméterértéket kell megaduk. A χ -eloszlás sűrűségfüggvéyéek grafkoja,3, ν ν5, ν5, ábra A χ eloszlás aszmptotkusa ormáls eloszlás, vagys a szabadságfokát mde határo túl övelve közelít a ormáls eloszláshoz. Ezért χ táblázat értékét > eseté (adott α mellett) a következő összefüggések valamelykével s megkaphatjuk: lletve χ ν + z 9 9, ν ν ( + ν ) χ z, 3 ahol a z a stadard ormáls eloszlású változó (α -ak) megfelelő táblázat értéke. 54

55 8.4. Itervallumbecslés FAE mta eseté (Megjegyzés: a köbös összefüggés jeletőse potosabb közelítést ad χ -re.) 66. példa Egy mezőgazdaság Rt. 3 hektáro búzatermesztéssel s foglalkozk. A termőterületükből véletleszerűe (vsszatevéses módszerrel) kválasztott 3 db hektáros terület alapjá vzsgálták az átlaghozamot. Az adatokat az 58. táblázat tartalmazza. Becsüljük meg a 3 hektár búzával bevetett terület átlaghozamáak szórását 95%-os megbízhatóság szt mellett. Az Rt 3 hektár búzával bevetett területéek átlaghozama Hozam (kg/ha) 58. táblázat Gyakorság Összese 3 (Megjegyzés: az átlaghozamokat klogrammos potossággal mérték.) Az 58. táblázat adata alapjá a mtaátlag 496 kg/ha; a korrgált tapasztalat szórás: s 79kg/ha; az aszmmetra mérőszáma αˆ 3, 7 ; a csúcsosság mérőszáma pedg α ˆ 4 3,3. A mta medája Me ˆ 4974 kg/ha; a módusza ˆ Mo 499 kg/ha. A fet adatok és a 3. fejezetbe említett törvéyszerűségek alapjá, a búza átlaghozamáak megközelítőleg ormáls eloszlása feltételezhető. A kofdeca tervallum meghatározásához a (8) képletet haszáljuk. Az ehhez szükséges táblázat értékeket az Ecel segítségével számíthatjuk k: 55

56 8. Mta alapjá törtéő becslések,5 χ (3 ) INVERZ.KHI(,5/;3-) 348,794 és,5 χ (3 ) INVERZ.KHI(-,5/;3-) 5,993. Megjegyzés: a statsztka táblázatukból ezeket az értékeket em tudjuk kolvas, de Ecel élkül s meghatározhatjuk az említett két közelítő összefüggéssel. Például a köbös közelítő képlet alapjá (3 ) 348,797 ; míg az egyszerűbb közelítő χ,5 összefüggés szert χ (3 ) 348, 3.,5 A redelkezésükre álló adatok alapjá a sokaság szóráségyzetére (95%-os megbízhatóság szte) <σ a szórására pedg < 658 <σ < 947 becslést adhatjuk

57 8.5. Itervallumbecslés EV mta eseté 8.5. Itervallumbecslés EV mta eseté Sokaság várható érték becslése EV mta eseté a várható érték becsléséek stadard hbájáál fgyelembe kell veük a sokaság elemszámát s. σ var( ) N N Az N N értéket véges sokaság szorzóak evezzük. Az EV mtából származó adatokra Z µ σ N N valószíűség változó stadard ormáls eloszlású. Ezek alapjá a sokaság várható értékre voatkozó kofdeca tervallumot a (83) képlet alapjá tudjuk meghatároz. σ N σ N Pr µ z(p) < < + z(p) α (83) N N A véges sokaság szorzó értéke és között va, ezért EV mta eseté a hbahatár ksebb lesz, mt az FAE mta alkalmazásakor, tehát potosabb becslést kapuk. Eek az az oka, hogy az EV mta alapjá törtéő becslés hatásosabb, mt az FAE mta alapjá törtéő, hsze ebbe az esetbe mde sokaság egység csak egyszer kerülhet a mtába. Adott hbahatár eseté az EV mtához szükséges mtaagyságot a (75) helyett a (84) képlet segítségével határozhatjuk meg. ( z(p) σ ) ( z(p) σ ) N + (84) 57

58 8. Mta alapjá törtéő becslések Ha a sokaság szóráségyzet em áll redelkezésre, akkor ezt s a mtából kell becsülük. A 6. példába, a (7) képletek megfelelőe, már láttuk, hogy EV mta eseté N E s σ, N lletve E ( s ) N σ. N Ebbe az esetbe az átlag stadard hbájáak becslése ( s ) a (85) alapjá törték. s s N (85) Ez torzítatla becslése a mtavétel szóráségyzetek: σ N E( s ) σ. (86) N A (85) képlet égyzetgyöke: s s. (87) N Sokaság értékösszeg becslése Ebbe az esetbe s közvetleül a sokaság várható érték becsléséből kaphatjuk meg a sokaság értékösszegre voatkozó becslést, ha a kofdeca tervallum határat megszorozzuk a sokaság elemszámával, N-el. 67. példa Egy kstermelő (azoos fajtájú) teheet tart. Az egy tehére jutó tejtermelés 58

59 8.5. Itervallumbecslés EV mta eseté meghatározása végett véletleszerűe (smétlés élkül) kválasztott -et, és a következő adatokat kapta (lter/év): 45, 493, 58, 567, 56, 534, 4985, 598, 556 és 55. Határozza meg az egy tehére jutó tejtermelés kofdeca tervallumát 95%-os megbízhatóság mellett, és a kstermelő által értékesíthető összes tejmeység tervallumát! Mvel smétlés élkül a mta és a populácó szórása smeretle, a mtaátlagok stadard hbájáak kszámításához a (87) képletet kell alkalmazuk, ehhez pedg smerük kell a mta átlagát és korrgált tapasztalat szórását. A kapott eredméyek: 57, ; s 348,3 és s 4, 5 lter/év. Fgyelembe véve a (76) összefüggést, az egy tehére jutó tejtermelés kofdeca tervalluma 95%-os megbízhatóság szte (a III. táblázatot haszálva): 57, m,6 4,5 57, m 36,4 lter/év; az egy év alatt (összese) értékesíthető tej meysége pedg 548,5 lter között va. 4935,7 és Sokaság aráy becslése A sokaság aráy EV mtá alapuló becslésekor a (8) szert defált stadard hbát kell fgyelembe ve. Sokaság szóráségyzet becslése Ezzel az esettel köyvükbe részletese em foglalkozuk. 59

60 8. Mta alapjá törtéő becslések 8.6. Itervallumbecslés R mta eseté Sokaság várható érték és értékösszeg becslése A rétegzett mtavétel eseté a vszoylag homogé sztrátumok mdegykéből veszük vsszatevés élkül (EV) mtát. A rétegek elemszámával súlyozott mtaátlag ebbe az esetbe s torzítatlaul becsül a sokaság várható értéket. A 7. fejezetbe említettük, hogy rétegzett mta eseté több fajta elosztás s létezk. Ezek közül legtöbbször az aráyos elosztást alkalmazzuk. Aráyos elosztás eseté az egyes sztrátumokból vett mták agyságáak aráya megegyezk a rétegek elemszámaak aráyával. Ezért: E () µ, ahol (75) alapjá M j j j. Az átlag stadard hbája: M N j σ j N j j σ, (88) N N j j j ahol σ j az alapsokaság j-edk rétegéek szóráségyzete. Az emprkus elemzésekél a véges sokaság szorzó értéke legtöbbször -hez közel szám, ezért a továbbakba eek haszálatától eltektük. Fgyelembe véve a (63) összefüggést: N N j j. 6

61 Így a (88) képlet felírható a következő alakba s: 8.6. Itervallumbecslés R mta eseté σ M j j σ j j. A belső szórás (8) szert képlete alapjá az átlag stadard hbájára a (89) összefüggés adódk. σ B σ (89) Az alapsokaság egyes rétegeek szórásara voatkozóa általába em redelkezük potos formácóval, ezért helyettük a mtából (67) szert kszámított becslésekkel dolgozuk. Eek fgyelembevételével felírható a (9) képlet. s M j j s j (9) Mvel mde rétegből vettük mtát, a stadard hba csak a belső szórástól függ. Ez alapjá megállapíthatjuk, hogy a rétegzett mtavétel akkor ad potosabb becslést, vagys akkor hatékoyabb a több mtavétel módszerél, ha a sztrátumok megfelelőe homogéek, azaz a sokaság szóráségyzet mél agyobb részét a külső szóráségyzet tesz k. Ha a belső szóráségyzet a sokaság szóráségyzet agyobb részét adja, akkor a rétegzett mta alkalmazása em ayra hatékoy, és ezért a sokaság (adott rétegképző smérv szert) csoportosítása em volt célszerű. Ha a sokaság belső szórás em smert, akkor ezt a mta alapjá a rétegek részszóráségyzeteek segítségével tudjuk becsül. Mvel a gyakorlatba agy mtákat haszáluk, a becsléshez haszált statsztkák stadard ormáls eloszlásúak tekthető. Az értékösszeg becslését ezúttal s a várható érték kofdeca tervallumáak N kostassal való szorzása révé tehetjük meg. 6

62 8. Mta alapjá törtéő becslések 68. példa A 66. példáál homogéek tektettük a sokaságot. Ha fgyelembe vesszük azt a téyt, hogy em azoos, haem három fajta (megoszlásuk: 5% A, % B és 3% C típusú) búzával vetették be a 3 hektárt, akkor mlye kofdeca tervallumot kapuk azoos megbízhatóság szt (95%) mellett, ha véletleszerű kválasztással és aráyos elosztású rétegzett mtával dolgozuk? A mta eredméyet az 59. táblázat tartalmazza. Fajta Az Rt 3 hektáros (aráyos elosztású) mtájáak adata j j (t/ha) 59. táblázat s j (t/ha) A 5 3,8, B 6 4,3,3 C 9 4,, Fgyelembe véve a (75) és (9) képleteket: 5 3, , , 3,99 t/ha 3 és 5, + 6,3 + 9, s,69 t/ha. 3 Ezek alapjá kszámítható a keresett kofdeca tervallum: 3,99 m,96,69 4, m, t/ha. Mlye kofdeca tervallumot kapák ha a 3 ha búzával bevetett területből 3 hektáry FAE, lletve EV mtát veék? 6

63 9. Hpotézsek vzsgálata 9.. Alapfogalmak A gyakorlatba sokszor előfordul, hogy egy sokaság valamely paraméterére voatkozóa va egy feltételezett érték, és csak azt szereték eldöte, hogy ez megfelel-e a valóságak. Ha a sokaság teljes körű megfgyelésére cs móduk, akkor a mtavétel módszeréhez folyamodhatuk. Ilyekor egy véletle mta alapjá a fejezetbe smertetett módszerek szert azt fogjuk megvzsgál, hogy a mták támogatja-e a hpotézsüket, vagy szgfkása elletmod ek. Így bzoyos megbízhatósággal állíthatjuk majd, hogy hpotézsük gaz vagy hams. A felállított hpotézsek helyességéek véletle mtákra alapozott vzsgálatát hpotézsvzsgálatak evezzük. Az eek sorá alkalmazott eljárások a statsztka próbák vagy tesztek. A hpotézsvzsgálat eleme A hpotézsvzsgálat első fázsa a tesztel kívát feltételezés matematka megfogalmazása. Ezt ullhpotézsek evezzük (jele: H ). Az ezzel szembe álló feltételezés az alteratív hpotézs (jele: H ). A fet két állítás megfogalmazására egyszerre kerül sor, oly módo, hogy egymás komplemetere legyeek (a kettő közül potosa egy gaz). A ullhpotézs helyessége egyúttal az alteratív hpotézs hams voltát jelet és fordítva. Megkülöböztetük egyszerű és összetett hpotézseket. Egyszerű egy hpotézs, ha ebbe azt feltételezzük, hogy az smeretle sokaság jellemző megegyezk egy adott értékkel. Például: H : Θ Θ. Az összetett hpotézsek esetébe az smeretle sokaság jellemző értékére egy tartomáyt jelölük k. Például: H : Θ > Θ vagy H : Θ Θ. 63

64 9. Hpotézsek vzsgálata A statsztka próbák elvégzéséhez (a becslésekhez hasolóa) mtaelemek egy függvéyét haszáljuk. Olya statsztkát kostruáluk, amelyek mtaelemeke felvett értéke alapjá dötést tuduk hoz arra voatkozóa, hogy a mta alátámasztjae a ullhpotézsbe megfogalmazott feltételezésüket. 5) Ezt a függvéyt próbafüggvéyek evezzük. A próbafüggvéy értéke s mtáról mtára változk, ezért a pror módo valószíűség változóak tekthető. A próbafüggvéyek olyaak kell lee, hogy valószíűségeloszlása egyértelműe meghatározható legye a ullhpotézs helyességéek feltételezése, a sokaságról redelkezésre álló formácók és a mtavétel módja alapjá. Azokat az formácókat, kkötéseket, amelyek a próbafüggvéy eloszlására hatással vaak, de a próba sorá helyességüket em vzsgáljuk, a próba alkalmazás feltételeek evezzük. A hpotézsvzsgálat sorá dötéseket tehát a próbafüggvéy mtá felvett értéke alapjá hozzuk. Ehhez a próbafüggvéy értékkészletét általába két átfedésmetes és hézagmetes tartomáyra botjuk. Ezeket elfogadás lletve krtkus (vsszautasítás) tartomáyak evezzük. A tartomáyok határat úgy határozzuk meg, hogy a ullhpotézs helyessége eseté a próbafüggvéy értéke adott valószíűséggel az elfogadás tartomáyba esse. Ezt az előre adott valószíűséget a próba megbízhatóság sztjéek evezzük és ( α) -val jelöljük. Ekkor az smeretle sokaság paraméter mtából becsült értéke és a feltételezett érték eltérése a reprezetatív megfgyelés matt feálló véletle mtavétel hbáak tudható be. Ha a próbafüggvéy értéke a krtkus tartomáyba esk, akkor azt modhatjuk, hogy az smeretle sokaság jellemzőre voatkozó feltételezésük, valamt a mta alapjá kapott becslésük szgfkás mértékbe külöbözk. Aak valószíűsége, hogy a ullhpotézs helyessége eseté a próbafüggvéy értéke a krtkus tartomáyba esse α - val egyelő. Ezt a valószíűséget evezzük szgfkaca-sztek. 5) Hpotézsek vzsgálatáál arra törekszük, hogy a ullhpotézs egyszerű legye, mert ekkor lehet legköyebbe (a ek megfelelő) próbafüggvéyt defál. Ha ez em lehetséges, akkor ú. techka hpotézst alkalmazuk. Köyvükbe ezek alkalmazásával em foglalkozuk. 64

65 9.. Alapfogalmak Az elfogadás és a krtkus tartomáy egymáshoz vszoyított elhelyezkedése háromféle lehet. Ezeket az eseteket a 35. ábra szemléltet. Az elfogadás és a krtkus tartomáy egymáshoz vszoyított elhelyezkedéseek esete ) Baloldal próba krtkus tartomáy elfogadás tartomáy α c a α ) Kétoldal próba krtkus tartomáy elfogadás tartomáy krtkus tartomáy α c a α c f α 3) Jobboldal próba elfogadás tartomáy krtkus tartomáy α α c f 35. ábra 65

66 9. Hpotézsek vzsgálata A baloldal és a jobboldal próba em kétoldal próba, haem ú. egyoldal próba. Az eddgek sorá már megsmerkedtük a fotosabb alapfogalmakkal, így fel tudjuk ír a hpotézsvzsgálat lépéset.. A tesztel kívát, ullhpotézsek evezett, feltételezés megfogalmazása. Ezzel szembe mdg va egy alteratív hpotézs.. A ullhpotézst és a redelkezésre álló formácókat fgyelembe véve a próbafüggvéy kválasztása. 3. A -hoz közel α szgfkaca-szt kválasztása, és a próbafüggvéy értékkészletéek elfogadás és krtkus tartomáyra botása. 4. A próbafüggvéy mtá felvett értékéek megállapítása. 5. Dötés a ullhpotézs helyességéek elfogadásáról-elvetéséről. A hpotézsvzsgálat sorá elkövethető hbák A hpotézsvzsgálat sorá s mta alapjá következtetük a sokaságra, így tt s számoluk kell a reprezetatív megfgyelésből eredő véletle mtavétel hbával. Ha a megfgyelésük em teljes körű, akkor teljes bzoyossággal em tuduk döte a ullhpotézs helyességéről. Állásfoglalásuk kalakításakor alapvetőe kétféle hbát követhetük el: elsőfajú hba: elvetjük a ullhpotézst, oha az megfelel a valóságak, másodfajú hba: elfogadjuk a ullhpotézst, oha az em felel meg a valóságak. Az elsőfajú hba elkövetéséek valószíűsége a szgfkaca-szt defícójából adódóa α. A másodfajú hba elkövetéséek valószíűségét β -val fogjuk jelöl. A ullhpotézssel kapcsolatos dötésük és a valóságba feálló téyállás lehetséges esetet és valószíűségüket a 6. táblázat tartalmazza. Az elsőfajú hbával már értőlegese foglalkoztuk a szgfkaca-szt kapcsá, ám a másodfajú hba em került szóba a hpotézsvzsgálat lépéseek tárgyalásáál. Ez azért va, mert a hpotézsvzsgálat alkalmazója csak az elsőfajú hba agyságát tudja befolyásol (a szgfkaca-szt megadásával), de a másodfajú hbáét em (ehhez tuduk kellee, hogy m felel meg a valóságak). Az elsőfajú hba és a másodfajú hba valószíűsége egymással elletétese alakul. 66

67 9.. Alapfogalmak Általába úgy járuk el, hogy meghatározuk egy α szgfkaca-sztet és keressük azt a próbafüggvéyt, amelyhez ekkor a legksebb β tartozk adott mtaagyság mellett. A hpotézsvzsgálat sorá elkövethető hbák és a helyes dötések valószíűsége H -t H megfelel a valóságak gaz hams 6. táblázat elfogadjuk helyes dötés ( α) másodfajú hba (β ) elvetjük elsőfajú hba (α ) helyes dötés ( β ) A köyvükbe bemutatott mtavétel tervek mdegykét alkalmazhaták hpotézsvzsgálat céljából, de a továbbakba mdg (a legegyszerűbb esetet) az FAE mtát feltételezzük. Attól függőe, hogy háy mta formácó alapjá törték a hpotézs tesztelése, köyvükbe megkülöböztetjük a következő eseteket: egymtás, két (egymástól függetle) mtás és több (egymástól függetle) mtás próba. A hpotézsvzsgálatál megkülöböztetük paraméteres és emparaméteres próbákat. Az előbbek alkalmazás feltétele között szükségszerűe szerepelek a vzsgált sokaság eloszlásáak típusára vagy paraméterere voatkozó feltételek, míg az utóbbakál ezekre cs szükség. A továbbakba részletesebbe bemutatjuk a gyakorlatba legtöbbször alkalmazott paraméteres próbákat. 67

68 9. Hpotézsek vzsgálata 9.. Egymtás próbák Az egymtás próbákat egy sokaság valamely jellemzőjére vagy paraméterére voatkozó feltételezések helyességéek vzsgálatára haszáljuk. Sokaság várható értékre ráyuló próba Egy sokaság valamely jellemzőjéek várható értékére voatkozó ullhpotézshez háromféleképpe fogalmazhatuk meg alteratív hpotézst. Ezeket az eseteket tartalmazza a 6. táblázat. Sokaság várható értékre ráyuló próbák esete 6. táblázat Próba Nullhpotézs Alteratív hpotézs baloldal H : µ< µ kétoldal H : µ µ H : µ µ jobboldal H : µ> µ A sokaság várható értékre ráyuló próba (a becsléshez hasolóa) függ a sokaságra voatkozó a pror formácóktól, kkötésektől. Ezeket eveztük a próba alkalmazás feltételeek. M három esettel foguk foglalkoz. z-próba A z-próba alkalmazásáak feltétele, hogy a mták smert szórású (σ ) ormáls eloszlású sokaságból származzo. Ebbe az esetbe a (9) szert defált próbafüggvéyt haszáljuk. Z µ (9) σ Ez a próbafüggvéy stadard ormáls eloszlású valószíűség változó. Attól függőe, hogy jobboldal, baloldal vagy kétoldal próbáról va-e szó, adott α szgfkaca- 68

69 9.. Egymtás próbák szt mellett, a 36. ábrá szemléltetett módo tudjuk feloszta a próbafüggvéy értékkészletét elfogadás és krtkus tartomáyra. A dötéshozatal grafkus modellje Kétoldal krtkus tartomáy: -α krtkus tartomáy α/ elfogadás > tartomáy < α/ krtkus tartomáy Jobboldal krtkus tartomáy: -α α elfogadás tartomáy < krtkus tartomáy Baloldal krtkus tartomáy: α -α krtkus tartomáy > elfogadás tartomáy 36. ábra 69

70 9. Hpotézsek vzsgálata Eek megfelelőe, a II. táblázat szempotjából, a 6. táblázatba feltütetett próbák és elfogadás tartomáyok adódhatak. (Ezzel egydejűleg adottak az alteratív hpotézsek és krtkus tartomáyok s.) Várható értékre ráyuló próbák és az ezekhez tartozó elfogadás tartomáyok smert szórású ormáls eloszlású sokaság eseté Próba Elfogadás tartomáy 6. táblázat baloldal [ z, ) α kétoldal z α, z α jobboldal, z ] ( α A kétoldal próba krtkus tartomáyáak meghatározásához az I. táblázatot haszálhatjuk, míg az egyoldal próbákhoz a II. táblázatba egyszerűbb a megfelelő eloszlásfüggvéy kvatls értékéek kkeresése. Mdhárom esetbe haszálhatjuk természetese az Ecel INVERZ.STNORM(valószíűség) statsztka függvéyt s. t-próba A t-próbát akkor alkalmazhatjuk, ha a vzsgált sokaság (smeretle szórással) ormáls eloszlású. Ebbe az esetbe a (9) szert defált próbafüggvéyt haszáljuk. T µ, (9) s ahol s a mtából számított korrgált tapasztalat szórás. Ez a próbafüggvéy ν szabadságfokú STUDENT-féle eloszlást követ. 7

71 9.. Egymtás próbák Eek megfelelőe, a IV. táblázat szempotjából, a 63. táblázatba közölt próbák és elfogadás tartomáyok adódhatak. Várható értékre ráyuló próbák és az ezekhez tartozó elfogadás tartomáyok smeretle szórású ormáls eloszlású sokaság eseté Próbák Elfogadás tartomáy 63. táblázat baloldal [ t ( ν ), ) α kétoldal t α ( ν ), t α ( ν ) jobboldal (, t ( ν )] α A kétoldal próba krtkus tartomáyáak meghatározásához legegyszerűbbe az III. táblázatot haszálhatjuk, míg az egyoldal próbákhoz a IV. táblázatot. Mdhárom esetbe tt s haszálhatjuk az Ecel megfelelő statsztka függvéyét. Aszmptotkus z-próba Ha agy mta áll redelkezésükre, akkor a sokaság jellemzőre tett egyéb smeretek és feltételek élkül 6) s alkalmazhatjuk az aszmptotkus z-próbát, mert a (93) alapjá defált próbafüggvéy (a közpot határeloszlás tétele matt) megközelítőleg stadard ormáls eloszlású lesz. Z µ (93) s Ebbe az esetbe s a 6. táblázatak megfelelő elfogadás tartomáyokat haszáljuk. 6) Véges szórás feltételezett ugya, de ez az emprkus vzsgálatokál teljesül s. 7

72 9. Hpotézsek vzsgálata Sokaság aráyra ráyuló próba Eek vzsgálatát csak arra az esetre tárgyaljuk, amkor a mta olya agy, hogy H : P P ahol Q P. ullhpotézs eseté eleget tesz az alább feltételek: {, Q } m P, Ehhez hasoló feltétellel már a 8. fejezetbe s találkoztuk a sokaság aráy tervallumbecslésekor. A fet feltételek a teljesülése bztosítja számukra, hogy a bomáls eloszlás helyett jó közelítéssel ormáls eloszlással dolgozzuk. Sokaság aráyra voatkozó hpotézsek tesztelésére a (94) próbafüggvéyt haszáljuk. Z p P (94) P Q Megjegyzés: tt s alkalmazuk kellee a folytoosság korrekcót ( m mták eseté eek értéke általába elhayagolható, a dötést em befolyásolja. ), de agy A sokaság aráyra voatkozó ullhpotézshez háromféleképpe fogalmazhatuk meg alteratív hpotézst. Ezeket az eseteket tartalmazza a 64. táblázat. Sokaság aráyra ráyuló próbák esete 64. táblázat Próba Nullhpotézs Alteratív hpotézs baloldal H : P < P kétoldal H : P P H : P P jobboldal H : P > P Ezekhez a próbákhoz tartozó elfogadás tartomáyok (agy mták eseté) megegyezek a 6. táblázatba közöltekkel. 7

73 9.. Egymtás próbák 69. példa Egy agykereskedelm vállalat mlló égőt vásárolt. A gyártó szerződésbe vállalta, hogy a hbás égők részaráya %-ál em lesz több. A vállalat elleőrzés végett véletleszerű kválasztással ezer égőt vett a mtába, amelybe hbás égőt találtak. Elfogadható-e az a hpotézs (5%-os szgfkaca-szt mellett), hogy a szállítmáyba a hbás égők részaráya em több %-ál, azaz a gyártó eleget tett-e a szerződésbe vállalat kötelezettségéek? 6 3 A feladat szert smertek a következő adatok: N ; ; p, vagy,%; α,5. A feladatak megfelelő ullhpotézs: H : P,; az alteratív hpotézs pedg: H : P >,. A feladatak megfelelő grafkus modell 5% 45% 5% elfogadás tartomáy < 37. ábra 73

74 9. Hpotézsek vzsgálata Mvel a mta agysága az alapsokaság agyságáak csupá ezreléke, és agy mtáról va szó (, ), azaz FAE mtát feltételezhetük, a teszteléshez a (94) szert próbafüggvéyt haszálhatjuk:,, Z,64.,,99 A 37. ábra szert jobboldal próbáról va szó, az eek megfelelő elfogadás tartomáy a 64. táblázat alapjá: ( ;,65]. Mvel a kszámított érték (,64) az elfogadás tartomáyba esk, ullhpotézsüket 5%- os szgfkaca-szt mellett elfogadjuk, azaz a szerződés szert % és a mta alapjá kszámított,% között külöbség statsztkalag em jeletős. Függetleségvzsgálat Az eddgek sorá olya próbákkal foglalkoztuk, amelyek egy sokaság jellemzőre voatkozó feltételezések elleőrzését tették lehetővé. Most két sokaság jellemző között feálló kapcsolatra voatkozó hpotézsekkel foglalkozuk. A 4.. fejezetbe már tárgyaltuk azokat az eszközöket, amelyekkel a sokaság teljes körű smerete eseté két smérv kapcsolatát elemezhetjük. Ha azoba csak egy reprezetatív megfgyelés adata állak redelkezésre, akkor a továbbakba smertetett módszert alkalmazzuk aak eldötésére, hogy a vzsgált két smérv függetleek tekthető-e. Nullhpotézsük: az adott sokaságo belül két smérv függetle egymástól, alteratív hpotézsük: a két vzsgált smérv között sztochasztkus vagy determsztkus kapcsolat va. Függetleségvzsgálat χ -teszttel A évleges mérés sztű adatok között kapcsolat vzsgálatáál már beszéltük a χ alapú mutatókról. Ott azt vzsgáltuk, hogy egy adott ( r c méretű) kombácós tábla gyakorsága meyre külöbözek egy (a két smérv függetlesége eseté feálló) gyakorság eloszlástól. 74

75 9.. Egymtás próbák Megjegyzés: a 4.. fejezetbe a χ alapú mutatókat asszocácós kapcsolatokál haszáltuk, de természetese meység smérvekél s alkalmazható, hsze (osztályközöket képezve) ezeket s kombácós táblába tudjuk redez. A χ statsztkát most mt próbafüggvéyt alkalmazzuk. A függetleségvzsgálat ullhpotézsét χ -teszt eseté az alább módo írhatjuk fel. H : Pr(C ) P P.,,..., r ; j. j j,,..., c H : Pr(C ) P P. valamelyk -re, lletve j-re j. j A fet megfogalmazás azt jelet, hogy aak valószíűsége, hogy egy sokaság egység a kombácós tábla (lásd a 4. táblázatot) adott C cellájába esk, megegyezk a függetleséget feltételezve kszámított valószíűséggel, ahol és a peremvalószíűségeket jelöl. Egy sokaság egység kombácós tábla adott cellájába eséséek valószíűségére pedg a mta relatív feltételes eloszlása ( g következtethetük, ezért a (95) szert defált próbafüggvéyt haszáljuk: r c j r c ( g p p ) ( f f ) j j P. P. j P. j j j j P.j ) alapjá χ, (95) p p f... j. j j ahol p-k a P peremvalószíűségek mtából becsült értéke és f j p. p. j. A (95) szert defált statsztka χ -eloszlású valószíűség változó, ν ( r )( c ) szabadságfokkal, ha a kombácós tábla r c méretű. Mvel a χ mutató az eltérés mértékét számszerűsít, a ks értéke megerősítk, míg agy értéke cáfolják a ullhpotézst, tehát ezt mde esetbe jobboldal próbakét hajtjuk végre. A χ -teszt alkalmazás feltétele között szerepel, hogy legalább p. p. 5, de kább p. p. mde -re, lletve j-re j j feálljo. Ezt az egyes osztályközök megfelelő kalakításával tudjuk bztosíta. 75

76 9. Hpotézsek vzsgálata 7. példa A mérök-mukaélkülek terület egységek (999. júus 3.) szert megoszlását a 65. táblázat tartalmazza. Elfogadható-e az a hpotézs, hogy a mukaélkül mérökök szakterületekét és lakóhelyük szert eloszlása között cs szgfkás összefüggés? A mérök-mukaélkülek megoszlása szakterületük és lakóhelyük szert Szakterület Lakóhely terület egységek szert 65. táblázat KM KD NyD DD ÉM ÉA DA. Báya-, kohó-, földmérök Gépészmérök Vllamosmérök Építész-, építőmérök Mezőgazdaság, kertész-, fapar mérök Egyéb mérök végzettség Forrás: OMK Jelmagyarázat: KM: Közép-Magyarország, KD: Közép-Duátúl, NyD: Nyugat- Duátúl, DD: Dél-Duátúl, ÉM: Észak-Magyarország, ÉA: Észak- Alföld, DA: Dél-Alföld. A feladat megoldható a (95) képletbe defált próbafüggvéyel. Ehhez szükségük va a vzsgált két smérv között kapcsolat függetlesége eseté feálló elmélet eloszlásra, amelyet a 66. táblázat tartalmaz. Ebbe a táblázatba szereplő adatok eleget teszek a -teszt alkalmazás feltételeek, mert mde cellába 5-él em ksebb szám szerepel (ráadásul, 3 kvételével, még a szgorúbb feltételek s megfelelek, azaz -él em ksebbek az elmélet gyakorságok). χ 76

77 Két smérv függetlesége eseté feálló eloszlás 9.. Egymtás próbák 66. táblázat KM KD NyD DD ÉM ÉA DA Össz Össz A 65. és 66. táblázat adataak felhaszálásával a (95) képlet jobboldala alapjá a próbafüggvéy meghatározható: χ (8 ) ( 7) (33 39) χ , A χ elmélet értékét a ν ( 6 )(7 ) 3 szabadságfok fgyelembevételével kell meghatározuk. Ez az V. táblázatba mde szgfkaca-szte alacsoyabb 3,9-él; ezért azt modhatjuk, hogy a mta em támasztja alá a ullhpotézsüket, azaz a két smérv em tekthető függetleek. Illeszkedésvzsgálat Gyakra szükség va arra, hogy egy emprkus eloszlásál megvzsgáljuk, hogy az megközelítőe egyezk-e egy evezetes eloszlással. Azt az egymtás próbát, amelyek sorá egy valószíűség változó feltételezett eloszlására voatkozó hpotézst tesztelük lleszkedésvzsgálatak evezzük. Ameybe a feltételezett eloszlás a ormáls eloszlás, akkor ormaltásvzsgálatról beszélük. Ha a ullhpotézs meghatározza a feltételezett eloszlás mde paraméterét, akkor tszta lleszkedésvzsgálatról, ellekező esetbe becsléses lleszkedésvzsgálatról va 77

78 9. Hpotézsek vzsgálata szó. Az utóbb esetbe a feltételezett eloszlást leíró paramétereket ugyas valamlye potbecsléssel határozzuk meg a mta alapjá. Nullhpotézsük tehát az, hogy a mta egy adott elmélet eloszlásból származk. Ezt a következőképpe fogalmazhatjuk meg: : F () (). H F Többféle próba létezk arra, hogy egy elemű mta alapjá teszteljük a hpotetkus F () eloszlásfüggvéyhez való lleszkedést. Illeszkedésvzsgálat mometumok segítségével Ahogy azt már láttuk a (éháy sokaság jellemzőre voatkozó) hpotézsek tesztjeél, a próba alkalmazás feltétele között gyakra szerepel az alapsokaság eloszlására tett kkötés. Természetese lye esetbe s lleszkedésvzsgálatot kell végezük. A 66. példába tulajdoképpe ezt tettük, amkor a mta mometumaból következtettük arra, hogy (az adott mezőgazdaság Rt-él) a búza átlaghozama GAUSS-féle eloszlásúak tekthető-e. Ha a mtából becsült α ˆ mutató körül, míg az α ˆ mutató 3 körül értéket vesz fel, akkor azt állíthatjuk, hogy a mta em mod ellet az alapsokaság ormaltására voatkozó feltételezések. Illeszkedésvzsgálat χ -teszttel 3 4 Az tt alkalmazott módszer léyegébe megegyezk a függetleségvzsgálatál bemutatott χ -teszttel, de most két gyakorság sor (lásd a 3. táblázatot) számpárosa között külöbség statsztka jeletőségét fogjuk vzsgál. (A gyakorság sor természetese egy specáls kombácós tábláak s tekthető.) Az lleszkedésvzsgálat ullhpotézsét χ -teszt esté az alább módo írhatjuk fel. H : Pr (C ) P,,..., k H : Pr(C ) P valamelyk -re A ullhpotézsuk tehát a következő: egy sokaság egység adott osztályközbe eséséek hpotetkus és emprkus eloszlás szert valószíűsége megegyezk. Egy sokaság 78

79 9.. Egymtás próbák egység adott osztályközbe eséséek valószíűségére pedg a relatív gyakorságok alapjá következtethetük, ezért a következő próbafüggvéyt haszálhatjuk: k ( g P ) ( f f ) k χ, (96) P f ahol f. P A (96) szert defált statsztka χ -eloszlású valószíűség változó, ν k b szabadságfokkal, ahol k a gyakorság sor osztályközeek száma, b pedg a mtából becsült paraméterek száma (tszta lleszkedésvzsgálat eseté b ). A függetleségvzsgálat feltétele, hogy χ -tesztjéhez hasolóa ez s jobboldal próba, és alkalmazás legalább P 5, de kább P mde -re feálljo. Megjegyzés: ha a fet feltétel em teljesül (ez leggyakrabba az első, lletve az utolsó osztályok valamelykére gaz), akkor ezeket mdaddg összegezzük, amíg em kapuk legalább 5-él agyobb f gyakorságot. A szabadságfok meghatározásáál a k értékét lyekor az összevot osztályok fgyelembevételével (és em az eredet osztályok száma alapjá) határozzuk meg. 7. példa Vzsgáljuk meg a 66. példa adata alapjá azt, hogy (a mezőgazdaság Rt-él) a búza átlaghozama megközelítőleg ormáls eloszlásúak tekthető-e. Régebb tapasztalatok alapjá tudjuk, hogy az átlagtermés várható értéke 495 kg/ha. Legye a szgfkacaszt %. A ormáls eloszlásak két paramétere va, de ekük csak a várható érték adott. A szóráségyzetet a mtából számított korrgált tapasztalat szóráségyzet segítségével határozzuk meg. Ez alapjá ullhpotézsük az, hogy az átlaghozam (megközelítőleg) 79

80 9. Hpotézsek vzsgálata ormáls eloszlást követ, 495 [kg/ha] várható értékkel és (fgyelembe véve a 66. példa részeredméyét) [kg / ha ] szóráségyzettel. Mvel csak a stadard ormáls eloszlású valószíűség változó eloszlásfüggvéyéek táblázat értékevel redelkezük, ezért először az 58. táblázat adatat stadardzáljuk. A traszformált változó értéket a 67. táblázat tartalmazza. Megjegyzés: a feladat szert folytoos valószíűség változó eloszlásáról va szó, ezért a stadardzáláskor (a hézagmetesség bztosítása végett) a valód (és em a közölt) határok felső értéket kell fgyelembe ve. A ormaltásvzsgálathoz szükséges számítások 67. táblázat Valód osztályhatárok felső értéke f X, Φ X, P f,5 6 -,647,498,498 4,9 4,5 6 -,534,979,48 74,4 6,5 5,5863,7,43 7, 8,5 59,73,9557,346 7,4 4,,443 3,3 Összese 3, 3, A P valószíűségeket az alább módo határoztuk meg: X Φ, 495 X, 495 P Φ A táblázat utolsó oszlopába szereplő elmélet gyakorságok sorra md agyobbak - él, ezért osztályközök összevoására cs szükség. A próbafüggvéyük értékét a 67. táblázat adataak a (96) képlet jobboldalába helyettesítésével kaphatjuk meg. 8

81 (6 4,9) (6 74,4) (4 3,3) χ ,55. 4,9 74,4 3,3 9.. Egymtás próbák A feladat szert csak egy paramétert kellett becsülük a mtából (b ) és az osztályközök száma k 5, így a χ próbafüggvéy szabadságfoka ν 5 3. Az %-os szgfkaca-szthez tartozó elmélet érték az V. táblázat szert,345. Mvel 8,55 <,345; a búza átlaghozamáak ormáls eloszlására tett hpotézst %-os szgfkaca-szt mellett elfogadjuk. 8

82 9. Hpotézsek vzsgálata 9.3. Két függetle mtát géylő próbák Az előző fejezetbe mdg egy sokaságból származó mta alapjá következtettük a sokaság valamely jellemzőjére. A továbbakba azt vzsgáljuk, hogy két sokaság (azoos fajta) jellemzője eltér-e egymástól. A sokaságok összehasolítására két mtát haszáluk, amelyek az egyes sokaságok reprezetatív megfgyeléséből származak. A kétmtás vzsgálatok között megkülöböztetjük a páros mtákat és a függetle mtákat. Az előbb esetbe az egyk mta eleméek kválasztása maga utá voja a másk mta egy eleméek kválasztását. Ezek a mták ezért bzoyos értelembe egymtás próbáak s tekthetőek. Ezzel a specáls esettel azoba m em foglalkozuk. A továbbakba áttektjük a két, egymástól függetleül kválasztott, mtá alapuló próbák legfotosabb esetet. A két sokaság és a mták jellemzőre deeléssel utaluk. Például a két sokaság várható értékét jelölje µ és µ, a mtaátlagokat és. Várható értékek egyezőségére ráyuló próbák Két sokaság várható értéke egyelőségére voatkozó próbák ullhpotézsét és az alteratív hpotézset a 68. táblázatba feltütetett módo fogalmazhatjuk meg. Két sokaság várható értéke egyelőségére ráyuló próbák esete 68. táblázat Próba Nullhpotézs Alteratív hpotézs baloldal H : µ < µ kétoldal H : µ µ H : µ µ jobboldal H : µ > µ Ezekél a tesztekél s többféle próbafüggvéyt haszálhatuk, attól függőe, hogy melyk teszt alkalmazás feltétele állak fe. Most s három esettel foguk foglalkoz. 8

83 9.3. Két függetle mtát géylő próbák Kétmtás z-próba A kétmtás z-próba alkalmazásáak feltétele, hogy mdkét mták smert szórású ormáls eloszlású sokaságokból származzo. Ebbe az esetbe a (97) szert defált próbafüggvéyt haszáljuk. Z (97) σ σ + Ez a próbafüggvéy stadard ormáls eloszlású valószíűség változó, így a próbát az eddgekbe smertetett módo hajthatjuk végre. A kétmtás z-próbát az Ecelbe s elvégezhetjük. Vgyük be az adatokat egy cellatartomáyba, majd hívjuk meg az Eszközök meü Adatelemzés... almeüjét és válasszuk k a felkíált lehetőségek közül a Kétmtás z-próba a várható értékre meüpotot. A megjeleő párbeszédablakba bevhetjük a változótartomáyokat, a ullhpotézst, az smert szóráségyzeteket és a szgfkaca-sztet. Kétmtás t-próba A kétmtás t-próbát akkor alkalmazhatjuk, ha a két sokaság ormáls eloszlású és szórásak ugya smeretleek, de az feltételezhető, hogy egyformák (homoszkedasztkus sokaságok). Ekkor a (98) szert defált próbafüggvéyt haszáljuk. T, (98) s c + ahol s c a két sokaság egyforma szórásáak a két mta alapjá törtéő becslése. Ezt a mták adataból többféleképpe s kszámíthatjuk: s c ( ) s + ( ) s j j. (99) 83

84 9. Hpotézsek vzsgálata A (98) próbafüggvéy ν + szabadságfokú STUDENT-féle eloszlást követ. A homoszkedasztkus t-próba az Ecelbe az Eszközök meü Adatelemzés... almeüjébe a Kétmtás t-próba egyelő szóráségyzetekél meüpottal hívható meg. Kétmtás aszmptotkus z-próba Ha mdkét mták agy, akkor a sokaságokra tett egyéb smeretek és feltételek 7) élkül s alkalmazhatjuk a kétmtás aszmptotkus z-próbát, mert a () alapjá defált próbafüggvéy megközelítőleg stadard ormáls eloszlású lesz. Z () s s + A 68. táblázatba smertetett próbákhoz tartozó elfogadás tartomáyok megegyezek a 6., lletve 63. táblázatba közöltekkel. 7. példa A 67. példába említett kstermelő újabb teheeket szerete vásárol. Egy kollégája másfajta teheeket tart. Aak eldötésére, hogy az eddg fajtából vásároljo-e vagy a kollégája által tartottakból, az utóbb fajtából 8 elemű (smétléses) mtát vettek. A mtába a teheekét tejhozamok (lter/év) a következők: 5656, 498, 565, 57, 4999, 567, 556, 53. Hogya döt a kstermelő 5%-os szgfkaca-szt mellett? A feladat alapjá felírható (lásd a 68. táblázatot) az alább két hpotézs. H : µ µ H : µ µ 7) A szórások végessége most s feltételezett. 84

85 9.3. Két függetle mtát géylő próbák Fgyelembe véve azt a téyt, hogy ks mtákról va szó és a szóráségyzetek s smeretleek, a kérdés megválaszolásához a (98) próbafüggvéyt haszálhatjuk, amelyek egyk alkalmazás feltétele a szóráségyzetek azoossága. Eek elleőrzése végett számítsuk k a 8 elemű mta átlagát és korrgált tapasztalat szóráségyzetét. (Emlékeztetőül megsmételjük a 67. példa részeredméyet: 57, és s 348,3.) A redelkezésükre állak a következő adatok: ; 57, ; s 3,9 ; 8 ; 5393, ; s 5,6. Ezek szert a próbafüggvéy alkalmazásáak említett feltétele bztosított, hsze s s. (A tejhozamok megközelítőleg ormáls eloszlását feltételezzük.) A (99) szert: 9 3, ,6 s c 395, A (98) szert: 57, 5393, T, ,9 + 8 A próbafüggvéy emprkus és elmélet értékét a 68. és a 63. táblázatba közöltek szert kell összehasolíta. A III. táblázatba a ν szabadságfokhoz és α, 5 szgfkacaszthez tartozó elmélet érték:,99. Mvel a próbafüggvéy abszolút értéke (,3366) ksebb a táblázat értékél (,99), a ullhpotézst 5%-os szgfkaca-szt mellett elfogadjuk. Ez azt jelet, hogy a két átlag között külöbség (,9 lter/év) statsztkalag em jeletős (azaz a véletleel magyarázható), ezért a tejhozam szempotjából em dokolt a fajtaváltás. 85

86 9. Hpotézsek vzsgálata A feladatot megoldhatjuk az Ecel segítségével s az említett Kétmtás t-próba egyelő szóráségyzetekél meüpot segítségével. A megfelelő adatok bevtele utá kapott kmeet eredméyeket a 38. ábrá láthatjuk. Az Ecel outputja Kétmtás t-próba egyelő szóráségyzetekél Változó Változó Várható érték 57, 5393 Varaca 3,8778 5,57 Megfgyelések 8 Súlyozott varaca 395,363 Feltételezett átlagos eltérés df 6 t érték -, P(T<t) egyszélű,49 t krtkus egyszélű, P(T<t) kétszélű,4885 t krtkus kétszélű, ábra Megjegyzés: az általuk közölt részeredméyekbe mutatkozó külöbségek a kerekített adatakak a következméye. Sokaság aráyok egyezőségére ráyuló próba Eek vzsgálatát csak arra az esetre tárgyaljuk, amkor agy mták állak redelkezésükre, ekkor ugyas a bomáls eloszlás helyett jó közelítéssel ormáls eloszlással dolgozhatuk. Két sokaság aráy egyelőségére voatkozó lehetséges ullhpotézst és az alteratív hpotézseket a 69. táblázat tartalmazza. 86

87 9.3. Két függetle mtát géylő próbák Két sokaság aráy egyelőségére ráyuló próbák esete 69. táblázat Próba Nullhpotézs Alteratív hpotézs baloldal H : P < P kétoldal H : P P H : P P jobboldal H : P > P A tesztelésére a () próbafüggvéyt haszáljuk. Z p p, () p q + ahol p q p, q + p +. Természetese p + q. A 69. táblázatba smertetett próbákhoz tartozó elfogadás tartomáyok megegyezek a 6. táblázatba közöltekkel. + q + 87

88 9. Hpotézsek vzsgálata 9.4. Több függetle mtát géylő próbák Kettőél több (M számú) sokaságból (külö-külö és egymástól függetleül) vett mták alapjá végezhető teszteket evezzük többmtás próbákak. M csak a várható értékek egyezőségére voatkozó próbát tárgyaljuk. Varaca-aalízs A varaca-aalízs segítségével, evével elletétbe, több (ormáls eloszlású és azoos szóráségyzetű) sokaság várható értékéek egyezősége tesztelhető. A ullhpotézsüket és az ehhez tartozó alteratív hpotézst az alábbak szert fogalmazhatjuk meg. H : µ µ j,,..., M j H : µ j µ valamelyk j-re A fet ullhpotézs helyességéek elleőrzésére a () szert defált próbafüggvéyt haszáljuk. SSK /( M ) s F, () SSB /( M ) s K B ahol M számú sokaságból M számú mta áll redelkezésre, SSB a (77) képlet alapjá értelmezett eltérés-égyzetösszegek. M j j. Az SSK és az A () próbafüggvéy F eloszlást követ, a számláló szabadságfoka ν M és a evező szabadságfoka ν M. A varaca-aalízs végrehajtását és eredméyet egy táblázatba szoktuk rögzíte, amelyet leggyakrabba ANOVA 8) táblázatak evezük. Eek általáos redezés formáját a 7. táblázat tartalmazza. 8) Aalyss of Varace 88

89 Az ANOVA táblázat vázlata 9.4. Több függetle mtát géylő próbák 7. táblázat A szóródás oka Eltérések égyzetösszege Szabadságfok Szóráségyzet becslése F Téyező SSK M s K Hba SSB M s Összese SST B s s K B Az ANOVA táblázatba szereplő tapasztalat F értéket kell összevetük a megfelelő elmélet értékkel. Ez s jobboldal próba, tehát ha a tapasztalat F érték agyobb az elmélet értékél, akkor a várható értékek egyezőségére voatkozó ullhpotézst (az adott szgfkaca-szt mellett) elutasítjuk és ezzel egydejűleg a felállított alteratív hpotézst elfogadjuk. A FISHER-féle F-eloszlás Az F-eloszlás sűrűségfüggvéye a következő: ( ( / ) Y F f F), ( ν + ν ) / ( ν F + ν ) ν ahol Y kostas a ν és a ν értékektől függ, amelyet úgy kell megválaszta, hogy a sűrűségfüggvéy görbe alatt területe legye. Az F-eloszlás sűrűségfüggvéye a 39. ábrá látható. 9) Az F-eloszláshoz tartozó értékeket a stadard ormáls eloszláshoz hasolóa táblázatok segítségével s meg tudjuk határoz. Erre a VI. vagy a VII. táblázatot haszálhatjuk. 9) Lásd a ) lábjegyzetet. 89

90 9. Hpotézsek vzsgálata Az F-eloszlás sűrűségfüggvéyéek grafkoja,4,3 F (5,5),3,, F (,),, F (,),,5,5, ábra Az Ecelbe az F-eloszlás kvatls értéket az INVERZ.F(valószíűség; szabadságfok;szabadságfok) statsztka függvéy segítségével kaphatjuk meg. Itt a valószíűség α paraméterértéket kell megaduk a varaca-aalízshez szükséges elmélet érték meghatározásához. A t- eloszlás (IV. táblázat szert) értékere és az F-eloszlás értékere feáll: 73. példa t ν ) F (, ν ). α ( α Három kukorcafajta átlaghozamáak összehasolítása végett véletleszerű kválasztással (egymástól függetle) mtákat vettük, és az alábbakba smertetett adatokhoz (t/ha) jutottuk. Első fajta: 5,; 5,; 5,; 5,3; 5,3; 5,3; 5,3; 5,4; 5,4; 5,4; 5,5; 5,5. Másodk fajta: 5,; 5,3; 5,4; 5,4; 5,5; 5,6; 5,6; 5,6; 5,7. Harmadk fajta: 5,; 5,; 5,; 5,; 5,4; 5,4; 5,4; 5,6. 9

91 9.4. Több függetle mtát géylő próbák Az adatok alapjá, 5%-os szgfkaca-szte, elfogadhatjuk-e azt a hpotézst, hogy a három kukorcafajta átlaghozama megegyezk? (A hozamok megközelítőleg ormáls eloszlását feltételezzük.) A feladatak megfelelő ullhpotézs és alteratív hpotézs: H : µ µ j,, 3; H : µ j j µ valamelyk j-re. Az egyes fajtákra az alábbakba feltütetett mtajellemzőket számíthatjuk k. Első fajta: ; 5, 3 ; s,3. Másodk fajta: 9 ; 5, 48 ; s,4. Harmadk fajta: 3 8 ; 3 5, 3; s 3,4. Ezek alapjá a varaca-aalízs azoos szóráségyzetekre voatkozó feltételét az adatak kelégítk, így alkalmazhatjuk a () szert defált F próbafüggvéyt. Először határozzuk meg az eltérés-égyzetösszegeket a (77) összefüggések megfelelőe. SST SSK + SSB,843,69 +,634 Készítsük el az ANOVA táblázatot! A kukorcahozamok ANOVA táblázata 7. táblázat A szóródás oka Eltérések égyzetösszege Szabadságfok Szóráségyzet becslése F Fajta,69,35 Hba,634 6,36 4,89 Összese,843 8 A krtkus érték 5 %-os szgfkaca-szte és ν, ν 6 eseté a VI. táblázat 9

92 9. Hpotézsek vzsgálata szert (mt legközelebb felhaszálható érték) F,5 (,5) 3,385. A potos értéket az Ecel megfelelő függvéyéek meghívásával kapjuk: INVERZ.F(,5;;6) 3,369. Mvel jobboldal próbáról va szó és a próbafüggvéy aktuáls értéke agyobb a krtkus értékél, a ullhpotézst elutasítjuk, tehát a mták 5%-os szgfkacaszte em támasztják alá azt a feltételezést, hogy az egyes kukorcafajták átlaghozama között cs jeletős eltérés. Megjegyzés: %-os szgfkaca-szte, azaz az előbbél ksebb elsőfajú hba eseté, a ullhpotézst már elfogadák, mert az F, (,6) 5, 56 elmélet érték agyobb a kszámított F 4,89 értékél. 9

93 . Damkus elemzés Az eddgek sorá legkább egy vzsgált jeleség állapotával, lletve több jeleség között kapcsolat feltárásával foglalkoztuk. A jeleségek dőbel változásáak em tulajdoítottuk fotos szerepet, csupá a külöböző dőpotokba statkusa vzsgált jeleségek összehasolítását végeztük. Ebbe a fejezetbe azoba mde jeleséget az dő függvéyébe vzsgáluk, megpróbáljuk leír dőbel lefolyásukat. A damkus elemzésekek három megközelítése smert. Sztochasztkus dősorelemzés: azt feltételez, hogy mde dősor alakulását saját korább állapota és a véletle téyező befolyásolja. Az dősort sztochasztkus folyamatkét fogja fel és rövd távú hatásat vzsgálja. Spektrálaalízs: Az dősorok adatat többfrekvecás hullám eredőjekét fogja fel. Akkor haszálható, ha korlátla számú kísérlet végezhető azoos feltételek mellett. Determsztkus dősorelemzés: azt feltételez, hogy az dősorokba hosszú távo érvéyesülő törvéyszerűségek, tredek vaak, amelyek matematkalag kezelhetőek. M csak a legutóbb megközelítéssel foguk foglalkoz, de előbb tektsük át az dősorok elemzésére szolgáló egyszerűbb módszereket... Egyszerű elemzés módszerek A damkus elemzések forrása az dősorok. A.. fejezetbe már megsmerkedtük az dősor fogalmával és két fajtájával: az állapotdősorral (stock típusú) és a tartamdősorral (flow típusú). A.3. fejezetbe részletesebbe tárgyaltuk a damkus vszoyszámokat, amelyeket azoos sokaság két (dőbe külöböző) adatáak összehasolításával kaptuk. A.4. fejezetbe pedg az dősorok ábrázolásával s foglalkoztuk. Idősor adataak átlaga Az dősorok egyszerű jellemzésére szolgál, ha egy agyobb dőtervallumba meghatározzuk az abba megfgyelt értékek átlagát. Ezt az átlagot, mt dőtartamhoz tartozó adatot, az dőszak közepéhez gazítjuk. Eek megfelelőe külöböző módo 93

94 . Damkus elemzés átlagoljuk a stock és a flow típusú dősorok adatat. Tartamdősor eseté számta átlagot haszáluk: t t, ahol t a t-edk dőszakhoz tartozó megfgyelt érték, a megfgyelések száma. Megjegyzés: a fet képlet ekvdsztás (azoos hosszúságú) dőszakok megfgyeléset feltételez. Ha a megfgyelések dőbe em egyelő távolságra esek, akkor súlyozott képletet kell alkalmazuk. A továbbakba azoba az dősorok ekvdsztás jellegét mdg feltételezzük. Állapotdősor eseté az dősor átlaga s állomáy adat kell hogy legye, ezért először meg kell határozuk a megfgyelt dőpotok között dőszakokra eső átlagos állomáyokat, majd ezeket kell átlagoluk. Ezt a (3) szert számított mutatót kroologkus átlagak evezzük. k t t + (3) 74. példa Egy kft forgalm és létszámadatat a 7. táblázat tartalmazza. A kft fotosabb adata 7. táblázat Év Forgalom Létszám (mlló Ft) az év elejé

95 .. Egyszerű elemzés módszerek Számítsuk k a kft átlagos forgalmát az adott dőszakba és a foglalkoztatottak év átlagos agyságát, ha tudjuk hogy a kft 999 elejé 34 főt foglalkoztatott! A forgalomra voatkozó dősor flow típusú, azaz a 7. táblázat első adatsora tartamdősor. Az átlagos forgalmat ezért a következőképpe tudjuk kszámíta: ,6. 5 A létszám dősora azoba stock típusú, ezért tt a kroologkus átlagot haszáljuk: k 9. 6 Ezek alapjá a kft-ek 994. jauár. és 998. december 3. között évete átlagosa 87,6 mlló Ft forgalma volt; és e közbe évete átlagosa 9 főt foglalkoztatott. A változás teztásáak egyszerű mutatószáma Ha az egyk dőpotról (vagy dőszakról) a máskra törtéő változások agysága a vzsgált dőtervallumba bzoyos álladóságot mutat, tehát a szomszédos dőpotok (vagy dőszakok) adataak külöbsége agyjából egyelő, akkor a változás teztását jól jellemz a (4) szert defált övekedés átlagos mértéke. d t ( t t ) (4) Ha a szomszédos dőpotokhoz (vagy dőszakokhoz) tartozó adatok háyadosa tekthetőek álladóak, akkor a vzsgált dőtervallumba a változás teztását a övekedés átlagos üteme jellemz jól. Ezt (35) szert defáljuk: t l. t t A fet két mutató az dősorak csak az első és utolsó adatára támaszkodk, ezért csak akkor alkalmazható, ha az dősorba (abszolút vagy relatív módó) egyeletese érvéyesülő övekvő vagy csökkeő tedeca fgyelhető meg. 95

96 . Damkus elemzés Az dősorok összetevő A determsztkus dősorelemzés leggyakrabba alkalmazott modellje a dekompozícós dősormodell. Ez azt feltételez, hogy az dősorok alakulását égy fő összetevő befolyásolja. A legfotosabb összetevő a hosszabb dőszako át tartósa meglevő tedecát (átlagos mozgásráyt) kfejező tred. Ez az alapráyzat, amelyet a vzsgált jeleségre ható alapvető gazdaság, társadalm téyezők alakítaak k. Az dősorok vzsgálatakor gyakra fgyelhető meg szabályos gadozás (a tredhez képest), amely redszerese smétlődő hullámzást jelet. Ezt az összetevőt evezzük szezoáls kompoesek. A szezoaltás általába egy éve belül jeletkezk, természet téyezőkkel, társadalm szokásokkal magyarázható. Ez megfgyelhető például a mezőgazdaságba, az degeforgalomba, a házasságkötések számáak alakulásába, stb. A hosszabb dősorok vzsgálatáál megfgyelhetőek olya perodkus gadozások, amelyek em olya szabályosak és hosszúságuk több év. Ezek alkotják a cklkus kompoest. Ilyeek például a gazdaságba kmutatható kojuktúráls cklusok (lásd például KONDRATYEV-féle cklus, sertéscklus). Az eddg összetevőkkel em magyarázható szabálytala gadozásokat a véletle téyezőek tulajdoítjuk. Ez okozza a megfgyelt értékekek a tred, lletve a perodkus összetevők által meghatározott dősor görbéje körül sztochasztkus gadozását. Ezt a kompoest valószíűség változóak tekthetjük, éppúgy mt az dősor adatat, hsze ezek sok, egyekét számba em vehető téyező alakulásáak függvéye. A fetekből következk, hogy egy dősor bármelyk tagja az említett téyezőkek a függvéye, ezért a továbbakba em szel jelöljük, haem (utalva a függőségére) y- al. Arra voatkozóa, hogy a fet smertetett égy összetevő hogya kapcsolódk egymáshoz, a statsztka rodalomba alapvetőe kétféle modell smeretes. Az addtív 96

97 .. Egyszerű elemzés módszerek modell szert az összetevők összege adja azok eredőjét, míg a multplkatív modell szert az dősor a kompoesek szorzatakét képződk. A továbbakba szmbólumok segítségével fogjuk felír e két modellt. Addtív modell: a a a y T + S + C + ε. Multplkatív modell: m m m y T S C η. A két egyeletbe T a tred, S a szezoáls, C a cklkus kompoest, míg ε és η a véletle téyezőt jelöl. Az addtív modell eseté elvárjuk, hogy a szezoáls kompoesek összege legye, hsze szabályos ampltúdót feltételeztük. A véletle téyező várható értékét szté - ak feltételezzük. Multplkatív modell eseté ezek logartmusaról modhatjuk el ugyaezt. A dekompozícós dősormodellek esetébe céluk az, hogy ezeket az összetevőket elkülöítsük és számszerűsítsük. M a továbbakba az alaptedecát leíró treddel és a szezoáls kompoessel foglalkozuk részletesebbe, míg a cklkus téyező vzsgálatát em tárgyaljuk. Az általuk haszált addtív modell legye: y T + S + e, j a j a j j a multplkatív modell pedg: y j T S u, m j m j j ahol,,..., p a peródusok sorszáma, j,,..., p pedg a peróduso belül dőszak sorszáma. 97

98 . Damkus elemzés.. Mozgó átlagok módszere A tredszámítás az alaptedeca meghatározását, az dősor ksmítását jelet. Célja a múltba megfgyelt átlagos mozgásráy jövőbe való kvetítése, amt etrapolácóak evezük, elletétbe az terpolácóval, am a vzsgált dőszakra voatkozó vsszatektést jelet. Megjegyzés: az dősorok emprkus elemzéséél etrapoláláskor abból a feltételezésből duluk k, hogy a vzsgált jeleség múltbel átlagos mozgásráya a jövőbe s femarad. Ezért em ajálatos tredek segítségével túl távol dőtervallumokra következtet. A tredszámításak két fő módszere smeretes: a mozgó átlagok módszere és az aaltkus tredszámítás. Mozgó átlagok módszere A mozgó átlagok módszere alkalmazásakor a tredet az dősor damkus átlagolásával határozzuk meg úgy, hogy az dősor mde eleméhez kszámítjuk aak (valamekkora) köryezetébe levő elemek átlagát. A mozgó átlagok módszerét m csak addtív modellt feltételezve tárgyaljuk és ekkor számta átlagformát alkalmazuk. A multplkatív modell eseté a módszer hasolóa hajtható végre, csak mérta átlagokat kell haszáluk. A mozgó átlagok módszere azo alapszk, hogy addtív esetbe a szezoáls téyező várható értéke mde peródusba, ezért ha a peródus hosszáak megfelelőe választjuk meg aak a köryezetek a agyságát, amelybe levő elemeket átlagoljuk, akkor megközelítőleg a tredértékekhez jutuk (ameybe a tred megközelítőleg leárs). Az átlagolással kküszöböljük a szezoáls kompoest és csökketjük a véletle téyező szerepét. Fotos tehát a mozgó átlagolás tagszámáak, vagys az átlagoladó adatok számáak a helyes meghatározása. Ameybe ez em egyelő a perodkus kompoes hullámhosszáak egész számú többszörösével, akkor a szezoáls összetevőt em 98

99 .. Mozgó átlagok módszere tudjuk kküszöböl, és esetleg az eredet dősorál s agyobb hullámzást mutató tredet kapuk. A smítás émképpe külöbözk, ha a szezoáls kompoes peródusáak hullámhossza páratla és páros. A páratla tagszámú mozgó átlagolással ksmított tredet a (6) képlet segítségével kaphatjuk meg. yt k + yt k yt yt + k yˆ t, (5) k + ahol k + a szezoáls kompoes peródusáak hullámhossza. Ha a peródus páros számú megfgyelésből áll, akkor a mozgó átlag em redelhető egész sorszámú dőpothoz vagy dőszakhoz. Például 4 tagú mozgóátlagokat számítva az dősor első 4 adatáak átlaga a másodk és a harmadk megfgyelés között dőpothoz tartozk, hsze az e körül köryezetbe levő adatokat átlagoltuk. Ilyekor a kszámított adatokat még középre kell gazíta. Ezt az utóbb eljárást evezzük cetrírozásak. Eek sorá a mozgó átlagolással kapott dősoro újra elvégezzük a módszert kéttagú mozgó átlagokat alkalmazva. A cetrírozás utá kapott dősort közvetleül az eredet adatokból a következőképpe írhatjuk fel: yˆ t yt y k t + k + yt k yt yt + k +. (6) k A fet képletek alkalmazásával a mozgó átlagolású tredet csak a sorszámú adatokra tudjuk meghatároz, ezért az dősor elejé és végé k számú dőpothoz vagy dőszakhoz em számítható tredérték. Ezt evezzük a tred mozgó átlagolásból adódó rövdüléséek. k + t k Megjegyzés: az előzőekbe smertetett módszer megközelítőleg leárs alapráyzat eseté alkalmas a tredértékek elkülöítésére. Nemleárs esetbe más módszert kell alkalmaz (pl. SPENCER-féle súlyozott mozgó átlagok). 99

100 . Damkus elemzés 75. példa Az élelmszerek fogyasztó árdeet (hav botásba) 995 és 998 között a 73. táblázat tartalmazza. Készítsük el az dősor mozgó átlagolású ksmítását! A 4. ábra alapjá megállapíthatjuk, hogy az élelmszerek hav fogyasztó árdeeek dősorába évekét perodctás fgyelhető meg, ezért a ksmításhoz (vagy eek egész számú többszöröse) tagszámú mozgó átlagolást haszálhatuk. Páros tagszám eseté alkalmazuk kell a középre gazítást s. Az eredméyeket a 74. táblázat tartalmazza. Élelmszerek fogyasztó árdee között 73. táblázat Hóap Jauár 5,9 3,6 3,7,9 Február 3,3,8,5,6 Márcus,4,7,9,5 Áprls 3,,,5,5 Május,5,8,6,4 Júus 99,6,6 4, 99,9 Júlus 99,, 98,3 97,6 Augusztus 98,4 99,5 99, 98, Szeptember,5,,6, Október,9,7,6, November,4,6, December,3,9,6, Forrás: Fogyasztó Árde Füzetek, KSH, Bp., Először ábrázoljuk az adatokat voaldagram segítségével. (Lásd a 4. ábrát.) 3

101 .. Mozgó átlagok módszere Az élelmszerek fogyasztó árdeéek alakulása között 7, Hav árdeek 5, 3,, 99, 97, 95, Év 4. ábra A 74. táblázat elkészítéséél haszálhatjuk az Ecelt s. Hívjuk meg az Eszközök meü Adatelemzés... almeüjét és válasszuk k a felkíált lehetőségek közül a Mozgóátlag meüpotot. Az ekkor megjeleő párbeszédpael segítségével adjuk meg a Bemeet tartomáyt. Az Itervallum mezőbe kell beíruk a mozgó átlagok tagszámát. A Dagramkmeet jelölőégyzetet bekapcsolva grafkus ábrát s kaphatuk. Az említett opcóko kívül az Ecel még más lehetőségeket s felkíál, de ezekkel m em foglalkozuk. Megjegyzés: az Ecel által haszált eljárás em alkalmazza a (6) szert cetrírozást! Ezt ekük kell utólag elvégez. 3

102 . Damkus elemzés Élelmszerek fogyasztó árdeeek mozgó átlagolással ksmított dősora 74. táblázat Év Hóap Árde Mozgó átlag Cetrírozás 995 Jauár 5,9 Február 3,3 Márcus,4 Áprls 3, Május,5 Júus 99,6,77 Júlus 99,,58,67 Augusztus 98,4,45,5 Szeptember,5,48,46 Október,9,33,4 November,4,8,5 December,3,7,3 996 Jauár 3,6,35,3 Február,8,44,4 M M M M M,8 998 Jauár,9,,5 Február,6,3,7 Márcus,5,9,96 Áprls,5,78,84 Május,4,63,7 Júus 99,9,5,57 Júlus 97,6 Augusztus 98, Szeptember, Október, November, December, 3

103 .. Mozgó átlagok módszere Az eredet és a ksmított dősort a 4. ábrá láthatjuk. Élelmszerek hav fogyasztó árdeeek mozgó átlagolással ksmított dősora 7, Hav deek 5, 3,, 99, 97, 95, Év Eredet dősor Ksmított dősor 4. ábra A következő fejezetbe egy másk (agyo gyakra alkalmazott) eljárást smertetük, amely segítségével az dősor alapráyzata szté számszerűsíthető. 33

104 . Damkus elemzés.3. Aaltkus tredszámítás Az aaltkus tredszámítás sorá a vzsgált jeleség alapráyzatát aaltkus függvéy megadásával írjuk le. (Megjegyzés: a mozgó átlagok módszere em eredméyezett lye aaltkusa felírható tredfüggvéyt.) Ez a módszer a regresszószámítás egy specáls esetéek s tekthető. Ilyekor a vzsgált jeleség adatat ( y ) az dő ( ) függvéyekét kezelhetjük, és eek megfelelőe végezhetjük el a görbellesztést. A 6. fejezethez hasolóa, most s az LNM-t haszáljuk. Megjegyzés: a regresszószámítással elletétbe, ahol az adatpárok sorredje léyegtele, az dősor eseté ugyaez már fotos szerepet játszk! Az aaltkus tredszámítás sorá s az az első feladatuk, hogy eldötsük mlye típusú függvéy lleszkede legjobba az dősorra. A megfelelő függvéytípus kválasztásáál most s haszálhatjuk az dősor grafkus ábráját. Leárs tred Ha az dősor tartós tedecáját leárs függvéyel modellezzük (leárs tred), akkor felírhatjuk a következő összefüggést: y β + β + ε. A fet modellbe szereplő (számukra smeretle) paraméterek becslése végett külöböző dőpotokra vagy dőszakokra voatkozó adatokat veszük (am egy mtáak tekthető). Eek a mtáak a segítségével (redszert az LNM alkalmazásával) határozzuk meg a becsült paramétereket, azaz a βˆ -t, lletve a β -t. ˆ Ha az LNM-t haszáljuk, a becsült paramétereket a (34)-(35) egyeletredszer szert számíthatjuk k. Így a (33) egyeletek megfelelő összefüggéshez jutuk: ˆ ˆ ˆ. y β + β A ormálegyeletek egyszerűsítése végett, damkus elemzésél, gyakra alkalmazuk leárs traszformácót. Az eredet dőváltozót úgy traszformáljuk, hogy az így kapott 34

105 .3. Aaltkus tredszámítás új változó (amelyet a továbbakba t -vel jelölük) értékeek összege legye, azaz t (7) teljesül. A (7) összefüggés mdg bztosítható a 75. és a 76. táblázatba szereplő algortmus szert, amelyél a t értéket az dősor közepéhez redeljük. Megjegyzés: az aaltkus tredszámítás alkalmazásakor mdg ekvdsztás dősorokat feltételezük! Egy jeleség között adataak lehetséges kódolása (páratla számú megfgyelés) Év t táblázat 5 t Egy jeleség között adataak lehetséges kódolása (páros számú megfgyelés) Év t -,5 -,5,5,5 t táblázat 4 t Ha az eredet dőváltozót traszformáltuk, akkor a tredegyelet felírásakor kötelezőe meg kell aduk a kdulópotot (a t értékhez tartózó dőpotot), lletve az egyes tegelyeke haszált egységeket. Megjegyzés: a kdulópot megadásáál mdeféleképpe fgyelembe kell veük: az dősor típusát és azt, hogy adatak melyk dőpothoz tartozak. Az új változó bevezetésével, fgyelembe véve a (7) összefüggést, az eredet ormálegyeletek alkalmazása helyett, a becsült paramétereket a (8)-(9) képletek 35

106 . Damkus elemzés segítségével számíthatjuk k. y ˆβ (8) t y ˆβ (9) t A ˆβ becsült paraméter a t dőpothoz (am az dősoruk közepé va) tartozó becslés, így ez (a regresszószámítással elletétbe) mdg értelmezhető. A kostas paraméter tartamdősor eseté az dősor átlagos értékéek tekthető. A ˆβ becsült paraméter azt mutatja meg, hogy az adott dőszakba a vzsgált jeleség dőegységekét átlagosa háy egységyvel változott. Megjegyzés: a (4) szert defált mutatót ugyaígy értelmezhetjük. Azoba ez a két mutató általába em egyelő, mert a d meghatározásakor csak az dősor első és utolsó adatát, míg vesszük. ˆβ kszámításakor az dősor összes megfgyelés értékét fgyelembe Az dősorok emprkus elemzésekor gyakra em csak az éves adatokra va szükség, haem a egyedéves, lletve hav adatokra s. Az éves leárs tred ( yˆ ˆ β + ˆ β ) segítségével ezeket k tudjuk számíta a 77. táblázatba közölt összefüggések szert. Megjegyzés: mvel külöböző dőegységek szerepelhetek a tredfüggvéybe, mdg fel kell tütet a kdulópotot és az dőtegelye felvett egységet, am a leggyakrabba év, egyedév, lletve hóap szokott le. 36

107 Negyedéves és hav tredértékek kszámítása.3. Aaltkus tredszámítás A tred fajtája egyedév hav 77. táblázat Az dősor típusa tartamdősor állapotdősor ˆ ˆ ˆ β β yˆ + y ˆ β ˆ β ˆ β ˆ β ˆ yˆ + y ˆ β ˆ β + 44 Epoecáls tred Ha az dősor folyamá az dőegységekét relatív változás mutatkozk megközelítőleg álladóak, akkor epoecáls tredegyelettel közelítjük a megfgyelés értékeket. Eek felírása a (45) képletek megfelelő. Ezt (a 6.. fejezetbe smertetett módo) logartmzálva, a leárs esethez hasoló ormálegyeletekhez jutuk. Ha a t értéket most s az dősor közepéhez gazítjuk, akkor a ()-() szert képletek segítségével határozhatjuk meg a becsült paramétereket. log y log ˆ β () t log y log ˆ β () t A paraméterek eredet értékét a fetek (logartmus alapjáak megfelelő) hatváyozásával kaphatjuk meg. A ˆβ becsült paraméter most s a t dőpothoz tartozó becslés. A ˆβ becsült paraméter az dőegységekét átlagos változás relatív mértékét (p) és ráyát adja meg a vzsgált dőtartam alatt, ahol p százalékba kfejezve: p ( ˆ β ). 37

108 . Damkus elemzés A ˆβ (lletve a p) jeletését tektve megegyezk a (35) szert defált övekedés átlagos ütemével ( l ). Ez a két mutató sem mdg egyezk meg, mert az utóbb (a d - hoz hasolóa) a övekedés átlagos üteméek becslésére csak az dősor első és utolsó adatát haszálja, míg βˆ most s fgyelembe vesz az dősor összes megfgyelés értékét. 76. példa A személy jövedelemadó hely ökormáyzatokál maradó részaráyáak tartamdősorát a 78. táblázat tartalmazza. Az ökormáyzatok részesedése az SZJA-ból 78. táblázat Év SZJA részesedés mértéke (%) Forrás: Pézügymsztérum Illesszük epoecáls tredet az adott tartamdősorra! A tredegyelet meghatározásához szükséges mellékszámításokat a 79. táblázat tartalmazza. 38

109 Év.3. Aaltkus tredszámítás Az epoecáls tredfüggvéy llesztéséhez szükséges adatok t lg y t lg y t 79. táblázat 99-4,5,699-7,645,5 99-3,5,699-5,946, ,5,477-3,693 6, ,5,477 -,6, ,5,477 -,739,5 996,5,3979,699,5 997,5,344,4,5 998,5,3 3,53 6, ,5,76 4,6,5 4,5,699 3,45,5 Összese, 3,7458-7, 8,5 A táblázat utolsó soráak adatat a ()-() képletekbe helyettesítve a következő eredméyeket kapjuk: lg ˆ β 3746, ; lletve lg ˆ β -, 85. Ie: ˆ β 3,696 ; lletve ˆ β,83. Az epoecáls tredegyelet az alább. yˆ 3,696, 83 Kdulópot: 995. december 3. A t tegelye egység: év. Az y tegelye egység: %. t A ˆ β,83 azt jelet, hogy az ökormáyzatok SZJA részesedéséek mértéke (a vzsgált dőszakba) évete átlagosa,83 szorosára változk. 39

110 . Damkus elemzés Mvel p (,83 ) ; az átlagos éves csökkeés 7,77%. Az eredet dősort és az llesztett tredet a 4. ábra mutatja. Az ökormáyzatok részesedése az SZJA-ból 99- között 6 Részesedés (%) ,5-3,5 -,5 -,5 -,5,5,5,5 3,5 4,5 Év Erdet dősor Tred 4. ábra Parabolkus tred A (másodfokú) parabola tredegyeletét (47) képlethez hasolóa defálhatjuk. Ezt alkalmazva a 6.. fejezetbe smertetett (parabolkus függvéyhez tartozó) ormálegyeletekből álló egyeletredszert kell megoldauk. Ha a t értéket most s az dősor közepéhez gazítjuk, azaz a teljesül, akkor az egyeletredszerük a ()-(4) összefüggésekkel s felírható. t Ez az (eredetél egyszerűbb) egyeletredszer, (3) szert, közvetleül adja a β smeretle paraméter becsült értékét. 3

111 .3. Aaltkus tredszámítás y ˆ β + ˆ β t () ˆβ t y t (3) t y ˆ t + ˆ 4 β t β (4) Megjegyzés: a regresszószámításhoz hasolóa, a tredszámításál sem tudjuk közvetleül értelmez a ˆβ és ˆβ paramétereket. A ˆβ paraméter a kdulópothoz tartozó tredértéket adja, tehát ugyaúgy értelmezhető, mt a leárs és az epoecáls tredfüggvéyek esetébe. 77. példa A táppézre jogosultak átlagos ap létszámára voatkozó adatokat a 8. táblázat tartalmazza. A táppézre jogosultak számáak alakulása között Év 8. táblázat Jogosultak ap átlagos létszáma (ezer fő) Forrás: Országos Egészségbztosítás Péztár 3

112 . Damkus elemzés Illesszük (másodfokú) parabolát az adott tartamdősorra és számítsuk k a 5. évhez tartozó tredértéket! A ()-(4) összefüggések alkalmazásával a feladat megoldható. Ezekhez szükséges számításokat a 8. táblázat tartalmazza. t A parabolkus tredfüggvéy llesztéséhez szükséges adatok y t y t y t 8. táblázat -4, , ,75,5 4,65-3, , 3 776,5,5 5,65 -, , ,5 6,5 39,65 -, , ,5,5 5,65 -, ,5 987,5,5,65, ,5 54,75,5,65, , 9 57,5,5 5,65, , 6 5, 6,5 39,65 3, , 55 65,,5 5,65 4, , ,75,5 4,65 Összese , 66 64, 8,5 8,65 4 t A parabolkus tred egyelete az alább. yˆ 47,5 + 4,6 t 54,83 t Kdulópot: 97. december 3. A t tegelye egység:5 év. Az y tegelye egység: ezer fő. Az eredet dősort és az llesztett tredet a 43. ábra mutatja. A 5. évhez tartozó tredértéket a t 6,5 helyettesítéssel kapjuk: yˆ( t 6,5) 47,5 + 4,6 6,5 54,83 6,5 334,49. Ezek szert, ha a vzsgált dősorba levő átlagos mozgásráy a 5. évg változatla 3

113 .3. Aaltkus tredszámítás marada, a táppézre jogosultak átlagos ap létszáma 5-be fő lee. A táppézre jogosultak számáak alakulása között Táppézre jogosultak ap átlagos száma (ezer fő) ,5-3,5 -,5 -,5 -,5,5,5,5 3,5 4,5 Év Eredet dősor Parabolkus tred 43. ábra Logsztkus tred A hosszú dősorok vzsgálatáál a grafkus ábrá gyakra megkülöböztethetük három szakaszt. Az első szakaszra a lassú övekedés jellemző, míg a másodkba ez felgyorsul, majd a harmadkba a övekedés ütem smét lassúvá válk, és az adatok egy álladó érték felé tartaak. Ilyekor célszerű (yújtott) S alakú görbét lleszte az dősorra. Ezt a függvéytípust evezzük logsztkus tredfüggvéyek. Ilye típusú függvéyt leggyakrabba a épességstatsztkába, (tartós fogyasztás) termékek keresletéél haszálhatuk. Az utóbb esetbe az említett S alakú görbe a termék életgörbéje, és szakasza megfelelek a termékbevezetés, a tömegszerűvé válás és a telítődés szakaszáak. 33

114 . Damkus elemzés A logsztkus görbék közül m a (5) képlettel defált becslőfüggvéyt fogjuk haszál. e y y + + ˆ ˆ ma ˆ ˆ β β (5) Az paraméter a telítődés szt, a (5) függvéy felső (vízsztes) aszmptotája. ŷ ma A logsztkus tred paramétereek meghatározása a legksebb égyzetek módszere szert jóval boyolultabb, mt az eddg smertetett modellek esetébe, ezért először egy egyszerűbb (kevésbé egzakt) megoldást smertetük: a három kválasztott pot módszerét. Első lépéskét, az említett három szakaszra jellemző helye, válasszuk k három potot. Ezek (kötelezőe) egymástól egyelő távolságra legyeek. Jelölésükre vezessük be a következő szmbólumokat:, ahol m a kválasztott potok egymástól való (azoos) dőbel távolságát jelöl és. m m,, + + Másodk lépéskét meghatározzuk az így kválasztott dőpotok köryezetéhez tartozó átlagos adatot ( m m Y Y,, + + Y ). Harmadk lépéskét kszámítjuk a (5) függvéy paraméteret a (6)-(8) összefüggések segítségével. ma ) ( ˆ m m m m m m Y Y Y Y Y Y Y Y Y y (6) ma ˆ l ˆ Y Y y β (7) + + ) ˆ ( ) ˆ ( l ˆ ma ma m m Y y Y Y y Y m β (8) 34

115 .3. Aaltkus tredszámítás 78. példa Hazák személygépkocs-állomáyát az között dőszakra a 8. táblázat tartalmazza. A személygépkocs-állomáy között (az év végé, ezer db) 8. táblázat Év Szgk. száma Év Szgk. száma Év Szgk. száma Forrás: Magyar Statsztka Zsebköyvek 58-98, KSH, Bp. Illesszük logsztkus tredfüggvéyt az adott állapotdősorhoz a három kválasztott pot módszeréek alkalmazásával, és ábrázoljuk az emprkus és az elmélet adatokat! A módszer léyege az, hogy (első lépéskét) ökéyese kválasztuk három, a szakaszokat jól jellemző potot. Legyeek ezek 96., 977. és 99. december 3. A következő lépésbe az adott potok (ökéyese kválasztott agyságú) köryezetébe kszámítjuk a kroologkus átlagokat a (3) képlet alapjá a 83. táblázatba közöltek szert. A 83. táblázatba szereplő adatokat a (6)-(8) képletekbe helyettesítve a következő eredméyeket kapjuk: yˆ ma 54, ; βˆ 3, 848 ; ˆ β,

116 . Damkus elemzés A logsztkus tredfüggvéy meghatározásához szükséges részeredméyek A kválasztott három dőpot Az dősor tagjaak új jelölése 96. dec dec m dec m táblázat A éves köryezet kroologkus átlaga Y Y Y ,5 3 75,5 55,75 Ezek szert a logsztkus tredfüggvéy az alább. yˆ + e 54, 3, Kdulópot: 96. december 3. A tegelye egység: év. Az y tegelye egység: ezer db. Az emprkus és a fet függvéy szert adatokat a 44. ábra mutatja. Megjegyzés: az smertetett módszer egyk hátráya, hogy az dősor harmadk szakaszába általába felülbecsül a vzsgált adatsort. Ez a 44. ábrá s jól látható. A logsztkus tred llesztésére most egy összetettebb, de ökéyes elemeket em tartalmazó módszert smertetük. Eek az a léyege, hogy előbb (9) alapjá megbecsüljük az dősor telítődés sztjét, és eek smeretébe learzáljuk a (5) tredfüggvéyt. 36

117 .3. Aaltkus tredszámítás A személygépkocs-állomáy alakulása (az év végé, ezer db) 5 Személygépkocsk száma 5 5 Időpot Eredet dősor Logsztkus tred 44. ábra A szaturácós szt becslése végett a következő dfferecaegyeletből duluk k: y β + ( β ) y + y. yma Vezessük be az alább helyettesítéseket. u y + b ( β ) c y β ma Ezek szert az eredet dfferecaegyelet felírható a következő módo s: u b y + c y,,...,. 37

118 . Damkus elemzés Ez em más, mt egy másodfokú parabola regresszófüggvéye. Megjegyzés: a vzsgált függvéy em azoos a (47) alatt smertetett regresszófüggvéyel, mert a kostas tag tt em szerepel! A legksebb égyzetek módszerét alkalmazva megkapjuk a b és a c becsült értékét, amelyek segítségével az szté becsülhető. (Megjegyzés: a becsült értékét em a b paraméter smeretébe számítjuk k!) ma y β Fgyelembe véve a feteket, a szaturácós szt becslésére felírható az alább eplct összefüggés ˆ ma y y y y y y y y y y y y y y y y (9) A (9) segítségével kszámított értéket tektjük a (5) tredfüggvéy (számlálójába szereplő) paraméteréek. ŷ ma A (5) egyelet (átalakítások utá) az alább alakra hozható: y y y z ma ˆ ˆ ˆ l ˆ β β +, () ahol: y y y z ˆ ma l. Megjegyzés: az előző egyelet helyett a következő leárs tredegyeletet s leírhattuk vola: z ε β β + +. A paraméterek becslését ( megfelelő helyettesítésével) a (8)-(9) képletek z 38

119 .3. Aaltkus tredszámítás alkalmazásával kaptuk. 79. példa A 78. példa adata alapjá, ezzel a módszerrel s határozzuk meg a személygépkocsállomáy dősorához llesztett tredfüggvéyt! Először (a 84. táblázat adata alapjá) k kell számítauk a telítődés szt becslését. A (9) képletbe behelyettesítve: -8588, E y ˆ ma 449,7. -4, 437E6 Most már felírhatjuk a learzált egyeletet: z 449,7 y l β + β + ε y. A logsztkus tredfüggvéy telítődés sztjéek becsléséhez szükséges részeredméyek y y + y 3 y 84. táblázat M

120 . Damkus elemzés A logsztkus tredfüggvéy telítődés sztjéek becsléséhez szükséges részeredméyek (folytatás) 4 y y y+ y y+,464e+4,43e+,573e+3,856e+4,34e+ 3,4E+3,4976E+5 4,5E+ 8,E+3 3,965E+5 7,75E+,9375E+4 M,9534E+3 4,5548E+6 9,5756E+9,46E+3 4,88737E+6,6398E+,549E+3 5,868E+6,46E+,678E+3 5,4E+6,7737E+,9867E+4 5,78754E+7,345E+ 84. táblázat A ˆβ és ˆβ kszámításához szükséges részeredméyeket a 85. táblázat tartalmazza. A logsztkus tredfüggvéy llesztéséhez szükséges részeredméyek 85. táblázat Év t y z z t t ŷ 956 -,5 5,433 -,778 4,5 6, ,5 3 5,3346 -,54 38,5, 958-8,5 8 4,9598-9, ,5 4, 959-7,5 5 4, , ,5 9, M 994 7,5 77 -,778-36, ,5 95, 995 8,5 45 -, , ,5 34, ,5 64 -,568-48, ,5 69, 997,5 97 -,779-55,574 4,5 98, Össz., , ,48 67,5 3735,3 3

121 .3. Aaltkus tredszámítás A (8)-(9) képletek fgyelembevételével kszámíthatjuk a (5) tredfüggvéy még em smert paraméteret. Ezek: 47,5755 ˆ β,363 ; 4 lletve: 59,48 ˆ β, ,5 Ezek szert a logsztkus tredfüggvéy az alább. yˆ + e 449,7,363,8783 t Kdulópot: 977. júus 3. A t tegelye egység: év. Az y tegelye egység: ezer db. Az emprkus és a fet függvéy szert adatokat a 45. ábra mutatja. A 44. és a 45. ábra összehasolításával jól látható, hogy a másodk módszer jóval potosabb (de összetettebb s) az elsőél. Erre utal a becsült értékek összege s, am a másodk módszer szert 3735,3; az első módszer szert 457,8; míg az eredet adatok összege ezer db. 3

122 . Damkus elemzés A személygépkocs-állomáy alakulása (év vég adatok, ezer db) Személygépkocsk száma Eredet dősor Logsztkus tred t 45. ábra A tredhatás mellett, az dősorok adatat a szezoáls téyező s befolyásolhatja. A következő fejezetbe eze téyezők számszerűsítéséek módszeret smertetjük. 3

123 .4. Szezoáls gadozások elemzése.4. Szezoáls gadozások elemzése Ahogy azt már említettük, a szezoáls kompoes (S) az dősorba redszerese smétlődő, azoos peródusú és szabályos ampltúdójú gadozásokat mutatja. Ezek az emprkus vzsgálatokba leggyakrabba hav vagy egyedéves gadozások. Most azt fogjuk megvzsgál, hogy az S kompoes értékét hogya tudjuk becsül egy megfgyelt dősorból. Arra keressük tehát a választ, hogy a szezoáls hatás az egyes peródusokba mlye mértékbe (addtív modell), lletve mlye aráyba (multplkatív modell) térít el az dősor adatat az alapráyzattól. A szezoáls hatás kmutatását úgy végezzük, hogy kszűrjük az dősorból a másk két téyező hatását (a tredet most már y-al helyettesítve). Addtív modell eseté: j a j y y + S + e, a j j ezért a tredhatást az smertetett eljárások alapjá kszámítva, és a megfgyelt értékekből levova, majd a kapott értékeket átlagolva jutuk a becsült yers szezoáls eltérésekhez. Ha a tredet a mozgó átlagok segítségével számítottuk k, akkor: / p a ( y yˆ ) j j s a j,,..., p j / p ; () ha pedg aaltkus tredszámítást alkalmaztuk, akkor: s / p j a j / a ( y yˆ ) j. () p Mvel a szezoáls hatások egy peróduso belül kegyelítk egymást, ezt a becsült szezoáls eltérésektől s elvárjuk. Eek bztosítására a yers szezoáls eltérésekből kszámítjuk a korrgált szezoáls eltéréseket. ~ s s s, (3) a j a j a j 33

124 . Damkus elemzés ahol: s a j p j s a j. p A becsült korrgált szezoáls eltérésekre: p j ~ a s. j A fet módszerrel kapott becsült szezoáls eltérések azt fejezk k, hogy az dősor megfgyelt értéke átlagosa meyvel térek el a tredértéktől a szezoáls hatás következtébe. Multplkatív modell eseté y j m j y S u. m j j Itt az addtív modellhez hasoló módo tudjuk kmutat a szezoáls hatást. A becsült yers szezodeeket s kétféleképpe lehet kszámíta. Ha a tredet a mozgó átlagok segítségével számítottuk k, akkor: / p y j m yˆ m j s j, (4) / p ha pedg aaltkus tredszámítást alkalmaztuk, akkor: s / p y j m yˆ j. (5) p m j / A korrgált szezodeek: m j ~ s m s j, (6) s m j 34

125 .4. Szezoáls gadozások elemzése ahol: s m j p j s m j. p A becsült korrgált szezodeekre: p j ~ m s p vagy p%. j Megjegyzés: hav adatok eseté a fet összeg -vel vagy százalékkal egyelő. Az alkalmazott módszerrel kapott becsült szezodeek azt fejezk k, hogy az dősor megfgyelt értéke, a szezoáls hatás következtébe, átlagosa háyszorosa a tredértékek. 8. példa A 75. példa 73. táblázata az élelmszerek fogyasztó árdeet tartalmazza (hav botásba) 995 és 998 között. Elemezzük az árdeek dőbel alakulását, számszerűsítsük a szezoáls kompoest! Ebbe az esetbe, az dősor alapráyzatát jellemző tred meghatározására, haszáljuk aaltkus tredllesztést. A 4. ábra alapjá leárs modellt feltételezhetük. A (8)-(9) képletek alkalmazásával az alább eredméyre juthatuk. y,58, 39 t Kdulópot: 996. december 3. A t tegelye egység: hóap. Az y tegelye egység: %. Számítsuk most k az eredet adatok leárs tredtől való külöbséget, lletve háyadosat. 35

126 . Damkus elemzés a j y j A megfgyelt értékek és a tred értékeek külöbsége ( y ˆ ) 86. táblázat Hóap Átlag Ja. 3,73,897,46,5,554 Febr.,7,35,3,864,68 Márc. -,69,74 -,6,83 -,9 Ápr.,948 -,387,377,84,445 Máj.,487 -,749,56,78,759 Jú. -,374 -,9,955 -,68 -,53 Júl. -,936 -,47 -,77 -,94 -,54 Aug. -3,497 -,93 -,768 -,44 -,4 Szept.,64,86,67 -,365,438 Okt.,8,345,79 -,6,477 Nov. -,38 -,76,48 -,88 -,59 Dec. -,44 -,378,787 -,49 -,45 Összese:, A megfgyelt értékek és a tred értékeek háyadosa ( y m j yˆ j / ) 87. táblázat Hóap Átlag Ja.,37,9,4,,5 Febr.,,,3,9,6 Márc.,993,,997,8, Ápr.,9,996,4,8,4 Máj.,5,993,5,8,8 Jú.,977,99,9,993,998 Júl.,97,986,973,97,975 Aug.,966,98,98,976,976 Szept.,6,8,7,996,4 Okt.,,3,7,998,5 Nov.,996,993,,997,999 Dec.,996,996,8,999, Összese:, 36

127 .4. Szezoáls gadozások elemzése A szezodeek álladóbbak, mt a szezoáls eltérések, ezért a továbbakba a multplkatív modell haszálata dokolt. Mvel a szezodeek összege -vel egyelő, ezért cs szükség a (6) szert korrgálásra. A szezoáls hatás ábrázolása 7, Hav árdeek (%) 5, 3,, 99, 97, 95, Eredet dősor Tred Becsült dősor Hóapok 46. ábra A fejezet végé megemlítjük a szezoáls kgazítás fogalmát. Ezalatt azt értjük, hogy a megfgyelt dősort megtsztítjuk a szezoáls hatásoktól. A szezoáls kgazítás eredméyekét ú. szezoálsa kgazított dősort kapuk, amely gyakra szerepel a külöböző statsztka kadváyokba. 37

128 . Többváltozós regresszó- és korrelácószámítás.. Többváltozós regresszószámítás A 6. fejezetbe már részletesebbe tárgyaltuk a kétváltozós regresszós modellt, amelybe egyetle magyarázóváltozót szerepeltettük. A gyakorlatba azoba egy jeleség alakulását általába em egy, haem több szgfkás téyező határozza meg. A regresszós modell javítása érdekébe ezért mde relevás téyező szerepeltetése célszerű. A változók száma mellett fotos szerepe va a regresszós modellbe alkalmazott függvéy típusáak s, amely egyszerűbb esetekbe leárs, de az emprkus elemzésekél gyakra emleárs. Az előzőek alapjá a regresszós modellek égy esetét külöböztethetjük meg. A regresszós modellek esete 88. táblázat A regresszó- A változók számától függőe a modell lehet függvéy típusától függőe a modell lehet kétváltozós leárs kétváltozós emleárs többváltozós leárs többváltozós emleárs Emprkus elemzésekél az első lépések egykekét el kell döte, hogy a fet esetek közül melykkel dolgozuk. Eek kválasztását és a későbbekbe smertetett egyéb feltételredszer meghatározását evezzük a modell specfkácójáak. A stadard leárs regresszós modell A 88. táblázatba közölt esetek közül köyvükbe csak a leárs, lletve leárs alakra hozható kétváltozós vagy többváltozós regresszófüggvéyekkel foglalkozuk. Ezek általáos alakja, (3)-höz hasolóa, ( elemű mtát feltételezve) felírható (7) szert s. y βˆ ˆ ˆ ˆ + β + β + K + βm m + e,,..., m + < < N (7) 38

129 .. Többváltozós regresszószámítás A továbbakba gyakra fogjuk alkalmaz a regresszós modell mátralgebra jelölésmódját. A következő jelöléseket fogjuk haszál: y y y M y X M L m m m βˆ βˆ ˆ β M βˆ m e e e, (8) M e ahol m a magyarázóváltozók száma és X első oszlopa mdg egy összegező vektor. A modell specfkácójáak fotos részét alkotják még az alábbakba smertetett feltételek s. A változók között feállak a következő összefüggések: y Xβ + ε, y Xβ ˆ + e, lletve yˆ Xβˆ. A magyarázóváltozók em sztochasztkusak (mérés hbát em tartalmazak), valamt leársa függetleek (tehát em redudásak). Ez utóbb azt jelet, hogy az X mátr ragja az oszlopaak számával egyelő: ρ ( X) m +. A hbatagok ulla várható értékű, kostas varacájú (σ ), korrelálatla valószíűség változók, amelyek együttes eloszlása -dmezós ormáls eloszlás: ε N(, σ I), ahol I az egységmátr. Az összes eddg smertetett feltételekek eleget tevő modelleket evezzük stadard leárs regresszós modellekek. A regresszószámítás gyakorlat alkalmazásakor ügyelük kell arra, hogy a fet modellt e haszáljuk, ha valamelyk feltétele szgfkása em teljesül! 39

130 . Többváltozós regresszó- és korrelácószámítás Közgazdaság elemzésekél eek leggyakrabba három oka lehet: multkolleartás: a magyarázóváltozók leárs függetleségéek háya, autokorrelácó: a hbatagok leársa em függetleek, heteroszkedasztctás: a hbatag szóráségyzete em álladó. Ezekkel a jeleségekkel részletesebbe majd a.3. fejezetbe foglalkozuk. A modellük fukcoáls operátoráak meghatározásakor olya hpersíkot keresük, amely a legközelebb va az -dmezós potfelhőhöz. Ha a β paramétervektor becslésére most s a legksebb égyzetek módszerét alkalmazzuk, akkor a (4) szert mátregyelethez juthatuk. A GAUSS MARKOV tétel: a legksebb égyzetek módszere BLUE (best lear ubased estmator) tulajdoságú βˆ vektort ad, vagys a becslőfüggvéy torzítatla és (a leárs modellek közül) a legksebb szóráségyzetű (effces). A becsült paraméterek értelmezése A βˆ, βˆ,..., ˆ βˆ j β m becsült regresszós paramétereket a következőképpe értelmezhetjük: a azt mutatja meg, hogy az magyarázóváltozó egységy övekedése az eredméyváltozó átlagosa mekkora változásával jár együtt, ha a több magyarázóváltozó értéke em változk. A értelmezés matt, parcáls regresszós együtthatókak evezzük. j A regresszós modell lleszkedéséek jósága Defáljuk az alább eltérés-égyzetösszegeket. ˆ β j együtthatókat, ematt a ceters parbus SST SSR SSE ( y y) (9) ( yˆ y) (3) ( y yˆ ) e (3) 33

131 .. Többváltozós regresszószámítás Ameybe a modellük tartalmaz kostas paramétert, tehát β, akkor a (9)-(3) szert defált eltérés-égyzetösszegekre feáll a következő összefüggés: SST SSR + SSE. (3) Ezek alapjá a (5) szert defált leárs determácós együttható felírható a (33) képlettel s. SSE r SST SSR SST (33) Eek részletesebb smertetésére majd a.. fejezetbe kerül sor. Egy modell lleszkedéséek mértéke természetese azzal defálható, hogy a teljes eltéréségyzetösszegek mekkora részét tesz k a regresszó által megmagyarázott és a hbataggal kapcsolatos égyzetösszeg. A modell lleszkedéséek jóságát varaca-aalízs segítségével tesztelhetjük, amt a többváltozós regresszószámításba globáls F-próbáak s evezük. Nullhpotézsük és alteratív hpotézsük az alább módo fogalmazható meg. H m H : β β... β : β valamelyk j-re j,,..., m j A fet ullhpotézs helyességéek elleőrzésére a (34) szert defált próbafüggvéyt haszáljuk. SSR / m F SSE /( m ) MSR MSE (34) A (34) próbafüggvéy F-eloszlást követ, a számláló szabadságfoka ν m, a evező szabadságfoka ν m. A varaca-aalízs végrehajtását és eredméyet most s ANOVA táblázatba rögzítjük. Eek általáos redezés formáját a 89. táblázat tartalmazza. Az ANOVA táblázatba szereplő tapasztalat F értéket kell összevetük a megfelelő elmélet értékkel. A varaca-aalízs (mt tudjuk) jobboldal próba, tehát ha a 33

132 . Többváltozós regresszó- és korrelácószámítás tapasztalat F érték ksebb az elmélet értékél, akkor a ullhpotézst (az adott szgfkaca-szt mellett) elfogadjuk, am azt jelet, hogy a vzsgált modell em alkalmas a megfgyelt jeleség elemzésére. A ullhpotézs elutasítása azoba em jelet automatkusa a modell lleszkedéséek jóságát! Az ANOVA táblázat vázlata 89. táblázat A szóródás oka Eltérések égyzetösszege Szabadságfok Szóráségyzet becslése F Regresszó SSR m MSR Hba SSE m MSE Összese SST MSR MSE Paraméterek tesztelése Az előzőekbe az egész modell lleszkedését vzsgáltuk, most egyetle magyarázóváltozó fotosságát, magyarázó erejét fogjuk tesztel. Nullhpotézsük az lesz, hogy az adott j magyarázóváltozó cs szgfkás kapcsolatba az eredméyváltozóval. H : β j,,..., m j H : β j A tesztelésre a következő próbafüggvéyt haszáljuk: ˆ β j F, (35) var( βˆ ) j ahol var( βˆ j ) a e e var(ˆ) β e X m ( ) X X s ( X ) (36) varaca-kovaracamátr (lásd a következő fejezetet) főátlójába szereplő j-edk 33

133 .. Többváltozós regresszószámítás elem. Ez a statsztka ν, ν m szabadságfokú F-eloszlást követ. Ezt a tesztelést parcáls F-próbáak evezzük. Mvel a 9.4. fejezetbe említett t (IV. táblázat szert) és F értékek között összefüggés most így s felírható: t ( α α m ) F (, m ), ezért t-eloszlást s alkalmazhatuk. Ekkor a próbafüggvéy: βˆ j t. (37) s βˆ j A t-próbához tartozó (IV. táblázat szert) elmélet érték α szgfkaca-szte: t α ( m ). Ha az emprkus t-érték abszolút értéke ksebb az elmélet értékél, akkor a H -t elfogadjuk, am azt jelet, hogy a vzsgált magyarázóváltozó szgfkása em befolyásolja az eredméyváltozót, ezért em célszerű szerepeltetük a modellbe. Megjegyzés: a stadard leárs regresszós modellél a becslések varacáját eredetleg em a (36) szert kell kszámíta, haem: var(ˆ) β σ ( X ) X összefüggés szert, ahol σ a hbatagok számukra smeretle szóráségyzete. Az s, e az ú. rezduáls szóráségyzet, eek torzítatla becslése. 333

134 . Többváltozós regresszó- és korrelácószámítás.. Többváltozós korrelácószámítás Korrelácós együtthatók A 4. és a 6. fejezetbe már tárgyaltuk a leárs korrelácós együtthatót és a leárs determácós együtthatót kétváltozós esetre. A többváltozós modellbe a leárs korrelácós együtthatót a változók összes lehetséges párosításába k tudjuk számíta. Két-két változó között kapcsolat szorosságát és ráyát mérő leárs korrelácós együtthatókat a többváltozós modellbe párokét korrelácós együtthatókak evezzük. Ezek értéket az ú. korrelácós mátrba redezzük, amely a (38) szert defált. ry L r ym r y r m R (38) M r y r m m A leárs korrelácós együttható szmmetratulajdosága matt az R mátr szmmetrkus, és a főátlójába levő elemek értéke. Első sorába (lletve oszlopába) az egyes magyarázóváltozók és az eredméyváltozó között kapcsolatot jellemző együtthatók állak, amelyek a regresszós modell magyarázóváltozóak kválasztásáál adhatak segítséget. Gyakra haszáljuk a kapcsolat természetéek jellemzésére a kovaracát s. A változók között kovaracát a varaca-kovaracamátrba redezzük. σ y Cy L C ym C y σ C C m (39) M C m y Cm σ m A varaca-kovaracamátr szté szmmetrkus, főátlójába az egyes változók 334

135 .. Többváltozós korrelácószámítás varacája található. ) Megjegyzés: ha a változók eredet értéke helyett azok stadardzált értékevel dolgozuk, akkor a (38) és a (39) alatt mátr megegyezk. Ez az összefüggés az emprkus elemzésekél egyszerűsít a számításokat. Az említett R és C mátrokat az Ecel segítségével s k tudjuk számíta. Hívjuk meg az Eszközök meü Adatelemzés... almeüjét és válasszuk k a felkíált lehetőségek közül a Korrelácóaalízs, lletve a Kovaracaaalízs meüpotot. Az ekkor megjeleő párbeszédpaellel vgyük be a Bemeet tartomáyba az adatakat tartalmazó megfelelő cellahvatkozásokat. Ha bekapcsoljuk a Felratok az első sorba (oszlopba) jelölőégyzetet, akkor a (38)-(39) mátrok eleme mellett még a hozzájuk tartozó változók megevezéset s láthatjuk. (Ezzel a megoldással áttekthetőbbé válak az adatok.) A párokét korrelácós együtthatók számításáál a több változó keresztül gyakorolt közvetett hatást s kmutattuk. Ha a kapcsolat természetét a több magyarázóváltozót kszűrve akarjuk kmutat, akkor parcáls korrelácós együtthatóra va szükségük. Eek kszámításához fel kell haszáluk a korrelácós mátr verzét. r y j R y j.,,...,,,..., j j+ (4) m R R yy j j A parcáls korrelácós együttható deébe először a vzsgálat tárgyát képező változókat tütetjük fel, majd egy pot utá azokat, amelyekek a hatását kszűrtük. A parcáls korrelácós együttható égyzetét parcáls determácós együtthatóak evezzük. ) A korrelácós mátr és a varaca-kovaracamátr között, elmélet esetet feltételezve, felírható a következő összefüggés: ( I) C ( σ ) R σ I, ahol σ I a hbatag varaca-kovaracamátra, azaz E( εε ) σ I. 335

136 . Többváltozós regresszó- és korrelácószámítás A leárs determácós együtthatót a többváltozós modellbe s többféleképpe kszámíthatjuk, m a (4) képletet fogjuk alkalmaz.. (4) R r y,,..., m yy Ez az ú. többszörös determácós együttható, amelyek égyzetgyökét többszörös korrelácós együtthatóak evezzük. A többszörös determácós együttható azt mutatja meg, hogy az eredméyváltozó szóráségyzetéek háy százalékát tudjuk megmagyaráz (együttese) az összes függetle változóval. Leárs korrelácós együttható tesztelése Emprkus elemzésekél mtából szoktuk kszámíta a leárs korrelácós együttható (r) értékét, amely általába ullától külöböző és a populácó azoos mutatójáak ( ρ ) becslését adja. Az r értékéek smeretébe lehetséges aak tesztelése, hogy a leárs korrelácós együttható szgfkása külöbözk-e -tól. Eek eldötésére a (4) szert defált próbafüggvéyt haszáljuk, ha a hpotézseket az alább módo fogalmazzuk meg. H : ρ H : ρ. A próbafüggvéyük: r t. (4) r Ez a statsztka ν szabadságfokú t-eloszlást követ. Kétoldal próbakét hajtjuk végre (azaz közvetleül haszálhatjuk a III. táblázatot). 336

137 .3. Multkolleartás, autokorrelácó, heteroszkedasztctás.3. Multkolleartás, autokorrelácó, heteroszkedasztctás Multkolleartás A stadard leárs regresszós modell feltételez, hogy a magyarázóváltozók egymástól leársa függetleek. Ha valamelyk magyarázóváltozó kfejezhető a több téyezőváltozó leárs kombácójakét, vagys függvéyszerű kapcsolatba áll a több téyezőváltozóval, akkor teljes vagy etrém multkolleartásról beszélük. Ekkor X ragja em egyelő oszlopa számával és az X X mátr szgulárs, ezért em vertálható. A teljes multkolleartás felsmerése köyű, és egyszerűe megoldható az adott magyarázóváltozó elhagyásával. Az emprkus vzsgálatokál azoba a magyarázóváltozók között kább sztochasztkus kapcsolat jeletkezk. A multkolleartás következméye Ha a magyarázóváltozók egymástól leársa em függetleek, akkor az LNM közvetle alkalmazásával kapott becslések fotosabb tulajdosága az alábbak. A becslés és az előrejelzés torzítatla marad. A regresszós együtthatók stadard hbá őek. Bzoytalaá, stabllá válak (a továbbra s torzítatla) becslések. Az egyes magyarázóváltozók hatásaak szeparált vzsgálata em lehetséges, lletve a parcáls regresszós együtthatók helyes értelmezése lehetetleé válk. A fetek matt a magyarázóváltozók kölcsöös függőségéek mértékét mdg elleőrzük kell. A multkolleartás mérése Ha egy új magyarázóváltozót kapcsoluk be a modellbe, akkor a többszörös determácós együttható vagy övekszk, vagy egyáltalá em változk. Mde magyarázóváltozóra kszámítva, hogy a modellbe utolsó változókét bevova meyvel övel a determácós együtthatót, elleőrzhető a multkolleartás. Ha az említett hatásokak az összege egyelő a többszörös determácós együtthatóval, akkor azt modhatjuk, hogy a magyarázóváltozók leársa függetleek. Ellekező esetbe az eredméyváltozó szóráségyzetéek va olya része, amt együttese magyaráz több 337

138 . Többváltozós regresszó- és korrelácószámítás változó. A multkollertás agyságát ezzel az együttese magyarázott résszel a (43) módo mérhetjük. M m ( ry. r ),,..., m y,,..., j, j +,..., m y,,..., m. j r. (43) Mél agyobb az M mutató értéke, aál jeletősebb a multkolleartás, és eek következtébe a modell paramétereek becslése mdkább stabllá válk. Megjegyzés: a (43) szert M mutató egatív értéket s felvehet. Egy adott parcáls ( βˆ ) y j.,,..., j, j+,..., m ) és a ek megfelelő kétváltozós regresszós együttható ( βˆ y j ) összevetésével, az M mutató kszámítása élkül s, következtethetük a szgfkás multkolleartás létére. Ugyas, szgfkás multkolleartás eseté, az említett együtthatók között általába em csak agyságbel, haem még előjelbel külöbség s előfordulhat! Az említett kétfajta regresszós együttható részletesebb összefüggésevel az út-elemzés módszerek foglalkozak. Út-elemzés módszerek Ha egy modell magyarázóváltozó egymással s kapcsolatba vaak, akkor az eredméyváltozóra em csak drekt, haem (közvetle és közvetett) drekt módo s hatak. Ezekek a hatásokak a szemléltetésére haszáljuk az út-dagramot, amely ( elemű mtát feltételezve) a 47. ábrá látható. Négyváltozós modell eseté, például a másodk magyarázóváltozó teljes hatása az eredméyváltozóra az alább. Hatások: β ˆ y teljes β ˆ + drekt y., 3 + β ˆ βˆ + βˆ ˆ + közvetle drekt. 3 y., 3 3. β y3., + βˆ ˆ ˆ ˆ ˆ ˆ közvetett drekt 3 β 3. β y., + β 3 β 3. β y3., ) Az eddgektől eltérőe, a köyebb érthetőség végett, ebbe a fejezetbe az összetettebb jelölésmódot haszáljuk. A j-edk parcáls együtthatót eddg βˆ j, míg most βˆ jelöl. y j.,,..., j, j +,..., m 338

139 .3. Multkolleartás, autokorrelácó, heteroszkedasztctás Megjegyzés: többváltozós modellekél az áttételesebb drekt hatások általába elhayagolhatóak. Út-dagram m magyarázóváltozót tartalmazó modell eseté βˆ m., 3,..., m βˆ y., 3,..., m y e βˆ... βˆ., 3,..., m m m., 3,..., m βˆ y.,,..., m m m 47. ábra 8. példa A 9. táblázat a magyarország állatteyésztés alakulását mutatja. Számszerűsítsük a sertésállomáy (közvetle és közvetett) hatását a vágóállattermelésre! 339

140 . Többváltozós regresszó- és korrelácószámítás Állatteyésztés hazákba között 9. táblázat Év Vágóállattermelés (ezer toa) Szarvasmarhaállomáy (ezer db) Sertésállomáy (ezer db) Baromfállomáy (ezer db) Forrás: Magyar Statsztka Évköyv 98, KSH, Bp., 999. Legye a szarvasmarha-, sertés- és a baromfállomáy, a vágóállat-termelés 3 pedg y. A feladat szert meg kell határozuk βˆ y összetevőt az előbbekbe smertetett módo. Ehhez még 5 regresszós modell paraméteret kell külö-külö kszámíta. 34

141 .3. Multkolleartás, autokorrelácó, heteroszkedasztctás A kapott eredméyek vázlatos áttektése az alább. Hatások:,889 teljes, 39 + drekt +,36 (,757) + (,769) (,4) + közvetle drekt + 3,767,99 (,757) +,438 5,9597 (,4) közvetett drekt Ezek szert a teljes hatáso belül a drekt hatásak va a legagyobb súlya, míg a közvetle (-,6) és a közvetett (-,9) drekt hatásokak jóval ksebb. A multkolleartás következméyeek csökketése, kküszöbölése Ha céluk az előrejelzés és em az együtthatók parcáls vzsgálata, akkor a magyarázóváltozók leárs függetleségéek háya em okoz godot. Nem teljes multkolleartás eseté s megoldás lehet (éháy) magyarázóváltozó elhagyása a modellből, ha a közöttük feálló kapcsolatok redszere em boyolult. A modell újrafogalmazása, például TOBIN által alkalmazott módszer szert. ) Rdge-regresszó alkalmazása. 3) Főkompoes aalízs alkalmazása. (Lásd a.5. fejezetet.) Autokorrelácó Idősoros adatok vzsgálatáál a hbatagok egymást követő értéke gyakra korrelálak. Eek több oka lehet, általába specfkácós hbára vezethető vssza. Például, ha egy szgfkás változót (amely értéke a statsztka sorba egymástól em függetleek) fgyelme kívül hagyuk, akkor köye autokorrelált hbataghoz juthatuk. ) 3) A módszer léyege: a jövedelm elasztctások becslését keresztmetszet, míg az árrugalmasság együtthatókat dősoros adatok alapjá kapjuk. A módszer az smeretle paraméterek becslésére (4) helyett az alább összefüggést alkalmazza: β ˆ ( X X + ai) X y a, ahol az a ökéyese választott skalár (torzítás téyező). A módszer előye, hogy szgfkás multkolleartás eseté s közvetleül alkalmazható. Torzított becslést eredméyez. A (,) tervallumba megfelelőe választott a eseté azoba a becslés stabllá válk, és a (7) szert átlagos égyzetes hba csökkethető. 34

142 . Többváltozós regresszó- és korrelácószámítás Az autokorrelácó külöböző redű lehet, attól függőe, hogy a hbatag -edk értéke melyk értékkel va kapcsolatba. Ha a hbatag -edk értéke az ( ) -edk értékkel (tehát a közvetleül előtte levő értékkel) áll korrelácós kapcsolatba, akkor elsőredű autokorrelácóról 4) beszélük. (Köyvükbe csak ezzel az esettel foglalkozuk.) Az elsőredű autokorrelácóak megfelelő modell a következő: ε ρ ε + η, ahol ρ az autokorrelácós együttható. Az η valószíűség változóra gazak az alábbak. E( η ) E ( ηη ) var( η) I var( ε var( η) ) ρ Megjegyzés: az smertetett modell éves dősorok alapjá törtéő elemzésekél általába jól alkalmazható. Az autokorrelácó következméye Ha a hbatagok között szgfkás leárs kapcsolat va, akkor az LNM közvetle alkalmazásával kapott becslések fotosabb tulajdosága az alábbak. A becslés és az előrejelzés torzítatla marad. A regresszós együtthatók becslése em effces. A rezduáls szóráségyzet a hbatag szóráségyzetéek torzított becslését adja, ezért az F-próbák em alkalmazhatóak. 4) A szakrodalomba ezekre gyakra AR() jelöléssel hvatkozuk, ahol az AR az autoregresszóra utal. AR() a másodredű autokorrelácót jelöl, stb. 34

143 .3. Multkolleartás, autokorrelácó, heteroszkedasztctás Az elsőredű autokorrelácó tesztelése Az elsőredű autokorrelácó tesztelésére a DURBIN-WATSON-féle próbát fogjuk alkalmaz. Eek próbafüggvéye a (44) képlet szert defált. d ( e e ) e, (44) ahol az e az LNM alkalmazásával kapott rezduumok, amelyeket a hbatagok becsléséek tekthetük. A ρ autokorrelácós együttható értékét, (98) fgyelembevételével, az alábbak szert becsüljük. ˆρ e e e e Mvel e alakra hozható. e e, a megfelelő műveletek elvégzése utá, (44) az alább d ( ρˆ) (45) Az elsőredű autokorrelácó tesztelésekor, a (45) szert összefüggést fgyelembe véve, a 9. táblázatba feltütetett relácók alapjá dötük. Nullhpotézsük tehát az elsőredű autokorrelácó háya ( H : ρ ). Ameybe a próbafüggvéyük értéke -él agyobb, akkor alteratív hpotézsük a egatív autokorrelácó ( ( H : ρ > ). H : ρ < ), ameybe -él ksebb, akkor a poztív autokorrelácó 343

144 . Többváltozós regresszó- és korrelácószámítás A krtkus értékek meghatározásához szükséges alsó ( d ) és felső (d ) értékeket a VIII. és IX. táblázat tartalmazza (a megfgyelések száma és a magyarázóváltozók számáak függvéyébe). Megjegyzés: a megfelelő táblázat értékek forrása Sav, N. E. Whte, K. J.: The Durb-Watso Test for Seral Correlato wth Etreme Sample Szes of May Regressors, Ecoometrca, 45, Nov L U DURBIN-WATSON-féle teszt dötés táblája 9. táblázat Alteratív hpotézs H : ρ Elfogadjuk Elvetjük Ncs dötés ρ > d > du d < d L d L d du ρ < d < 4 du d > 4 d L 4 du d 4 d L Abba az esetbe, ha az autokorreláltságra voatkozóa a teszt alapjá em tuduk dötést hoz, akkor a modell paramétereek becslését újból el kell végez, de most már több megfgyelést tartalmazó mta alapjá! Megjegyzés: emprkus elemzések alkalmával haszos grafkusa ábrázol az egymást követő rezduumok értéket egy olya grafkoo, amelyél az abszcssza-tegelye az e, míg az ordáta-tegelye az e értékeket tütetjük fel, ahogy az például a 48. ábrá látható. A kapott potdagram alapjá általába már következtet tuduk az esetleges autokorrelácó jellegére. 344

145 .3. Multkolleartás, autokorrelácó, heteroszkedasztctás A rezduumok grafkus ábrázolása e e ábra Az autokorrelácó kezelése A regresszós modell fukcoáls operátoráak megváltoztatása. Az általáosított legksebb égyzetek módszeréek alkalmazása. (Lásd a.4. fejezetet.) Általáosabb damkus modell megadása. (Köyvükbe ezekkel em foglalkozuk.) Heteroszkedasztctás Míg az dősoros adatokál az autokorrelácó okoz legtöbbször godot, a keresztmetszet adatok esetébe gyakra a hbatagok varacá (a stadard leárs regresszós modell feltételredszerétől eltérőe) em álladóak. Eek általába az az oka, hogy a hbatag agysága függ valamelyk változótól. 345

146 . Többváltozós regresszó- és korrelácószámítás A heteroszkedasztctás következméye Ha a hbatagok varacá em álladóak, akkor az LNM közvetle alkalmazásával kapott becslések fotosabb tulajdosága az alábbak. A becslés és az előrejelzés torzítatla marad. A regresszós együtthatók becslése em effces. Az F-próbák em alkalmazhatóak. A heteroszkedasztctás tesztelése Emprkus elemzésekél azt kell megvzsgáluk, hogy mlye szoros a kapcsolat az egyes változók és a hbatagok (a gyakorlatba a rezduumok) abszolút értéke között. Ha a mta elemű, akkor a feltételezésükek megfelelő modell az alább. E ( e ) var( e ) j A heteroszkedasztctás teszteléséhez a (4) próbafüggvéyt haszáljuk. Külö-külö kszámítjuk az egyes magyarázóváltozókak, lletve a becsült eredméyváltozóak a rezduumok abszolút értékevel való szorosságát jellemző leárs korrelácós együtthatót, és ezek közül a legagyobb abszolút értékű együtthatót teszteljük. Ameybe a ullhpotézst ( r ) elvetjük, a modell heteroszkedasztkusak tekthető. Az autokorrelácóhoz hasolóa, az esetleges heteroszkedasztctás vzsgálatakor s célszerű a grafkus ábrázolás. A vzsgált változó redelkezésükre álló adatat felvsszük az abszcssza-tegelyre, a rezduumok érétket pedg az ordáta-tegelyre. Heteroszkedasztctás eseté a potdagramo összetartó vagy széttartó potfelhőt kapuk, ahogy az például a 49. ábrá látható. A heteroszkedasztctás kezelése Az általáosított legksebb égyzetek módszere ebbe az esetbe s alkalmazható. (Lásd a.4. fejezetet.) 346

147 .3. Multkolleartás, autokorrelácó, heteroszkedasztctás A heteroszkedasztkus rezduumok grafkus ábrázolása a j-edk magyarázóváltozó függvéyébe e j 49. ábra A továbbakba bemutatjuk az eddg smertetett regresszó- és korrelácószámítással kapcsolatos elmélet összefüggéseket egy, az eddgektől émleg összetettebb, valós példá keresztül. 8. példa A szeyvízcsatora- és az vóvízvezeték-hálózat terület egységekét adatat 998. évre voatkozóa a 9. táblázat tartalmazza. Az adatok jelölésére vezessük be a következő szmbólumokat: : szeyvízcsatora-hálózat hossza (m/lakos), y : vóvízvezeték-hálózat hossza (m/lakos), : száz lakásra jutó lakosok száma. Leárs modellt feltételezve, elleőrzzük a stadard regresszós modell feltételeek teljesülését! Értelmezzük a kapott eredméyeket! Vzsgáljuk a modellük lleszkedéséek jóságát, valamt értelmezzük és teszteljük a parcáls regresszós 347

148 . Többváltozós regresszó- és korrelácószámítás együtthatókat! A szeyvízcsatora- és az vóvízvezeték-hálózat terület egységekét, 998 Megye Szeyvízcsatorahálózat hossza (m/lakos) Ivóvízvezetékhálózat hossza (m/lakos) 9. táblázat Száz lakásra jutó lakosok száma (fő) y Bács-Ksku,73 5, Baraya,33 7,38 58 Békés,5 7,87 37 Borsod-Abaúj-Zemplé,735 6,58 6 Csográd,355 5,45 3 Fejér,36 6, Győr-Moso-Sopro 3,5 6,63 65 Hajdú,89 5,7 58 Heves,98 6, Jász-Nagyku-Szolok,5 7,8 46 Komárom-Esztergom,765 5,897 6 Nógrád,48 9, Pest,59 7,38 73 Somogy,7 9,943 5 Szabolcs-Szatmár-Bereg,76 6, Tola,649 6,967 5 Vas,67 6,858 6 Veszprém,675 9,88 6 Zala,68 7, Forrás: Magyar Statsztka Zsebköyv 98, KSH, Bp., 999. Első lépéskét az 5. ábrá megadjuk a bemeet (okok) és a kmeet adatok (okozat) grafkus modelljét. Az ezeket összekötő fukcoáls operátor detfkálása végett alkalmazzuk az LNM-t a (7) alatt defált modellükre. A feladatak megfelelő becslőfüggvéy alapjá y βˆ + βˆ + βˆ + e,,...,

149 .3. Multkolleartás, autokorrelácó, heteroszkedasztctás A regresszós modell grafkus ábrája f (, ) y 5. ábra Melőtt elvégezék a modell paramétereek becslését, vzsgáljuk meg, hogy teljesül-e a stadard leárs regresszós modell feltételredszere. Mdeekelőtt elleőrzzük a magyarázóváltozók (egymástól való) leárs függetleségét. Számítsuk k a (38) alatt defált korrelácós mátrot, amelyél a párokét korrelácós együtthatókhoz a (98) szert juthatuk. Az Ecel segítségével azoba, a korábbakba már smertetett módo, közvetleül megkaphatjuk a mátrot., R,,538,,,34,538,34, Mvel a mátr főátló kívül eleme agyrészt -hoz közel értékek, em következtetük szgfkás multkolleartásra. Ezt a sejtésüket kétféleképpe elleőrzzük. A (43) képlet szert M mutató kszámításához, mvel most háromdmezós 349

150 . Többváltozós regresszó- és korrelácószámítás modellről va szó, a többszörös determácós együttható mellett a megfelelő párokét leárs korrelácós együtthatókra va szükség. Ezeket a korrelácós mátr tartalmazza. r y, r y,538 A többszörös determácós együtthatót a (4) képlet szert az segítségével tudjuk kszámíta. R mátr R,44,85,78,85,5,35,78,35,45 A többszörös determácós együttható értéke: r y.,36,.,44 Ez azt jelet, hogy az eredméyváltozó szóráségyzetéek 3,6 százalékát tudjuk megmagyaráz az, magyarázóváltozókkal. A megfelelő adatok behelyettesítésével: M,36 ((,36, ) + (,36,538 )),45. Az M mérőszám -hoz közel értéke s alátámasztja a magyarázóváltozók leárs függetleségét. A két magyarázóváltozó kapcsolatáak szorosságát tesztelhetjük a (4) próbafüggvéy segítségével s.,34 7 t,4., 35

151 .3. Multkolleartás, autokorrelácó, heteroszkedasztctás Kétoldal próbához (α,5 és ν 7 eseté) az elmélet t érték a III. táblázat szert,98. Az emprkus t,4 abszolút értéke ksebb az elmélet értékél, ezért a ullhpotézst 5%-os szgfkaca-szte elfogadjuk, am a magyarázóváltozók leárs függetleségére utal. Ugyaerre a következtetésre juthatuk a két magyarázóváltozó grafkus ábrázolásával s. Az 5. ábrá látható, hogy a potok elredeződése véletleszerű. A magyarázóváltozók potdagramja ábra Megjegyzés: elméletleg mde olya esetbe, amkor két magyarázóváltozó (például és ) leársa függetle egymástól, akkor az ( ) és az ( ) kétváltozós leárs regresszós egyeesek (ugyaazo a dagramo ábrázolva) derékszögbe metszk egymást. A multkolleartás utá teszteljük az autokorrelácóra voatkozó ullhpotézsüket. Ehhez szükségük va a rezduumokra. 35

152 . Többváltozós regresszó- és korrelácószámítás Ha a mátralgebra jelölésmódot alkalmazzuk, akkor felírhatjuk a következő összefüggést: y Xβ ˆ + e, lletve, fgyelembe véve a 9. táblázatba közölt adatokat és a (8) szert jelölésmódot, a következő mátregyeletet kapjuk:,73,33 M M,68 5,865 7,38 7, βˆ 58 β ˆ ˆ 54 β e e +. M e9 Az smeretle β oszlopvektoráak (4) szert becsléséhez szükségük va a következő számításokra: X X 5, ,38 58 L 7,358 M 54 5,865 7,38 7, , 33, , 33, , , , 346,376 ; 34674, 5,495,57,93 X,57,34, ;,93,,4 ( X),73 L 38,6,33 X y 5,865 7,38 7,358 73,985 ; M ,839,68 35

153 .3. Multkolleartás, autokorrelácó, heteroszkedasztctás 5,495,57,93 38,6 5,359 ˆβ,57,34, 73,985,6.,93,,4 998,839,7 A fet mátrműveletek köye elvégezhetőek az Ecel segítségével a következő függvéyek alkalmazásával: TRANSZPONÁLÁS(tömb), MSZORZAT(tömb;tömb), INVERZ.MÁTRIX(tömb). Ezek eredméye tömb lesz, ezért k kell jelölük egy megfelelő agyságú cellatartomáyt (ahova az eredméytömböt várjuk), majd a függvéy bellesztése utá a szerkesztőlécre állva a SHIFT, a CTRL és az ENTER blletyűk együttes leyomása utá a kjelölt cellatartomáyba megkapjuk a keresett mátrot. A becsült paraméterek oszlopvektora segítségével, (4) szert, a szeyvízcsatorahálózat hosszáak becsült értékere felírhatjuk a következő mátregyeletet:,45,4 M M,34 5,865 7,38 7, ,349 58,6.,7 54 Az autokorrelácó teszteléséhez szükséges adatokat a 93. táblázat tartalmazza. A (44) képlet szert próbafüggvéy:,68 d,398. 4,87 A (45) képlet alapjá az autokorrelácós együttható becslése: ρ ˆ d,99. A kapott eredméyek alapjá az alteratív hpotézsük a egatív autokorrelácó. A VIII. táblázat szert 5%-os szgfkaca-szt mellett d U,536 és 353

154 . Többváltozós regresszó- és korrelácószámítás d,398 < 4 d,464 ; ezért a DURBIN-WATSON-féle próba ullhpotézsét U elfogadjuk, tehát a hbatagok em autokorreláltak. A regresszófüggvéy becsült értéke és a rezduumok 93. táblázat Megye y yˆ e e e ( e ) e e Bács-K.,73,45 -,379,44,379 Baraya,33,4,63,7 -,379,94,63 Békés,5,6 -,99,,63,69,99 BAZ,735,74 -,439,93 -,99,6,439 Csográd,355,63,9,8 -,439,8,9 Fejér,36,397 -,6,68,9,4,6 GYMS 3,5,6,5,56 -,6,8,5 Hajdú,89, -,7,58,5 3,85,7 Heves,98,735,46,6 -,7,98,46 JNSZ,5,8,44,63,46,5,44 KE,765,37,68,394,44,5,68 Nógrád,48,95 -,7,49,68,768,7 Pest,59,534 -,5, -,7,486,5 Somogy,7,8,9, -,5,3,9 SZSZB,76,567 -,85,648,9,836,85 Tola,649,956 -,37,94 -,85,48,37 Vas,67,95 -,8,6 -,37,3,8 Veszp.,675,34,36,3 -,8,39,36 Zala,68,34,584,34,36,5,584 Összese 38,6 38,6, 4,87 -,584,68 Megjegyzés: ugyaerre a következtetésre juthatuk a rezduumok és a késleltetett rezduumok grafkus ábrázolásával s. Az 5. ábrá látható, hogy a potok elredeződése véletleszerű. 354

155 .3. Multkolleartás, autokorrelácó, heteroszkedasztctás A rezduumok grafkus ábrázolása e,5,,5, -, -,5,,5,,5 -,5 e - -, 5. ábra A heteroszkedasztctás vzsgálatához a rezduumok abszolút értéke és az egyes változók értéke között leárs korrelácós együtthatót számítjuk k. r e yˆ,49 r e, r e,3 Ezek közül a legagyobb abszolút értékű az r e, 3. Aak tesztelését kell elvégezük, hogy ez szgfkása külöbözk-e -tól. A (4) próbafüggvéyt haszáljuk:,3 7 t,36.,9 Kétoldal próbához (α,5 és ν 7 eseté) az elmélet t érték a III. táblázat szert,98. Az emprkus t, 36 érték az elfogadás tartomáyba esk, ezért a 355

156 . Többváltozós regresszó- és korrelácószámítás ullhpotézst 5%-os szgfkaca-szte elfogadjuk, am a hbatagok homoszkedasztctására utal. Megjegyzés: ugyaerre a következtetésre juthatuk az egyes változók és a rezduumok grafkus ábrázolásával s. Az 54. ábrá látható, hogy a potok elredeződése véletleszerű. Az eddg elemzések eredméyeek fgyelembevételével megállapíthatjuk, hogy a stadard leárs regresszós modell alkalmazható. A leárs háromváltozós regresszófüggvéy tehát: ˆ y 5,349 +,6 +, 7. A parcáls regresszós együtthatókat a következőképpe értelmezhetjük: β ˆ,6 azt jelet, hogy az vóvízvezeték-hálózat egy lakosra jutó hosszáak méterrel törtéő övekedése a szeyvízcsatora-hálózat egy lakosra jutó hosszáak átlagosa,6 méteres övekedésével jár együtt, ha a száz lakásra jutó lakosok száma em változk. β ˆ,7 azt jelet, hogy a száz lakásra jutó lakosok számáak fővel törtéő övekedése a szeyvízcsatora-hálózat egy lakosra jutó hosszáak átlagosa,7 méteres övekedésével jár együtt, ha az vóvízvezeték-hálózat egy lakosra jutó hossza em változk. Emprkus elemzésekél, a tredfüggvéy megadásához hasolóa, em elegedő pusztá a fukcoáls operátor közlése, haem e mellett még a következő adatokat s ajálatos feltütet: a többszörös determácós együttható értéke, a globáls F-próba értéke, a regresszós paraméterek stadard hbájáak értéke, a parcáls F-próba értéke, az autokorrelácó teszteléséél alkalmazott d statsztka értéke, a heteroszkedasztctás teszteléséhez szükséges (legagyobb) leárs korrelácós együttható értéke és a korrelácós mátr. 356

157 .3. Multkolleartás, autokorrelácó, heteroszkedasztctás A többszörös determácós együttható y.,,36 értéke arra utal, hogy modellük em jól lleszkedk az emprkus adatokra. Az objektív következtetéshez alkalmazzuk a globáls F-próbát. H : β β H : β valamelyk j-re j, j r A fet ullhpotézs helyességéek elleőrzésére a (34) szert defált próbafüggvéyt haszáljuk. Eredméyeket ANOVA táblázatba foglaljuk. Az ANOVA táblázat 94. táblázat A szóródás oka Eltérések égyzetösszege Szabadságfok Szóráségyzet becslése F Regresszó,47,74 Hba 4,87 6,34 3,57 Összese 7,8 8 5%-os szgfkaca-szt mellett az elmélet F érték: F, 95 (,6) 3,634. Mvel a próbafüggvéy értéke ksebb eél, a ullhpotézst em vethetjük el. A regresszós paraméterek teszteléséhez szükségük va a paraméterek stadard hbára. Eek kszámítása a (36) képlet szert törtéhet. (A rezduumok értéket, lletve égyzetösszegüket a 93. táblázat tartalmazza.) 5,495 4,87 var(ˆ) β,57 6,93,57,34,,93 7, 767,, 763,4, 83, 763, 955, 4, 83, 4, Ie a főátlóba levő elemek égyzetgyöke adják a keresett stadard hbákat. 357

158 . Többváltozós regresszó- és korrelácószámítás s ˆ β s ˆ β s ˆ β,786,98, A parcáls F-teszt próbafüggvéyéek (37) szert értéke: t,9; βˆ t,67 ; ˆ β t,63. ˆ β Kétoldal próbához (α,5 és ν 6 eseté) az elmélet t érték a III. táblázat szert,99. Mvel t,67 <, 99, ez azt jelet, hogy szgfkása em ˆ β befolyásolja az eredméyváltozót. A t,63, 99; így az magyarázóváltozót (a száz lakásra jutó lakosok > β ˆ számát) célszerű a modellbe szerepeltet. Az egy lakosra jutó szeyvízcsatora-hálózat hosszát számszerűsítő statsztka modellt az alább formába közölhetjük. yˆ 5,349 +,6 +, 7 r y.,, 36 (,786) (,98) (,) F 3,57 t,9 t, 67 t, 63 r,34 M, 45 d,398 4 d, 464 U r e,3 t, 36 Megjegyzés: regresszószámítás eseté, a modell becsült paramétere mellett, célszerű közöl (a fetekhez hasolóa) az elemzés több eredméyét s. 358

159 .3. Multkolleartás, autokorrelácó, heteroszkedasztctás A kapott eredméyek agy részét az Ecel segítségével s kszámíthatjuk a 6.. fejezetbe smertetett módo. Az eredméyeket az 53. és az 54. ábrá láthatjuk. Az Ecel outputja ÖSSZESÍTŐ TÁBLA Regresszós statsztka r értéke,553 r-égyzet,36 Korrgált r-égyzet,9 Stadard hba,55 Megfgyelések 9 VARIANCIAANALÍZIS df SS MS F F szgfkacája Regresszó,47,74 3,57,54 Maradék 6 4,87,34 Összese 8 7,8 Koeffce Stadard t érték p-érték Alsó Felső Alsó Felső sek hba 95% 95% 95,% 95,% Tegely -5,349,786 -,9,73 -,55,556 -,55,556 metszet,6,98,67,546 -,47,67 -,47,67,7,,63,9,5,5,5,5 MARADÉK TÁBLA Megfgyelés Becsült y Maradékok,45 -,379,4,63 3,6 -,99 4,74 -,439 5,63,9 6,397 -,6 7,6,5 8, -,7 9,735,46,8,44,37,68,95 -,7 3,534 -,5 4,8,9 5,567 -,85 6,956 -,37 7,95 -,8 8,34,36 9,34, ábra 359

160 . Többváltozós regresszó- és korrelácószámítás Az Ecel outputja (folytatás) Maradék potsor,5, Maradékok,5, -, , Maradék potsor,5, Maradékok,5, ,5 -, 54. ábra 36

161 .3. Multkolleartás, autokorrelácó, heteroszkedasztctás Fotossága matt még egyszer kemeljük, hogy az emprkus elemzésekél a (4) képletet em szabad automatkusa alkalmaz, lletve a kapott eredméyeket a stadard leárs regresszós modell feltételredszerére voatkozó elleőrzések élkül felhaszál! A lehetséges hbák elkerülése végett a következő algortmust célszerű követ: először a korrelácós mátr segítségével elleőrzzük a magyarázóváltozók leárs függetleségét. Így (esetleges) szgfkás multkolleartás eseté döthetük a modellbe vett magyarázóváltozók szerepeltetéséről; az eredméyváltozó emprkus és becsült értéke segítségével teszteljük a rezduumok leárs függetleségét. Így (esetleges) szgfkás (elsőredű) autokorrelácó eseté döthetük az adott modell alkalmazhatóságáról; elleőrzzük a rezduumok szóráségyzetéek álladóságára voatkozó feltevést. Így (esetleges) szgfkás heteroszkedasztctás eseté szté döthetük az adott modell alkalmazhatóságáról. Mvel az vóvízvezeték-hálózat egy lakosra jutó hosszáak ( változó) magyarázó ereje em bzoyult szgfkásak, ezért a modellükből elhagyjuk, és csak a száz lakásra jutó lakosok számát ( változó) hagyjuk az új modellbe, amely becslése (általáosa) a következő alakba s felírható: ˆ y γ + γ,,..., 9. ˆ ˆ A 9. táblázat és adata alapjá a fet kétváltozós leárs modell becsült paraméteret a 6.. fejezetbe smertetett módo tudjuk kszámíta, vagy a (4) képlet alkalmazásával, vagy az Ecel segítségével. száma ( y A szeyvízcsatora-hálózat egy lakosra jutó hossza ( paramétere: ) és a száz lakásra jutó lakosok ) között összefüggést számszerűsítő leárs regresszós modell becsült γ ˆ 4,868 ; γ ˆ,7. y 36

162 . Többváltozós regresszó- és korrelácószámítás Az emprkus elemzés eredméyet most s a már említett (ajálott) formába közöljük. yˆ 4,868 +,7 r, 89 (,65) (,) F 6,96 t,854 t, 63 d,396 4 d, 599 r e,357 t, 576 U 5%-os szgfkaca-szt mellett az elmélet F érték: F, 95 (,7) 4,45. Mvel a próbafüggvéy értéke F 6,96 agyobb az elméletél, a ullhpotézst ( H : γ ) elvetjük, am azt jelet, hogy szgfkás (gaz, agyo gyege) összefüggés va a magyarázó- és az eredméyváltozó között. (Lásd az 55. ábrát.) A leárs regresszófüggvéy llesztése Szeyvízcsatora-hálózat hossza 4, 3,5 3,,5,,5,,5, Száz lakásra jutó lakosok száma Emprkus adatok Becsült adatok 55. ábra 36

163 .3. Multkolleartás, autokorrelácó, heteroszkedasztctás Megjegyzés: mvel az eredet modellbe a két magyarázóváltozót egymástól gyakorlatlag (leársa) függetleek tekthetjük ( értéke agyo ks mértékbe külöbözk a egyformák). β r,34 ), a γ becsült becsült értékétől (három tzedesg A kétváltozós modell rezduuma s léyegébe homoszkedasztkusak és em áll fe közöttük statsztkalag jeletős elsőredű autokorrelácó. 363

164 . Többváltozós regresszó- és korrelácószámítás.4. Az általáosított legksebb égyzetek módszere Ahogy azt a.. fejezetbe láttuk, a stadard leárs regresszós modell feltételredszere szert a hbatagok ulla várható értékű, kostas varacájú, korrelálatla valószíűség változók. Ekkor, mt tudjuk, a hbatag varacakovaracamátra az alább. σ K σ E ( εε ) σ M σ I Ha a hbatag fet említett tulajdosága em teljesülek, akkor az E( ε ε ) mátr főátlójába levő elemek em egyelőek, és a főátló kívül elemek em mdegyke lesz. Ekkor a fet mátr felírható a (46) szert. E ( εε ) σ Ω. (46) Eek vszot az a következméye, hogy az LNM segítségével kapott képletek már em alkalmazhatóak. Ha az Ω mátr poztív deft, akkor a (4) helyett β paramétervektor becslőfüggvéye ( X Ω X) X Ω y βˆ, (47) a β ˆ paraméterek varaca-kovaracamátra var(ˆ) X β σ ( X Ω ), (48) a σ becslése pedg s e e Ω e. (49) m A (47)-(49) képletek az LNM általáosítása, amelyre az általáosított legksebb égyzetek módszerekét hvatkozuk. 364

165 .4. Az általáosított legksebb égyzetek módszere Mvel a stadard leárs regresszós modellek megfelelő esetbe: Ω I, a klasszkus legksebb égyzetek módszere (LNM) az általáosított legksebb égyzetek módszere egy specáls esetéek tekthető. 5) AITKEN-tétel: az általáosított legksebb égyzetek módszere BLUE tulajdoágú becslést ad. Megjegyzés: a GAUSS-MARKOV-tétel az AITKEN-tétel egy specáls esete. Ahhoz, hogy a (47)-(49) képleteket alkalmaz tudjuk smerük kellee az mátrot. Mvel ez az emprkus vzsgálatokál smeretle, becsülük kell. Egy elemű mta alapjá azoba eze mátr ezért az Ω Ω(Θ) ( + ) legalább aszmptotkusa torzítatlaul tudjuk becsül, akkor β ˆ kozsztes lesz. Ω elemére em következtethetük, szerkezetére voatkozó feltételezésből duluk k, és általába arra törekszük, hogy mél kevesebb paramétert tartalmazzo. Ha Θ paramétervektort Becslés szgfkás autokorrelácó mellett A.3. fejezetbe smertetett elsőredű (leárs) autokorrelácós modell (ahol ρ <) eseté az Ω mátr a (5) szert. ρ ρ K ρ ρ ρ ρ 3 Ω ρ ρ ρ (5) M 3 ρ ρ ρ Ie 5) A klasszkus legksebb égyzetek módszerére gyakra az OLS (Ordary Least Squares), míg az általáosított legksebb égyzetek módszerére a GLS (Geeralzed Least Squares) betűszóval hvatkozuk. 365

166 . Többváltozós regresszó- és korrelácószámítás ρ L ρ + ρ ρ + ρ ρ Ω. (5) ρ M + ρ ρ ρ Ekkor csak egy paramétert, a ρ -t kell becsülük, például (5) szert. ee ˆρ (5) e Az általáosított legksebb égyzetek módszere helyett alkalmazhatjuk a COCHRANE- ORCUTT teratív módszert s. Ez az alább lépésekből áll. ) Az LNM alkalmazása és az autokorrelácó tesztelése. ) Az alteratív hpotézs elfogadása eseté a 3) lépés következk, külöbe megkaptuk a modell becslését. 3) Elvégezzük az alább traszformácókat. 6) y j y ρˆ y j ˆ, j ρ,3,..., j,,..., m 4) Végrehajtjuk az ) lépést. Az eljárás egyszerű, ezért gyakra alkalmazzuk. 6) A 3) lépés az eredet modell T traszformácós mátrszal való beszorzásáak következméye. y Xβ + ε / T Ty TXβ + Tε Olya T-re va szükségük, amelyre: E Tεε T ) σ I. Ha Ω (5) szert, akkor (46) fgyelembevételével, ρ T M ( η ρ L ( ) elemű mátrra T T Ω ρ. 366

167 .4. Az általáosított legksebb égyzetek módszere 83. példa A 9. táblázat harmadk és egyedk oszlopa a magyarország szarvasmarha- és sertésállomáy alakulását mutatja. Ha a magyarázóváltozó a sertésállomáy, leárs modellt feltételezve, számítsuk k a regresszós egyees egyeletét! Vzsgáljuk meg mdeekelőtt a stadard modell feltételeek teljesülését. Teszteljük a heteroszkedasztctást és az autokorrelácót. Ehhez alkalmazzuk az LNM-et. 83,599 ˆβ,44 ˆ) var(β 9738,455 3,895 3,895,53 A kapott becslés alapjá, a heteroszkedasztctás teszteléséhez, szükségük va az r e,97 értékre. A (4) próbafüggvéy értéke (t,96 ) alapjá a modell homoszkedasztkusak tekthető. A (44) próbafüggvéy értéke ( d,5953 ) alapjá azoba a modell szgfkás elsőredű poztív autokorrelácójára következtetük (α, eseté, 55 ). A rezduumok grafkus ábrázolása (lásd az 56. ábrát) s a hbatagok között leárs függőségre utal. A szgfkás autokorrelácó matt, a regresszós együtthatókat em becsülhetjük az LNM segítségével, haem az általáosított legksebb égyzetek módszerét kell alkalmazuk! Az 56. ábra alapjá a hbatagokra voatkozó leárs (elsőredű) autokorrelácós modell feltételezhető, ezért az Ω mátr (5) szert szerkezete alkalmazható. d L 367

168 . Többváltozós regresszó- és korrelácószámítás A rezduumok grafkus ábrázolása e e ábra Az autokorrelácós együttható becslése (5) szert: ,6 ρ ˆ, ,3399 Így (5) mátr a következő: Ω,6668,6668 M,6668,4446,6668,6668,4446 L,4446,6668.,6668 A (47)-(49) szert, a megfelelő mátrműveletek elvégzése utá: 368

169 .4. Az általáosított legksebb égyzetek módszere 357,995 ˆβ,,65 ˆ) var(β 57,94, , ,559 6,36 6,36,9. -,537878,35 Az smertetett eljárás helyett alkalmazhatjuk a COCHRANE-ORCUTT teratív módszert s. Eek eredméyet a 95. táblázat tartalmazza. A COCHRANE-ORCUTT teratív módszer szert eredméyek Az LNM alkalmazásáak eredméye 95. táblázat sorszáma s d d (%) L ρˆ. 5,44,3,5953,55, ,58,79,46,37,37 %-os szgfkaca-sztet feltételezve, már az LNM másodk alkalmazása utá elfogadhatjuk az autokorrelácóra voatkozó ullhpotézst. Becslés szgfkás heteroszkedasztctás mellett A.3. fejezetbe smertetett heteroszkedasztkus modell eseté az Ω mátr dagoáls, és főátlójába levő smeretle elemek em md egyelőek. Becslésük elemű mta alapjá törték, mt láttuk, a következő összefüggés feltételezése szert: Ekkor a E ( e ) var( e ) j. 369

170 . Többváltozós regresszó- és korrelácószámítás L j P j (53) M j mátrra gaz az Ω P P P (54) összefüggés. 7) A (53)-(54) segítségével már alkalmazhatjuk a (47)-(49) becslőfüggvéyeket. 84. példa A 96. táblázat az egy főre jutó bruttó haza termék és a közműellátásra voatkozó adatokat tartalmazza terület egységekét. Ha a magyarázóváltozó az egy főre jutó GDP, leárs modellt feltételezve, számítsuk k a regresszós egyees egyeletét! Vzsgáljuk meg mdeekelőtt a stadard modell feltételeek teljesülését. Teszteljük az autokorrelácót és a heteroszkedasztctást. Ehhez alkalmazzuk az LNM-et. 9,844 ˆβ,5756 ˆ) var(β 334,47 4,387 4,387,57 7) Az eredet modell (53) szert P traszformácós mátrszal való beszorzásából adódk (54). y Xβ + ε Py PXβ + Pε E( Pεε P ) σ I PΩP I / P 37

171 .4. Az általáosított legksebb égyzetek módszere A bruttó haza termék és a szeyvízcsatora-hálózat adata terület egységekét 997-be Terület egység Egy km vízvezetékhálózatra jutó szeyvízcsatorahálózat (m) 96. táblázat Egy főre jutó bruttó haza termék (ezer Ft) Budapest 99,6 575 Pest 9, 653 Fejér 85,6 985 Komárom-Esztergom 49,4 74 Veszprém 56, 675 Győr-Moso-Sopro 9, 9 Vas 3, 96 Zala 334,3 767 Baraya 87,9 67 Somogy 3, 59 Tola 33,6 78 Borsod-Abaúj-Zemplé 4,7 584 Heves 57,6 67 Nógrád 5,4 443 Hajdú-Bhar 39, 64 Jász-Nagyku-Szolok 3,8 63 Szabolcs-Szatmár-Bereg 4,8 487 Bács-Ksku 83,9 65 Békés 73,6 63 Csográd 3,4 755 Forrás: Magyar Statsztka Évköyv 97, 98, KSH, Bp., A kapott becslés alapjá, az autokorrelácó teszteléséhez, szükségük va a (44) próbafüggvéy értékére. d,799 Mvel 5%-os szgfkaca-szt mellett a megfelelő függetleségére voatkozó ullhpotézst elfogadjuk. d U,4; a hbatagok 37

172 . Többváltozós regresszó- és korrelácószámítás A heteroszkedasztctás teszteléséhez szükségük va az r e,685 leárs korrelácós együtthatóra. Ekkor a (4) próbafüggvéy értéke t 3,995. Mvel a III. táblázat szert t (8),95,9 ; a modell heteroszkedasztkusak tekthető. Erre következtethetük az 57. ábra alapjá s. A heteroszkedasztctás matt, a regresszós együtthatókat em becsülhetjük az LNM segítségével, haem az általáosított legksebb égyzetek módszerét kell alkalmazuk! A rezduumok grafkus ábrázolása e ábra Az 57. ábra alapjá a rezduumok szóráségyzetére voatkozó E ( e ) var( e ) j modell feltételezhető, ezért (54) mátr a következő: 37

173 .4. Az általáosított legksebb égyzetek módszere L 575 Ω 653. M 755 A (47)-(49) szert, a megfelelő mátrműveletek elvégzése utá: 46,485 ˆβ,,458 ˆ) var(β, , , ,766-5,75-5,75, ,747,97 Az emprkus elemzésekél az autokorrelácó és a heteroszkedasztctás mellett (amelyek egatív hatását az általáosított legksebb égyzetek módszerével kezel tudjuk) majdem mdg jeletkezk a multkolleartás s, de eek következméyet a (47)-(49) képletekkel már em tudjuk kküszöböl. Szgfkás multkolleartás eseté hatékoya alkalmazható eljárás a főkompoes aalízs. Ezzel foglalkozk a.5. fejezet. 373

174 . Többváltozós regresszó- és korrelácószámítás.5. Főkompoes aalízs A stadard regresszós modell feltételez, hogy a magyarázóváltozók leársa függetleek. Társadalm, gazdaság adatok emprkus elemzéséél azoba, a változók között valamlye mértékű sztochasztkus összefüggés szte mdg előfordul. Ahhoz, hogy a.. fejezetbe smertetett modellt alkalmaz tudjuk más módszerre va szükségük, amellyel az eredet magyarázóváltozókból olya új változókat képezhetük, amelyek teljesítk a stadard modell feltételet és megtartják a magyarázóváltozókba rejlő formácókat. Az eredet magyarázóváltozók traszformálásával kapott új változókat fogjuk főkompoesekek evez. A főkompoes aalízs sorá a megfgyelések m dmezós terét egy olya új (derékszögű) koordáta-redszerbe traszformáljuk, amelybe a traszformált változók varacá redre csökkeek. A főkompoes aalízs sorá előállított új, mesterséges változók egymástól már függetleek. A magyarázóváltozók multkolleartása azt jelet, hogy azok redudás módo tartalmazak formácót. Például teljes multkolleartás eseté a magyarázóváltozók mátráak egy vagy több oszlopa elhagyható. Lát fogjuk, hogy a főkompoeseket úgy lehet előállíta, hogy az első éháyal már meg tudjuk magyaráz az eredméyváltozó szóráségyzetéek ge agy háyadát. Főkompoesváltozók Mvel külöböző mértékegységű változókból foguk új, mesterséges változókat előállíta, a mértékegységeket k kell küszöbölük. Ehhez a stadardzálás műveletét alkalmazzuk. A (3) képlet fgyelembevételével: ~ j j j,,..., j,,..., m s ; (55) j ahol jelöl. s j a j-edk magyarázóváltozó (67)-(68) szert korrgált tapasztalat szórását 374

175 .5. Főkompoes aalízs A főkompoesaalízs formáls modellje a következő: C XU ~, (56) ahol U olya leárs traszformácó mátra, amely az ~ vektorváltozókat c korrelálatla vektorváltozókba traszformálja. A C mátr oszlopvektorat főkompoesvektorokak vagy főkompoesekek evezzük. Feladatuk tehát az U mátr u ( k, l,,..., m ) elemeek a meghatározása. Ezeket kl az ~ j stadardzált változók varaca-kovaracamátráak u l ortoormált sajátvektora adják. Mvel a stadardzált változók varaca-kovaracamátra az eredet változók korrelácós mátrával (R) azoos, így eleve ebből a mátrból dulhatuk k. Legye R (öadjugált mátr) spektrálfelbotása a következő: R UΛU, ahol Ë dagoáls mátr, amelyek főátlójába a λ λ K λ sajátértékek állak, az U oszlopvektora pedg a megfelelő sajátvektorok. A sajátértékek összege a magyarázóváltozók számával egyelő: λ m. m j j m A főkompoesek C és a magyarázóváltozók mdkét mátr dmezója m. X ~ mátra ugyaolya alakú, azaz A (56) fgyelembevételével, a főkompoesek és a stadardzált magyarázóváltozók között felírható a következő két összefüggés: 8) c u ~ ~ K u ~, (57) j j + u j + + mj m 8) Mvel U ortogoáls, feáll U U. ~ C XU ~ CU X ~ X CU / U - 375

176 . Többváltozós regresszó- és korrelácószámítás lletve ~ u c + u c + K+ u c. (58) j j j jm m Megjegyzés: az eddgekből következk, hogy a főkompoesek korrelálatlaok és c j főkompoes szóráségyzete a megfelelő λ j sajátértékkel egyelő. A főkompoessúlyok A főkompoessúlyok (loadg változók) a sajátvektorok kompoeseek és a megfelelő sajátértékek égyzetgyökéek a szorzata: a λ k, l,,..., m. (59) kl u kl l A főkompoessúlyokat tartalmazó A mátr az ú. főkompoessúly-mátr, dmezója m m, és az alább tulajdoságokkal redelkezk. - A főkompoessúlyok abszolút értéke -él em agyobbak. - Az oszlopokét égyzetösszegük λ, a sorokét égyzetösszegük. j - Oszloppárokét szorzatuk, sorpárokét szorzatuk a megfelelő két magyarázóváltozó leárs korrelácós együtthatója. - A főkompoessúlyok megadják a magyarázóváltozók és a főkompoesváltozók között leárs korrelácós együtthatót. a kl r r (6) ~ c k l c k l Kommualtások Ha az A mátr -edk sora első w darab elemeek égyzetet kumuláljuk, akkor az - edk magyarázóváltozó (w) h kommualtásához jutuk. ( w) w h k a l kl w m (6) A kumulált főkompoessúly-égyzetek azt fejezk k, hogy az egyes főkompoesekek mlye jeletősége, súlya va a magyarázóváltozók varacájába, 376

177 .5. Főkompoes aalízs azaz az első w darab főkompoes mlye mértékbe járul hozzá az ~ k magyarázóváltozó szóráségyzetéhez. Például (3) 4 a4 + a4 a43 h + azt mutatja, hogy a egyedk magyarázóváltozó szóráségyzetéek az első három főkompoes százaléky háyadát értelmez. Nylvávalóa h, lletve %. ( m) k (3) h 4 Mvel általába éháy főkompoes már jól jellemz a mtába rejlő formácót, a több elhayagolható, számuk csökkethető. Az eddgekbe a magyarázóváltozók szóráségyzeteek értelmezett háyadáról volt szó, de fotos tud azt s, hogy az eredméyváltozó szóráségyzetéek túlyomó részét háy főkomopoessel tudjuk értelmez. Szgfkás multkolleartás eseté azokat a főkompoeseket, amelyekhez tartozó sajátérték -él ksebb (vagys em ér el az átlagot) általába már em vesszük fgyelembe. 85. példa Vzsgáljuk meg, hogy a 9. táblázat utolsó három oszlopába szereplő három magyarázóváltozót háy főkompoessel lehete helyettesíte! Először elleőrzzük a magyarázóváltozók leárs függetleségét! Ehhez szükségük va a magyarázóváltozókra voatkozó korrelácós mátrra., R,984,983,984,,86,983,86, Már a korrelácós mátr eleme alapjá s következtethetük arra, hogy szgfkás, ge agy mértékű multkolleartás jellemző az adatokra. Erre utal az M,57 érték s. A magyarázóváltozók között erős sztochasztkus kapcsolat matt em ajálatos az LNM alkalmazása, haem a főkompoes aalízs végrehajtása vola célszerű. Első lépéskét (55) szert stadardzáljuk a magyarázóváltozókat. Az eredméy a 97. táblázatba található. 377

178 . Többváltozós regresszó- és korrelácószámítás Stadardzált adatok Év Szarvasmarhaállomáy Sertésállomáy 97. táblázat Baromfállomáy ~ ~ ~ 3 974,478,658 -, ,78 -,, ,74,346, ,8874,339,8 978,975,4397,9 979,837,6545,89 98,84,6389,397 98,8779,677,48 98,837,79, ,7883,5843, ,774,53, ,4555,677, ,3588,868,68 987,48,5677, ,76,637,53 989,59,5 -, ,46,438 -, ,36 -,85 -, ,9769 -,33 -, ,3544 -,44 -, ,5644 -,848 -, ,5 -,46 -, ,5668 -,6 -, ,6565 -,4837 -, ,658 -,45 -,54 Végezzük el az eredet magyarázóváltozók korrelácós mátráak (R) spektrálfelbotását! 378

179 .5. Főkompoes aalízs Ehhez az R sajátértékere va szükségük. Ezeket az Ecel segítségével s meg tudjuk határoz, például a célérték-keresés felhaszálásával. Az Eszközök meü Adatelemzés... almeüjébe levő Korrelácóaalízs meüpot segítségével számítsuk k az eredet magyarázóváltozók korrelácós mátrát (vagy a Kovaracaaalízs segítségével a stadardzált magyarázóváltozók varaca-kovaracamátrát)! Készítsük el az [ R λi] mátrot modjuk a B6:D8 cellatartomáyba, úgy hogy λ például az F6 cellába kerüljö. Az F6 kezdőértéke legye a változók száma, tehát 3. A B mezőbe az MDETERM(tömb) függvéyel számíttassuk k a mátruk determását: MDETERM(B6;D8). Most hívjuk meg az Eszközök meü Célértékkeresés... almeüjét. A Célcella legye B, a Célérték, a Módosuló cella F6. Ekkor az F6 cellába megkapjuk a 3-hoz legközelebb, tehát a legagyobb sajátértéket ( λ,7589 ). Most írjuk át az F6 értékét 3 λ, 4 értékre; majd újra végezzük célérték-keresést az előző módo. A harmadk sajátértéket az első kettő segítségével már k tudjuk számíta: λ3 3 λ λ. A keresett három sajátérték az alább. λ λ λ 3,758835,794,6765 3, Az Ecel mátrokkal kapcsolatos műveletet felhaszálva oldjuk meg md a három λ -ra az alábbhoz hasoló ( u -ek és u3 -ak megfelelő) homogé leárs egyeletredszert, ahol az együtthatók az R mátr eleme. ( λ) u,984 u,983 u +,984 u + + ( λ) u,86 u + + +,983 u,86 u ( λ) u A ormált sajátvektorokat és a hozzájuk tartozó sajátértékeket a 98. táblázat tartalmazza. 379

180 . Többváltozós regresszó- és korrelácószámítás Az R mátrból kszámított sajátértékek és sajátvektorok Változók u u u táblázat Szarvasmarhaállomáy Sertésállomáy Baromfállomáy,5898 -, -,875,57 -,77,47,57,77,47 Sajátértékek,7588,794,68 A (59) fgyelembevételével kszámíthatjuk a főkompoessúly-égyzeteket. A főkompoessúly-égyzetek 99. táblázat Változók a a a 3 Szarvasmarhaállomáy Sertésállomáy Baromfállomáy Összese (sajátértékek),9597,,43,8995,897,7,8995,897,7,7588,794,68 Az első, a másodk és a harmadk magyarázóváltozó szóráségyzetéek redre (megközelítőleg) 96; 9 és 9%-át lehet az első főkompoessel értelmez. A 99. táblázat adata és a (6) segítségével k lehet számíta a három (w) magyarázóváltozóhoz tartozó h k kommualtás mutatókat. Például 38

181 .5. Főkompoes aalízs (,8995 +,897,989. Ez azt jelet, hogy a harmadk magyarázóváltozó h ) 3 szóráségyzetéek 98,9%-át tudjuk az első két főkompoessel megmagyaráz. A (56) vagy a (57) alapjá kszámított főkompoeseket a. táblázat tartalmazza. Év Szarvasmarhaállomáy c A főkompoesek Sertésállomáy. táblázat Baromfállomáy c c 3 974,855 -,6387 -,79 975,65,493 -, ,799,565,7 977,3498,5438 -,3 978,4336,476 -,5 979,337,35 -,5 98,4387,834,45 98,466,37 -,65 98,933,93,37 983,845 -,533, ,5964 -,93,74 985,8633 -,3, ,8568 -,499,85 987,587 -,35, 988,556 -,44,64 989,783 -,58 -, ,8 -,778 -, ,8 -,373 -, ,6396,399, 993 -,366,694 -, ,3999,7769, ,35,54, ,763 -,499 -, ,756 -,47, ,555 -,89,55 38

182 . Többváltozós regresszó- és korrelácószámítás Elleőrzés végett számítsuk k a főkompoesek varaca-kovaracamátrát. Ez dagoáls mátr, amelyek főátlójába a sajátértékek állak. C c,7588,,,,794,,,,67 A kszámított főkompoesek valóba korrelálatlaok és a főátlóba s (kerekítés hbával) a sajátértékek állak. Az említetteke kívül, a főkompoeselemzések va egy másk alkalmazás lehetősége s. Ez vagy a megfgyelések, vagy a magyarázóváltozók grafkus ábrázolásából áll. Olya grafkookról va szó, amelyekél a vízsztes tegelye az első főkompoes, míg a függőleges tegelye a másodk főkompoes található. 9) Az lye grafkookál gyakra fordul elő az az eset, hogy az ábrázolt potok egy része agyo közel esk egymáshoz, azaz koordáták megközelítőleg azoosak. Ezeket a csoportosulásokat (általába több va belőlük) clusterekek evezzük, amelyek mögött redszert valamlye közös téyező, ú. háttérváltozó (faktorváltozó) áll. Ezekek a háttérváltozókak a részletes elemzése a faktoraalízs tárgya, de m ezzel em foglalkozuk. A fetekből következk, hogy kevés számú magyarázóváltozót tartalmazó modellekél cs értelme az esetleges háttérváltozók kereséséek, ezért a 86. példa hat magyarázóváltozóból dul k. 86. példa Számítsuk k a. táblázatba szereplő adatok alapjá a főkompoessúly-mátrot és ábrázoljuk az első két oszlopát! Jelölje redre ( j,,..., j 6 ) a táblázat utolsó hat vektorát. 9) Elvleg háromdmezós grafkus ábrát s alkalmazhaták, de szgfkás multkolleartás eseté (általába) a harmadk főkompoes szerepeltetése em célszerű, mert a potok elredeződése a harmadk tegely meté agyo keskey lee, és em yújtaa vzuálsa léyeges többletformácót. 38

183 .5. Főkompoes aalízs Hazák par termeléséek éháy fotosabb adata. táblázat Év Vllamoseerga (mlló kwh) Kőolaj ( t) Baut ( t) Autóbusz (db) Televízókészülék ( db) Műayagalapayag ( t) M Forrás: Magyar Statsztka Évköyv 98, KSH, Bp., 999. A főkompoesek meghatározása utá a (59) szert mátr az alább. Főkomopesek c c c 3 c 4 c 5 c 6,9854,9876,963 A,8364,678,97,4,59,3478,4939,767,675,6,9,96,357,359,769,995,73,3,8,44,4,86,455,994,84,3,549,358,739,48,37,334,99 Vllayáram Kőolaj Baut Autóbusz TV Műayag Az 58. ábrá az A mátr első két oszlopa szert potokat ábrázoltuk. Mvel most csak a korrelácós kapcsolat erőssége érdekel beüket (és az ráya em), a potok esetleges csoportosulásáak szemléltetése végett tükrözzük a másodk és a harmadk egyedbe eső potokat az orgóra. Az áttükrözés utá kép az 59. ábrá látható. Ez alapjá három potcsoportosulást, azaz clustert külöböztethetük meg. Egykbe tartozhat az autóbusz- és a baut-, egy máskba a kőolaj-, a műayag-alapayag- és a vllayáram-, egy újabba a televízókészülék termelése. Ezek mögött álló háttérváltozók egy értelmezése lehete a vzsgált termékek külkereskedelme. Az autóbusz és a baut tpkus kvtel, míg a másodk cluster három eleme tpkusa behozatal termékük. 383

184 . Többváltozós regresszó- és korrelácószámítás A főkompoessúlyok ábrázolása,8 c 5,6 4,4 3, 6, -, -,8 -,6 -,4 -,,,,4,6,8, c -, 58. ábra A főkompoessúlyok áttükrözés utá ábrázolása,8 c,6 Televízó-készülék,4, Műayag-alapayag Kőolaj,,,,4,6,8, Vllamoseerga, c -, -,4 -,6 Baut Autóbusz 59. ábra 384

185 Tesztkérdések 385

186 Tesztkérdések I. Tesztkérdések válaszokkal A következő két részbe 5-5 tesztfeladatot talál, amelyek mdegykébe 4 állítást kell mősíte aszert, hogy azt gazak vagy hamsak ítél meg. Válaszát egyértelműe jelölje I vagy H betűvel! Megjegyzés: ezekél a feladatokál mellékszámítást em kell bemutat.. Egy sokaság lehet: A. mozgó; B. leárs; C. aggregált; D. dszkrét.. A következő mutatók a kvatlsekhez tartozak: A. kvtls; B. percetls; C. módusz; D. medá. 3. Nagyság szempotjából, egyazo adatállomáyt vzsgálva, mlye összefüggés va az átlagos abszolút eltérés és a szórás között? A. Mdg a szórás ksebb; B. mdg a szórás agyobb; C. általába a szórás agyobb; D. cse szabály. 386

187 I. Tesztkérdések válaszokkal 4. Adva va egy 5 tagból álló meység sor, amelyre voatkozóa a számított átlagok: h 3, 9437; g 4, 4737 ; 5, és q 5, 459. Eze adatok alapjá leírhatjuk a következő egyelőségeket: A. M -, 536 ; B. M M 4, 87 ; C. v, 438; D. v-t em lehet kszámíta. 5. A teljes szóráségyzet a belső és a külső szóráségyzet összege. Azt állíthatjuk, hogy: A. a belső szórás a részszórások súlyozott számta átlaga; B. a belső szórás a csoporto belül szórások súlyozott égyzetes átlaga; C. a belső szóráségyzet a részszórások súlyozott égyzetes átlaga; D. a belső szóráségyzet a részvaracák súlyozott számta átlaga. 6. Nagyo sok megfgyelésből álló gyakorság sor (becsült) középértéke között, baloldal aszmmetra eseté, (általába) feállak a következő összefüggések: A. < Me $ < M$ o; B. Mo $ < Me $ < ; C. < Mo $ < M$ e; D. Me $ < Mo $ <. 7. Stadardzálásál smert a következő összefüggés: I I I. Azt állíthatjuk, hogy: A. az I'' azt mutatja, hogy a részvszoyszámok változása hogya hatott a vzsgált összetett (teztás) vszoyszám változására; B. az I'' de csupá az összetételváltozás téyét fejez k; C. az I'' azt mutatja, hogy az összetételváltozás hogya hatott a vzsgált összetett (teztás) vszoyszám változására; D. az I' deet összetételhatás-deek evezzük. 387

188 Tesztkérdések 8. Az depróbák az deekkel kapcsolatos követelméyeket fejezk k. Az alábbak közül ezek tartozak az depróbákhoz: A. függetleség próba; B. összemérhetőség próba; C. égyzetes próba; D. téyezőpróba. 9. Homogé, véges elemszámú sokaság eseté a következő típusú mtákat szokás alkalmaz: A. egyeletes elosztású rétegzett mta; B. aráyos elosztású rétegzett mta; C. csoportos mta; D. egyszerű véletle mta.. Becslőfüggvéyekkel kapcsolatosak a következő állítások: A. egy torzítatla és egy torzított becslőfüggvéyt hatásosság szempotjából em tuduk összehasolíta; B. ha egy becslőfüggvéy kozsztes, akkor torzítatla s; C. ha egy becslőfüggvéy torzítatla, akkor effces s; D. egy torzított becslőfüggvéy lehet effces s.. A statsztkába haszált evezetes elmélet eloszlásokkal kapcsolatosak az alább összefüggések. A. Véges szabadságfok mellett a χ -eloszlásak baloldal aszmmetrája va. B. Véges szabadságfok mellett az F-eloszlásak jobboldal aszmmetrája va. C. Véges szabadságfok mellett a t-eloszlásak jobboldal aszmmetrája va. D. A ormáls eloszlás éha aszmmetrkus s lehet. 388

189 I. Tesztkérdések válaszokkal. A stadard leárs regresszós modellekek megfelelő feltételek a következőek: A. ekvdsztas megfgyelések kelleek; B. homoszkedasztctás; C. a magyarázóváltozók között lehet szgfkás leárs kapcsolat; D. autokorrelácó. 3. Adva va két leárs regresszófüggvéy: y() és (y), amelyekél a két változó (X és Y) kokrét jeletése most rrelevás. A következő regresszós paraméterek párosa közül statsztkalag lehetségesek: A. y():,5 és (y):,5; B. y():-.5 és (y):-.5; C. y():-,5 és (y):,5; D. y():,5 és (y):,3. 4. Autokorrelácó tesztelésekor a d-statsztka agyságát a DURBIN-WATSON-féle táblázat krtkus értékevel szoktuk összehasolíta. Ismertek a következő adatok: 5 ; m 3 és d 3, 8. Ezek smeretébe, elsőredű autokorrelácót feltételezve, az adatokból (α, eseté) az következk, hogy: A. a rezduumok egymástól leársa függetleek; B. poztív autokorrelácóról va szó; C. egatív autokorrelácóról va szó; D. elsőredű autokorrelácóál a fet adatok em lehetségesek. 5. Három- vagy többváltozós regresszós elemzésél a multkolleartás majdem mdg jeletkezk. Következméyehez az alábbak tartozak: A. a becsült regresszós együtthatók em torzítatlaok; B. a becsült regresszós együtthatók szórását csökket; C. stabllá tesz a becsléseket; D. em lehet kszámíta a korrelácós mátrot. 389

190 Tesztkérdések Válaszok. A) I B) H C) I D) I. A) I B) I C) H D) I 3. A) H B) H C) I D) H 4. A) I B) I C) I D) H 5. A) H B) I C) H D) I 6. A) H B) I C) H D) H 7. A) H B) H C) I D) H 8. A) H B) I C) H D) I 9. A) H B) H C) I D) I. A) H B) H C) H D) H. A) I B) H C) H D) H. A) H B) I C) H D) H 3. A) I B) I C) H D) H 4. A) H B) H C) I D) H 5. A) H B) H C) I D) H 39

191 II. Tesztkérdések válaszok élkül II. Tesztkérdések válaszok élkül. A mometumokkal kapcsolatos összefüggések: A. a ulladk mometum mdg -val egyelő; B. a ulladk mometum mdg -gyel egyelő; C. a ulladk cetráls mometum mdg -val egyelő; D. a ulladk cetráls mometum mdg -gyel egyelő.. A hatváyktevős regresszófüggvéy becsült regresszós együtthatójáak ( ˆβ ) értelmezése: A. ha a magyarázóváltozó értékét (bármlye sztről) egységyvel öveljük, akkor az eredméyváltozó értéke átlagosa, megközelítő potossággal ˆβ százalékkal változk; B. ha a magyarázóváltozó értékét (bármlye sztről) százalékkal öveljük, akkor az eredméyváltozó értéke átlagosa, megközelítő potossággal ˆβ egységyvel változk; C. ha a magyarázóváltozó értékét (bármlye sztről) százalékkal öveljük, akkor az eredméyváltozó értéke átlagosa, megközelítő potossággal p ( βˆ ) százalékkal változk; D. ha a magyarázóváltozó értékét (bármlye sztről) ˆβ százalékkal öveljük, akkor az eredméyváltozó értéke átlagosa, megközelítő potossággal egységyvel változk. 3. A szóródás mérőszámara smertek a következő összefüggések: A. a szórás a másodk cetráls mometum ; B. a varaca a másodk mometum égyzete; C. a relatív szórás em lehet egatív előjelű; D. a stadardzált változó átlaga egatív s lehet. 39

192 Tesztkérdések 4. Mtavétellel kapcsolatosa smertek a következő állítások: A. csoportos mtavétel eseté az egyes részsokaságok homogetása előyös; B. csoportos mtavétel eseté az egyes részsokaságok homogetása em előyös; C. rétegzett mtavétel eseté az egyes sztrátumok homogetása előyös; D. rétegzett mtavétel eseté az egyes sztrátumok homogetása em előyös. 5. A középértékekre voatkozak a következő állítások: A. az egyes adatok számta átlaguktól mért eltéréseek összege mmáls; B. az egyes adatok számta átlaguktól mért eltérése égyzeteek összege mmáls; C. az egyes adatok medájuktól mért eltéréseek összege mmáls D. az egyes adatok medájuktól mért eltérése égyzeteek összege mmáls. 6. Három- vagy többváltozós regresszós elemzésekkel kapcsolatba smertek az alábbak: A. teljes multkolleartás eseté az X X mátr szgulárs; B. teljes multkolleartás eseté a korrelácós mátr szgulárs; C. a heteroszkedasztctás általába az dősor alapjá törtéő becslésekél fordul elő; D. az autokorrelácó általába a keresztmetszet adatok alapjá törtéő becslésekél fordul elő. 39

193 II. Tesztkérdések válaszok élkül 7. Az deekkel kapcsolatosa smertek a következő összefüggések: A. a LASPEYRES-féle volumede mdg agyobb a PAASCHE-féle volumedeél; B. a PAASCHE- és a LASPEYRES-féle volumedeek háyadosa külöbözhet a PAASCHE- és a LASPEYRES-féle árdeek háyadosától; C. az egyed ár- és volumedeek között leárs korrelácós együttható em lehet poztív előjelű; D. a PAASCHE- és a LASPEYRES-féle deek háyadosa általába egyél ksebb. 8. Ismertek az FAE mtával kapcsolatos összefüggések: A. a tapasztalat szórás a populácó szórásáak torzítatla becslése; B. a tapasztalat szóráségyzet a populácó varacájáak torzítatla becslése; C. a korrgált tapasztalat szórás a sokaság szórásáak torzítatla becslése; D. a korrgált tapasztalat szóráségyzet a populácó szóráségyzetéek torzítatla becslése. 9. Az éves epoecáls (aaltkus) tredfüggvéy ˆβ becsült paraméteréek értelmezése: A. a vzsgált jeleség évete átlagosa ˆβ egységyvel változk; B. a vzsgált jeleség évete átlagosa ˆβ szeresére változk; C. a vzsgált jeleség évete átlagosa p ( βˆ ) százalékkal változk; D. a vzsgált jeleség évete átlagosa p ( β ˆ ) százalékkal változk. 393

194 Tesztkérdések. Jobboldal aszmmetra eseté a középértékek között (általába) feállak a következő összefüggések: A. a számta átlag a móduszál ksebb; B. a számta átlag a móduszál agyobb; C. a medá a móduszál ksebb; D. a medá a móduszál agyobb.. Egy 6 tagú statsztka adatállomáy csoportosításáál az osztályok (k) deáls számára voatkozóa állíthatjuk, hogy: A. homogé adatok eseté k deáls értéke 6; B. heterogé adatok eseté k deáls értékét em lehet meghatároz; C. heterogé adatok eseté k deáls értéke 6; D. k értékéek meghatározásához semmlye támpot sem smert.. A felfelé és lefelé kumulált gyakorságokra voatkozóa gazak az alább összefüggések: A. az első lefelé kumulált gyakorság az utolsó abszolút gyakorsággal egyelő; B. az utolsó lefelé kumulált gyakorság az utolsó abszolút gyakorsággal egyelő; C. az első felfelé kumulált gyakorság az első abszolút gyakorsággal egyelő; D. a felfelé és a lefelé kumulált gyakorságok között em létezk semmlye evezetes összefüggés. 3. A meység sorokkal kapcsolatba tudjuk, hogy: A. az ogva a relatív gyakorság sorok grafkus ábrája; B. az ogva a felfelé kumulált gyakorságok grafkus ábrája; C. a gyakorság görbe a gyakorság polgo határesete; D. a hsztogram a gyakorság sor kördagramja. 394

195 II. Tesztkérdések válaszok élkül 4. Két smérv között összefüggés számszerűsítésével kapcsolatba azt állíthatjuk, hogy: A. egy terület és egy meység smérv között korrelácós kapcsolatról beszélük; B. egy mőség és egy alteratív smérv között vegyes kapcsolatról beszélük; C. két meység smérv között ragkorrelácós kapcsolatról beszélük; D. egy terület és egy mőség smérv között asszocácós kapcsolatról beszélük. 5. Ugyaazo adatok számított átlagara voatkozóa smertek a következő összefüggések: A. a mérta átlag a számta átlagál mdg ksebb; B. a harmokus átlag a kvadratkus átlagál mdg ksebb; C. éha egy kszámított átlag ksebb s lehet az adatállomáy legksebb adatáál; D. bármlye adatállomáy eseté: h < g. 395

196 Tárgymutató 396

197 determsztkus dősorelemzés abszolút hatásos torzítatla becslőfüggvéy 36 addtív modell 96 AITKEN-tétel 365 alapsokaság 6 általáosított legksebb égyzetek módszere 364 alteratív hpotézs 63 aaltkus tredszámítás 34 ANOVA táblázat 88 aráyos elosztás 6 aszmptotkus hatásosság 36 aszmptotkus z-próba 7 aszmptotkusa ormáls eloszlás 7 aszmptotkusa torzítatla 3 átlagos égyzetes hba 37 autokorrelácó 33 autokorrelácós együttható 34 baloldal próba 65 becsléses lleszkedés vzsgálat 77 becslőfüggvéy 9 BLUE tulajdoság 33 cetrírozás 99 cklkus kompoes 96 cluster 38 COCHRANE-ORCUTT teratív módszer 366 CSEBISEV-féle eloszlás 47 csoportos mtavétel 7 defícós hba 7 dekompozícós dősormodell 96 determsztkus dősorelemzés

198 DURBIN-WATSON-féle próba DURBIN-WATSON-féle próba 343 effces becslés 33 egyeletes elosztás 6 egyoldal próba 66 egyszerű hpotézs 63 egyszerű véletle mta 4 ekvdsztás 94 elfogadás tartomáy 64 elsőfajú hba 66 elsőredű autokorrelácó 34 epoecáls tred 37 etrapolácó 98 etrém multkolleartás 337 faktoraalízs 38 faktorváltozó 38 F-eloszlás 89 főkompoes 375 főkompoes aalízs 374 főkompoessúly 376 főkompoessúly-mátr 376 főkompoesvektor 375 folytoosság korrekcó 5 függetle, azoos eloszlású mta 4 GAUSS-féle egyelőtleség 47 GAUSS-féle eloszlás 7 GAUSS-görbe 8 GAUSS MARKOV tétel 33 globáls F-próba 33 hatásosság

199 loadg változó három kválasztott pot módszere 34 háttérváltozó 38 heteroszkedasztctás 33 hbahatár 43 hpotézsvzsgálat 63 homoszkedasztctás 83 dősor rövdülése 99 lleszkedésvzsgálat 77 terpolácó 98 tervallumbecslés 9 jobboldal próba 65 kétmtás t-próba 83 kétmtás z-próba 83 kétoldal próba 65 χ (kh-égyzet) eloszlás 53 ks mta 7 kommualtás 376 kofdeca tervallum 4 kofdeca paraméter 4 kozsztes becslőfüggvéy 37 korrelácós mátr 334 korrgált szezoáls eltérés 33 korrgált szezode 34 korrgált tapasztalat szóráségyzet 3 krtkus tartomáy 64 kroologkus átlag 94 lkelhood függvéy 39 leárs tred 34 loadg változó

200 logsztkus tredfüggvéy logsztkus tredfüggvéy 33 mamum lkelhood módszer 39 másodfajú hba 66 másodfokú tredegyelet 3 mátralgebra jelölésmód 39 megbízhatóság szt 4 mkrocezus 6 mmáls szóráségyzetű torzítatla becslőfüggvéy 36 mta 6 mtaátlag 5 mtasokaság 6 mtavétel eloszlás 5 mtavétel hba 7 mtavétel szóráségyzet 7 modell specfkácója 38 mometumok módszere 4 mozgó átlagok módszere 98 mozgó átlagolás tagszáma 98 multkolleartás 33 multplkatív modell 96 agy mta 7 emmtavétel hba 7 emparaméteres próba 67 NEYMAN-féle optmáls elosztás 6 ormáls eloszlás 7 ormaltásvzsgálat 77 övekedés átlagos mértéke 95 övekedés átlagos üteme 95 ullhpotézs 63 yers szezoáls eltérés 33 4

201 yers szezode 34 statsztka tesztek összetett hpotézs 63 parabolkus tred 3 paraméteres próba 67 parcáls determácós együttható 335 parcáls F-próba 333 parcáls korrelácós együttható 335 parcáls regresszós együttható 33 párokét korrelácós együttható 334 páros mta 8 potbecslés 9 próba alkalmazás feltétele 64 próba megbízhatóság sztje 64 próbafüggvéy 64 reprezetatív megfgyelés 6 réteg 5 rétegzett mtavétel 4 rezduáls szóráségyzet 333 rdge-regresszó 34 robosztus becslés 37 spektrálaalízs 93 SPENCER-féle súlyozott mozgó átlagok 99 stadard hba 7 stadard leárs regresszós modell 39 stadard ormáls eloszlás 9 statsztka dukcó 5 statsztka következtetéselmélet 5 statsztka próbák 63 statsztka tesztek 63 4

202 STIRLING-féle összefüggés STIRLING-féle összefüggés 3 szabadságfok 44 szezoáls kgazítás 37 szezoáls kompoes 96 szezoálsa kgazított dősor 37 szgfkaca-szt 64 szgfkás 9 szsztematkus kválasztás 4 sztochasztkus dősorelemzés 93 sztrátum 5 tapasztalat szóráségyzet 3 techka hpotézs 64 teljes multkolleartás 337 t- (STUDENT-féle) eloszlás 44 tszta lleszkedésvzsgálat 77 torzítatlaság 3 többlépcsős mtavétel 7 többszörös determácós együttható 336 többszörös korrelácós együttható 336 t-próba 7 tred 96 út-dagram 338 út-elemzés módszer 338 valószíűség mta varaca-aalízs 88 varaca-kovaracamátr 334 válaszadás hba 7 véges sokaság szorzó 57 végrehajtás hba 7 4

203 z-próba véletle mtavétel véletle számok táblázata véletle téyező 96 vsszatevés élkül mtavétel vsszatevéses mtavétel vsszautasítás tartomáy 64 z-próba 68 43

204 Képletgyűjteméy 44

205 7. Statsztka mták módszere 7. Statsztka mták módszere (5) k N FAE N (53) k EV (54) E ( ) µ µ (55) σ σ (56) σ σ N N (57) f ( ) µ σ e σ π (58) ϕ ( z) z e π (59) µ m z σ (6) N( µ, σ ) (6) µ m z σ (6) j j,,...,m M 45

206 Képletgyűjteméy (63) N j j M j N j N j N (64) j M N σ j j j j N σ j 8. Mta alapjá törtéő becslések (65) E( Θ) ˆ Θ (66) Bs( Θˆ ) Θ E( Θˆ ) (67) s ( ) (68) s k f ( ) (69) E s ( ) σ (7) E s N N σ (7) Mse( Θˆ ) Bs ( Θˆ ) + Se ( Θˆ ) E( Θˆ Θ) Pr ˆ a( α) ˆ f ( α) (7) ( Θ < Θ < Θ ) α σ σ (73) Pr z(p) < µ < + z(p) α 46

207 8. Mta alapjá törtéő becslések (74) z σ (p) (75) ( ) (p) σ z (76) α ν µ ν + < < ) ( ) ( ) (p (p) s t s t Pr (77) α σ µ σ + < < 9 4 k k k Pr (78) α σ µ σ + < < k k k Pr (79) pq s p (8) N N pq s p (8) α + < < (p) (p) pq z p P pq z p Pr (8) α ν χ σ ν χ α α < < ) ( ) ( ) ( ) ( s s Pr (83) α σ µ σ + < < (p) (p) N N z N N z Pr 47

208 Képletgyűjteméy (84) ( z(p) σ ) ( z(p) σ ) N + s (85) s N (86) σ N E σ N ( s ) (87) s s N (88) σ M N N j σ j N j N j j j j (89) σ B σ (9) s M j j s j 9. Hpotézsek vzsgálata (9) Z µ σ (9) T µ s 48

209 9. Hpotézsek vzsgálata (93) s Z µ (94) P Q P p Z (95) ( ) ( ) r c j r c j j j j j j f f f p p p p g j.... χ (96) ( ) ( ) k k f f f P P g χ (97) Z σ + σ (98) s T c + (99) ) ( ) ( s s s j j c () s s Z + () + p q p p Z 49

210 Képletgyűjteméy () ) /( ) /( B K s s M SSB M SSK F. Damkus elemzés (3) + + t k t (4) d (5) ˆ k y y y y y k t t k t k t t (6) k y y y y y y k t k t t k t k t t ˆ (7) t (8) y ˆβ (9) t y t ˆβ () y log ˆ log β 4

211 . Damkus elemzés () t y t log ˆ log β () + t y ˆ ˆ β β (3) t y t ˆβ (4) + t t y t 4 ˆ ˆ β β (5) e y y + + ˆ ˆ ma ˆ ˆ β β (6) ma ) ( ˆ m m m m m m Y Y Y Y Y Y Y Y Y y (7) ma ˆ l ˆ Y Y y β (8) + + ) ˆ ( ) ˆ ( l ˆ ma ma m m Y y Y Y y Y m β (9) ˆ ma y y y y y y y y y y y y y y y y 4

212 Képletgyűjteméy yˆ ma y () zˆ ˆ ˆ l β + β y () s / p a ( y yˆ ) j j a j p / p j,,..., () / p a ( y yˆ ) j a s j / p j (3) ~ s a j s a j s a j (4) s m j / p y j m yˆ j / p (5) / p y j m y m ˆj s j / p (6) ~ s m s j s m j m j. Többváltozós regresszó- és korrelácószámítás (7) y ˆ β ˆ ˆ ˆ + β + β + K+ βm m + e,,..., m + < < N 4

213 . Többváltozós regresszó- és korrelácószámítás (8) y y y M y X M L m m m ˆ β ˆ ˆ β β M ˆ β m e e e M e (9) SST ( y y) (3) SSR ( yˆ y) (3) SSE ( y yˆ ) e (3) SST SSR + SSE (33) SSE r SST SSR SST (34) SSR / m F SSE /( m ) (35) ˆ β j F j,,..., m var( ˆ β ) j e e var(ˆ) β X X e X X m (36) ( ) s ( ) (37) ˆ β j t s ˆ β j 43

214 Képletgyűjteméy (38) y y y y m m m m r r r r r r M L R (39) m m m m m y y y y y C C C C C C σ σ σ M L C (4),...,,,...,, + j j j m yy y y j j j r R R R. (4),...,, yy m y r R. (4) r r t (43) ( ) + m j m y m y m y j j r r r M,...,,,...,,,...,,,...,,... (44) ( ) e e e d (45) ) ˆ ( ρ d 44

215 . Többváltozós regresszó- és korrelácószámítás (46) Ω εε ) ( σ E (47) ( ) y X Ω X X Ω β ˆ (48) ) ( var(ˆ) X X Ω β σ (49) m s e e e Ω (5) 3 3 ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ M K Ω (5) ρ ρ ρ ρ ρ ρ ρ ρ ρ ρ M L Ω (5) e e e ˆρ (53) j j j M L P 45

216 Képletgyűjteméy (54) Ω P P P (55) ~ j j j,,..., s j j,,..., m (56) C X ~ U (57) c j u ~ j u ~ j u ~ + + K+ mj m (58) ~ j u jc + u jc + K+ u jmcm (59) akl u kl λl k, l,,..., m (6) a kl r r ~ c k l c k l ( w) (6) h k a w l kl w m 46

217 Statsztka táblázatok 47

218 Statsztka táblázatok I. TÁBLÁZAT Stadard ormáls eloszlású változó eloszlásfüggvéyéek értéke (kétoldal próbákhoz) z , , , , , , , , , , , , , , , , , , , , , , , , , Megjegyzés: a táblázatba szereplő számok törtrészek (mdegyk előtt, áll). 48

219 Stadard ormáls eloszlás II. TÁBLÁZAT Stadard ormáls eloszlású változó eloszlásfüggvéyéek értéke (egyoldal próbákhoz) z , , , , , , , , , , , , , , , , , , , , , , , , , Megjegyzés: a táblázatba szereplő számok törtrészek (mdegyk előtt, áll). 49

220 Statsztka táblázatok III. TÁBLÁZAT A STUDENT-féle t-eloszlású változó eloszlásáak kvatls értéke (kétoldal próbákhoz) ν,9,9,9,93,94,95,96,97,98,99 5,5,978,9,974,46,576,7565 3,9 3,3649 4,3 6,943,9,43,,333,4469,6,889 3,47 3,774 7,8946,966,46,365,49,3646,568,746,9979 3,4995 8,8595,98,4,9,89,36,449,6338,8965 3,3554 9,833,899,977,554,54,6,3984,5738,84 3,498,85,8768,948,83,,8,3593,575,7638 3,693,7959,8588,984,67,96,,38,497,78 3,58,783,844,93,9889,764,788,37,467,68 3,545 3,779,837,8989,974,6,64,86,4358,653 3,3 4,763,83,8875,967,46,448,638,449,645,9768 5,753,83,8777,959,343,35,485,397,65,9467 6,7459,846,8693,947,4,99,354,385,5835,98 7,7396,7978,869,9335,5,98,38,368,5669,898 8,734,798,8553,964,7,9,37,356,554,8784 9,79,7864,8495,9,,93,47,3457,5395,869,747,786,8443,943,9937,86,967,336,58,8453,77,7773,8397,99,988,796,894,378,576,834,77,7734,8354,945,989,739,89,3,583,888 3,739,7699,836,93,9783,687,77,33,4999,873 4,79,7667,88,8965,974,639,75,369,49,797 5,78,7637,848,899,97,595,666,3,485,7874 6,756,76,89,8897,9665,555,6,958,4786,7787 7,733,7585,89,8867,963,58,578,99,477,777 8,7,756,866,8839,96,484,539,864,467,7633 9,699,754,84,883,9573,45,53,8,46,7564 4

221 STUDENT-féle t-eloszlás IV. TÁBLÁZAT A STUDENT-féle t-eloszlású változó eloszlásáak kvatls értéke (egyoldal próbákhoz) ν,9,9,9,93,94,95,96,97,98,99 5,4759,5579,6493,759,877,5,9,46,7565 3,3649 6,4398,57,633,7,87,943,43,333,6 3,47 7,449,4894,578,6643,77,8946,46,49,568,9979 8,3968,469,5489,6383,74,8595,4,89,449,8965 9,383,4537,535,685,776,833,977,54,3984,84,37,446,579,63,6998,85,948,,3593,7638,3634,438,569,596,6856,7959,984,96,38,78,356,437,4979,584,6739,783,93,764,37,68 3,35,47,493,578,664,779,8989,6,86,653 4,345,43,4839,5646,6558,763,8875,46,638,645 5,346,463,4784,5583,6487,753,8777,343,485,65 6,3368,4,4736,559,645,7459,8693,4,354,5835 7,3334,3983,4694,548,637,7396,869,5,38,5669 8,334,395,4656,5439,63,734,8553,7,37,554 9,377,39,463,54,68,79,8495,,47,5395,353,3894,4593,5369,64,747,8443,9937,967,58,33,387,4567,5338,67,77,8397,988,894,576,3,3848,454,53,676,77,8354,989,89,583 3,395,388,45,586,648,739,836,9783,77,4999 4,378,38,45,563,6,79,88,974,75,49 5,363,3794,448,54,698,78,848,97,666,485 6,35,3778,4464,53,676,756,89,9665,6,4786 7,337,3764,4449,55,656,733,89,963,578,477 8,35,375,4434,589,637,7,866,96,539,467 9,34,3739,44,574,6,699,84,9573,53,46 4

222 Statsztka táblázatok V. TÁBLÁZAT A χ -eloszlású változó eloszlásáak kvatls értéke ν,5,,,5,5,95,975,98,99,995,,,4,5,386 5,99 7,378 7,84 9,,597 3,7,5,85,6,366 7,85 9,348 9,837,345,838 4,7,97,49,484 3,357 9,488,43,668 3,77 4,86 5,4,554,75,83 4,35,7,83 3,388 5,86 6,75 6,676,87,34,37 5,348,59 4,449 5,33 6,8 8,548 7,989,39,564,69 6,346 4,67 6,3 6,6 8,475,78 8,344,647,3,8 7,344 5,57 7,535 8,68,9,955 9,735,88,53,7 8,343 6,99 9,3 9,679,666 3,589,56,558 3,59 3,47 9,34 8,37,483,6 3,9 5,88,63 3,53 3,69 3,86,34 9,675,9,68 4,75 6,757 3,74 3,57 4,78 4,44,34,6 3,337 4,54 6,7 8,3 3 3,565 4,7 4,765 5,9,34,36 4,736 5,47 7,688 9,89 4 4,75 4,66 5,368 5,69 3,339 3,685 6,9 6,873 9,4 3,39 5 4,6 5,9 5,985 6,6 4,339 4,996 7,488 8,59 3,578 3,8 6 5,4 5,8 6,64 6,98 5,338 6,96 8,845 9,633 3, 34,67 7 5,697 6,48 7,55 7,564 6,338 7,587 3,9 3,995 33,49 35,78 8 6,65 7,5 7,96 8,3 7,338 8,869 3,56 3,346 34,85 37,56 9 6,844 7,633 8,567 8,97 8,338 3,44 3,85 33,687 36,9 38,58 7,434 8,6 9,37 9,59 9,337 3,4 34,7 35, 37,566 39,997 8,34 8,897 9,95,83,337 3,67 35,479 36,343 38,93 4,4 8,643 9,54,6,98,337 33,94 36,78 37,659 4,89 4, ,6,96,93,689,337 35,7 38,76 38,968 4,638 44,8 4 9,886,856,99,4 3,337 36,45 39,364 4,7 4,98 45,558 4

223 χ -eloszlás V. TÁBLÁZAT (folytatás) A χ -eloszlású változó eloszlásáak kvatls értéke ν,5,,,5,5,95,975,98,99,995 5,5,5,7 3, 4,34 37,65 4,65 4,57 44,3 46,93 6,6, 3,4 3,84 5,34 38,89 4,9 4,86 45,64 48,9 7,8,88 4,3 4,57 6,34 4, 43,9 44,4 46,96 49,65 8,46 3,56 4,85 5,3 7,34 4,34 44,46 45,4 48,8 5,99 9 3, 4,6 5,57 6,5 8,34 4,56 45,7 46,69 49,59 5,34 3 3,79 4,95 6,3 6,79 9,34 43,77 46,98 47,96 5,89 53, ,9 8,5,3,57 34,34 49,8 53, 54,4 57,34 6,7 4,7,6 3,84 4,43 39,34 55,76 59,34 6,44 63,69 66, ,3 5,9 7,7 8,37 44,34 6,66 65,4 66,56 69,96 73,7 5 7,99 9,7 3,66 3,36 49,33 67,5 7,4 7,6 76,5 79, ,73 33,57 35,66 36,4 54,33 73,3 77,38 78,6 8,9 85, ,53 37,48 39,7 4,48 59,33 79,8 83,3 84,58 88,38 9, ,38 4,44 43,78 44,6 64,33 84,8 89,8 9,5 94,4 98, 7 43,8 45,44 47,89 48,76 69,33 9,53 95, 96,39,43 4, 75 47, 49,48 5,4 5,94 74,33 96,,84,4 6,39,9 8 5,7 53,54 56, 57,5 79,33,88 6,63 8,7,33 6, ,7 57,63 6,4 6,39 84,33 7,5,39 3,87 8,4,3 9 59, 6,75 64,63 65,65 89,33 3,5 8,4 9,65 4, 8, ,5 65,9 68,88 69,9 94,33 8,75 3,86 5,4 9,97 34,5 67,33 7,6 73,4 74, 99,33 4,34 9,56 3,4 35,8 4,7 43

224 Statsztka táblázatok VI. TÁBLÁZAT Az F-eloszlású változó eloszlásáak kvatls értéke α,5 ν ν ,446 99,499 5,77 4,583 3,6 33,988 36,767 38,884 4,543 8,53 9, 9,64 9,47 9,96 9,39 9,353 9,37 9,385 3,8 9,55 9,77 9,7 9,3 8,94 8,887 8,845 8,8 4 7,79 6,944 6,59 6,388 6,56 6,63 6,94 6,4 5, ,68 5,786 5,49 5,9 5,5 4,95 4,876 4,88 4,77 6 5,987 5,43 4,757 4,534 4,387 4,84 4,7 4,47 4,99 7 5,59 4,737 4,347 4, 3,97 3,866 3,787 3,76 3, ,38 4,459 4,66 3,838 3,688 3,58 3,5 3,438 3, ,7 4,56 3,863 3,633 3,48 3,374 3,93 3,3 3,79 4,965 4,3 3,78 3,478 3,36 3,7 3,35 3,7 3, 4,844 3,98 3,587 3,357 3,4 3,95 3,,948,896 4,747 3,885 3,49 3,59 3,6,996,93,849, ,667 3,86 3,4 3,79 3,5,95,83,767,74 4 4,6 3,739 3,344 3,,958,848,764,699, ,543 3,68 3,87 3,56,9,79,77,64, ,494 3,634 3,39 3,7,85,74,657,59, ,45 3,59 3,97,965,8,699,64,548, ,44 3,555 3,6,98,773,66,577,5, ,38 3,5 3,7,895,74,68,544,477,43 4,35 3,493 3,98,866,7,599,54,447, ,4 3,385,99,759,63,49,45,337,8 3 4,7 3,36,9,69,534,4,334,66, 35 4, 3,67,874,64,485,37,85,7,6 4 4,85 3,3,839,66,449,336,49,8,4 45 4,57 3,4,8,579,4,38,,5,96 5 4,34 3,83,79,557,4,86,99,3,73 44

225 F-eloszlás VI. TÁBLÁZAT (folytatás) Az F-eloszlású változó eloszlásáak kvatls értéke α,5 ν ν ,88 45,949 48,6 49,6 5,96 5,693 5,44 5,493 5,774 9,396 9,49 9,446 9,456 9,463 9,467 9,47 9,473 9, ,785 8,73 8,66 8,634 8,67 8,64 8,594 8,587 8,58 4 5,964 5,858 5,83 5,769 5,746 5,79 5,77 5,77 5, ,735 4,69 4,558 4,5 4,496 4,478 4,464 4,453 4, ,6 3,938 3,874 3,835 3,88 3,789 3,774 3,763 3, ,637 3,5 3,445 3,44 3,376 3,356 3,34 3,38 3,39 8 3,347 3,8 3,5 3,8 3,79 3,59 3,43 3,3 3, 9 3,37 3,6,936,893,864,84,86,83,83,978,845,774,73,7,678,66,648,637,854,79,646,6,57,548,53,57,57,753,67,544,498,466,443,46,4,4 3,67,533,459,4,38,357,339,35,34 4,6,463,388,34,38,84,66,5,4 5,544,43,38,8,47,3,4,9,78 6,494,35,76,7,94,69,5,36,4 7,45,38,3,8,48,3,4,89,77 8,4,69,9,4,7,8,63,48,35 9,378,34,55,6,7,46,6,,999,348,3,4,74,39,3,994,978,966 5,36,89,7,955,99,89,87,855,84 3,65,5,93,878,84,83,79,775,76 35,4,963,878,84,786,757,735,78,73 4,77,94,839,783,744,75,693,675,66 45,49,895,88,75,73,683,66,64,66 5,6,87,784,77,687,657,634,65,599 45

226 Statsztka táblázatok VII. TÁBLÁZAT Az F-eloszlású változó eloszlásáak kvatls értéke α, ν ν ,5 99, 99,64 99,5 99,3 99,33 99,357 99,375 99, ,6 3,86 9,457 8,7 8,37 7,9 7,67 7,489 7,345 4,98 8, 6,694 5,977 5,5 5,7 4,976 4,799 4, ,58 3,74,6,39,967,67,456,89,58 6 3,745,95 9,78 9,48 8,746 8,466 8,6 8, 7,976 7,46 9,547 8,45 7,847 7,46 7,9 6,993 6,84 6,79 8,59 8,649 7,59 7,6 6,63 6,37 6,78 6,9 5,9 9,56 8, 6,99 6,4 6,57 5,8 5,63 5,467 5,35,44 7,559 6,55 5,994 5,636 5,386 5, 5,57 4,94 9,646 7,6 6,7 5,668 5,36 5,69 4,886 4,744 4,63 9,33 6,97 5,953 5,4 5,64 4,8 4,64 4,499 4, ,74 6,7 5,739 5,5 4,86 4,6 4,44 4,3 4,9 4 8,86 6,55 5,564 5,35 4,695 4,456 4,78 4,4 4,3 5 8,683 6,359 5,47 4,893 4,556 4,38 4,4 4,4 3, ,53 6,6 5,9 4,773 4,437 4, 4,6 3,89 3,78 7 8,4 6, 5,85 4,669 4,336 4, 3,97 3,79 3,68 8 8,85 6,3 5,9 4,579 4,48 4,5 3,84 3,75 3, ,85 5,96 5, 4,5 4,7 3,939 3,765 3,63 3,53 8,96 5,849 4,938 4,43 4,3 3,87 3,699 3,564 3, ,77 5,568 4,675 4,77 3,855 3,67 3,457 3,34 3,7 3 7,56 5,39 4,5 4,8 3,699 3,473 3,35 3,73 3, ,49 5,68 4,396 3,98 3,59 3,368 3, 3,69, ,34 5,78 4,33 3,88 3,54 3,9 3,4,993, ,34 5, 4,49 3,767 3,454 3,3 3,66,935,83 5 7,7 5,57 4,99 3,7 3,48 3,86 3,,89,785 46

227 F-eloszlás VII. TÁBLÁZAT (folytatás) Az F-eloszlású változó eloszlásáak kvatls értéke α, ν ν ,397 99,433 99,448 99,459 99,466 99,47 99,477 99,477 99, ,8 6,87 6,69 6,579 6,54 6,45 6,4 6,379 6, ,546 4,98 4,9 3,9 3,838 3,785 3,745 3,74 3,69 5,5 9,7 9,553 9,449 9,379 9,39 9,9 9,6 9,38 6 7,874 7,559 7,396 7,96 7,9 7,8 7,43 7,5 7,9 7 6,6 6,34 6,55 6,58 5,99 5,944 5,98 5,88 5, ,84 5,55 5,359 5,63 5,98 5,5 5,6 5,88 5,65 9 5,57 4,96 4,88 4,73 4,649 4,6 4,567 4,539 4,57 4,849 4,558 4,45 4,3 4,47 4, 4,65 4,38 4,5 4,539 4,5 4,99 4,5 3,94 3,895 3,86 3,83 3,8 4,96 4, 3,858 3,765 3,7 3,654 3,69 3,59 3, , 3,85 3,665 3,57 3,57 3,46 3,45 3,398 3, ,939 3,656 3,55 3,4 3,348 3,3 3,66 3,38 3,5 5 3,85 3,5 3,37 3,78 3,4 3,67 3,3 3,4 3,8 6 3,69 3,49 3,59 3,65 3, 3,54 3,8,99, ,593 3,3 3,6 3,68 3,3,956,9,89, ,58 3,7 3,77,983,99,87,835,87, ,434 3,53 3,3,99,844,797,76,73,79 3,368 3,88,938,843,778,73,695,666, ,9,85,699,64,538,49,453,44,4 3,979,7,549,453,386,337,99,69,45 35,876,597,445,348,8,3,93,6,37 4,8,5,369,7,3,53,4,83,58 45,743,464,3,3,44,93,54,3,997 5,698,49,65,67,98,46,7,975,949 47

228 Statsztka táblázatok VIII. TÁBLÁZAT DURBIN-WATSON-féle próba jobboldal krtkus értéke α,5 m m m 3 m 4 d L d U d L d U d L d U d L d U 5,77,36,946,543,84,75,685,977 6,6,37,98,539,857,78,734,935 7,33,38,5,536,897,7,779,9 8,58,39,46,535,933,69,8,87 9,8,4,74,536,967,685,859,848,,4,,537,998,676,894,88,,4,5,538,6,669,97,8,39,49,47,54,53,664,958,797 3,57,437,68,543,78,66,986,785 4,73,446,88,546,,656,3,775 5,88,454,6,55,3,654,38,767 6,3,46,4,553,43,65,6,759 7,36,469,4,556,6,65,84,753 8,38,476,55,56,8,65,4,747 9,34,483,7,563,98,65,4,743 3,35,489,84,567,4,65,43,739 35,4,59,343,584,83,653,,76 4,44,544,39,6,338,659,85,7 45,475,566,43,65,383,666,336,7 5,53,585,46,68,4,674,378,7 55,58,6,49,64,45,68,44,74 6,549,66,54,65,48,689,444,77 65,567,69,536,66,53,698,47,73 7,583,64,554,67,55,73,494,735 75,598,65,57,68,543,79,55,739 8,6,66,586,688,56,75,534,743 Forrás: Ecoometrca, 45, Nov

229 IX. TÁBLÁZAT DURBIN-WATSON-féle próba krtkus értéke DURBIN-WATSON-féle próba jobboldal krtkus értéke α, m m m 3 m 4 d L d U d L d U d L d U d L d U 5,8,7,7,5,59,464,488,74 6,844,86,737,5,633,446,53,663 7,874,,77,55,67,43,574,63 8,9,8,85,59,78,4,63,64 9,98,3,835,65,74,45,65,584,95,47,863,7,773,4,685,567,975,6,89,77,83,48,78,554,997,74,94,84,83,47,748,543 3,8,87,936,9,858,47,777,534 4,37,99,96,98,88,47,85,58 5,55,,98,35,96,49,83,53 6,7,,,3,98,4,855,58 7,89,33,9,39,949,43,878,55 8,4,44,37,35,969,45,9,53 9,9,54,54,33,988,48,9,5 3,33,63,7,339,6,4,94,5 35,95,37,4,37,85,439,8,5 4,46,344,98,398,48,457,98,58 45,88,376,45,43,,474,56,58 5,34,43,85,446,45,49,5,538 55,356,47,3,466,84,56,47,548 6,383,449,35,484,37,5,83,558 65,47,468,377,5,346,534,35,568 7,49,485,4,55,37,546,343,578 75,448,5,4,59,395,557,368,587 8,466,55,44,54,46,556,39,595 49

230 Irodalom 43

231 Dekger G.: Valószíűségszámítás, Nemzet Taköyvkadó, Budapest, 997. Irodalom Éltető Ö.-Meszéa Gy.-Zerma M.: Sztochasztkus módszerek és modellek, Közgazdaság és Jog Köyvkadó, Budapest, 98. Greee, W.H.: Ecoometrc Aalyss, Macmlla Publshg Compay, New York, 993. Huyad L.-Mudruczó Gy.-Vta L.: Statsztka, Aula Kadó, Budapest, 996. Kerékgyártó Gy.-Mudruczó Gy.: Statsztka módszerek a gazdaság elemzésbe, Aula Kadó, Budapest, 994. Köves P. Párczky G.: Általáos Statsztka, Közgazdaság és Jog Köyvkadó, Budapest, 98. Lukács O.: Matematka statsztka, Műszak Köyvkadó, Budapest, 987. Meszéa Gy.-Zerma M.: Valószíűségelmélet és matematka statsztka, Közgazdaság és Jog Köyvkadó, Budapest, 98. Mudruczó Gy.: Alkalmazott regresszószámítás, Akadéma Kadó, Budapest, 98. Ramaatha, R.: Itroductory Ecoometrcs (wth applcatos), Harcourt Brace, Orlado, 995. Spegel, M. R.: Statsztka (elmélet és gyakorlat), Paem-McGraw-Hll, Budapest, 995. Sváb J.: Többváltozós módszerek a bometrába, Mezőgazdaság Köyvkadó, Budapest,

? közgazdasági statisztika

? közgazdasági statisztika Valószíűségszámítás és a statsztka Valószíűség számítás Matematka statsztka Alkalmazott statsztka? közgazdaság statsztka épesség statsztka orvos statsztka Stb. Példa: vércsoportok Az eloszlás A AB B Elem

Részletesebben

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések! ORVOSI STATISZTIKA Az orvos statsztka helye Életta Aatóma Kéma Lehet kérdés?? Statsztka! Az orvos dötéseket hoz! Mkor jó egy dötés? Meyre helyes egy dötés? Mekkora a tévedés lehetősége? Példa: test hőmérséklet

Részletesebben

Statisztika. Eloszlásjellemzők

Statisztika. Eloszlásjellemzők Statsztka Eloszlásjellemzők Statsztka adatok elemzése A sokaság jellemzése középértékekkel A sokaság jellemzéséek szempotja A sokaság jellemzéséek szempotja: A sokaság tpkus értékéek meghatározása. Az

Részletesebben

Megállapítható változók elemzése Függetlenségvizsgálat, illeszkedésvizsgálat, homogenitásvizsgálat

Megállapítható változók elemzése Függetlenségvizsgálat, illeszkedésvizsgálat, homogenitásvizsgálat Megállapítható változók elemzése Függetleségvzsgálat, lleszkedésvzsgálat, homogetásvzsgálat Ordáls, omáls esetre s alkalmazhatóak a következő χ próbá alapuló vzsgálatok: 1) Függetleségvzsgálat: két valószíűség

Részletesebben

AZ OPTIMÁLIS MINTANAGYSÁG A KAPCSOLÓDÓ KÖLTSÉGEK ÉS BEVÉTELEK RELÁCIÓJÁBAN

AZ OPTIMÁLIS MINTANAGYSÁG A KAPCSOLÓDÓ KÖLTSÉGEK ÉS BEVÉTELEK RELÁCIÓJÁBAN AZ OPTIMÁLIS MINTANAGYSÁG A KAPCSOLÓDÓ KÖLTSÉGEK ÉS BEVÉTELEK RELÁCIÓJÁBAN Molár László Ph.D. hallgató Mskolc Egyetem, Gazdaságelmélet Itézet 1. A MINTANAGYSÁG MEGHATÁROZÁSA EGYSZERŐ VÉLETLEN (EV) MINTA

Részletesebben

Matematikai statisztika

Matematikai statisztika Matematka statsztka 8. elıadás http://www.math.elte.hu/~arato/matstat0.htm Kétmtás eset: függetle mták + + + = + ) ( ) ( ) ( Y Y X X Y X m m m t m Ha smert a szórás: (X elemő, σ szórású, Y m elemő, σ szórású),

Részletesebben

Feladatok és megoldások a 11. heti gyakorlathoz

Feladatok és megoldások a 11. heti gyakorlathoz Feladatok és megoldások a. het gyakorlathoz dszkrét várható érték Építőkar Matematka A. Egy verseye öt ő és öt férf verseyző dul. Tegyük fel, hogy cs két azoos eredméy, és md a 0! sorred egyformá valószíű.

Részletesebben

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük. Statisztikai módszerek. BMEGEVGAT01 Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudomáyi Egyetem Gépészméröki Kar Hidrodiamikai Redszerek Taszék 1111, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:

Részletesebben

A heteroszkedaszticitásról egyszerûbben

A heteroszkedaszticitásról egyszerûbben Mûhely Huyad László kaddátus, egyetem taár, a Statsztka Szemle főszerkesztője A heteroszkedasztctásról egyszerûbbe E-mal: [email protected] A heteroszkedasztctás az ökoometra modellezés egyk kulcsfogalma,

Részletesebben

A paramétereket kísérletileg meghatározott yi értékekre támaszkodva becsülik. Ha n darab kisérletet (megfigyelést, mérést) végeznek, n darab

A paramétereket kísérletileg meghatározott yi értékekre támaszkodva becsülik. Ha n darab kisérletet (megfigyelést, mérést) végeznek, n darab öbbváltozós regresszók Paraméterbecslés-. A paraméterbecslés.. A probléma megfogalmazása A paramétereket kísérletleg meghatározott y értékekre támaszkodva becsülk. Ha darab ksérletet (megfgyelést, mérést

Részletesebben

Azonos névleges értékű, hitelesített súlyokból alkotott csoportok együttes mérési bizonytalansága

Azonos névleges értékű, hitelesített súlyokból alkotott csoportok együttes mérési bizonytalansága Azoos évleges értékű, htelesített súlyokból alkotott csoportok együttes mérés bzoytalasága Zeleka Zoltá* Több mérés feladatál alkalmazak súlyokat. Sokszor ezek em egyekét, haem külöböző társításba kombácókba

Részletesebben

BIOMATEMATIKA ELŐADÁS

BIOMATEMATIKA ELŐADÁS BIOMATEMATIKA ELŐADÁS 10. A statisztika alapjai Debrecei Egyetem, 2015 Dr. Bérczes Attila, Bertók Csaád A diasor tartalma 1 Bevezetés 2 Statisztikai függvéyek Defiíció, empirikus várható érték Empirikus

Részletesebben

Tartalomjegyzék. 4.3 Alkalmazás: sorozatgyártású tűgörgő átmérőjének jellemzése

Tartalomjegyzék. 4.3 Alkalmazás: sorozatgyártású tűgörgő átmérőjének jellemzése 3 4 Tartalomegyzék. BEVEZETÉS 5. A MÉRÉS 8. A mérés mt folyamat, fogalmak 8. Fotosabb mérés- és műszertechka fogalmak 4.3 Mérés hbák 8.3. Mérés hbák csoportosítása eredetük szert 8.3. A hbák megeleítés

Részletesebben

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum) Az átlagra voatkozó megbízhatósági itervallum (kofidecia itervallum) Határozzuk meg körül azt az itervallumot amibe előre meghatározott valószíűséggel esik a várható érték (µ). A várható értéket potosa

Részletesebben

MINTAVÉTEL A MARKETINGKUTATÁSBAN, KÜLÖNÖS TEKINTETTEL A DIVIZÍV ÉS AZ AGGLOMERATÍV RÉTEGZÉSRE

MINTAVÉTEL A MARKETINGKUTATÁSBAN, KÜLÖNÖS TEKINTETTEL A DIVIZÍV ÉS AZ AGGLOMERATÍV RÉTEGZÉSRE MINTAVÉTEL A MARKETINGKUTATÁSBAN, KÜLÖNÖS TEKINTETTEL A DIVIZÍV ÉS AZ AGGLOMERATÍV RÉTEGZÉSRE Molár László egyetem taársegéd 1. BEVEZETÉS A statsztkusok a mtaagyság meghatározására számos módszert dolgoztak

Részletesebben

Hipotéziselmélet. Statisztikai próbák I. Statisztikai próbák II. Informatikai Tudományok Doktori Iskola

Hipotéziselmélet. Statisztikai próbák I. Statisztikai próbák II. Informatikai Tudományok Doktori Iskola Hpotézselmélet Iformatka Tudomáyok Doktor Iskola Statsztka próbák I. 0.0.. Dr Ketskeméty László előadása Statsztka próbák II. Dötés eljárást dolgozuk k aak eldötésére, hogy a ullhpotézs gaz-e. Ha úgy kell

Részletesebben

A MATEMATIKAI STATISZTIKA ELEMEI

A MATEMATIKAI STATISZTIKA ELEMEI A MATEMATIKAI STATISZTIKA ELEMEI Az Eötvös Lórád Tudomáyegyetem Természettudomáy Kará a Fzka Kéma Taszék évek óta kéma-szakos taárhallgatókak matematka bevezetõ elõadásokat tart. Az elõadások célja az,

Részletesebben

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje. 24. tétel valószíűségszámítás elemei. valószíűség kiszámításáak kombiatorikus modellje. GYORISÁG ÉS VLÓSZÍŰSÉG meyibe az egyes adatok a sokaságo belüli részaráyát adjuk meg (törtbe vagy százalékba), akkor

Részletesebben

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet A biostatisztika alapfogalmai, kofideciaitervallum Dr. Boda Krisztia PhD SZTE ÁOK Orvosi Fizikai és Orvosi Iformatikai Itézet Mitavétel ormális eloszlásból http://www.ruf.rice.edu/~lae/stat_sim/idex.html

Részletesebben

A matematikai statisztika elemei

A matematikai statisztika elemei A matematikai statisztika elemei Mikó Teréz, dr. Szalkai Istvá [email protected] Pao Egyetem, Veszprém 2014. március 23. 2 Tartalomjegyzék Tartalomjegyzék 3 Bevezetés................................

Részletesebben

Ismérvek közötti kapcsolatok szorosságának vizsgálata. 1. Egy kis ismétlés: mérési skálák (Hunyadi-Vita: Statisztika I. 25-26. o)

Ismérvek közötti kapcsolatok szorosságának vizsgálata. 1. Egy kis ismétlés: mérési skálák (Hunyadi-Vita: Statisztika I. 25-26. o) Ismérvek között kapcsolatok szorosságáak vzsgálata 1. Egy ks smétlés: mérés skálák (Huyad-Vta: Statsztka I. 5-6. o) A külöböző smérveket, eltérő mérés sztekkel (skálákkal) ellemezhetük. a. évleges (omáls)

Részletesebben

Statisztika 1. zárthelyi dolgozat március 21.

Statisztika 1. zárthelyi dolgozat március 21. Statisztika 1 zárthelyi dolgozat 011 március 1 1 Legye X = X 1,, X 00 függetle mita b paraméterű Poisso-eloszlásból b > 0 Legye T 1 X = X 1+X ++X 100, T 100 X = X 1+X ++X 00 00 a Milye a számra igaz, hogy

Részletesebben

Miért pont úgy kombinálja kétfokozatú legkisebb négyzetek módszere (2SLS) az instrumentumokat, ahogy?

Miért pont úgy kombinálja kétfokozatú legkisebb négyzetek módszere (2SLS) az instrumentumokat, ahogy? Mért pot úgy kombálja kétfokozatú legksebb égyzetek módszere (2SLS az strumetumokat, ahogy? Kézrat A Huyad László 60. születésapjára készülő köyvbe Kézd Gábor 2004. júlus A Budapest Corvus Egyetem rövd

Részletesebben

VII. A határozatlan esetek kiküszöbölése

VII. A határozatlan esetek kiküszöbölése A határozatla esetek kiküszöbölése 9 VII A határozatla esetek kiküszöbölése 7 A l Hospital szabály A véges övekedések tétele alapjá egy függvéy értékét egy potba közelíthetjük az köryezetébe felvett valamely

Részletesebben

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika BIOSTATISZTIKA ÉS INFORMATIKA Leíró statisztika Első közelítésbe a statisztikai tevékeységeket égy csoportba sorolhatjuk, de ezek között ics éles határ:. adatgyűjtés, 2. az adatok áttekithetővé tétele,

Részletesebben

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó. I. Függelék A valószíűségszámítás alapjai I.1. Alapfogalamak: Véletle jeleség: létrejöttét befolyásoló összes téyezőt em ismerjük. Tömegjeleség: a jeleség adott feltételek mellett akárháyszor megismételhető.

Részletesebben

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben Propositio 1 (Jese-egyelőtleség Ha f : kovex, akkor tetszőleges ξ változóra f (M (ξ M (f (ξ feltéve, hogy az egyelőtleségbe szereplő véges vagy végtele várható értékek létezek Bizoyítás: Megjegyezzük,

Részletesebben

Statisztika II. előadás és gyakorlat 2. rész

Statisztika II. előadás és gyakorlat 2. rész előadás és gyakorlat. rész T.Nagy Judt Ajálott rodalom: Ilyésé Molár Emese Lovasé Avató Judt: Feladatgyűjteméy, Perekt, 006. Korpás Attláé (szerk.): Általáos, Nemzet Taköyvkadó, 1997. Molár Mátéé Tóth

Részletesebben

A pályázat címe: Rugalmas-képlékeny tartószerkezetek topológiai optimalizálásának néhány különleges feladata

A pályázat címe: Rugalmas-képlékeny tartószerkezetek topológiai optimalizálásának néhány különleges feladata 6. év OTKA zárójeletés: Vezető kutató:kalszky Sádor OTKA ylvátartás szám T 4993 A pályázat címe: Rugalmas-képlékey tartószerkezetek topológa optmalzálásáak éháy külöleges feladata (Részletes jeletés) Az

Részletesebben

Adatfeldolgozás, adatértékelés. Dr. Szűcs Péter, Dr. Madarász Tamás Miskolci Egyetem, Hidrogeológiai Mérnökgeológiai Tanszék

Adatfeldolgozás, adatértékelés. Dr. Szűcs Péter, Dr. Madarász Tamás Miskolci Egyetem, Hidrogeológiai Mérnökgeológiai Tanszék Adatfeldolgozás, adatértékelés Dr. Szűcs Péter, Dr. Madarász Tamás Mskolc Egyetem, Hdrogeológa Mérökgeológa Taszék A vzsgált köryezet elemek, lletve a felszí alatt közeg megsmerése céljából számtala külöböző

Részletesebben

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai 05..04. szórások vizsgálata z F-próba Hogya foguk hozzá? Nullhipotézis: a két szórás azoos, az eltérés véletle (mitavétel). ullhipotézishez tartozik egy ú. F-eloszlás. Szabadsági fokok: számláló: - evező:

Részletesebben

Példák 2. Teljes eseményrendszer. Tulajdonságok. Példák diszkrét valószínőségi változókra

Példák 2. Teljes eseményrendszer. Tulajdonságok. Példák diszkrét valószínőségi változókra Valószíőségszámítás és statsztka elıadás fo. BSC/B-C szakosokak 3. elıadás Szeptember 28 dszkrét valószíőség változókra X(ω)=c mde ω-ra. Elevezés: elfajult eloszlás. P(X=c)=1. X akkor 1, ha egy adott,

Részletesebben

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések! ORVOSI STATISZTIKA Az orvos statsztka helye Élettan Anatóma Kéma Lehet kérdés?? Statsztka! Az orvos döntéseket hoz! Mkor jó egy döntés? Mennyre helyes egy döntés? Mekkora a tévedés lehetősége? Példa: test

Részletesebben

Tulajdonságok. Teljes eseményrendszer. Valószínőségi változók függetlensége. Példák, szimulációk

Tulajdonságok. Teljes eseményrendszer. Valószínőségi változók függetlensége. Példák, szimulációk Valószíőségszámítás és statsztka elıadás fo. BSC/B-C szakosokak 3. elıadás Szeptember 26 p 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 A bomáls és a hpergeom. elo. összehasolítása 0 1 2 3 4 5 6 7 8 9 10 k Hp.geom

Részletesebben

Matematikai statisztika

Matematikai statisztika Matematikai statisztika PROGRAMTERVEZŐ INFORMATIKUS alapszak, A szakiráy Arató Miklós Valószíűségelméleti és Statisztika Taszék Természettudomáyi Kar 2019. február 18. Arató Miklós (ELTE) Matematikai statisztika

Részletesebben

ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június ÖKONOMETIA Készült a TÁMOP-4.1.-08//A/KM-009-0041pályázat projet eretébe Tartalomfejlesztés az ELTE TáTK Közgazdaságtudomáy Taszéé az ELTE Közgazdaságtudomáy Taszé az MTA Közgazdaságtudomáy Itézet és a

Részletesebben

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat Kísérlettervezés - biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert u-próba Feltétel: egy ormális eloszlású sokaság σ variaciájáak számszerű értéke ismert. Hipotézis: a sokaság µ várható értéke

Részletesebben

Izsák János. ELTE TTK Állatrendszertani és Ökológiai Tanszék. Kézirat

Izsák János. ELTE TTK Állatrendszertani és Ökológiai Tanszék. Kézirat BIOSTATISZTIKAI ALAPISMERETEK Izsák Jáos ELTE TTK Állatredszerta és Ökológa Taszék Kézrat Budapest, 5 Tartalomjegyzék Előszó 4. Valószíűség vektorváltozók 6.. Bevezetés 6.. A többváltozós, specálsa kétváltozós

Részletesebben

Ökonometria. /Elméleti jegyzet/

Ökonometria. /Elméleti jegyzet/ Ökoometra /Elmélet jegyzet/ Ökoometra /Elmélet jegyzet/ Szerző: Nagy Lajos Debrece Egyetem Gazdálkodástudomáy és Vdékfejlesztés Kar (1.,., 3., 4., 5., 6., és 9. fejezet) Balogh Péter Debrece Egyetem Gazdálkodástudomáy

Részletesebben

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet): A umerikus sorozatok fogalma, határértéke (A TÁMOP-4-8//A/KMR-9-8 számú projekt keretébe írt egyetemi jegyzetrészlet): Koverges és diverges sorozatok Defiíció: A természetes számoko értelmezett N R sorozatokak

Részletesebben

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x

Részletesebben

Sztochasztikus tartalékolás és a tartalék függése a kifutási háromszög időperiódusától

Sztochasztikus tartalékolás és a tartalék függése a kifutási háromszög időperiódusától Sztochasztkus tartalékolás és a tartalék függése a kfutás háromszög dőperódusától Faluköz Tamás Vtéz Ildkó Ibola Kozules: r. Arató Mklós ELTETTK Budapest IBNR kfutás háromszög IBNR: curred but ot reported

Részletesebben

Mérési adatok feldolgozása. 2008.04.08. Méréselmélet PE_MIK MI_BSc, VI_BSc 1

Mérési adatok feldolgozása. 2008.04.08. Méréselmélet PE_MIK MI_BSc, VI_BSc 1 Mérés adatok feldolgozása 2008.04.08. Méréselmélet PE_MIK MI_BSc, VI_BSc Bevezetés A mérés adatok külöböző formába, általába ömlesztve jeleek meg Ezeket az adatokat külöböző szempotok szert redez kértékel

Részletesebben

GEOFIZIKA / 4. GRAVITÁCIÓS ANOMÁLIÁK PREDIKCIÓJA, ANALITIKAI FOLYTATÁSOK MÓDSZERE, GRAVITÁCIÓS ANOMÁLIATEREK SZŰRÉSE

GEOFIZIKA / 4. GRAVITÁCIÓS ANOMÁLIÁK PREDIKCIÓJA, ANALITIKAI FOLYTATÁSOK MÓDSZERE, GRAVITÁCIÓS ANOMÁLIATEREK SZŰRÉSE MSc GEOFIZIKA / 4. BMEEOAFMFT3 GRAVITÁCIÓS ANOMÁLIÁK REDIKCIÓJA, ANALITIKAI FOLYTATÁSOK MÓDSZERE, GRAVITÁCIÓS ANOMÁLIATEREK SZŰRÉSE A gravtácós aomálák predkcója Külöböző feladatok megoldása sorá - elsősorba

Részletesebben

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat. Zavar és mita Zavar (cofoudig): akkor lép fel egy kísérletbe, ha a kísérletet végző em tudja megkülöbözteti az egyes faktorokat. Zavar és mita Zavar (cofoudig): akkor lép fel egy kísérletbe, ha a kísérletet

Részletesebben

Statisztikai. Statisztika Sportszervező BSc képzés NBG GI866G4. Statisztika fogalma. Statisztikai alapfogalmak. Statisztika fogalma

Statisztikai. Statisztika Sportszervező BSc képzés NBG GI866G4. Statisztika fogalma. Statisztikai alapfogalmak. Statisztika fogalma Statsztka Sportszervező BSc képzés NBG GI866G4 010-011-es taév II félév Statsztka alapfogalmak Oktató: Dr Csáfor Hajalka főskola doces Vállalkozás-gazdaságta Tsz E-mal: hcsafor@ektfhu Statsztka alapfogalmak

Részletesebben

2. fejezet. Számsorozatok, számsorok

2. fejezet. Számsorozatok, számsorok . fejezet Számsorozatok, számsorok .. Számsorozatok és számsorok... Számsorozat megadása, határértéke Írjuk fel képlettel az alábbi sorozatok -dik elemét! mooto, korlátos, illetve koverges-e! Vizsgáljuk

Részletesebben

Ha n darab standard normális eloszlású változót négyzetesen összegzünk, akkor kapjuk a χ 2 - eloszlást: N

Ha n darab standard normális eloszlású változót négyzetesen összegzünk, akkor kapjuk a χ 2 - eloszlást: N Krály Zoltá: Statsztka II. Bevezetés A paraméteres eljárások alkalmazásához, a célváltozóra ézve szgorú feltételek szükségesek (folytoosság, ormaltás, szóráshomogetás), ekkor a hpotézseket egy-egy paraméterre

Részletesebben

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás. Statsztka próbák Paraméteres. A populácó paraméteret becsüljük, ezekkel számolunk.. Az alapsokaság eloszlására van kkötés. Nem paraméteres Nncs lyen becslés Nncs kkötés Ugyanazon problémára sokszor megvan

Részletesebben

VASBETON ÉPÜLETEK MEREVÍTÉSE

VASBETON ÉPÜLETEK MEREVÍTÉSE BUDAPET MŰZAK É GAZDAÁGTUDOMÁY EGYETEM Építőmérök Kar Hdak és zerkezetek Taszéke VABETO ÉPÜLETEK MEREVÍTÉE Oktatás segédlet v. Összeállította: Dr. Bód stvá - Dr. Farkas György Dr. Kors Kálmá Budapest,.

Részletesebben

Statisztika elméleti összefoglaló

Statisztika elméleti összefoglaló 1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11

Részletesebben

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak. 8. GYAKORLAT STATISZTIKAI PRÓBÁK ISMÉTLÉS: Tanult nem paraméteres próbák, és hogy mlyen probléma megoldására szolgálnak. Név Illeszkedésvzsgálat Χ próbával Illeszkedésvzsgálat grafkus úton Gauss papírral

Részletesebben

Dr. Tóth Zsuzsanna Eszter Dr. Jónás Tamás Erdei János. Gazdaságstatisztika. II. rész A matematikai statisztika alapjai

Dr. Tóth Zsuzsanna Eszter Dr. Jónás Tamás Erdei János. Gazdaságstatisztika. II. rész A matematikai statisztika alapjai Budapest Műszak és Gazdaságtudomáy Egyetem Gazdaság- és Társadalomtudomáy Kar Üzlet Tudomáyok Itézet Meedzsmet és Vállalatgazdaságta Taszék Dr. Tóth Zsuzsaa Eszter Dr. Jóás Tamás Erde Jáos Gazdaságstatsztka

Részletesebben

1. A radioaktivitás statisztikus jellege

1. A radioaktivitás statisztikus jellege A radioaktivitás időfüggése 1. A radioaktivitás statisztikus jellege Va N darab azoos radioaktív atomuk, melyekek az atommagja spotá átalakulásra képes. tegyük fel, hogy ezek em bomlaak tovább. Ekkor a

Részletesebben

Backtrack módszer (1.49)

Backtrack módszer (1.49) Backtrack módszer A backtrack módszer kombatorkus programozás eljárás, mely emleárs függvéy mmumát keres feltételek mellett, szsztematkus kereséssel. A módszer előye, hogy csak dszkrét változókat kezel,

Részletesebben

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő.

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő. 3. SOROZATOK 3. Sorozatok korlátossága, mootoitása, kovergeciája Defiíció. Egy f : N R függvéyt valós szám)sorozatak evezük. Ha A egy adott halmaz és f : N A, akkor f-et A-beli értékű) sorozatak evezzük.

Részletesebben

A brexit-szavazás és a nagy számok törvénye

A brexit-szavazás és a nagy számok törvénye Mûhely Medvegyev Péter kadidátus, a Corvius Egyetem egyetemi taára E-mail: [email protected] A brexit-szavazás és a agy számok törvéye A 016. év, de vélhetőe az egész évtized legfotosabb politikai

Részletesebben

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer? 01.09.18. Hpotézs vzsgálatok Egy példa Kérdések (példa) Hogyan adhatunk választ? Kérdés: Hatásos a lázcsllapító gyógyszer? Hatásos-e a gyógyszer?? rodalomból kísérletekből Hpotézsek A megfgyelt változó

Részletesebben

Geostatisztika I. Dr. Szabó Norbert Péter. BSc geográfus alapszak hallgatóinak

Geostatisztika I. Dr. Szabó Norbert Péter. BSc geográfus alapszak hallgatóinak Geostatsztka I. BSc geográfus alapszak hallgatóak Dr. Szabó Norbert Péter egyetem adjuktus Mskolc Egyetem Geofzka Itézet Taszék e-mal: [email protected] Ajálott rodalom Steer Ferec, 990. A geostatsztka

Részletesebben

MÉRÉSTECHNIKA. DR. HUBA ANTAL c. egy. tanár BME Mechatronika, Optika és Gépészeti Informatika Tanszék 2011

MÉRÉSTECHNIKA. DR. HUBA ANTAL c. egy. tanár BME Mechatronika, Optika és Gépészeti Informatika Tanszék 2011 MÉRÉSTECHNIKA DR. HUBA ANTAL c. egy. taár BME Mechatroka, Optka és Gépészet Iformatka Taszék 0 Rövde a tárgyprogramról Előadások tematkája: Metrológa és műszertechka alapok Mérés adatok kértékelése Időbe

Részletesebben

Intelligens adatelemzés ea. vázlat 1. rész

Intelligens adatelemzés ea. vázlat 1. rész Itellges adatelemzés ea. vázlat. rész A tematka.ea. a tárgy tematkájáak áttektése. Egy mtaélda M-S adatok elemzése (A)..ea. HF-ok jellegéek megbeszélése, a HF témák választásához szemotok 3.ea. Statsztka

Részletesebben

Statisztika 1. zárthelyi dolgozat március 18.

Statisztika 1. zárthelyi dolgozat március 18. Statisztika. zárthelyi dolgozat 009. március 8.. Ismeretle m várható értékű, szórású ormális eloszlásból a következő hatelemű mitát kaptuk:, 48 3, 3, 83 0,, 3, 97 a) Számítsuk ki a mitaközepet és a tapasztalati

Részletesebben

13. Tárcsák számítása. 1. A felületszerkezetek. A felületszerkezetek típusai

13. Tárcsák számítása. 1. A felületszerkezetek. A felületszerkezetek típusai Tárcsák számítása A felületszerkezetek A felületszerkezetek típusa A tartószerkezeteket geometra méretek alapjá osztálozzuk Az eddg taulmáakba szereplı rúdszerkezetek rúdjara az a jellemzı hog a hosszuk

Részletesebben

1. előadás: Bevezetés. Irodalom. Számonkérés. A valószínűségszámítás és a statisztika tárgya. Cél

1. előadás: Bevezetés. Irodalom. Számonkérés. A valószínűségszámítás és a statisztika tárgya. Cél Valószíűségszámítás és statsztka előadás fo. BSC/B-C szakosokak 1. előadás szeptember 13. 1. előadás: Bevezetés Irodalom, követelméyek A félév célja Valószíűségszámítás tárgya Törtéet Alapfogalmak Valószíűségek

Részletesebben

Tapasztalati eloszlás. Kumulált gyakorisági sorok. Példa. Értékösszegsor. Grafikus ábrázolás

Tapasztalati eloszlás. Kumulált gyakorisági sorok. Példa. Értékösszegsor. Grafikus ábrázolás Matemata statszta elıadás III. éves elemzı szaosoa 009/00. élév. elıadás Tapasztalat eloszlás Mde meggyeléshez (,,, ) / súlyt redel. Valószíőségeloszlás! Mtaátlag éppe ee az eloszlása a várható értée.

Részletesebben

Regresszió és korreláció

Regresszió és korreláció Regresszó és korrelácó regresso: vsszatérés, hátrálás; vsszafordulás correlato: vszo, összefüggés, kölcsöösség KAD 01.11.1 1 (vsszatérés, hátrálás; vsszafordulás) Regresszó és korrelácó Gakorlat megközelítés

Részletesebben

4 2 lapultsági együttható =

4 2 lapultsági együttható = Leíró statsztka Egy kísérlet végeztével általában tetemes mennységű adat szokott összegyűln. Állandó probléma, hogy mt s kezdjünk - lletve mt tudunk kezden az adatokkal. A statsztka ebben segít mnket.

Részletesebben

Statisztikai hipotézisvizsgálatok

Statisztikai hipotézisvizsgálatok Statisztikai hipotézisvizsgálatok. Milye problémákál haszálatos? A gyakorlatba agyo gyakra szükségük lehet arra, hogy mitákból származó iformációk alapjá hozzuk sokaságra voatkozó dötéseket. Például egy

Részletesebben

3.1. A Poisson-eloszlás

3.1. A Poisson-eloszlás Harmadik fejezet Nevezetes valószíűségi változók Valamely valószíűségi változóhoz kapcsolódó kérdésekre akkor tuduk potos választ adi, ha a változó eloszlása ismert, vagy megközelítőleg ismert. Ebbe a

Részletesebben

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes

Részletesebben

( a b)( c d) 2 ab2 cd 2 abcd 2 Egyenlőség akkor és csak akkor áll fenn

( a b)( c d) 2 ab2 cd 2 abcd 2 Egyenlőség akkor és csak akkor áll fenn Feladatok közepek közötti egyelőtleségekre (megoldások, megoldási ötletek) A továbbiakba szmk=számtai-mértai közép közötti egyelőtleség, szhk=számtaiharmoikus közép közötti egyelőtleség, míg szk= számtai-égyzetes

Részletesebben

2. Az együttműködő villamosenergia-rendszer teljesítmény-egyensúlya

2. Az együttműködő villamosenergia-rendszer teljesítmény-egyensúlya II RÉZ 2 EJEZE 2 Az együttműködő vllamoseerga-redszer teljesítméy-egyesúlya 2 A frekveca és a hatásos teljesítméy között összefüggés A fogyasztó alredszerbe a fogyasztók hatásos wattos teljesítméyt lletve

Részletesebben

A figurális számokról (IV.)

A figurális számokról (IV.) A figurális számokról (IV.) Tuzso Zoltá, Székelyudvarhely A továbbiakba külöféle számkombiációk és összefüggések reprezetálásáról, és bizoyos összegek kiszámolásáról íruk. Sajátos összefüggések Az elekbe

Részletesebben

2012.03.01. Méréselmélet PE_MIK MI_BSc, VI_BSc 1

2012.03.01. Méréselmélet PE_MIK MI_BSc, VI_BSc 1 Mérés adatok feldolgozása 202.03.0. Méréselmélet PE_MIK MI_BSc, VI_BSc Bevezetés A mérés adatok külöböző formába, általába ömlesztve jeleek meg Ezeket az adatokat külöböző szempotok szert redez kértékel

Részletesebben

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik. Számsorozatok 2015. december 22. 1. Alapfeladatok 1. Feladat: Határozzuk meg az a 2 + 7 5 2 + 4 létezik. sorozat határértékét, ha Megoldás: Mivel egy tört határértéke a kérdés, ezért vizsgáljuk meg el

Részletesebben

KTK. Dr. Herman Sándor Dr. Rédey Katalin. Statisztika I. PÉCSI TUDOMÁNYEGYETEM. Közgazdaságtudományi Kar. Alapítva: 1970

KTK. Dr. Herman Sándor Dr. Rédey Katalin. Statisztika I. PÉCSI TUDOMÁNYEGYETEM. Közgazdaságtudományi Kar. Alapítva: 1970 Dr. Herma Sádor Dr. Rédey Katal Statsztka I. PÉCSI TUDOMÁNYEGYETEM KTK Közgazdaságtudomáy Kar Alapítva: 97 Mde jog fetartva. Jele köyvet vagy aak részletet a szerző egedélye élkül bármlye formába vagy

Részletesebben

Laboratóriumi mérések

Laboratóriumi mérések Laboratórum mérések. Bevezetı Bármlye mérés ayt jelet, mt meghatároz, háyszor va meg a méredı meységbe egy másk, a méredıvel egyemő, ökéyese egységek választott meység. Egy mérés eredméyét tehát két adat

Részletesebben

Matematika I. 9. előadás

Matematika I. 9. előadás Matematika I. 9. előadás Valós számsorozat kovergeciája +-hez ill. --hez divergáló sorozatok A határérték és a műveletek kapcsolata Valós számsorozatok mootoitása, korlátossága Komplex számsorozatok kovergeciája

Részletesebben

I. Valószínűségelméleti és matematikai statisztikai alapok

I. Valószínűségelméleti és matematikai statisztikai alapok I. Valószíűségelmélet és matematka statsztka alapok. A szükséges valószíűségelmélet és matematka statsztka alapsmeretek összefoglalása Az alkalmazott statsztka módszerek tárgalása, amel e kötet célja,

Részletesebben

A Secretary problem. Optimális választás megtalálása.

A Secretary problem. Optimális választás megtalálása. A Secretary problem. Optmáls választás megtalálása. A Szdbád problémáa va egy szté lasszusa tethető talá természetesebb vszot ehezebb változata. Ez a övetező Secretary problem -a evezett érdés: Egy állásra

Részletesebben

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak Valószíűségszámítás és statisztika előadás ifo. BSC/B-C szakosokak 6. előadás október 16. A matematikai statisztika tárgya Következtetések levoása adatok alapjá Ipari termelés Mezőgazdaság Szociológia

Részletesebben

A sokaság/minta eloszlásának jellemzése

A sokaság/minta eloszlásának jellemzése 3. előadás A sokaság/mnta eloszlásának jellemzése tpkus értékek meghatározása; az adatok különbözőségének vzsgálata, a sokaság/mnta eloszlásgörbéjének elemzése. Eloszlásjellemzők Középértékek helyzet (Me,

Részletesebben

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés A m és az átlag Standard hba Mnta átlag 1 170 Az átlagok szntén ngadoznak a m körül. s x s n Az átlagok átlagos eltérése a m- től! 168 A m konfdenca ntervalluma. 3 166 4 173 x s x ~ 68% ~68% annak a valószínűsége,

Részletesebben

6. feladatsor. Statisztika december 6. és 8.

6. feladatsor. Statisztika december 6. és 8. 6. feladatsor Statisztika 200. december 6. és 8.. Egy = 0 szervert tartalmazó kiszolgáló mide szervere mide pillaatba 0 < p < valószíűséggel foglalt, a foglaltságok szerverekét függetleek. Tehát a foglaltak

Részletesebben

BEVEZETÉS AZ SPSS ALAPJAIBA. (Belső használatra)

BEVEZETÉS AZ SPSS ALAPJAIBA. (Belső használatra) BEVEZETÉS AZ SPSS ALAPJAIBA (Belső haszálatra) TARTALOMJEGYZÉK. Statsztka alapfogalmak..... Sokaság...4.2. Ismérvek és mérés skálák...6.3. Statsztka sorok...7 2. SPSS alapfogalmak...9 3. Alapvető statsztka

Részletesebben

VÉLETLENÍTETT ALGORITMUSOK. 1.ea.

VÉLETLENÍTETT ALGORITMUSOK. 1.ea. VÉLETLENÍTETT ALGORITMUSOK 1.ea. 1. Bevezetés - (Mire jók a véletleített algoritmusok, alap techikák) 1.1. Gyorsredezés Vegyük egy ismert példát, a redezések témaköréből, méghozzá a gyorsredezés algoritmusát.

Részletesebben