Ökonometria. /Elméleti jegyzet/

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Ökonometria. /Elméleti jegyzet/"

Átírás

1 Ökoometra /Elmélet jegyzet/

2 Ökoometra /Elmélet jegyzet/ Szerző: Nagy Lajos Debrece Egyetem Gazdálkodástudomáy és Vdékfejlesztés Kar (1.,., 3., 4., 5., 6., és 9. fejezet) Balogh Péter Debrece Egyetem Gazdálkodástudomáy és Vdékfejlesztés Kar (7., 8., 10., 11., 1., 13., és 14. fejezet) Szerkesztő: Nagy Lajos Balogh Péter Lektor: Szűcs Istvá Szet Istvá Egyetem Debrece Egyetem Gazdálkodástudomáy és Vdékfejlesztés Kar Pao Egyetem Georgko Kar Debrece Egyetem, AGTC Debrece, 013 Nagy Lajos, Balogh Péter 013

3 Kézrat lezárva: 013. május 30. ISBN DEBRECENI EGYETEM AGRÁR- ÉS GAZDÁLKODÁSTUDOMÁNYOK CENTRUMA A kadváy a TÁMOP-4.1..A/1-11/ projekt keretébe készült. 3

4 TARTALOMJEGYZÉK Előszó Az ökoometra törtéete, célja, gazdaságelmélet, matematka és valószíűség számítás háttere Az ökoometra fogalma, célja, rövd törtéet áttektés Matematka és valószíűség számítás háttér Az ökoometrába leggyakrabba alkalmazott eloszlástípusok Dszkrét eloszlások Folytoos eloszlások Összefoglalás... 6 Elleőrző kérdések... 6 Leíró statsztka áttektés Statsztka alapfogalmak Sokaság Ismérvek és mérés skálák Statsztka sorok Középértékek Számított középértékek Helyzet középértékek Változékoyság A szóródás terjedelme Kvatls értékek Középeltérés Abszolút átlageltérés Varaca Szórás Relatív szórás vagy varácós koeffces Átlagos külöbség A mometumok Alakmutatók Aszmmetra Lapultság, csúcsosság A szélsőséges adatok kezelése Összefoglalás Elleőrző kérdések Statsztka hpotézs vzsgálatok Nem-paraméteres statsztka próbák Eloszlásokra voatkozó próbák (Ch - próba) Paraméteres statsztka próbák Középértékekre voatkozó próbák Szórásokra, varacákra voatkozó statsztka próbák Összefoglalás Elleőrző kérdések Kétváltozós sztochasztkus kapcsolatok A jeleségek között kapcsolat erősségéek vzsgálata Regresszó-aalízs Kétváltozós leárs regresszó Összefoglalás

5 Elleőrző kérdések Kompetecát fejlesztő kérdések Nem leárs kétváltozós kapcsolatok Korrelácós dex Hatváyktevős regresszó Expoecáls regresszó Másodfokú függvéy (parabola) Összefoglalás Elleőrző kérdések: Kompetecát fejlesztő kérdések: Többváltozós leárs kapcsolatok és az ezzel kapcsolatos problémák Többváltozós regresszós elemzés Többváltozós korrelácószámítás Parcáls korrelácó vzsgálata Itervallumbecslés a többváltozós regresszós modellbe Hpotézsvzsgálat A többváltozós regresszó számítás eredméyet befolyásoló egyéb problémák... 8 Összefoglalás Elleőrző kérdések Kompetecát fejlesztő kérdések Proxyk, dummyk és mőség változók (Mesterséges változók alkalmazása) A proxy változók kezelése A mőség változók (dummyk) kezelése Egyváltozós regresszó kétértékű változóval Többváltozós regresszó kétértékű változókkal Többváltozós regresszó kétértékű és em kétértékű változókkal A kétértékű és em kétértékű változók terakcója Összefoglalás Elleőrző kérdések Kompetecát fejlesztő kérdések Logsztkus regresszó Leárs regresszó dchotóm vagy kategóráls függő változóval Logsztkus regresszó - A kétértékű függő változó esete A kettőél többértékű kategoráls függő változó Exogé és edogé mta A bárs logt modellek teszteléséek eszköze Magyarázó változókra voatkozó tesztek A modell általáos jóságára voatkozó tesztek Általáos jóság mutatók Előrejelzés teszt Klasszfkácós tábla Összefoglalás Elleőrző kérdések Kompetecát fejlesztő kérdések Termelés függvéyek és az ebből származtatott közgazdaság mutatók A gazdaság függvéyek fogalma, alkalmazása a mezőgazdaságba A termelés függvéyek alkalmazása az optmáls termelés szívoal meghatározására

6 Összefoglalás Elleőrző kérdések Kompetecát fejlesztő kérdések A sztochasztkus dősorelemzés alapja Kvaltatív előrejelzés Kvattatív előrejelzés Kauzáls módszerek Projektív módszerek Összefoglalás Elleőrző kérdések Kompetecát fejlesztő kérdések AR(I)MA modellek specfkálása. Box-Jeks-modellezés Az ARIMA modellezés A stacoartás bztosítása Az ARIMA modell beazoosítása A modell együtthatóak becslése Dagosztka elleőrzés Összefoglalás Elleőrző kérdések Kompetecát fejlesztő kérdések Az előrejelzés módszere Ex post és ex ate előrejelzések Az előrejelzés dősoros módszere: Szakértő módszerek Tred-extrapolácó Smító eljárások Komplex dősoros modellek Összefoglalás Elleőrző kérdések Kompetecát fejlesztő kérdések Rezduáls autokorrelácó, ARCH modell Az autokorrelácó és tesztelése Az elsőredű autokorrelácó tesztje Autoregresszív Feltételes Heteroszkedasztctás (ARCH) Az ARCH modellek becslése Összefoglalás Elleőrző kérdések Kompetecát fejlesztő kérdések Damkus, elosztott késleltetésű modellek. Kotegrácó, hbakorrekcó Az osztott késleltetésű modellek A kotegrácó Grager-féle okság vzsgálat Összefoglalás Elleőrző kérdések Kompetecát fejlesztő kérdések Fogalomtár Irodalomjegyzék

7 Előszó Ezt a jegyzetet a TÁMOP A/1/1-11/1 támogatta. A jegyzetet gazdaság agrármérök és vdékfejlesztés agrármérök mesterhallgatók képzésébe kívájuk felhaszál, ezért külööse a gyakorlat részbe az adatbázsok és a témák megválasztásáál fgyelembe vesszük ezt a téyt. Az elemzésekél így a mezőgazdaság folyamatokhoz, md a vdékfejlesztés témákhoz szorosabba, vagy lazábba kapcsolódó feladatokat, modelleket mutatuk be. Feltételezzük, hogy a jegyzetet haszálók alapvető statsztka és valószíűség számítás smeretekkel már redelkezek, de a. és 3. fejezetbe áttektjük ezeket az smereteket megfelelő forrásjegyzékkel ellátva, hogy azok, akk gyegébb módszerta alapokkal redelkezek, felzárkózhassaak. Sokat godolkodtuk azo, hogy mlye szoftveres támogatást válasszuk a külöböző problémák megoldásakor, bemutatásakor. Felmerült az Excel, mt az egyk legépszerűbb táblázatkezelő program, az SPSS statsztka programcsomag, és az R platform s. Választásuk végül a GRETL ökoometra programcsomagra esett, mert gyeessége mellett egyszerűe és hatékoya lehet vele az egyszerűbb statsztka elemzésektől az összetett dősor vzsgálatokg bármlye problémát megolda.

8 1 Az ökoometra törtéete, célja, gazdaságelmélet, matematka és valószíűség számítás háttere. Equato Chapter 1 Secto Az ökoometra fogalma, célja, rövd törtéet áttektés Az ökoometrát a külöböző források külöbözőképpe defálják. A tudomáy elevezése a görög okoóma (közgazdaság) és metra (mérés) szavakból származk; Ragar Frsch ( ) és Joseph Schumpeter ( ) haszálta elsőkét ezt a kfejezést az 1930-as évekbe, bár a tudomáy gyökere sokak szert egésze a 17. századba élt Sr Wllam Pettyg ( ) yúlak vssza. Ragar Frsch Joseph Schumpeter Ragar Frsch az egyk alapító tagja volt az Ökoometra Társaságak (1930 dec. 9. USA, Clevelad), és az első szerkesztője az Ecoometrca folyóratak. Az ökoometra defícója az Ökoometra Társaság alapító okratáak 1. részébe leírt feladatkörébe bele va foglalva, mely szert: Az Ökoometra Társaság egy emzetköz társaság a közgazdaság elmélet előrehaladásáért a statsztka és a matematka területé Fő célja, hogy támogassa azokat a taulmáyokat/vzsgálatokat, amelyek célja az ökoóma problémák megközelítése elmélet és emprkus kvattatív módszerek egyesítésével Azoba számos aspektusa va az ökoóma kvattatív megközelítéséek és ezek közül egyket sem szabad összetéveszte az ökoometrával. Így, az ökoometra semmképpe em ugyaaz, mt a gazdaságstatsztka. Azzal sem azoos, amt m úgy evezük, hogy ökoóma elmélet, habár az ökoóma elmélet jeletős része határozotta kvattatív jelleggel bír. Az ökoometrát em lehet a közgazdaságta matematka alkalmazásával szomakét említe. A tapasztalat azt mutatja, hogy mdhárom említett ézőpot, a statsztka, a közgazdaságta elmelét és a matematka, szükségesek, de em elégséges feltételek ömagukba a moder gazdaság élet kvattatív voatkozásaak valód megértéséhez. Ez mdhármat egyesít. És ez aak az egyesítése/egységesítése, amből az ökoometra áll (R. Frsch, 1933). A fet defícó ma s érvéyes, habár éháy kfejezés/fogalom továbbfejlődött az eltelt évekbe. Az ökoometra az ökoóma modellek, a matematka statsztka és a gazdaság adatok egységesített tudomáya. Az ökoometra területé belül vaak alegységek és specalzácók. Az ökoometra elmélete voatkozk az eszközök és módszerek kfejlesztésére és az ökoometra módszerek tulajdoságaak taulmáyozására. Az alkalmazott ökoometra egy olya fogalom, am leírja a kvattatív ökoóma modellek kfejlesztését és az ökoometra módszerek az alkalmazását azo modellekél, amelyekhez gazdaság adatok szükségesek. (B.E. Hase, 000) Természetese az évek sorá egyéb megfogalmazásokkal s találkozhattuk.

9 A matematka közgazdaság modellek emprkus támogatása a gazdaság adatok matematka statsztka alkalmazások segítségével törtéő elemzésével, valamt számszerű becslésekkel (Samuelso et al., 1954) Az ökoometra egyesít a matematka közgazdaságtat, gazdaság statsztkát és statsztka következtetéseket: a közgazdaságta elméletek kfejezése matematka formába a gazdaság adatok gyűjtése és feldolgozása a matematka egyeletek elleőrzése statsztka következtetés techkákkal (Thomas, 1996) A későbbekbe az alább megfogalmazást fogadjuk el, am az előzőek sztézséek tekthető: Az ökoometra a közgazdaságta azo belül s a matematka közgazdaságta öálló tudomáyá fejlődött részterülete, amelyek célja a gazdaság jeleségek matematka jellegű elemzése, továbbá a közgazdaság elméletek és modellek tapasztalat adatok alapjá törtéő gazolása, lletve megcáfolása. Eszközet elsősorba a matematka, azo belül s főkét a valószíűség-számítás, továbbá a statsztka eszköztárából merít. A következtető (matematka) statsztka egyes részterülete, így a regresszó számítás és az dősorelemzés képezk az ökoometra tulajdoképpe alapjat. 1. Matematka és valószíűség számítás háttér A matematka statsztkába a valószíűség változók smeretle, vagy csak bzoyos paraméterektől eltektve smert eloszlására lehet következtet kísérlet adatokból. A kísérlet lehet egyszerű pézérme feldobása vagy három dobókocka feldobása, de az ökoometrába lehet boyolult s, például a gazdaság szereplőkkel lefolytatott felmérés, vagy a mezőgazdaságba egy kísérlet takarmáyozás program lefolytatása. A gazdaság felmérés elvégzésekor az adott sokaságból (például a mezőgazdaság vállalkozások közül) bzoyos egyedeket kválasztva azok tulajdoságaból következtetük az egész sokaság tulajdoságara. A takarmáyozás kísérlet eseté statsztka módszerekkel költség- és formácó-hatékoy elredezéseket alakítuk k. A megkapott adatokból becsléseket végezhetük a megsmer kívát smeretleekre, vagy eldöthetjük, hogy az smeretleek eleget teszek-e bzoyos kkötésekek. A matematka statsztka módszerek mdezek mellett a sztochasztkus folyamatok smeretle jellemzőek meghatározásával s foglalkozak. A kísérletek sorá megkapott eredméyek értéke a véletletől függ, 1 azoba meghatározható, hogy mlye valószíűséggel esk megadott határok közé. Az eredméyt meghatározó véletle téyezőket a valószíűség (sztochasztkus) változókak evezzük A valószíűség változó dszkrét, ha csak meghatározott értékeket vehet fel. Például a családba lévő gyerekek száma, vagy a mőséghbás termékek száma egy mtába. Folytoos valószíűség változóról beszélük, ha az egy valós számtervallum bármely értékét felvehet. Például lye a testtömeg, a hőmérséklet, vagy egy adott dőszakba elért árbevétel. A következőkbe áttektük éháy valószíűség számítással kapcsolatos alapfogalmat. 1 Az eredméyt meghatározó téyezők értéke kísérletről kísérletre mások lehetek, mert a véletleszerűe kválasztott egyedek em bztos, hogy egy másk felvételbe, vagy takarmáyozás kísérletbe ugyaazok. 9

10 Eseméy: egy megfgyelés vagy kísérlet lehetséges eredméyeek valamlye meghatározott összessége, amely a megfgyelés (kísérlet) végrehajtása közbe vagy bekövetkezk, vagy em. A valószíűség számításba egy kísérlet lehetséges eredméyet egy halmaz eseméytér elemeek tektjük, és az eseméyek az eseméytér bzoyos részhalmaza. Ha valamely eseméy az eseméytér mde elemét tartalmazza, akkor bztos eseméyről, ha egyet sem, lehetetle eseméyről va szó. Legye A valamely kísérlettel kapcsolatos eseméy. Végezzük el a kísérletet -szer egymástól függetleül, és jelöljük k-val az A eseméy bekövetkezéseek a számát. A k szám k az A eseméy gyakorsága, a háyados a relatív gyakorság. Ha a -szer elvégzett kísérletsorozatot többször megsmételjük, a relatív gyakorságok a tapasztalatok szert és ha a kísérlet körülméye változatlaok olya véletle gadozást mutatak, amelyek egy meghatározott (elmélet) érték között gadozak, melyet az A eseméy valószíűségéek evezük és P(A)-val jelöljük. Mél agyobb az, aak többször megsmétlése utá aál ksebb lesz relatív gyakorságok gadozása. A relatív gyakorság értéke em lehet egatív, és legfeljebb 1: 0P( A) 1, és ha A 1, A,, Ak a H eseméytér véges, vagy megszámlálhatóa végtele sok, egymást párokét kzáró eseméye, akkor ezek összegéek a valószíűsége egyelő az egyes eseméyek valószíűségeek az összességével: P( A1 A A k ) P( A) 1 P( A) P( A) k [1-1] Tehát az olya meységeket, amelyek értéke a véletletől függ azaz felmérésről/kísérletről felmérésre/kísérletre más lehet de meghatározható, hogy mlye valószíűséggel esk egy megadott tartomáyba, valószíűség változóak evezzük. Ha X egy valószíűség változó, akkor a P( X x ) érték azt a valószíűséget adja meg, hogy a valószíűség változó értéke éppe x. Nézzük például (Maczel, 1983 alapjá) egy sertésteyészetbe az alomszámot (X), am az egy kocára jutó malacszaporulatot jelet. A P( X 10 ) 0, 15 azt mutatja meg, hogy 0,15 (15%) a valószíűsége aak, hogy a malacszaporulat éppe 10. Ebbe az esetbe a X értékkészlete véges halmaz, az egy kocára jutó szaporulat mutató dszkrét valószíűség változó. Ha em az alomszámot vzsgálák, haem az alomtömeget, akkor az X értéke egy k 1 (alsó korlát) és k (felső korlát) között tetszés szert valós szám lehet, azaz folytoos valószíűség változók. Példákba az alomszám 6 és 15 között va, a valószíűségek összege 1, tehát az a téy, hogy az alomszám 6 és 15 között va, bztos eseméyek tekthető (1-1. táblázat). Nézzük meg, hogy m aak a valószíűsége, hogy az alomszám ksebb vagy egyelő, mt 11? P( X 11) P( X 10 ) P( X 9 )P( X 8 ) P( X 7 ) P( X 6 ) azaz P( X 10 ) 0, 15 0, 14 0, 10 0, 07 0, 05 0, 51 [1-] Természetese bármely X eseté meghatározható az [1-]-be kszámolt kumulált valószíűség: F( x ) P( X x ) [1-3] ahol x R, F(x) a valószíűség változó eloszlásfüggvéye. Ha bármely két eseméyek egyetle közös eleme scs, akkor azok egymást párokét kzáró eseméyek. 10

11 1-1. táblázat: Alomszám és az előfordulás valószíűsége x P(X=x) P(X<x) 6 0,05 0,00 7 0,07 0,05 8 0,10 0,1 9 0,14 0, 10 0,15 0, ,16 0,51 1 0,1 0, ,09 0, ,06 0, ,06 0, ,00 1,00 Összese 1,00 Forrás: Maczel, 1986 alapjá A malacszaporulat eloszlásfüggvéyét a 1-1. ábra mutatja be. Az ábra jól szemléltet, hogy dszkrét valószíűség változó eseté: F( x ) P x [1-4] ahol x x x a valószíűség változók lehetséges értéket, lletve az valószíűségeket jelöl. ehhez tartozó F(x) 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0,1 0, x 1-1. ábra: Dszkrét valószíűség változó eloszlásfüggvéye Forrás: Maczel, 1983 alapjá Folytoos valószíűség változóál egy-egy kokrét érték előfordulásáak a valószíűsége zérus (bár az előfordulás valószíűsége em lehetetle), de meghatározható a változó egy adott (x 1, x ) tervallumba eséséek a valószíűsége ( x1 X x ), vagy aak a valószíűsége, hogy a változó értéke x-él ksebb ( X x ), de megállapítható az s, hogy a valószíűség változó em ksebb, mt az x ( X x ). 11

12 A folytoos valószíűség változó eloszlásfüggvéyét az Észak-alföld Régóba található 57 mezőgazdaság vállalkozásba elért búza termésátlagok alakulásá keresztül mutatjuk be (1-. ábra). 1-. ábra: A búza termésátlag eloszlásfüggvéye az Észak-alföld Régóba Forrás: Saját szerkesztés Az eloszlásfüggvéy egyk fotos tulajdosága: P( a X b ) F(b ) F( a ) [1-5] A sertés alomszám példa alapjá (1-1. táblázat) vzsgáljuk meg, hogy m a valószíűsége aak, hogy a malacok száma legalább 9 és kevesebb, mt 1. Az [1-5] összefüggés szert P( 9 X 1 ) F( 1 ) F( 9) 0, 67 0, 0, 45, am köye elleőrzhető, hsz P( X 9 ) P( X 10 ) P( X 11) 0, 14 0, 15 0, 16 0, 45. Tehát a megadott tervallumba esés valószíűsége 45%. Ugyaez a szabály alkalmazadó folytoos valószíűség változó eseté s. A búza termésátlagál a 4,78 és 4,95 t/ha értékek közé esés valószíűsége 0,8-0,5=0,3, azaz 30% (1-. ábra). Ha egy F(x) eloszlásfüggvéy dfferecálható, akkor az f(x)=f(x) függvéy a valószíűség változó sűrűségfüggvéye. A dszkrét eloszlások em dfferecálhatók em folytoosak, ezért em értelmezhető a sűrűségfüggvéy. Dszkrét eloszlásokál ezért az ú. valószíűség eloszlás fogalma jelek meg, am valójába a valószíűség változó értékehez tartozó P( X x ) valószíűségek felsorolása (1-1. táblázat; 1-3. ábra). A folytoos változó sűrűségfüggvéyét a 1-4. ábra szemléltet a korábba már bemutatott búza termésátlagok alapjá. 1

13 P 0,18 0,16 0,14 0,1 0,10 0,08 0,06 0,04 0,0 0, Alomszám (X) 1-3. ábra: Valószíűség eloszlás dszkrét valószíűség változóál Forrás: Maczel, 1983 alapjá f(x) 0,6 0,5 0,4 0,3 0, 0, ,5 1 1,5,5 3 3,5 4 4,5 5 5,5 6 6,5 7 7,5 Búza termésátlag 1-4. ábra: A búza termésátlag sűrűségfüggvéye az Észak-alföld Régóba Forrás: Saját szerkesztés Dszkrét eloszlásál az X valószíűség változó valószíűségeek összege 1: P 1 [1-6] 1 Folytoos eloszlásál eek mtájára a sűrűségfüggvéy alatt terület egyelő 1-gyel: f ( x )dx 1 [1-7] 13

14 Korábba a [1-5]-be dszkrét eloszlás eseté megvzsgáltuk, hogy m a valószíűsége aak, hogy az X értéke az [a,b] tervallumo belül esse. Folytoos eloszlásál ez a b P( a X b ) f ( x )dx [1-8] a összefüggéssel írható le, és eek alapjá az [a,b] tervallumo kívül esés valószíűsége: b 1 f ( x )dx [1-9] a Eek majd a későbbekbe a agy jeletősége lesz az elemzésekél. Az eloszlás lletve a sűrűségfüggvéy smerete fotos formácókat ad számukra az adott jeleségről. Azoba felvetődk a kérdés, hogy mey lehet példákba az átlagos alomszám, vagy mey a búza termésátlaga. Legyeek az X dszkrét valószíűség változó lehetséges értéke: x 1,x x, amelyek P 1,P,,P. Feltételezve, hogy 1 1 P 1 felírható valószíűség eloszlás várható értéke: 1 M( X ) x P x P x P x P [1-10] 1 Folytoos valószíűség eseté a sűrűségfüggvéyből [1-7] duluk k: M( X ) xf ( x )dx [1-11] Az [1-10]-be és az [1-11]-be meghatározott várható értékkel jól jellemezhetjük a valószíűség változó átlagát. Kérdés azoba, hogy ez az egy érték meybe adja vssza a változó jellemzőt, azaz a téyleges értékek mlye mértékbe gadozak a várható érték körül. Az gadozás mértékét a szóráségyzet (varaca) és a szórás mutatóval mérjük. A szórás az alábbak szert számítható: D( X ) M X M( X ) [1-1] A szórás égyzetre emelésével kapjuk meg a varacát: D ( X ) M X M( X ) [1-13] Dszkrét eloszlás eseté akárcsak az átlagot (lásd [1-10]) a szóráségyzetet és a szórást s súlyozotta számítjuk: x M( X ) P [1-14] 1 x M( X ) P [1-15] 1 Az 1-. táblázatba foglaltuk össze a koca alomszám várható értékéek és varacájáak számítását. Az átlagos alomszám 10,46 db, a szóráségyzet 5,668. A szóráségyzet égyzetgyöke a szórás,381 db malac. 14

15 1-. táblázat: Az alomszám várható értéke és szóráségyzete x P x P [x -M(X)] P 6 0,05 0,30 0, ,07 0,49 0, ,10 0,80 0, ,14 1,6 0, ,15 1,50 0, ,16 1,76 0, ,1 1,44 0, ,09 1,17 0, ,06 0,84 0, ,06 0,90 1,37 Összese 1,00 10,46 5,668 Forrás: Saját szerkesztés Maczel, 1983 alapjá 1.3 Az ökoometrába leggyakrabba alkalmazott eloszlástípusok Dszkrét eloszlások Bomáls eloszlás Egy, a vzsgálat szempotjából két kmeettel redelkező jeleséget smétlésbe (vagy kísérletbe) vzsgálva legye A eseméy bekövetkezéséek valószíűsége p. Bzoyítható, hogy ha egymástól függetleül -szer egymás utá elvégezzük a kísérletet, akkor aak a valószíűsége, hogy A éppe k-szor következk be (k=0, 1,,,): k k pk P( X k ) p ( 1 p ) [1-16] k Az [1-16] dszkrét eloszlást bomáls eloszlásak 3 evezzük, melyek k<x-re törtéő kumulálásával kapjuk meg az eloszlásfüggvéyét (1-5. ábra): k k F ( x ) p ( 1 p ) [1-17] kxk Egy bomáls eloszlású X valószíűség változó: Várható értéke: M( X ) p [1-18] Varacája: D ( X ) pq [1-19] Szórása: D( X ) pq [1-0] 3 Kétkmeetelű kísérletekkel először J. Beroull foglalkozott, ezért gyakra Beroull-eloszlás éve találkozhatuk a bomáls eloszlással a szakrodalomba. 15

16 Egy baromftelepe egy új probotkum hatását vzsgálják. Az eddg gyakorlat alapjá megállapítható, hogy egy lye kísérlet skeréek a valószíűsége 0,85. A tulajdoos összese a kísérlet 6-szor smétléséhez járul hozzá. Számítsuk k, hogy ebbe az esetbe m a valószíűsége, hogy a 6 közül kísérlet lesz skeres (1-3. táblázat) táblázat: Az =6, p=0,85 bomáls eloszlás függvéyértéke külöböző k értékekél = 6 p= 0,85 Forrás: Saját számítás k Eloszlásfüggvéfüggvéy Sűrűség- 0 0,0000 0, ,0004 0,0004 0,0059 0, ,0473 0, ,35 0, ,69 0, ,0000 0, ábra: A bomáls eloszlás eloszlásfüggvéye és hsztogramja Forrás: Saját szerkesztés A bomáls eloszlás jeletőségét az adja, hogy az elemzések sorá előfordulhatak alteratív smérvet vzsgáló vsszatevéses mtavételek, melyekél jól alkalmazható. K kell emel, hogy agy és em túl kcs p eseté jól közelíthető ormáls eloszlással Posso eloszlás A Posso eloszlás a rtka eseméyek valószíűség eloszlása. A bomáls eloszlás specáls határértékéek tekthetjük, amkor (a megfgyelések száma) agyo agy és p=p(x) agyo kcs. Tulajdoképpe arról va szó, hogy a bomáls eloszlás [1-16] jól közelíthető aak határértékével, ha eléggé agy és p vszoylag kcs. 16

17 Bevezetve az p= jelölést: k k k e lm p ( 1 p ) k k! [1-1] azaz ha X a k értékeket k e P( X k ) p( k; ),( 0 ),( k 0, 1,,...) [1-] k! valószíűséggel vesz fel, akkor X eloszlását paraméterű Posso-eloszlásak evezzük. Tpkusa Posso eloszlású valószíűség változók: Az adott tömegű radoaktív elemél bzoyos dőtartam alatt elbomló atomok száma Egy üzletbe adott dőszak alatt betérő vásárlók száma (sorbaállás probléma) Mkroszkóp alatt adott mm -e leszámolható baktérumok száma Mazsolás süteméybe egy levágott szeletbe található mazsolák száma. Egy szállítmáyba előforduló extrém tulajdoságokkal redelkező egyedek (tételek) száma Egy köyv valamely kytott oldalá elforduló sajtóhbák száma Ha kumuláljuk az [1-] segítségével meghatározott valószíűségeket k<x-re, megkapjuk a Posso-eloszlású valószíűség változó eloszlásfüggvéyét: k e F ( x ) [1-3] k! kx A Posso-eloszlású X valószíűség változó: Várható értéke: M( X ) [1-4] Varacája: D ( X ) [1-5] Szórása: D( x ) [1-6] Egy baromftelep a hízlalás végé darab állatot értékesít, melyből 50 darab a korább szállítmáyok statsztka elemzése alapjá léyegese ksebb az előírtál. A baromft 1500 db-os tételekbe szállítják el, előtte cs válogatás, így az előírtál ksebb testtömegű állatok véletleszerűe kerülek a csoportokba. M a valószíűsége aak, hogy egy csoportba em kerül 10- él több em előírt testtömegű baromf? Megoldás: baromf közül 50 em megfelelő. Aak a valószíűsége, a teljes állomáyba találuk ks 50 p 0, 005 testtömegű állatot: így =1500 0,005=7,5 Aak a valószíűsége, hogy em lesz a csoportba 10-él több selejt baromf az [1-3] alapjá: 0 7, 5 7, 5 7, , 5 7, 5 e 7, 5 e 7, 5 e 7, 5 e P( X 10 )... 0, 86 0! 1!! 10! Tehát 86,% aak a valószíűsége, hogy egy szállítás csoportba legfeljebb 10 db előírásokak em megfelelő baromf kerül (1-6. ábra). 17

18 1-6. ábra: A Posso-eloszlás hsztogramja és eloszlásfüggvéye (λ=7,5 ) Forrás: Saját szerkesztés Hpergeometrkus eloszlás Hpergeometrkus eloszlással vsszatevés élkül mták eseté találkozuk. Va egy N elemű sokaságuk, amből mtát választuk. M aak a valószíűsége, hogy a mta eleméből k külöleges tulajdosággal redelkezk, ha smert az, hogy a teljes sokaság N eleméből M redelkezk ezzel a jellemzővel? Azt az X valószíűség változót, amely az xk M N M k k pk P( X k ),( k 0, 1,,..., ) N k értékeket [1-7] valószíűséggel vesz fel, hpergeometrkus valószíűség változóak (1-7. ábra) evezzük, paramétere N, M, emegatív egészek és M<N, 0<N m(m, N-M). Egy hpergeometrkus eloszlású X valószíűség változó: Várható értéke: Varacája: M [1-8] M( X ) p N 1 D ( X ) p( 1 p ) 1 N 1 [1-9] Szórása: 1 D( X ) p( 1 p ) 1 N 1 [1-30] 0 láda őszbarack között 5 láda már régebb szállítmáyból való, így kssé löttyedt barackok vaak bee. A kereskedő a ládák tetejére válogatott szép barackokat helyez. 3 láda vásárlása eseté m a valószíűsége, hogy a) md frss barackokat tartalmaz, b) 1 rossz láda va közte, c)kettő rossz láda va közte, lletve d) mdhárom rossz? Paraméterek: N=0, M=5, =3, k=0,1,,3 18

19 a) P(X=0)= c) P(X=)= , , b) P(X=1)= d) P(X=3)= , , N=0,M=5,=3 0,5 0,45 0,4 0,35 0,3 0,5 0, 0,15 0,1 0, ábra: Hpergeometrkus eloszlás Forrás: Saját szerkesztés Zemakovcsé, 007 yomá 1.3. Folytoos eloszlások Egyeletes eloszlás Az X valószíűség változót egyeletes eloszlásúak evezzük az ]a;b[ tervallumo, ha sűrűségfüggvéye (1-8. ábra): 1, ha a x b, f ( x ) b a x R [1-31] 0, egyébkét Az egyeletes eloszlás eloszlásfüggvéye (1-9. ábra): 19

20 x a, ha a x b; x x b a dt F( x ) P( X x ) f ( t )dt 0, ha x a; b a a 1, ha x b [1-3] A telefotársaság egy óra között tervallumot jelölt meg a telefo megjavítására. Feltételezve, hogy az adott dőszakba azoos valószíűséggel bármkor megérkezhet a telefoszerelő, m az esélye, hogy 1 előtt valóba be s cseget? Megoldás: a=11, b=14, x=1 f(x) 0,35 0,3 0,5 0, 0,15 0,1 0, F(1) , azaz kb. 33% esély va a 1 előtt érkezésre x 1-8. ábra: Az egyeletes eloszlás sűrűségfüggvéye Forrás: Saját szerkesztés F(x) 1 0,8 0,6 0,4 0, x 1-9. ábra: Az egyeletes eloszlás eloszlásfüggvéye Forrás: Saját szerkesztés Az egyeletes eloszlást leggyakrabba statsztka szmulácókál alkalmazzák, ahol gyakor probléma egy adott eloszlású véletle szám geerálás. A legtöbb algortmus a pszeudó véletleszám geerátor módszere alapul: ez olya X számokat geerál, melyek egyeletese oszlaak el a (0,1) tervallumba. Ezeket az X számokat átalakítják u(x)-re, melyek kelégítk az adott f(u) eloszlást. 0

21 1.3.. Expoecáls eloszlás Az expoecáls eloszlás alkalmazása az ökoometrába vszoylag ksebb súlyú, de agyo sok probléma írható le segítségével. Ezek közül éháy: várakozás dő; sorba állással eltöltött dő; bzoyos beredezések, alkatrészek élettartama, amkor a működést egy váratla eseméy szakítja meg (törés, szakadás, stb.); radoaktív elemek bomlás folyamata; Posso-eloszlás feltételeek teljesülése eseté, az egymást követő eseméyek között eltelt dő Az expoecáls eloszlás sűrűségfüggvéye: 0 ha x 0 f ( x) x e ha x 0 xr [1-33] ahol a λ álladó tetszőleges poztív szám, az eloszlás paramétere. Az expoecáls eloszlás eloszlásfüggvéye: 0 ha x 0 F x P( X x) x R x 1 e ha x 0 [1-34] Az eloszlás- és sűrűségfüggvéy képét a ábra mutatja be. Az expoecáls eloszlás: 1 várható értéke: M( X) [1-35] varacája: szórása: 1 D ( X ) [1-36] 1 D( X ) [1-37] Legye X egy eergatakarékos zzó élettartama, melyek átlaga 000 óra. M a valószíűsége, hogy egy találomra választott zzó kevesebb, mt 1000 órág működk? 1 1 M( X) 000, ebből = 0, Az eloszlásfüggvéy X=1000-hez tartozó értéke adja meg a választ. 0, Az eloszlásfüggvéy: x 0 ezért F(1000) 1e 0, Tehát közelítőleg 39,3 % aak a valószíűsége, hogy az zzó 1000 órá belül meghbásodk. 1

22 1-10. ábra: Az expoecáls eloszlás eloszlásfüggvéye (F(x)) és sűrűségfüggvéye (f(x)) Forrás: Saját szerkesztés Normáls eloszlás A leggyakrabba előforduló és alkalmazott, és az ökoometrába s legagyobb jeletőségű a ormáls eloszlás. A ormáls eloszlás görbéjét először egy fraca matematkus, Abraham de Movre fedezte fel és közölte le 1733-ba. A ormáls eloszlást tudomáyosa két matematkus-csllagász, a fraca Perre-Smo Laplace és a émet Carl Fredrch Gauss alapozta meg. Többe úgy vélk,hogy Laplace hozzájárulása a ormáls eloszlás tulajdoságaak tsztázásához jeletősebb volt, mt Gaussé, mégs Gauss utá evezték el a ormáls eloszlást Gauss eloszlásak, mutá Gauss volt az első, ak a ormáls eloszlást égtestek mozgására alkalmazta. Perre Smo Laplace ( ) Carl Fredrch Gauss ( )

23 Egy X folytoos valószíűség változót m és σ paraméterű ormáls eloszlásúak evezük, ha sűrűségfüggvéye: ( ) ( ) ( xm) 1 f x e x m : tetszőleges valós szám : tetszőleges poztív szám [1-38] A sűrűségfüggvéy egy szmmetrkus haraggörbe (1-11. ábra), melyek maxmuma az x=m helye va, a σ a görbe lapultságára jellemző érték. A ormáls eloszlás eloszlásfüggvéye: x ( tm) 1 F( x) P( X x) e dt [1-39] Az X ormáls eloszlású valószíűség változó: Várható értéke: M( X ) m [1-40] Varacája: Szórása: DX ( ) D ( X) [1-41] [1-4] ábra: A ormáls eloszlás eloszlásfüggvéye (F(x)) és sűrűségfüggvéye (f(x)) álladó m és külöböző σ értékekél Forrás: Saját szerkesztés Stadard ormáls eloszlás A ormáls eloszlás jelölése: N(μ,σ). Tehát az eloszlásak két paramétere va, a μ az eloszlás várható értéke (a sokaság középértéke, számta átlaga) és a σ a sokaság szórása. A két paraméter függetle egymástól. Ameybe valamlye összefüggés léteze közöttük, akkor elég lee csak egy paraméter. A középérték és szórás mértékegységgel redelkezk, ez megegyezk az alapadatok mértékegységével. Külöböző tulajdoságú jeleségek összehasolításakor célszerű, hogy a mértékegységek és agyságredek megegyezzeek, amhez stadardzál kell az adatokat. 3

24 * X M ( X ) Az X valószíűség változó stadardzáltja: X melyek várható értéke DX ( ) M(X * )=0, szórása D(X * )=1. Ha az X változó N(μ,σ) eloszlású, akkor a stadardzáltja az alábbak szert számíthatjuk fgyelembe véve [1-40] és [1-4] egyeleteket: X X [1-43] A képlet számlálójába egy skálaeltolás szerepel. Mde egyes mérés adatból kvojuk a számta átlagot. Ameybe em smerjük a sokaság téyleges középértékét, akkor a mtából becsült értéket haszáljuk. Ezzel az eljárással a stadardzált értékek várható értéke ulla lesz, mert a számta átlagtól vett eltérések összege ulla, ha a jeleség ormáls eloszlású. Az előző külöbséget elosztjuk a szórással. Ameybe em smerjük a sokaság valód szórását, akkor ezt s a mtából becsüljük. Ezzel az eljárással a stadardzált értékek szórása egy lesz. A stadardzált értékekek cs mértékegysége. A stadardzálás sorá a mta eredet jellemző em változak, csak uformzálódak. Ezek az értékek szté ormáls eloszlásúak, és stadard ormáls eloszlásak evezzük. Jelölése: N(0, 1) Ezt az eloszlást haszáljuk az ökoometrába a külöböző eljárások és tesztek sorá. A stadard ormáls eloszlás: Eloszlásfüggvéye (1-13. ábra) x t 1 ( x) e dt [1-44] Sűrűségfüggvéye (1-1. ábra) x 1 ( x) e x R [1-45] A Φ(x) értéke a stadard ormáls eloszlás táblázataból kszámítható. A stadard ormáls eloszlás sűrűség- és eloszlásfüggvéyevel kfejezhetők az [1-38] és [1-39] függvéyek, így 1 x m f( x) x m [1-46] F( x) x R [1-47] 4

25 1-1. ábra: A stadard ormáls eloszlás sűrűségfüggvéye Forrás: Saját szerkesztés A 1-1. ábra -1 x 1 tervallumhoz eső görbe alatt terület a görbe alatt terület 68,6%-át, a - x tervallumhoz tartozó a 95,45%-át, -3 x 3-hoz tartozó a 99,73%-át reprezetálja. Mvel a ormáls eloszlás sűrűségfüggvéye szmmetrkus a várható értékre, ezért ( x) ( x) és ( x) 1 ( x) eek alapjá [1-48] P( x X x) ( x) ( x) ( x) (1 ( x)) ( x) 1 Eek alapjá az 1-él ksebb értékek előfordulása 0,8413. A -1-él ksebb értékek előfordulás valószíűsége 1-0,8413=0,1587 (1-13. ábra). A kettő külöbsége 0,686, azaz, ahogy azt az 1-1. ábra kapcsá már láttuk az átlag±1 szórásy távolságba az adatok 68,6%-a található. 5

26 1-13. ábra A stadard ormáls eloszlás eloszlásfüggvéye Forrás:Saját szerkesztés Összefoglalás Az ökoometra a közgazdaságta azo belül s a matematka közgazdaságta öálló tudomáyá fejlődött részterülete, amelyek célja a gazdaság jeleségek matematka jellegű elemzése, továbbá a közgazdaság elméletek és modellek tapasztalat adatok alapjá törtéő gazolása, lletve megcáfolása. Eszközet elsősorba a matematka, azo belül s főkét a valószíűség-számítás, továbbá a statsztka eszköztárából merít. A következtető (matematka) statsztka egyes részterülete, így a regresszó számítás és az dősorelemzés képezk az ökoometra tulajdoképpe alapjat Az ökoometra taulmáyokhoz elegedhetetle a valószíűségszámítás alapok smerete. Megkülöböztetük dszkrét és folytoos eloszlásokat. Dszkrét eloszlás a bomáls, a Posso és a hpergeometrkus eloszlás. A folytoos eloszlások közül az egyeletes eloszlásak a véletleszám geerálásba, így a szmulácós modellekbe va kemelt szerepe. Az ökoometrába a legagyobb jeletősége a ormáls eloszlásak va. Sűrűségfüggvéye haraggörbe alakú. A stadard ormáls eloszlás, melyek várható értéke 1, és a szórása 0 lehetőséget bztosít a külöböző tulajdoságú jeleségek összehasolítására. Normál eloszlás eseté a várható értékhez képest ±1 szórásy távolságra helyezkedk el az adatok 68,6%-a. ± szórásy távolságra az adatok 95,45%-a. Elleőrző kérdések 1. Mt tud az ökoometra kalakulásáról?. Mlye fogalm megközelítése vaak az ökoometráak? 6

27 3. M az eloszlásfüggvéy és sűrűségfüggvéy között a külöbség? 4. Hogya határozzuk meg egy valószíűség változó előfordulás valószíűségét? 5. Mlye eloszlásokat smer? 6. Mlye kapcsolatba va egymással a bomáls és Posso eloszlás? 7. M a ormáls eloszlás jeletősége? Kompetecát fejlesztő kérdések 1. M a jellemzője az egyeletes eloszlásak?. Hogya defáljuk a ormáls eloszlású valószíűség változó sűrűségfüggvéyét és eloszlásfüggvéyét? 3. Hogya értelmezzük a stadard ormáls eloszlás sűrűségfüggvéyét és eloszlásfüggvéyét? 7

28 Leíró statsztka áttektés Equato Chapter Secto 1.1 Statsztka alapfogalmak A statsztka módszerek helyes alkalmazásáak feltétele a megszerzett formácók helyes értelmezése. Ehhez szükség va a statsztka alapfogalmak potos smeretére. A külöböző statsztka programcsomagok, így a GRETL s lehetővé tesz számukra a jeleségek gyors és sokoldalú vzsgálatát, azoba e feledjük, hogy bármely program csak az általuk megadott formácók alapjá végz el a külöféle számításokat. Ha az formácókat hamsa közöljük programmal a kmeet adatak s hamsak leszek. Fetek alapjá tektsük át a legfotosabb statsztka alapfogalmakat, és ezek értelmezését. Az alapvető statsztka elemzés módszerek közül elsősorba azokkal foglalkozuk, amelyek az ökoometra taulmáyok sorá fotosak. Ezért a jegyzetbe em foglalkozuk a vszoyszámokkal és az dexszámítással..1.1 Sokaság A vzsgálat tárgyát képező tömegjeleségeket a statsztkába sokaságak evezzük. A sokaságot agyszámú egyed alkotja, amelyeket a sokaság egyedeek evezzük. A sokaság egyede között vaak olyaok, amelyek bzoyos tulajdoságok, léyegbel jegyek tektetébe egymással megegyezek, más szempotból vszot eltérhetek egymástól. Az egyedekek a hasolósága lletve megegyezősége adja meg számukra a sokaság egyötetűségét, homogetását, míg a külöböző jegyek alapjá meghatározott eltérő jelleg a sokaság heterogetását. A sokaság egyede lehetek valóságos egységek, amelyeket a felvételezés dőpotjába valóságosa tuduk mér, számlál, és lehetek úgyevezett em valóságos egységek, eseméyek, amelyek egy adott dőtartam alatt bekövetkezett változást, teljesítméyt, törtéést tükrözek. A sokaságokat több szempot alapjá csoportosíthatjuk: Attól függőe, hogy valóságos egységekből vagy eseméyekből épül fel a sokaság, megkülöböztethetük ú. álló sokaságot és mozgó sokaságot. Az álló sokaság vagy állapot sokaság valóságos egységekből áll, a sokaság egységeek egy adott dőpotba feálló állapotát rögzít. Agol kfejezéssel modják ezt stock, állomáy jellegű sokaságak s. A mozgó sokaságot eseméyek alkotják, amelyek egy adott dőtartam alatt következek be. Ezt agol kfejezéssel flow, áramlás jellegű sokaságak s evezzük. A sokaságokat úgy s csoportosíthatjuk, hogy gyakorlatlag számbavehető egységekből, vagy em számba vehető egységekből állak. Eek alapjá külöböztethetük meg véges és végtele sokaságot. Harmadk csoportosítás móduk, amkor a sokaság téylegese meglévő egységekből valóságos sokaság-, vagy valamely eseméy egységeek a lehetséges értékeek összeségéből épül fel a sokaság elmélet sokaság. 8

29 Teljes sokaságról beszélük akkor, ha a körülhatárolt sokaság mde egységét tartalmazza a sokaság, ha a teljes statsztka sokaság egységeek bzoyos szempotból kválasztott része található meg a sokaságba, akkor mtasokaságról beszélük. Amkor sokaság egysége valamlye alapvető tulajdoság tektetébe azoosak, pl. egy vállalat dolgozó, ezt fősokaságak evezzük. Eze belül külöböző tulajdoságok alapjá változatokat képezhetük, pl. szellem és fzka dolgozók. A fősokaság így képzett részet részsokaságokak evezzük. A sokaság egyede, egysége vszoylag jól elkülöíthetők egymástól, és ezekek az egységekek a jellemző határozzák meg azt, hogy mlye típusú lesz valamely sokaság. Az alapfogalmakat és a leíró statsztka számításakat bemutató adatbázsba 57 mezőgazdaság vállalkozás, termeléssel, termőhely adottságokkal és gazdálkodással kapcsolatos adata találhatók meg (-1. táblázat). Ebből az adatbázsból mutatuk most be egy kvoatot, megézzük, hogy mlye jellegű a sokaság, a későbbekbe az smérvek és mérés sztek alapjá meghatározzuk a változótípusokat, és a mérés sztekek megfelelő leíró statsztka elemzéseket végzük. -1. táblázat: Mezőgazdaság vállalkozások adata (kvoat) Hízó- Gaz- Saját Bérelt Bérlet Föld- Maxmum értéke- sítés Erőgépek Sertés da- ság ha ha Ft/ha ra száma db Tájegység terület terület díj kategó- hőmérséklet C 00- be t 1 Hajdúság , B-A-Z megye , Szabolcs- Szatmár-Bereg 3 megye , Hajdúság 0 335, , ,5 7 Dél-Alföld , ,84 8 B-A-Z megye , Szabolcs- 9 Szatmár-Bereg megye , Forrás: Saját adatok A -1. táblázat alapjá képzett sokaságok egységet a potosa elkülöíthető mezőgazdaság vállalkozások képezk. Nézzük példákat a külöböző sokaságokra: A mezőgazdaság vállalkozások tulajdoába lévő erőgépek é elevezésű sokaság dszkrét, álló, véges sokaságak tekthető. A hízósertés értékesítése a 00. évbe folytoos, mozgó és véges sokaság. A mezőgazdaság vállalkozások által bérelt terület agysága é folytoos, álló, véges sokaságot képez. A sokaság elemeek a száma 57 darab, amelyek a teljes sokaság egy bzoyos szempotból kválasztott részét képezk, ezért az előbb említett valamey sokaság mtasokaság s egybe. A sokaságok csoportosításáál em említettük, de em hagyhatjuk fgyelme kívül, hogy agyo sokszor külöböző mőségű, gyakra eltérő mértékegységű, de valamlye okból együtt vzsgál 9

30 kívát jeleségek, jószágok, termékek összességéek együttes vzsgálatára va szükség. Ebbe az esetbe az összehasolíthatóságot leggyakrabba az érték meghatározásával érhetjük el, de esetleg más fajta egységeket s haszálhatuk az összevetés megteremtéséhez. Az lye sokaságokat aggregált sokaságokak evezzük, amely folytoos és dszkrét s. Az aggregált sokaság képzéséek módja: A q p v [-1] 1 1 q az -edk mőségű termék meysége adott mértékegységbe p az -edk mőségű termék egységára v az -edk termék azo egységeek összértéke, melyek az aggregált sokaságba tartozak. Természetese az aggregált sokaság képzéséél emcsak az egységárat, haem valamlye más alkalmasa megválasztott egységet s haszálhatuk, így pl. a ormálhektárt, vagy a számosállatot s..1. Ismérvek és mérés skálák.1..1 Ismérvek A statsztka vzsgálat egzaktságáak előfeltétele a vzsgálat tárgyát képező sokaság potos körülhatárolása. A sokaság egyedeek közös tulajdosága az smérvek. Az egységek jellemzéséhez három alapvető kérdésre kell válaszoluk: MI? HOL? MIKOR? A tartalm, térbel és dőbel közös tulajdoságok megválaszolása utá válk a sokaság egészéek potos körülhatárolása félreérthetetleé. A statsztka smérvek tárgy, térbel és dőbel smérvek lehetek: Tárgy smérvek: A tárgy smérvek a sokaság egyedet jellemző mőség vagy meység tulajdoságok. o Mőség smérvek: a sokaság egységet csak verbálsa, fogalmlag külöítk el egymástól, kvaltatív vagy fokozat külöbségeket jeleteek. Általába de tartozak a csak két változattal redelkező alteratív smérvek s. o Meység smérvek: a sokaság egységet valamlye számlálás vagy mérés alapjá jellemzk. A meység smérveket tovább s csoportosíthatjuk: Folytoos smérvek: olya mérhető smérvek, amelyek bzoyos határoko belül bármlye valós szám értéket felvehetk. Dszkrét smérvek: olya számlálható smérvek, amelyek értéke csak egész szám lehet. Időbel smérvek: a sokaság egységet dőbel alakulásáak alapjá külöít el. Változata lehetek dőpotok és dőtartamok. Térbel smérvek: az egységek térbel elhelyezésére szolgáló redezőelvek. Változatak lehetek terület, közgazgatás stb. egységek. A számítógépes adatfeldolgozás köyítése, és adatak redszerezése érdekébe bármely, em meység smérvváltozat számértékké alakítható, kódolható. Természetese az ly módo yert számértékek értékeléséél fgyelembe kell veük azt, hogy ez mlye 30

31 módo jellemző a sokaság értékere. A mérés sztek, vagy mérés skálák arról adak felvlágosítást, hogy mlyeek a sokaság egységehez tartozó számértékek tulajdosága..1.. Mérés skálák: Névleges (omáls) mérés szt: a legegyszerűbb és legkevésbé formatív mérés skála, kzárólag az egységekhez redelt számértékekek mértékegysége cs, azok egyező vagy külöböző voltát eged meg jellemző tulajdoságkét elfogad, a kódszámok között külöbségek és aráyok em értelmezhetők. Nomáls mérés sztű smérvek lehetek a terület és mőség smérvek. Sorred (ordáls) mérés szt: a skálaértékek egyezősége vagy külöbözősége mellett az értékek sorredségét s fgyelembe vehetjük. A skálaértékek bármlye mértékegység élkül számot felvehetek, hsz tt em maga a számérték jelet számukra formácót, haem azok sorredje. Az elemzések sorá elsősorba olya műveleteket végezhetük el az lye típusú adatokkal, amelyek az értékek sorredségére épülek. A gyakorlatba azoba gyakra előfordul, hogy átlagolást, külöbségképzést folytatuk az ordáls mérés sztű számértékekkel. Sorred skálá mérhető smérvek lehetek a mőség smérvek. Külöbség (tervallum) mérés szt: valós méréseke alapuló skálaértékekről va szó, tt már a meyvel több, lletve meyvel kevesebb kérdésre s választ kapuk. Az tervallum mérés sztű adatokak már mértékegységük s va. A skála kezdőpotjáak megválasztása azoba ökéyes, így ha ugyaazt a tulajdoságot egy másk ökéyese megválasztott kezdőpot alapjá és más beosztással mérjük, ugyaaak a tulajdoságak a két skála alapjá meghatározott aráya már em egyértelmű, csak a külöbsége. Külöbség skálá mérhetőek a meység smérvek, és az dőbel smérvek. Aráyskála: a legtöbb formácót adja. A skála kezdőpotja egyértelműe meghatározott, a külöbsége kívül az értékek aráya s egyértelműe meghatározható. Aráyskálá mérhetők a meység smérvek. Most ézzük példákat a -1. táblázat alapjá külöböző smérvekre és mérés sztekre: A sokaságuk: Mezőgazdaság vállalkozások é. A sokaság egysége: 1. számú mezőgazdaság vállalkozás -. táblázat: Ismérvek és mérés sztek Ismérv Változat Ismérvfajta Mérés szt Tájegység Hajdúság Térbel Nomáls/omal Saját terület ha 0 Meység/folytoos Aráy/scale Földkategóra 4 Mőség Ordáls/ordal Erőgépek száma db 18 Meység/dszkrét Aráy/scale Maxmum 8,9 Meység/folytoos Itervallum/scale hőmérséklet 0 C Hízóértékesítés 00-be t 397 Meység/folytoos Aráy/scale Forrás: Saját feldolgozás 31

32 .1.3 Statsztka sorok A statsztka adatok valamlye szempotok szert felsorolását, redezett halmazát statsztka sorokak evezzük. Mde statsztka sor két egymással összefüggő felsorolást tartalmaz, amely általába csoportosítás, összehasolítás útjá jö létre. Az lye statsztka sorokat valód sorokak evezzük. A másk eset az, hogy a statsztka sor em csoportosítás vagy összehasolítás útjá jö létre, haem egyszerűe felsorakoztatjuk egymás utá az egyazo jeleségre, gazdaság egységre voatkozó többféle sokaság külöemű adatat (Pl. egy mezőgazdaság vállalkozás adataak felsorolása). Az lye statsztka sorokat em valód, leíró sorokak evezzük. A valód sorok a készítésükhöz felhaszált smérvek alapjá mőség, meység, terület és dősorok lehetek. Mőség sorok A mőség sorok a sokaság olya tárgy smérv szert megoszlását mutatják, amelyek változata csak fogalmlag határolhatók le egymástól. A fősokaság részsokaság szert összetételéről, szerkezéről yújt számukra formácót. Meység sorok A meység sorok a sokaság olya tárgy smérv szert megoszlását mutatják, amelyek változatat számszerűe fejezzük k. Folytoos meység smérvek eseté lletve agyszámú smérvértékkel redelkező dszkrét meység smérvekél osztályközökre botást haszáluk. Az osztályközös meység sor jellemző: Az egyes osztályok alsó és felső határa Az osztálytervallum hossza () Az egyes osztályok alsó és felső határaak átlaga, az osztályközép (u ) A meység sorok típusa: o Gyakorság sor: megmutatja, hogy mey egy meghatározott smérvérték (osztályköz) előfordulásáak száma (f ) o Értékösszeg sor: megmutatja, hogy mey egy meghatározott smérvértékhez (osztályközhöz) tartozó smérvértékek összege (s ) Terület sorok: valamely statsztka sokaság terület egység szert megoszlását mutatják be. Idősorok Az dősorok a sokaság alakulását az dő függvéyébe, dőbel változásába, mozgásába mutatják be. Az állósokaság dőbel változását mutatják be az állapot dősorok, amelyek smérvváltozata dőpotok. Az állapot dősorok készítése mdg összehasolítás célzatú. A mozgó sokaság dőbel változásat a tartam dősorok mutatják be. A tartam dősor smérvváltozata dőtartamok. Az dőtartamhoz kötött értékekkel a meység smérvékél/aráyskála elvégezhető elemzések többsége végrehajtható. 3

33 . Középértékek A középértékek a vzsgált statsztka sokaságot egy olya számmal jellemzk, amely mdekor a sokaság cetrumába helyezkedk el. A fősokaság középértékek mellett a külöböző részsokaságra jellemző középértékeket s meghatározhatjuk, így lehetővé válk azok általáos jellemzőek összehasolítása. A középértékek egyk csoportja a számított középértékek, amelyek Matematka számítás eredméye és ezáltal Az értéksor elemevel matematka összefüggésbe állak Az elemek értékagyságáak a cetrumába állak. A másk csoportot a helyzet középértékek képezk, amelyeket Az elemek értékagyság szert redezett sorából Matematka számítás élkül jelölük k, és A kjelölés az adatok sorszámához vagy gyakorságához kötődk...1 Számított középértékek..1.1 Számta átlag A számta átlag az észlelés adatok olya középértéke, melyet az adatok helyébe helyettesítve az adatsor összege változatla marad. Súlyozatla formába számoljuk, ha az átlagoladó értékek gyakorsága megegyezk, ha a gyakorság külöböző súlyozott formába számoljuk. Egyszerű számta átlag: X a 1 x [-] Súlyozott számta átlag: X a 1 1 fx f [-3] A gyakorlatba gyakra az átlagoladó értékek száma ge agy ekkor osztályozással osztályközös gyakorság sorokat képezük, az osztályokba sorolt adatokat az osztályközéppel (u ) jellemezzük. Ekkor a súlyozott számítás a következőképp törték: fu 1 Xa [-4] f 1 A gyakorságot emcsak abszolút számokkal, haem a relatív gyakorsággal (g ) s kfejezhetjük: 33

34 X g u [-5] a 1 A számta átlag: érzékey a kugró értékekre em mdg tpkus érték a sor legksebb és legagyobb eleme között helyezkedk el az átlagtól vett eltérések előjel szert összege 0 Ha mde smérvértéket az átlaggal helyettesítük, az összeg em változk. A égyzetes eltérésösszegek között a számta átlagé a legksebb, azaz x A mmáls, ha A x. 1 Az smérvértékek mdegykét B számmal megszorozva és/vagy A számmal övelve (csökketve) az átlag s így változk: y B x 1,,..., akkor y B x y x A 1,,..., akkor y x A..1. Kroológkus átlag A kroológkus átlag az állapot dősor adataból számított specáls számta átlag. Számításáak alapja, hogy két szomszédos dőpotba mért állomáyok átlaga az dőszak átlagát adja. A teljes dőtartamra voatkozó átlag az dőszakok átlagáak az átlagolásával határozható meg: x1 x x x3 x 1 X [-6] k Harmokus átlag A harmokus átlagot olya teztás vszoyszámok átlagáak meghatározására haszáljuk, amelyek fordított aráyt tükrözek. A harmokus átlag eseté azt az értéket keressük, amelyek recprokát az eredet adatok helyére írva, egyelő az eredet adatok recprokértékeek összegével. Egyszerű harmokus átlag: Xh 1 [-7] x Súlyozott harmokus átlag: X h 1 f 1 1 f 1 x [-8] 34

35 ..1.4 Mérta átlag A mérta átlag az dőbel, damkus folyamatok változás üteméek átlagát adja. Számítását leggyakrabba a damkus vszoyszámok segítségével végezzük el. Egyszerű mérta átlag: Súlyozott mérta átlag: X X g g x [-9] f 1 x f [-10]..1.5 Négyzetes átlag A égyzetes átlag meghatározásáál azt a számot keressük, amelyet az eredet adatokat helyettesítve az adatsor égyzetösszege változatla marad. Egyszerű égyzetes átlag: Súlyozott égyzetes átlag: X X q q x [-11] fx f [-1] A égyzetes átlagot öálló formába em haszáljuk, általába az átlagtól vett eltérések átlagos távolságáak meghatározására haszáljuk. Mdg a vzsgálat célja, az elemez kívát jeleség tulajdosága határozzák meg, hogy mlye típusú átlagot számoluk. Ugyaabból a sokaságból számított külöböző átlagok agysága eltér egymástól: Xh Xg Xa Xq [-13].. Helyzet középértékek A gyakorlatba em mdg az átlagok a legalkalmasabbak a sorok jellemzésére, haem az olya mutatók, amelyek helyzetük révé jellemzk a statsztka sort, vagy a sorszámuk matt, vagy pedg a legagyobb gyakorság cetrumába helyezkedek el. Az lye középértékeket helyzet középértékek evezzük....1 Medá A medá a sorba redezett adatsor közepé elhelyezkedő középérték, amelyél az összes előforduló smérvérték fele ksebb, fele agyobb. A medá a ragsorolt adatok N 1 -k eleméek az értéke. Ha az értéksor páratla számú adatból áll a medá a középső adat értéke, ha páros, akkor a két középső szám számta átlagáak az értéke. 35

36 Ha a jeleség agyszámú megfgyelésből áll a medá, mt felező érték az értékek eloszlásáak megítélésébe játszk fotos szerepet. Sok adat eseté célszerű azokat osztályba sorol. Ebbe az esetbe a medá meghatározásáak módja: 1 f me 1 Me mex0 [-14] f ahol me x0 a medát tartalmazó osztály alsó határa f me 1 a gyakorságok kumulált összege a medát tartalmazó osztályg f me a medát tartalmazó osztály gyakorsága az osztályközök agysága me... Módusz A módusz a tpkus smérvérték, dszkrét smérv eseté a módusz a leggyakrabba előforduló smérvérték, folytoos smérv eseté a gyakorság görbe maxmumhelye. Előfordul, hogy az értéksor gyakorsága közel azoos, lyekor a sorak kfejezett módusza. Vaak olya statsztka sorok, amelyekek két módusza va (U vagy M alakú sorok). A csoportosító smérvekkel törtéő részsokaságokra törtéő botással általába a több móduszból eredő problémák megszütethetők. Osztályközös gyakorság sorok eseté meg kell keresük a legagyobb gyakorságú osztályt, ez lesz a modáls köz. A modáls köz aráyos osztásával határozhatjuk meg a móduszt: fmo fmo 1 Mo mox0 [-15] (f f ) (f f ) mo mo1 mo mo1 ahol mo a modáls köz alsó határa mo x0 f a móduszt tartalmazó osztályköz gyakorsága fmo 1 fmo 1 a modáls közt megelőző osztály gyakorsága a modáls közt követő osztály gyakorsága az osztályközök agysága.3 Változékoyság A középértékek a sokaság elemeek értékagyságbel külöbséget eltakarják. A változékoyság az azoos tulajdoságú, de eltérő értékagyságú adatok egymástól vagy középértéktől való külöbözőségét mér. 36

37 .3.1 A szóródás terjedelme A szóródás terjedelme a statsztka sor legagyobb és legksebb eleme között külöbség, azt mutatja meg, hogy a középérték mlye alsó és felső határérték között helyezkedk el. xmax xm [-16] Mél heterogéebb a sokaság aál rosszabbul jellemz a terjedelem, amt legkább homogé sokaságok jellemzésére haszálhatuk..3. Kvatls értékek A gyakorság sorok eseté a megfgyelt sokaság egységeből képezük egyelő vagy em egyelő osztályközű statsztka sort. Ebbe az esetbe az egyes osztályközök gyakorsága általába külöbözek egymástól. A megfgyelt sokaságot azoba úgy s felbothatjuk osztályokra, hogy az egyes osztályközökbe a megfgyelések száma egyelő legye. Ha k számú osztályt szereték képez, akkor az osztópotok száma k 1 lesz. Az osztópotokat k-ad redű kvatlsekek evezzük, ahol k. Az edk k ad redű kvatlls az a szám, amelyél az összes előforduló smérvérték ad k része ksebb, 1 ad része agyobb. k A gyakorlatba evezetes kvatls értékeket szoktuk meghatároz, így a medát a medá meghatározásával a helyzet középértékekél részletese foglalkoztuk, a kvartlst tt a sokaságot 4 egyelő gyakorságú részre osztjuk, a kvtlst 5 egyelő rész, a declst 10 egyelő rész, és a percetlst 100 egyelő részre osztjuk a sokaságot. A kvatls értékek számítása a szélsőséges értékek kezelése matt fotos számukra, a szóródás terjedelméek meghatározásáál feltárt problémát korrgálja Kvartls eltérés A kvartls eltérés számításáál előbb a kvatlsekél smertetett módo meghatározzuk az osztópotok sorszámát, majd az azokhoz tartozó kvartls értékeket. Alsó kvartls: 1 Q1 4 [-17] Középső kvartls (medá): 1 Q [-18] Felső kvartls: 3( 1) Q3 4 [-19] A fet sorszámokhoz tartozó értékek adják a kvartlsek értékét. Gyakorság sorokál a meghatározás módja: Q Q Qx0 f Q1 f 1 [-0] Q 37

38 ahol Q x0 az -edk kvartls értéke Q a kvartls adatsorszámáak megfelelő adat alsó határa az -edk kvartls adat sorszáma Q Q1 f a kvartlst tartalmazó osztályg terjedő halmozott gyakorságok összege 1 f Q a kvartlst tartalmazó osztály gyakorsága az osztályközök agysága A kvartls értékek meghatározása utá határozható meg az terkvartls terjedelem: Q Q [-1] Q 3 1 Mt látható az terkvartls terjedelem a statsztka sor értékeek középső 50 %-át foglalja magába, az első egyed alatt (5%) és felett (5%) értékek kívül esek a mértékadó kvartlseke. A kvartls eltérés az terkvartls terjedelem fele: Q3 Q1 Qe [-].3.3 Középeltérés A középeltérés a statsztka sor elemeek a medától vett eltérése abszolút értékéek az átlaga: Egyszerű formába: Súlyozott formába: Me Me e e 1 1 (x Me) f (x [-3] 1 Me) [-4] f.3.4 Abszolút átlageltérés Az abszolút átlageltérés a statsztka sor elemeek a számta átlagtól vett eltérése abszolút értékeek az átlaga: 38

39 Egyszerű formába: Súlyozott formába: A A e e 1 1 (x X) 1 f (x X) f [-5] [-6] Az abszolút átlageltérés azt mutatja meg, hogy az egyes mérvértékek átlagosa meyvel térek el a számta átlagtól..3.5 Varaca A varaca vagy szóráségyzet a sokaság elemeek számta átlagtól vett eltérések éyzetösszegéből számított átlag: Egyszerű formába: S Súlyozott formába: S 1 1 (x X) [-7] f (x X) 1 f [-8] A szóráségyzet fotos szerepet tölt be a sokaság változékoyságáak az elemzésébe. Segítségével feltárhatók a változékoyság téyezőkét összetevő. Az lye jellegű vzsgálatokkal a varacaalízs foglakozk..3.6 Szórás A szórás a legfotosabb szóródás mutató, amelyet a varacából számítuk égyzetgyökvoással. Egyszerű formába: Súlyozott formába: S S 1 1 (x X) 1 f (x X) f ) [-9] [-30] 39

40 Jeletése hasoló az abszolút átlageltéréshez, azoba léyeges külöbség, hogy eek számításakor a sokaság értékek és a számta átlag külöbségeek égyzetösszegét számoljuk, és a égyzetre emeléssel a szélsőséges értékek abszolút értelembe vett agyságát s jobba hagsúlyozzuk. A égyzetgyökvoással az összehasolíthatóság érdekébe az eredet mértékegységhez térük vssza. Abból adódóa, hogy az átlagtól vett eltéréseket jobba hagsúlyozzuk, azo eset kvételével, amkor Ae 0 és így S =0, mdg S Ae áll fe..3.7 Relatív szórás vagy varácós koeffces Az elemzés sorá szükséges lehet: Külöböző vagy azoos tulajdoságú Külöböző szórású, de azoos átlagú Külöböző átlagú, de azoos szórású sokaságok összehasolítása. A szórás abszolút értékű mutatója erre kevéssé alkalmas, sokkal alkalmasabb erre az smérvértékek átlagtól vett átlagos relatív eltérése, amt relatív szórásak, vagy varácós koeffcesek evezük. Számítása: S V [-31] X Értéke egy dmezó élkül szám, amt százalékos formába s kfejezhetük. A számta átlag aál kább jellemz az smérvértékeket, mél ksebb a relatív szórás mértéke..3.8 Átlagos külöbség Az eddg megsmert szóródás mutatók számítása sorá vagy két evezetes érték között terjedelmet, vagy valamlye középértéktől való átlagos eltérést vzsgáltuk. Az átlagos külöbség meghatározásáál a mde lehetséges módo párba állított smérvértékek abszolút külöbségeből számítuk átlagot. Számítása: Súlyozatla esetbe: Súlyozott esetbe: G G k 1 j1 k 1 j1 x x f f x x j j j [-3] [-33] A G (G) mutató az mutatja meg, hogy az adott smérv értéke átlagosa meyre külöbözek egymástól. Az átlagos külöbség mutatója a kocetrácó elemzéséhez kapcsolódk ge szorosa. 40

41 .4 A mometumok A mometumok a külöféle átlagok és a szóráségyzet általáosításáak tekthetők, ahol em a középértéktől vett eltéréseket vesszük alapul, haem az smérvértékek és egy tetszőleges álladó szám külöbözetét. Eze eltérések hatváyat átlagoljuk. A mometum súlyozatla esetbe: Súlyozott esetbe: d (A) x A M (A) r M (A) r r r (x A) d (A) 1 1 k r r 1 1 f (x A) f d (A) [-34] [-35] [-36] A fet képletekkel meghatározott meységeket x smérv, vagy a gyakorság eloszlás A körül r-edk mometumaak evezzük. A=0 esetbe az általáos képletek r-edk mometumokat adak, amelyek jelölése M r. A Xeseté az úgyevezett r-edk cetráls mometumokhoz jutuk. A mometumok gyakorlat fotosságát az adja, hogy jól felhaszálhatók a gyakorság eloszlások alakjáak jellemzésére, mt azt a későbbekbe lát fogjuk..5 Alakmutatók Az alakmutatók arra adak választ, hogy a gyakorság eloszlások mlye tektetbe és mlye mértékbe térek el a ormáls eloszlás gyakorság görbéjétől. Az alakmutatók számításáak csak akkor va értelme, ha a gyakorság eloszlásuk egymóduszú. Ha egyél több módusz va, akkor az elemzést a sokaság részekre botásával kell folytatuk..5.1 Aszmmetra Az eloszlás akkor tekthető szmmetrkusak, ha feáll az X Mo Me. Abba az esetbe, ha Mo Me X jobboldal (poztív) aszmmetráról, ha X Me Mo baloldal (egatív) aszmmetráról beszélük (-1. ábra). A jobb lletve baloldal aszmmetra megkülöböztetésébe elég agy káosz fgyelhető meg a szakrodalomba. Vaak, akk baloldal aszmmetráról akkor beszélek, ha a megfgyelések legagyobb része az átlagál ksebb, és hossza jobbra elyúló farok fgyelhető meg az sűrűségfüggvéyél, míg mások szert ez jobb oldal aszmmetra. Ha módusz agyobb az átlagál, akkor s hasoló a helyzet, természetszerűleg fordított értelembe. A gyakorlatba azoba em s az elevezés a fotos, haem a kapott eredméyekre adott kelégítő válasz. 41

42 -1. ábra: Baloldal (egatív) és jobboldal (poztív) aszmmetra alakja Forrás: Saját szerkesztés Az aszmmetra mérésére többféle mutatószám haszálatos: Pearso-féle mutatószám: X Mo AP [-37] S A mutatószám egy dmezó élkül szám, am baloldal aszmmetráál poztív, jobboldalál egatív. A mutató értékagysága a gyakorlatba -1 és +1 közé eső érték. 0 értékél szmmetráról va szó, 0.5 felett erős aszmmetráról, az előjel pedg a ferdeség ráyát mutatja meg. A Pearso-féle mutatószámot meghatározhatjuk arra a gyakorlat megfgyelésre támaszkodva s, hogy eyhé aszmmetrkus gyakorság eloszlások eseté a medá az átlagtól az átlag és a módusz között teljes távolság harmadával balra, vagy jobbra esk. Eek alapjá az aszmmetramutató: A P 3(X Me) [-38] S A számítógépes programcsomagokba az asszmmetra mérőszáma a harmadk cetráls mometum meghatározásá alapszk. 3 f (x X) 1 M 3(X) [-39] f Az aszmmetra mutatószáma: M 3(X) 3 [-40] 3 S A egatív érték jobboldal aszmmetrát, a poztív baloldalt, a 0 pedg szmmetrkus eloszlást jelez. Hátráya eek a mutatóak, hogy em adható meg az aszmmetra mértékére alsó és felső határ, és agyo érzékeye reagál az eloszlás alakjáak ksmértékű változására s Lapultság, csúcsosság A lapultság (vagy csúcsosság) mutató a gyakorság görbe középső szakaszáról yújt formácót számukra. Arról, hogy a ormál eloszláshoz képest a sűrűségfüggvéy csúcsosabb, vagy lapultabb (-. ábra). 4

43 Számítása ge egyszerű a percetlsek alapjá: P 75 P 5 Q K P P P P [-41] Belátható, hogy a mutató számítása azo okfejtése alapszk, hogy mél ksebb az terkvartls terjedelem és a P 90 és a P 10 külöbségéek a háyadosa, aál csúcsosabb az eloszlás. Normál eloszlásál a K értéke 0,6315. Tehát ha a K értéke ksebb, mt 0,6315 akkor csúcsos (leptokurtkus), ha agyobb, akkor lapult (platkurtkus az eloszlás). -. ábra: Lapult (platkurkus), csúcsos (leptokurkus) eloszlás a ormál gyakorság görbéhez képest Forrás: Saját szerkesztés A lapultság meghatározása leggyakrabba a egyedk cetráls mometum felhaszálásával törték. A statsztka és ökoometra programok s általába ezt a mutatót haszálják. A egyedk cetráls mometumot a következőképpe határozhatjuk meg: 4 f (x X) 1 M 4(X) [-4] f A egyedk cetráls mometum értéke 0 várható érték és 1 szórás eseté 3, eek alapjá a csúcsosság meghatározása: M4(X) 4 3 [-43] 4 S A mutató poztív értéke a ormáls eloszlásál csúcsosabb, egatív értéke lapultabb, a 0 értéke a ormáls eloszlással azoos csúcsosságú eloszlást mutat. Az 4 hátráya hasolóa az 3 -hoz az, hogy em előre meghatározott határok között mozog az értéke, ematt a ksebb csúcsosság eltéréseket felagyíthatja. Felmerül a kérdés, hogy a számítógépes programok mért haszálják mégs a mometumokból számított alakmutatókat? Egyrészt azért, mert az 3 és az 4 egyarát köye számítható a legtöbb eloszlástípus eseté az adott eloszlás paraméterevel, másrészt azo eloszlások eseté s megbízhatóa jelz az eloszlás alakját, ha az extrém módo eltér a ormáleloszlástól. 1.6 A szélsőséges adatok kezelése Valamely tulajdoság értékéek agyságát az egyéb smérvek értékagyságáak redkívül változatos kombácó határozhatják meg. Ebből adódóa a kválasztott 43

44 tulajdoság értéke agymértékű változékoyságot mutatak. Az átlagok ge érzékeyek az adatsor értékagyságára, és ebből adódóa a szóródás mutatók s. Sok esetbe jellemzőbb képet kapuk a sokaságról az extrém értékek bzoyos háyadát elhagyva. Nézzük meg, hogy az extrém adatok kezeléséek mlye eszköze vaak: Összefoglalás Nyesett átlag: a agyság szert sorba redezett megfgyelések két végé az értékekből 5-5 %-ot elhagyuk, és így számítjuk k az átlagot. Köye belátható, hogy szmmetrkus eloszlás eseté a hagyomáyosa számolt, és a yesett átlag közel megegyezk. Balra ferde eloszlás eseté a yesett átlag agyobb, míg jobbra ferde eloszlás eseté a yesett átlag ksebb a számított átlagál. Box-plot: ebbe az esetbe az terkvartls terjedelem ( Q ) határat (Q 1 és Q 3 ) csökketjük lletve öveljük, és szélsőséges adatkét kezeljük az e határoko túl értékeket: o Eyhe outlerek meghatározása: Q11,5 Q [-44] Q 1,5 1 Q o Extrém outlerek meghatározása: Q 3 Q 1 Q 3 1 Q [-45] Az átlagoktól távol eső megfgyelések súlyozása M-esztmátorok segítségével: ekkor em hagyjuk el a szélső értékeket, csak a távolság övekedésével csökkeő súlyokat aduk ekk. A leíró statsztka smeretek fotosak az ökoometra eszközök megértéséhez és alkalmazásához. Az ökoometra módszerta alapját a matematka statsztka adja. A vzsgálat tárgyát képező tömegjeleségeket sokaságak evezzük. A sokaság egyedeek tulajdosága az smérvek, melyek lehetővé teszk a sokaság egyértelmű elhatárolását. Az smérvek segítségével végezhető el az adatak megfelelő elemzésre alkalmas csoportosítása. Fotos, hogy fgyeljük arra, hogy adatak mlye mérés sztűek, mert ez alapvetőe determálja az elvégezhető vzsgálatok, az alkalmazható módszerek körét. A sokaságok jellemzésére középértékeket alkalmazuk. A helyzet középértékek (medá módusz) helyzetükél fogva jellemzk a sokaságot. Gyakra alkalmasabba mutatják a sokaság tulajdoságat, mt a számított középértékek. A számított középértékek (számta, kroologkus, harmokus, mérta átlag) alkalmazásáál em mdegy, hogy az alapadatok mlye összegzéséek va értelme. A középértékek ugya mdg az adatsor legksebb és legagyobb eleme között helyezkedek el, azoba em mdg jellemzk megfelelőe a sokaságot. A szóródás és alakmutatók erről yújtaak számukra formácót. Elleőrző kérdések 1. Mlye sokaságtípusokat smer?. Hogya képzük meység sorból osztályközös gyakorság és értékösszeg sorokat? 3. Mkor alkalmazható a harmokus és mkor a számta átlag? 4. Ismertesse a külöböző mérés szteket! 44

45 5. Melyek a legfotosabb szóródás mutatók? 6. Hogya jellemezhető egy eloszlás aszmmetrája? Kompetecát fejlesztő kérdések 1. Mért szükséges a szélsőséges adatok smerete, és hogya kezelhetjük azokat?. Mlye egyszerű statsztka módszerekkel jellemeze egy állapotdősort? 3. Mlye egyszerű statsztka módszerekkel jellemeze egy tartamdősort? 45

46 3 Statsztka hpotézs vzsgálatok Equato Chapter (Next) Secto 3 A gyakorlatba csak rtká va arra lehetőségük, hogy a teljes sokaság adata alapjá hozzuk dötéseket, ezért mták alapjá kell ezt megteük. A hpotézsvzsgálat sorá a vzsgálat eredméye alapjá azt vzsgáljuk, hogy a mtából yert adatok géyelek-e külö magyarázatot, elemzést. A tovább vzsgálatokak ugyas csak akkor va értelme, ha a mtából vagy mtákból yert adatok eléggé külöbözek egymástól vagy egy valamlye elvárt értéktől, és az eltérés em csak a mtavétellel szükségszerűe együtt járó véletleszerű gadozásokak tulajdoítható. A statsztka próbák pedg éppe eek az elemzésére szolgálak. De a próbákat alkalmazuk a gazdaság vagy társadalm jeleségek leírására alkalmazott statsztka, ökoometra stb. modellekél s. A modellépítések ugyas ge léyeges eleme md a modell egyes kompoesere voatkozó bzoyos feltevések teljesüléséek elleőrzése, md a modellel yert becslésekek a valóság téyevel való egybevetése. Mdkét feladat megfelelő hpotézsvzsgálatok segítségével oldható meg a leghatékoyabba. Elegedő tt a regresszós modellek feltételredszeréek elleőrzésére szolgáló tesztekre, valamt a regresszós együtthatók bzoyos ktütetett értékekkel való összehasolítására haszálatos tesztekre utal (Vta, 011). Ebbe a fejezetbe először rövde áttektjük a mtavételezéssel kapcsolatos fogalmakat, majd részletesebbe foglalkozuk a statsztka hpotézsvzsgálat végrehajtásával, és a külöböző feltételek mellett alkalmazható statszka próbákkal. 3.1 Mtavételezéssel kapcsolatos alapfogalmak A statsztkába tömegese előforduló jeleségeket fgyelük meg (közgazdaság jellegű becslések eseté). A statsztka mtavétel a sorá a sokaságból egyedeket választuk k valamlye módszerrel, azért, hogy smereteket szerezzük a megfgyel kívát sokaságról, és statsztka következtetése alapuló előrejelzéseket tehessük. A közvetleül vzsgált korlátozott számú egyed a mtasokaság, vagy egyszerűe mta. A mtavételezés oka: a teljes körű megfgyelés lehetetle (pl. termésbecslés), a teljes körű megfgyelés költsége agyobb, mt az formácó gazdaság értéke, lletve olcsóba jutuk kelégítő potosságú formácóhoz, a megfgyelés a termék megsemmsítésével jár (külöböző mőségvzsgálatok), kísérletek (ks elemszámú mták értékelés módszere). A mtavétel három fő előye, hogy a költségek alacsoyabbak, az adatgyűjtés gyorsabb, és mvel az adathalmaz ksebb, bztosíta lehet a homogetását, és fokoz lehet az adatok potosságát és mőségét. A mták alapjá törtéő értékelések alapelve: Nagy számok törvéye (Beroull ): bármlye, ks tetszőleges poztív szám legye a relatív gyakorság és a valószíűség eltérése (Δ), mdg végezhető ay megfgyelés, hogy eleyésző legye aak a valószíűsége, hogy a hba a Δ-t meghaladja. A közpot határeloszlás tétele (Ljapuov ): ha valamely tömegjeleség adott paramétere mt valószíűség változó agyszámú, egymástól függetle valószíűség változó összegzésekét jö létre, és ezek egyekét csak ksmértékbe járulak hozzá az egész gadozáshoz, akkor az adott paraméter eloszlása jó közelítéssel ormáls eloszlású. 46

47 A mtavétel folyamata: a) Defáljuk a vzsgáladó sokaságot A statsztka elemzés skerességét befolyásoló léyeges lépésről va szó. A vzsgáladó sokaság valóságos sokaság egységek vagy eseméyek halmazát jelet, melyek dőbel és térbel dmezója s lehet, az alapsokaságot jelet. Általába egyértelműe, és köye meghatározható, de éha em túl egyszerű, sőt az s előfordulhat, hogy a mta, em abból a sokaságból származk, amek a tulajdoságaról akaruk formácókat. Például ha egy élelmszerpar termék gyártásakor a termékre voatkozó meység, mőség értékeléshez, előrejelzéshez gyűjtük adatokat, akkor köyű helyzetbe vagyuk. Az állatkísérletek célja gyakra az ember működéséek a jobb megsmerése az új gyógymódok hatékoy és bztoságos alkalmazásáak érdekébe. Cél az, hogya találjuk a teljes sokaság reprezetatív mtáját. b) Meghatározzuk mtavétel keretet A mtavétel keret, egy olya eszköz, mely lehetővé tesz számukra, hogy a sokaság mde egyes elemét azoosítsuk és bevojuk bármely mtába. A legegyszerűbb keret típus a sokaság elemeek az elérhetőség formácókkal ellátott lstája. Ilye lehet például telefoköyv, cégjegyzék stb. c) Meghatározzuk a mtavétel eljárást Véletle kválasztáso alapuló módszerek ) Egyszerű véletle kválasztás: (az alapsokaság elemet sorszámozzuk) Sorsolással törtéő kválasztás Véletle számok táblázatáak alkalmazása Mechakus kválasztás - egymástól egyelő távolságra lévő egyedeket választuk k, lehet dőbel és térbel (pl. próbafejések adott dőközökét, térképre helyezett hálózat). Véletle koordáták módszere (egyeletes térbel elhelyezkedésű sokaságál, pl. legelő, övéyek termés becslése) ) Rétegezett mtavétel: a heterogé alapsokaságot rétegere botjuk, s ezekből külö külö törték a mtavétel (vállalkozó, alkalmazott jövedelem vszoyok) ) Lépcsőzetes kválasztás: csak akkor alkalmazzuk, ha em smerjük az alapsokaság mde egységét (pl. árbecslés, homogé sokaság eseté) Nem véletle kválasztáso alapuló módszerek: ) Kvóta szert kválasztás az alapsokaságot körzetekre botják és eze belül aráyokat, kvótákat határozak meg. (közvéleméykutatás, háztartás statsztka felmérések) ) Kocetrált kválasztás (árstatsztka megfgyelésekél, a legjellemzőbb típusok kerülek a mtába). 47

48 ) Ökéyes kválasztás szubjektív alapo a tpkusak vélt elemeket voják be a mtába. A em véletlee alapuló mták jellemző csak tájékoztató jellegűek az alapsokaság jellemzőt lletőe. d) Megszabjuk a mta agyságát A mta jóságát a mta stadard hbájával jellemezhetjük: Ismétléssel törtéő kválasztás eseté: Ismétlés élkül kválasztás eseté: S x S x S S 1 N [3-1] [3-] [3-1] és [3-] alapjá belátható, hogyha a sokaság vszoylag agy, akkor a mta stadard hbája, azaz az eredméyek megbízhatósága csak egyedül a mta abszolút agyságától függ. Ez azt jelet, hogy ksebb populácóhoz relatíve agyobb mtát kell ve, agy populácók esetébe pedg meglepőe ks mták s elégségesek. Ha az alappopulácót alcsoportokra botjuk valamely szempot szert magasabb mtaelemszám szükséges. Tovább lépések: e) Létrehozzuk a mtavétel tervet. f) Mtát veszük, és adatokat gyűjtük. g) Felülvzsgáljuk a mtavétel eljárásukat. 3. A satsztka vzsgálatokkal kapcsolatos alapfogalmak Amkor dötést akaruk hoz, feltételezéseket fogalmazuk meg, amelyek lehetek gazak, vagy hamsak ezért evezzük őket statsztka hpotézsekek. Dötésüket a mta alapjá kalkulált értékek segítségével tudjuk meghoz. Mvel a mtavételt a véletle befolyásolja, a számolt statsztka mutatók valószíűség változók leszek. A statsztka próba az az eljárás, amely sorá eldötjük, hogy az adott hpotézs elfogadható-e, vagy sem. A módszer alkalmazása sorá összehasolítuk két számot: a kszámított próbastatsztka értékét és egy táblázatbel (krtkus) értéket. A statsztka hpotézsvzsgálat meete: Szakma (kutatás) hpotézs megfogalmazása (gyakra még em olya formába va megfogalmazva, hogy aak helyessége a statsztka eszközevel közvetleül vzsgálható) Megfogalmazzuk a ullhpotézst és az alteratív hpotézst. Megkeressük a megfelelő próbafüggvéyt. Megválasztjuk a szgfkaca-sztet. A mtából kszámítjuk a próbafüggvéy aktuáls értékét. 48

49 Meghatározzuk az elfogadás tartomáyt. Ha a próbafüggvéy értéke az előbb meghatározott elfogadás tartomáyba esk, akkor elfogadjuk a ullhpotézst, egyébkét az alteratív hpotézst kell elfogaduk. A feltételezésük matematka megfogalmazása a ullhpotézs. Alakja egyelőség, két érték azoosságát állítja. A evét oa kapta, hogy e két érték külöbsége ulla. Például a sokaság várható értéke (µ) megegyezk egy előre rögzített értékkel (m 0 ). H 0 : µ=m 0. Ezzel szembe megfogalmazuk egy ellehpotézst s, amt úgy evezük, hogy alteratív hpotézs (H 1 ). A két hpotézsek olyaak kell lee, hogy azok (1) a formáls logka szabálya szert kzárják egymást, azaz e lehesseek egyszerre gazak, () bármelykét s tektjük majd a máskál hhetőbbek, megválaszolható legye a beüket érdeklő kérdés. A hpotézsvzsgálat közvetleül mdg a ullhpotézs helyességéek elleőrzésére ráyul. Ezért a két hpotézs em játszk szmmetrkus szerepet, em cserélhető fel tetszés szert. A ullhpotézs szte mdg azt modja k, hogy valam egy adat vagy egy eloszlás em tér el valam mástól: egy másk adattól vagy eloszlástól. A hpotézsvzsgálat végzőjét ge gyakra em az érdekl, hogy a ullhpotézs feáll-e vagy sem, haem sokszor az alteratív hpotézsbe szereplő állítás helyessége. Azoba, ha betartják a H 0 és H 1 megfogalmazásával kapcsolatos első követelméyt, a ullhpotézs helyességéről való dötés egybe dötést jelet az alteratív hpotézs helyességéről s. Ha mód va rá, H 0 -t és H 1 -t célszerű úgy megfogalmaz, hogy H 0 elvetése legye gazá fotos számukra (Vta, 011). Az alteratív hpotézs lehet kétoldal vagy egyoldal alteratív hpotézs. Tehát az előző példából kdulva: Nullhpotézs: H 0 : µ=m 0 Kétoldal alteratív hpotézs: H 1 : µ m 0 Egyoldal alteratív hpotézs: H 1 : µ<m 0 (baloldal) H 1 : µ>m 0 (jobboldal) A ullhpotézs felállítása utá egy olya próbafüggvéyt kell szerkeszte, amely egyrészt a véletle mta elemek a függvéye, azaz valószíűség változó, másrészt valószíűségeloszlása a ullhpotézs helyességéek feltételezése mellett matematka úto meghatározható. A próbafüggvéy alapjá kjelölhető egy olya tervallum, amely tetszőlegese agy valószíűséggel magába foglalja a próbafüggvéy értéket, másképpe fogalmazva a jellemzők között külöbségek eloszlása alapjá megállapítható aak a valószíűsége s, hogy a mták között külöbség meghalad-e bzoyos határértéket. Az tervallum két végpotja a krtkus érték, az tervallum az elfogadás tartomáy (3-1. ábra, 3-. ábra). A megbízhatóság szt (kofdeca szt: 1-α) a ullhpotézs elfogadására voatkozó dötés helyességéek a valószíűségét fejez k, ameybe a ullhpotézs gaz. A szgfkaca szt (α) a hbás dötés valószíűsége ugyacsak ullhpotézs eseté. Az emprkus szgfkaca szt (p érték) aak a valószíűsége, hogy a próbastatsztka a mtából kszámított értéket vesz fel. Mél ksebb a p érték, aál agyobb a valószíűsége, hogy a H 0 hpotézs hams. A próbastatsztka értéke a ullhpotézs érvéyességétől, a krtkus érték agysága a megbízhatóság szttől függ. Mvel a mta a véletletől függ, ezért soha em lehetük bztosak abba, hogy a hpotézs gaz, vagy sem. A statsztka dötés sorá kétféle hbát követhetük el. Első fajú hba (α) eseté a ullhpotézst elutasítjuk, pedg gaz. Az első fajú hba elkövetéséek a valószíűsége megegyezk a szgfkacaszttel. A hba agysága a szgfkacaszt 49

50 csökketésével alacsoyabb lesz. Másodfajú hba (β) eseté elfogadjuk a ullhpotézst, pedg az em gaz. Ez a hba a szgfkacaszt övelésével csökkethető. H 0 Ha gaz Ha hams H 0 elfogadása Helyes dötés Másodfajú hba H 0 elvetése Első fajú hba Helyes dötés Látható, hogy a két hbafajta egymással elletétese mozog. Együttes csökketésük a mtaelemszám övelésével érhető el ábra: Kétoldal statsztka hpotézs (H 0 : µ=m 0 ;H 1 : µ m 0 ) Forrás: Huzsva, 01 50

51 3-. ábra: Egyoldal aszmmetrkus statsztka hpotézs (H 0 : µ=m 0 ;H 1 : µ>m 0 ) Forrás: Huzsva, 01 Az tervallum vagy a háyados skálá végzett mérésekél az adatokból számolhatuk átlagot, szóráségyzetet, szórást. Fotos módszerek alapulak ezekek a származtatott paraméterekek a matematka, logka tulajdosága; ezeket a módszereket paraméteres módszerekek evezk. Köyű belát, hogy például a omáls skálá mért adatok esetébe em helyévaló átlagot számíta, és - következésképpe - em alkalmazhatók a paraméteres statsztka módszerek. Például, ha egy mtába csak fekete és szőke hajú egyéek vaak, akkor a mtára voatkozóa em lehet átlagos (pl. bara) hajszíről beszél. A omáls és az ordáls skálá mért adatokkal számos módszer alkalmazható, melyek egyk közös tulajdosága, hogy em kell hozzájuk az, hogy az adatokból átlag, vagy szórás számolható legye. Általába modható, hogy ezek a módszerek em az smert evezetes eloszlás, a ormáls eloszlás paramétereek tulajdosága alapulak, ezeket emparaméteres módszerekek szokták evez. 3.3 Nem-paraméteres statsztka próbák A em-paraméteres eljárások alkalmazásáak esete: Nomáls skálá mért adatoko elvégezhető. Ordáls (redezett) skálá mért adatoko elvégezhető. Itervallum skálá mért adatoko aélkül végezhető el, hogy azt kellee feltételezük, hogy az adatok egy adott tulajdoságokkal redelkező 51

52 eloszlásból származak. Ebbe az esetbe az adatokat ragtraszformácóak vetjük alá. Ez azt jelet, hogy az tervallum skálá tett megfgyeléseket az ordáls skálá értékeljük k. A em-paraméteres módszerek előye Kevesebb feltételük va, így hbás alkalmazásuk esélye ksebb. Nomáls és ordáls változóko s haszálhatók. Próbastatsztkák számítása sokszor egyszerűbb. Skálaérzéketleek, azaz az adatok traszformálása em befolyásolja a tesztek eredméyét. Kevésbé érzékeyek a kugró adatokra. Nem csak az átlag külöbséget tudjuk vzsgál, haem az eloszlás más tulajdoságáak (például ferdeség fellépése kezelés hatására) változását s. A em-paraméteres módszerek hátráya: Erejük ksebb mt a paraméteres megfelelőkek (azok feltételeek teljesülése eseté) de ez sokszor em jeletős (kb. 5 %). Sok (főleg a komplkáltabb) parametrkus tesztek cs meg a emparametrkus megfelelője, főleg az elmélet háttér boyolultabb volta matt Eloszlásokra voatkozó próbák (Ch - próba) A sokaságok százalékos megoszlására vagy a valószíűség változó eloszlására voatkozó hpotézs elleőrzésére szolgál. Dszkrét és folytoos valószíűség változó eloszlásáak vzsgálatára egyarát alkalmas oly módo, hogy osztályokat képezük, és az osztálygyakorságokat, vagy a relatív osztálygyakorságokat, ll. a megfelelő valószíűségeket vzsgáljuk. Feltételek (f : az -edk osztály megfgyelt gyakorsága): Nagy mta ( 50). Valamey megfgyelt osztályba az osztálygyakorság f 1. Maxmum az osztályok 0%-ába lehet f Illeszkedésvzsgálat Tszta lleszkedésvzsgálat: a mta eloszlását hasolítjuk egy elmélet eloszláshoz. * ( f f ) * [3-3] f ahol f : az -edk osztály megfgyelt gyakorsága f * : az -edk osztály várt gyakorsága : a mta elemszáma Ha a megfgyelt gyakorságok messze vaak a várttól, akkor ez az összeg agy lesz, ha azoba közel, akkor kcs. Így megad egy mértéket a megfgyelt és a várt gyakorságok távolságáak mérésére. Ezek utá elő kell ve a -eloszlás táblázatát, és meg kell bee éz a számolt értékhez tartozó valószíűséget. A táblázatokba általába csak bzoyos valószíűségekhez tartozó értékeket adak meg. Ha 5%-os szgfkaca szttel dolgozuk (azaz esetükbe 5

53 azt modjuk, hogy akkor utasítjuk el a ullhpotézsüket, ha ksebb, mt 5% a valószíűsége aak, hogy olya eredméyt kapjuk, amlyet kaptuk), akkor k kell keresük a táblázatból az 5%-hoz és a megfelelő szabadság fokhoz tartozó értéket, és össze kell hasolíta a számolttal. Ha a számolt agyobb a táblázatbel értékél, akkor elutasítjuk hpotézsüket. Becsléses lleszkedésvzsgálatál csak az eloszlás típusa smert (ormáls, expoecáls ), paraméteret a mta alapjá becsüljük, majd ezekre voatkozóa végzük lleszkedésvzsgálatot. * ( f f ) ( f p ) * f p [3-4] ahol f : az -edk osztály megfgyelt gyakorsága f * : az -edk osztály várt gyakorsága : a mta elemszáma p : az -edk osztály várt relatív gyakorsága Feltétel: a várható érték gyakorsága mde osztályba érje el legalább az 5 értéket (f * > 5) és a mta kellőe agy legye. Szabadság fokok: tszta lleszkedésvzsgálatál szf = k-1, becsléses lleszkedésvzsgálatál szf = k-1-b, ahol a k : a csoportosítás sorá képezett osztályok száma b : a mtából becsült paraméterek száma Homogetásvzsgálat Két függetle mta eloszlásfüggvéyéek összehasolítására szolgál. Arra a kérdésre válaszol, hogy származhat-e a két függetle mta azoos eloszlásfüggvéyű sokaságból? A próbastatsztka kszámolásához a megfgyelés egységeket mdkét 1 ll. elemű mta eseté azoos osztályokba soroljuk (k osztályt képzük), melyekre gazak a alább összefüggések: f, 1 1 A próbastatsztka értékéek kszámolása: f [3-5] 1 f 1 f 1 f1 f [3-6] 1 ahol 1, : a mta elemszáma f 1, f : osztályokét gyakorságok mtákét k: az osztályok száma. és a szabadság fok: k-1 A két sokaság azoosak tekthető, ha számolt táblázatbel. 53

54 Függetleség vzsgálat Az alapsokaság két smérv szert csoportosításakor s x t típusú kotgeca táblázatot kapuk. (s db csoportot képeztük az első, t db csoportot pedg a másodk szempot szert.) Vzsgálhatjuk, hogy az első szempot szert eloszlás függetle-e a másodk szempot szert eloszlástól. ( f f * f * ) f kl f k. f. l f k. f. l [3-7] ahol f : az -edk osztály megfgyelt gyakorsága f * : az -edk osztály várt gyakorsága : a mta elemszáma f kl : az első szempot k-adk és a másodk szempot l-edk osztálykombácójába tartozó egyedek elmélet relatív gyakorsága. f k. : az első szempot k-adk osztályáak gyakorsága. f.l : a másodk szempot l-edk osztályáak gyakorsága. A szabadság fokok száma: szf: (s-1)(t-1) Elfodgajuk a ullhpotézst ha számolt táblázatbel és elutasítjuk, ha számolt > táblázatbel Rag-korrelácós teszt A emparaméteres próbák arra s haszálhatók, hogy két változó, X és Y korrelácóját mérjék. A ragkorrelácós együtthatók azt mérk, hogy két sorozat együtt változk-e. Ha az egyk sorozat ő, a másk csökke, akkor a ragkorrelácók egatívak leszek. A leggyakrabba haszált ragkorrelácós együtthatók: Spearma-féle ragkorrelácó 6 p 1 ( 1) ahol d x y R R x R y R d : az egyk smérv (x) szert ragsorszám : a másk smérv (y) szert ragsorszám [3-8] A p értéke -1 és +1 között lehet. Például, ha a két sorred azoos, d = 0 mde re, tehát a ragkorrelácós együttható értéke 1. Kedall-féle rag-módszer vagy kokordaca mutató o Kedall-féle ragkorrelácó (τ) 54

55 c d 1 ( 1) ahol c : a megfelelő párok száma d : az eltérő párok száma o Kedall-féle kokordaca mutató [3-9] Több ragsor összehasolítása eseté haszáljuk. Például több bíró dötése között va-e valamlye azoosság. Kszámításáak alapja az, hogy egy jellemző összese háy helyezés potszámot ért el, amt ragösszegek evezük. A kokordaca mutató arról yújt formácót, hogy az egyes ragszámösszegek átlagtól való eltéréséek égyzetösszege hogya vszoyul a teljes összhagot jelető értékhez. max ( j ) [3-10] d R R d 3 m ( ) 1 d 1 d W d 3 max m ( ) ahol d: az eltérések égyzetösszege R j max : az -edk egyed ragösszege R : a ragszámösszegek átlaga d : a teljes egyetértés mutatója m : a dötéshozók száma : az értékelés téyezők száma W : a Kedall-féle egyetértés mutató [3-11] [3-1] Előjel-próba Pszchológa vzsgálatokba, közvéleméy kutatásokba gyakor, hogy azt vzsgálják, hogy egy mta egyede két lehetőség közül melyket preferálják. Például a televízó est főműsor dejébe sport műsort, vagy játékflmet ézéek-e a ézők szívesebbe. A két lehetőség között választás, vagy két (egymást kzáró) eseméy előfordulásáak valószíűsége elvleg azoos jellegű probléma. Például egy adott beteg populácóba a született gyermekek között a fúk és a láyok aráya azoos-e? Mdezekbe az esetekbe az egyk eseméy előjelét poztívak, a másk előjelét egatívak evezzük, és em egedük meg eldötetle esetet. Mdeze vzsgálatok eredméyét értékelhetjük az előjel próbával. Az előjel próbáak cs elterjedt, smert megfelelője a paraméteres próbák között. Köye észrevehető, hogy az előjel próbával értékelhető adatok esete léyegébe véve azoos a pézfeldobás kísérlet kmeeteléek vzsgálata esetével, amelyet a bomáls eloszlás írt le. Lehetek olya esetek, amkor em lehet egyértelműe eldöte az előjelet. Ezekbe az eldötetle esetekbe a megfgyeléseket em vesszük fgyelembe egyk típusú előjel számlálása sorá sem. 55

56 Páros mták eseté. Pl. adott két gép (külöböző típusú), és az általuk 1 ap alatt gyártott hbás csavarok száma. H 0 : a két gép között cs külöbség, ha a hbás csavarok száma eltér egymástól, az csak a véletle műve. Ilyekor vesszük a apota gyártott hbás csavarok számáak előjelét. Nap I. gép II. gép előjel Összese 3 + és 9 jelet kaptuk. A ullhpotézs szert 6 +-t és 6 jelet váruk el. A problémát bomáls megoszlással vzsgáljuk: PX ( 3) 0, 0193 k pk P( X k ) p ( 1 p ) k k [3-13] PX ( 4) 0, 0730 Kétoldal próbát kell végezük, mert H 0 azt állítja, hogy cs külöbség a gépek között (em pedg, hogy az I. jobb, mt a II.) Ezért az 5%-os szgfkaca-sztél: 0,05*(1/)=0,05 Mvel 0,0193 < 0,05 < 0,0730, akkor utasítjuk el a H 0 hpotézst, ha a pluszok száma vagy kevesebb. A + jelek száma vszot 3, így 5%-os szgfkaca szte em utasíthatjuk el a H 0 -t, lye szte cs külöbség a gépek között Ma-Whthey-Wlcoxo próba (U próba, ragösszegpróba) Két egymástól függetle mta medá értékéek összehasolítására szolgál, ha a mtaelemek párosíthatók, tehát a kétmtás t-próba emparaméteres megfelelője. Ordáls változókra s eseté s elvégezhető. Alkalmazásáak feltétele: Függetle mták Azoos formájú eloszlások. Folytoos és dszkrét valószíűség változók esetébe s haszálható. Kísérlet elredezés: Két függetle, véletle mta. A próba elvégzéséek meete a következő: Elvégezzük a ragtraszformácót. Az összes adatot (a csoporthoz való tartozástól függetleül) agysága szert sorba állítjuk, az adatok helyébe azok ragszámát helyettesítjük. Ha két, vagy több azoos adatot találuk, akkor azok helyébe az átlagos ragszámokat írjuk. Az így kapott ragszámokat az eredet csoportokra szétbotjuk. Ez a traszformácó az eredet megfgyeléseket az ordáls skálá fejez k. Ha a két csoport középértéke (medája) között cs külöbség (azaz H 0 teljesül), akkor md a két csoportba leszek alacsoy és magas ragszámú megfgyelések, és az átlagos ragszám értékek s közel azoosak leszek. Ha H 0 -t elvetjük, akkor az egyk csoportba agy valószíűséggel agyobb lesz az átlagos ragszám, mt a másk csoportba. Ez az eljárás hatékoyabb, mt a t-próba, ha a t-próba feltétele em teljesülek. Ha pl. az adatok eloszlása ferde, em csak helytele a t-próbát felhaszál, haem a hbása haszált t-próba téves következtetésekre s vezethet. Ha sok az azoos ragsorú érték, ezeket a teszt em vesz fgyelembe, és ezért lyekor kssé alulértékel a szgfkaca sztet. 56

57 Kétmtás t-próbát célszerű alkalmaz, ha a két sokaság amelyekből a két függetle mta származk, ormáls eloszlású. Vszot ha a ormaltás em áll fe, de a két populácó eloszlása azoos formájú akkor e próba alkalmazása ajálható. Ismerjük két külöböző ötvözetből készült kábelféleség mért erősségét: A ullhpotézsük (H 0 ): a két mta ugyaabból a sokaságból származk I. ötvözet: (cs külöbség a két mta között) 18,3; 16,4;,7; 17,8; Redezzük az összes mtaértéket, és adjuk sorszámokat ezekhez az 18,9; 5,3; értékekhez. (1-et a legksebbhez, 18-at a legagyobbhoz. Egyforma értékek eseté a megfelelő ragszámok átlagát adjuk (6 és 7 helyett mdkettőél 6,5-et) 16,1; 4, Számítsuk k mdkét mtára a sorszámok összegét. Jelölje a két összeget II. ötvözet: R 1 és R ; N 1 és N pedg redre a mta-elemszámokat. (N 1 N ) Az R 1 és R 1,6; 14,1; között szgfkás külöbség a két mta között szgfkás külöbségre utal. 0,5; 10,7; 15,9; 19,6; A teszteléshez haszáljuk az első mtához tartozó 1,9; 15,; 11,8; 14,7 N1N1 1 U N1N R1 [3-14] statsztkát. U mtavétel eloszlása szmmetrkus, átlag és varacája a következő módo számolható: 1 N1N N1 N 1 U U [3-15] 1 Ha N 1 és N s legalább 8, akkor U eloszlása közel ormáls lesz úgy, hogy U z U 0 átlagú és 1 varacájú ormáls eloszlást követ. Példákba: R 1 = 106, R = 65, N 1 = 8 és N = 10, U = 10; U = 40; U =11,5; z = -,67 Mvel a vzsgált H 0 hpotézs az, hogy cs külöbség az ötvözetek között, kétoldal próbát kell alkalmaz. 5%-os szgfkaca szte a dötés szabály: Elfogadjuk H 0 -t, ha -1,96 z 1,96. Eek alapjá elutasítjuk a H 0 -t Kruskal-Walls próba (H próba) A Kruskal.Walls próba eseté három, vagy több populácót hasolítuk össze, melyekből véletle egyváltozós mtát vettük. A H próba az egyutas osztályozás vagy egytéyezős kísérlet varacaaalízsére ad általáosítható em paraméteres módszert. Ez a próba külööse érzékey a medá változásara. Alaphpotézs és alteratív hpotézs: H 0 : A mták eloszlása em külöbözk egymástól. H 1 : Legalább két eloszlás külöbözk egymástól. Ha elvetjük H 0 -t, akkor arra következtetük, hogy a vzsgált populácók között vaak külöbségek. A próba feltétele: Véletle mtavétel (bztosítja az egyes változók egyelő eloszlását a H 0 feállása eseté) Függetle mták Legalább ordáls skálá mérhető változó 57

58 Tegyük fel, hogy k számú mták va, egyekét N 1, N, N k mtaagyságokkal, és így az összes mta N = N 1 + N + + N k elemszámú. Az összes mtát együtt kell ragsorol, és a ragösszegek: R 1, R, R k. k 1 R j H 3( 1) 1 N [3-16] N N j1 N j H mtavétel eloszlása közelítőleg k-1 szabadságfokú kh-égyzet eloszlást követ, feltéve, hogy az N 1, N, N k mdegyke legalább 5. Egy vállalat öt külöböző gépet tesztel beszerzés előtt. A tesztelés sorá 5 mukás egyelő deg dolgozk a gépeke. A táblázat a készített termékek számát mutatja. Tesztelje 5%-os szgfkaca szte, hogy cs külöbség a gépek között? A B C D E N = 5 A ragösszegek: A 17, ,5 70 B 1 6,5 1 6,5,5 48,5 C D, ,5 E ,5 6,5 73 k 1 R j H 3( N 1) 6,44 N N 1 N j1 k-1 = 4 szabadság fokál 5%-os szgfkaca szte krt = 9,49. Mvel 6,44 < 9,49 elfogadjuk a ullhpotézst, cs külöbség a gépek között. j Wlcoxo-féle előjeles rag próba Ez a próba olya kísérlet helyzetekbe alkalmazható, ahol a mtavétel a páros megfgyelése alapul, ahol két összefüggő változóból mtavétel törték, úgy, hogy mdegykből egy-egy jut egy megfgyelés egységbe. Az lye kísérlet elredezésből eredő adatok kértékelésére a paraméteres próbák közül az egymtás t próba alkalmazható, ha aak feltétele teljesülek (tervallum skálá mérhető adatok, melyek külöbségeek eloszlása ormáls). Ha a feltételek em teljesülek, például, mert a mérés skála ordáls, vagy a külöbségek eloszlása ferde, akkor alkalmazható a Wlcoxo-féle előjeles rag próba. A próba feltétele: Ordáls skálá mérhető folytoos valószíűség változók eseté akkor alkalmazható, ha a külöbségek s ordáls skálá mérhetőek. Erőse asszmmetrkus eloszlás eseté em alkalmazható. A kísérlet elredezés: Valamlye szempotból párosított megfgyeléseket végzük úgy, hogy a párok egyes tagja között a külöbség csak a kezelésbe legye. Ez a radomzált blokk elredezés legegyszerűbb esete. Nullhpotézs és alteratív hpotézs: H 0 : A két populácó eloszlása azoos. 58

59 H 1 : A két populácó eloszlása em azoos. Legye objektumuk, mdegykkel kapcsolatba két megfgyelést teszük, egyet kezelés előtt (X j ), a máskat kezelés utá (Y j ). A továbbakba csak azokra leszük tektettel ahol X j Y j. Legye z = X j - Y j. Vesszük a z külöbségek abszolút értékét, majd ezeket agyság szert redezzük. Jelölje R a z ragját a redezett sorozatba. Legye továbbá 1, ha zí 0 = 1,,, ( ) [3-17] 0, ha zí 0 A T ' 1 R kfejezés a poztív ragok összege. [3-18] Jelölje ξ = E(z ). Tehát a ullhpotézs: H 0 : ξ = 0, vagys, hogy cs külöbség a kezelések között, a próbastatsztka pedg T +. Ha a H 0 hpotézssel (1-α szte) szembe a H 1 alteratív hpotézs H 1 : ξ > 0 egyoldal alteratíva, akkor a krtkus tartomáy: K = {T + t(α, )}. Ha H 1 : ξ < 0 egyoldal alteratíva, akkor a krtkus tartomáy: K = {T + ( 1) - t(α, )}. Ha H 1 : ξ 0 kétoldal alteratíva, akkor a krtkus tartomáy: K = {T + ( 1) - t(α /, ) vagy T + t(α/, )},ahol α = α 1 + α ; a t(α, ) értékeket pedg táblázatból ézhetjük meg. Ha H 0 -t gazak 1 tételezzük fel, pedg agy, akkor mthogy eseté a T * 4 statsztkáak T 1 1) aszmptotkusa N(0,1) eloszlása va, így a stadard ormáls eloszlás táblázatát haszálhatjuk Fredma próba Amkor kétszeres osztályozással szóráselemzést akaruk végrehajta, de em teljesül a ormaltás, vagy a szórások egyelősége, akkor a Fredma próbát alkalmazhatjuk. Alkalmazásáak feltétele: Függetle mták. A mérések legalább ordáls skálá törtéjeek. A következő típusú problémát vzsgáljuk: számú objektumra k külöböző eljárást (kezelést) alkalmazuk. A kísérlet célja: megállapíta, hogy va-e külöbség a k számú (k>) eljárás között. Ha mde blokkba alkalmazzuk az összes eljárást, akkor véletleített teljes kísérlet elredezésről beszélük, egyébkét pedg em teljes kísérlet elredezésről. Most az előbbről lesz szó. Ez tehát egy többmtás próba, ahol a blokkhatást szereték kküszöböl, és a k eljárást összehasolíta. Blokk Eljárás 1 k 1 X 11 X 1 X 1k X 1 X X k 59

60 X 1 X X k A modell megegyezk a varacaaalízsbe alkalmazott kéttéyezős kísérlet elredezésű modellel X j = μ + τ + β j + ε j, = 1,,, k; j = 1,,,. μ a közös várható érték, β j a j-edk blokk hatása, τ az -edk módszer (kezelés) hatása, e j a véletle okozta eltérés A H 0 : τ 1 = τ = = τ k hpotézst vzsgáljuk a H 1 : em mde τ egyelő alteratívával szembe. Ha H 0 -t elvetjük, akkor páros összehasolításokkal kell felderíteük a csoportok között esetleges külöbségeket. Erre az előjel próbát kell haszáluk. Mde blokkba redezzük agyság szert a k megfgyelést és jelöljük r j -vel az X j ragját. Legye 1 S k k 1 1 R R r j j 1. k R k [3-19] k k 1 Ha H 0 -t gazak tételezzük fel, pedg agy, akkor Az S statsztka aszmptotkusa χ eloszlású (k-1) paraméterrel. Az elfogadás tartomáy S < χ k-1, α, ahol α a próba szgfkacasztje. 3.4 Paraméteres statsztka próbák Ha az eloszlás jellege smert, és a ullhpotézsük az eloszlás valamely paraméterére voatkozk, paraméteres próbáról, ellekező esetbe emparaméteres próbáról beszélük. A paraméteres próbák alkalmazása omáls és ordáls mérés sztű változók eseté em ajálott Középértékekre voatkozó próbák Egymtás próbák: Egymtás u-próba (z-próba) Az u-próba alkalmazásakor a céluk a mta középértékéek összehasolítása egy feltételezett középértékkel. Arra válaszol, hogy származhat-e az x középértékű mta egy μ középértékű sokaságból? o A ullhpotézs: H 0 : x =μ o Ellehpotézs (kétoldal szmmetrkus): H 1 : x μ Alkalmazhatóság feltételek: o Normáls eloszlású populácó o Ismert szórás A gyakorlatba alkalmazzák tetszőleges eloszlású populácók eseté s, ha >30. A mta alapjá számított x középérték stadardzált értékét fgyelembe véve az egymtás u- próba statsztkája: 60

61 u x [3-0] ahol: u: a próbastatsztka mta alapjá meghatározott értéke x : a mta középértéke, μ : a populácó feltételezett középértéke (adott középérték), σ: a populácó (smert) szórása, a mta elemszáma. A mta abba az esetbe származhat az μ középértékű populácóból, ha a mta alapjá meghatározott z próbastatsztka értéke ksebb az adott valószíűség szthez tartozó krtkus u-értékél. Egyoldalú hpotézs eseté a-ál, kétoldalú hpotézs eseté a/-él kell meghatároz a krtkus u-értéket. Elfogadjuk a ullhpotézst, ha uemp ukrt. Egymtás t-próba Normáls eloszlású sokaság eseté haszálható, amkor a szórás em smert, valamt a mta elemszám kcs (<30). x t s [3-1] ahol: a szabadságfok: -1 és t: a próbastatsztka mta alapjá meghatározott értéke x : a mta középértéke, μ : a populácó feltételezett középértéke (adott középérték), s: a sokaság becsült szórása, a mta elemszáma. Elfogadjuk a ullhpotézst, ha temp t. krt Kétmtás próbák Kétmtás u-próba (z-próba) A függetle kétmtás u-próbával megvzsgálhatjuk, hogy származhat-e a két függetle megfgyelés, mta azoos középértékű populácóból, vagy másképp: két összehasolítadó populácó mtaátlaga szgfkása külöbözek-e. Így a ullhpotézs: H 0 : x1 x A z-próba alkalmazásáak feltétele, hogy: o Md a két sokaság ormáls eloszlású o Az alapsokaságok szórása smertek o A mták elemszáma agy o A két mta egymástól függetle. u x Függetle kétmtás t-próba x [3-] 61

62 A vzsgálat célja hasoló, mt a kétmtás u-próbáál, csak kevesebb formácó áll redelkezésükre. A kétmtás t-próbáál a két sokaság ormáls eloszlású, a szórások vszot em smertek, de közel azoosak, a két mta egymástól függetle. A próbafüggvéy: x1 x t 1 1 [3-3] Sp 1 ahol a szabadságfok: A evezőbe az Sp a két mta összevot varacájáak (pooled varace) égyzetgyökét jelet, melyet a két mta összevot szórásáak evezük. S p ( 1) s ( 1) s [3-4] Welch-próba A függetle kétmtás t-próbáál kkötéskét szerepelt a szórások azoossága. Ha ez em áll fe, de a sokaság ormáls eloszlású és a két mta egymástól függetle, akkor a Welch-próbát kell elvégez: t x x 1 s s 1 1 [3-5] Ameybe a két csoport szórása szgfkása külöbözk, lyekor a két összehasolítadó csoport varacáját súlyoz kell a varaca becsléséhez (separate varaca). A próba valószíűség változója ebbe az esetbe em t-eloszlású, ezért a szabadságfokokat Boferro módszerével korrgál kell, és ezt kell haszál a középértékek külöbözőségéek elbírálásakor: Szf s s 1 1 s1 s1 [3-6] Mt láthattuk, a függetle kétmtás t-próbákál em mdegy, hogy megegyezk-e a mták szórása, vagy em. Ha megegyezk kétmtás t-próbát kell elvégezük, ha em akkor Welch-próbát. A szórások (varacák) egyezőségéek elleőrzést a kétmtás F-próbával végezzük, amt a következő alfejezetbe tektük át. Párosított t-próba Tegyük fel, hogy egy mtá vzsgáljuk valamlye kezelések a hatását. Ilye esetekbe em a mtaátlagokat hasolítjuk össze, haem a kezelés előtt és utá érték külöbségéről állapítjuk meg, hogy szgfkása külöbözk-e ullától. A két mta középértékéek azoossága helyett a párosított mták d külöbségéek (előjeles) várható értékére fogalmazzuk meg a H 0 hpotézst. Ha d = x - y és A próbafüggvéy: d d H 0 : d 0, H 1 : d 0. d t [3-7] s / d 6

63 Ahol a szabadságfok -1 és s d a párosított mták külöbségéek szórása, amelyet a mta alapjá becsülük Szórásokra, varacákra voatkozó statsztka próbák Legye 1 az első a másodk populácó varacája (szóráségyzete), ekkor a ullés az alteratív hpotézsek a következők leszek: H :, 0 1 H1 : 1 Ha H 0 gaz, akkor a kél populácó szóráségyzetéek háyadosa 1. Két mta alapjá becsüljük ezt a háyadost. A becslést F-statsztkáak evezzük, ahol s1 F s [3-8] 1 ahol s1 az első, s a másodk mta korrgált tapasztalat szóráségyzete, és s 1 > s.ha ez az F érték elég közel va l-hez, akkor azt modhatjuk, hogy az eltérést csupá a véletle mtavételből származó hba okozta, így elfogadhatjuk a H 0 -t, egyébkét pedg elutasítjuk. Mél agyobbak a mták, aál jobba megközelít a mták szóráségyzete a sokaság szóráségyzetét. Ilye esetekbe az l-től csak ks eltérést egedük meg. Ha a mták vszoylag kcsk, akkor pedg még agyobb eltérés eseté s elfogadjuk a ullhpotézst. Az s előfordulhat, hogy az egyk mta kcs, a másk pedg agy. Ebből s ktűk, hogy md a két mta elemszámától függ, hogy az 1 körül mekkora tervallumba fogadjuk el a H 0 hpotézst. Az F-statsztka eloszlása külöböző mta elemszámok eseté más és más lesz. Hasolóa a t-statsztkához tt s a szabadság fok mutatja meg, hogy melyk F-eloszIást kell választauk. A két mta szabadság foka ( 1 1, - 1). ahol 1 az első mta, pedg a másodk mta elemszáma. A táblázatokat általába 5%-os szgfkaca-sztre közlk a külöböző statsztka köyvek. Összefoglalás A gyakorlatba csak rtká va arra lehetőségük, hogy a teljes sokaság adata alapjá hozzuk dötéseket, ezért mták alapjá kell ezt megteük. A hpotézsvzsgálat sorá a vzsgálat eredméye alapjá azt vzsgáljuk, hogy a mtából yert adatok géyelek-e külö magyarázatot, elemzést. A tovább vzsgálatokak ugyas csak akkor va értelme, ha a mtából vagy mtákból yert adatok eléggé külöbözek egymástól vagy egy valamlye elvárt értéktől, és az eltérés em csak a mtavétellel szükségszerűe együtt járó véletleszerű gadozásokak tulajdoítható. A statsztka próbák pedg éppe eek az elemzésére szolgálak. De a próbákat alkalmazuk a gazdaság vagy társadalm jeleségek leírására alkalmazott statsztka, ökoometra stb. modellekél s. A modellépítések ugyas ge léyeges eleme md a modell egyes kompoesere voatkozó bzoyos feltevések teljesüléséek elleőrzése, md a modellel yert becslésekek a valóság téyevel való egybevetése. A feltételezésük matematka megfogalmazása a ullhpotézs. Alakja egyelőség, két érték azoosságát állítja. Ezzel szembe megfogalmazuk egy ellehpotézst s, amt úgy evezük, hogy alteratív hpotézs. A két hpotézs a formáls logka szabálya szert kzárja egymást, és bármelyket s tektjük hhetőbbek, megválaszolható a beüket érdeklő kérdés. 63

64 A megbízhatóság szt (kofdeca szt: 1-α) a ullhpotézs elfogadására voatkozó dötés helyességéek a valószíűségét fejez k, ameybe a ullhpotézs gaz. A szgfkaca szt (α) a hbás dötés valószíűsége ugyacsak ullhpotézs eseté. Az emprkus szgfkaca szt (p érték) aak a valószíűsége, hogy a próbastatsztka a mtából kszámított értéket vesz fel. Az tervallum vagy a háyados skálá végzett mérésekél paraméteres próbákat, egyéb esetbe em paraméteres próbákat végzük. A paraméteres próbák ereje mdg agyobb. Elleőrző kérdések 1. M a statsztka próba?. Ismertesse a statsztka hpotézsvzsgálat meetét! 3. Mkor alkalmazuk paraméteres és em paraméteres statsztka próbát? 4. Mlye eloszlásokra voatkozó próbák vaak? Ismertesse őket! 5. Ismertesse a középértékekre voatkozó próbákat! 6. Mlye esetekbe alkalmazzuk a stadard ormáls eloszlást a hpotézs vzsgálatokál? 7. Ismertesse statsztka dötés sorá elkövethető hbákat? Hogya csökkethetők ezek? Kompetecát fejlesztő kérdések 1. Melyek a t-próba teljesüléséek feltétele? Ha ezek háyozak, mlye lehetőségük va még a hpotézsük alátámasztására?. Melyek az egytéyezős és a kéttéyezős varacaalízs emparaméteres alteratívá? Mkor célszerű ezeket elvégez? 64

65 4 Kétváltozós sztochasztkus kapcsolatok Equato Chapter 4 Secto 1 A társadalm gazdaság élet jelesége kölcsöhatásba állak, összefüggek egymással. Az összefüggések felsmeréséhez szakma tudás és logka készség, az összefüggések számszerűsítéséhez statsztka módszerek smeretére va szükség. Fotos a szakma smeretek prortásáak kemelése, mert a matematka statsztka módszerek krtka élkül alkalmazása téves következtetésekhez vezethet. A fukcoáls kapcsolatok eseté az egymással kapcsolatba álló jeleségek egyértelműe és kölcsööse meghatározzák egymást. A tökéletes fukcoáls kapcsolat főkét a matematka és fzka törvéyeket jellemz. A gazdaság életbe em lye egyértelmű a helyzet, az egymással összefüggő jeleségek között kapcsolat csak átlagosa érvéyesülő tedecakét, a valószíűségek törvéyszerűségere támaszkodva állapítható meg. Az lye kapcsolatok sztochasztkus kapcsolatok, az lye ok-okozat összefüggések átmeetet képezek a kapcsolat háya és fukcoáls kapcsolat között. Egy másk megközelítése a téyezők között kapcsolatokak, hogy azok lehetek a megfordíthatóak (reverzblsek) és megfordíthatatlaok (rreverzblsek). Például az állatállomáy alakulása és a kukorcatermelés között megfordítható a kapcsolat, hsz odavssza hatás s érvéyesülhet. Ezzel szembe a apsütéses órák száma hat a terméseredméyekre, de a vsszaráyuló hatást értelmetle lee vzsgál. Az ok okozat összefüggések vzsgálatáál más-más megközelítést alkalmazuk mőség smérvek között kapcsolatok az asszocácó, a mőség és meység smérvek között vegyes kapcsolat és a meység smérvek között korrelácó között. A társadalm-gazdaság folyamatok elemzésekor előfordulhat, hogy két téyező között cs okság összefüggés, mégs haszos lehet ezek regresszós elemzése. Ilye em kauzáls kapcsolat lehet a téyezők között kölcsöhatás és az együtt haladás. A kölcsöhatás (terakcó) eseté cs kfejezett okság kapcsolat, de a kölcsöhatás feltárása haszos formácót szolgáltathat. Együtt haladást (szmptomatkus összefüggés) olya változók között találuk melyekre ugyaazok az okok hatak. Itt függő és függetle változó elkülöítése értelmetle, de a regresszó feltárásáak va értelme, hsz gyakra valamelyk együtt haladó téyezőt, mt dkátort egy eheze, vagy költségese mérhető másk folyamat bemutatására, progosztzálására lehet haszál. Az dő változása és a jeleségek között s feállhat sztochasztkus kapcsolat. Ezzel a témakörrel később fejezetekbe még részletese foglalkozuk. Az összefüggések bemutatására egy vszoylag változatos eszközredszer áll redelkezésükre. A legegyszerűbb módszer, amkor (1) az egymáshoz kapcsolódó adatok adatsorat egymás mellé redezzük. Szemléletes az egymáshoz kapcsolódó adatok () kotgecatáblába (4-1. ábra) redezése. Mőség és ordáls mérés sztű változó eseté általába eleve adottak a csoportosító smérvek, meység sorok eseté osztályközös gyakorság sor létrehozásával butíthatjuk vssza és a képzett kategóra változókkal alkalmassá tehetjük az adatokat kereszttábla létrehozására. Szemléletes az összetartozó (3) adatok grafkus bemutatása, például potdagrammal (4-. ábra) törtéő ábrázolása s. 65

66 Termés (búza) t/ha X smérv szert osztályok Y smérv szert osztályok C 1 Y C Y C j Y C Y j C 1 X f 11 f 1 f 1j f 1 f 1 C X f 1 f f j f f C X f 1 f f j f f Forrás: Saját szerkesztés C m X f m1 f m f mj f m f m f 1 f f j f N 4-1. ábra: Kétdmezós kereszttábla felépítése Az arayakoroa érték és a termésátl agok között összefüggés bemutatása 7 a vzsgált gazdaságokba AK/ha 4-. ábra: Az összefüggések bemutatás potdagrammal Forrás: Saját szerkesztés 4.1 A jeleségek között kapcsolat erősségéek vzsgálata Az ökoometrába mdg szsztematkusa megkülöböztetjük az eredméy- és a magyarázó jellegű változókat. Most mdg egy eredméyváltozót (edogé vagy függő változót) feltételezük, jele: y, és több magyarázó változót (exogé vagy függetle változót), jelük: x, =,3,...,k. 66

67 A korrelácó az smérvek között kapcsolatok szorosságát, lletve teztását mér. Általába abszolút értékbe 0 és 1 között értéket vesz fel. Két meység smérv között kapcsolat szorosságát a Pearso-féle korrelácós együtthatóval mérhetjük. Az első lépésbe kszámítjuk az együtthatót, amelyet a másodk lépésbe letesztelük (t-próba), ekkor állapítjuk meg, hogy a mérőszám gazolta eltér-e ullától vagy sem. A harmadk lépésbe pedg egy úgyevezett determácós együtthatót számítuk, amely megmutatja, hogy a függetle változó (x) mlye mértékbe befolyásolja az eredméyváltozót (y). Korrelácós együttható számítása x x y y x x y y r [4-1] x x y y x x y y Az átlagtól való eltérések szorzatösszegéek előjele meghatározza a leárs kapcsolat típusát és a változás jellegét, a szorzatösszeget függetleíteük kell a megfgyelt adatpárok számától ezért osztjuk -el. Ez az úgyevezett kovaraca. A mértékegység megválasztásából eredő ökéyességet, hbát kzárjuk, ha a kovaracát osztjuk a változók szórásával. Az együttható tesztelése t-próbával: r t [4-] 1 r A számított t-értéket a kívát szgfkaca sztél - szabadságfokál a Studet-t értékek táblázatába található t értékkel hasolítjuk össze. Ha az általuk számított érték agyobb, akkor a korrelácós együttható eltérése a 0-tól szgfkásak tekthető. Determácós együttható D = r [4-3] A determácós együttható azt mutatja meg, hogy a függő változó szóráségyzetéek háyad része tulajdoítható a függetle változó hatásáak. Az együtthatós forma mellett a százalékos megjeleítés s gyakor. 4. Regresszó-aalízs A meység smérvek között kapcsolatok vzsgálata sorá, az smérvek kapcsolatáak szorosságát (teztását) a korrelácóval mérjük, míg a kapcsolat törvéyszerűségét a regresszó írja le. Ez tulajdoképpe matematka függvéyek társadalm-gazdaság adaptácóját jelet. A függvéyek sokfélék lehetek, amelyeket a változók száma szert és a kapcsolat mlyesége alapjá osztályozhatuk. Vázlatosa tektsük át ezek redszerét! A változók száma szert két- és többváltozós függvéyeket külöböztetük meg. A kapcsolatok mlyesége alapjá pedg leárs és em leárs függvéyeket külöíthetük el. A kapcsolat típusától függőe a regresszós függvéy lehet: egyees voalú (leárs): leárs regresszó elmélet voala a regresszós egyees), görbe voalú (em leárs), o expoecáls, 67

68 o parabolkus, o hperbolkus Kétváltozós leárs regresszó A leárs egyees egyelete: Y 0 1x. A β 0 és a β 1 a regresszó paramétere, az ε a maradékot, a rezduumot vagy a hbát jelet. A korrelácó erősségétől függ az ε értéke, mél erősebb a korrelácó, ε értéke csökke. Az aaltkus regresszó megállapításakor β 0 és a β 1 a tapasztalat adatokból becsülhetők. A becsült paraméterek y b0 b1 x e így y' b0 b1 x Az egyees llesztése leggyakrabba a legksebb égyzetek elve (OLS) alapjá törték: és, ( y y) MIN! 1 [4-4] A b 0 és b 1 paraméterek meghatározása a ormálegyeletek segítségével törték: 1.. y b b x x y b0 x b1 x [4-5] Léyegese egyszerűsíthetők a számítások a koordátategelyek kezdőpotjáak x y által meghatározott potba törtéő traszformácója segítségével (4-3. ábra). Khaszálva azt, hogy ( x x) 0 és ( y y) 0 a ormál egyeletek felírhatók: ( y y) b b ( x x). ( x x)( y y) b ( x x) b ( x x) Az első egyeletből b 0 =0, a másodkból b 1 : A b 0 a b 1 és az átlagok smeretébe számítható, mert az új koordátaredszerbe b 0 =0, vagys az eredet függvéy áthalad az x és y potoko (4-3. ábra): b x x y y xx 1 [4-6] [4-7] b0 y b1x [4-8] 68

69 4-3. ábra: A koordátategelyek traszformálása Forrás: Saját szerkesztés Maczel, 1983 alapjá Mutá meghatároztuk a b 0 és b 1 paramétereket meghatározhatjuk az x értékek vsszahelyettesítésével a regresszós értékeket. A leárs összefüggésekél elleőrzük kell, hogy a leárs összefüggések téylegese azok-e. Ezt szóráségyzet felbotással és F- próbával végezzük el. Ezt követőe megvzsgáljuk, hogy a regresszós értékek meyre lleszkedek az eredet megfgyelésekhez, azaz megvzsgáljuk a függvéylleszkedést. Az lleszkedésvzsgálat sorá meghatározhatuk egy abszolút (eredet mértékegységű és agyságredű) mutatót és egy relatív mutatót s, am lehetővé tesz az összehasolításokat s. : A függő változó szóráségyzete megegyezk a regresszó szóráségyzetéek és a hba szóráségyzetéek az összegével: sy sy' s y y' [4-9] Az F-próbát a 63.oldalo leírtakak megfelelőe értékeljük: Az lleszkedés stadard hbája: s s s y y e y y ' ' s y y y ' y y y ' y ' e [4-10] s F [4-11] s y y ' s Az lleszkedés relatív se hbája: VSe 100 [4-13] y [4-10] felhaszálásával kszámítható, hogy mey a regresszó hatása a teljes szóráségyzetbe: s y' r D s [4-14] e [4-1] y 69

70 Látható, hogy a már korábba bemutatott determácós együttható a regresszós egyelet kompoeseből s számítható. A leárs regresszós egyelet β 0 és β 1 becsült értéke (b 0, b 1 ) s valószíűség változók, ezért ezek stadard hbáját és adott valószíűsége értelmezett kofdeca határat s célszerű megvzsgál. A b 0 stadard hbája: s s 1 b0 e sb 1 A b 1 stadard hbája: 1 ( x x) 1 s x e ( x x) [4-15] [4-16] A regresszós együtthatók kofdeca határa (ormáls eloszlás eseté): b 0 eseté: b 0 ± t 1-σ/ s bo [4-17] b 1 eseté: b 1 ± t 1-σ/ s b1 El kell végezük a regresszós paraméterek szgfkaca vzsgálatát s. Ebbe az esetbe t-eloszlást feltételezük: b A próbafüggvéy: t [4-18] sb [4-18] alapjá számolt t értéket - szabadságfokál hasolítjuk a táblázatba található krtkus értékekhez. Összefoglalás A gazdaság életbe az egymással összefüggő jeleségek között kapcsolat csak átlagosa érvéyesülő tedecakét, a valószíűségek törvéyszerűségere támaszkodva állapítható meg. Az lye kapcsolatok sztochasztkus kapcsolatok, az lye ok-okozat összefüggések átmeetet képezek a kapcsolat háya és fukcoáls kapcsolat között. Vzsgálhatjuk a téyezők között kapcsolat szorosságát (korrelácó) és téyezők között kapcsolat törvéyszerűségét (regresszó). A korrelácó az smérvek között kapcsolatok szorosságát, lletve teztását mér. Általába abszolút értékbe 0 és 1 között értéket vesz fel. Két meység smérv között kapcsolat szorosságát a Pearso-féle korrelácós együtthatóval adjuk meg. A kapcsolat lehet leárs vagy görbevoalú. Ha változó számát ézzük: kétváltozós és többváltozós. A regresszós elemzésekél mdg megkülöböztetük egy eredméyváltozót és hatóváltozó/ka/t. A kétváltozós leárs regresszós függvéy paraméteret becsléssel határozzuk meg. A becslést a legksebb égyzetek módszerével (OLS) végezzük. A regresszós függvéyt tesztel kell. Megvzsgáljuk a függvéylleszkedést, F- próbával elleőrzzük, hogy a leárs összefüggések téylegese azok-e. Megvzsgáljuk a regresszós együtthatók kofdeca tervallumát, t-próbával a szgfkaca vzsgálatát. Elleőrző kérdések 1. Mt fejez k a determácós együttható?. Melyek a regresszóaalízs lépése? 3. Mlye szempotokat kell fgyelembe ve a függvéyllesztéskor? 4. M a kovaraca? 70

71 Kompetecát fejlesztő kérdések 1. Hogya mérjük két változó között a kapcsolat szorosságát?. Mlye eszközöket smer két változó között kapcsolat bemutatására? 71

72 5 Nem leárs kétváltozós kapcsolatok Equato Chapter (Next) Secto 1 A gyakorlatba az egyees voalú összefüggések agyo rtkák, lletve csak egy szűk x értelmezés tartomáyba értelmezhetők. A legtöbb esetbe valamlye görbe voalú összefüggést valószíűsíthetük. Ezek leggyakorbb fajtát előzőleg már smertettük, kemelve azokat a függvéytípusokat, amelyek a gyakorlatba a legtöbbször előfordulak. Ezeket fogjuk most áttekte. 5.1 Korrelácós dex Nemleárs esetekbe haszált kapcsolat-szorosság mérőszám a korrelácós dex, amely az eredet változók között kapcsolat szorosságát mutatja: I 1 y y' y y [5-1] A korrelácós dex aalóg a leárs esetbe a determácós együtthatóból vot égyzetgyökkel. Az dex értéke 0 és 1 között helyezkedk el. Ha az lleszkedés jó, a mutató értéke 1-hez közelít, míg alacsoy érték eseté a maradék-égyzetösszeg vszoylag agy, am rossz lleszkedésre utal. A korrelácós együtthatóval szembe ez a mutató ráyt em jelez. Kellemetle tulajdosága, hogy em mdg va valós érték, hsze emleárs regresszó eseté előfordulhat, hogy a gyök alatt álló kfejezés egatív lesz. Eek oka, hogy emleárs esetbe a égyzetösszeg-felbotás em úgy teljesül, mt leárs esetbe. 5. Hatváyktevős regresszó A hatváyktevős regresszós összefüggés a társadalm-gazdaság életbe gyakra előfordul. Ezt fgyelhetjük meg például a háztartások jövedelme és a fogyasztás kadása között. Eek a törvéyszerűségek az smerete agyo fotos, hsze ez alapjá lehet tervez, például a leedő megtakarításokat, tudomáyos éve a megtakarítás határhajladóságot, am a gyakorlat közgazdaságta egyk alapvető eleme. A hatváyfüggvéy általáos képlete: b ˆ. y a x Az a paramétert a gyakorlatba em értelmezzük, a b paramétert rugalmasság (elasztctás) együtthatóak s evezzük. Jeletése: x egy százalékos változása, y háy százalékos változását voja maga utá. Ez hasoló a leárs esetbe számított rugalmasság együtthatóhoz, de ez mde x eseté ugyaay. A hatváyfüggvéy lefutása a b paraméter értékétől függ (5-1. ábra). 7

73 5-1. ábra: A hatváyfüggvéy alakja külöböző b értékekél Forrás: saját szerkesztés A hatváyfüggvéy korrelácó- és regresszó számítás feladata hasolóak a kétváltozós leárs függvéyél már megsmert lépésekhez. A hatváyfüggvéy ráadásul leárssá alakítható logartmzálás segítségével, így az átalakítás utá alkalmazhatóak az ott megtault smeretek. A logartmzálás utá a következő összefüggést kapjuk: b yˆ a x log y log a blog x ˆ Az átalakítás utá em x -ek és y -ok között va leárs kapcsolat, haem log y -ek és log x -ek között, tehát cs más dolguk, mt az eredet változók logartmusát képez, és ezek között keres a leárs kapcsolatot. 5.3 Expoecáls regresszó Eek a típusak s va gyakorlat jeletősége, főleg dősorok eseté, amkor azt vzsgáljuk, hogy egyk dőszakról a máskra háy százalékkal változott a vzsgált jeleség. Az expoecáls-függvéy képlete: x yˆ a b. Az a paramétert a gyakorlatba em értelmezzük. A b paraméter azt mutatja meg, hogy x egy egységy változása az y háy %-os változását voja maga utá. Az expoecáls függvéy lefutása a b paraméter értékétől függ. Ha b1, akkor övekvő a függvéy, ha 0b1, akkor csökkeő függvéyről beszélük (5-. ábra). Az expoecáls függvéy korrelácó- és regresszó számítás feladata s hasolítaak a kétváltozós leárs függvéyél már megsmert lépésekhez, ugyas ez a függvéy s átalakítható leárssá, logartmzálás segítségével: x y ' a b log y' log a x log b Az átalakítás utá em x -ek és y -ok között va leárs kapcsolat, haem log y -ek és x -ek között, tehát cs más dolguk, mt az eredet y változók logartmusát képez, és log y -ok és x -ek között keres a leárs kapcsolatot. 73

74 5-. ábra: Az expoecáls függvéy alakja külöböző b értékekél Forrás: saját szerkesztés 5.4 Másodfokú függvéy (parabola) A polomok sajátos lefutású függvéyek. Abba külöbözek az eddg tárgyalt függvéyektől, hogy a vzsgált jeleség alakulásába egy bzoyos x értelmezés tartomáyg emelkedek, lletve csökkeek, majd egy pot utá az ellekezőjére fordul a jeleség alakulása. A polomok közül a gazdaságelemzésbe a másodfokú paraboláak va agyobb jeletősége. Eél magasabb fokú polomok közül még a harmadfokú bírhat jeletőséggel bzoyos esetekbe, de már ott s a függvéyparaméterek em sok formácót hordozak, kább a függvéy egyes szakasza elemezhetők. A másodfokú függvéyekre jellemző, hogy egy szélsőértékük (maxmum vagy mmum) va. Gyakorlat jeletőségük vszoylag agy, külööse a mezőgazdaságba, így például a műtrágyázás és a termésátlag között összefüggés vzsgálata sorá (5-3. ábra) ábra: Műtrágya ráfordítás hatásvzsgálata másodfokú függvéyllesztéssel Forrás: Saját szerkesztés Csák-Mészáros, 1981 yomá A hatváyfüggvéyt gyakra alkalmazzuk a termelés költség és a termelés érték kapcsolatáak elemzéséél, külööse olyakor, amkor a valamlye telítődés potot elérő 74

75 folyamatról va szó. Ebbe az esetbe a termelés érték alakulására egy bzoyos értelmezés tartomáyba parabola lleszthető. A parabola általáos egyelete: y' b b x b x. 0 1 A másodfokú parabolákak két alapvető típusáról beszélük a kokáv és a kovex parabolákról. A függvéy akkor kokáv, ha a égyzetes tag együtthatójáak előjele egatív (5-4. ábra) A parabola értelmezésekor a szélsőérték számításáak va jeletősége. Ez maxmum-, vagy mmumértéket jelet, attól függőe, hogy kokáv, vagy kovex paraboláról va szó. A szélsőérték számítása derválás útjá lehetséges. A parabola derváltja a hozzá húzott értő egyees meredekségét adja. Tehát, ha az első derváltat egyelővé tesszük 0 -val, akkor egy olya, parabolát értő egyeest kapuk, amely párhozamos az x tegellyel, ebből következőe a szélsőértékéél ért a parabolát. Ie a szélsőérték-hely meghatározása már egyszerű feladat: b1 ( y')' b1 b x 0 x b b <0 b >0 Forrás: Saját szerkesztés 5-4. ábra: A másodfokú függvéy képe Összefoglalás Nemleárs esetekbe haszált kapcsolat-szorosság mérőszám a korrelácós dex. A korrelácós dex aalóg a leárs esetbe a determácós együtthatóból vot égyzetgyökkel. A gyakorlatba az egyees voalú összefüggések agyo rtkák, lletve csak egy szűk x értelmezés tartomáyba értelmezhetők. A legtöbb esetbe valamlye görbe voalú összefüggést valószíűsíthetük. Ezek leggyakorbb fajtá: hatváyktevős, expoecáls és polomáls regresszó. A polomok sajátos lefutású függvéyek. A vzsgált jeleség alakulásába egy bzoyos x értelmezés tartomáyg emelkedés, lletve csökkeés fgyelhető meg, majd egy pot utá az ellekezőjére fordul a jeleség alakulása. A polomok közül a gazdaságelemzésbe a másodfokú paraboláak va agyobb jeletősége. Eél magasabb fokú polomok közül még a harmadfokú bírhat jeletőséggel bzoyos esetekbe, de már ott 75

76 s a függvéyparaméterek em sok formácót hordozak, kább a függvéy egyes szakasza elemezhetők. Elleőrző kérdések: 1. Hogya mérjük két változó között a kapcsolat szorosságát emleárs esetbe?. Mlye emleárs regresszós függvéyeket smer? 3. Mlye tulajdosága vaak a másodfokú függvéyek? 4. Mk azok a polomok? Kompetecát fejlesztő kérdések: 1. Melyek a regresszóaalízs lépése?. Hogya értelmezzük és m a jeletősége a hatváyfüggvéy elasztctásáak? 76

77 6 Többváltozós leárs kapcsolatok és az ezzel kapcsolatos problémák Equato Chapter (Next) Secto Többváltozós regresszós elemzés A gyakorlatba általába em lehetséges egyetle magyarázóváltozó segítségével leír a vzsgált jeleség alakulását. Az előző fejezetekbe a kétváltozós kapcsolat vzsgálatáál az függő változóra ható téyezők közül csak egyet választottuk k feltételezve, hogy eek hatása jeletős. Például egy dolgozó hav bruttó átlagbérét jeletőse befolyásolja az skola végzettségük foka. Azoba a vállalkozások gazdálkodás mutatót vzsgálva arra a következtetésre jutuk, hogy az eredméy alakulását több téyező befolyásolja (pl. ettó árbevétel, hatékoyságot kfejező vagyoaráy mutató stb.). Az eredméyváltozóra ható téyezők köréek kbővítésével többszörös vagy többváltozós sztochasztkus kapcsolathoz jutuk. Ha regresszós modellt egy adott dőpotra, vagy dőszakra voatkozó megfgyelések adatbázsára épül, akkor e modellt keresztmetszet (cross-sectoal regresso) modellek evezzük. Meghatározható tehát, hogy az eredméyváltozó alakulásába mely függetle változó(k), lletve eze változó(k) mlye mértékbe játszaak szerepet. A regresszós modellt megszerkeszthetjük a változók dősora alapjá, ekkor dősoros regresszós modellt (tmeseres regresso) kapuk. A vállalat gyakorlatba elterjedtebb, hogy redelkezésre áll md az eredméyváltozó, md a vele sztochasztkus kapcsolatba levő téyezőváltozó, vagy változók dősora. A többváltozós regresszó-aalízs segítségével több smérv eredméyváltozóra gyakorolt hatását vzsgáljuk. A kapcsolat az smérvek száma szert három-, égy-, öt- stb. változós, a függvéy típusa szert pedg leárs és emleárs kapcsolat lehet. A többváltozós függvéyek értelmezése ehezebb, mt a kétváltozós kapcsolatoké, ezek függvéyképe már csak térbe írható le. Grafkus ábrázolásuk s problémásabb, ugyas három változóál többet háromdmezós térbe csak agyo erős megszorítások mellett vetíthetük k. Ezért a legmegfelelőbb függvéytípus kválasztása a téyezők hatásáak számszerűsítése többráyú megfotolást, körültektőbb szakma mérlegelést tesz szükségessé. A regresszós modellek szerkesztésekor legelső feladatuk, hogy megkeressük azokat a változókat, amelyek feltevésük szert az eredméyváltozóval léyeges (szgfkás) kapcsolatba vaak. Az így meghatározott magyarázó- és eredméyváltozók kapcsolata persze csak hpotetkus, azt első lépésbe elleőrz kell, hogy feltevésük a kokrét megfgyelések függvéyébe meyre állja meg a helyét. A többváltozós leárs regresszós modellt az alább matematka egyelettel írhatjuk fel: y 0 1x1 x... mxm [6-1] ahol, β 1,β β m a ható téyezők β 0 a függvéy kostas tagja ε a regresszós egyees hbatagja. Fő feladatuk az ε hbatag mmalzálása, amt akkor érük el, ha a becslőfüggvéy értéke mmálsa térek el az eredet tapasztalat értékektől. Vagy az eltérések égyzetösszegé értelmezve: e y ( 0 1x1 x... mxm) MIN! [6-] 1 77

78 Az egyeletredszer megoldásához szükséges paraméterek a fet egyelet β 1,β β m szert parcáls derváltjaak meghatározásával állíthatóak elő. A függvéyllesztés hbáját hasoló elve számoljuk, mt kétváltozós esetbe: e ( y y ' ) se [6-3] se VS.100 e y ' A regresszós függvéy paramétere a regresszós együtthatók egy-egy téyezőváltozó részleges hatását mutatják meg: y' b0 b1 x1 b x... bmxm [6-4] A b 0 az x 1 =x = =x m =0 helye vett függvéyérték. Értelmezés legtöbbször logkalag értelmetle. A b 1,b, b m parcáls regresszós együtthatók az jeletk, ha az x értéket egy egységgel öveljük, mközbe a több változó értéke változatla marad, akkor az eredméyváltozó (y) becsült értéke (y ) b egységgel változk meg. A regresszós együttható tehát kfejez, hogy egy adott téyezőváltozó egységy övekedése mekkora övekedést (vagy csökkeést) okoz az eredméyváltozó becsült értékébe, mközbe a több téyezőváltozó értéke változatla. 6. Többváltozós korrelácószámítás A többváltozós leárs regresszós modellbe arra a kérdésre s választ keresük, hogy az egyes téyezőváltozók tsztá, ömagukba mlye szoros kapcsolatba vaak az eredméyváltozóval. A regresszó-számítással szembe a korrelácó szorosságáak vzsgálatakor mde változót valószíűség változóak tektük. Vagys kzárjuk az olya kotrollált kísérletek eredméyekét kapott magyarázóváltozókat, amelyekkel a több befolyásoló téyező értékét rögzíte tudjuk, és így hatásukat a vzsgálat sorá elleőrzésük alatt tartjuk. Az eredméyváltozót eek elleére megkülöböztetjük a téyezőváltozóktól. Ezt azoba csak azért tesszük, hogy jelölésredszerük összhagba legye a regresszószámításál taultakkal. A kapcsolat szorosságáak vzsgálata ömagába a megkülöböztetést em teé szükségessé. Kettőél több változó eseté a korrelácó szorosságáról háromféle értelembe beszélhetük. A kapcsolat szorossága vzsgálható párokét, továbbá párokét, de a több változó hatásáak kszűrésével. Végül pedg az eredméyváltozó és az összes téyezőváltozó között szorosság s mérhető Parcáls korrelácó vzsgálata A parcáls korrelácós együttható ayba külöbözk a párokét együtthatótól, hogy számításáál a több változótól em tektük el, de hatásukat kküszöböljük. Az így kapott parcáls korrelácós együttható az mutatja meg, hogy mlye szoros a kapcsolat valamelyk kválasztott téyezőváltozó és a függő változó között, ha a több téyezőváltozó hatását md a vzsgált téyezőváltozóból, md az eredméyváltozóból kszűrjük. Az R korrelácós mátrx a modellbe számítható összes kétváltozós korrelácós együtthatót tartalmazza. A mátrx első sora és első oszlopa az eredméyváltozó és az egyes téyezőváltozók között kapcsolat szorosságát mérő leárs korrelácós együtthatókat tartalmazza, a mátrx több eleme pedg a téyezőváltozók egymás között korrelácóját mér. 78

79 A korrelácós mátrx szmmetrkus mátrx, a fődagoálsába lévő elemek értéke 1, am a kétváltozós leárs korrelácós együttható képzés módjából közvetleül adódk. Az R mátrx számos formácót tartalmaz a kapcsolat természetére voatkozóa. Megállapítható, hogy melyek azok a magyarázó változók, amelyek a legszorosabb összefüggésbe vaak a függő változóval és mely magyarázó változók között va számottevőbb korrelácós összefüggés. Ez utóbb a multkolleartás veszélyére hívja fel a fgyelmet (6-1. ábra). 1 ry1 ry rym r 1 r1 r 1m R r y r1 1 r m rmy rm 1 rm ábra: Korrelácós mátrx A parcáls korrelácós együtthatók a korrelácós mátrx verze alapjá határozhatók meg (6-. ábra): qyy qy1 qyj qym q1 y q11 q1 j q 1m R q jy q j1 q jj q jy q my qm 1 qmj qmm 6-. ábra A korrelácós mátrx verze A parcáls korrelácós együttható az Y és az X j változók kapcsolatáak szorosságát mér, mutá a több (m-1) magyarázó változó hatását mdkét változóból kszűrtük. A parcáls korrelácós együttható égyzetét parcáls determácós együtthatóak evezzük. A parcáls determácós együttható arra ad választ, hogy az X j magyarázó változó mekkora háyadot képes megmagyaráz az Y függő változó varacájáak azo részéből, amelyet az X 1, X, X j-1, X j+ 1,,X m változók em képesek megmagyaráz. Gyakra előfordul, hogy a korrelácós mátrx mellett a változók párokét kovaraca-mérőszámat tartalmazó, varaca-kovaraca mátrxra s szükségük va. A kovaraca mátrx hasolóa épül fel, mt a korrelácós mátrx, tehát a mátrx első sora és első oszlopa az eredméyváltozó és az egyes téyezőváltozók között kapcsolat szorosságát mérő leárs kovaracákat tartalmazza, a mátrx több eleme pedg a téyezőváltozók egymás között korrelácóját mér. Az átlóba szereplő változók a regresszós modellbe szereplő változók szóráségyzete. A többváltozós leárs regresszós modellél az eredméyváltozó (y) és a magyarázó változók (x 1, x,,x m ) együttes összefüggését s vzsgáljuk. A téyezőváltozók és az eredméyváltozó között korrelácó szorosságát a többszörös korrelácós együttható mér. A többszörös korrelácós együttható olya specáls kétváltozós korrelácós együttható, amely az y és az x 1, x,,x m téyezőváltozók alapjá becsült y kapcsolatáak szorosságát mér. A többszörös korrelácós együttható égyzetét többszörös determácós együtthatóak evezzük. A mutatószámmal azt mérjük, hogy a függetle változók együttese mlye erősséggel határozzák meg az Y változó gadozását. Másképpe fogalmazva az együttható arra ad választ, hogy a függő változó teljes szóráségyzetéből mekkora a regresszóak tulajdoítható, tehát a téyezőváltozókkal megmagyarázható háyad. 79

80 A determácós együttható: értéke 0 és 1 között lehetséges, a maxmáls értéket akkor vesz fel, ha az X változók determsztkusa meghatározzák Y-t, 0 az értéke, ha az Y szóródását teljes egészébe a véletle magyarázza, %-os formába értelmezzük A többszörös determácós együttható kfejezhető a többváltozós regresszós modell regresszós és teljes eltérés égyzetösszegeek háyadosakét s. SSR R ahol SST [6-5] SSR: regresszós eltérés égyzetösszeg SST: teljes eltérés égyzetösszeg 6.. Itervallumbecslés a többváltozós regresszós modellbe A regresszós becslést úgy s értelmezhetjük, mt a regresszós együtthatók adott leárs kombácóját. A kofdecatervallum-számítás sorá a fotosabb feladat azoba em a becsült paraméterek tervallumáak, haem a függvéyérték tervallumáak a becslése. Ez hasoló ahhoz, amt a kétváltozós esetbe számítottuk, a külöbség mdössze ay, hogy a függvéyértékek kszámításakor a mátrxalakokat haszáljuk, a t-eloszlású változó pedg -p-1 szabadságfokú. A függvéyérték varacáját mtából becsülve a σ -et s e -tel közelítve a varacára torzítatla becslést kapuk (x=x 0 eseté): 1 var( y') se x' 0( X ' X ) x0 [6-6] [6-6] égyzetgyöke a stadard hba: s' s x' ( X ' X ) x [6-7] 1 y' e 0 0 A kofdeca tervallumot 1-α megbízhatóság szte a regresszós becslés és a varaca alapjá az alább formulával számíthatjuk k (kokrét mta eseté): y ' t1 / s ' y ' [6-8] Fetek mutatják, hogy függő változó várható értékére számított kofdeca tervallum agysága a magyarázó változók adott értéketől, valamt a paraméterek varacájáak és kovaracáak agyságától függ. Ameybe csak egyetle függetle változók va, az eredet adatok függvéyébe egyszerűbbe felírható a becslőfüggvéy: Fgyelembe véve, hogy Y =y + ε 1 var( Y ') 1 x' 0( X ' X ) x 0 [6-9] A becsült hba: s'' s 1 x' ( X ' X ) x [6-10] 1 y' e 0 0 A kofdecatervallum: y ' t1 / s '' y ' [6-11] Ebbe az tervallumba helyezkedek el 1-α megbízhatósággal x 0 -hoz tartozó smeretle sokaság Y értékek. 80

81 6..3 Hpotézsvzsgálat A regresszós modellekél az alább a hpotézsvzsgálattal elleőrzzük a becsült paraméterek jóságát, azt hogy a magyarázó változók együttese kelégítő módo magyarázzák-e az eredméyváltozót. A paraméterek tesztelésekor az a ullhpotézs, hogy a j-edk sokaság paraméter 0. Tehát: H 0 : βj = 0 és H 1 : βj 0. A ullhpotézs szert a j-edk változó regresszós együtthatója ulla, azaz értékváltozása em befolyásolja az eredméyváltozót, ezért felesleges a modellbe szerepeltet. A hpotézs tesztelésére a t-próba alkalmazható, amelyet külökülö az összes paraméterre el kell végez. A próba hozadéka, hogy változókét megsmerjük az eredméyváltozó magyarázatát. A magyarázó változók együttes hatásáak a vzsgálatakor a ullhpotézs az lesz, hogy a magyarázó változók sokaság együttható md ullák: H 0 : β 1 = β = =β k = 0. Az ellehpotézs: H 1 : βj 0, tehát legalább egy olya együttható va, am sokaság szte em ulla. Ezt a próbát varacaaalízssel végezzük, azaz egy F-próbát. Mvel az egész modellre alkalmazzuk, globáls F-próbáak s szokták evez. ( y y) ( y ' y) ( y y ' ) [6-1] SST SSR SSE A függő változó átlagtól vett eltéréségyzet-összegéek (SST) két kompoese tehát: a regresszós becslések átlagtól vett eltéréségyzet-összege (SSR) és a rezduáls égyzetösszeg (SSE). A mtákból meghatározott égyzetösszegek segítségével vzsgálhatjuk a ullhpotézs feállását: SSR p F A számláló szabadságfoka [6-13] SSE m, a evezőé -p-1 p1 Az F-próba végrehajtása utá az alább megállapításokat tehetjük: Ha a számított érték ksebb, mt a krtkus érték, akkor a ullhpotézs elfogadjuk, és megállapítjuk, hogy a vzsgált szgfkaca-szte a modell em jó, a magyarázó változók em tudtak érdembe több magyarázatot ad az eredméyváltozó alakulására, mt az eredméyváltozó egyszerű mtaátlaga. Ha a számított érték agyobb vagy egyelő a táblázatból kkeresett krtkus értékél, akkor az adott szgfkaca-szte a modell em utasítható el egyértelműe, legalább egy léyeges relácót megragad, ezért érdemes tovább vzsgál. A varacaaalízs értékelését általába úgyevezett ANOVA (ANalyss Of Varace) táblázatba mutatjuk be (6-3. ábra): 81

82 6-3. ábra: Az ANOVA tábla felépítése Kszámíthatjuk az emprkus szgfkacasztet (p-érték) s. A számítógépes programcsomagok többsége a próbafüggvéy tapasztalat értéke mellett közl a p-értéket s. A globáls F-próbát felírhatjuk a többszörös determácós együttható segítségével: p 1 SSR p 1 SSR / SST p 1 R F [6-14] p SSE p 1 ( SSR / SST ) p 1R [6-14] jól mutatja, hogy az F-próba agy R, azaz jó lleszkedés eseté utasítja el a ullhpotézst. Ebbe az értelembe tehát a globáls F-próba az lleszkedés jóságáak próbájáak s tekthető A többváltozós regresszó számítás eredméyet befolyásoló egyéb problémák A regresszószámítás gyakorlat alkalmazásakor ügyelük kell arra, hogy a stadard leárs regresszós modellt e haszáljuk, ha valamelyk feltétele em teljesül. Közgazdaság elemzésekél eek leggyakrabba három oka lehet: autokorrelácó: a hbatagok együttmozgása szgfkás; heteroszkedasztctás: a hbatag szóráségyzete em álladó; multkolleartás: a magyarázóváltozók együttmozgása statsztkalag jeletős, azaz szgfkás. Leárs regresszós modellek eseté ez a jeleség a redudaca egy fajtájakét értelmezhető. Az autokorrelácóval az dősorok elemzésekor foglalkozuk részletesebbe Multkolleartás A regresszó számítás egyk legfotosabb feladata a dötéstámogatásba, hogy formácókat yújt arról, hogy az egyes téyezőkek mlye az eredméyhez való hozzájárulása. A vzsgálatba bevot magyarázó változók azoba emcsak az eredméyváltozóra hatak, haem egymással s boyolult kapcsolatredszerbe vaak, sőt gyakra egymás hatását erősítve befolyásolják a függő változó alakulását. A multkolleartás tehát két vagy több magyarázó változó leárs korrelácós kapcsolatát jelet. A multkolleartás szgfkás volta egy adottság és em az alkalmazott modell hbája. Emprkus vzsgálatokál gyakra komoly problémát jelet a multkolleartás felsmerése és okáak megtalálása, hsze egyrészt a multkolleartás egatív következméye em mdg lépek fel, másrészt a multkolleartást emcsak egy változó, haem egy változócsoport s okozhatja. Így sejthető, hogy a multkolleartás mérőszáma 8

83 em mde esetbe jellemzk megfelelőe ezt a jeleséget. A multkolleartás mérőszámaak értelmezése sokszor meglehetőse szubjektív. Ugyas a mérőszámok többsége arra ad választ, hogy a vzsgált adatállomáy meyre em deáls, azaz mlye mértékbe térük el az deáls esettől, amkor s mde téyezőváltozó leársa függetle egymástól. Néháy mérőszám eseté cs egyértelmű határ az eltérés káros mértékű jelzésére. A multkolleartás egatív hatásaak csökketésére, lletve kküszöbölésére gyakrabba haszált módszerek skeressége agymértékbe függhet a multkolleartás potos felsmerésétől. Eze módszerek többségéek alkalmazása ugya csökket, potosabba mt lát fogjuk csökkethet a multkolleartás egatív következméyeek mértékét, de ez más egatív következméyekkel (például jeletős formácóveszteséggel, az eredméyek em megfelelő értelmezhetőségével) járhat (Kovács,008). Mt látható a multkolleartás problémaköréek értelmezése em egyértelmű. Eek elleére em hagyhatjuk fgyelme kívül. A multkolleartás meghatározására legegyszerűbbe a többváltozós korrelácószámítás eredméyeek felhaszálásával törtéhet. Köye belátható, ha többszörös determácós együttható értéke megegyezk magyarázó változók determácós együtthatóak összegével, akkor cs multkolleartás. Ha em egyezk meg, akkor létezk, mégpedg a külöbség agyságával aráyosa. Ilyekor a többszörös determáós együtthatóak va olya része, amt több változó együttese magyaráz meg. A multkolleartás mérőszáma (M) azt mutatja meg, hogy a magyarázó változók elkülöítő hatása mlye mértékű. A multkolleartás tesztelése a VIF (Varácós fláló faktor) segítségével törtéhet. 1 VIFj 1 r [6-15] x j. x1, x,..., x j1, x j1,..., xm Azt mutatja, hogy a j-edk változó becsült együtthatójáak téyleges varacája háyszorosa aak, am a multkolleartás teljes kzárásával lee. A mutatót valamey változóra kszámítjuk. Ha a VIF értéke 1 és között va gyege, ha -5 között erős, zavaró, 5 felett agyo erős káros multkolleartásról va szó. Alkalmazhatjuk még a VIF mutató recprokát, a toleracamutatót (T) s a multkolleartás tesztelésére. Értéke 0 és 1 között va Heteroszkedasztctás A többváltozós leárs regresszós modellek eseté ktétel, hogy a maradékváltozó legye ormáls eloszlású és álladó szórású. Ha eleget tesz eek a feltételek azt modjuk, hogy a modell homoszkedasztkus. Ha ez em teljesül, akkor heteroszkedasztctás áll fe. A heteroszkedasztctás több problémát s felvet a paraméterbecslések és kofdeca tervallumok potos meghatározásáál ezért em hagyhatjuk fgyelme kívül. A heteroszkedasztctást Whte-teszttel tudjuk kmutat. A statsztka programcsomagok md a heteroszkedasztctás tesztelésbe, md a kezelésbe hatékoy segítséget yújtaak. Összefoglalás A gyakorlatba általába em lehetséges egyetle magyarázóváltozó segítségével leír a vzsgált jeleség alakulását. A többváltozós regresszó-aalízs segítségével több smérv eredméyváltozóra gyakorolt hatását vzsgáljuk. A kapcsolat az smérvek száma szert három-, égy-, öt- stb. változós, a függvéy típusa szert pedg leárs és emleárs kapcsolat lehet. A többváltozós függvéyek értelmezése ehezebb, mt a kétváltozós 83

84 kapcsolatoké, ezek függvéyképe már csak térbe írható le. A kapcsolat szorosságáak elemzésekor vzsgálhatjuk párokét s a korrelácós együtthatókat, de agyobb jeletősége va a parcáls értékek megsmeréséek. A parcáls korrelácós együttható az mutatja meg, hogy mlye szoros a kapcsolat valamelyk kválasztott téyezőváltozó és a függő változó között, ha a több téyezőváltozó hatását md a vzsgált téyezőváltozóból, md az eredméyváltozóból kszűrjük. Többváltozós regresszóál kbővül az utólagos tesztelés köre. Többváltozós esetbe a vzsgálatba bevot magyarázó változók emcsak az eredméyváltozóra hatak, haem egymással s boyolult kapcsolatredszerbe vaak, sőt gyakra egymás hatását erősítve befolyásolják a függő változó alakulását. A multkolleartás tehát két vagy több magyarázó változó leárs korrelácós kapcsolatát jelet. A többváltozós leárs regresszós modellek eseté ktétel, hogy a maradékváltozó legye ormáls eloszlású és álladó szórású. Ha eleget tesz eek a feltételek azt modjuk, hogy a modell homoszkedasztkus. Ha ez em teljesül, akkor heteroszkedasztctás áll fe. A heteroszkedasztctás több problémát s felvet a paraméterbecslések és kofdeca tervallumok potos meghatározásáál ezért em hagyhatjuk fgyelme kívül. Elleőrző kérdések 1. Hogya teszteljük a többváltozós leárs regresszó jóságát, és a paraméterek lleszkedését?. M a többszörös determácós együttható? 3. Hogya értelmezzük a globáls F-próbát? 4. M a multkolleartás? 5. M heteroszkedasztctás? Kompetecát fejlesztő kérdések 1. Írja le a többváltozós leárs regresszós elemzés folyamatát, és elleőrzését!. Mért léyeges a parcáls korrelácós együtthatók számítása és értékelése a többváltozós leárs programozás modellekbe? 84

85 7 Proxyk, dummyk és mőség változók (Mesterséges változók alkalmazása) Equato Chapter 7 Secto 1 A regresszós modellek gyakra tartalmazak specáls (dszkrét, omáls sztű, ordáls sztű, em megfgyelhető stb.) változókat. Attól függőe, hogy a modellbe hol jeleek meg ezek a változók hatótéyezőkét vagy eredméyváltozókét másképp kell kezelük őket. Ha okozatkét találkozuk velük, abba az esetbe az eddgektől eltérőe kell modellezük, amre a később fejezetekbe vsszatérük még. Ha az eredméyváltozó alakulását mőség jellemzők s befolyásolják am gyakra előfordulhat, akkor az eset kezelhető az eddg megsmert eszközökkel. Meg kell jegyez, hogy ha a vzsgálatokál ezekek a mőség jellemzőkek a hatásat em szerepeltetjük, akkor léyeges hatótéyezőktől tektük el, s így köye adódhat, hogy a felépített modell hbatéyezője léyeges hatótéyező háyát mutatja 7.1 A proxy változók kezelése A regresszóak sokszor okság magyarázatot adak: a magyarázó változók az eredméyváltozó alakulásáak okakét jeleek meg. A proxy változók olya magyarázó változók, amelyek tartalmlag csak közvetve magyarázzák az eredméyváltozó alakulását. Ezért a proxy változókat ugyaúgy kezeljük, mt a hagyomáyos magyarázó változókat, de esetükbe a paraméterek értelmezése egy kcst eltér. Ha egy mesterséges változó kettőél több értéket vehet fel, azt proxy változóak hívjuk. E változó alkalmazásáak körülméye hasolóak a regresszóál már megsmertekhez, a közvetleül em mérhető jeleségeket a vele összefüggésbe levő, mérhető változóval közelítjük. Mvel az OLS a téyezőváltozókat em tekt valószíűség változóak, így azok eloszlásáak eltérése a meység smérvek eloszlásától, lletve az eloszlás kérdése em merül fel, mt alkalmazás probléma. Ha a proxy változót a téyleges változó hbása mért értékéek tektjük, amelyre feállak a mérés hbát tartalmazó modell feltevése, akkor a proxy változókat potosa úgy elemezhetjük, mt a regresszós modellbe eddg tárgyalt mérés hbát tartalmazó változót. Akkor haszáluk proxy változókat, amkor a valód változó közvetleül em megfgyelhető, lletve egy változóval em írható le a jeleség. Proxy változó az oktatásba töltött évek száma a képzettség kfejezésére, a felvétel teszte elért potok száma a képesség jellemzésére, a vlággazdaság helyzetéek leírására az olajár, mvel a fogalom közvetleül eheze mérhető, ezért valam pótlólagos mérhető változóval helyettesítjük. Elterjedte alkalmazott proxy változó az dőváltozó (t tme). Az dőt em lehet a jeleségek közvetle kváltójakét tekte, de mégs jól jellemz az dőbe lezajló folyamatok eredméyét, amt köye fel tuduk haszál az elemzésekbe. Eek a változóak a kezelése ugyaúgy törték, mt bármely regresszós változóé, de magyarázata eltér a többtől. 7. A mőség változók (dummyk) kezelése Ha a mőség smérvek két változata lehetséges, lletve megoldható aak alteratívvá alakítása, akkor umerkussá tehető úgy, hogy az egyk előfordulást 0 értékkel, a másk előfordulást 1 értékkel tesszük egyelővé. 0 ha em teljesül a feltétel 1 ha teljesül a feltétel. Az így defált változót Beroull vagy dummy változóak evezzük. Megállapíthatjuk, hogy ezekek a változókak a felhaszálásával a kmutatott, de potosa mégsem számszerűsíthető hatásokat s lehet szerepeltet az adott regresszós modellbe. Ha a dummy változó értéket defáltuk, akkor a szokásos módo határozzuk meg a regresszós 85

86 modellt. Főleg a társadalomtudomáy és gazdaság kutatásokba gyakor ez a kérdés, de mezőgazdaság elemzések esetébe s jól alkalmazható. A legegyszerűbb esetbe mőség smérvükek két változata va (fagykár volt em volt fagykár, aszályos dőszak em aszályos dőszak, volt csapadék em volt csapadék, ötözött em ötözött terület, őstermelő em őstermelő, redelkezk képesítéssel em redelkezk képesítéssel, férf - ő, részt vett mukavédelm oktatáso em vett részt mukavédelm oktatáso, egészséges beteg állat, termelésbe lévő állat kselejtezett állat, földrajz elhelyezkedés (főváros - vdék, de lehet szerepeltet a régókat, vagy a megyéket s a modellbe, de csak úgy, hogy adott terület egység és attól eltérő terület egységek), szezoáls dősorak az éve belül szezook kmutatása (több alteratív smérv kombácójával például a egyedévek), a kugró értékek (outler) szerepeltetése (szokásostól eltérő állapot - szokásos állapot). Ekkor a modellezést egyszerűe meg tudjuk olda, mvel köye képezhetük egy kétértékű ú. dummy változót, amelyet be tuduk a modellükbe építe. Ezek kódolása azoba többféleképpe s elvégezhető. A gyakorlatba általába háromféleképpe törték egy kétértékű változó kódolása (pl. őstermelő em őstermelő): a) A. mőség kfejezésére szolgáló dummy (d) változó 1 értéket vesz fel (d = 1) ha a vzsgált személy őstermelő, és 0-t (d = 0), ha em. Azt a csoportot, ahol a D álváltozó 0-val egyelő, kotrollcsoportak evezk. b)a megfelelő dummy változó 0, ha a vzsgált személy őstermelő, és 1, ha em. c) Legye a dummy változó értéke 1/, ha a vzsgált személy őstermelő, és -1/, ha em. Mdhárom eset haszálható, egyeértékű megoldást jelet arra a problémára, hogy az őstermelő / em őstermelő hatást modellez akarjuk, de a regresszós paraméterek értelmezése az egyes esetekbe eltér Egyváltozós regresszó kétértékű változóval Két változattal redelkező mőség smérvek Tektsük most egy olya regresszós modellt, amelybe csak egy kétértékű változó, D szerepel: Y=α + β D +e. [7-1] A fet regresszó legksebb égyzetes becslése (KLN vagy OLS) adja ˆ -ot és ˆ -ot. Megkapjuk α és β kofdecatervallumat s, a megfelelő P-értékeket pedg felhaszálhatjuk az együtthatók szgfkacájáak vzsgálatára. Kszámíthajuk az R -et, a regresszó szgfkacáját vzsgálhatjuk az F-próbával. Az Y és a D között leárs összefüggésből az -edk megfgyelés becsült értéke a következő: Yˆ ˆ ˆ D. [7-] Látható, hogy D értéke 0 vagy 1, Yˆ ˆ vagy Y ˆ ˆ ˆ Kettőél több változattal redelkező mőség smérvek Ha a mőség smérvek kettőél több változata va (több fajta/hbrd, alap-közép-felsőfokú végzettség sztek, főváros-város-község, kettőél több féle művelés/metszés mód, tej-húsvegyes haszosítás, legalább három féle gépmárka) akkor maga a kódolás s boyolultabbá válk. A kódolásál fgyelembe kell veük azt, hogy mde lehetséges esetet meg tudjuk 86

87 vzsgál, a legkevesebb számú változót haszáljuk fel, de ugyaakkor a paraméterek mdegyke valahogya értelmezhető legye. Trváls-kódolás kostas élkül: D A D B D C A B C Y = β A D A + β B D B + β C D C + e [7-3] Ebbe az esetbe megállapítható, hogy a 3 csoporthoz em szükséges 3 dummy változó, változóval s elemezhető a probléma. Ha va kostas a modellbe, akkor tlos s csoporthoz dummyt haszál a kódoláshoz. Ha ezt megteék, akkor egzakt multkolleartás jöe létre, amt dummy változó csapdáak evezek. Ha a mőség smérvek számú smérvértéke va, akkor a ulláak tektett referecakategóra mellett -1 számú változót haszáluk fel a kódoláskor. A referecakategóráak a megválasztása kemelt jeletőséggel bír, mvel a későbbekbe ehhez a kategórához (smérvváltozathoz) vszoyítuk mdet. Ugyaakkor, ha egy változóba kódolák az számú változatot (0, 1,, 3,, -1), akkor az azt jeleteé, hogy az smérvváltozatok között azoos távolságot feltételeztük, am a gyakorlatba elképzelhetetle. Refereca-kódolás kostassal: D A D B A 1 0 B 0 1 C 0 0 Y = β * +β * AD A + β * BD B + e [7-4] Meg kell jegyez, hogy ugyaarra a csoportra a külöböző kódolások esetébe s ugyaakkora értékek kell kjöe, függetleül a kódolás típusától. Például az A csoportra: β A =β * +β * A [7-5] Az elmodottak alapjá a teljes egyelet a következőképpe írható fel: Y = β C +(β A - β C )D A + (β B - β C )D B + e [7-6] Megjegyezzük, hogy olya feladatok, melyekél több mőség változó szerepel, lletve olya mőség változókat haszáluk, amelyekek több lehetséges kmeetelük (smérvváltozatuk) va, meglehetőse boyolult kódolás problémákhoz vezetek. 7.. Többváltozós regresszó kétértékű változókkal Vzsgáljuk meg egy olya többváltozós regresszót, amelybe több kétértékű változó szerepel: Y D... D e. [7-7] 1 1 k k 87

88 Ezt az egyeletet a legksebb égyzetek módszerével meg tudjuk becsül és a szokásos statsztka eszközökkel elemezhetjük Többváltozós regresszó kétértékű és em kétértékű változókkal A gyakorlatba sokszor előfordul, hogy em csak kétértékű magyarázó változókkal kell dolgozuk, haem egyszerre többfélével. Eek a legegyszerűbb változata, ha egy kétértékű (D) és egy meység változó (X) szerepel a regresszóba: Y D X e. [7-8] 1 Az előzőekbe elmodottakat arra az esetre s k lehet terjeszte, ha több kétértékű és em kétértékű változó hatását együtt vzsgáljuk. A következő regresszós modellbe két kétértékű, és két em kétértékű változó szerepel: Y D D X X e. [7-9] A kétértékű és em kétértékű változók terakcója A kétértékű változókat eddg úgy haszáltuk, hogy a regresszós egyeletbe az egyes csoportokhoz tartozó tegelymetszetek külöbözzeek egymástól, az egyeesek meredeksége ugyaakkor változatla maradt. A kétértékű és em kétértékű változók között terakcóval lehetőségük va arra, hogy az egyes csoportok egyeeseek meredeksége s eltérje. Vzsgáljuk a következő regresszós modellt: Y 1D1 X 3Z e, [7-10] ahol D kétértékű változó és X em kétértékű változó, eze a két változó kívül szerepel még egy harmadk változó, Z s, amelyet a következőképpe hoztuk létre: Z = DX. A következőkbe bemutatjuk Y-ak D-re, X-re és Z-re voatkozó regresszójáak értelmezését. Vegyük észre, hogy Z értéke vagy 0 (az olya megfgyelések esetébe, ahol D = 0), vagy X (az olya megfgyelések esetébe, ahol D = 1). Ezek utá írjuk fel D = 0 és D = 1 értékek mellett adódó regresszós egyeeseket: Yˆ ˆ ˆ ˆ ˆ X. [7-11] ha D = 1, akkor 1 3 Ha D = 0, akkor Yˆ ˆ ˆ X. [7-1] Máskét fogalmazva a D = 0 és D = 1 esethez két teljese külöböző regresszós egyees tartozk: eltér a tegelymetszetük és más a meredekségük s. Eek az egyk fotos következméye, hogy X-ek az Y-ra gyakorolt margáls hatása más akkor, ha D = 0, és más, ha D = 1. Összefoglalás A kétértékű változók csak két értéket vehetek fel, a 0-át és az 1-et. Jellemző módo a kvaltatív (mőség) adatokat számszerűsítjük így. Az lye típusú magyarázó változók haszálata teljese megegyezk a em kétértékű változók esetébe alkalmazottakkal. A csak kétértékű (dummy) magyarázó változókat tartalmazó regresszó a változók kombácó által meghatározott csoportokba sorolja a megfgyeléseket (férf vagy ő, külföld mukatapasztalattal redelkező vagy em redelkező, fatal vagy dősebb géppark, adott tájegységbe vagy más tájegységbe termelő). A csoportok alapos smerete hozzájárulhat az eredméyek értelmezéséhez. A kétértékű és em kétértékű magyarázó változókat tartalmazó regresszó s csoportokba sorolja a megfgyeléseket, de eze kívül még az egyes csoportokhoz 88

89 külö-külö regresszós egyeest számít, amelybe a tegelymetszet csoportokét eltér. Az egyeletek meredeksége ugyaakkor azoos. A kétértékű, em kétértékű és terakcós (amt az előző kettő változó szorzatakét számítuk k) változókat s tartalmazó regresszó csoportokba sorolja a megfgyeléseket, és azt s modja, hogy az egyes csoportokhoz külökülö regresszós egyees, tegelymetszet és meredekség tartozk. Elleőrző kérdések 1. Mt értük a proxy változó kfejezés alatt?. Mt jelet a dummy kfejezés? 3. Hogya törtéhet a kétértékű változók kódolása? 4. Hogya lehet a kétértékű és em kétértékű változókat beépíte a regresszóba? Kompetecát fejlesztő kérdések 1. Hogya értelmezzük a kétértékű változókhoz tartozó paraméter értékeket?. Írjo fel egy olya regresszós modellt, amelybe csak kétértékű változó szerepel! 3. Írjo fel egy olya regresszós modellt, amelybe kétértékű és em kétértékű változót s beépített! 4. Magyarázza meg, hogy az előző potba felírt modell paramétere mt jeleteek! 89

90 8 Logsztkus regresszó Equato Chapter 8 Secto 1 A regresszós vzsgálatok specáls esete, ha az eredméyváltozó omáls (bárs, multomáls) vagy ordáls. Ebbe az esetbe a dszkrét, kategóra-kmeetű eredméyváltozó előrejelzését besorolásak evezzük. A besorolás sorá a besoroladó (személy, állat, tárgy vagy vállalkozás) olya jellemzőre támaszkoduk, melyek a korább megfgyelések alapjá meghatározzák a csoportok szóródását. Az lye osztályozó változókat magyarázó változókak evezzük. A magyarázó változók mérés sztje lehetek meység jellegű számértékek, de lehetek omáls kategórák s, mvel a modell számára em jelet problémát a külöböző sztű változók haszálata. A omáls kategórák dummy változók redszerével vohatók be a dötés modellbe. Az előzőek matt ezt az eljárást széles körbe alkalmazzák, mvel cs a modellbe az adatokra előzetese voatkozó megkötés. Ha modellez szereték egy bárs függő változót (Campbell, 004), ahhoz gyakra a legkább megfelelő módszer a logsztkus regresszó. Swscow szert a kh-égyzet próbát kellee alkalmaz a két bárs változó között kapcsolat leírására. A kh-égyzet teszt a logsztkus regresszó általáosítása, abból a szempotból, hogy megvzsgálja a kapcsolatot a két kmeetelű függő változó és egy vagy több függetle változó között, amelyek értéke lehetek bársak, kategorkusak (több mt kétkategórásak) vagy folytoosak. A logsztkus regresszót haszáljuk a függő változó előrejelzésére a folytoos és a kategorkus függetle változókra alapulva, hogy: meghatározzák az eltérés százalékát a függő változóba, ragsorolja a függetle változók relatív fotosságát, értékeljék a közöttük lévő kölcsöhatást, megértsük az együtthatók befolyását az elleőrző változókra. Az előre jelzett változók befolyását gyakra magyarázzák az odds rato voatkozásába. A mkroökoóma legegyszerűbb dötés (optmalzácós) modelljebe általába feltételezzük, hogy a dötéshozó folytoosa helyettesíthető javak közül választ. Ezt a feltételezést feloldva, akkor beszélük dszkrét dötés modellekről, ha a modellbe szereplő javak em oszthatók fel tetszőlegese ks részekre. Ilye esettel találkozhatuk például akkor, ha a mezőgazdaság termelők által vásárolt traktorok számát próbáljuk magyaráz: egy termelő ha vásárol vehet egy, két stb. traktort, de például elképzelhetetle 1,4 traktor vásárlása. A gyakorlat alkalmazások sorá ktütetett szerepet játszk a logsztkus eloszláso alapuló ú. MNL- (multomal logt) modell. Sokszor találkozhatuk a dszkrét dötés modellek azo specáls esetével s, amkor a magyaráz kívát változó csak két értéket vehet fel: például ötözött-e a mezőgazdaság termelő egy adott dőszak alatt. Ilye esetekbe szokás az ú. bárs modelleket haszál. A bárs modelleke belül szté ktütetett szerepet kap a logsztkus eloszláshoz kapcsolható modell, az ú. bárs logt modell, amelyek becslésére már szte mde statsztka programcsomag képes. A természetes logsztkus függvéy alakja: 90

91 Ilye görbét haszálak a tpkus övekedés jelleg becslésére s. Például egy új termék (mobltelefo) eladása kezdetbe gyorsa ő, majd fokozatosa csökke a övekedése. A becslés eljárás attól függ, hogy a megfgyelt P a 0 és 1 közé esk-e, vagy bárs és az értéke 0 vagy 1. Azokat a modelleket, amelyekbe az eredméyváltozó bárs, bomáls logt modellekek evezzük. Abba az esetbe, amkor P értéke szgorúa csak 0 és 1 között lehet (például mezőgazdaság bztosítást kötő termelők aráya az összes termelőből), egy kostassal és X változó(k)-val becsüljük. Ha vszot P bárs, a P/(1-P) logartmusa em defálható, mert P értéke 0 vagy 1. Az lye esetekbe alkalmazzuk, az u. maxmum lkelhood-módszert. 8.1 Leárs regresszó dchotóm vagy kategóráls függő változóval Amkor a célváltozó kétértékű, az alább modellel dolgozhatuk (Ketskeméty et al., 011): Y X, [8-1] ahol Y 01, 0 1 dchotóm változó, P(Y=1)=p és P(Y=0)=1-p eloszlással, EY=p, σ Y=p(1-p), [8-] X umerkus változó, a függetle változó. T A regresszós, együtthatóvektor b b,b 0 1 T módszerével a 1 T b X,X X Y 0 1 T becslését a legksebb égyzetek Y Y 1,Y,...,Y a függő egyelettel kapjuk meg, ahol 1 X1 változóra voatkozó mta, X a függetle változók megfgyeléset tartalmazó - 1X es mátrx. A kapott Y b0 b1x regresszós egyees egy X s helye aak a valószíűségét közelít, hogy a megfelelő Y s érték éppe 1 értéket fog felve: P(Y s =1) b0 b1x s. (Ebbe az esetbe az eredméy em bztos, hogy b b X, lesz!) Logsztkus regresszó - A kétértékű függő változó esete Amkor dchotóm függőváltozók va és emleárs regresszót akaruk, dolgozhatuk ezzel a modellel (Ketskeméty et al., 011): exp 0 1X [8-3] Y, 1exp X 0 1 T 91

92 p=ey exp exp X X 0 1 [8-4] p Ebből learzálva kapjuk, hogy 0 1X l p, am már az előző problémával 1 p egyezk meg. Az ott smertetett módo előállítva a b 0, b 1 együtthatókat, a számított exp b0 b1x regresszós görbe a Y lesz, am most s valószíűséget jelet. Az Y 1 exp b b X 0 1 célváltozó most dchotóm, am azt jelet, hogy csupá két értéket vesz fel: 1-et, ha egy A eseméy bekövetkezk, és 0-át, ha A em következk be. Pl. az A eseméy lehet A gazdálkodó meglátogatja a FARMEREXPO-t" A termelő befejez a termelését (yugdíjba megy)" A övéyvédelmet dőbe elvégzk" Adott tovább k függetle változó: X 1, X,..., X k. Pl. A függetle változók a fet eseméyekhez kapcsolódóa lehetek: - a gazdálkodó eddg már háyszor látogatta meg a kállítást, m a kora, skolája, jövedelme stb. - a termelő mekkora földterülettel redelkezk, mlye géppark áll a redelkezésére, család állapota, gyermekeek száma, életkora, stressz-rzkó faktorok stb. - mey csapadék esett a területe, mlye a talajállapota, mlye a övéyek fejlődés stáduma, mekkora területe kell elvégez a védekezést stb. A függetle folytoos változók értékevel akarjuk megbecsül Y-t, és eze keresztül az A eseméy bekövetkezését! A függetle változókak azt a Z =B 0 + B 1 X 1 + B X B k X k leárs összefüggését keressük, amelyek expoecáls függvéyével legjobba lehet PY 1 P( A) Z közelíte az A eseméy esélyét" (ú. odds- át), vagys ahol e. P Y 0 1P( A) 1 1 Ie kapjuk, hogy PY 1 P( A),PY 0 1 P( A). A legagyobb Z Z 1e 1e valószíűség (maxmum-lkelhood) elvét alkalmazzuk most a probléma megoldásakor. Az Y, X 1, X,..., X k változókra voatkozó elemű mta,x,x,...,x,...,,x,x,...,x, alapjá maxmalzál akarjuk az k1 1 k 1 L 1,,..., l PY 1 1,Y,...,Y l 1 B0 B1 X1 B X... Bk Xk 1 1 e ú. loglkelhood függvéyt. A megoldást adó B 0,B 1,...,Bk együtthatók a fet összeget maxmalzálják. Ezeket az együtthatókat alkalmazzuk majd az Y-ra voatkozó előrejelzésél. Y=1 et tppelük, Z ha ez e 1, külöbe Y=0-át tppelük. Maxmum-lkelhood becslés (ML) A mometumok módszeré kívül a potbecslés másk módszere. A maxmáls valószíűség agolul: maxmumlkelhood, tehát az L = L(k; λ) lkelhood függvéy maxmumát keressük. Általáosítva: Ismerjük a sokaság eloszlását, de em smerjük az eloszlást jelző paramétert vagy paramétereket. A paraméter vagy paraméterek értékét olya értékkel vagy értékekkel becsüljük, amely vagy amelyek eseté az adott mta bekövetkezése lee a legagyobb valószíűség. A maxmáls valószíűséget az adott mta valószíűségét megadó lkelhoodfüggvéy maxmumával vagy a logartmusáak a maxmumával keressük meg (Bókko, 010). 9

93 Defícó: Legye X 1,..,X mta F ϑ eloszlásból, L(X; ˆ ) = max {L(X; ϑ) : }.. Ekkor a ϑ maxmum lkelhood (ML) becslése ˆ, ha Ha ez em egyértelmű, vagy em létezk, de L(X; ˆ ) elég sma, akkor a l L X ; 0 lkelhoodegyelet megoldására vagyuk kívácsak. A maxmum-lkelhood becslés az egyk legelterjedtebb módszer a gyakorlatba. Bár, a becslés általába em torzítatla, bzoyos erős feltételek mellett jó aszmptotkus tulajdosága vaak. Tétel: Bzoyos (erős) regulartás feltételek mellett elég agy -re a Egyes esetekbe: Aszmptotkusa ormáls eloszlású: ˆ Aszmptotkusa torzítatla: m 0 Aszmptotkusa optmáls: I ˆ ML becslés létezk, és kozsztes. N m,, A kettőél többértékű kategoráls függő változó Az eddgekbe a bárs logsztkus regresszóval foglalkoztuk, amelyél a kategoráls függő változó csak két értéket vehet fel. Eek kterjesztése a multomáls logsztkus regresszó, amelyél a kategoráls függő változó kettőél több értéket s felvehet. Ismert, hogy a leárs regresszóba a kategoráls predktor (függetle) változó akkor sem probléma, ha az em kétértékű, mert lyekor egyszerűe megfelelő számú kétértékű "dummy" (dcator) változót lehet helyette haszál. A multomáls logsztkus regresszóál ugyaezt az elvet alkalmazzuk a függő változóra. A multomáls logsztkus regresszó valójába L-l számú bárs logsztkus regresszós modellre vezet vssza a megoldást ( L a függő változó lehetséges értékeek, lletve kategóráak a száma). Eze bárs logsztkus regresszós modellek mdegykéek megva a maga tegelymetszete és megvaak a regresszós koeffcese. A multomáls logsztkus regresszó alkalmazásáak az előye abba állak a külö-külö futtatott bárs logsztkus regresszós modellekhez képest, hogy hatékoyabb a paraméterek becslése és ksebb a hba. A bárs és multomáls logsztkus regresszó közös előye, hogy a regresszós koeffcesek (odds rato) értelmezhetőek. A multomáls logsztkus regresszó alapmodelljét az L=3 esete mutatjuk be, amelyre a modell a következő 3 egyeletből áll (Ketskeméty et al., 011): z1 e [8-5] PY 1 z1 z z3 e e e z e [8-6] PY z1 z z3 e e e z3 e [8-7] PY3 z1 z z3 e e e Ez az egyeletredszer azoba határozatla, mert ha mde z értékhez hozzáaduk egy C kostast, a P valószíűségek változatlaok maradak (azaz külöböző z értékekhez tartozhatak azoos P valószíűségek). Az egyeletredszert úgy tehetjük határozottá, hogy az egyk kválasztott z értéket 0 szte ökéyese rögzítjük (pl. z 3 =0). Ezzel az Y=3 értéket ú. refereca-kategóráak jelöltük k. Az Y=3 refereca-kategóra kjelölésével egyúttal két esély (odds) értéket s defáltuk: 93

94 odds p,odds p3 1 p3 p [8-8] Általáos esetbe L-3 esélyt (odds) kapuk. A z 3 =0=B 30 + B 31 X 1 + B 3 X + B 33 X B 3p X p feltétel azt jelet, hogy B 30 = B 31 = B 3 = B 33 =... = B 3p = 0. Ha ezt elvégezzük az L= esetre, megkapjuk a bárs logsztkus regresszó már megsmert alapmodelljét: z1 e [8-9] PY 1 z1 z e e z e [8-10] PY z1 z e e Legye tt az Y=1 a refereca-kategóra, az Y= pedg felelje meg az A eseméy bekövetkezéséek. Ekkor z dexét elhagyva kapjuk: z e 1 [8-11] PY PY A pa z z e 1 1e A bárs és a multomáls logsztkus regresszó az összehasolításokhoz a függő változó egy ktütetett ú. refereca-kategóráját haszálja, ezért az eredméyek elv okokból vszoylagosak, em adak meg abszolút szteket. A bárs esetbe a refereca a 0 értékű kategóra, és az eljárás ehhez képest becsl az 1 (vagy A) értékű eset előfordulásáak a valószíűségét mde egyes függetle változóra. A multomáls esetbe a függő változó refereca-kategórája bármelyk értékhez tartozó kategóra lehet és az eljárás a függő változó valamey kategóráját összehasolítja ezzel a kválasztott refereca-kategórával mde egyes függetle változóra. Az eljárás a modell alapjá mde esetre kszámítja a függő változó lehetséges L számú kategórájába tartozásáak a valószíűségét és az esetet a legagyobb valószíűségű kategórába sorolja. Semmlye előzetes feltételt em támaszt: em szükséges pl. a függetle változók ormaltása, leartása, a varaca homogetása stb. Eze kedvező tulajdoságok matt előyöse haszálható olyakor, amkor a dszkrmaca-aalízs feltétele em teljesülek (Ketskeméty et al., 011). Az egyetle feltétel az, hogy mde függetle változóra legalább 10 eset jusso (ajálott case-to-varable aráy: 0). Tegyük fel, hogy az X 1,,...,c ordáls változó. Legye R az Y = 1, X = egybeesések száma az elemű mtába, pedg az X = esetek száma a mtába. Legye p p l. 1 p A legksebb égyzetek módszerét most a w p 1 p alkalmazzuk: T T , 1 p R és súlytéyezőkkel Y X ww Y X m, majd a mmalzálás exp b0 b1x eredméyekét kapott b 0, b 1 együtthatókkal felírjuk a Y válaszfüggvéyt. 1 exp b b X Exogé és edogé mta A gyakorlat alkalmazások sorá gyakra előfordul, hogy mtákat valamlye szempot szert rétegezzük (Fülöp, 00). Az alkalmazott kutatásokba általába kétfajta egyszerűbb módo rétegzett mtával találkozhatuk: az egyk a magyarázó változó keresztül rétegzett mta (ezt szokás exogé mtáak s evez), a másk az eredméyváltozó keresztül rétegzett mta (ezt szokás edogé mtáak s evez). Ha például egy adott 94

95 mezőgazdaság gépmárka vásárlását befolyásoló téyezőket kívájuk egy bárs logt modell segítségével meghatároz, akkor exogé mtáak tekthetjük a jövedelem szert rétegzést, edogé mtáak pedg az adott mezőgazdaság gépmárka vásárlása szert rétegzést, azaz egy olya mtát, ahol külö mtát veszük a márkát vásárlók, lletve em vásárlók alapsokaságából. Ez az eset általába akkor fordul elő, ha az alapsokaságba az eredméyváltozó két kmeetele agyságredleg s külöböző aráyba fordul elő. Általáos eredméy, hogy a dszkrét dötés modellek esetébe ha exogé mtát haszáluk, akkor em kell módosíta az egyszerű véletle mtára kdolgozott becslés módszert, míg az edogé mta esetébe ge (McFadde; 1983). Ez utóbb esetébe a leggyakrabba haszált módszer a Mask Lerma (1977) által javasolt ú. súlyozott exogé mtá alapuló maxmum lkelhood függvéy WESML (Weghted exogeous sample maxmum lkelhood) alkalmazása. A súlyozott maxmum lkelhood becslés kozsztes, de aszmptotkusa em feltétleül hatásos. Mvel azoba em lehet egyértelműe meghatároz, hogy az alteratív szté kozsztes becslés eljárásokkal összevetve melyk becslés az aszmptotkusa hatásosabb, az emprkus mukákba tektettel köyű kszámíthatóságára a súlyozott maxmum lkelhood becslést alkalmazzák (Mask McFadde; 1981, Pudey; 1989). Míg a fet állítások általába érvéyesek a dszkrét dötés modellekre, addg a logt modellek eseté szerecsére sokkal egyszerűbb a helyzet. Megmutatható ugyas, hogy az egyszerű véletle mtavételhez tartozó becslésük a kostast leszámítva a paraméterek kozsztes becslését adja. Így logt modellek eseté edogé mta esetébe s haszálhatjuk az egyszerű maxmum lkelhood becslést, csupá a kostasra kettőél több elemű dötés halmaz (MNL-modellek) eseté pedg az alteratíva-specfkus kostasokra voatkozó becslésüket kell módosíta a következőképpe: Az alapsokaságot botsuk két részre aszert, hogy az edogé változó mlye értéket vesz fel. Potosa lye eset a fetebb említett példák: az adott mezőgazdaság gépmárka vásárlását meghatározó modell becsléséhez külö-külö veszük mtát a gépmárkát vásárlók, lletve em vásárlók alapsokaságából. A magyarázott változó vegye fel az 1-es és a 0 értéket aszert, hogy az adott termelő vásárol, lletve em vásárol gépmárkát. Vegyük tehát egyszerű véletle mtát külö-külö az alapsokaságak a csak 1-es értékű edogé változókat tartalmazó első és a csak 0 értéket tartalmazó másodk csoportjából. Tételezzük fel, hogy az első csoport eseté a keresett aráy p 1, a másodk csoport eseté pedg p, tehát a mtába kerülés valószíűsége az első csoportból p 1, a másodk csoportból pedg p. Ebbe az esetbe a mtába x e p1 x x pe Pr y x e [8-1] x, x e 1 p p1e p1 p x x 1e 1e 1 p x 0 1 p Pr y x e [8-13] x 1 1. p p p1e 1 p x x 1e 1e p Legye most p. Ez esetbe a fet két összefüggést átírhatjuk a következő alakra: p 1 x e 1 Pr y 1 x 0 x Pr y x x p e e 1 p [8-14] Legye a továbbakba l p, azaz p e. Ekkor a fet valószíűségek a következőképp írhatók fel: 95

96 Pr y e e e e 1 x e e e e e 1 e 1 Pr y 0 x x 1 e x x x x x x [8-15] Ez utóbb két kfejezés vszot azt jelet, hogy egy edogé mta esetébe ameybe smerjük a megfelelő mtavétel aráyokat egy olya modellt becsülük, amelyek paramétere a kostast kvéve megegyezek az egyszerű véletle mtához tartozó modell paraméterevel. Így haszálhatjuk a szokásos maxmum lkelhood becslést, csupá a kostasra voatkozó becslésüket kell korrgáluk. Mvel a kostasra edogé mta eseté -val agyobb értéket kapuk, ezért egyszerűe le kell vouk a kostas becsült értékéből az l p 1 l p kfejezés értékét. Térjük most rövde vssza a mezőgazdaság gépmárka vásárlását befolyásoló téyezők becslésére voatkozó példához. Ha a márkát em vásárlókhoz képest eleyésző a márkát vásárlók száma, egyszerű véletle mtavétel eseté ylvávalóa gazdaságtalaul agy mtával kellee dolgozuk. Ha azoba külö veszük egyszerű véletle mtát a vásárlókból és a em vásárlókból, akkor léyegese ksebb mtával dolgozhatuk, ráadásul a kostas korábba említett korrekcóját leszámítva haszálhatjuk a stadard becslés eljárást. 8.5 A bárs logt modellek teszteléséek eszköze A logt modelleket maxmum lkelhood elve alapuló függvéy segítségével becsüljük, a tesztelés sorá legkább alkalmazott eszközök az ML-becslésre voatkozó stadard specfkácós tesztek közül a lkelhood aráy (LR) és a Wald-típusú teszteket mutatjuk be. Mdegyk fajta teszthez tartozk egy, a modell adott specfkácójához kapcsolható ull- és ellehpotézs (H 0 és H 1 ). A legegyszerűbb példa szert ullhpotézs lehet, hogy egy adott exogé változó paraméterértéke ullával egyelő, az ellehpotézs pedg az, hogy ez az érték em egyelő ullával. A külöböző típusú tesztek mögött más-más elgodolás áll, ezért a tesztstatsztkák kszámítása s külöbözk. A lkelhood aráy elve alapuló tesztek eseté k kell számítauk a log-lkelhood függvéy értékét md a ullhpotézs, md az ellehpotézs esetére és ezeket kell összevetük egymással. A Wald-típusú tesztelv pedg azt vzsgálja, hogy modellük adott specfkácója szgfkása külöbözk-e a ullhpotézshez tartozó specfkácótól. Ebbe az esetbe tesztstatsztkát csak az ellehpotézshez kapcsolódó specfkácó mellett kell kszámítauk. A Wald-teszt haszálata tehát akkor előyös, ha a tesztstatsztka értékét köyebb az ellehpotézs mellett kszámíta. Ilye eset a felesleges változó teszteléséek az esete: a H 1 hpotézs szert az adott változó em felesleges, így modellüket becsülhetjük az adott változóval s, majd ezt a becslést felhaszálva tesztelhetjük a változó felesleges voltát Magyarázó változókra voatkozó tesztek A magyarázó változókra voatkozó tesztek közül a legfotosabb bárs logt modellek eseté az aszmptotkus z-teszt, amely az egyes magyarázó változók teszteléséek legfotosabb eszköze (Log; 1997). Felesleges változók eseté az ML-becslés kozsztes, de em hatásos. Vzsgálatát a Waldteszt segítségével végezzük el, és a teszt H 0 hpotézse szert az adott magyarázó változó vagy változók feleslegesek. A Wald-tesztet hasolóa a leárs modell teszteléséhez haszálják a magyarázó változókra voatkozó leárs feltételek tesztelésére s. 96

97 A teszt egy paraméterre voatkozó specáls esete megfeleltethető a modellépítés sorá leggyakrabba haszált aszmptotkus z-tesztek. Ha ugyas ullhpotézsük például a 1 1, akkor az aszmptotkus z-teszt alapjá a ˆ 1 1 z [8-16] Var ˆ 1 aszmptotkusa stadard ormáls eloszlású. A ullhpotézsek megfelelő Wald-statsztka: 1 ˆ 1 1 W [8-17] Var ˆ am potosa a égyzete az aszmptotkus z-teszthez tartozó statsztkáak. Ha z stadard ormáls eloszlású valószíűség változó, akkor z 1, így emcsak a két tesztstatsztka kszámítása, haem aszmptotkus eloszlása s megfeleltethető egymásak A modell általáos jóságára voatkozó tesztek A modell általáos jóságára voatkozó tesztek szté a modellépítés legfotosabb eszköze közé tartozak. Az alábbakba áttektjük a szokásos LR-tesztet és a Hosmer-Lemeshow statsztkát. Az LR-teszt (Be-Akva Lerma; 1985) a feállására voatkozó H 0 hpotézs eseté az LR =-(ll(c) ll( ˆ )) k 1 szabadságfokú χ -eloszlást követ,ahol az L(c) és L( ˆ ) a log-lkelhood függvéy értékét jelöl, ameybe csak a kostas (azaz β 0 0), lletve az általuk becsült ˆ vektor a magyarázó változó. Ez a bárs logt modell esetébe azt jelet, hogy az eredméyváltozó bekövetkezéséek valószíűségére mde egyes esetbe eek a változóak a mtabel aráyát becsüljük. Ha a feállására voatkozó H 0 hpotézst akarjuk tesztel, akkor az LR = (ll(0) ll( ˆ )) k szabadságfokú χ -eloszlást követ, ahol L(0) az MLfüggvéy értékét jelöl a k 0 eseté. A Hosmer és Lemeshow által 1980-ba javasolt statsztka robosztus és főképp umerkus függetle változó és ks mták eseté haszálható. Az eljárás tíz részre osztja a becsült függő változó szert sorba redezett mtát és mdegyk decmálsba összehasolítja a függő változó 0 lletve 1-gyes értékeek megfgyelt számát a becsülttel. A Hosmer-Lemeshow féle Ĉ statsztka a 10x-es klasszfkácós táblából kszámolt Pearso ch-égyzet statsztká alapul és megközelítőleg ch-égyzet eloszlása va. k k Általáos jóság mutatók A log-lkelhood függvéye alapuló pszeudó-r mutatók a lkelhood függvéy maxmalzált értékét hasolítják valamlye bázsértékhez, például ahhoz az értékhez, amkor csak egy kostas va a modellbe, ezzel próbálva megragad azt, hogy a magyarázó változók meyt javítaak a modelle. A legkább haszált mutató a McFadde-féle korrgált pszeudo-r mutató: 97

98 l L 1 l L ˆ k 1 0 [8-18] Az Akake s Iformato Crtero (AIC) (Log, 1997) kszámítás módja: l L ˆ k 1 [8-19] AIC N Mvel alacsoyabb ll( ˆ ) magasabb ML-függvéy értéket jelöl, a több magyarázó változó övel, míg a mtaagyság övelése csökket az AIC-mutató értékét, ezért az alacsoyabb érték jobb lleszkedésre utal. Az AIC-mutatót haszálják a külöböző egymásból em származtatható, lletve külöböző mtákból becsült modellek összehasolítására. Gyakra haszálak még tovább mutatókat s az lleszkedés szorosságáak jellemzésére. A Schwarz Bayes-Crtero (BIC) számítás módja a következő (Tutz, 000): l L ˆ k 1l [8-0] BIC N A mutatót egymásból em származtatható modellek összevetésére haszáljuk mégpedg úgy, hogy a külöböző modellekhez tartozó értékeket kszámítjuk és a ksebb értékkel redelkező modellt tektjük jobbak. Általába kettőél agyobb külöbség eseté már tekthetjük a ksebb értékkel redelkező modellt jobbak Az Akake s Iformato Crtero (AIC) tovább alteratívája a Haa Qu Crtero (HQC) mutató: ˆ 1 HQC l L k l N [8-1] Előrejelzés teszt Az LR-teszt (Lkelhood rato test) segítségével lehetőségük va a modell előrejelzés erejéek a tesztelésére (Aderso; 1987). A teszt haszálatakor modellüket először a teljes mtát ( =1,..., N), majd csak a mta egy részét ( = 1,..., N 1 ) felhaszálva becsüljük (ll N ( ˆ ), lletve ll N1 ( ˆ )). A log-lkelhood függvéy két becsléséhez tartozó értékeek segítségével pedg kszámítjuk az LR = (ll N1 ( ˆ ) ll N ( ˆ )) kfejezés értékét. A megfelelő előrejelzés erőre voatkozó H 0 hpotézs mellett az LR (N N 1 ) szabadságfokú χ eloszlást követ. Noha az előrejelzés teszteket általába dősorokhoz kötk, esetükbe jól haszálható keresztmetszet adatok eseté s. A tesztet Aderso (1987) alapvetőe strukturáls változás tesztelésére ajálja. A teszt haszos lehet akkor s, ha meg akaruk győződ arról, hogy modellük meyre érzékey a megfgyelések számára. A modell lleszkedéséek jósága úgy defálható, hogy a modell meyre képes leír a függő változót (Hosmer-Lemeshow, 000). Az lleszkedés jóságáak mutató közül valamey a téyleges és a modell által becsült függő változó értékeek összehasolításá alapul, ezért az előrejelzés potosságo alapuló mutatókak s evezzük. Bárs változók eseté (Csorba, 009) a cut-off value azt az értéket mutatja meg, amely felett a változó értéke 1, és alatta pedg 0. A cut-off value értékéek változtatásával változk az osztályokba való besorolás s, hsze vagy egy magasabb értékél vagy egy alacsoyabb értékél húzzuk meg a határt, így az eredet határ közelébe lévő elemek átsorolódhatak a másk csoportba. A krtkus értéket úgy célszerű megválaszta, hogy a téves besorolás elkövetésével együtt járó veszteség mmáls legye. A besorolás potosságáak mérésére a legalapvetőbb eszköz a klasszfkácós mátrx. 98

99 8.5.5 Klasszfkácós tábla Egy másk köyű érthetősége matt a marketgkutatás gyakorlatba s agyo épszerű mutatója a logsztkus regresszós modell lleszkedés jóságáak a klasszfkácós tábla, am a függő változó becsült és téyleges értéket hasolítja össze (Lázár, 011). A magyar yelvű szakrodalomba elterjedt a "találat mátrx" kfejezés s, de tt matematka értelembe em mátrxról va szó. A modell becsült valószíűsége alapjá hozzáredelhetjük valamey esethez a függő változó két kmeetéek valamelykét. Ehhez szükséges defáluk egy küszöbértéket (k), amely felett valószíűség értékek eseté a mezőgazdaság mukagép vásárlását, az alatt értékek eseté pedg a vásárlás elutasítását valószíűsítjük. Legye ŷ becsült függő változó két értéke: 0 hapˆ y 1 k [8-] ŷ 1 hapˆ y 1 k, ˆP y a modell alapjá becsült valószíűség. A k küszöbérték általába 0,5, de a ahol 1 logsztkus regresszó elemzést tartalmazó számítógépes szoftverek lehetővé teszk eek opcoáls változtatását. A klasszfkácós tábla általáos formája: Klasszfkácós tábla Megevezés Előrejelzés Találat aráy 0 em 1 ge % 11 Téy 0 em helyes besorolás másodfajú hba 1. 1 ge 1 elsőfajú hba helyes besorolás. Összese.1. Forrás: Hosmer Lemeshow, 000. A főátlójába a helyes osztályozások (ezek aráya a helyes osztályozás ráta), a mellékátlójába az első-és másodfajú hbák vaak feltütetve. A találat aráy kfejezhető egy értékkel, ez a klasszfkácós R k : 11 [8-3] Rk, ahol a mtaelemszám, 11 és a két típusú helyes találatok száma. 1 Összefoglalás A regresszós vzsgálatokba gyakra az eredméyváltozó omáls (bárs, multomáls) vagy ordáls mérés sztű. Az lye esetekbe a függőváltozó dummy változók redszerével vohatók be a dötés modellbe. Ez az eljárás agyo elterjedt, mvel cs a modellbe az adatokra előzetese voatkozó megkötés. Az lye típusú modellekbe, ha smerjük a sokaság eloszlását, de em smerjük az eloszlást jelző paramétert vagy paramétereket, akkor ezeket olya értékkel becsüljük, amely eseté az adott mta bekövetkezése lee a legagyobb valószíűségű. A maxmáls valószíűséget az adott mta valószíűségét megadó lkelhood-függvéy maxmumával vagy a logartmusáak a maxmumával keressük meg. A fejezetbe rövde áttektjük a bárs logt modellek származtatását és becslésük módszerét, a mtavétel kérdését, az alkalmazott kutatások sorá 99

100 gyakra haszált teszteket. Végül ktérük az dvduáls sztű adatokhoz kapcsolódó előrejelzés módszerre s. Elleőrző kérdések 1. Hogya tudjuk a regresszót vzsgál, ha a függőváltozó dchotóm?. M a maxmum lkelhood becslés? 3. Mt jelet a bárs logt modell kfejezés? 4. Mlye teszteket haszáluk a logt modellek vzsgálata sorá? 5. Hogya lehet előrejelzést végez logt modellekkel? Kompetecát fejlesztő kérdések 1. Készítse egy mezőgazdaság modellt, amelybe a függő változó kétértékű!. Írjo fel egy olya regresszós modellt, amelybe a függőváltozóak kettőél több értéke s lehet! 3. Értelmezze, hogy a logt modell lleszkedését hogya magyarázza a pszeudó- R mutató! 4. Mre haszálható a Lkelhood rato test? 100

101 9 Termelés függvéyek és az ebből származtatott közgazdaság mutatók 9.1 A gazdaság függvéyek fogalma, alkalmazása a mezőgazdaságba Equato Chapter 9 Secto 1 Az eddg fejezetekbe áttektettük a függvéyelemzés alapvető eszközredszerét, alkalmazás lehetőséget. A gazdaság folyamatok elemzések egyk legfotosabb területe az, hogy a termelésbe részt vevő téyezők hogya alakítják a kbocsátást. Ezeket termelés függvéyekkel tudjuk kfejez. A termelés függvéy olya mplct függvéy, amely a y 1, y, y termelés output és x 1, x, x termelésbe résztvevő téyező között kapcsolatot matematka eszközökkel fejez k: F(y 1, y, y ; x 1, x, x )=0 A gazdaság függvéyek leggyakorbb alkalmazás területe: Törvéyszerűségek feltárása Függvéyek elemzésével vzsgálható a termelés téyezők hatékoysága, megállapítható alkalmazásuk optmáls sztje és aráya Progosztzálással hozamok előrejelzése Felhaszálhatók más modellek paramétereek a tervezéséhez Közvetleül beépíthetők agyobb ökoometra vagy szmulácós modellekbe A gazdaság függvéyeket a függő és függetle változó által kfejezett gazdaság kategórák szert csoportosíthatjuk: Termelés Költség Jövedelem Kíálat Kereslet függvéyek A termelés függvéyek a termelés téyezők és a termék között meység összefüggést fejezk k, adott techológa mellett. Típusa: Termelés volume függvéy Átlaghozam függvéy (termelőegységre, pl. 1 ha, 1 állat voatkozk) Növekedés függvéyek (a termelés téyező között összefüggést em adott techológa mellett, haem damkus értelembe fejezk k, pl. dőtéyezőt s tartalmazak) A mezőgazdaságba leggyakrabba alkalmazott függvéyek az alábbak: Műtrágyázás függvéyek Növéytermelés függvéyek Állatteyésztés függvéyek Mezőgazdaság termelés egészére voatkozó függvéyek Mezőgazdaság költségfüggvéyek A termelés függvéyek alkalmazásáak a célja a függvéykapcsolatokkal jellemzett termelés folyamatok meghatározott paramétereek megváltoztatása úgy, hogy az egész folyamat eredméye valamlye előzetese ktűzött cél szempotjából optmáls legye. A termelés függvéyek vzsgálata sorá a gazdaság dötések megalapozását, a dötések 101

102 várható következméyeek elemzésé végezzük el. A függvéyek elemzése sorá megkapott adatokat gyakra más modellekbe llesztjük be. A termelés optmalzálásakor alapelv, hogy a kbocsátások értéke agyobb legye a felhaszált ráfordítások értékéél, tehát a kbocsátások és ráfordítások értéke között külöbség, a jövedelem maxmumáak elérésére kell töreked. Dötés problémák: A termelésbe felhaszált erőforrások ráfordítások optmáls szívoaláak meghatározása egyváltozós termelés függvéy elemzésével. Két vagy több, egymást valamlye mértékbe és aráyba helyettesíthető erőforrás ráfordítás optmáls aráyáak meghatározása két, vagy többváltozós termelés függvéyek elemzésével. Több termék termelésére, vagy több célra s felhaszálható korlátozott meységbe redelkezésre álló erőforrás optmáls elosztása a termelés lehetőségek között egy vagy többváltozós termelés függvéyek segítségével. A termelés függvéyek alkalmazása eredméyekét kapott formácók dötéshozatalba való felhaszálhatóságát az elemzés adatbázsa alapvetőe befolyásolja. Az adatbázs kalakításáak szempotja: a változók széles megfgyelés tartomáyal redelkezzeek a léyeges változókat vojuk be a vzsgálatba a többváltozós leárs regresszó számítása sorá, multkolleartás eseté az értett téyezőkre voatkozó parcáls regresszós koeffcesek meghatározása bzoytala, ezért az egyk téyezőt k kell hagy a többváltozós regresszós egyeletből azokat a változókat vojuk be a regresszós egyeletbe, amelyek felvétele a totáls korrelácós együtthatót övel, lletve a stadard hbát csökket 9. A termelés függvéyek alkalmazása az optmáls termelés szívoal meghatározására Az optmáls termelés szívoal meghatározásakor dötés probléma ráfordítás, átalakítás, hozam folyamat eleme között aráyok meghatározása. A cél a termelés érték és a változó költségek külöbségéek, a fedezet hozzájárulásak a maxmalzálása. Egy másodfokú függvéye keresztül fogjuk bemutat az optmalzálás meetét. Regresszó számítással határozzuk meg a hozamfüggvéyt y ' a bx cx H a br cr A ráfordítások hozamra gyakorolt hatásáak elemzése érdekébe meghatározzuk: o Margáls hozam (H m ): A hozam változásáak ütemét fejez k a ráfordítás változás függvéyébe, amt a termelés függvéy görbéjéek meredeksége mutat (a hozamfüggvéy ráfordítás szert első derváltja). A margáls hozam az egységy többletráfordítás által létrehozott többlethozam. Az így kszámított hozam a termelés függvéy em egy potjára, haem a ráfordítás meységéek megfelelő szakaszára érvéyes átlagos érték. 10

103 dh Hm Hm b cr dr o Átlaghozam (Há): Az egységy ráfordításra jutó hozamot fejez k a fgyelembe vett ráfordítás tartomáy átlagába. H a br cr a Há Há b cr R R R o Ráfordítás elasztctása (E): Azt fejez k, hogy a ráfordítás meységéek 1 %-os változása háy %-os hozamváltozást déz elő. A margáls hozam és az átlaghozam háyadosa, dmezó élkül szám. H H H H R R H E R R H H H R R m á Termelés érték függvéy meghatározása: TÉ HÁ ahol H: hozam Á : a hozam ára h h h h h H a br cr TÉ Á a Á br Á cr A margáls termelés érték függvéy: TÉ Á b Á cr Á ( b cr) Á H m h h h h m A változó ráfordítás költségfüggvéye: K Á R v ahol Á : a ráfordítás ára R : a ráfodítás meysége A fedezet hozzájárulás függvéye: R R FH TÉ Kv FH ÁhH ÁRR A margáls fedezet hozzájárulás: A fedezet hozzájárulás függvéy ráfordítás szert első derváltja. dfh dh FH Á Á Á H Á dr dr m h R H m R A fedezet hozzájárulás maxmuma aál a ráfordítás meységél adódk, ahol margáls termelés érték egyelő az előállításához szükséges margáls költséggel. Ebbe a potba a margáls fedezet hozzájárulás ullával egyelő: 103

104 dh dh Á Á 0 Á Á dr dr h R h R Másképp fogalmazva: az optmum feltétele, hogy a margáls hozam legye egyelő a ráfordítás és a hozam áraak háyadosával. dh ÁR dr Á Az optmáls ráfordítás szt a kétváltozós másodfokú függvéyre: ÁR b cr Á H Á Á bá cr b Á A R ÁR bá cá h R R H H H H H Nézzük egy műtrágyázás függvéyt: H 4, 63 0, 0R 0, 000R. b A függvéybe a függetle változó az adagolt műtrágya meysége (R), a függő változó a búza hozama (H b ). A búza értékesítés ára: Ft/to, a műtrágya ára 50 Ft/kg. A 9-1. táblázat tartalmazza a külöböző ráfordítássztekhez tartozó számított függvéyértékeket. A maxmáls hozamhoz tartozó ráfordítás: b 505, 7 kg ráfordításál 9,7 toa. c Az optmáls ráfordítás szt: ÁR báh R 97 kg cá H Az optmáls ráfordítás szthez tartozó hozamszt: 8,87 to/ha. A 9-1. ábra szemléltet az optmáls ráfordítás szt meghatározásakor felhaszált összefüggéseket és az optmalzálás eredméyét. 104

105 9-1. táblázat: Hozam, költség, ráfordítás adatok alakulás külöböző ráfordítássztekél NPK Y' H(m) H(á) E TÉ TÉ(m) NPK FH FH(m) kg t kg kg % eft/ha Ft/ha eft/ha 5 5,1 19, 04,90 9% 9, 345,9 3,75 88,5 195,9 75 6,03 17, 80,45 1% 108,6 309,9 11,5 97,4 159,9 15 6,84 15, 54,75 8% 13, 73,9 18,75 104,4 13, ,55 13,1 43,17 31% 136,0 37,9 6,5 109,7 87,9 5 8,17 11,1 36,9 31% 147,0 01,9 33,75 113, 51,9 75 8,68 9,1 31,55 9% 156, 165,8 41,5 114,9 15,8 35 9,09 7,1 7,96 6% 163,6 19,8 48,75 114,8-0, 375 9,40 5,1 5,06 1% 169, 93,8 56,5 11,9-56, 45 9,61 3,1,61 14% 17,9 57,8 63,75 109, -9, 475 9,7 1,1 0,46 6% 174,9 1,8 71,5 103,7-18, 55 9,73-0,79 18,53-4% 175,1-14, 78,75 96,4-164, 575 9,64 -,79 16,76-17% 173,5-50, 86,5 87,3-00, 65 9,45-4,79 15,1-3% 170,1-86, 93,75 76,4-36, 675 9,16-6,79 13,57-50% 164,9-1, 101,5 63,6-7, 75 8,77-8,79 1,10-73% 157,9-158,3 108,75 49,1-308,3 Forrás: Saját számítás 9-1. ábra: Az optmáls ráfordítás szívoal meghatározása Forrás: Saját szerkesztés 105

106 Összefoglalás. A gazdaság folyamatok elemzések egyk legfotosabb területe az, hogy a termelésbe részt vevő téyezők hogya alakítják a kbocsátást. Ezeket termelés függvéyekkel tudjuk kfejez. A gazdaság függvéyek leggyakorbb alkalmazás területe Törvéyszerűségek feltárása Függvéyek elemzésével vzsgálható a termelés téyezők hatékoysága, megállapítható alkalmazásuk optmáls sztje és aráya Progosztzálással hozamok előrejelzése Felhaszálhatók más modellek paramétereek a tervezéséhez Közvetleül beépíthetők agyobb ökoometra vagy szmulácós modellekbe A termelés függvéyek alkalmazásáak a célja a függvéykapcsolatokkal jellemzett termelés folyamatok meghatározott paramétereek megváltoztatása úgy, hogy az egész folyamat eredméye valamlye előzetese ktűzött cél szempotjából optmáls legye. A termelés függvéyek vzsgálata sorá a gazdaság dötések megalapozását, a dötések várható következméyeek elemzésé végezzük el. A függvéyek elemzése sorá megkapott adatokat gyakra más modellekbe llesztjük be. Az optmáls termelés szívoal meghatározásakor dötés probléma ráfordítás, átalakítás, hozam folyamat eleme között aráyok meghatározása. A cél a termelés érték és a változó költségek külöbségéek, a fedezet hozzájárulásak a maxmalzálása. Elleőrző kérdések 1. M a termelés függvéy? Melyek a leggyakorbb alkalmazás területe?. M a termelés függvéyek alkalmazásáak acélja? 3. Sorolja fel a termelés függvéy adatbázsáak a megteremtéséhez szükséges szempotokat 4. M az elasztctás? 5. M az optmum krtérum az optmáls termelés szívoal meghatározásakor? Kompetecát fejlesztő kérdések 1. M a termelés függvéyek gyakorlat alkalmazásáak leggyakorbb gátló téyezője?. Vzsgálja meg az optmáls ráfordítás szívoal számítását hatváyfüggvéy eseté! 3. M a gazdaság függvéyek ökoometra modellekbe betöltött szerepe? 106

107 10 A sztochasztkus dősorelemzés alapja Equato Chapter 10 Secto 1 Az dősorok esetébe a megfgyelések sorredje kötött és ez a sorred fotos formácókat hordoz (a mezőgazdaság termelés éves adatat em lehet felcserél). Idősoro az egymást követő, azoos tartalmú megfgyelések sorozatát értjük, és 1 t y,y,...,y,...,y módo jelöljük. Az dősor egy vagy több meység (változó) dőbe redezett megfgyelése. A társadalmgazdaság élet dősora em megsmételhetők, egyszer lefutásúak. Az ekvdsztás dősorba a megfgyelések között azoos a távolság. Az dőbel megfgyelések voatkozhatak dőtartamra vagy dőpotra. Az állapotdősor (stock) egy-egy dőpotra (kválasztott pllaat eszme dőpot, évkezdet jauár 1. 0 óra) jellemző megfgyelésekből álló dősor (állomáyok: épesség, készlet, állatállomáy). A tartamdősor (flow) egy-egy dőszakra, dőtervallumra (év, hóap stb.) jellemző megfgyelésekből álló dősor (gaboatermelés, házasságkötések száma). Idősorok elemzésekor céluk lehet leírás tedeca, vsszatérő szabályosságok, belső összefüggések feltárása, véletleek tekthető zavaró hatások egymástól való elválasztása magyarázat mért vselkedk úgy az dősor, verbáls és formáls (okság modelleket keresük) magyarázat előrejelzés az dősor várható alakulását a jövőre előrevetíte. Az dősor egyes értéket potdagrammal ábrázoljuk. Tartamdősorok eseté a potok az dőtervallumok közepé, míg állomáy típusú változók eseté a potok az dőtervallum szélé (dőszak elej vagy dőszak vég adatok) helyezkedek el. Ha egyszerre csak egy adatsort vzsgáluk, akkor egyváltozós dősorelemzést végzük. Az ugyaazokba az dőpllaatokba megfgyelt többféle adatsor együttes vzsgálatát pedg többváltozós dősorelemzések evezzük (vagys a mukaélkülség, az árszívoal, a pézkíálat stb. között összefüggés hav adatok alapjá törtéő elemzése többváltozós dősorelemzés). Az dősorelemzés legfőbb célja az adatsorok damkájáak vagy dőbel szerkezetéek a meghatározása (Maddala, 004). Az dősor elemzés módszereket két fő csoportba sorolhatjuk: az ú. dőtartomáyo törtéő elemzés kategórájába esk a determsztkus és a szochasztkus dősorelemzés (mvel azo alapulak, hogy az dősor külöböző dőpotokhoz tartozó értéke között teremteek kapcsolatot). A másk agy kategóra a frekvecatartomáyo törtéő elemzés, ezzel azoba em foguk részletebe foglalkoz. A frekvecatartomáyo törtéő elemzés léyege, hogy az dősort Fourer-traszformácóval szuszhullámok összegére botja. A látszólag szabálytala gadozások mögött külöböző hullámhosszú szabályos perodkus mozgások vaak. Belátható, hogy az dősorok egy széles csoportja ekvvalese reprezetálható úgy, hogy megadjuk, hogy az egyes frekvecájú szuszhullámokat mlye súllyal kell kombál, hogy megkapjuk az dősort. Ez utóbbra szokták azt moda, hogy dőtartomáy helyett frekvecatartomáyo írtuk fel az dősort; ebből s sok haszos és érdekes következtetést lehet levo (Ferec, 01). Ezt a módszertat szokták spektráls elemzések s evez (trgoometrkus függvéyeket haszáluk). A statsztkába az dősor elemzés külöböző módszereket alkalmaz az elmúlt dőszak tedecáak, összefüggéseek a feltárására és egybe támpotot yújt a jövő várható folyamataak előrelátásához. Ahogya a törtéelem sorá mde eljárás módszer fomodott, tökéletesedett, úgy a statsztka előrejelzésekél s megtörtét ez a változás. Az 1970-es évekg a determsztkus szemlélet uralkodott, majd ezt követte a '80-as évekbe az u. ARMA modell család és a legfatalabb módszercsaládba tartozak az ARCH modellek (Polgáré Hoschek, 011). 107

108 A társadalm-gazdaság jeleségek alakulását három dmezóba vzsgálhatjuk, amelybe a megfgyelés egységek, a változók és az dő jeletk a koordáta-tegelyeket. De a kvatfkácó mdhárom dmezóba számos korlátozó téyezőbe ütközk. Általába em smerjük azt a teljes sokaságot, amelybe a jeleség megfgyelhető, haem csak mtát tuduk ve belőle. A jeleséget teljeskörűe leíró változókat sem vehetjük md fgyelembe, mert vaak közöttük olyaok, amelyek közvetleül em mérhetők (ú. lates változók), vagy ha mérhetők s, akkor - többek között - a ehéz hozzáférhetőség, az eltérő mérés skálák vagy esetleg a belső kapcsolatok erőssége jelet akadályt. A statsztka stabltást fokozá, ha mél hosszabb lee az dősoruk, ekkor vszot ehézségeket okoz például a strukturáls változások kezelése, em s beszélve a megfgyelések gyakorságáak megválasztásáról. (Kovács, 1989) Az dőbe törtéő előrejelzés lehet kvattatív és kvaltatív, azaz a számoko alapuló, lletve a mőség Kvaltatív előrejelzés Ez a típust az u. szubjektív előrejelzés, mvel a megkérdezett személyek tapasztalatá, tudásá, megérzése alapszk (ábra). Ezek a megkérdezettek lehetek a meedzsmet tagja, packutatók, szakértők. A megkérdezettek mde esetbe olya személyek, akk a vzsgált területet behatóa smerk, és így képesek olya dolgok, változások meglátására, előrejelzésére, amket mások em tudáak ábra: Időbel előrejelzések csoportosítása Forrás: Polgáré Hoschek, Kvattatív előrejelzés Ezek az előrejelzések már objektívebbek, hsze a számok elemzésé alapszaak. Attól függőe, hogy az adott jeleség okát vagy a múltbel értéket tekt-e vzsgálat alapak két csoportra lehet oszta: Kauzáls módszerek A módszercsalád megevezéséből jól látszk, tt a jeleség okáak a feltárása a cél, és ha már ez megva, akkor ezt követ a jövő progosztzálása. Mvel egy jeleségek csak agyo 108

109 rtká va egyetle oka, így ezeket a módszereket többváltozós modellekek s szokás evez (ábra) Projektív módszerek Ez a módszercsalád egyváltozós. Az előrejelzések eze típusa az dősorokat haszálják fel, a múltból (mt egyetle vzsgált változóból) dulak k, azt vzsgálják, majd pedg aak felhaszálásával próbálak a jövőre voatkozó progózsokat ad. A múltak tehát tt kemelt jeletősége va. Ám amíg a projektív módszerek egyk csoportja elfogadja, hogy mde előre elredelt, determált, addg a másk csoport már em godolja, hogy elég a tedecák automatkus jövőre való kvetítése. A determsztkus modellekbe a véletle passzív szerepet játszk, em képez léyeges alkotóelemét a modellek. Akkor jó a modell, ha a véletle mél ksebb befolyást gyakorol a folyamatra. Míg a sztochasztkus modellek esetébe a rövdebb távú elemzésekbe, a véletle a folyamat alkotóelemévé, aktív részesévé válk. Pl. a gazdaságba sokk (háború, természet katasztrófa, ázsába a baromf flueza ktörése, sertéspests, dox botráy, külpac változások a gazdaság vlágválság hatására) Determsztkus dősorelemzés A dekompozícós modellek alapelve az, hogy az dősorok égy fő, egymástól elkülöíthető kompoesekből tevődek össze. A hosszú távú ráyzatot kfejező tred, az ettől szabályos (többyre hav vagy egyedéves) gadozásokkal eltérő szezoáls kompoes, a (többyre hosszabb távú) szabálytala gadozást, hullámzást kfejező cklkus kompoes és a véletle összetevő. Ezek az összetevők alapvetőe két módo összegszerűe, lletve szorzatszerűe kapcsolódhatak egymáshoz, az előbb az ú. addtív, az utóbb a multplkatív modellekhez vezet. y ˆy s c [10-1] y ˆy s c [10-] Az dősor égy része a tred ( ŷ ), a cklus (c), a szezo (s) és a véletle ( ): ; 1. tred vagy alapráyzat: az dősorba hosszabb dőszako tartósa érvéyesülő tedeca, amely az dősor alakulásáak a fő ráyát, általáos szívoalát jelet. Az alapráyzat maga s több, hosszútávo érvéyesülő téyező együttes hatásáak a következméye. Alapvetőe társadalm, gazdaság törvéyszerűségek (pl.: a mezőgazdaságba foglalkoztatottak létszámáak változása, a termésátlagok változása, a fogyasztó preferecákba bekövetkező változások, az élelmszerpac övekedése, az flácó, a deflácó) határozzák meg.. cklus: a tred felett vagy alatt tartósabb, em szabályos mozgás, így jeletését csak hosszabb dősorok alapjá lehet felfed és taulmáyoz. Eek a kompoesek az elemzéséről gyakra elfeledkezek, pedg kszűrése az dősorból fotos, hsze élküle a kapott eredméyek torzak lehetek. 3. szezoáls vagy déyszerű gadozás: azoos hullámhosszú és szabályos ampltúdójú, többyre rövd távú gadozás. Azaz olya rtmkus gadozás, amely szabályosa vsszatérő dőközökét mdg azoos ráyba térít el az dősor értékét az alapráyzattól. A mezőgazdaság dősorok szte mdegyke mutat éves peródusokba smétlődő szezoáls gadozást és/vagy perodkus gadozást. Az gadozás lehet akár ap, hetes, hóapos, attól függőe, hogy m okozta (pl.: évszakok változása, üepek, társadalm szokások, életrtmus). 4. véletle gadozás: szabálytala mozgás, am sok esetbe em mutat semmlye szsztematkusságot. Sok, az dősor szempotjából em jeletős téyező együttes hatását képvsel. Szabálytala jellege matt az dősorra gyakorolt hatását a múltra k tudjuk mutat, ám előre jelez em lehet. A smító-előrejelző (kegyelítő) modellek a múlt dőbel összefüggéset vetítk előre egyszerűe kívülről adott vagy kalbrált paraméterekkel. Az dősorokba rejlő formácók 109

110 lehetőséget yújtaak progosztzálásra s, tehát a vzsgált jeleség jövőbe várható értékeek becslésére a múltbel tapasztalatok alapjá (Brow, 1959; Köves és Párczk, 1960). Eek egyk módszerét képezk a smító eljárások, amelyek folyamatosa korrgálják a modellt az előrejelzések hbá alapjá, malatt a közelmúlt formácót agyobb súllyal szerepeltetk, mt a régebb megfgyeléseket (Brow, 1967; Chatfeld et al., 001). Eek magyarázata, hogy mél régebbe törtét egy eseméy, aál kevesebb az összefüggés a jele törtéésevel. A smító eljárások közül a Brow féle expoecáls smítás az egyk legelterjedtebb módszer. A módszer leírását a következőkbe mutatjuk be (Balogh, 003). Legye ŷ az -edk dőszakra készített becslésük, pedg a becslés hbája, tehát a megfgyelt és a becsült érték között eltérés. A smító eljárás redelkezk a szsztematkus taulás tulajdoságával (Harvey, 1989), tehát a következő, +1-edk dőszakra készített becslésbe mmár beleépít, valamlye függvéy segítségével az -edk dőszak becsléséek hbáját (Ralph et al., 00). Egyelettel felírva tehát az általáos alak: ˆy ˆ 1 y f, 0 1 [10-3] Az α úgyevezett smítóparaméter felelős azért, hogy a modell mlye mértékbe vesz fgyelembe a hbát (Rappa, 001). Ha az α 0-hoz közel érték, akkor a hbát elhayagoljuk, a következő becslésükél alg vesszük fgyelembe, amek az értéke így alg tér el az előző dőszak becsléstől, a modell ksmítja az dősor téyleges gadozásat. Ha vszot az α 1- hez közel érték, akkor a hbát jól beépítjük a modellbe, eek hátráya vszot, hogy mvel ezáltal a véletle gadozások s erőse beépülek, a modell em képes a meglévő tedecák leírására (Huyad et al., 1996). A modell felépítéséél duljuk k a legegyszerűbb esetből, amkor s az f hbakorrekcós függvéy kostas. Ezzel az egyeletük a következő: ˆy ˆ 1 ˆ y y y kapjuk ˆy y ˆy 1 1 ezt átalakítva. Ha ebből megpróbáljuk kfejez a megelőző dőszakokat, végül a következő összefüggéshez jutuk: ˆy y y y... y 1 ˆy [10-4] Ez az egyelet megmutatja a modellek azt a tulajdoságát, hogy az +1-edk dőszakra adott becslés az dősor korább értékeek függvéyekét adódk, méghozzá oly módo, hogy mél régebb az érték mél alacsoyabb az adott y-hoz tartozó dex, aál ksebb az érték 1 szorzója, vagys az egyre régebb értékek egyre ksebb súllyal szerepelek a progózsba. A smító eljárásokat agyba befolyásolja az α paraméter értékéek megválasztása. Nem létezk egyetle legjobb megoldás erre a problémára, a kutatók többféle módszert alkalmazak az α kválasztására. A legelterjedtebb, hogy a legksebb égyzetek módszerével határozzák meg az α-t, de em feltétleül ez a módszer adja a legjobb smítást, lletve a legksebb előrejelzés hbát. A legksebb égyzetek módszere abba áll, hogy a smított és az eredet sor között e eltéréseket kszámítjuk α-két, és amelyk α-ra ez az összeg a legksebb lesz, az elemzésbe ezt a paraméterértéket alkalmazzuk (Garder et al., 001) Sztochasztkus dősorelemzés A sztochasztkus dősorelemzés alapvető flozófa eltérése (Ferec, 011) a determsztkus szemlélettel szembe, hogy bár ez a modell s ad fog egy becsült értéket az dősor adott dőpotbel értékére, és feltételez, hogy a valós érték ettől véletle módo eltér, ám abból dul k, hogy eek a véletle eltérések később s hatása va: az dősor később alakulását s befolyásolja. Azt modhatjuk, hogy az dősor fejlődésébe ögeeráló hatások érvéyesülek: egy adott dőpllaatbel (véletle) eltérés befolyásolja a később értékeket s, 110

111 tehát a véletleek folyamatépítő szerepe va. E megközelítést agy skerrel alkalmazták külöböző közgazdaság (kemelte: pézügy) dősorok modellezésére; elsősorba rövdtávra. Az alábbakba bemutatjuk Ferec (011) alapjá, hogy m az alapvető külöbség a kétféle elemzés szemlélet között. A determsztkus dősor felírható: D Yt t t, [10-5] a sztochasztkus dősor pedg a következőképpe fogalmazható meg: Sz Sz Y Y Y. [10-6] t t1 t 0 0 Feltételezzük még azt, hogy t N 0, külöböző t-kre függetleül. Mdkettőre gaz, hogy egy dőszakkal később várhatóa α-val agyobb értéket veszek fel, de az α lehet egatív érték s. A várható értékek azoosak: EY D t Ett tés E Sz t Yt Et 1 t, de az dősorok fejlődésébe már va külöbség: D Y D t t és D Sz D t Yt D t t 1 t. A két dősor tehát várhatóértékbe Sz D azoos, de Y t egyre agyobb klegésekkel gadozk eze várhatóérték körül, míg Y t álladóakkal. Ezt számítógépes szmulácóval mdkét típus esetébe szemléltethetjük úgy, hogy véletleszámgeerátorral előállítuk t N 0, számokat, majd így bemutatjuk egy lehetséges lefutását az dősorak. E megközelítés előye, hogy míg valós sztuácóba em smerjük a sokaság eloszlást (eek meghatározása lesz a feladat), csak egy realzáltat (sőt, dősorelemzésél bztosa legfeljebb egy realzáltját láthatjuk az smeretle sokaság eloszlásak), addg ebbe az esetbe smerjük, sőt, m határozzuk meg (a véletleszámgeerátor beállításával) a sokaság eloszlást. Eek megfelelőe természetese ebbe az esetbe vehetük akárháy realzáltat a sokaság eloszlásból (csak újra lefuttatjuk a szmulácót). Ezt szemléltet az ábra, melye 4 futtatást (1 determsztkus és 3 sztochasztkus tredet) ábrázoltuk az dősorokból α = 1, σ =4 paraméterek mellett Determsztkus tred Szochasztkus tred1 Szochasztkus tred Szochasztkus tred ábra: A determsztkus és a sztochasztkus tredek szmulált lefutása 50 dőegységre Forrás: Saját szerkesztés 111

112 Az ábrá jól látszk, hogy várhatóértékbe téyleg egyezk a két dősor (az y = x egyees körül gadozak); és az s jól látszk, hogy míg Y álladó szórással gadozk eze egyees Sz körül, addg Y t egyre agyobb szórással ( legyezőszerűe" ktágul eze egyees körül). Az D Sz Yt -t determsztkus tredek, Yt -et pedg sztochasztkus tredek evezk. A determsztkus tred alakulását úgy lehet elképzel, hogy a t-edk dőpotba fellépük az N 0, véletleszám szert módosítjuk a pozícókat. A αt potba, majd egy sztochasztkus tred eseté az előző pozícóból fellépük α-t és utáa térítjük el a pozícókat N 0, véletleszám szert. A kettő között a külöbség az, hogy ha a egy véletlegeerátor pot egy agyo agy, vagy agyo kcs értéket dob k, az ugya kugró pozícót fog eredméyez, ám eek determsztkus tredél semmlye jeletősége cs a későbbek szempotjából (ettől függetleül αt-be lépük és geeráluk újra véletleszámot a következő dőpotba), addg sztochasztkus tred eseté agyo s va: az egész folyamat a kugró pozícótól folytatódk tovább! Ez legjobba az ábra legfelső trajektórájá látszk: mutá a 18. dőpllaatba egy agy poztív véletleszámot kaptuk, a agy kugrás em egyszer volt (ahogy determsztkus tred eseté lett vola), haem léyegébe eltolódott" az dősor, és oa folytatódott a továbbakba. Azt s modhaták, hogy a sztochasztkus tred eseté az dősorba beépülek a sokkok", míg a determsztkus tredbe em. Megjegyezzük, hogy az Yt Yt 1 [10-7] t specfkácót szokás véletle bolyogásak (RW, radom walk) s evez, hsze Y t felfogható úgy s, mt egy objektum ( a bolyogó") térbel helyzete. Azaz: a bolyogó kezdetbe az orgóba áll, mde dőpllaatba elővesz a véletleszámgeerátorát, és ayt lép felfelé, ameyt a véletleszám-geerátor mutat. (Ez egatív s lehet.) Ez tehát egy ú. egydmezós bolyogás. Az Yt Yt 1 [10-8] t típusú folyamat eve eltolásos véletle bolyogás (RWD, radom walk wth drft), hsze lyekor a bolyogó először determsztkusa felfelé lép α-t (eltolás, sodródás") és utáa éz meg a véletleszámgeerátorát. RWD-folyamatokra az előzőekbe már láttuk példát, az ábrá pedg 4 szmulált RW-folyamatot láthatuk. Eze folyamatokak a valószíűségszámításba va agy jeletőségük. D t ábra: A véletle bolyogás szmulált adatsora 50 dőegységre Forrás: Saját szerkesztés 11

113 A stacoartás az emprkus dősorokat előállító adatgeeráló folyamatok azo tulajdosága, mely lehetővé tesz, hogy vszoylag egyszerű modellekkel jól le tudjuk ír a valóságot (Ács, 011). Széles értelembe stacoárusak evezük egy sztochasztkus folyamatot, ha eloszlása em függ az dőtől és tértől. Az ökoometrába gyegé stacoer egy dősor, ha várható értéke, varacája és autokovaraca függvéye függetle az dőpottól. A stacoer dősorok vszoylag egyszerűe modellezhetők, éppe a defícóba említett kostas várható érték és szórás matt. Ugyaakkor a pézügy dősorok agy része em stacoer, vagys pl. a varacájuk az dőbe változk (általába mde határo túl ő), így modellezésük sokkal összetettebb feladat. A legegyszerűbb em stacoer folyamat az ú. véletle bolyogás (radom walk), amelyek eltolásos (wth drft) formáját a sztochasztkus tred megfelelőjekét s szokás emleget (Huyad, 1994). Nelso és Plosser (198) 14 hosszútávú makrogazdaság dősort elemeztek a Dckey-Fuller statsztka techka (ezt a későbbekbe smertetjük) segítségével és arra a következtetésre jutottak, hogy az dősorok közül 13 em stacoárus. A legtöbb makrogazdaság dősor dőbe em stacoárus. Ez azt jelet, hogy középértékük és varacájuk dőbe em álladó. Ilye esetbe a klasszkus stadard becslés eljárások és statsztka dukcó alkalmazása torzított becsült értékeket és/vagy értelmetle regresszót eredméyez (Bakucs, 004). A probléma köyebb megértése érdekébe, az ábrá, egy em-stacoárus sorozatot, lletve aak első dfferecáját ábrázoltuk ábra: Egy em-stacoárus és külöbség stacoárus sorozat Forrás: Saját szerkesztés Y t középértéke kezdetbe ulla körül va, majd dőbe övekszk, cs egy kostas, álladó középérték. Ellebe ha Y t sorozatot egyszer dfferecáljuk, vagys a ΔY t = Y t - Y t-1 sorozatot kszámoljuk, akkor egy valószíűleg stacoárus sorozatot kapuk, álladó varacával és álladó, ulla körük oszclláló középértékkel. A ΔY t a változó dőbel változását vagy övekedését mér. Mutá Y 0 -t em smerjük, ΔY t értéke a t=,,t dőszakokra smert csak, em pedg T=1,, T-re. A taköyvbe elsősorba az emprkus mukába leghaszosabb első dfferecára kocetráluk, de magasabb redű dfferecák meghatározására s va mód. Az Y t másodk dfferecáját például a következőképpe kaphatjuk meg: Δ Y t =ΔY t ΔY t-1. [10-9] 113

114 A ΔY t t gyakra evezzük rövde ΔY ak, delta Y -ak, vagy Y változásáak. Szokás Y t-1 re úgy s hvatkoz, mt Y t egy dőszakos késleltetettjére vagy mt a késleltetett Y-ra. Ha a vzsgált sorozatba egy leárs dőtred va, akkor az ábrá bemutatott tredstacoárus folyamatot kaphatuk Forrás: Saját szerkesztés Tredstacoárus folyamat Leárs tred ábra: Tred-stacoárus folyamat Ebbe az esetbe a vzsgált változó egy dőtred körül gadozk. A hasoló sorozatokat dődetermsztkus sorozatokak evezzük (Bakucs, 004). Elletétbe a dffereca stacoárus esettel, az dőtred dfferecálással em távolítható el, haem az Y t sorozatot regresszál kell a t dő függvéyébe, a kapott rezduumok pedg megfelelek a tredmetes (de-tredelt) Y t -ek. Ha a vzsgált dősorokba strukturáls törés va, akkor ez agyba befolyásolhatja az egységgyök vzsgálat eredméyet. Pero (1989) taulmáyozta az egységgyökök teszteléséek a lehetőségét, amkor az dősorokba strukturáls törés va. Egy strukturáls törés, az adott dősor középértékéek permaes eltolódását eredméyez (ábra). Forrás: Saját szerkesztés ábra: Strukturáls törés az Y t dősorba 114

115 A T 1 potba az Y t sorozatba strukturáls törés va, és az dősor determsztkus tredje egy magasabb sztre kerül. Perro szert, ha a Nagy Gazdaság Válságot, mt strukturáls töréspotokat kezeljük, akkor a Nelso és Plosser (198) által taulmáyozott 14 makroökooma dősor közül, 11 mt 'flexbls' tred-stacoárus folyamatkét értelmezhető. Perro szté bebzoyította, hogy ha a leárs tredbe em vesszük fgyelembe az esetleges töréspotokat, úgy a hagyomáyos tesztek (pl. a bővített Dckey - Fuller egységgyök teszt), tévese em utasítják el az egységgyök ullhpotézst Autokorrelácó Az x t sztochasztkus folyamat akkor stacoárus, ha az x t (t [ t 1 ; t ] T) eloszlása függetle a [ t 1 ; t ] kválasztásától (Kozma, 009). Az x t stacoárus sztochasztkus folyamat gauss fehérzaj, ha mde t-re stadard ormáls eloszlású. Gelb tétele kmodja, hogy egy előrejelző (szmulácós) modell akkor optmáls, ha az előrejelzés (szmulácós) hbafolyamat gauss fehérzaj folyamat. Idősoros adatok vzsgálatáál a hbatagok egymást követő értéke gyakra korrelálak. Eek több oka lehet, általába specfkácós hbára vezethető vssza (Kovács, 01). Például, ha egy szgfkás változót amely értéke a statsztka sorba egymástól em függetleek fgyelme kívül hagyuk, akkor köye autokorrelált hbataghoz juthatuk. Az autokorrelácó külöböző redű lehet. Ha a hbatag a közvetleül előtte levő értékkel áll leárs korrelácós kapcsolatba, akkor elsőredű autokorrelácóról beszélük. Az elsőredű autokorrelácó tesztelésére számos próba létezk. A leggyakrabba a Durb-Watso-féle próbát alkalmazzuk. Emprkus elemzések alkalmával haszos grafkusa ábrázol az egymást követő rezduumok értéket egy olya grafkoo, amelyél az abszcsszategelye az e -1, míg az ordátategelye az e értékeket tütetjük fel, ahogy az például az ábrá látható. A kapott potdagram alapjá általába már következtet tuduk az esetleges autokorrelácó jellegére ábra: Az autokorrelált rezduumok grafkus ábrázolása Forrás: Saját szerkesztés Az autokorrelácó jeletése, hogy az dősorba komoly összefüggés va az előző dőszak érték és a prompt (jeleleg, aktuáls) érték között (pl.: árfolyam, évekét árbevétel, lakosság jövedelem). 115

116 A k lépéses autokorrelácó az dősor és a k lépéssel eltolt dősor között korrelácó. A k lépéses autokorrelácó elmélet értéke: E zt ztk E zt ztk k E z z t E z tk Az autokorrelácó mátrx és becslése: A P autokorrelácó mátrx szmmetrkus, mvel r xy = r yx P Az egyes ρ téyezők közelítő r értéket az dősor eleme alapjá számíthatjuk k: [10-10] [10-11] r T t1 ( y y )( y y ) t T t1 T: az dősor hossza y : az dősor várható értékéek becslése t t ( y y ) [10-1] Autokorrelácó függvéy (ACF) Egy dősor autokorrelácó függvéye a = 0... értékekhez tartozó r autokorrelácó téyezőkből áll. Forrás: Kozma, ábra: Tpkus autokorrelácó függvéyek: 116

117 Az autokorrelácós függvéyekre lehet szerkeszte egy kofdeca tervallumot, am megmutatja, hogy melyk késleltetés esetébe va jeletős eltérés az adatsorba. Ezt evezzük az Aderso-féle kofdeca tervallumak (10.9. ábra). Forrás: Kozma, ábra: Aderso-féle kofdeca tervallum: A következő autokorrelácós ábra a 10.4 ábrá feltütetett em-stacoárus és külöbség stacoárus sorozatok amelyek pl. lehetéek az Y=a mezőgazdaság termelők jövedelme és a ΔY=a mezőgazdaság termelők jövedelem változásáak ábrá autokorrelácós függvéyet mutatja be 10 dőszaky maxmáls késleltetéssel (τ=10). Az oszlopdagramok X tegelyé a késleltetés hossza szerepel, az autokorrelácó mértéke pedg az Y tegelye va feltütetve. Az ábrá jól látható, hogy a mezőgazdaság termelők jövedelméek autokorrelácója a 9. késleltetés mellett s még meghaladja a kofdeca tervallumot. Ezzel szembe a mezőgazdaság termelők jövedelem változásáak autokorrelácója ge kcs, a változás dőbel alakulása pedg véletleszerűek látszk, azaz az autokorrelácó léyegébe ulla. Ez a jeleség a legtöbb makroökoóma dősorál megfgyelhető. 117

118 ábra: A jövedelem és a jövedelemváltozás autokorrelácós függvéye Forrás: Saját szerkesztés Az alábbakba kemelük éháy szempotot, amelyek fotosak lehetek az autokorrelácóval kapcsolatba. Az Y dőbe egymást követő értéke erőse korrelálak egymással. Még a 10 dőszakkal korább (τ = 10) jövedelem s korrelál a jelelegvel. ΔY már teljese másképp vselkedk, mvel a termelő jövedelem tárgydőszak övekedése em korrelál a korább dőszakok övekedésével. Ha smerjük a termelők jövedelmét az előző dőszakokba, akkor potosa megbecsülhetjük a agyságát a tárgydőszakba s. De a termelők korább jövedelem változásaak smerete em segít a tárgydőszakba várható változás megbecsülésébe. Megállapíthatjuk azt, hogy Y emlékszk a múltra (azaz erőse korrelál a saját korább értékevel). Hosszú távú emlékezetek s evezk ezt a tulajdoságot, am ΔYra már em gaz. Az Y em stacoárus, míg ΔY stacoárus dősor. A másk leggyakrabba haszált függvéy a parcáls autokorrelácós függvéy (PACF). Ez az Y t és az Y t+k között kapcsolatot jelz úgy, hogy a közbeső megfgyelések hatását kszűrjük (csak az dősor és a k lépéssel eltolt dősor között korrelácót mutatja). Eek a jeletőségét a következő 11. fejezetbe tárgyaljuk részletese. Az előzőekbe említettük már, hogy a sztochasztkus dősorok lehetek stacoárusak, lletve a modellezéshez stacoárussá kell őket traszformál (Mák, 011). A stacoartás elleőrzése gyakra az egységgyöktesztek elvégzésével törték. A stacoartás háyát okozhatja egyrészt az, hogy az dősor tegrált, lletve az dősor tartalmazhat determsztkus kompoeseket, például determsztkus tredet s. Mdeze túl azoba az dősorba lehetek strukturáls törések s, amelyek a hagyomáyos tesztek elvégzését ehezítk. A strukturáls törések kezelése elsősorba hosszú dősorok eseté felmerülő probléma, ahol a modell sztochasztkus része lehet stacoer és tegrált folyamat s. Mvel a hagyomáyos egységgyöktesztek redkívül érzékeyek az adatgeeráló folyamat determsztkus részéek specfkácójára, ezért a strukturáls törések modellekbe törtéő explct beépítése jelethet ebbe az ráyba járható utat. A gyakorlatba azoba sokszor em smert előre a strukturáls törés dőpotja, vagy em egyértelmű, mettől meddg tart, így em merül fel az a 118

119 lehetőség, hogy az dősorokat a törések meté részekre botva vzsgáljuk. Utóbb lehetőség a ksebb mtaelemszám matt egyébkét s ksebb erejű próbák elvégzését jeleteé, lletve az egyes részmtáko születő esetleges elletmodó eredméyek megehezítk az dősor egységes kezelését Az egységgyök fogalma az ökoometrába elsősorba a sztochasztkus dősorelemzéshez kapcsolódk. Stacoárusak evezük egy folyamatot akkor, ha a folyamatot dőközbe ért sokkok hatása dővel elhal, elmúlk, elfelejtődk, vagy más megfogalmazásba cs tartósa hatással az dősor sztjére, így az dősor sztjé tulajdoképpe értelmezhető az átlag vagy a várható érték. Nemstacoer dősorok eseté a folyamatot dőközbe ért sokkok hatása em múlk el. Ebbe a csoportba tartozak az egységgyök-, lletve az ú. felrobbaó folyamatok s, bár gyakorlatlag elsősorba a stacoer folyamat egységgyökfolyamatmegkülöböztetés, lletve aak tesztelése hagsúlyos és léyeges. Techkalag az utóbb elkülöítés úgy értelmezhető, hogy a megfelelőe defált karaktersztkus polom gyöke az egységkörö kívül, vagy olykor, az egységkörö helyezkedek el (Huyad, 1994). Az egységgyökfolyamat tartalmlag így azt jelet, hogy az dősort álladóa érő ksebb-agyobb sokkok hatása folyamatosa beépül az dősorba, folyamatosa változtatja (eltolja) aak sztjét (átlagát, várható értékét), mégpedg dőbe övekvő varacával. Köye elképzelhető azoba olya helyzet, hogy az dősort érő véletleek hatása elfelejtődk, elmúlk, va azoba éháy (véges, kevés számú) olya kugró, outler sokk, amelyekre ez em jellemző. Ebbe az esetbe em gaz kzárólagosa az, hogy a sokkokak cs hatásuk az dősor sztjére, az állítás csak eze kugró sokkok hatásáak kszűrése mellett teljesül. Kézefekvőek tűk tehát, hogy ameybe emprkusa, a megfgyelt dősor alapjá dokolható, akkor eze sokkokat amelyek az dősor sztjét (azaz átlagát, várható értékét) módosítják feltárjuk, azoosítsuk. Ezért fotos a kugró sokkok kemelése, amely sokkok lefutása modellezhető md azoal, md fokozatosa bekövetkező hatáskét. Egy dősor stacoartásáak tesztelésére két eltérő szemléletű próbacsaládot s kdolgoztak: egyrészt tesztelhetjük az egységgyök meglétét a folyamatba a kterjesztett Dckey-Fuller (Augmeted Dckey-Fuller, ADF) tesztet futtatva, lletve vzsgálhatjuk magát a stacoartást a KPSS (Kwatkowsk-Phllps-Schmdt-Sh) teszt segítségével. Az egységgyök létéek vzsgálatára épül az ADF próba. Léyege, hogy ameybe a vzsgált folyamat véletle bolyogást követ, vagys Yt Yt 1 t, akkor felírható az ú. Y 1 Y Y... Y melybe a Dckey-Fuller regresszó: t t t t t H 0 : 1 0 feltevés elleőrzése az egységgyök meglétét tesztel. Ameybe a ullhpotézst elvetjük, az dősor stacoerek tekthető. A KPSS teszt (Kwatkowsk-Phllps-Schmdt-Sh) sorá az dősort x t (ahol t=1;;...;t) kompoesekre botjuk: xt yt t t, ahol y t véletlebolyogást követ (vagys y y u ahol u t d 0 u t t1 t N ; azaz fehér zaj), β t egy determsztkus tred és ε t egy stacoárus hbatag. A modell alapjá tesztelhető a stacoartás, ugyas x t várható érték stacoer, ha 0 és ß=0. Ekkor az első tag kostas tegelymetszetté válk, és u determsztkus tred sem játszk szerepet értékéek meghatározásába. A H 0 :u 0 és ß=0 kduló hpotézs tesztelésére a ú. KPSS próbafüggvéyt haszáljuk. A próba ullhpotézséek elfogadása azt jelet, hogy az dősor stacoárus. Fotos megjegyez, hogy míg a KPSS teszt eseté a ullhpotézs elvetése az egységgyök meglétét, vagys a stacoartás háyát jelet, addg az ADF próbáál a ull-hpotézs elvetése a stacoartás meglétére utal. A stacoartás fogalma egy újabb dősor elemzés kategóra defálását s szükségessé tesz. Eek alapjá határozzuk meg egy dősor tegráltság redjét. Ameybe a stacoer 119

120 folyamatokat ulladredű tegráltak evezzük, és t 0 y I szmbólummal jelöljük, akkor defálhatuk magasabb redű stochasztkus folyamatokat s. Egy dősort d-ed redű tegráltak evezük, és y I d szmbólummal jelöljük, ha alapállapotába em t d stacoárus, de a d-ed redű dfferecája már stacoerek tekthető, azaz y I d Az ARMA és ARCH modellek Az ARMA-ARIMA (AutoRegresszív (Itegrált) Mozgó Átlagolású) típusú modellek sztochasztkus szemléletűek (10.1 ábra), az dősorok korább értékeek és véletle kompoesekek a boyolult redszerét tektk alapul. Ezek a modellek általába az y f y,y,...,y,,,..., alakba írhatók fel. A mdekor állapotot a korább t t1 t tk t t1 tl állapotok és külöböző késleltetésű véletle kompoesekkel ragadják meg, így a véletleek aktív szerepet bztosítaak. A paramétereket becslésekkel határozzák meg, a paraméterek és az egész modell érvéyességét statsztka próbákkal elleőrzk zárt logkájú redszerbe (ezek az u. Box Jeks modellek). Az ARCH modellek jellemzésekor meg kell említe, hogy a közgazdaság modellekbe az összefüggésekre jellemző bzoytalaságot a hbataggal és aak varacájával ragadjuk meg. A legtöbb dősor esetébe a heteroszkedasztctás problémájával kell szembesülük (Huyad, 006). Ez azt jelet, hogy az dősor adatara llesztett regresszós egyeletbe a hbatag varacája em álladó, haem függ az dőtéyezőtől. Az ARCH- (autoregressve codtoal heteroskedastcty autoregresszív feltételes heteroszkedasztctás) modellekbe a hbatag feltétel élkül varacája álladó, vszot a feltételes varaca em az, mvel ezt a múltbel adatok függvéyével magyarázzuk (Darvas, 004). A volatltás tömörülését tükröz az az észrevétel, mszert számos esetbe a részvéyek hozamaak modellezésekor kapott rezduumok autokorrelálatlaak bzoyultak, a rezduumok égyzete azoba már szgfkás autokorrelácót mutatott. Ez utóbb megfgyelésre alapozva alkotta meg Robert Egle 198-be a legelső ARCH modellt, amely képes volt a fet emprkus jeleségeket (az autokorrelált rezduumégyzeteket, az eloszlások csúcsosságát és a volatltás tömörülését) egyszerre reprodukál. Összefoglalás Az dősor egy vagy több meység dőbe redezett megfgyelése. Ha egyszerre csak egy adatsort vzsgáluk, akkor egyváltozós dősorelemzést végzük. Az ugyaazokba az dőpllaatokba megfgyelt többféle adatsor együttes vzsgálatát pedg többváltozós dősorelemzések evezzük. Az dősor elemzés módszereket két fő csoportja va: az ú. dőtartomáyo törtéő elemzés kategórájába esk a determsztkus és a szochasztkus dősorelemzés (mvel azo alapulak, hogy az dősor külöböző dőpotokhoz tartozó értéke között teremteek kapcsolatot), a másk agy kategóra a frekvecatartomáyo törtéő elemzés. Az dőbe törtéő előrejelzés lehet kvattatív és kvaltatív, azaz a számoko alapuló, lletve a mőség. A kvaltatív előrejelzés az u. szubjektív előrejelzés, mvel a megkérdezett személyek tapasztalatá, tudásá, megérzése alapszk. Ezek a megkérdezettek szakértők, akk a vzsgált területet behatóa smerk, és így képesek olya dolgok, változások meglátására, előrejelzésére, amket mások em tudáak. A kvattatív előrejelzést két csoportra lehet oszta: a kauzáls módszerek (többváltozós modellek) esetébe a jeleség okáak a feltárása a cél, és ha már ez megva, akkor ezt követ a jövő progosztzálása. A másk csoport a projektív módszerek (ez a módszercsalád egyváltozós). Az előrejelzések eze típusa az dősorokat haszálják fel, a múltból (mt egyetle vzsgált változóból) dulak k. A projektív módszerek egyk csoportja a determsztkus modellek, amelyekbe a véletle em képez léyeges alkotóelemét a modellek. A sztochasztkus modellek esetébe a t 10

121 véletle a folyamat alkotóelemévé válk és beépül a modellbe. A statsztkába az dősor elemzés külöböző módszereket alkalmaz: az 1970-es évekg a determsztkus szemlélet uralkodott, majd ezt követte a 1980-as évekbe az u. ARMA modell család és a legfatalabb módszercsaládba tartozak az ARCH modellek. Elleőrző kérdések 1. Mkor evezzük a vzsgálatukat egyváltozós dősor elemzések?. M a determsztkus dősor elemezés? 3. M a sztochasztkus dősor elemezés? 4. M a frekvecatartomáyo alapuló dősorelemzés? 5. M az autokorrelácó? Kompetecát fejlesztő kérdések 1. Mlye célja lehetek az dősorok elemzéséek?. Hogya lehet elkülöíte a sztochasztkus dősorelemzés módszeret? 3. Mlye oka lehetek a strukturáls törések kalakulásáak? 4. Mre haszálható az autokorrelácós függvéy? 11

122 11 AR(I)MA modellek specfkálása. Box-Jeks-modellezés Equato Chapter 11 Secto 1 A sztochasztkus módszerek a véletleek jeletős hatást tulajdoítaak, ez a modellezésbe fotos szerepet játszk. Ezek törtéete Yule autoregresszív (197), lletve Slutsky mozgóátlagolású modelljég (1937) yúlk vssza (Bauer Földes, 005). Wold alkalmazta először a mozgóátlagolású modellt valós adatokra, lletve ő dolgozta k a vegyes ARMAmodellek haszálatát (1954). Az dősorokra voatkozó legáryaltabb, legösszetettebb elemzés a Box és Jeks által kdolgozott ARIMA modellekkel lehetséges (Ketskeméty et al., 011). A számítások ehézkessége matt az ARMA-modelleket csak agyo kevese haszálták, egésze a számítógépek széles körű elterjedéség, lletve amíg Box és Jeks meg em fogalmazta azokat a krtérumokat, amelyekkel mde dősorra meghatározható egy kokrét típusú és fokú ARIMA modell (Bauer Földes, 005; Box Perce, 1970). Ez a modellezés elsősorba a sűrű megfgyeléssel redelkező változók (pl. árfolyamok) eheze megragadható szabálytala gadozásat, dőbel lefutásat próbálja leír, alapesetbe csupá saját múltbel értékek és a véletleek törvéyszerűsége alapjá (Huyad, 001). Az dősorok elméletébe és alkalmazásába az autoregresszív és mozgóátlag- (ARMA) folyamatok jeletősége az utóbb évtzedekbe redkívül megőtt. Ez aak köszöhető, hogy az ARMA sztochasztkus folyamatok matematka szempotból jól kezelhetők, és a folyamatok egy elég általáos osztályát képvselk. Ematt a gyakorlatba előforduló, stacoárus vselkedést mutató véletle folyamatok agy része jól közelíthető az ARMA folyamatokkal (Fábá, 008) Az ARIMA modellezés Az dősorelemzéshez mdeképpe szükség va bzoyos előfeltevésekre, modellezésre, mvel tt cs mód több függetle mtát ve, mt ahogya a statsztka más területe; tt csak egy dősoruk va (Bauer Földes, 003). Az ARIMA-modellezés (tegrált autoregresszív mozgóátlagolás) léyege, hogy az dősorok leírására kdolgozott autoregresszós (amelyek azt becslk, hogy a megfgyelés mosta, Y t értéke hogya függ az előző dőszakok Y t-1,y t-,y t-3,, Y 1 értéketől) és mozgóátlagoláso alapuló eljárásokat (amelyek pedg azt mutatják, hogya függ a megfgyelés mosta értéke az előző dőszakok véletle téyezőtől) egy közös modellbe építjük be. A Box és Jeks által ajálott általáos módszer, ARIMA modellek alkalmazása dősorelemzésre, progosztzálásra és elleőrzésre az dősorelemzés Box-Jeks módszertaakét lett smert. Az ARIMA (Autoregressve- Itegrated-Movg-Average = Autoregresszív Itegrált Mozgóátlag) modellezés meetét a következőkbe foglaljuk össze (Herma et al., 1994; Kehl Spos, 011 alapjá). A szochasztkus dősor modellek tegrált autoregresszív és mozgóátlag (rövdítve ARIMA) modellcsaládjáak elevezésébe, az AR az autoregresszív, az MA a mozgóátlag jelzőre, az I betű (Itegrated) pedg az összegzésre utal. Az autoregresszív (AR) modell, az dősor jeleleg értékét, saját előző értékeek függvéyébe fejez k, természetese, mt sztochasztkus modell, kegészülve a véletle gadozást reprezetáló változóval. Az autoregresszó a regresszó olya formája, melybe az eredméyváltozó más magyarázó változók helyett saját külöböző késleltetésű múltbel értékehez kapcsolódk. Statsztka szempotból tehát egyváltozós dősorelemzést végzük. ARIMA (p, 0, 0): Yt 0 1Y t1 Y t... pyt p [11-1] t Y Y Y... Y [11-] vagy t 1 t1 t p t p t ahol: p az autoregresszvtás redjét jelöl. 1

123 A mozgóátlag (MA) modell az dősor jeleleg értékét, a jeleleg és a múltbel véletle változók függvéyébe fejez k. ARIMA (0,0,q): Y t t 1 t1 t... q [11-3] tq ahol: q a mozgóátlag folyamat redjét jelöl. A Box - Jeks modellezésbe az MA azt jelet, hogy az dősor értékét a t dőpotba befolyásolja a jeleleg hbatag és a múltbel hbatagok súlyozott kombácója. ARMA modell: Az lye típusú dősor modell formája lehet autoregresszív (AR) vagy mozgóátlag (MA) vagy a kettő kombácója (ARMA, vagy más éve vegyes modell). A vegyes (ARMA) modell az dősor jeleleg értékét, saját előző értékeek, és a jeleleg, lletve a múltbel véletle változók függvéyébe fejez k. ARIMA(p,0,q): Yt 1Y t1 Y t... py t p t 1 t1 t... q [11-4] tq máskép felírva (Kovács Balogh, 011): Y p Y t t t t 1 1 q [11-5] Az ARMA modell alakja a Lag operátor bevezetésével a következő alakba írható: p q t t 1 1, [11-6] ( 1 L )Y ( 1 L ) ahol LYt Yt Az ARMA általáosítása az AutoRegresszív Itegrated Movg Average modell (ARIMA(p,d,q)), amelybe először dfferecáljuk többször az dősort, majd a dfferecált dősor egy ARMA folyamat az alábbak szert: (1 p q d L )(1 L) X t (1 L ) t, [11-7] 1 1 ahol d a dfferecálás fokát jelet. Ha d=0, akkor az ARMA modellt kapjuk, ha d-szer derváluk egy ARIMA(p,d,q) modellt, akkor s az ARMA modellhez jutuk. Ameybe d=0, akkor az dősor stacoárus, ameybe d=1, akkor em stacoárus. Vaak olya stacoárus dősorok, amelyek esetébe az autokorrelácós függvéy lassa cseg le, és két távol megfgyelés között s összefüggés mutatkozk. Ilyekor két eset lehetséges. Az dősor egységgyököt tartalmaz, de mvel agyo közel va az egyhez, ezért az egységgyök teszt téves eredméyt mutat. A másk lehetőség, hogy az dősorba cs egységgyök valóba, de hosszútávú korrelácókat tartalmaz, erre em lleszkedk jól a szokváyos ARIMA modell. Ameybe újra dfferecálák az dősort, az sem lee megoldás, mert túl dfferecált lee az dősor. Grager és Joyeux (1980), valamt Hoskg (1981) javasolta eek a problémáak az áthdalására, hogy a d dfferecálás paraméter legye em egész érték. Ekkor az ARIMA modell képletébe az alább módosulások törtéek: (1 L) d d(1 d) 1 dl L! d(1 d)( d) 3 d(1 d)( d)...(k 1 d) k L... L 3! k! [11-8] Ha d értéke 0 és 0,5 közé esk, akkor az dősor hosszú távú függőségeket tartalmaz. Ha d értéke agyobb, mt 0,5, akkor az dősor em stacoárus, ha d=0, akkor az dősor egy fehér zaj folyamat. Az autoregresszív tegrált mozgóátlag (ARIMA) modell, a dffereca- vagy külöbözetképzéssel stacoárussá traszformált, ú. d-ed redű tegrált [I(d)] dősorokra felírt ARMA modell. Ha például az dősor első dfferecá (az Y t Y t-1 értékek) stacoárusak, az eredet dősor elsőredű tegrált [I(1)]. 13

124 Az ARIMA modellezés kdulópotja aak megállapítása, hogy a vzsgál kívát dősoruk stacoárus-e, lletve, ha em, akkor az, hogy alkalmas traszformácóval stacoárussá tehető-e. Ezzel eldötöttük azt, hogy az adott dősorhoz lleszthető-e ARIMA modell, ha ge mlye (d) dmezóval (fokkal) redelkezk. A következő kérdés aak megválaszolása, hogy mlye típusú ARMA modell llesztésével próbálkozzuk, lletve, mlye legye az autoregresszvtás (p) és/vagy, a mozgóátlagolás (q) redje. Erre a kérdésre a választ a tapasztalat, vagy a traszformált dősor ACF és PACF értéke (autokorrelácós- és parcáls autokorrelácós együtthatók) alapjá adjuk meg. A modellezés eze fázsát, modell azoosításak (detfkácóak) evez a szakrodalom. Ezutá a modellezés lépése alapvetőe megfelelek a már smert leárs regresszós modellezések. A választott modell paraméterbecslése utá a modell elleőrzése következk. A modell elleőrzése sorá vzsgáljuk azt, hogy paramétere szgfkásak-e, lletve véletle változók fehér zaj folyamatot követek-e. Specálsa az ARMA modellekek va stacoartás (az dősor jellemző dőbe álladóak, azaz függetleek a t dőváltozótól) és vertbltás (azaz a becsült paraméterek abszolút értéke ksebb, mt egy) feltétele s, melyek a modell paramétereek értékére voatkozó megszorításokkét jeleek meg. Ezutá dötük arról, hogy felhaszálható-e az llesztett modell elemzésre, előrejelzésre vagy más modell választásával kell próbálkozuk. A modellkészítés meetét llusztrálja az alább folyamatábra ábra: Az ARIMA modellezés Box-Jeks-féle módszere Forrás: Maddala, 004 Az ARIMA modellek dmezót a következő módo adjuk meg: ARIMA (p, d, q). A gyakorlat alkalmazások szert az dősorok agy része jól közelíthető olya modellekkel, melyekél az autoregresszvtás és a mozgóátlag folyamat redje (p és q), lletve a dfferecaképzés foka (d) alacsoy. Általába mdhárom dmezó - a (p), a (d), és a (q) s 0, vagy 1, vagy értéket vesz fel. Egy (p,d,q) paraméterekkel jellemezhető ARIMA-modell tartalmaz egy q-ad redű mozgóátlagolású és egy p-ed redű autoregresszív modellt, amelyeket az dősor eredet elemeből képzett d-ed fokú dfferecákra íruk fel. Szezoáls modellre a paraméterek kbővülek (p,d,q) (P,Q,D) 4 -re) vagy (p,d,q) (P,Q,D) 1 -re, ahol a agybetűs paraméterek a 14

Statisztika. Eloszlásjellemzők

Statisztika. Eloszlásjellemzők Statsztka Eloszlásjellemzők Statsztka adatok elemzése A sokaság jellemzése középértékekkel A sokaság jellemzéséek szempotja A sokaság jellemzéséek szempotja: A sokaság tpkus értékéek meghatározása. Az

Részletesebben

? közgazdasági statisztika

? közgazdasági statisztika Valószíűségszámítás és a statsztka Valószíűség számítás Matematka statsztka Alkalmazott statsztka? közgazdaság statsztka épesség statsztka orvos statsztka Stb. Példa: vércsoportok Az eloszlás A AB B Elem

Részletesebben

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések! ORVOSI STATISZTIKA Az orvos statsztka helye Életta Aatóma Kéma Lehet kérdés?? Statsztka! Az orvos dötéseket hoz! Mkor jó egy dötés? Meyre helyes egy dötés? Mekkora a tévedés lehetősége? Példa: test hőmérséklet

Részletesebben

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre Statsztka I. 4. előadás Előadó: Dr. Ertsey Imre KÖZÉPÉRTÉKEK A statsztka sor általáos jellemzésére szolgálak, a statsztka sokaságot egy számmal jellemzk. Számított középértékek: matematka számítás eredméyekét

Részletesebben

? közgazdasági statisztika

? közgazdasági statisztika ... Valószíűségszámítás és a statsztka Valószíűség számítás Matematka statsztka Alkalmazott statsztka? közgazdaság statsztka épesség statsztka orvos statsztka Stb. Példa: vércsoportok Az eloszlás A AB

Részletesebben

BEVEZETÉS AZ SPSS ALAPJAIBA. (Belső használatra)

BEVEZETÉS AZ SPSS ALAPJAIBA. (Belső használatra) BEVEZETÉS AZ SPSS ALAPJAIBA (Belső haszálatra) TARTALOMJEGYZÉK. Statsztka alapfogalmak..... Sokaság...4.2. Ismérvek és mérés skálák...6.3. Statsztka sorok...7 2. SPSS alapfogalmak...9 3. Alapvető statsztka

Részletesebben

Ismérvek közötti kapcsolatok szorosságának vizsgálata. 1. Egy kis ismétlés: mérési skálák (Hunyadi-Vita: Statisztika I. 25-26. o)

Ismérvek közötti kapcsolatok szorosságának vizsgálata. 1. Egy kis ismétlés: mérési skálák (Hunyadi-Vita: Statisztika I. 25-26. o) Ismérvek között kapcsolatok szorosságáak vzsgálata 1. Egy ks smétlés: mérés skálák (Huyad-Vta: Statsztka I. 5-6. o) A külöböző smérveket, eltérő mérés sztekkel (skálákkal) ellemezhetük. a. évleges (omáls)

Részletesebben

A sokaság/minta eloszlásának jellemzése

A sokaság/minta eloszlásának jellemzése 3. előadás A sokaság/mnta eloszlásának jellemzése tpkus értékek meghatározása; az adatok különbözőségének vzsgálata, a sokaság/mnta eloszlásgörbéjének elemzése. Eloszlásjellemzők Középértékek helyzet (Me,

Részletesebben

Megállapítható változók elemzése Függetlenségvizsgálat, illeszkedésvizsgálat, homogenitásvizsgálat

Megállapítható változók elemzése Függetlenségvizsgálat, illeszkedésvizsgálat, homogenitásvizsgálat Megállapítható változók elemzése Függetleségvzsgálat, lleszkedésvzsgálat, homogetásvzsgálat Ordáls, omáls esetre s alkalmazhatóak a következő χ próbá alapuló vzsgálatok: 1) Függetleségvzsgálat: két valószíűség

Részletesebben

Feladatok és megoldások a 11. heti gyakorlathoz

Feladatok és megoldások a 11. heti gyakorlathoz Feladatok és megoldások a. het gyakorlathoz dszkrét várható érték Építőkar Matematka A. Egy verseye öt ő és öt férf verseyző dul. Tegyük fel, hogy cs két azoos eredméy, és md a 0! sorred egyformá valószíű.

Részletesebben

Statisztikai. Statisztika Sportszervező BSc képzés NBG GI866G4. Statisztika fogalma. Statisztikai alapfogalmak. Statisztika fogalma

Statisztikai. Statisztika Sportszervező BSc képzés NBG GI866G4. Statisztika fogalma. Statisztikai alapfogalmak. Statisztika fogalma Statsztka Sportszervező BSc képzés NBG GI866G4 010-011-es taév II félév Statsztka alapfogalmak Oktató: Dr Csáfor Hajalka főskola doces Vállalkozás-gazdaságta Tsz E-mal: hcsafor@ektfhu Statsztka alapfogalmak

Részletesebben

A MATEMATIKAI STATISZTIKA ELEMEI

A MATEMATIKAI STATISZTIKA ELEMEI A MATEMATIKAI STATISZTIKA ELEMEI Az Eötvös Lórád Tudomáyegyetem Természettudomáy Kará a Fzka Kéma Taszék évek óta kéma-szakos taárhallgatókak matematka bevezetõ elõadásokat tart. Az elõadások célja az,

Részletesebben

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje. 24. tétel valószíűségszámítás elemei. valószíűség kiszámításáak kombiatorikus modellje. GYORISÁG ÉS VLÓSZÍŰSÉG meyibe az egyes adatok a sokaságo belüli részaráyát adjuk meg (törtbe vagy százalékba), akkor

Részletesebben

STATISZTIKA. ltozók. szintjei, tartozhatnak: 2. Előad. Intervallum skála. Az adatok mérési m. Az alacsony mérési m. Megszáml Gyakoriság módusz

STATISZTIKA. ltozók. szintjei, tartozhatnak: 2. Előad. Intervallum skála. Az adatok mérési m. Az alacsony mérési m. Megszáml Gyakoriság módusz A változv ltozók k mérés m sztje STATISZTIKA. Előad adás Az adatok mérés m sztje, Cetráls mutatók A változv ltozók k az alább típusba t tartozhatak: Nomáls (kategorkus és s dszkrét) Ordáls Itervallum skála

Részletesebben

Dr. Tóth Zsuzsanna Eszter Dr. Jónás Tamás Erdei János. Gazdaságstatisztika. II. rész A matematikai statisztika alapjai

Dr. Tóth Zsuzsanna Eszter Dr. Jónás Tamás Erdei János. Gazdaságstatisztika. II. rész A matematikai statisztika alapjai Budapest Műszak és Gazdaságtudomáy Egyetem Gazdaság- és Társadalomtudomáy Kar Üzlet Tudomáyok Itézet Meedzsmet és Vállalatgazdaságta Taszék Dr. Tóth Zsuzsaa Eszter Dr. Jóás Tamás Erde Jáos Gazdaságstatsztka

Részletesebben

Matematikai statisztika

Matematikai statisztika Matematikai statisztika PROGRAMTERVEZŐ INFORMATIKUS alapszak, A szakiráy Arató Miklós Valószíűségelméleti és Statisztika Taszék Természettudomáyi Kar 2019. február 18. Arató Miklós (ELTE) Matematikai statisztika

Részletesebben

Matematikai statisztika elıadás III. éves elemzı szakosoknak. Zempléni András 9. elıadásból (részlet)

Matematikai statisztika elıadás III. éves elemzı szakosoknak. Zempléni András 9. elıadásból (részlet) Matematka statsztka elıadás III. éves elemzı szakosokak Zemplé Adrás 9. elıadásból részlet Y közelítése függvéyével Gyakor eset, hogy em smerjük a számukra érdekes meység Y potos értékét pl. holap részvéy-árfolyam,

Részletesebben

Matematikai statisztika

Matematikai statisztika Matematka statsztka 8. elıadás http://www.math.elte.hu/~arato/matstat0.htm Kétmtás eset: függetle mták + + + = + ) ( ) ( ) ( Y Y X X Y X m m m t m Ha smert a szórás: (X elemő, σ szórású, Y m elemő, σ szórású),

Részletesebben

4 2 lapultsági együttható =

4 2 lapultsági együttható = Leíró statsztka Egy kísérlet végeztével általában tetemes mennységű adat szokott összegyűln. Állandó probléma, hogy mt s kezdjünk - lletve mt tudunk kezden az adatokkal. A statsztka ebben segít mnket.

Részletesebben

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó. I. Függelék A valószíűségszámítás alapjai I.1. Alapfogalamak: Véletle jeleség: létrejöttét befolyásoló összes téyezőt em ismerjük. Tömegjeleség: a jeleség adott feltételek mellett akárháyszor megismételhető.

Részletesebben

Tartalomjegyzék. 4.3 Alkalmazás: sorozatgyártású tűgörgő átmérőjének jellemzése

Tartalomjegyzék. 4.3 Alkalmazás: sorozatgyártású tűgörgő átmérőjének jellemzése 3 4 Tartalomegyzék. BEVEZETÉS 5. A MÉRÉS 8. A mérés mt folyamat, fogalmak 8. Fotosabb mérés- és műszertechka fogalmak 4.3 Mérés hbák 8.3. Mérés hbák csoportosítása eredetük szert 8.3. A hbák megeleítés

Részletesebben

STATISZTIKA II. kötet

STATISZTIKA II. kötet Szeged Tudomáyegyetem Gazdaságtudomáy Kar Petres Tbor Tóth László STATISZTIKA II. kötet Szerzők: Dr. Petres Tbor, PhD egyetem doces Statsztka és Demográfa Taszék Tóth László PhD-hallgató Gazdaságtudomáy

Részletesebben

Tulajdonságok. Teljes eseményrendszer. Valószínőségi változók függetlensége. Példák, szimulációk

Tulajdonságok. Teljes eseményrendszer. Valószínőségi változók függetlensége. Példák, szimulációk Valószíőségszámítás és statsztka elıadás fo. BSC/B-C szakosokak 3. elıadás Szeptember 26 p 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 A bomáls és a hpergeom. elo. összehasolítása 0 1 2 3 4 5 6 7 8 9 10 k Hp.geom

Részletesebben

A pályázat címe: Rugalmas-képlékeny tartószerkezetek topológiai optimalizálásának néhány különleges feladata

A pályázat címe: Rugalmas-képlékeny tartószerkezetek topológiai optimalizálásának néhány különleges feladata 6. év OTKA zárójeletés: Vezető kutató:kalszky Sádor OTKA ylvátartás szám T 4993 A pályázat címe: Rugalmas-képlékey tartószerkezetek topológa optmalzálásáak éháy külöleges feladata (Részletes jeletés) Az

Részletesebben

A paramétereket kísérletileg meghatározott yi értékekre támaszkodva becsülik. Ha n darab kisérletet (megfigyelést, mérést) végeznek, n darab

A paramétereket kísérletileg meghatározott yi értékekre támaszkodva becsülik. Ha n darab kisérletet (megfigyelést, mérést) végeznek, n darab öbbváltozós regresszók Paraméterbecslés-. A paraméterbecslés.. A probléma megfogalmazása A paramétereket kísérletleg meghatározott y értékekre támaszkodva becsülk. Ha darab ksérletet (megfgyelést, mérést

Részletesebben

Példák 2. Teljes eseményrendszer. Tulajdonságok. Példák diszkrét valószínőségi változókra

Példák 2. Teljes eseményrendszer. Tulajdonságok. Példák diszkrét valószínőségi változókra Valószíőségszámítás és statsztka elıadás fo. BSC/B-C szakosokak 3. elıadás Szeptember 28 dszkrét valószíőség változókra X(ω)=c mde ω-ra. Elevezés: elfajult eloszlás. P(X=c)=1. X akkor 1, ha egy adott,

Részletesebben

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika BIOSTATISZTIKA ÉS INFORMATIKA Leíró statisztika Első közelítésbe a statisztikai tevékeységeket égy csoportba sorolhatjuk, de ezek között ics éles határ:. adatgyűjtés, 2. az adatok áttekithetővé tétele,

Részletesebben

Mérési adatok feldolgozása. 2008.04.08. Méréselmélet PE_MIK MI_BSc, VI_BSc 1

Mérési adatok feldolgozása. 2008.04.08. Méréselmélet PE_MIK MI_BSc, VI_BSc 1 Mérés adatok feldolgozása 2008.04.08. Méréselmélet PE_MIK MI_BSc, VI_BSc Bevezetés A mérés adatok külöböző formába, általába ömlesztve jeleek meg Ezeket az adatokat külöböző szempotok szert redez kértékel

Részletesebben

Változók függőségi viszonyainak vizsgálata

Változók függőségi viszonyainak vizsgálata Változók függőség vszoyaak vzsgálata Ismétlés: változók, mérés skálák típusa kategoráls változók Asszocácós kapcsolat számszerű változók Korrelácós kapcsolat testsúly (kg) szemüveges em ő 1 3 férf 5 3

Részletesebben

ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június ÖKONOMETIA Készült a TÁMOP-4.1.-08//A/KM-009-0041pályázat projet eretébe Tartalomfejlesztés az ELTE TáTK Közgazdaságtudomáy Taszéé az ELTE Közgazdaságtudomáy Taszé az MTA Közgazdaságtudomáy Itézet és a

Részletesebben

BIOMATEMATIKA ELŐADÁS

BIOMATEMATIKA ELŐADÁS BIOMATEMATIKA ELŐADÁS 10. A statisztika alapjai Debrecei Egyetem, 2015 Dr. Bérczes Attila, Bertók Csaád A diasor tartalma 1 Bevezetés 2 Statisztikai függvéyek Defiíció, empirikus várható érték Empirikus

Részletesebben

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük. Statisztikai módszerek. BMEGEVGAT01 Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudomáyi Egyetem Gépészméröki Kar Hidrodiamikai Redszerek Taszék 1111, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:

Részletesebben

Regresszió és korreláció

Regresszió és korreláció Regresszó és korrelácó regresso: vsszatérés, hátrálás; vsszafordulás correlato: vszo, összefüggés, kölcsöösség KAD 01.11.1 1 (vsszatérés, hátrálás; vsszafordulás) Regresszó és korrelácó Gakorlat megközelítés

Részletesebben

1. előadás: Bevezetés. Irodalom. Számonkérés. A valószínűségszámítás és a statisztika tárgya. Cél

1. előadás: Bevezetés. Irodalom. Számonkérés. A valószínűségszámítás és a statisztika tárgya. Cél Valószíűségszámítás és statsztka előadás fo. BSC/B-C szakosokak 1. előadás szeptember 13. 1. előadás: Bevezetés Irodalom, követelméyek A félév célja Valószíűségszámítás tárgya Törtéet Alapfogalmak Valószíűségek

Részletesebben

Azonos névleges értékű, hitelesített súlyokból alkotott csoportok együttes mérési bizonytalansága

Azonos névleges értékű, hitelesített súlyokból alkotott csoportok együttes mérési bizonytalansága Azoos évleges értékű, htelesített súlyokból alkotott csoportok együttes mérés bzoytalasága Zeleka Zoltá* Több mérés feladatál alkalmazak súlyokat. Sokszor ezek em egyekét, haem külöböző társításba kombácókba

Részletesebben

Adatfeldolgozás, adatértékelés. Dr. Szűcs Péter, Dr. Madarász Tamás Miskolci Egyetem, Hidrogeológiai Mérnökgeológiai Tanszék

Adatfeldolgozás, adatértékelés. Dr. Szűcs Péter, Dr. Madarász Tamás Miskolci Egyetem, Hidrogeológiai Mérnökgeológiai Tanszék Adatfeldolgozás, adatértékelés Dr. Szűcs Péter, Dr. Madarász Tamás Mskolc Egyetem, Hdrogeológa Mérökgeológa Taszék A vzsgált köryezet elemek, lletve a felszí alatt közeg megsmerése céljából számtala külöböző

Részletesebben

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet A biostatisztika alapfogalmai, kofideciaitervallum Dr. Boda Krisztia PhD SZTE ÁOK Orvosi Fizikai és Orvosi Iformatikai Itézet Mitavétel ormális eloszlásból http://www.ruf.rice.edu/~lae/stat_sim/idex.html

Részletesebben

AZ OPTIMÁLIS MINTANAGYSÁG A KAPCSOLÓDÓ KÖLTSÉGEK ÉS BEVÉTELEK RELÁCIÓJÁBAN

AZ OPTIMÁLIS MINTANAGYSÁG A KAPCSOLÓDÓ KÖLTSÉGEK ÉS BEVÉTELEK RELÁCIÓJÁBAN AZ OPTIMÁLIS MINTANAGYSÁG A KAPCSOLÓDÓ KÖLTSÉGEK ÉS BEVÉTELEK RELÁCIÓJÁBAN Molár László Ph.D. hallgató Mskolc Egyetem, Gazdaságelmélet Itézet 1. A MINTANAGYSÁG MEGHATÁROZÁSA EGYSZERŐ VÉLETLEN (EV) MINTA

Részletesebben

1. előadás: Bevezetés. Számonkérés. Irodalom. Valószínűségszámítás helye a tudományok között. Cél

1. előadás: Bevezetés. Számonkérés. Irodalom. Valószínűségszámítás helye a tudományok között. Cél Valószíűségszámítás 1 előadás mat. BSc alk. mat. szakráyosokak 2016/2017 1. félév Zemplé Adrás zemple@ludes.elte.hu http://zemple.elte.hu/ 1. előadás: Bevezetés Irodalom, követelméyek A félév célja Valószíűségszámítás

Részletesebben

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat Kísérlettervezés - biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert u-próba Feltétel: egy ormális eloszlású sokaság σ variaciájáak számszerű értéke ismert. Hipotézis: a sokaság µ várható értéke

Részletesebben

A heteroszkedaszticitásról egyszerûbben

A heteroszkedaszticitásról egyszerûbben Mûhely Huyad László kaddátus, egyetem taár, a Statsztka Szemle főszerkesztője A heteroszkedasztctásról egyszerûbbe E-mal: laszlo.huyad@ksh.hu A heteroszkedasztctás az ökoometra modellezés egyk kulcsfogalma,

Részletesebben

A peremeloszlások. Valószínőségszámítás elıadás III. alk. matematikus szak. Példa. Valószínőségi vektorváltozók eloszlásfüggvénye.

A peremeloszlások. Valószínőségszámítás elıadás III. alk. matematikus szak. Példa. Valószínőségi vektorváltozók eloszlásfüggvénye. y Valószíőségszámítás elıaás III. alk. matematkus szak 4. elıaás, szeptember 30 A peremeloszlások (X,Y) eloszlásából (elevezés: együttes eloszlás) következtethetük az egyes változók eloszlására: P(X)P(X,Y0)+P(X,Y)+P(X,Y2)

Részletesebben

Korreláció- és regressziószámítás

Korreláció- és regressziószámítás Korrelácó- és regresszószámítás sztochasztkus kapcsolat léyege az, hogy a megfgyelt sokaság egységeek egyk smérv szert mlyeségét, hovatartozását smerve levoható ugya bzoyos következtetés az egységek másk

Részletesebben

2. METROLÓGIA ÉS HIBASZÁMíTÁS

2. METROLÓGIA ÉS HIBASZÁMíTÁS . METROLÓGIA ÉS HIBASZÁMíTÁS. Metrológa alapfogalmak A metrológa a mérések tudomáya, a mérésekkel kapcsolatos smereteket fogja össze. Méréssel egy objektum valamlye tulajdoságáról számszerű értéket kapuk.

Részletesebben

Matematika B4 I. gyakorlat

Matematika B4 I. gyakorlat Matematika B4 I. gyakorlat 2006. február 16. 1. Egy-dimeziós adatredszerek Va valamilye adatredszer (számsorozat), amelyről szereték kiszámoli bizoyos dolgokat. Az egyes értékeket jelöljük z i -vel, a

Részletesebben

Kutatói pályára felkészítı modul

Kutatói pályára felkészítı modul Kutatói pályára felkészítı modul Kutatói pályára felkészítı kutatási ismeretek modul Tudomáyos kutatási alapayag feldolgozása, elemzési ismeretek KÖRNYEZETGAZDÁLKODÁSI MÉRNÖKI MSc TERMÉSZETVÉDELMI MÉRNÖKI

Részletesebben

GEOFIZIKA / 4. GRAVITÁCIÓS ANOMÁLIÁK PREDIKCIÓJA, ANALITIKAI FOLYTATÁSOK MÓDSZERE, GRAVITÁCIÓS ANOMÁLIATEREK SZŰRÉSE

GEOFIZIKA / 4. GRAVITÁCIÓS ANOMÁLIÁK PREDIKCIÓJA, ANALITIKAI FOLYTATÁSOK MÓDSZERE, GRAVITÁCIÓS ANOMÁLIATEREK SZŰRÉSE MSc GEOFIZIKA / 4. BMEEOAFMFT3 GRAVITÁCIÓS ANOMÁLIÁK REDIKCIÓJA, ANALITIKAI FOLYTATÁSOK MÓDSZERE, GRAVITÁCIÓS ANOMÁLIATEREK SZŰRÉSE A gravtácós aomálák predkcója Külöböző feladatok megoldása sorá - elsősorba

Részletesebben

A matematikai statisztika elemei

A matematikai statisztika elemei A matematikai statisztika elemei Mikó Teréz, dr. Szalkai Istvá szalkai@almos.ui-pao.hu Pao Egyetem, Veszprém 2014. március 23. 2 Tartalomjegyzék Tartalomjegyzék 3 Bevezetés................................

Részletesebben

MINTAVÉTEL A MARKETINGKUTATÁSBAN, KÜLÖNÖS TEKINTETTEL A DIVIZÍV ÉS AZ AGGLOMERATÍV RÉTEGZÉSRE

MINTAVÉTEL A MARKETINGKUTATÁSBAN, KÜLÖNÖS TEKINTETTEL A DIVIZÍV ÉS AZ AGGLOMERATÍV RÉTEGZÉSRE MINTAVÉTEL A MARKETINGKUTATÁSBAN, KÜLÖNÖS TEKINTETTEL A DIVIZÍV ÉS AZ AGGLOMERATÍV RÉTEGZÉSRE Molár László egyetem taársegéd 1. BEVEZETÉS A statsztkusok a mtaagyság meghatározására számos módszert dolgoztak

Részletesebben

Regresszió és korreláció

Regresszió és korreláció Regresszó és korrelácó regresso: vsszatérés, hátrálás; vsszafordulás correlato: vszo, összefüggés, kölcsöösség KAD 016.11.10 1 (vsszatérés, hátrálás; vsszafordulás) Regresszó és korrelácó Gakorlat megközelítés

Részletesebben

Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X = 1) = p Ind(p) P(X = 0) = 1 p. Leíró és matematikai statisztika

Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X = 1) = p Ind(p) P(X = 0) = 1 p. Leíró és matematikai statisztika Leíró és matematikai statisztika Matematika alapszak, matematikai elemző szakiráy Zempléi Adrás Valószíűségelméleti és Statisztika Taszék Matematikai Itézet Természettudomáyi Kar Eötvös Lorád Tudomáyegyetem

Részletesebben

Hipotéziselmélet. Statisztikai próbák I. Statisztikai próbák II. Informatikai Tudományok Doktori Iskola

Hipotéziselmélet. Statisztikai próbák I. Statisztikai próbák II. Informatikai Tudományok Doktori Iskola Hpotézselmélet Iformatka Tudomáyok Doktor Iskola Statsztka próbák I. 0.0.. Dr Ketskeméty László előadása Statsztka próbák II. Dötés eljárást dolgozuk k aak eldötésére, hogy a ullhpotézs gaz-e. Ha úgy kell

Részletesebben

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer? 01.09.18. Hpotézs vzsgálatok Egy példa Kérdések (példa) Hogyan adhatunk választ? Kérdés: Hatásos a lázcsllapító gyógyszer? Hatásos-e a gyógyszer?? rodalomból kísérletekből Hpotézsek A megfgyelt változó

Részletesebben

Statisztika 1. zárthelyi dolgozat március 21.

Statisztika 1. zárthelyi dolgozat március 21. Statisztika 1 zárthelyi dolgozat 011 március 1 1 Legye X = X 1,, X 00 függetle mita b paraméterű Poisso-eloszlásból b > 0 Legye T 1 X = X 1+X ++X 100, T 100 X = X 1+X ++X 00 00 a Milye a számra igaz, hogy

Részletesebben

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések! ORVOSI STATISZTIKA Az orvos statsztka helye Élettan Anatóma Kéma Lehet kérdés?? Statsztka! Az orvos döntéseket hoz! Mkor jó egy döntés? Mennyre helyes egy döntés? Mekkora a tévedés lehetősége? Példa: test

Részletesebben

Valószínűségszámítás. Ketskeméty László

Valószínűségszámítás. Ketskeméty László Valószíűségszámítás Ketskeméty László Budapest, 996 Tartalomjegyzék I. fejezet VALÓSZÍNŰSÉGSZÁMÍTÁS 3. Kombatorka alapfogalmak 4 Elleőrző kérdések és gyakorló feladatok 6. A valószíűségszámítás alapfogalma

Részletesebben

KTK. Dr. Herman Sándor Dr. Rédey Katalin. Statisztika I. PÉCSI TUDOMÁNYEGYETEM. Közgazdaságtudományi Kar. Alapítva: 1970

KTK. Dr. Herman Sándor Dr. Rédey Katalin. Statisztika I. PÉCSI TUDOMÁNYEGYETEM. Közgazdaságtudományi Kar. Alapítva: 1970 Dr. Herma Sádor Dr. Rédey Katal Statsztka I. PÉCSI TUDOMÁNYEGYETEM KTK Közgazdaságtudomáy Kar Alapítva: 97 Mde jog fetartva. Jele köyvet vagy aak részletet a szerző egedélye élkül bármlye formába vagy

Részletesebben

1. A radioaktivitás statisztikus jellege

1. A radioaktivitás statisztikus jellege A radioaktivitás időfüggése 1. A radioaktivitás statisztikus jellege Va N darab azoos radioaktív atomuk, melyekek az atommagja spotá átalakulásra képes. tegyük fel, hogy ezek em bomlaak tovább. Ekkor a

Részletesebben

VII. A határozatlan esetek kiküszöbölése

VII. A határozatlan esetek kiküszöbölése A határozatla esetek kiküszöbölése 9 VII A határozatla esetek kiküszöbölése 7 A l Hospital szabály A véges övekedések tétele alapjá egy függvéy értékét egy potba közelíthetjük az köryezetébe felvett valamely

Részletesebben

Izsák János. ELTE TTK Állatrendszertani és Ökológiai Tanszék. Kézirat

Izsák János. ELTE TTK Állatrendszertani és Ökológiai Tanszék. Kézirat BIOSTATISZTIKAI ALAPISMERETEK Izsák Jáos ELTE TTK Állatredszerta és Ökológa Taszék Kézrat Budapest, 5 Tartalomjegyzék Előszó 4. Valószíűség vektorváltozók 6.. Bevezetés 6.. A többváltozós, specálsa kétváltozós

Részletesebben

2012.03.01. Méréselmélet PE_MIK MI_BSc, VI_BSc 1

2012.03.01. Méréselmélet PE_MIK MI_BSc, VI_BSc 1 Mérés adatok feldolgozása 202.03.0. Méréselmélet PE_MIK MI_BSc, VI_BSc Bevezetés A mérés adatok külöböző formába, általába ömlesztve jeleek meg Ezeket az adatokat külöböző szempotok szert redez kértékel

Részletesebben

Miért pont úgy kombinálja kétfokozatú legkisebb négyzetek módszere (2SLS) az instrumentumokat, ahogy?

Miért pont úgy kombinálja kétfokozatú legkisebb négyzetek módszere (2SLS) az instrumentumokat, ahogy? Mért pot úgy kombálja kétfokozatú legksebb égyzetek módszere (2SLS az strumetumokat, ahogy? Kézrat A Huyad László 60. születésapjára készülő köyvbe Kézd Gábor 2004. júlus A Budapest Corvus Egyetem rövd

Részletesebben

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum) Az átlagra voatkozó megbízhatósági itervallum (kofidecia itervallum) Határozzuk meg körül azt az itervallumot amibe előre meghatározott valószíűséggel esik a várható érték (µ). A várható értéket potosa

Részletesebben

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér 13. www.u-szeged.hu www.palyazat.gov.

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér 13. www.u-szeged.hu www.palyazat.gov. Pályázat címe: Új geerációs sorttudomáyi kézés és tartalomfejlesztés, hazai és emzetközi hálózatfejlesztés és társadalmasítás a Szegedi Tudomáyegyeteme Pályázati azoosító: TÁMOP-4...E-5//KONV-05-000 Sortstatisztika

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

Statisztika segédlet*

Statisztika segédlet* Statsztka segédlet* Deícók: Statsztka: Valóság tömör számszerő jellemzésére szolgáló módszerta ll. gyakorlat teékeység. Statsztka gyakorlat ter: Tömegese elıorduló jeleségek egyedere oatkozó ormácók győjtése,

Részletesebben

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés A m és az átlag Standard hba Mnta átlag 1 170 Az átlagok szntén ngadoznak a m körül. s x s n Az átlagok átlagos eltérése a m- től! 168 A m konfdenca ntervalluma. 3 166 4 173 x s x ~ 68% ~68% annak a valószínűsége,

Részletesebben

A valószínűségszámítás elemei

A valószínűségszámítás elemei A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:

Részletesebben

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai 05..04. szórások vizsgálata z F-próba Hogya foguk hozzá? Nullhipotézis: a két szórás azoos, az eltérés véletle (mitavétel). ullhipotézishez tartozik egy ú. F-eloszlás. Szabadsági fokok: számláló: - evező:

Részletesebben

A Secretary problem. Optimális választás megtalálása.

A Secretary problem. Optimális választás megtalálása. A Secretary problem. Optmáls választás megtalálása. A Szdbád problémáa va egy szté lasszusa tethető talá természetesebb vszot ehezebb változata. Ez a övetező Secretary problem -a evezett érdés: Egy állásra

Részletesebben

Backtrack módszer (1.49)

Backtrack módszer (1.49) Backtrack módszer A backtrack módszer kombatorkus programozás eljárás, mely emleárs függvéy mmumát keres feltételek mellett, szsztematkus kereséssel. A módszer előye, hogy csak dszkrét változókat kezel,

Részletesebben

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Statisztika

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Statisztika Statisztika A statisztika adatok gyűjtésével, redszerezésével, illetve adatsorok elemzésével, szemléltetésével foglalkozik. Adatok redszerezése DEFINÍCIÓ: (Populáció) Populációak (statisztikai sokaságak)

Részletesebben

4 TÁRSADALMI JELENSÉGEK TÉRBELI EGYÜTTMOZGÁSA

4 TÁRSADALMI JELENSÉGEK TÉRBELI EGYÜTTMOZGÁSA ELTE Regoáls Földrajz Taszék 005 4 TÁRSADALMI JELENSÉGEK TÉRBELI EGYÜTTMOZGÁSA 4. Általáos szempotok A terület folyamatok, a tagoltság vzsgálata szte sohasem szűkül le egy-egy jeleség (mutatószám) térbel

Részletesebben

KOMBINATORIKA ELŐADÁS osztatlan matematikatanár hallgatók számára. Szita formula J = S \R,

KOMBINATORIKA ELŐADÁS osztatlan matematikatanár hallgatók számára. Szita formula J = S \R, KOMBINATORIKA ELŐADÁS osztatla matematkataár hallgatók számára Szta formula Előadó: Hajal Péter 2018 1. Bevezető példák 1. Feladat. Háy olya sorbaállítása va a {a,b,c,d,e} halmazak, amelybe a és b em kerül

Részletesebben

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia Valószíűségszámítás és statisztika előadás ifo. BSC/B-C szakosokak 6. előadás október 5. Megjegyzések. A tétel feltételei gyegíthetőek: elég, ha a függetle, azoos eloszlású változók várható értéke véges.

Részletesebben

PDF created with FinePrint pdffactory Pro trial version Irodalom.

PDF created with FinePrint pdffactory Pro trial version   Irodalom. r etskemétyászló matematkus http://wwwketskemetyhu laszlo@ketskemetyhu kela@sztbmehu : +36/70/3 00 5 0 egjelet az ötvös adó godozásába orgalmazza a Cytotechft egjeleés éve: 005 Jellemzők: 459 o, 94 cm

Részletesebben

Sztochasztikus tartalékolás és a tartalék függése a kifutási háromszög időperiódusától

Sztochasztikus tartalékolás és a tartalék függése a kifutási háromszög időperiódusától Sztochasztkus tartalékolás és a tartalék függése a kfutás háromszög dőperódusától Faluköz Tamás Vtéz Ildkó Ibola Kozules: r. Arató Mklós ELTETTK Budapest IBNR kfutás háromszög IBNR: curred but ot reported

Részletesebben

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos Középérték Középérték A középérték a statisztikai adatok tömör számszerű jellemzése. helyzeti középérték: módusz medián számított középérték: számtani átlag kronológikus átlag harmonikus átlag mértani

Részletesebben

Függvénygörbe alatti terület a határozott integrál

Függvénygörbe alatti terület a határozott integrál Függvéygörbe alatt terület a határozott tegrál Tektsük az üggvéyt a ; tervallumo. Adjuk becslést a görbe az tegely és az egyees között síkdom területére! Jelöljük ezt a területet I-vel! A becslést legegyszerűbbe

Részletesebben

Eseményalgebra, kombinatorika

Eseményalgebra, kombinatorika Eseméyalgebra, kombiatorika Eseméyalgebra Defiíció. Véletle kísérletek evezük mide olya megfigyelést, melyek több kimeetele lehetséges, és a véletletől függ, (azaz az általuk figyelembevett feltételek

Részletesebben

3.1. A Poisson-eloszlás

3.1. A Poisson-eloszlás Harmadik fejezet Nevezetes valószíűségi változók Valamely valószíűségi változóhoz kapcsolódó kérdésekre akkor tuduk potos választ adi, ha a változó eloszlása ismert, vagy megközelítőleg ismert. Ebbe a

Részletesebben

Adatsorok jellegadó értékei

Adatsorok jellegadó értékei Adatsorok jellegadó értéke Varga Ágnes egyetem tanársegéd varga.ag14@gmal.com Terület és térnformatka kvanttatív elemzés módszerek BCE Geo Intézet Terület elemzés forgatókönyve vacsora hasonlat Terület

Részletesebben

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya Matematikai statisztika előadás survey statisztika MA szakosokak 206/207 2. félév Zempléi Adrás. előadás: Bevezetés Irodalom, követelméyek A félév célja Matematikai statisztika tárgya Törtéet Alapfogalmak

Részletesebben

Ha n darab standard normális eloszlású változót négyzetesen összegzünk, akkor kapjuk a χ 2 - eloszlást: N

Ha n darab standard normális eloszlású változót négyzetesen összegzünk, akkor kapjuk a χ 2 - eloszlást: N Krály Zoltá: Statsztka II. Bevezetés A paraméteres eljárások alkalmazásához, a célváltozóra ézve szgorú feltételek szükségesek (folytoosság, ormaltás, szóráshomogetás), ekkor a hpotézseket egy-egy paraméterre

Részletesebben

VII.Valószínűségszámítási, statisztikai, gráfelméleti alapfogalmak

VII.Valószínűségszámítási, statisztikai, gráfelméleti alapfogalmak VII.Valószíűségszámítási, statisztikai, gráfelméleti alapfogalmak VII..A valószíűségszámítás elemei A valószíűségszámítás a véletle tömegjeleségeket taulmáyozó, kb. 300 éves tudomáy. Véletle jeleség: em

Részletesebben

véletlen : statisztikai törvényeknek engedelmeskedik (Mi az ami közös a népszavazásban, a betegségek gyógyulásában és a fiz. kém. laborban?

véletlen : statisztikai törvényeknek engedelmeskedik (Mi az ami közös a népszavazásban, a betegségek gyógyulásában és a fiz. kém. laborban? BEVEZETÉS A statisztika teljese laikusokak: agy mukával gyűjtött adatok vizsgálata, abból következtetések levoása ( statistical iferece ) (Egy kicsit sok hűhó semmiért azaz Much ado about othig.) Mi is

Részletesebben

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága Sorozatok, határérték fogalma. Függvéyek határértéke, folytoossága 1) Végtele valós számsorozatok Fogalma, megadása Defiíció: A természetes számok halmazá értelmezett a: N R egyváltozós valós függvéyt

Részletesebben

Hiba! Nincs ilyen stílusú szöveg a dokumentumban.-86. ábra: A példa-feladat kódolási változatai

Hiba! Nincs ilyen stílusú szöveg a dokumentumban.-86. ábra: A példa-feladat kódolási változatai közzétéve a szerző egedélyével) Öfüggő szekuder-változó csoport keresése: egy bevezető példa Ez a módszer az állapothalmazo értelmezett partíció-párok elméleté alapul. E helye em lehet céluk az elmélet

Részletesebben

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet): A umerikus sorozatok fogalma, határértéke (A TÁMOP-4-8//A/KMR-9-8 számú projekt keretébe írt egyetemi jegyzetrészlet): Koverges és diverges sorozatok Defiíció: A természetes számoko értelmezett N R sorozatokak

Részletesebben

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak Valószíűségszámítás és statisztika előadás ifo. BSC/B-C szakosokak 6. előadás október 16. A matematikai statisztika tárgya Következtetések levoása adatok alapjá Ipari termelés Mezőgazdaság Szociológia

Részletesebben

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok 1999. október hó: (adott a vastagon szedett!) S i g i z i g i z i

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok 1999. október hó: (adott a vastagon szedett!) S i g i z i g i z i . konzult. LEV. 013. ápr. 5. MENNYISÉGI ISMÉRV szernt ELEMZÉS Tk. 3-8., 88-90. oldal, kmarad: 70., 74. oldal A mennység smérv (X) lehet: dszkrét és folytonos. A rangsor a mennység smérv értékenek monoton

Részletesebben

STATISZTIKA I. Mekkora? Viszonyszá m = Viszonyszám. sa: 1. Két t statisztikai adat arány. egyik főf. csoportját t alkotják,

STATISZTIKA I. Mekkora? Viszonyszá m = Viszonyszám. sa: 1. Két t statisztikai adat arány. egyik főf. csoportját t alkotják, Mekkora? STATISZTIKA I. 3. Előad adás, Vszoyszámok Előad adó: Dr. Huzsva LászlL szló egyetem doces Vszoyszámok. Két t statsztka adat aráy yát kfejező számok, 2. Az ú. leszármaztatott számok egyk főf csoportját

Részletesebben

MÉRÉSTECHNIKA. DR. HUBA ANTAL c. egy. tanár BME Mechatronika, Optika és Gépészeti Informatika Tanszék 2011

MÉRÉSTECHNIKA. DR. HUBA ANTAL c. egy. tanár BME Mechatronika, Optika és Gépészeti Informatika Tanszék 2011 MÉRÉSTECHNIKA DR. HUBA ANTAL c. egy. taár BME Mechatroka, Optka és Gépészet Iformatka Taszék 0 Rövde a tárgyprogramról Előadások tematkája: Metrológa és műszertechka alapok Mérés adatok kértékelése Időbe

Részletesebben

Arrhenius-paraméterek becslése közvetett és közvetlen mérések alapján

Arrhenius-paraméterek becslése közvetett és közvetlen mérések alapján Tudomáyos Dákkör Dolgozat SZABÓ BOTOND Arrheus-paraméterek becslése közvetett és közvetle mérések alapá Turáy Tamás. Zsély Istvá Gyula Kéma Itézet Eötvös Lorád Tudomáyegyetem Természettudomáy Kar Budapest,

Részletesebben

2. Az együttműködő villamosenergia-rendszer teljesítmény-egyensúlya

2. Az együttműködő villamosenergia-rendszer teljesítmény-egyensúlya II RÉZ 2 EJEZE 2 Az együttműködő vllamoseerga-redszer teljesítméy-egyesúlya 2 A frekveca és a hatásos teljesítméy között összefüggés A fogyasztó alredszerbe a fogyasztók hatásos wattos teljesítméyt lletve

Részletesebben

KÍSÉRLETTERVEZÉS ÉS ÉRTÉKELÉS A MIKROBIOLÓGIAI GYAKORLATBAN

KÍSÉRLETTERVEZÉS ÉS ÉRTÉKELÉS A MIKROBIOLÓGIAI GYAKORLATBAN KÍSÉRLETTERVEZÉS ÉS ÉRTÉKELÉS A MIKROBIOLÓGIAI GYAKORLATBAN DR. REICHART OLIVÉR 005. Budapest Lektorálta: Zukál Edre Tartalom BEVEZETÉS 3. VALÓSZÍNŰSÉGSZÁMÍTÁSI ALAPOK 5.. Kombiatorikai alapösszefüggések

Részletesebben

I. Valószínűségelméleti és matematikai statisztikai alapok

I. Valószínűségelméleti és matematikai statisztikai alapok I. Valószíűségelmélet és matematka statsztka alapok. A szükséges valószíűségelmélet és matematka statsztka alapsmeretek összefoglalása Az alkalmazott statsztka módszerek tárgalása, amel e kötet célja,

Részletesebben

Matematika I. 9. előadás

Matematika I. 9. előadás Matematika I. 9. előadás Valós számsorozat kovergeciája +-hez ill. --hez divergáló sorozatok A határérték és a műveletek kapcsolata Valós számsorozatok mootoitása, korlátossága Komplex számsorozatok kovergeciája

Részletesebben

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat. Zavar és mita Zavar (cofoudig): akkor lép fel egy kísérletbe, ha a kísérletet végző em tudja megkülöbözteti az egyes faktorokat. Zavar és mita Zavar (cofoudig): akkor lép fel egy kísérletbe, ha a kísérletet

Részletesebben

Tapasztalati eloszlás. Kumulált gyakorisági sorok. Példa. Értékösszegsor. Grafikus ábrázolás

Tapasztalati eloszlás. Kumulált gyakorisági sorok. Példa. Értékösszegsor. Grafikus ábrázolás Matemata statszta elıadás III. éves elemzı szaosoa 009/00. élév. elıadás Tapasztalat eloszlás Mde meggyeléshez (,,, ) / súlyt redel. Valószíőségeloszlás! Mtaátlag éppe ee az eloszlása a várható értée.

Részletesebben