Pénzügyi idôsorok hiányzó adatainak kezelése afrikai devizaárfolyamok példáján*
|
|
- Csaba Bognár
- 8 évvel ezelőtt
- Látták:
Átírás
1 Pénzügyi idôsorok hiányzó adatainak kezelése afrikai devizaárfolyamok példáján* Sávai Marianna, a Szegedi Tudományegyetem PhD-hallgatója savai.marianna@eco.uszeged.hu Kiss Gábor Dávid, a Szegedi Tudományegyetem egyetemi adjunktusa kiss.gabor.david@eco.uszeged.hu A tanulmány célja a pénzügyi idősorokban megjelenő adathiányok kezelésére alkalmazott főbb eljárások összehasonlítása, azok momentumokra, volatilitásmodellezésre és value-at-risk jelzésekre gyakorolt hatásain keresztül. Tekintettel arra, hogy a hiányzó adatok kezelését elsősorban kérdőíves lekérdezésekből származó adathiányok esetében tárgyalja a szakirodalom, szükséges a pénzügyi idősorokon történő összehasonlításuk. A szerzők a listaszerű adattörlést, átlaggal pótlást és a likelihood-becsléseken alapuló általános várakozásmaximalizációs eljárásokat hasonlítják össze napi záró devizás idősorokon. A vizsgált minta az afrikai lebegő devizákat tartalmazza 000. március 8. és 015. március 6. között dollárban denominálva, kiegészítve az euróval és az ahhoz kötött CFA frankkal. Az elvégzett számítások eredményei alapján az EM-eljárás alkalmazását nem javasolják, annak a volatilitásra, korrelációra és extrém elmozdulásokra gyakorolt hatásai miatt. TÁRGYSZÓ: Hiányzó adat. Idősor. DOI: /stat hu0736 * A szerzők köszönetet mondanak a Pallas Athéné Domus Scientiae Alapítványnak a pénzügyi támogatásért, amely hozzájárult a tanulmány elkészüléséhez.
2 Sávai Kiss: Pénzügyi idôsorok hiányzó adatainak kezelése 737 A többváltozós idősorok elemzése során szinkronizált és folytonos adatokra van szükségünk azaz minden kereskedési nap és vizsgált piaci eszköz esetében rendelkeznünk kell egy árfolyammal. Mindazonáltal lehetnek olyan speciális alkalmak, amikor egy vagy több adat hiányzik a kereskedési aktivitás hiánya miatt. Tanulmányunkban a hiányzó adatok pótlására alkalmazott főbb módszerek GARCH- (generalized autoregressive conditional heteroskedasticity általánosított autoregresszív feltételes heteroszkedaszticitás), VaR- (value at risk kockáztatott érték) eljárások paramétereire gyakorolt hatását hasonlítjuk össze, különösképpen kitérve a volatilitás perzisztenciájára és aszimmetriájára, valamint az eredeti és javított idősorok momentumaira. 1 A hiányzó adat (vagy hiányzó érték) definíciója a következő: azon adatok összessége, melyek nem találhatók meg a vizsgálatra kiválasztott mintában (Kang [013] 40. old.). Adathiány az adatgeneráló-folyamat átmeneti felfüggesztése miatt jön létre idősorok esetében (Graham [01]), melyek kapcsán komoly elvárásokat szokás megfogalmazni: a hiányzó adatok kezelésekor sem illik torzítani az ARIMA- (autoregressive integrated moving average autoregresszív integrált mozgóátlagfolyamat) és GARCH-paramétereket, rontani a reprezentativitást vagy az átlag, szórás értékét és az autokorreláltság fokát (Juan Carlos et al. [010], Kang [013]). Munkánk fő hozzáadott értéke a napi felbontású, pénzügyi idősorok hiányzó adatainak kezelése során alkalmazott főbb eljárások (a listaszerű vagy páronkénti törlés, átlaggal vagy a rendelkezésre álló historikus mediánnal történő pótlás és a likelihood-alapú várakozásmaximalizáció) összehasonlítása, miután a szakirodalom elsősorban a kérdőív típusú hiányzó adatok problémájának kezelését tárgyalja. A vizsgált mintát az afrikai az IMF [013] besorolása szerinti lebegő árfolyam-politikát folytató országok devizái adják: a kenyai shilling (KES), a ghánai cedi (GHS), a dél-afrikai rand (ZAR), a tanzániai shilling (TZS), ugandai új shilling (UGX), gambiai dalasi (GMD), madagaszkári ariary (MGA) és mozambiki metical (MZN) fizetőeszközök, amerikai dollárban kifejezve. Kontrollcsoportként a CEMAC (Commission of the Economic and Monetary Community of Central Africa Középafrikai Gazdasági és Monetáris Közösség) által alkalmazott, euróhoz rögzített CFA frank 1 (XAF) is a mintába került, valamint a devizák közötti korreláció teszteléséhez az EUR/USD árfolyamot is elemeztük. Vizsgálatunk a Bloomberg adatbázisából 1 Az adathiány kezelése nem kizárólag a pénzügyi idősorokra vonatkozik, nemzetközi folyamatok összehasonlítására is alkalmas lehet, ahol nagyon gyakran az adathiány miatt kell egy-egy országot vagy változót kihagyni az elemzésből (lásd például Udvari Urbánné [015] vagy Udvari Pontet [015]). Közép-afrikai valutaközösségi frank (Csád, Egyenlítői Guinea, Gabon, Kamerun, Kongó, Közép-afrikai Köztársaság).
3 738 Sávai Marianna Kiss Gábor Dávid letöltött, 000. március 8. és 015. március 6. közötti időszak napi záró adatain alapszik. A mintaválasztást az idősorok egzotikus jellege indokolja, amellett, hogy e gazdaságok strukturális gyengesége miatt a pénz- és tőkepiaci idősorokra hagyományosan jellemző, eltérő nemzeti ünnepek miatti kereskedési szünnapok mellett, további kereskedési szüneteket is találhatunk. Tanulmányunk felépítése: az első fejezetben foglaljuk össze a hiányzó adatokkal kapcsolatos elméleti feltételezéseket, rámutatva a kérdőíves és idősoros adatok közötti különbségekre. Ezt követi a kezelésükre kidolgozott főbb eljárások bemutatása a módszertani második fejezetben, valamint az eredmények összehasonlítására szolgáló GARCH- és DCC-GARCH- (dynamic conditional correlation dinamikus feltételes korreláció) modellek és az alapértelmezett VaR-eljárás ismertetése. A harmadik fejezetben előbb bemutatjuk a nyers, szinkronizálatlan devizás idősorok tulajdonságait, majd összevetjük őket a szinkronizált, hiányzó adatoktól megtisztított idősorok teszteredményeivel. 1. Elméleti háttér A pénzügyi idősorok, különösen a napi záróárfolyamok esetében előfordul adathiány a kereskedési adatokban, hiszen egyes piacok zárva tarthatnak, míg a többi piacon javában zajlik a kereskedés. Ez egy érdekes többváltozós jelenség. A kereskedés hiánya egyrészt a nemzeti sajátosságokra vezethető vissza (például az ünnepekre, a szombati munkavégzésre), másrészt a piaci erők okozta alacsonyforgalmú helyzetekre (ez leggyakrabban a kis tőzsdecégek részvényeivel 3 fordul elő), továbbá az árak hirtelen összeomlása miatti felfüggesztésre. Óriási irodalma van az árképzést és a piaci hatékonyságot aláásó jelenségeknek, amelyek közül a legtöbbet idézett a hétvégehatás (weekend effect) (Keim Stambaugh [1984], Robins Smith [015], Shahid Mehmood [015]). A szakirodalom három típusát különbözteti meg az adathiánynak (Graham [01], Junger Leon [015], Oravecz [008]): MCAR (missing completely at random teljesen véletlenszerű adathiány): az adathiány nem függ az adatok vagy más, különösen a megfigyelt változó értékeitől. Kihagyásuk nem torzítja a becslésünket a homogenitásuk miatt (Enders [010], Junger Leon [015], Kang [013]). MAR (missing at random véletlenszerű adathiány): a hiányzás attól a változótól független, amely adatsorában felmerül (Kang 3 Erről a jelenségről bővebben ír például Giovanni [005].
4 Pénzügyi idôsorok hiányzó adatainak kezelése 739 [013]), de valamilyen mechanizmust feltételezhetünk a hiányzás mögött (Graham [01]). Kihagyásuk károsíthatja az olyan időbeli struktúrákat, mint az autokorreláció, a trendek vagy a szezonalitás (Junger Leon [015]). MNAR (missing no at random nem véletlenszerű adathiány) akkor következik be, ha a hiány nem független az azt tartalmazó változótól (Oravecz [008]), de amikor lehetséges, akkor torzítatlan becslést illeszthetünk a hiányzó adatokra (Graham [01]). Előfordul, hogy az adathiányt a kutató nem tudja kezelni, mert az eloszlása ismeretlen, a MAR esetén csak feltételezéssel lehet élni (Graham [01]). A következőkben három különféle adathiány kezelésére használható, Baraldi et al. [015] által is leírt gyakorlatot mutatunk be. Az első, az adathiányt tartalmazó esetek listaszerű vagy páronkénti törlése, amikor eltávolítjuk azokat az intervallumokat, ahol legalább egy hiányzó adatunk van. A törlés az idősor töredezettségét okozhatja vagy torzítottá válhat a paraméter becslése, ezért csak MCAR-adathiánynál alkalmazható (Kang [013]). A második, az adathiány átlaggal vagy a rendelkezésre álló historikus mediánnal történő pótlása, amit Junger Leon [015] is javasol aszimmetrikus adatoknál. Ennek a módszernek is hasonló hatása lehet, mint az előzőnek a logaritmikus hozamokra, melynek idősora zéró átlagú és móduszú. Ezt a megoldást Graham [01] nem javasolja az MCAR-adathiány esetén, az eloszlások magasabb átlag körüli koncentrációja, valamint a standard hibák és variancia alulbecslése miatt (Junger Leon [015], Enders [010]). A harmadik és egyben legmodernebb eljárás, amikor a hiányzó adatokat megpróbálják rekonstruálni, minimalizálva a hibafüggvényt, a szórás deriválásával vagy valószínűségi hányadossal (Baraldi et al. [015], Ceylan et al. [013], Juan Carlos [010]). Az EM- (expectation maximization várakozásmaximalizáció) modellek közül a leggyakrabban alkalmazott a maximum likelihood becslés, de neurális hálózatokra építő és genetikus struktúrán alapuló megközelítések is elterjedtek (Ceylan et al. [013], Juan Carlos [010]). Az EM-eljárások hátránya, hogy alkalmazásuk több időt vehet igénybe, mert az algoritmusuk és a likelihood függvény nehezen számítható ki (Ruud [1991]), valamint szükség lehet további adatgeneráló modellre is (Horari et al. [013]). Az EM-eljárások nem okoznak problémát MCAR-adathiány esetén, ilyenkor jól használhatók az EM eljárások. A legjobb választási lehetőség a maximum likelihood becslés a hiányos többváltozós normális eloszlású adatok kezelésére, ugyanis ezek az eljárások kevésbé torzítanak, mint az adathiány törlése vagy az átlaggal való pótlás. A maximum likelihood alkalmazhatósága a többi eljáráshoz képest függ a hiányzó adatok arányától, a mintanagyságtól és adatstruktúra kovarianciájától (Wothke [1998]). A hiányzó adatok miatti problémák befolyásolhatják olyan, a napi idősorokon történő többváltozós alkalmazások használatát, mint a volatilitás tovagyűrűzését, az
5 740 Sávai Marianna Kiss Gábor Dávid extrém ingadozások, illetve fertőzések modellezését, ahol a feltételes varianciáról, a kovarianciáról és a korrelációról azt feltételezzük, hogy a vizsgálat szempontjából döntő jelentőségűek.. Módszertan A tanulmány három különféle adathiányt kezelő módszert hasonlít össze a legfontosabb centrális momentumok, az autokorreláció, a volatilitás tartóssága és az extrém elmozdulások alapján. Tegyük fel, hogy a vizsgált n külföldi deviza közül kiválasztott i-edik deviza 1 i n árfolyamából vett P i minta /1/ minden y kereskedési napon v mintamérettel a következők szerint írható le: P i y p yν p 1 i, 1 i, ν. /1/ Emellett kiválasztunk még egy másik k-adik 1 k n és k i devizát is // w minta és z z y időindexszel: P k z p zw p 1 k, 1 k, w. // A minta mérete rendre megegyezik a kereskedési napok számával. Amennyiben az előbbiek alapján leírható P 1,, i, k,, n mátrixokat egyesíteni kell egy többváltozós elemzés céljából, akkor az időindexek összehangolására (szinkronizálására) van szükségünk, ami az Y és Z oszlopvektorok közötti közös és a diszjunkt halmazok elemeinek kezelését jelenti. A listaszerű adattörlésnél /3/ kizárunk minden olyan esetet, amikor legalább egy érték hiányzik ez az Y és Z halmazok közös metszetét (T) jelenti: T Y Z. /3/ Az átlaggal való pótlás /4/ alkalmazása különösen abból a szempontból praktikus, mert a logaritmikus hozamok jellemzően nulla közeli átlaggal és módusszal rendel-
6 Pénzügyi idôsorok hiányzó adatainak kezelése 741 keznek. Az LOCF- (last observation carried forward utolsó elvégzett megfigyelés értékelése) módszer alkalmazása szintén erre az eredményre vezet, nulla logaritmikus hozamot produkálva (feltételezve, hogy az o időindexnél hiányzik az adat, míg az o 1 esetében van). 4 T Y Z, pi, o pi, o 1 és T Y Z, illetve ri, o pi, o pi, o 1. /4/ Az általános EM-algoritmus alapja egy iterált lineáris regressziós elemzés, de ezt helyettesítettük egy gauss eloszlású regressziós paraméter feltételes maximum likelihood becslésével /5/ Schneider [001] tanulmánya alapján. Egyes pt, i P hiányzó értékkel rendelkező mátrix esetén, a hiányzó (kereskedési napok) és a rendelkezésre álló értékekkel megadott árak közötti kapcsolatra lineáris regressziós modell írható fel: p μ p μ B ε, /5/ NaN NaN a a n n a NaN ahol a a meglevő adatot jelenti, B pedig a regressziós együtthatók mátrixa a hiányzó és meglevő értékek kovarianciamátrixával, az n számú összes mintából. Az nnan nnan 1 nnan ε reziduumról feltételezzük, hogy nulla átlagú és C egy ismeretlen kovarianciamátrix-vektor. Az EM-algoritmus iterációiban a 1 n μ átlagát és a n n Σ kovarianciamátrix becslését adottnak tekintjük, és ezek becsléséből számoljuk ki a B mátrix regressziós együtthatóira és a C kovarianciamátrix reziduumaira vonatkozó feltételes maximum likelihood becsléseket minden hiányzó értéket tartalmazó bejegyzésre. Mindezt úgy, hogy az algoritmus minden hiányzó érték helyére imputált értéket helyettesítsen a teljes μ vektor és Σ mátrix újraszámítását megelőzően. Ezek alapján a becsült regressziós együttható két (hiányzó-hiányzó és meglevő-hiányzó) becsült kovarianciamátrixból adódik: 1 aa B, amely a reziduum kovarianciamátrixának becslésére használható anan a későbbiekben. Azonban, az általános EM-algoritmus minden hiányzó értékkel 4 Könnyen belátható, hogy nulla várható érték mellett az átlaggal való pótlás és az LOSCF-eljárás azonos eredményre vezet, amennyiben a javított idősornak a továbbiakban az r i, o differenciáltjaival számolunk: ri, o pi, o pi, o 1 a pi, o pi, o 1 esetben ri, o 0 eredménnyel zárul. Logaritmikus hozamoknál ellenben x problémákba ütközünk, hiszen e 0, ami miatt érdemes egy kellően kicsi, ekkor r p p ε ε p p ε i, o i, o 1 ln ln 0 lesz az eredmény. i, o i, o i, o 1 6 ε 10 számmal kiegészíteni:
7 74 Sávai Marianna Kiss Gábor Dávid rendelkező bejegyzés esetén a 1 B h Diag becslést használ- aa aa anan ja, ahol a h szabályozó paraméter a diagonális elemeket 1 h tényezővel bővíti. Az említett eljárásokkal szinkronizált többváltozós idősorokon végrehajtott érzékenységvizsgálat a modellben szereplő bizonytalan input torzításának, a középértékek, az autokorreláció vizsgálatát érinti, valamint meghatározza az adathiány százalékos súlyát a mintában (Kang [013], Graham [01]). A varianciamodellre hatással lehet az adathiány, a modellválasztás és a paraméterek torzítása. Különféle GARCH-modelleket illesztettünk az adatokra a volatilitás tartósságának vizsgálatához, követve Cappeiello Engle Sheppard [006] munkájában leírtakat. Az alkalmazott (/6/ /10/) modellek hasznosak a volatilitás és időbeli csoportosulásának (a heteroszkedaszticitás) megragadásához. GARCH (p, q): p q t i t i i t j i 1 j 1 σ ω α ε β σ, /6/ ahol σ t a jelenbeli variancia, ω a konstans tényező, p a késleltetés száma az t 1 α i σ t j paraméterű ε innovációnak, valamint q a késleltetés száma a β i paraméterű varianciának a volatilitás tartósságának kimutatásához. Aszimmetrikus GARCHmodellek alapján: St i 1, ha εt i 0 St i 0, ha εt i 0 /7/ egy jelzés a csökkenő hozamokra adott aszimmetrikus reakciókra. GJR- (Glosten Jagannathan Runkle) GARCH (p, o, q): p o q t i t i i t i t i i t j i 1 i 1 j 1 σ ω α ε γ S ε β σ. /8/ TGARCH (p, o, q) (threshold GARCH küszöb GARCH): p o q t i t i i t i t i i t j i 1 i 1 j 1 σ ω α ε γ S ε β σ. /9/
8 Pénzügyi idôsorok hiányzó adatainak kezelése 743 APARCH (p, o, q) (asymmetric power ARCH aszimmetrikus teljesítmény ARCH): ahol 0 i p δ q δ δ t i t i i t i j t j i 1 j 1 σ ω α ε γ ε β σ, /10/ α i 1,, p, γi αi 0 i 1,, o, βi 0 i 1,, q 0,5 1 i 1,, p; j 1,, o; k 1,, q α γ β i i k, és δ index paraméter 1 és közötti értéket vehet fel. A modellválasztás során a homoszkedasztikus hibatagokra koncentráltunk (-vel késleltetett ARCH LM-tesztet futtattunk), és megkerestük a legalacsonyabb BIC-cel (Bayesian information criterion Bayes-féle információs kritérium) rendelkezőt. Engle [00] alapján tanulmányunk a GARCH-alapú DCC-modellt 5 alkalmazza a kiválasztott piacok napi együttmozgásának vizsgálatára. A hiányzó értékek hatással vannak az adatokból számolt logaritmikus hozamok sűrűségfüggvényére, a listaszerű adattörlés feltételezhetően több adatot eredményezhet az eloszlás szélein a csonkított idősor esetében, míg az átlaggal történő imputáció növeli a 0 elmozdulás gyakoriságát a kiegészített idősornál. Az EM-nek az átlag és az extrém értékek közötti adatokat kellene produkálnia. Az adatok extrém ingadozását közönséges VaR-modellel /11/ vizsgáltuk, ahol az extrém adatok súlya és a nem extrém adatok kurtózisa volt a változó. n x x r r r r, x x r μ 1,65 σ, r μ 1,65 σ, /11/ ahol r a logaritmikus hozam, μ a feltétel nélküli átlag, σ a feltétel nélküli szórás, r x jelzi az extrém negatív, r x az extrém pozitív hozamokat és r n mutatja a nem extrém adatok részhalmazát (Madura [008]). A DCC-GARCH-modell definíciója Engle [00] alapján: ahol 1 t t t, t t t, t t t t r μ α α H z H D R D, 1 1 T t t t, 1 t t t 1 t 1 t 1 R Q Q Q Q a b Q aε ε bq, /1/ r t a hozamok logaritmusát, α t a korrigált hozamot jelöli E α t 0 és Cov α t Ht, μ t a várható értéke a feltételes r t -nek, feltételes varianciamátrixa, H t az α t 1 H t adódik a Cholesky-felbontás után, D t feltételes 5 A becslés a Kevin Sheppard által fejlesztett Oxford MFE- és UCSD-toolboxokon alapul:
9 Sávai Marianna Kiss Gábor Dávid R t feltételes korrelációs mátrixnak, z t a független azonos eloszlású hiba- szórása az tagok vektora, Q t feltétel nélküli kovarianciamátrixa a standardizált ε t hibatagnak (Cappeiello et al. [006]). A tanulmányunk a három modellt a következő alapján vizsgálja: eltérés a nyers és finomított adatok között, középértékek, autokorreláció, heteroszkedaszticitás, normális eloszlás, gyenge stacionaritás, GARCH-modell és paraméterválasztás, VaR-súlyok és kurtózis, valamint a dinamikus feltételes korreláció eredményeit hasonlítjuk össze. 3. Eredmények és adatok A nyers, szinkronizálatlan idősorok statisztikáit, valamint a szinkronizálás és a háromféle hiányzóadat kezelési eljárás nyomán kapott eredményeket hasonlítjuk össze ebben a fejezetben, bemutatva a pénzügyi idősorok vizsgálatára használt GARCH-, DCC-GARCH- és VaR-modellek hiányzó adatpótlási eljárásokkal szembeni érzékenységét Eredeti idősor, egyváltozós tesztek Az ábrán látható, hogy az euróhoz rögzített XAF szorosan követte e kulcsvaluta dollárral szembeni erősödését, majd 008-at követő oldalazását. Emellett a KES és a ZAR értékelődött fel a subprime-válság (jelzáloghitel-válság) 008-as kiéleződése előtt. Ezeket az eseteket leszámítva a minta többi részére a leértékelődés volt jellemző. A mintában szereplő afrikai devizák heti árfolyamának változása a bázishoz képest 000 és 015 között (000. március 14. = 100%) Százalék 00% 150% 100% 50% 0% 0 év, hónap, nap KES/USD GHS/USD ZAR/USD TZS/USD UGX/USD XAF/USD GMD/USD MGA/USD MZN/USD EUR/USD Forrás: Bloomberg.
10 Pénzügyi idôsorok hiányzó adatainak kezelése 745 A nyers idősor logaritmikus hozamai nulla átlaggal és alacsony szórással rendelkeztek, míg szimmetria csupán az EUR és a GMD esetében valósult meg. (Lásd az 1. táblázatot.) Kiugró csúcsosság volt jellemző a mintára, ami a normális eloszlásnál az elvárthoz képest több extrém árfolyamváltozást jelzett csupán a rögzített XAF-nál és az EUR-nál találtunk ideális, háromhoz közeli értékeket. A normális eloszlás hipotézisét valamennyi deviza esetében elvetettük, míg két késleltetés mellett a minta jelentős hányadára az autokorreláltság (kivéve az EUR-t) és a heteroszkedaszticitás (kivéve a KES-t, a ZAR-t és az EUR-t) volt jellemző. Az adatok gyenge stacionaritást mutattak. Az egyváltozós idősorok leíró és alapstatisztikái 1. táblázat Átlag Szórás Aszimmetria Csúcsosság Normális eloszlás Jarque Bera (p) Autokorreláció Ljung Box (p) Heteroszkedaszticitás ARCH-LM (p) Stacionaritás ADF (p) KES/USD 0,00 0,01 0,3 0,51 0,00 0,00 0,10** 0,00 GHS/USD 0,00 0,01 1,3 33,77 0,00 0,00 0,00 0,00 ZAR/USD 0,00 0,01 1,05 15,74 0,00 0,01 0,14** 0,00 TZS/USD 0,00 0,01 0,8 39,78 0,00 0,00 0,00 0,00 UGX/USD 0,00 0,01 0,47 16,76 0,00 0,00 0,0 0,00 XAF/USD 0,00 0,01 0,13 5,14 0,00 0,00 0,00 0,00 GMD/USD 0,00 0,0 0,05 169,41 0,00 0,00 0,03 0,00 MGA/USD 0,00 0,01 1,63 54,41 0,00 0,00 0,00 0,00 MZN/USD 0,00 0,01 0,80 4,11 0,00 0,00 0,00 0,00 EUR/USD 0,00 0,01 0,0 4,39 0,00 0,5* 0,59** 0,00 * Nem autokorrelált késleltetés mellett. ** Homoszkedasztikus késleltetés mellett. Forrás: Saját számítás a Kevin Sheppard-féle MFE-toolbox segítségével. Négy különböző (GARCH-, TARCH-, GJR-GARCH-, APARCH-) modell 13 különböző késleltetése mellett vizsgáltuk az idősorokat, keresve azt az eljárást, amely homoszkedasztikus hibatagokat eredményez abszolút értékben a legalacsonyabb BIC mellett. A minta felére az aszimmetrikus varianciát leíró modellek illeszkedtek jól (kivéve a GHS-t, a TZS-t, az UGX-t, az EUR-t), továbbá megjelent a volatilitás perzisztenciája (az 1-hez közeli béták). Sajátos eredményre jutottunk a GMD esetében, ahol az innovációk (vagy sokkok) kaptak komolyabb súlyozást. (Lásd a. táblázatot.)
11 746 Sávai Marianna Kiss Gábor Dávid GARCH-modellek az egyváltozós idősorokon. táblázat Modell ω α 1 α γ β 1 β paraméter BIC- KES/USD TARCH(1,1,) 0,00 0,6 0,03 0,46 0,9 4,0 GHS/USD GARCH(1,) 0,00 0,11 0,37 0,51 3,70 ZAR/USD GJR-GARCH(1,1,1) 0,00 0,1 0,10 0,93 3,1 TZS/USD GARCH(1,1) 0,00 0,1 0,79 3,91 UGX/USD GARCH(1,1) 0,00 0,0 0,80 3,8 XAF/USD* GMD/USD TARCH(,1,1) 0,00 0,30 0,30 0,16 0,48,81 MGA/USD GJR-GARCH(1,1,) 0,00 0,0 0,03 0,47 0,49 3,18 MZN/USD GJR-GARCH(1,1,) 0,00 0,6 0,11 0,9 0,51 3,3 EUR/USD GARCH(1,1) 0,00 0,04 0,96 3,71 * Egy modell sem volt képes normális eloszlású homoszkedasztikus hibatagok létrehozására. Forrás: Saját számítás a Kevin Sheppard-féle UCSD-toolbox segítségével. VaR segítségével lehetőség nyílt arra, hogy az extrém elmozdulások leválogatásával létrehozott csonka idősor csúcsossága 5 alá, jellemzően 3 közelébe csökkenjen. (Lásd a 3. táblázatot.) Az extrém árfolyammozgások súlya 10 százalék alatti (kivéve a XAF-ra és EUR-ra jellemző 11 százalékot), így az eljárás alkalmas volt azon ritka ingadozások kiszűrésére, amelyek az idősor vastag farkúságáért felelnek. VaR-tulajdonságok az egyváltozós idősorokon 3. táblázat Mutató KES GHS ZAR TZS UGX XAF GMD MGA MZN EUR Átlag 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 Szórás 0,00 0,01 0,01 0,00 0,00 0,00 0,01 0,01 0,01 0,00 Aszimmetria 0,07 0,14 0,04 0,0 0,0 0,0 0,04 0,04 0,05 0,01 Csúcsosság 3,48 4,34,51 3,16,84,5 4,07 3,68 4,4,48 Extrém hozam ( ) küszöb 0,01 0,0 0,0 0,01 0,01 0,01 0,03 0,0 0,0 0,01 Extrém hozam (+) küszöb 0,01 0,0 0,0 0,01 0,01 0,01 0,03 0,0 0,0 0,01 Extrém hozam ( ) (db) Extrém hozam (+) (db) Nem extrém hozam (db) Forrás: Saját számítás Madura [008] nyomán.
12 Pénzügyi idôsorok hiányzó adatainak kezelése Eljárások összehasonlítása A hiányzások természetének jobb megértéséhez előbb teszteltük a két hiányzó adat felbukkanása között eltelt kereskedési napok számának normális eloszlását, illetve a hiányzó adatok mintabeli súlyát. A 4. táblázatban látható, hogy leginkább az MGA, illetve a GMD, a GHS és az XAF volt terhelt hiányzó adatokkal, továbbá a legkevésbé kíméletesnek a listaszerű törlés bizonyult a magasabb hiányzó százalékos értékeivel. Az adatok hiánya azonban nem véletlenszerűen jelenik meg, miután az adathiányok között eltelt idő adott devizán belül nem követ normális eloszlást. A hiányok létrejöttének időbeli eloszlása tehát nem a véletlentől függ, hanem egyéb gazdasági hatásoktól (ünnepnapoktól, piaci viszonyoktól). A hiányzó adatok százalékos aránya és a közöttük eltelt idő normális eloszlásának tesztelése 4. táblázat Adathiány százalékos súlya (százalék) Listaszerű adattörlés Átlaggal pótlás Hiányzó adatok között eltelt idő normális eloszlása Kolmogorov Smirmov-teszt (p) KES/USD 1 1 0,00 GHS/USD 3 0,00 ZAR/USD 0 0 nincs adat TZS/USD 0,00 UGX/USD 0,00 XAF/USD 3 0,00 GMD/USD 4 3 0,00 MGA/USD 9 8 0,00 MZN/USD 0,00 EUR/USD 0 0 nincs adat Forrás: Saját számítás. A Függelék F1. táblázata tartalmazza a háromféle megközelítéssel kezelt idősorok logaritmikus differenciáltjainak momentumait, a normális eloszlásának, az autokorreláltságnak és heteroszkedasztikusságnak és gyenge stacionaritásnak tesztjeit. Az első momentum nullához közeli maradt az eredeti idősorokhoz hasonlóan, azonban a szórás megduplázódott-triplázódott az esetek 60 százalékában az EMeljárásnál. Az idősorok aszimmetriájának jellegét mindegyik módszer befolyásolta. A csúcsosság az esetek 40, illetve 50 százalékában nőtt a listaszerű adattörlés és
13 748 Sávai Marianna Kiss Gábor Dávid átlaggal pótlás mellett, míg akár nagyságrendi ugrásokat is mutatott az EM-eljárás mellett. A logaritmikus hozamok továbbra sem voltak normál eloszlásúak, viszont gyengén stacionerek igen, továbbá nem volt érdemi változás sem autokorreláltságuk, sem heteroszkedaszticitásuk tekintetében. A VaR-eljárás esetében (lásd az F. táblázatot) hasonló eredményre jutottunk, mint a csúcsosságnál: az első két eljárás nem mutatott érdemi változásokat, ellenben az EM-et tekintve a VaR kevesebb extrém mozgást jelzett, míg a nem extrém halmaz kurtózisa az esetek 80 százalékában megnőtt (kivéve a ZAR-nál és az EUR-nál). Az EM-eljárás alatt, a hiányzó adatok pótlása során a többváltozós idősor kovariancia-mátrixának stabilizálására tett lépések ezek szerint torzíthatják a feltétel nélküli szórás értékét. A listaszerű adattörlés a volatilitás modelljeinél (lásd az F3. táblázatot) csekély változást idézett elő a paraméterek körében (az innovációs paraméterek kismértékben növekedtek, a múltbéli volatilitás paraméterei csökkentek), és csupán az MGA és MZN devizáknál javasolt más modell kiválasztása, amellett, hogy ezúttal már volt olyan GARCH-modell, amely homoszkedasztikus hibatagokat eredményezett az XAF esetében. Az átlaggal pótlás módszere az egyébként is aszimmetrikus volatilitású MGN és GHS devizákra az APARCH-modellt illesztette, emellett a GHS szimmetrikusból aszimmetrikus volatilitásúvá vált. A volatilitás paraméterei úgy mutattak emelkedést, hogy közben a BIC-értékek változatlanok maradtak. Az EMeljárás átrendezte a korábbi, volatilitás szimmetriájával vagy épp aszimmetriájával kapcsolatos elképzeléseket, négy deviza (a KES, a GHS, a TZS, az UGX) vált szimmetrikusból aszimmetrikussá, míg három (a GMD, az MGA, az MZN) aszimmetrikusból szimmetrikus lett. A deviza árfolyamának csökkenése és a volatilitás növekedése közötti kapcsolatról alkotott képet tehát nagyban befolyásolta a hiányzó adatok kezelésére alkalmazott eljárás. Mindezt úgy, hogy az EM mellett kapott optimális GARCH BIC-értékek abszolút értékben alacsonyabbak a másik két eljárásénál, tehát jobban illeszkedő modellekkel van dolgunk. A ZAR és az EUR volatilitás-modelljei annak ellenére, hogy a listaszerű törlés miatt rengeteg adatot veszítettek (és emiatt töredezettebbek lettek), nem változtak érdemben, míg az egyébként számos hiányzó nappal terhelt GMD és MGA GARCH-modelljei és azok paraméterezése az adatkezelési eljárások függvényében alakultak. Dacára az Európai Unió és az Egyesült Államok által a mintaországok számára nyújtott számos külkereskedelmi, segélyezési és egyéb, fizetési mérleg javítását is magában foglaló, programjának (Udvari Pontet [015]), a listaszerű adattörléssel és átlaggal pótlással szinkronizált többváltozós idősorok korrelálatlanok voltak az EUR/USD árfolyamával szemben leszámítva a feltörekvő ZAR és a rögzített XAF esetét. (Lásd az F4. táblázatot.) A devizák izoláltságát jelzi, hogy a mintából csak a ZAR és az XAF mutatott szorosabb feltétel nélküli korrelációt. Ehhez képest az EMeljárás esetében számos, komolyabb feltétel nélküli együttmozgást sejtető eredmény-
14 Pénzügyi idôsorok hiányzó adatainak kezelése 749 re juthatunk, ilyen a GHS és az UGX között mért 0,64-es, valamint a GHS és a KES, a TZS, a GMD, az MGA és az MZN között tapasztalt 0,3 0,5 közötti értékek, amihez hasonlóakat találunk még az UGX KES, a TZS UGX, a GMD MZN párok esetében is. Az idősorok időbeli változásának lehetősége miatt teszteltük az idősor dinamikus feltételes korrelációját (DCC-GARCH) is, ahol ismét csupán a ZAR és az XAF mutatott valamiféle együttmozgást. (Lásd az 5. táblázatot.) Bár a listaszerű adattörlés mellett magasabbnak tűnik az átlagos feltételes korreláció, kétmintás t- próbával csupán a ZAR/USD EUR/USD páros esetében találni szignifikáns különbséget az átlaggal pótláshoz és EM-hez képest (p = 0,55 mellett, míg a többi esetben p = 0,00 volt az eredmény). Az afrikai devizák EUR/USD-vel szembeni dinamikus feltételes korrelációinak momentumai Listaszerű adattörlés Átlaggal pótlás EM-modell 5. táblázat momentum KES/USD 0,0451 0,0489 0,1880,335 0,0357 0,0459 0,5519,6715 0,0147 0,0354 1,180 3,4391 GHS/USD 0,0010 0,0166 0,0417 6,9048 0,0055 0,0094 0,1457 8,0598 0,094 0,0157 0,703,311 ZAR/USD 0,490 0,1775 0,6407 3,4664 0,4119 0,1711 0,4950,959 0,4119 0,1711 0,4950,959 TZS/USD 0,0037 0,016 0, ,784 0,0351 0,0088 0,3345 1,98 0,0059 0,003 13, ,9501 UGX/USD 0,0384 0,014 0,45 4,8841 0,0569 0,0167 0,014 1,715 0,0343 0,08 0,4147 3,8064 XAF/USD 0,8373 0,1755 1,373 4,668 0,7686 0,313 1,415 5,3184 0,764 0,403 1,4034 5,0187 GMD/USD 0,031 0,0151 0,5513,1798 0,096 0,0156 0,5877,86 0,0060 0,0073 0,718 0,5067 MGA/USD 0,0634 0,03 0,1573,735 0,0531 0,014 0,037,5063 0,0558 0,0117 0,5373,1534 MZN/USD 0,0054 0,0191 0,1388,190 0,0055 0,0390 0,8071,6819 0,0187 0,0350 0,9365 3,1454 Forrás: Saját szerkesztés. 4. Összefoglalás A likelihood-becsléseken alapuló általános várakozásmaximalizációs modellek kifejezetten népszerűnek számítanak napjainkban a kérdőívtípusú vizsgálatok hiányzó adatainak kezelése során, szerves részét képezve a leginkább elterjedt statisztikai programoknak (például az SPSS-nek). Mindazonáltal a pénzügyi idősorok esetében célszerűbb megmaradni az ott egyébként is előszeretettel alkalmazott listaszerű adat-
15 750 Sávai Marianna Kiss Gábor Dávid törlés vagy átlaggal pótlás eljárásainál, amennyiben a vizsgált idősorokban tömegesen megjelenik az adathiány. Ezek segítségével ugyanis kevésbé módosulnak a második és negyedik momentumok, vagy csökkennek a VaR-jelzések, továbbá a negatív logaritmikus hozamok is kevésbé hajlamosak a volatilitás növekedését okozni. A piacok, illetve eszközök közötti fertőzések vizsgálata során pedig további torzításokat kerülhetünk el általuk. Függelék A többváltozós idősorok leíró és alapstatisztikái F1. táblázat Átlag Szórás Aszimmetria Csúcsosság Normális eloszlás Jarque Bera (p) Autokorreláció Ljung Box (p) Heteroszkedaszticitás ARCH-LM (p) Stacionaritás ADF (p) Listaszerű adattörlés KES/USD 0,00 0,01 0,8 18,60 0,00 0,00 0,08 0,00 GHS/USD 0,00 0,01 1,78 39,88 0,00 0,00 0,00 0,00 ZAR/USD 0,00 0,01 1,07 17,89 0,00 0, 0,50 0,00 TZS/USD 0,00 0,01 0,87 30,73 0,00 0,00 0,00 0,00 UGX/USD 0,00 0,01 0,46 16,63 0,00 0,00 0,07 0,00 XAF/USD 0,00 0,01 0,06 5,08 0,00 0,00 0,00 0,00 GMD/USD 0,00 0,0 0,03 169,73 0,00 0,00 0,03 0,00 MGA/USD 0,00 0,01 1,77 58,07 0,00 0,00 0,00 0,00 MZN/USD 0,00 0,01 0,9 49,84 0,00 0,00 0,00 0,00 EUR/USD 0,00 0,01 0,05 4,59 0,00 0,83 0,86 0,00 Átlaggal pótlás KES/USD 0,00 0,01 0,3 0,60 0,00 0,00 0, 0,00 GHS/USD 0,00 0,01 1,5 34,57 0,00 0,00 0,00 0,00 ZAR/USD 0,00 0,01 1,05 15,74 0,00 0,01 0,14 0,00 TZS/USD 0,00 0,01 0,84 40,5 0,00 0,00 0,00 0,00 UGX/USD 0,00 0,01 0,46 16,99 0,00 0,00 0,0 0,00 XAF/USD 0,00 0,01 0,14 5,6 0,00 0,00 0,00 0,00 GMD/USD 0,00 0,0 0,05 174,91 0,00 0,00 0,03 0,00 MGA/USD 0,00 0,01 1,61 57,71 0,00 0,00 0,00 0,00 MZN/USD 0,00 0,01 0,81 43,03 0,00 0,00 0,00 0,00 EUR/USD 0,00 0,01 0,0 4,39 0,00 0,51 0,59 0,00 (A táblázat folytatása a következő oldalon.)
16 Pénzügyi idôsorok hiányzó adatainak kezelése 751 (Folytatás.) Átlag Szórás Aszimmetria Csúcsosság Normális eloszlás Jarque Bera (p) Autokorreláció Ljung Box (p) Heteroszkedaszticitás ARCH-LM (p) Stacionaritás ADF (p) EM-modell KES/USD 0,00 0,01 0,98 181,04 0,00 0,00 0,0 0,00 GHS/USD 0,00 0,03 0,0 358,51 0,00 0,00 0,06 0,00 ZAR/USD 0,00 0,01 1,05 15,74 0,00 0,01 0,14 0,00 TZS/USD 0,00 0,0 0,04 198,98 0,00 0,00 0,00 0,00 UGX/USD 0,00 0,0 0,03 11,75 0,00 0,00 0,00 0,00 XAF/USD 0,00 0,01 0,1 13,08 0,00 0,00 0,00 0,00 GMD/USD 0,00 0,03 0,07 74,16 0,00 0,00 0,00 0,00 MGA/USD 0,00 0,04 0,11 4,16 0,00 0,00 0,00 0,00 MZN/USD 0,00 0,0 0,14 55,40 0,00 0,00 0,00 0,00 EUR/USD 0,00 0,01 0,0 4,39 0,00 0,51 0,59 0,00 Forrás: Itt és a Függelék további táblázatainál saját számítás. A VaR különböző eljárások mellett F. táblázat Mutató KES GHS ZAR TZS UGX XAF GMD MGA MZN EUR Listaszerű adattörlés Átlag 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 Szórás 0,00 0,01 0,01 0,00 0,00 0,01 0,01 0,01 0,01 0,00 Aszimmetria 0,05 0,09 0,06 0,06 0,00 0,0 0,0 0,0 0,0 0,00 Csúcsosság 3,49 4,31,54 3,03,87,5 4,05 3,69 4,0,50 Extrém hozam ( ) küszöb 0,01 0,0 0,0 0,01 0,01 0,01 0,03 0,0 0,0 0,01 Extrém hozam (+) küszöb 0,01 0,0 0,0 0,01 0,01 0,01 0,03 0,0 0,0 0,01 Extrém hozam ( ) (db) Extrém hozam (+) (db) Nem extrém hozam (db) Átlaggal pótlás Átlag 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 Szórás 0,00 0,01 0,01 0,00 0,00 0,00 0,01 0,01 0,01 0,00 Aszimmetria 0,07 0,13 0,04 0,01 0,00 0,03 0,05 0,10 0,0 0,00 Csúcsosság 3,51 4,47,51 3,5,88,59 4,37 3,95 4,38,48 Extrém hozam ( ) küszöb 0,01 0,0 0,0 0,01 0,01 0,01 0,03 0,0 0,0 0,01 Extrém hozam (+) küszöb 0,01 0,0 0,0 0,01 0,01 0,01 0,03 0,0 0,0 0,01 Extrém hozam ( ) (db) Extrém hozam (+) (db) Nem extrém hozam (db) (A táblázat folytatása a következő oldalon.)
17 75 Sávai Marianna Kiss Gábor Dávid (Folytatás.) Mutató KES GHS ZAR TZS UGX XAF GMD MGA MZN EUR EM modell Átlag 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 Szórás 0,00 0,01 0,01 0,01 0,01 0,01 0,01 0,01 0,01 0,00 Aszimmetria 0,05 0,04 0,04 0,16 0,03 0,0 0,08 0,0 0,05 0,00 Csúcsosság 5,58 9,6,51 7,01 5,63,66 5,30 10,66 5,11,48 Extrém hozam ( ) küszöb 0,0 0,05 0,0 0,03 0,03 0,01 0,06 0,07 0,04 0,01 Extrém hozam (+) küszöb 0,0 0,06 0,0 0,03 0,03 0,01 0,06 0,07 0,04 0,01 Extrém hozam ( ) (db) Extrém hozam (+) (db) Nem extrém hozam (db) A GARCH-modell a korrigált idősorokon F3. táblázat Modell ω α 1 α γ β 1 β δ BIC- paraméter Listaszerű adattörlés KES/USD TARCH(1,1,) 0,00 0,3 0,04 0,40 0,36 4,1 GHS/USD GARCH(1,) 0,00 0,13 0,35 0,5 3,68 ZAR/USD TARCH(1,1,1) 0,00 0,05 0,07 0,91 3,13 TZS/USD GARCH(1,1) 0,00 0,5 0,75 3,96 UGX/USD GARCH(1,1) 0,00 0,1 0,79 3,80 XAF/USD GARCH(1,1) 0,00 0,04 0,95 3,57 GMD/USD TARCH(,1,1) 0,01 0,15 0,38 0,10 0,4,76 MGA/USD APARCH(1,1,1) 0,00 0,0 0,05 0,94 3,98 3, MZN/USD GARCH(1,) 0,00 0,3 0,30 0,47 3,36 EUR/USD GARCH(1,1) 0,00 0,05 0,95 3,63 Átlaggal pótlás KES/USD TARCH(1,1,) 0,00 0,3 0,03 0,44 0,3 4,0 GHS/USD APARCH(1,1,1) 0,00 0,05 0,01 0,89 3,66 3,69 ZAR/USD GJR-GARCH(1,1,1) 0,00 0,0 0,10 0,93 3,1 TZS/USD GARCH(1,1) 0,00 0,0 0,80 3,9 UGX/USD GARCH(1,1) 0,00 0,19 0,81 3,83 XAF/USD GARCH(1,) 0,00 0,06 0,0 0,91 3,6 GMD/USD TARCH(,1,1) 0,00 0,14 0,8 0,17 0,49,83 MGA/USD APARCH(1,1,1) 0,00 0,0 0,07 0,95 3,44 3, MZN/USD TARCH(1,1,) 0,00 0,14 0,1 0,9 0,5 3,3 EUR/USD GARCH(1,1) 0,00 0,04 0,96 3,71 (A táblázat folytatása a következő oldalon.)
18 Pénzügyi idôsorok hiányzó adatainak kezelése 753 (Folytatás.) Modell ω α 1 α γ β 1 β δ BIC- paraméter EM-modell KES/USD GJR-GARCH(1,1,) 0,00 0,09 0,05 0,00 0,94 3,7 GHS/USD TARCH(1,1,) 0,00 0,31 0,10 0,00 0,74,44 ZAR/USD GJR-GARCH(1,1,1) 0,00 0,0 0,10 0,93 3,1 TZS/USD TARCH(1,1,) 0,00 0,7 0,43 0,30 0,0 3,18 UGX/USD APARCH(1,1,1) 0,00 0,16 0,19 0,34 4,00 3,04 XAF/USD Egy modell sem adott homoszkedasztikus hibatagot GMD/USD GARCH(1,1) 0,00 0,34 0,50,8 MGA/USD GARCH(1,) 0,00 0,30 0,38 0,3,35 MZN/USD GARCH(1,1) 0,00 0,40 0,55,75 EUR/USD GARCH(1,1) 0,00 0,04 0,96 3,71 F4. táblázat Homoszkedasztikus hibatagokkal standardizált logaritmikus hozamokon számított feltétel nélküli korreláció KES/USD GHS/USD ZAR/USD TZS/USD UGX/USD XAF/USD GMD/USD MGA/USD MZN/USD EUR/USD Listaszerű adattörlés KES/USD 0,00 0,00 0,05 0,04 0,09 0,06 0,00 0,05 0,00 0,05 GHS/USD 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 ZAR/USD 0,05 0,00 0,00 0,00 0,00 0,38 0,00 0,00 0,00 0,43 TZS/USD 0,04 0,00 0,00 0,00 0,08 0,00 0,00 0,00 0,04 0,00 UGX/USD 0,09 0,00 0,00 0,08 0,00 0,04 0,05 0,00 0,00 0,04 XAF/USD 0,06 0,00 0,38 0,00 0,04 0,00 0,00 0,07 0,00 0,83 GMD/USD 0,00 0,00 0,00 0,00 0,05 0,00 0,00 0,00 0,00 0,00 MGA/USD 0,05 0,00 0,00 0,00 0,00 0,07 0,00 0,00 0,00 0,06 MZN/USD 0,00 0,00 0,00 0,04 0,00 0,00 0,00 0,00 0,00 0,00 EUR/USD 0,05 0,00 0,43 0,00 0,04 0,83 0,00 0,06 0,00 0,00 Átlaggal pótlás KES/USD 0,00 0,00 0,03 0,05 0,08 0,06 0,00 0,00 0,00 0,04 GHS/USD 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 ZAR/USD 0,03 0,00 0,00 0,00 0,00 0,35 0,00 0,00 0,00 0,41 TZS/USD 0,05 0,00 0,00 0,00 0,08 0,00 0,00 0,00 0,00 0,00 UGX/USD 0,08 0,00 0,00 0,08 0,00 0,04 0,04 0,00 0,05 0,00 XAF/USD 0,06 0,00 0,35 0,00 0,04 0,00 0,00 0,06 0,00 0,76 GMD/USD 0,00 0,00 0,00 0,00 0,04 0,00 0,00 0,00 0,00 0,00 MGA/USD 0,00 0,00 0,00 0,00 0,00 0,06 0,00 0,00 0,00 0,05 MZN/USD 0,00 0,00 0,00 0,00 0,05 0,00 0,00 0,00 0,00 0,00 EUR/USD 0,04 0,00 0,41 0,00 0,00 0,76 0,00 0,05 0,00 0,00 (A táblázat folytatása a következő oldalon.)
19 754 Sávai Marianna Kiss Gábor Dávid (Folytatás.) KES/USD GHS/USD ZAR/USD TZS/USD UGX/USD XAF/USD GMD/USD MGA/USD MZN/USD EUR/USD EM-modell KES/USD 0,00 0,3 0,00 0,17 0,33 0,05 0,08 0,13 0,14 0,03 GHS/USD 0,3 0,00 0,00 0,46 0,64 0,03 0,33 0,38 0,46 0,00 ZAR/USD 0,00 0,00 0,00 0,00 0,00 0,30 0,00 0,00 0,03 0,41 TZS/USD 0,17 0,46 0,00 0,00 0,41 0,00 0,9 0,9 0,38 0,00 UGX/USD 0,33 0,64 0,00 0,41 0,00 0,00 0,5 0,7 0,9 0,03 XAF/USD 0,05 0,03 0,30 0,00 0,00 0,00 0,00 0,04 0,03 0,66 GMD/USD 0,08 0,33 0,00 0,9 0,5 0,00 0,00 0,07 0,36 0,00 MGA/USD 0,13 0,38 0,00 0,9 0,7 0,04 0,07 0,00 0, 0,00 MZN/USD 0,14 0,46 0,03 0,38 0,9 0,03 0,36 0, 0,00 0,00 EUR/USD 0,03 0,00 0,41 0,00 0,03 0,66 0,00 0,00 0,00 0,00 Megjegyzés. Csak a szignifikáns (p < 0,05) korrelációkat tartalmazza a táblázat. A szürkével jelzett értékek a nullától érdemben eltérő korrelációt jelölik. Irodalom BARALDI, P. DI MAIO, F. GENINI, D. ZIO, E. [015]: Reconstruction of missing data in multidimensional time series by fuzzy similarity. Applied Soft Computing Journal. Vol. 6. No. 1. pp BILMES, J. A. [1998]: A gentle tutorial of the EM algorithm and its application to parameter estimation for Gaussian mixture and hidden Markov models. International Computer Science Institute. Vol No. 4. pp em.pdf CAPPEIELLO, L. ENGLE, R. F. SHEPPARD, K. [006]: Asymmetric dynamics in the correlations of global equity and bond returns. Journal of Financial Econometrics. Vol. 4. Issue 4. pp CEYLAN, Y. SIPAN, A. CEM, I. INCI, B. [013]: Comparison of missing value imputation methods in time series: The case of Turkish meteorological data. Theoretical and Applied Climatology. Vol. 11. No. 1. pp ENGLE, R. F. [00]: Dynamic conditional correlation A simple class of multivariate GARCH models. Journal of Business and Economic Statistics. Vol. 0. No. 3. pp GIOVANNI, P. [005]: Are Euro area small cap stocks an asset class? Evidence from mean-variance spanning tests. European Financial Management. Vol. 11. No.. pp GRAHAM, J. W. [01]: Missing Data Analysis and Design. Springer. New York, Heidelberg, Dordrecht, London. HOUARI, R. BOUNCEUR, A. KECHADI, T. EULER, R. [013]: A new method for estimation of missing data based on sampling methods for data mining. Advances in Computational Science,
20 Pénzügyi idôsorok hiányzó adatainak kezelése 755 Engineering and Information Technology. Vol. 5. pp IMF (INTERNATIONAL MONETARY FUND) [013]: IMF Annual Report on Exchange Arrangements and Exchange Restrictions 013. Washington, DC. JUAN CARLOS, F. G. DUSKO, K. BELLO, L. AMILCAR, C. [010]: An evolutionary approach for imputing missing data in time series. Journal of Circuits, Systems and Computers. Vol. 19. Issue 1. pp JUNGER, W. L. PONCE DE LEON, A. [015]: Imputation of missing data in time series for air pollutants. Atmospheric Environment. Vol. 10. No.. pp KANG, H. [013]: The prevention and handling of the missing data. Korean Journal of Anesthesiology. Vol. 64. No. 5. pp KEIM, D. B. STAMBAUGH, R. F. [1984]: A further investigation of the weekend effect in stock returns. The Journal of Finance. Vol. 39. Issue 3. pp MADURA, J. [008]: International Financial Management. Cengage Learning. Stamford. ORAVECZ B. [008]: Hiányzó adatok és kezelésük a statisztikai elemzésekben. Statisztikai Szemle. 86. évf. 4. sz old. ROBINS, R. P. SMITH, G. P. [016]: No More Weekend Effect. Critical Finance Review. Vol. 5. No.. pp RUUD, P. A. [1991]: Extensions of estimation methods using the EM algorithm. Journal of Econometrics. Vol. 49. No. 3. pp UDVARI B. PONTET J. [015]: Költségvetés-támogatás: útban a hatékonyabb segélyezés felé (?) Külgazdaság. 59. évf. 1. sz old. UDVARI, B. URBÁNNÉ MEZŐ J. [015]: Az ifjúsági munkanélküliség és a munkaerő-piaci rugalmasság összefüggései az Európai Unióban. Külgazdaság. 59. évf sz old. SCHNEIDER, T. [001]: Analysis of incomplete climate data: Estimation of mean values and covariance matrices and imputation of missing values. Journal of Climate. Vol. 14. No. 5. pp SHAHID, M. N. MEHMOOD, Z. [015]: Calendar anomalies in stock market: A case of KSE 100 index. International Journal of African and Asian Studies. Vol. 7. pp WOTHKE, W. [1998]: Longitudinal and multi-group modeling with missing data. In: Little, T. D. Schnabel, K. U. Baumert, J. (eds): Modeling Longitudinal and Multiple Group Data: Practical Issues, Applied Approaches and Specific Examples. Lawrence Erlbaum Associates. Mahwah. Summary The multivariate time series analysis requires synchronized and continuous data for its models. However, there can be special occasions when one or some data is/are missing due to the lack of trading activity. This paper focuses on the impact of different missing data handling methods on GARCH and value at risk model parameters, namely the volatility persistence and asymmetry and
21 756 Sávai Kiss: Pénzügyi idôsorok hiányzó adatainak kezelése the fat tailness of the corrected data. The main added value of the current paper is the comparison of the impact of different methods (like listwise deletion, mean substitution, and maximum likelihood based expectation maximization) on daily financial time series because this subject has insufficient literature. The authors have tested daily closing data of floating currencies from Kenya, Ghana, South Africa, Tanzania, Uganda, Gambia, Madagascar and Mozambique in USD denomination against EUR/USD rate between 8 March 000 and 6 March 015 acquired from Bloomberg database. Current paper suggests the usage of mean substitution or listwise deletion for daily financial time series due to the biases of the expectation maximization approach on volatility, correlation and extreme fluctuations.
Pénzügyi idősorok hiányzó adatainak kezelése afrikai devizaárfolyamok példáján
Lengyel I. (szerk.) 2017: Két évtizedes a regionális tudományi műhely Szegeden: 1997 2017. JATEPress, Szeged, 422 440. o. Pénzügyi idősorok hiányzó adatainak kezelése afrikai devizaárfolyamok példáján
Többváltozós lineáris regressziós modell feltételeinek
Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p
Többváltozós lineáris regressziós modell feltételeinek tesztelése I.
Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Kvantitatív statisztikai módszerek Petrovics Petra Többváltozós lineáris regressziós
2005. NEGYEDIK ÉVFOLYAM 2. SZÁM 73
2005. NEGYEDIK ÉVFOLYAM 2. SZÁM 73 74 HITELINTÉZETI SZEMLE PETRIMÁN ZITA TULASSAY ZSOLT BEPILLANTÁS AZ ARCH MODELLEK VILÁGÁBA * Jelen tanulmányban áttekintést adunk az ARCH modellek alapvetõ jellemzõirõl,
A maximum likelihood becslésről
A maximum likelihood becslésről Definíció Parametrikus becsléssel foglalkozunk. Adott egy modell, mellyel elképzeléseink szerint jól leírható a meghatározni kívánt rendszer. (A modell típusának és rendszámának
Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision
Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet
Operációkutatás I. 2017/2018-2. Szegedi Tudományegyetem Informatikai Intézet Számítógépes Optimalizálás Tanszék 11. Előadás Portfólió probléma Portfólió probléma Portfólió probléma Adott részvények (kötvények,tevékenységek,
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus
x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:
Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Valószínűségi változó általános fogalma: A : R leképezést valószínűségi változónak nevezzük, ha : ( ) x, x R, x rögzített esetén esemény.
Autoregresszív és mozgóátlag folyamatok. Géczi-Papp Renáta
Autoregresszív és mozgóátlag folyamatok Géczi-Papp Renáta Autoregresszív folyamat Az Y t diszkrét paraméterű sztochasztikus folyamatok k-ad rendű autoregresszív folyamatnak nevezzük, ha Y t = α 1 Y t 1
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
Autoregresszív és mozgóátlag folyamatok
Géczi-Papp Renáta Autoregresszív és mozgóátlag folyamatok Autoregresszív folyamat Az Y t diszkrét paraméterű sztochasztikus folyamatok k-ad rendű autoregresszív folyamatnak nevezzük, ha Y t = α 1 Y t 1
Statisztikai következtetések Nemlineáris regresszió Feladatok Vége
[GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell
STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás
ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika
Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió
SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás
STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése
4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól
Least Squares becslés
Least Squares becslés A négyzetes hibafüggvény: i d i ( ) φx i A négyzetes hibafüggvény mellett a minimumot biztosító megoldás W=( d LS becslés A gradiens számítása és nullává tétele eredményeképp A megoldás
Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1
Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,
STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás
ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 7. Előadás Egyenletes eloszlás Binomiális eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell /56 Matematikai statisztika Reprezentatív mintavétel
Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a
Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,
Statisztikai módszerek a skálafüggetlen hálózatok
Statisztikai módszerek a skálafüggetlen hálózatok vizsgálatára Gyenge Ádám1 1 Budapesti Műszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Számítástudományi és Információelméleti
Regression games and applications TDK prezentáció
Regression games and applications TDK prezentáció Budapesti Corvinus Egyetem Áttekintés Bevezetés Regressziós játékok és alkalmazásaik Autoregresszív játékok G N AR Abszolút eltérés regressziós játékok
Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok
STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris
Biostatisztika VIII. Mátyus László. 19 October
Biostatisztika VIII Mátyus László 19 October 2010 1 Ha σ nem ismert A gyakorlatban ritkán ismerjük σ-t. Ha kiszámítjuk s-t a minta alapján, akkor becsülhetjük σ-t. Ez további bizonytalanságot okoz a becslésben.
Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók
Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz
Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.
Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza
Normális eloszlás tesztje
Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra
Adatok statisztikai értékelésének főbb lehetőségei
Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció
2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!
GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az
Regressziós vizsgálatok
Regressziós vizsgálatok Regresszió (regression) Általános jelentése: visszaesés, hanyatlás, visszafelé mozgás, visszavezetés. Orvosi területen: visszafejlődés, involúció. A betegség tünetei, vagy maga
Matematikai statisztika c. tárgy oktatásának célja és tematikája
Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:
Termelés- és szolgáltatásmenedzsment
Termelés- és szolgáltatásmenedzsment egyetemi adjunktus Menedzsment és Vállalatgazdaságtan Tanszék Termelés- és szolgáltatásmenedzsment 13. Előrejelzési módszerek 14. Az előrejelzési modellek felépítése
Több valószínűségi változó együttes eloszlása, korreláció
Tartalomjegzék Előszó... 6 I. Valószínűségelméleti és matematikai statisztikai alapok... 8 1. A szükséges valószínűségelméleti és matematikai statisztikai alapismeretek összefoglalása... 8 1.1. Alapfogalmak...
Principal Component Analysis
Principal Component Analysis Principal Component Analysis Principal Component Analysis Definíció Ortogonális transzformáció, amely az adatokat egy új koordinátarendszerbe transzformálja úgy, hogy a koordináták
Többváltozós Regresszió-számítás
Töváltozós Regresszió-számítás 3. előadás Döntéselőkészítés módszertana Dr. Szilágyi Roland Korreláció Célja a kacsolat szorosságának mérése. Regresszió Célja a kacsolatan megfigyelhető törvényszerűség
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,
Statisztika elméleti összefoglaló
1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11
STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba
Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum
Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis
SZDT-09 p. 1/36 Biometria az orvosi gyakorlatban Regresszió Túlélésanalízis Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Logisztikus regresszió
Diagnosztika és előrejelzés
2018. november 28. A diagnosztika feladata A modelldiagnosztika alapfeladatai: A modellillesztés jóságának vizsgálata (idősoros adatok esetén, a regressziónál már tanultuk), a reziduumok fehérzaj voltának
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát
1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása
HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat
Likelihood, deviancia, Akaike-féle információs kritérium
Többváltozós statisztika (SZIE ÁOTK, 2011. ősz) 1 Likelihood, deviancia, Akaike-féle információs kritérium Likelihood függvény Az adatokhoz paraméteres modellt illesztünk. A likelihood függvény a megfigyelt
Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg
LMeasurement.tex, March, 00 Mérés Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg a mérendő mennyiségben egy másik, a mérendővel egynemű, önkényesen egységnek választott
Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt
Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Galbács Gábor KIUGRÓ ADATOK KISZŰRÉSE STATISZTIKAI TESZTEKKEL Dixon Q-tesztje Gyakori feladat az analitikai kémiában, hogy kiugrónak
Bevezetés a hipotézisvizsgálatokba
Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -
Populációbecslés és monitoring. Eloszlások és alapstatisztikák
Populációbecslés és monitoring Eloszlások és alapstatisztikák Eloszlások Az eloszlás megadja, hogy milyen valószínűséggel kapunk egy adott intervallumba tartozó értéket, ha egy olyan populációból veszünk
Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév
Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév A pirossal írt anyagrészeket nem fogom közvetlenül számon kérni a vizsgán, azok háttérismeretként,
Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása
Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból
14 A Black-Scholes-Merton modell. Options, Futures, and Other Derivatives, 8th Edition, Copyright John C. Hull
14 A Black-choles-Merton modell Copyright John C. Hull 01 1 Részvényárak viselkedése (feltevés!) Részvényár: μ: elvárt hozam : volatilitás Egy rövid Δt idő alatt a hozam normális eloszlású véletlen változó:
6. Előadás. Vereb György, DE OEC BSI, október 12.
6. Előadás Visszatekintés: a normális eloszlás Becslés, mintavételezés Reprezentatív minta A statisztika, mint változó Paraméter és Statisztika Torzítatlan becslés A mintaközép eloszlása - centrális határeloszlás
Loss Distribution Approach
Modeling operational risk using the Loss Distribution Approach Tartalom»Szabályozói környezet»modellezési struktúra»eseményszám eloszlás»káreloszlás»aggregált veszteségek»további problémák 2 Szabályozói
Segítség az outputok értelmezéséhez
Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró
Számítógépes döntéstámogatás. Statisztikai elemzés
SZDT-03 p. 1/22 Számítógépes döntéstámogatás Statisztikai elemzés Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Előadás SZDT-03 p. 2/22 Rendelkezésre
FOLYÓIRATOK, ADATBÁZISOK
Szakkönyvtár FOLYÓIRATOK, ADATBÁZISOK 2013. szeptember Acta Oeconomica Állam- és Jogtudomány Élet és Irodalom Figyelő Gazdaság és Jog Határozatok Tára HVG Közgazdasági Szemle Külgazdaság Magyar Hírlap
Esettanulmány. A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre. Tartalomjegyzék. 1. Bevezetés... 2
Esettanulmány A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre Tartalomjegyzék 1. Bevezetés... 2 2. A lineáris modell alkalmazhatóságának feltételei... 2 3. A feltételek teljesülésének
Korreláció és lineáris regresszió
Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.
Matematikai geodéziai számítások 6.
Matematikai geodéziai számítások 6. Lineáris regresszió számítás elektronikus távmérőkre Dr. Bácsatyai, László Matematikai geodéziai számítások 6.: Lineáris regresszió számítás elektronikus távmérőkre
y ij = µ + α i + e ij
Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció:
Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem
agy számok törvényei Statisztikai mintavétel Várható érték becslése Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem A mérés mint statisztikai mintavétel A méréssel az eloszlásfüggvénnyel
Módszertani hozzájárulás a Szegénység
Módszertani hozzájárulás a Szegénység Többváltozós Statisztikai Méréséhez MTA doktori értekezés főbb eredményei Hajdu ottó BCE KTK Statisztika Tanszék BME GTK Pénzügyek Tanszék Hajdu Ottó 1 Egyváltozós
Matematikai alapok és valószínőségszámítás. Normál eloszlás
Matematikai alapok és valószínőségszámítás Normál eloszlás A normál eloszlás Folytonos változók esetén az eloszlás meghatározása nehezebb, mint diszkrét változók esetén. A változó értékei nem sorolhatóak
Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.
Kiválasztás A változó szerint Egymintás t-próba Mann-Whitney U-test paraméteres nem-paraméteres Varianciaanalízis De melyiket válasszam? Kétmintás t-próba Fontos, hogy mindig a kérdésnek és a változónak
A modellezés sajátosságai anomáliákkal terhelt idősorok esetén
A modellezés sajátosságai anomáliákkal terhelt idősorok esetén MÓDSZERTANI DILEMMÁK A STATISZTIKÁBAN 4 ÉVE ALAKULT A JÖVŐKUTATÁSI BIZOTTSÁG SJTB Tudományos ülés, 216. november 18. 1 Idősor-modellezés alapkérdései
e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:
Normális eloszlás ξ valószínűségi változó normális eloszlású. ξ N ( µ, σ 2) Paraméterei: µ: várható érték, σ 2 : szórásnégyzet (µ tetszőleges, σ 2 tetszőleges pozitív valós szám) Normális eloszlás sűrűségfüggvénye:
Kísérlettervezés alapfogalmak
Kísérlettervezés alapfogalmak Rendszermodellezés Budapest University of Technology and Economics Fault Tolerant Systems Research Group Budapest University of Technology and Economics Department of Measurement
Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )
Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel: 463-6-80 Fa: 463-30-9 http://www.vizgep.bme.hu Alap-ötlet:
Dodé Réka (ELTE BTK Nyelvtudomány Doktori IskolaAlkalmazott Alknyelvdok 2017 nyelvészet program) február 3. 1 / 17
Doménspecifikus korpusz építése és validálása Dodé Réka ELTE BTK Nyelvtudomány Doktori Iskola Alkalmazott nyelvészet program 2017. február 3. Dodé Réka (ELTE BTK Nyelvtudomány Doktori IskolaAlkalmazott
Gyöngyös,
XIV. Nemzetközi Tudományos Napok Gyöngyös, 2014. 03.27.-03.28. A munkapiaci termelékenység és az intézmények összefüggései különböző képzettségi szinteket igénylő ágazatokban 1 Előadó: Dr. Máté Domicián
5. előadás - Regressziószámítás
5. előadás - Regressziószámítás 2016. október 3. 5. előadás 1 / 18 Kétváltozós eset A modell: Y i = α + βx i + u i, i = 1,..., T, ahol X i független u i -től minden i esetén, (u i ) pedig i.i.d. sorozat
Bevezetés a Korreláció &
Bevezetés a Korreláció & Regressziószámításba Petrovics Petra Doktorandusz Statisztikai kapcsolatok Asszociáció 2 minőségi/területi ismérv között Vegyes kapcsolat minőségi/területi és egy mennyiségi ismérv
A Lee-Carter módszer magyarországi
A Lee-Carter módszer magyarországi alkalmazása Baran Sándor, Gáll József, Ispány Márton, Pap Gyula Alkalmazott Matematika és Valószínűségszámítás Tanszék, Debreceni Egyetem, Informatikai Kar 1 Feladatok:
Idősorok elemzése november 14. Spektrálelemzés, DF és ADF tesztek. Idősorok elemzése
Spektrálelemzés, DF és ADF tesztek 2017. november 14. SPEKTRÁL-ELEMZÉS Példa - BKV villamosenergia-terhelési görbéje Figure: BKV villamosenergia-terhelési görbéje, negyedóránkénti mérések (2 hét adatai,
Bozóki Sándor. MTA SZTAKI, Budapesti Corvinus Egyetem. Vitaliy Tsyganok
A feszítőfákból számolt súlyvektorok mértani közepének optimalitása a logaritmikus legkisebb négyzetes célfüggvényre nézve Bozóki Sándor MTA SZTAKI, Budapesti Corvinus Egyetem Vitaliy Tsyganok Laboratory
Kettőnél több csoport vizsgálata. Makara B. Gábor
Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10
Logisztikus regresszió október 27.
Logisztikus regresszió 2017. október 27. Néhány példa Mi a valószínűsége egy adott betegségnek a páciens bizonyos megfigyelt jellemzői (pl. nem, életkor, laboreredmények, BMI stb.) alapján? Mely genetikai
Heckman modell. Szelekciós modellek alkalmazásai.
Heckman modell. Szelekciós modellek alkalmazásai. Mikroökonometria, 12. hét Bíró Anikó A tananyag a Gazdasági Versenyhivatal Versenykultúra Központja és a Tudás-Ökonómia Alapítvány támogatásával készült
A BÜKKI KARSZTVÍZSZINT ÉSZLELŐ RENDSZER KERETÉBEN GYŰJTÖTT HIDROMETEOROLÓGIAI ADATOK ELEMZÉSE
KARSZTFEJLŐDÉS XIX. Szombathely, 2014. pp. 137-146. A BÜKKI KARSZTVÍZSZINT ÉSZLELŐ RENDSZER KERETÉBEN GYŰJTÖTT HIDROMETEOROLÓGIAI ADATOK ELEMZÉSE ANALYSIS OF HYDROMETEOROLIGYCAL DATA OF BÜKK WATER LEVEL
GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június
GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TáTK Közgazdaságtudományi Tanszékén, az ELTE Közgazdaságtudományi Tanszék, az MTA Közgazdaságtudományi
A mérési eredmény megadása
A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk meg: a determinisztikus és a véletlenszerű
Kutatásmódszertan és prezentációkészítés
Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I
Bevezetés. 1. előadás, 2015. február 11. Módszerek. Tematika
Bevezetés 1. előadás, 2015. február 11. Zempléni András Valószínűségelméleti és Statisztika Tanszék Természettudományi Kar Eötvös Loránd Tudományegyetem Áringadozások előadás Heti 2 óra előadás + 2 óra
Matematikai geodéziai számítások 6.
Nyugat-magyarországi Egyetem Geoinformatikai Kara Dr. Bácsatyai László Matematikai geodéziai számítások 6. MGS6 modul Lineáris regresszió számítás elektronikus távmérőkre SZÉKESFEHÉRVÁR 2010 Jelen szellemi
A Statisztika alapjai
A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati
(Independence, dependence, random variables)
Két valószínűségi változó együttes vizsgálata Feltételes eloszlások Két diszkrét változó együttes eloszlása a lehetséges értékpárok és a hozzájuk tartozó valószínűségek (táblázat) Példa: Egy urna 3 fehér,
Hipotézis vizsgálatok
Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével
Geokémia gyakorlat. 1. Geokémiai adatok értelmezése: egyszerű statisztikai módszerek. Geológus szakirány (BSc) Dr. Lukács Réka
Geokémia gyakorlat 1. Geokémiai adatok értelmezése: egyszerű statisztikai módszerek Geológus szakirány (BSc) Dr. Lukács Réka MTA-ELTE Vulkanológiai Kutatócsoport e-mail: reka.harangi@gmail.com ALAPFOGALMAK:
VI. Magyar Földrajzi Konferencia 524-529
Van Leeuwen Boudewijn Tobak Zalán Szatmári József 1 BELVÍZ OSZTÁLYOZÁS HAGYOMÁNYOS MÓDSZERREL ÉS MESTERSÉGES NEURÁLIS HÁLÓVAL BEVEZETÉS Magyarország, különösen pedig az Alföld váltakozva szenved aszályos
Biomatematika 2 Orvosi biometria
Biomatematika 2 Orvosi biometria 2017.02.05. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)
GRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens
GRADUÁLIS BIOSTATISZTIKAI KURZUS 2012. február hó 22. Dr. Dinya Elek egyetemi docens Biometria fogalma The active pursuit of biological knowledge by quantitative methods Sir R. A. Fisher, 1948 BIOMETRIA
Matematikai geodéziai számítások 5.
Matematikai geodéziai számítások 5 Hibaterjedési feladatok Dr Bácsatyai László Matematikai geodéziai számítások 5: Hibaterjedési feladatok Dr Bácsatyai László Lektor: Dr Benedek Judit Ez a modul a TÁMOP
Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?
Feladatok: pontdiagram és dobozdiagram Hogyan csináltuk? Alakmutatók: ferdeség, csúcsosság Alakmutatók a ferdeség és csúcsosság mérésére Ez eloszlás centrumát (középérték) és az adatok centrum körüli terpeszkedését
Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes
c adatpontok és az ismeretlen pont közötti kovariancia vektora
1. MELLÉKLET: Alkalmazott jelölések A mintaterület kiterjedése, területe c adatpontok és az ismeretlen pont közötti kovariancia vektora C(0) reziduális komponens varianciája C R (h) C R Cov{} d( u, X )
Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás
STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H
y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell
Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.
A valószínűségszámítás elemei
A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:
A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos:
A. Matematikai Statisztika 2.MINTA ZH. 2003 december Név (olvasható) :... A feladatmegoldásnak az alkalmazott matematikai modell valószínűségszámítási ill. statisztikai szóhasználat szerinti megfogalmazását,