A sztochasztikus idősorelemzés alapjai

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "A sztochasztikus idősorelemzés alapjai"

Átírás

1 A sztochasztikus idősorelemzés alapjai Ferenci Tamás BCE, Statisztika Tanszék november 29.

2 2

3 Tartalomjegyzék 1. Az idősorelemzés fogalma, megközelítései Az idősor fogalma Idősorok nevezetes jellemzői Determinisztikus és sztochasztikus idősorelemzés Determinisztikus idősorelemzés Sztochasztikus idősorelemzés Determinisztikus és a sztochasztikus trend Stacionaritás A stacionaritás fogalmának szükségessége Erős és gyenge stacionaritás Erős stacionaritás Gyenge stacionaritás Stacionárius idősorok jellemzőinek becslése mintából A stacionaritás ellenőrzése Az idősor grafikus vizsgálata A korrelogram lecsengésének vizsgálata Statisztikai tesztek a stacionaritás vizsgálatára Stacionarizálás, trend- és differenciastacioner idősorok Trendstacioner idősorok (TSP) Differenciastacioner idősorok (DSP) Nevezetes idősormodellek A Box Jenkins-eljárás ARIMA-modellek haladó megfogalmazása ARIMA-modellek becslése 41 3

4 4 TARTALOMJEGYZÉK

5 1. fejezet Az idősorelemzés fogalma, megközelítései Ebben a fejezetben elsőként definiáljuk az idősor fogalmát (1.1. pont), majd későbbi jelentősége miatt külön beszélünk az időrosok néhány nevezetes jellemzőjéről (1.2. pont). Ezt követően bemutatjuk az idősorok elemzésével foglalkozó két alapvető megközelítési módot (1.3. pont), amire az 1.4. pontban példát is mutatunk Az idősor fogalma Az idősor fogalmát megragadhatjuk sokasági (elméleti idősor) és minta (empirikus idősor) szemléletben. Sokasági értelemben idősornak nevezzük valószínűségi változók egy indexelt {Y t, t N} családját 1, ahol a t indexet idő -nek fogjuk nevezni. (Az indexelés, amire az egyes valószínűségi változóknál az alsó index utal, a valószínűségi változók között egy sorrendet állít fel: Y 1 előbb van, Y 2 később.) Ilyen értelemben ez tehát lényegében valószínűségi változók egy sorbarendezett halmaza. Jelentheti például Y t a t nap végi OTP záróárfolyamot, a t nap végi HUF/EUR árfolyamot, a t évbeli magyarországi gabonatermelést stb. Néha az is hasznos lesz, ha úgy gondolunk erre, mint egy többdimenziós valószínűségi változóra, melynek Y t -k a komponensei (csak épp, szemben a szokásos többdimenziós eloszlásokkal, a sorrendjünk nem indifferens). N a lehetséges időpontok halmaza; ez a közgazdasági gyakorlatban legtöbbször diszkrét, nagyon gyakran egy véges halmaz, például N = {1, 2,..., T }. Ekkor tehát T számú időpontunk van, melyeket 1-től T -ig indexeltünk; a valószínűségi változóink így tehát: Y 1, Y 2,..., Y T. (Műszaki és természettudományos gyakorlatban előfordulnak folytonos indexhalmazok is, pl. lehet N = R +. Mi ilyen, ún. folytonos idejű idősorokkal a továbbiakban nem foglalkozunk, csak diszkrét idejűekkel, és az egyszerűség kedvéért azon belül is az N = {1, 2,..., T } esettel.) Lehet például az indexelés 1 Pontosan ugyanezt a fogalmat a valószínűségszámításban sztochasztikus folyamatnak szokás nevezni. 5

6 6 1. FEJEZET. AZ IDŐSORELEMZÉS FOGALMA, MEGKÖZELÍTÉSEI jelentése az, hogy t = 1 a jövő hétfői OTP záróárfolyam, t = 2 a jövő keddi stb., és T = 5 (azaz a jövő hét öt munkanapjára vonatkozó OTP záróárfolyam az idősorunk). Minta megközelítésben idősornak azt a y 1, y 2,..., y T statisztikai adatsort (adatbázist) nevezzük, amelynek az megfigyelési egységei sorbarendezettek, valamilyen időponthoz kötöttek. (Itt már láthatóan alkalmaztuk azt a konvenciót, hogy az időpontjaink az {1, 2,..., T } halmaz elemei.) Míg tehát az előbbiekben valószínűségi változók (sorbarendezett) sorozatával van dolgunk, itt már konkrét számok (sorbarendezett) sorozatával. Nyilvánvaló, hogy ez utóbbi az előbbi egy realizációja. (Pontosan ugyanúgy, ahogy az 1406 eladásra kínált lakás is egy-egy, összesen 1406 realizáció a kínálati ár, alapterület stb. változók (ismeretlen) együttes eloszlásából.) Ez utóbbi megjegyzés rögtön mutatja az idősorelemzés legnagyobb problémáját (és egyben persze kihívását): azt, hogy a gyakorlati feladatokban az egyes időpontokhoz tartozó valószínűségi változónkra csak egy realizációnk lesz! Nem hogy 1406 mintát nem vehetünk a valószínűségi változóból, de kettőt sem. (Aligha lehet a holnapi OTP-záróárfolyam, mint valószínűségi változóból két mintát venni... ) Szokás ezt, nagyon találóan, a reprodukálhatatlanság problémájának is nevezni. Mindezeket példázza az 1.1. ábra 2, mely az OTP 2010 évi záróárait ábrázolja ben összesen 254 kereskedési nap volt a BÉT-en, ez tehát egy T = 254 elemű idősor; január 4- től (az első kereskedési naptól) 1-gyel kezdve, minden kereskedési napon egyesével növekvően indexelhetjük. A fentiek fényében világos, hogy az OTP záróárfolyamainak alakulását elvileg egy 254-dimenziós valószínűségi változó írja le; az ábrán ennek egyetlen realizációja látható... ami egyúttal bizonyosan az egyetlen létező realizáció is erre az idősorra. Ennek megfelelően tehát soha ne felejtsük el, hogy az empirikus idősor, hiába is áll 254 számból, valójában egyetlen realizáció csak épp egy 254-dimenziós valószínűségi változóból. (Ahogy például a kínálati ár, alapterület, szobaszám együttes eloszlásából vett egyetlen realizáció is három számból áll.) A fenti ábrázolás azt juttatja kifejezésre, hogy az idősoros adatok specialitása (szemben a lakásos példával), hogy a valószínűségi változó komponensei között (és így persze a realizált komponensei között is) sorrendezés van: az ábrázolásnak csak úgy van értelme, ha erre tekintettel vagyunk; nyilván az ábra is e sorbarendezés figyelembevételével készült. A fentiek mind ún. egyváltozós idősorok voltak, hiszen skalárértékű valószínűségi változókat, ill. realizáltjaikat vizsgáltuk. Természetesen semmi akadálya annak, hogy ehelyett vektorértékű valószínűségi változókra térjünk át (pl. OTP árfolyam és HUF/EUR árfolyam együttes vizsgálata), ilyen többváltozós idősorról szokás beszélni. Ez egy még izgalmasabb, és persze bonyolultabb matematikai formalizmusú terület, hiszen ilyenkor nem csak a különböző időpontok közötti, hanem a különböző változók közötti kapcsolat kérdését is kezelni kell. Mi most egyváltozós idősorokkal fogunk foglalkozni. 2 Az ábrázolás elvileg nem teljesen korrekt, hiszen ez az idősor ugyebár diszkrét, ezért az egyes pontokat nem köthetnénk össze, ám itt olyan sok időpontunk van, hogy ez lényeges hibát nem jelent (amúgyis szabad szemmel szinte megkülönböztethetetlenül közel lennének a pontok).

7 1.2. IDŐSOROK NEVEZETES JELLEMZŐI Az OTP záróárai (BÉT), Záróár [Ft] febr. márc. ápr. máj. jún. júl. aug. szept. okt. nov. dec. Dátum 1.1. ábra. Az OTP évi záróárai a BÉT-en 1.2. Idősorok nevezetes jellemzői Egy idősor teljes sokasági leírását az adja, ha ismerjük az összes t N-re vett együttes eloszlását. Ennek ismeretében mindent tudunk az idősorról (természetesen sztochasztikus értelemben). Ezzel a kérdéssel, illetve ennek nehézségeivel a 2. fejezetben fogunk foglalkozni; de addig is hasonlóan a keresztmetszeti esethez itt is definiáljuk az idősor néhány, ennél egyszerűbb jellemzőjét. Olyan értelemben lesznek ezek egyszerűbbek, hogy az összes időpont együttes eloszlása helyett csak egy, legfeljebb két időpont együttes eloszlására vonatkoznak, illetve a teljes eloszlás megadása helyett csak egy, legfeljebb két momentumot adnak meg. (Teljes analógiában a keresztmetszeti esettel: ott is nagyon gyakori, hogy egy változó eloszlását csak várható értékével és esetleg szórásnégyzetével adjuk meg, illetve, hogy két változó eloszlását csak kovarianciájukkal/korrelációjukkal írjuk le.) Mivel Y t egy valószínűségi változó minden t N-re, így kiszámíthatjuk az EY t várhatóértékét. Ez már egyszerűen egy valós szám lesz, mégpedig t-től függő valós szám. Azaz: egy függvényt kaptunk, mely t időponthoz hozzárendeli, az akkori várható értékét az idősornak, EY t -t. Ezt

8 8 1. FEJEZET. AZ IDŐSORELEMZÉS FOGALMA, MEGKÖZELÍTÉSEI hívják precízen várható érték függvénynek, jele µ (µ : N R): µ t := EY t. Teljesen hasonlóan definiálható a σ 2 szórásnégyzet függvény (σ 2 : N R + ): σ 2 t := D2 Y t = E (Y t EY t ) 2 = E (Y t µ t ) 2 = EY 2 t µ 2 t. Értelemszerűen a σ szórás függvény ennek a négyzetgyöke: σ t := σ 2 t. Ezeken felül szokás definiálni az autokovariancia függvényt is, mint két időpont közti (azaz a két időponthoz tartozó valószínűségi változók közti) kovarianciát. (Az auto arra utal, hogy az idősor szintjén önmagával vett kovarianciáról van szó.) Mivel ehhez mindkét időpontot meg kell adni, ez már egy kétváltozós függvény lesz, jele γ (γ : N N R): γ t,s := cov (Y t, Y s ) = E [ (Y t EY t ) (Y s EY s ) ] = E [ (Y t µ t ) (Y s µ s ) ] = E (Y t Y s ) µ t µ s. Az autokovariancia-függvény hátránya (a keresztmetszeti esethez hasonlóan), hogy a számértéke önmagában nem sokat mond. Ezért itt is szokás ehelyett inkább az autokorreláció függvényt használni, melynek jele ρ (ρ : N N [ 1, 1]): ρ t,s := corr (Y t, Y s ) = γ t,s σ t σ s Determinisztikus és sztochasztikus idősorelemzési megközelítések Az idősorok elemzésének két alapvető megközelítése, módszertana alakult ki: a determisztikus ( alpont) és a sztochasztikus ( alpont) idősorelemzés. Megjegyezzük, hogy valójában mindkettő az ún. időtartományon történő elemzés kategóriájába esik (mivel azon alapulnak, hogy az idősor külöböző időpontokhoz tartozó értékei között teremtenek kapcsolatot). Tágabban szemlélve, az idősorelemzés másik nagy kategóriája a frekvenciatartományon történő elemzés, ezzel azonban nem fogunk részleteiben foglalkozni. A frekvenciatartományon történő elemzés lényege (némiképp leegyszerűsítve), hogy az idősort Fouriertranszformációval szinuszhullámok összegére bontja. Belátható, hogy idősorok egy széles csoportja ekvivalensen reprezentálható úgy, hogy megadjuk, hogy az egyes frekvenciájú szinuszhullámokat milyen súllyal kell kombinálni, hogy megkapjuk az idősort. (Az ekvivalens reprezentáció alatt azt értjük, hogy oda-vissza át lehet térni a két leírás között.) Ez utóbbira szokták azt mondani, hogy időtartomány helyett frekvenciatartományon írtuk fel az idősort; ebből is sok hasznos és érdekes következtetést lehet levonni. Ezt a módszertant szokták spektrális elemzésnek is nevezni.

9 1.3. DETERMINISZTIKUS ÉS SZTOCHASZTIKUS IDŐSORELEMZÉS Determinisztikus idősorelemzés Az ún. determinisztikus idősorelemzés azon a feltevésen nyugszik, hogy az idősort alakító tényezők, elvileg legalábbis, teljeskörűen számbavehetőek, és ez alapján az idősor alakulása, elvileg legalábbis, tökéletes pontossággal felírható lenne. A véletlennek csak annyiban jut szerep, hogy valami átkozott pech folytán a gyakorlati esetekben ez a teljeskörű felírás soha nem valósul meg (korlátozottak a mérési lehetőségek, korlátozott a tudásunk, hibával tudunk csak mérni stb.), emiatt a valóság mindig eltér a modell szerinti becslésünktől. (Vegyük észre, hogy ez az eltérés teljesen analóg a keresztmetszeti regresszió eltérésváltozójával, amiben szintén a fenti okok miatti hibát sűrítettük.) Azonban, és ez nagyon fontos, ebben a modellezési filozófiában a véletlen szerepe itt véget is ért: kialakítja az adott időszakbeli pontos értéket (eltérve valamennyivel a becslésünktől), ám ennyi, a későbbi időszakokra ennek már nincs hatása! (Természetesen a későbbi időpontokban is lesz eltérés, tehát ott is szerepet kap a véletlen, ám ez már az előző(ek)től függetlenül alakul mintha minden időpillanatban pénzfeldobásszerűen döntenénk a tényleges érték becsülttől való eltérítéséről.) Ez a filozófia a dekompozíciós idősormodellek felé mutat, melyek különböző, eltérő tartalmú komponensekre próbálják bontani az idősort (melyektől az idősor valamilyen függvényszerű módon függ). A legnépszerűbb modellben szokás beszélni pl. trendről (hosszú távú alapirányzat), ciklusról (éven túli ingadozás a trend körül) és szezonalitásról (évszakról-évszakra ingadozó, tehát éven belüli eltérés a trend és ciklus szerinti értéktől). Amennyiben feltesszük, hogy ezek additíve tevődnek össze, úgy az idősormodellünk a következőképp néz ki: Y t = R t + C t + S t + u t, ahol R t, C t és S t a trend, a ciklus és a szezonalitás t-edik időszakbeli értéke rendre, u t pedig a már említett eltérésváltozó. Ezek a komponensek klasszikus statisztikai (jellegében deskriptív statisztikai) módszerekkel (pl. analitikus trendszámítás) becsülhetőek. A determinisztikus idősorelemzéssel (mellyel elsősorban hosszútávú előrejelzések adása a cél), a továbbiakban nem foglalkozunk Sztochasztikus idősorelemzés A sztochasztikus idősorelemzés alapvető filozófiai eltérése, hogy bár ez a modell is adni fog egy becsült értéket az idősor adott időpontbeli értékére, és feltételezi, hogy a valós érték ettől véletlen módon eltér, ám abból indul ki, hogy ennek a véletlen eltérésnek később is hatása van: az idősor későbbi alakulását is befolyásolja. Úgy is szokták mondani, hogy az idősor fejlődésében öngeneráló hatások érvényesülnek: egy adott időpillanatbeli (véletlen) eltérés befolyásolja a későbbi értékeket is, tehát a véletlennek folyamatépítő szerepe van. E megközelítést nagy sikerrel alkalmazták különböző közgazdasági (kiemelten: pénzügyi) idősorok modellezésére; elsősorban rövid távra.

10 10 1. FEJEZET. AZ IDŐSORELEMZÉS FOGALMA, MEGKÖZELÍTÉSEI 1.4. Egy példa a két filozófiára: a determinisztikus és a sztochasztikus trend Most megnézünk egy egyszerű példát, mely közvetlenül a két modellezési iskola feltevéseit szemlélteti, ám a későbbiek szempontjából is nagyon jól fog jönni. Vegyük a következő két idősor-specifikációt: Y (D) t = αt + u t, Y (S) t = α + Y (S) t 1 + u t, Y 0 = 0. (Látható, hogy mindkét idősort a sokaságban 3 specifikáltuk.) Az egyszerűség kedvéért feltételezzük, hogy u t N ( 0, σ 2), mégpedig különböző t-kre függetlenül. Első ránézésre több hasonlóság is felfedezhető a két specifikáció között. Mindkét idősor a 0- ból indul (a 0 időpillanatban) és érezhető, hogy mindkettőre igaz, hogy egy időszakkal később várhatóan α-val nagyobb értéket vesznek fel. (Az α természetesen lehet negatív is.) Hogy ezt az állítást precízebben is megfogalmazzuk, vegyük észre, hogy az Y (S) t definíciójába rekurzíve behelyettesíthetünk (hiszen ha Y (S) t Y (S) t = α + Y (S) t 1 + u t = α + = α + = α + Y (S) t 1 + u t, akkor nyilván Y (S) t 1 = α + Y (S) t 2 + u t 1 stb.): ( ) α + Y (S) t 2 + u t 1 + u t = [ ( ) ] α + α + Y (S) t 3 + u t 2 + u t 1 + u t =... = αt + t u i. Az intuitív észrevételünket ( tehát úgy fogalmazhatjuk meg most már precízen, hogy EY (D) t = E (αt + u t ) = αt és EY (S) t = E αt + ) t i=1 u i = αt, tehát várható értékben minden időpillanatban ugyanaz a két idősor értéke. (Kihasználtuk, hogy összeg várható értéke a várható értékek összege, illetve, hogy konstans várható értéke saját maga és Eu i = 0.) Ez egy nagyon komoly megállapítás, ám van különbség is a két idősor fejlődése között. Ez rögtön világos lesz, ha felírjuk ( a szórásnégyzetet egy általános időpontra: D 2 Y (D) t = D 2 (αt + u t ) = σ 2 és D 2 Y (S) t = D 2 αt + ) t i=1 u i = tσ 2. (Kihasználtuk, hogy konstans minden valószínűségi változótól független (és szórásnégyzete nulla), és hogy független valószínűségi változók összegének szórásnégyzete a szórásnégyzetek összege.) A két idősor tehát várható értékban ugyan azonos, ám Y (S) t egyre nagyobb kilengésekkel ingadozik ezen várható érték körül, míg Y (D) t állandóakkal. Megjegyezzük, hogy mivel nyilván mind Y (D) t, mind Y (S) t normális eloszlású (hiszen a normális eloszláscsalád zárt a konvolúcióra és a konstanssal eltolásra), így a fenti két megállapítással teljesen le is írtuk az idősorokat. (Hiszen egy normális eloszlást egyértelműen meghatároz várható értéke és varianciája.) A fentieket számítógépes szimulációval szemléltethetjük: véletlenszám-generátorral előállítunk 3 Pontosan innen látszik az is, hogy az Y 0 = 0 természetesen nem azt jelenti, hogy az Y 0 az a 0 (mint valós szám), hiszen az Y t-k valószínűségi változók, ez tehát úgy értendő, hogy az Y 0 az az elfajult valószínűségi változó, mely 1 valószínűséggel a 0 értéket veszi fel. i=1

11 1.4. DETERMINISZTIKUS ÉS A SZTOCHASZTIKUS TREND 11 u t N ( 0, σ 2) számokat, majd így lejátszhatjuk egy lehetséges lefutását az idősornak. (Mind Y (D) t -t, mind Y (S) t -t szimulálhatjuk ilyen módon.) E megközelítés előnye, hogy míg valós szituációban nem ismerjük a sokasági eloszlást (épp ennek meghatározása lesz a feladat), csak egy realizáltat (sőt, idősorelemzésnél biztosan legfeljebb egy realizáltját láthatjuk az ismeretlen sokasági eloszlásnak), addig ebben az esetben ismerjük, sőt, mi határozzuk meg (a véletlenszámgenerátor beállításával) a sokasági eloszlást. Ennek megfelelően természetesen ebben az esetben vehetünk akárhány realizáltat a sokasági eloszlából (egyszerűen újra lefuttatjuk a szimulációt). Ezt szemlélteti az 1.2. ábra, melyen 9-9 realizáltat ábrázoltunk a Y (D) t (kékkel) és Y (S) t (pirossal) idősorokból α = 1, σ 2 = 9 paraméterek mellett. (A jobb áttekinthetőség végett csak 3-3 realizáltat ábrázoltunk egy grafikonon.) Megjegyezzük, hogy ezeket a lefutásokat szokás trajektóriának is nevezni. Az ábra tanulságosan igazolja vissza mindazt, amit eddig elméleti úton levezettünk. Egyrészt jól látszik, hogy várható értékben tényleg egyezik a két idősor (már ennyi ábrából is érezhető, hogy az y = x egyenes körül ingadoznak); és az is tökéletesen látszik, hogy míg Y (D) t állandó szórással ingadozik ezen egyenes körül, addig Y (S) t egyre nagyobb szórással ( legyezőszerűen kitágul ezen egyenes körül). Most már elárulhatjuk, hogy Y (D) t -t szokás determinisztikus trendnek, Y (S) t -et pedig sztochasztikus trendnek nevezni. (A trend elnevezés jogosságát épp a várható értékek alakulásáról tett megállapításunk indokolja.) Már a specifikációkból is látható, hogy a determinisztikus trend alakulása a determinisztikus idősorelemzési iskola premisszáit teljesíti, a sztochasztikus trend a sztochasztikus idősorelemzésiét. És ebből egy újabb fontos, tartalmi következtetést vonhatunk le az idősorok fejlődésének jellegzetességeire vonatkozóan. A determinisztikus trend alakulását úgy lehet elképzelni, hogy a t-edik időpontban fellépünk az αt pontba, majd egy N ( 0, σ 2) véletlenszám szerint perturbáljuk a pozíciónkat. A sztochasztikus trend esetén az előző pozícióból fellépünk α-t és utána térítjük el a pozíciónkat egy N ( 0, σ 2) véletlenszám szerint. (Mindezek a most ismert sokasági specifikációból világosak.) Hogy mi a különbség? Ha a véletlengenerátor pont egy nagyon nagy, vagy nagyon kicsi értéket dob ki, az ugyan kiugró pozíciót fog eredményezni, ám ennek determinisztikus trendnél semmilyen jelentősége nincs a későbbiek szempontjából (ettől függetlenül αt-be lépünk és generálunk újra véletlenszámot a következő időpontban), addig sztochasztikus trend esetén nagyon is van: az egész folyamat a kiugró pozíciótól folytatódik tovább! Ez legjobban talán a legalsó részábra legfelső trajektóriáján látszik: miután a 25. időpillanatban egy nagy pozitív véletlenszámot kaptunk, a nagy kiugrás nem egyszeri volt (ahogy determinisztikus trend esetén lett volna), hanem lényegében eltolódott az idősor, és onnan folytatódott az épülése. Mindez a specifikációból következik, természetesen. Azt is mondhatnánk, hogy a sztochasztikus trend esetén az idősorba beépülnek a sokkok, míg a determinisztikus trendbe nem. Ez a példa jól szemlélteti, hogy mit kell az alatt érteni, hogy egy idősorban a véletlennek folyamatépítő szerepe van, hogy öngeneráló hatások érvényesülnek. Megjegyezzük, hogy az Y t = Y t 1 +u t specifikációt szokás véletlen bolyongásnak (RW, random

12 12 1. FEJEZET. AZ IDŐSORELEMZÉS FOGALMA, MEGKÖZELÍTÉSEI ábra. Y (D) t (kék) és Y (S) t (piros) szimulált lefutása 100 időegységre walk) is nevezni, hiszen Y t felfogható úgy is, mint egy objektum ( a bolyongó ) térbeli helyzete. Azaz: a bolyongó kezdetben az origóban áll, minden időpillanatban előveszi a véletlenszámgenerátorát, és annyit lép felfelé, amennyit a véletlenszám-generátor mutat. (Ez természetesen negatív is lehet.) Ez tehát egy ún. egydimenziós bolyongás. Az Y t = α + Y t 1 + u t típusú folyamat neve eltolásos véletlen bolyongás (RWD, random walk with drift), hiszen ilyenkor a bolyongó

13 1.4. DETERMINISZTIKUS ÉS A SZTOCHASZTIKUS TREND 13 először determinisztikusan felfelé lép α-t (eltolás, sodródás ) és utána nézi meg a véletlenszámgenerátorát. RWD-folyamatokra a fentiekben már láttunk példákat, az 1.3. ábrán pedig 5 szimulált RW-folyamat trajektóriáját láthatjuk. Érdemes ellenőrizni a megbeszélt tulajdonságok teljesülését! Ezen folyamatoknak a valószínűségszámításban van nagy jelentőségük ábra. Véletlen bolyongás (RW) szimulált trajektóriái

14 14 1. FEJEZET. AZ IDŐSORELEMZÉS FOGALMA, MEGKÖZELÍTÉSEI

15 2. fejezet Stacionaritás A stacionaritás az idősorelemzés egyik alapvető fogalma; lényegében egy megkötést jelent az idősor valószínűségi struktúrájára nézve. E megkötés azért szükséges, hogy az idősor statisztikai eszközökkel kézbentartható legyen. (És mert épp emiatt a későbbi ismertetendő módszertan is stacionárius idősorokat fog igényelni.) A 2.1. pontban megindokoljuk, hogy miért szükséges ez a fogalom, mi a bevezetésének a logikája. Ezt követően, a 2.2. pontban precízen is bevezetjük a két, gyakran használt stacionaritás fogalmat, majd a 2.3. pontban megmutatjuk pár nevezetes jellemzőjét a stacionárius idősoroknak. Ez már csak azért is fontos, mert a későbbiekben szinte kizárólag ilyen idősorokkal fogunk dolgozni. A 2.4. pontban megmutatjuk, hogy az idősorok stacionaritását hogyan tudjuk megvizsgálni. Ez azért különösen fontos, mert a későbbiekben, amint már utaltunk is rá, stacioner idősorokra lesz szükségünk a modellépítéshez. Emiatt itt tárgyaljuk azt a másik nagyon fontos kérdést is, hogy mi a teendő nem-stacioner idősorok esetén, hogyan tudjuk őket stacioner idősorrá transzformálni ( stacionarizálás ) A stacionaritás fogalmának szükségessége Hasonlóan a keresztmetszeti adatelemzéshez, idősoros esetben is az lehet a célunk, hogy a minta alapján rekonstruáljuk az ismeretlen háttéreloszlást, amiből a minta származik. Ahogy már említettük is, egy idősor teljes leírását az adja, ha megadjuk a komponenseinek, tehát az egyes t N időponthoz tartozó valószínűségi változóknak az együttes eloszlását. Jegyezzük meg, hogy az egyes időpontok önmagában vett eloszlása nyilván kevés, hiszen ezekből semmit nem tudunk az időpontok közötti kapcsolatokról. Gondoljunk akár csak a legegyszerűbb esetre: T = 2 és az idősor eloszlása kétdimenziós normális. A 2.1. ábra két ilyen esetet szemléltet, a kétdimenziós sűrűségfüggvényt szintvonalakkal megjelenítve. A két eset jellegzetessége, hogy mindkét vetületi eloszlásuk (tehát: mindkét időpontban az adott időpontra 15

16 16 2. FEJEZET. STACIONARITÁS önmagában vett eloszlás) pontosan ugyanaz (ezt szemléltetendő az ábrán szintén feltüntettük ezeket a vetületi eloszlásokat, mégpedig pont úgy, ahogy a kétdimenziós eloszlást le kéne vetíteni ), mégis a két idősor tartalma drámaian eltérő: nagyon nem mindegy, hogy ha a részvény adott napi árfolyama az átlagánál magasabb, akkor a következő napi várhatóan átlagánál alacsonyabb, vagy pont hogy magasabb lesz... Kicsit precízebb valószínűségszámítási terminológiával megfogalmazva: a két eloszlás várhatérték-vektora és szórásnégyzetei teljesen azonosak, ami eltér, az a kovariancia (és így persze a korreláció is). Az is világos mellesleg valószínűségszámításból, hogy kizárólag akkor mondhatjuk, hogy a vetületi eloszlások elégségesek, ha az egyes időpontok függetlenek (hiszen ekkor az együttes sűrűségfüggvény 1 előállítható a vetületi sűrűségfüggvényekből, egyszerű szorzással). Ez nyilván irreális feltevés a legtöbb gyakorlati esetben. Minden információt általánosságban csak az együttes eloszlás hordoz y y x 2 y x y x x 2.1. ábra. Két kétdimenziós normális eloszlás sűrűségfüggvénye (szintvonalakkal) és vetületi eloszlásaik (szemléletesen ott, ahová tényleg vetíteni lehetne a kétdimenziós felületet); úgy, hogy az eloszlások mindkét vetületi eloszlása pontosan egyezik, mégis drámaian eltérőek tartalmilag Az 1. fejezetben mondottak szerint azonban az együttes eloszlás meghatározására szemben a keresztmetszeti esettel semmilyen reményünk nincs: míg 1406 minta alapján a 7 változónk együttes eloszlása jól rekonstruálható, addig itt, egyetlen minta lévén, lényegében semmit nem tudunk mondani az együttes eloszlásról. Sőt, nem csak az együttes eloszlásról nem tudunk érdemben nyilatkozni, de még a vetületi eloszlásokról (itt: az idősornak az egyes időpontokban önmagában vett eloszlásairól) sem: egyetlen realizációból értelmesen még várható értéket sem tudunk mondani, nemhogy eloszlást rekonstruálni. 1 Mi most csak olyan idősorokkal foglalkozunk, melyeknél a valószínűségi változó eloszlása folytonos, és így létezik sűrűségfüggvény.

17 2.2. ERŐS ÉS GYENGE STACIONARITÁS 17 Ebből tehát világos, hogy az idősorelemzéssel csak úgy tudunk érdemben továbbhaladni, ha az együttes eloszlásra bizonyos megkötéseket teszünk. Ez fog elvezetni minket a stacionaritás fogalmához. Először egy rávezető problémával kezdünk. Tegyük fel, hogy valaki megkér minket, hogy adjuk meg a január 4-i OTP záróárfolyam várható értékét. (Ez az Y 1 az 1.1. ábra példáján.) Ahogy már mondtuk, további megkötés nélkül ez a feladat reménytelen, hiszen arra a valószínűségi változóra egyetlen mintánk van (y 1 = 5492), amiből, értelmesen legalábbis, nem lehet várható értéket becsülni. (Mint ahogy semmi mást sem.) Itt jön elő a reprodukálhatatlanság, az egyetlen realizáció problémája: nem lenne gond egy ilyen becsléssel, ha vehetnék több mint a január 4-i OTP záróárfolyamból... de nem vehetünk, ez sajnos elvileg lehetetlen. Tegyük fel azonban, hogy valaki megsúgja, hogy az együttes eloszlás olyan, hogy minden vetületi eloszlásnak (tehát minden nap záróárának) ugyanaz a várható értéke. Ekkor már drasztikusan más a helyzet! Ha ugyanis ez a feltevés igaz, akkor természetesen a második (vagy bármelyik más) időpontbeli realizáció is ugyanúgy használható a várható érték becslésére, mint az első napi; azaz: a különböző naphoz tartozó értékeket összeönthetjük a várható érték becsléséhez. Márpedig 254 értékből nagyon is lehet várható értéket becsülni! E feltevés híján azonban a külöböző időpontbeli értékeket nem használhattuk volna fel együtt. Ez a példa rámutat arra, hogy ha bizonyos megszorításokat teszünk (a példában: hogy minden vetületi eloszlás várható értéke ugyanaz), akkor a kezdetben reménytelen feladatot kezelhetővé tesszük (legalábbis bizonyos szempontok szerint). E kikötések teljesülését persze valahogy ellenőrizni kell, de erre majd később, a 2.4. pontban térünk vissza Erős és gyenge stacionaritás Most bevezetjük, a fentiek által motiválva, idősorok stacionaritásának fogalmát. (Jobban mondva fogalmait, mert több stacionaritási fogalmat is definiálni fogunk.) Előtte még emlékeztetünk arra, hogy egy többdimenziós eloszlás vetületének néhány kiválasztott komponensének együttes eloszlását nevezzük. Például az X, Y, Z, V valószínűségi változókból (mint komponensekből) álló többdimenziós (négydimenziós) valószínűségi változónak 4 darab egydimenziós vetületi eloszlása van (az X, az Y, a Z és a V változók (önmagában vett) eloszlása), 6 darab kétdimenziós vetületi eloszlása van (az X, Y, X, Z, X, V, Y, Z, Y, V és Z, V párok együttes eloszlása) és így tovább. (Természetesen, mint azt ez a példa is mutatja, a vetületi eloszlás is lehet többdimenziós, azaz egy együttes eloszlás vetületi eloszlása is jelenthet együttes eloszlást.) Erős stacionaritás Kezdjük egy nagyon erős megkötéssel. Egy idősort erős értelemben stacionáriusnak (vagy: erős értelemben stacionernek) nevezünk, ha minden véges dimenziós vetületének együttes eloszlása (tehát: akárhány elemű vetületről van szó, és ezeket az elemeket akárhogy választjuk ki az idősor komponensei (azaz időpontjai) közül) eltolásinvariáns, minden értelmes eltolásra. Például

18 18 2. FEJEZET. STACIONARITÁS mondjuk azt, hogy háromdimenziós vetületek együttes eloszlására vagyunk kíváncsiak; egy ilyen lehetséges vetület például az Y 1, Y 3 és Y 7 együttes eloszlása. Ha az erős stacionaritás fennáll, akkor e három együttes eloszlásának ugyanannak kell lennie, mint Y 2, Y 4 és Y 8 együttes eloszlásának, vagy épp Y 12, Y 14 és Y 18 együttes eloszlásának, vagy épp Y 212, Y 214 és Y 218 együttes eloszlásának, és egyáltalán: minden más, eltolással kijelölt időpont együttes eloszlásának. (Eltolással kijelölés itt olyan, mintha egy ablakot mereven végigtolnánk az idősoron, tehát az egyes időpontok közti különbségeknek ugyanannyinak kell lenniük.) És ennek természetesen nem csak a háromdimenziós vetületekre kell teljesülnie, hanem az egydimenziósokra, a kétdimenziósokra,... és az n 1 dimenziósokra is. (Azért kellett úgy fogalmaznunk, hogy minden értelmes eltolásra, mert nem véges idősoroknál ezt az ablakot nyilván nem tolhatjuk ki az idősoron túlra.) Precízen megfogalmazva: k 1 esetén t 1, t 2,..., t k -ra Y t1, Y t2,..., Y tk együttes eloszlása megegyezik Y t1+h, Y t2+h,..., Y tk +h együttes eloszlásával, h-ra (ha az itt szereplő komponensek mind az idősor részei). Ez a feltétel (már a kvantorok számából is érezhetően... ) rendkívül sokat követel meg. Vegyük észre például, hogy ennek része az előző pont végének példa-megkötése: a definíciót k = 1- gyel alkalmazva azt kapjuk, hogy erős stacionaritás esetén minden egyes időpontban pontosan ugyanannak kell lennie az idősor adott időpontbeli (vetületi) eloszlásának. (Így nyilván a várható értékének, és egyáltalán, minden momentumának is ugyanannak kell lennie, minden időpontban.) Ennek megfelelően, ha egy idősor erősen stacioner, az rendkívüli módon megkönnyíti az elemzését. Nem csak a várható értékének becsléséhez használható fel együtt az összes időpontbeli érték (tehát y 1, y 2,..., y T ), de a szórásnégyzetének, ferdeségének stb., tehát általában, bármilyen momentumának becsléséhez, sőt: a definíció k = 2-re alkalmazásából látszik, hogy az egymást követő időpontok kétdimenziós eloszlása is ugyanaz, tehát minden időpont és a rákövetkező időpont közti korreláció is ugyanaz kell legyen (függetlenül attól, hogy melyik ez a két időpont, csak az számít, hogy egymás utániak legyenek), és ennek becsléséhez felhasználhatjuk az (y 1, y 2 ), (y 2, y 3 ),..., (y T 1, y T ) értékeket. Sőt, a kettő különbségű időpontok eloszlása is azonos, függetlenül attól, hogy melyek a konkrét időpontok (csak az számít, hogy időkülönbségük kettő legyen), így korrelációjuk is azonos, és emiatt e korreláció (szokták úgy is hívni: a kettő késleltetéshez tartozó korreláció) becsléséhez felhasználhatóak az (y 1, y 3 ), (y 2, y 4 ),...,(y T 2, y T ) párok értékei, és így tovább. (Tehát például minden háromdimenziós (stb.) vetületi eloszlás is azonos lesz, eltolástól függetlenül, csak ezek nem bírnak olyan nagy gyakorlati jelentőséggel, nincs is olyan közismert leírójuk, mint kétdimenziósoknál a korreláció.) Gyenge stacionaritás Az látható, hogy a felvázolt problémát az erős stacionaritás elfogadása megoldja, csak épp ezzel bizonyos értelemben átesünk a ló túloldalára : az erős stacionaritás olyan komplex követelményrendszer, hogy ellenőrzése lényegében reménytelen mintából. Éppen emiatt, a gyakorlati alkalmazásokban ehelyett inkább egy gyengített változatát szokás használni. A gyengítés motivációja, hogy csak azokat a követelményeket hagyjuk meg az erős

19 2.2. ERŐS ÉS GYENGE STACIONARITÁS 19 stacionaritásból, amelyek kézzelfogható statisztikai jellemzőkhöz kapcsolódnak: például a kétdimenziós eloszlásoknak van gyakorlati jelentőségük (fontos leírójuk kovariancia/korreláció), ám a három (és több) dimenziós eloszlásoknak nincs ilyen jellemzőjük, ezért kettőnél nagyobb dimenziójú vetületekre egyáltalán nem teszünk kikötést. Sőt, az egy- és kétdimenziós eloszlásoknál is enyhítünk a feltételeken: nem az eloszlások teljes egyezőségét követeljük meg, csak az első és második momentumban történő egyezést. (Kétdimenziós esetben az első momentumnak nincs értelme, a második momentum pedig a kovariancia lesz.) Mindezeket összefoglalva, és precízzé téve: egy idősort gyenge értelemben stacionáriusnak (vagy gyenge értelemben stacionernek) nevezünk, ha a következő három feltétel teljesül rá: 1. Minden időpontban ugyanaz az idősor várható értéke, tehát létezik a közös µ EY t várható érték (azaz µ t µ minden t-re). 2. Minden időpontban ugyanaz az idősor szórásnégyzete, tehát létezik a közös σ 2 D 2 Y t szórásnégyzet (azaz σ 2 t σ 2 minden t-re). 3. Két időpont közti kovariancia kizárólag a két időpont külöbségétől (a késleltetéstől) függ, tehát cov (Y t, Y s ) = cov (Y t+h, Y s+h ) minden értelmes h eltolásra (azaz a kétváltozós γ t,s függvény felírható egy egyváltozós függvényként úgy, hogy γ t,s = γ t s ). Azonnal látható, hogy egy az egyben az erős stacionaritás követelményeit ismételtük meg, csak épp mindössze egy- és kétdimenziós vetületekre, és mindössze első két momentumban történő egyezésre. (Szokás a gyenge stacionaritást kovariancia-stacionaritásnak is nevezni.) Észrevehető mellesleg, hogy ez a gyengítés pontosan összhangban van azzal, amit akkor tennénk, ha tudnánk, hogy az idősor többdimenziós normális eloszlású (és így persze minden vetületi eloszlása is (többdimenziós) normális). Ekkor ugyanis egyrészt az első két momentum teljesen meghatározza az eloszlást, másrészt pl. négy időpont együttes eloszlása teljesen determinált, ha ismerjük a belőlük kiválasztható összes pár eloszlását. (Hiszen az egyes időpontok várható értékén túl csak a kovarianciamátrixra van szükségünk (e kettő teljeskörűen leír egy többdimenziós normális eloszlást), márpedig az páronként számolható.) Magyarán: többdimenziós normális eloszlásnál semmilyen pluszt nem jelent a kettőnél több elemű vetületek, illetve a kettőnél nagyobb momentumok ismerete. A fentiekből tehát világos, hogy az erős stacionaritás fogalma valóban erősebb: az erősebb stacionaritás implikálja a gyengét 2. A fordított irány általában nem áll fenn (tehát a két fogalom nem ekvivalens), de az előző bekezdés fényében világos, hogy speciálisan többdimenziós normális eloszlású idősorra (ún. Gauss-folyamat) igen, ott tehát e két fogalom egybeesik. érteni. A továbbiakban, ha nem mondunk mást, stacionaritás alatt gyenge stacionaritást fogunk 2 Ez alól az egyetlen kivételt az jelenti, ha az idősor eloszlása az egyes időpontokban olyan, hogy annak nem létezik első vagy második momentuma. (Például: Cauchy-eloszlású.) Az erős stacionaritás definíciója ebben az esetben is teljesen változatlanul alkalmazható, viszont a gyenge stacionaritás definíciója értelmetlenné válik, hiszen a nem is létező momentumokra fog hivatkozni.

20 20 2. FEJEZET. STACIONARITÁS A 2.2. ábra példát mutat egy stacioner idősorra: adott, biztosan stacioner sokasági specifikációból 3 szimulációval generáltunk három trajektóriát. Érdemes megfigyelni a stacionaritási követelmények ránézésre történő teljesülését: nem úgy tűnik, mintha a trajektóriáknak lenne trendjük és szintén nem tűnik úgy, mintha a szórás változna. (Az autokorrelációk időfüggését nyilván kevésbé lehet szabad szemmel megítélni.) ábra. Példa stacionárius idősorra: három szimulált trajektória az Y t = 0,5+0,7 Y t 1 +u t, u t N (0, 3), beláthatóan stacionárius specifikációból 2.3. Stacionárius idősorok nevezetes jellemzőinek mintából történő becslése Ezen a ponton már világosan látható, hogy az 1.2. pontban bevezetett nevezetes jellemzőket (várható érték függvény, autokorreláció függvény stb.) miért csak a sokaságban definiáltuk: általános esetben a mintából történő becslésük reménytelen feladat (hiszen például m t becsléséhez egyetlen megfigyelésünk lenne... ). És itt válik érthetővé, hogy a stacionaritás miért volt fontos: ha ugyanis ezt elfogadjuk, akkor ezek a jellemzők máris becsülhetővé válnak! Ebben a pontban ezt a kérdéskört fogjuk áttekinteni. Ha egy idősor stacioner, úgy az előzőek alapján beszélhetünk az egyes komponenseinek közös 3 Ez a specifikáció egy ún. AR(1) folyamat, melyet később fogunk tárgyalni, itt most csak annyi fontos, hogy bizonyosan stacioner. Konkrét specifikációja: Y t = 0,5 + 0,7 Y t 1 + u t, u t N (0, 3).

21 2.3. STACIONÁRIUS IDŐSOROK JELLEMZŐINEK BECSLÉSE MINTÁBÓL 21 µ EY t várható értékéről. Ennek becslése minta alapján nyilván: µ = 1 T T y t. t=1 Érdemes megfigyelni, ahogy kihasználjuk a stacionaritást! Ha az idősor nem lenne stacioner, akkor a különböző időpontokhoz tartozó értékek nem lennének felhasználhatóak közös becsléshez (különösen, hogy közös várható érték nem is létezne), viszont ha a közös várható érték létezését a priori tudjuk, akkor annak megbecsléséhez ugyanúgy jó az első időpont értéke, a második időpont értéke és így tovább. Egyszerűbben szólva, e feltételezés fényében ezek ugyanúgy használhatóak várható érték becslésére, mint egy keresztmetszeti esetben az idősor, ebből a szempontból, összetolható, a különböző időponthoz tartozó megfigyelések összeönthetőek (legalábbis a várható érték becsléséhez!). Ha egy idősor stacioner, úgy az előzőek alapján beszélhetünk az egyes komponenseinek közös σ 2 D 2 Y t szórásnégyzetéről is. Ennek becslése minta alapján nyilván: σ 2 = 1 T T (y t µ). t=1 (Itt már kihasználtuk, hogy a gyenge stacionaritás miatt létezik közös várható érték.) Megjegyezzük, hogy ez a képlet csak akkor adna torzítatlan becslést σ 2 -re, ha a várható érték helyett annak µ sokasági értékét, és nem µ mintából becsült értékét szerepeltettük volna. A fenti formában ez torzított becslést fog adni, igaz a torzítás az idősor hosszának növekedtével egyre kisebb lesz (teljesen analóg módon a keresztmetszeti szórásnégyzet-becsléssel), továbbá a becslő konzisztens is. Izgalmasabb a kovariancia/korreláció kérdése. Már utaltunk rá, hogy a különböző időpontok (mint az idősor egyes komponens valószínűségi változói) közötti kovarianciát autokovarianciának szokás nevezni. A gyenge stacionaritás tehát azt köti ki, hogy az Y t és Y s közötti autokovariancia kizárólag a k = s t különbségtől (a késleltetéstől) függ, t-től és s-től konkrétan nem. Az várható érték és a szórásnégyzet jellemző általában egy egyváltozós függvény volt, de speciálisan stacioner esetben nulla változóssá (azaz: konstans számmá) alakulnak azáltal, hogy eltűnik az időfüggés. Az autokovariancia ezzel szemben általában kétváltozós függvény volt, így stacioner esetben is függvény lesz, igaz már csak egyváltozós. Erről szól a következő definíció: egy idősor (empirikus) autokovariancia függvényének nevezzük a γ k = cov (Y 1, Y 1+k ) kifejezést, mely láthatóan k függvénye. Megismételjük, hogy ez a definíció gyenge stacionaritás esetén jogos, hiszen ekkor cov (Y 1, Y 1+k ) = cov (Y 2, Y 2+k ) =... = cov (Y T k, Y T ), így ezt joggal definálhatjuk a k késleltetéshez tartozó autokovarianciának. Az autokovariancia függvény becslése mintából: γ k = 1 T k (y t µ) (y t+k µ). T k t=1

22 22 2. FEJEZET. STACIONARITÁS (A gyenge stacionaritás feltételezése miatt természetesen támaszkodhattunk arra, hogy létezik közös várható érték.) Itt is elmondható, hogy ez a képlet a fenti formában torzított becslés γ k -ra (akkor lenne torzítatlan, ha µ helyett a sokasági érték, µ szerepelne), viszont konzisztens; de ezekkel a kérdésekkel nem foglalkozunk tovább. Itt is kihasználtuk a stacionaritást: ez tette lehetővé, hogy például az 1 késleltetéshez tartozó autokorreláció becsléséhez ugyanúgy használjuk az első és második időpontbeli értékekből képezett párt, a második és harmadik időpontbeli értékekből képezett párt, és így tovább, egészen az utolsó előtti és utolsó időpontbeli értékekből képezett párig. Látható, hogy minél nagyobb késleltetésre vagyunk kíváncsiak, annál kevesebb párból kell becsülnünk ez logikus is, 1 késleltetéshez az idősor hosszánál mindössze eggyel kevesebb pár található (első és másodiktól az utolsó előtti és utolsóig), T 1 késleltetéshez viszont már csak egyetlen egy (a legelső és a legutolsó). Az autokovarianciának ugyanaz a baja, mint keresztmetszeti esetnél a kovarianciának: a számértéke önmagában keveset mond. Emiatt, szintén a keresztmetszeti esethez hasonlóan, be szokás vezetni az autokorreláció fogalmát, ami gyenge stacionaritás esetén nyilván ρ k = γ k σ (kihasználtuk, hogy a szórás, épp a stacionaritás miatt, minden időpontban σ); mintából becsült 2 értéke előállítható az eddigiek felhasználásával: ρ k = γ k σ 2. Ezt a függvényt szokás (empirikus) autokorreláció-függvénynek (ACF, autocorrelation function) nevezni. (Emiatt néha ρ k helyett az AC k megnevezést is használják.) Az ACF kézenfekvően ábrázolható grafikusan, ha a vízszintes tengelyen k lehetséges értékeit, a függőleges tengelyen pedig az e késleltetésekhez tartozó autokorrelációt ábrázoljuk. (ρ 0 = 1 nyilván, ezért ezt nem szokás külön feltüntetni.) Ezt az ábrát, mely természetesen diszkrét függvény lesz, és így oszlopdiagrammal vagy hasonló módon jeleníthető meg, korrelogramnak szokás nevezni. A 2.3. ábra a 2.2. ábra kék színnel jelölt idősorának korrelogramját mutatja. Bár ábrázolni nem szokták, de általában az ACF-et negatív késleltetésekre is értelmezik. Először a stacionaritást, aztán a korreláció szimmetriáját használva adódik, hogy corr (Y t, Y t+k ) = corr (Y t k, Y t ) = corr (Y t, Y t k ), azaz azt kaptuk, hogy ρ k = ρ k. (Szebben megfogalmazva: az ACF egy páros függvény.) Szintén szoktak beszélni egy idősor parciális autokorrelációs függvényéről (PACF, partial autocorrelation function). Emlékezhetünk rá, hogy a parciális autokorrelációt nem két változó, hanem két változó és változók egy halmaza között értelmezzük; tartalma: a két változó közti kapcsolat erőssége és iránya ha köztük a megadott változókon keresztül terjedő hatásokat kiszűrjük. (Ezúttal sem fontos, hogy ezt pontosan hogyan valósíthatjuk meg, mindenesetre megvalósíthatjuk. Itt természetesen csak lineáris hatásokról beszélünk.) A PACF-függvényt is két időpont

23 2.3. STACIONÁRIUS IDŐSOROK JELLEMZŐINEK BECSLÉSE MINTÁBÓL 23 ACF for Y_t = 0,5 + 0,7 * Y_{t-1} + u_t 0,4 +- 1,96/T^0,5 0,2 0-0,2-0, lag 2.3. ábra. A 2.2. ábra kék PACF színű for Y_t idősorának = 0,5 + 0,7 * korrelogramja Y_{t-1} + u_t (ACF-függvénye) 0,4 +- 1,96/T^0,5 között számoljuk, a kérdés már csak az, hogy mik a kiszűrt változók. A válasz kézenfekvő: a két 0,2 0 0,4 időpont közötti időpontok (mint valószínűségi változók). Ennek megfelelően a 0 és 1 késleltetéshez tartozó PACF szükségképp ugyanaz, mint a megfelelő ACF (azaz 1 és ρ 1 rendre) hiszen -0,2 0,2 ilyenkor nincs mit kiszűrni. A PACF az ACF-hez hasonlóan becsülhető mintából, ezzel most -0,4 0 nem foglalkozunk. ACF for Y_t = 0,5 + 0,7 * Y_{t-1} + u_t 0-0, lag -0,4 A 2.4. ábra mutat egy parciális autokorrelációs (PACF) függvényt, ezúttal is a 2.2. ábra kék idősorának példáján. (Tehát ez, és az előző korrelogram összevethető, olyan értelemben, hogy ugyanahhoz az idősorhoz tartoznak.) Érdemes ellenőrizni előbbi megjegyzésünket arról, hogy az késleltetéshez tartozó ACF és PACF megegyezik. lag +- 1,96/T^0,5 PACF for Y_t = 0,5 + 0,7 * Y_{t-1} + u_t 0,4 +- 1,96/T^0,5 0,2 0-0,2-0, lag 2.4. ábra. A 2.2. ábra kék színű idősorának parciális autokorrelációs (PACF) függvénye Végül még egy fontos kérdéskörről kell beszélnünk: az egyes korrelációk szignifikanciájáról. Mintából számolt értékek esetén (mint amilyen az empirikus autokorreláció és parciális autokorreláció) ugyanis soha nem tudhatjuk, hogy mi a valós (értsd: sokasági) értéke a jellemzőnek. A mintából számolt értékeket terheli a mintavételi ingadozás, azaz az a jelenség, hogy a mintából számolt jellemző értéke nem csak a sokasági jellemző értékétől függ, hanem attól is, hogy pont milyen mintát sikerült vennünk (még akkor is, ha a mintavétel tökéletes volt).

24 24 2. FEJEZET. STACIONARITÁS Hiába látjuk tehát például a 2.3. ábrán, hogy az idősor 1 késleltetéshez tartozó autokorrelációja mintegy ρ k = 0,4, nem tudhatjuk, hogy az valójában (értsd: a sokaságban, a valószínűségi változókkal megadott elméleti idősorban) mennyi (a ρ k ). Lehet, hogy 0,3, csak mi pont olyan mintát vettünk, amiben kicsit jobban korreláltak voltak az egymást követő elemek, lehet, hogy 0,5, csak mi pont olyan mintát vettünk, amiben kicsit kevésbé voltak korreláltak az egymást követő elemek, és persze az is lehet, hogy véletlenül épp 0,4. Erről nem tudunk biztos döntést hozni, csak valószínűségit: statisztikai próbát kell alkalmaznunk. A gyakorlatban legfontosabb kérdés, hogy elképzelhető-e, hogy egy adott késleltetéshez tartozó autokorreláció valódi (sokasági) értéke épp nulla (tehát, hogy nincs is azon a késleltetésen autokorreláció). A H 0 : ρ k = 0 H 1 : ρ k 0 hipotézispárra lehetséges statisztikai tesztet szerkeszteni. Egy közelítő (de nem túl kis mintaméretnél azaz idősor-hosszúságnál már elfogadható) megoldás a normális approximáció használata: az az észrevétel, hogy ha egy adott autokorreláció sokasági értéke ρ k, akkor egy sokaságból vett mintán kiszámolt ρ k eloszlása közelítőleg normális lesz ρ k várható értékkel és 1 T szórásnégyzettel (azaz ρ k N ( ρ k, 1/T ) a mintavételi eloszlás), így ρ k ρ k 1/ N (0, 1). Ez alapján a T tesztstatisztika és nulleloszlása (emlékezzünk rá, hogy a nullhipotézis feltételezése, hogy ρ k = 0): ρ k 1/ T N (0, 1). Ha tehát α szignifikanciaszinten [ szeretnénk ] dönteni, akkor azt kell megvizsgálnunk, hogy a ρ k 1/ benne van-e a z T 1 α/2, +z 1 α/2 intervallumban, avagy kívül esik ±z 1 α/2 -n. Ugyanez [ ] 1 másképp megfogalmazva: ρ k benne van-e a z 1 α/2 1 T, +z 1 α/2 T intervallumban, avagy 1 kívül esik ±z 1 α/2 T -n. Ez utóbbi megfogalmazás előnye, hogy segíti az összehasonlíthatóságot: a korrelogramon min- 1 den további nélkül feltüntethetőek a ±z 1 α/2 T határok, és mivel azokat a korrelogramon ábrázolt ρ k -kal kell összevetni, így a hipotézis vizuálisan is megvizsgálható: ha egy oszlop kilóg 1 a ±z 1 α/2 T sávból, akkor az szignifikáns (értve ez alatt azt, hogy adott szignifikanciaszinten elvethető a nullhipotézis, miszerint az autokorreláció sokasági értéke nulla: akkora a mintából számolt érték eltérése a nullától, hogy nem hihető, hogy az csak a mintavételi ingadozásnak lenne betudható, arra kell gondolnunk, hogy a sokasági érték sem nulla), ha benne van ebben a sávban, akkor inszignifikáns (elfogadható adott szignifikanciaszinten, hogy az autokorreláció sokasági értéke nulla, és csak a mintavételi ingadozás miatt nem nullát kaptunk a mintából számolva). Nem túl meglepő módon pontosan ezek azok a sávok, amik a 2.3. és a 2.4. ábrákon kékkel behúzva láthatóak, amint a jobb felső sarokban lévő felirat is mutatja. (Ebből az is kiderül, hogy itt z 1 α/2 = 1,96, tehát 5 %-os szignifikanciaszintre vonatkoznak.)

25 2.3. STACIONÁRIUS IDŐSOROK JELLEMZŐINEK BECSLÉSE MINTÁBÓL 25 Egy további fontos kérdés van, amit ennek kapcsán meg kell beszélni. A fent vázolt módszer rendkívüli módon csábít arra, hogy végignézzük az oszlopokat, és ha bárhol kilógót látunk, akkor megörüljünk, hogy találtunk egy szignifikáns autokorrelációt. Ez azonban rendkívül félrevezető lehet, ugyanis tipikus példa a többszörös összehasonlítások helyzetére (multiple comparisons). Amikor ugyanis végignézünk az ábrán, akkor valójában mi bár szinte tudattalan módon, implicite, de hipotézisvizsgálatok sokaságát hajtjuk végre (egész pontosan annyit, ahány késleltetésre készült a korrelogram, a fenti példákban tehát 20-at). Ilyen esetben azonban nem tehetjük meg, hogy megnézzük, hogy van-e szignifikáns különbség, és ha igen, akkor kijelentjük, hogy találtunk szignifikáns autokorrelációt! Ennek az oka abban keresendő, hogy minden egyes hipotézisvizsgálatnak (külön-külön) van elsőfajú hibája. Ha például 5 %-on végeztük a hipotézisvizsgálatot, akkor az egyúttal azt is jelenti, hogy minden egyes teszt (külön-külön) 5 % valószínűséggel akkor is szignifikáns autokorrelációt jelez, ha az valójában nincsen. Ha két tesztet végzünk (például két késleltetést vizsgálunk meg), akkor annak a valószínűsége, hogy legalább az egyik szignifikáns autokorrelációt fog jelezni annak ellenére, hogy egyik késleltetésen sincs autokorreláció 1 (1 0,05) 2 = 0,0975, tehát 10 % kishíján az eredeti szignifikanciaszint duplája! (Az egyszerűség kedvéért most feltételeztük, hogy a tesztek függetlenek.) Ez a jelenség az ún. α-infláció. 20 tesztnél ez a valószínűség már 64 %, tehát az lenne a meglepőbb, ha nem találnák egyetlen szignifikáns eredményt sem (miközben ugye azt feltételeztük, hogy valójában nincs ilyen!). Másként megfogalmazva azt is mondhatnánk, hogy 5 %-os szignifikanciaszinten döntve 20 tesztből várhatóan épp 1 a fals jelzések száma (tehát várhatóan 1 teszt fog még akkor is szignifikanciát jelezni, ha valójában mind a 20 esetben a nullhipotézis áll fenn). Emiatt nem tehetjük meg, hogy kiragadunk egy eredményt ha 20 késleltetésből 1 szignifikáns, azt nem feltétlenül nevezhetjük találatnak, hiszen vegyük észre, hogy ez pont megfelel annak, amit akkor várhatunk, ha egyetlen késleltetésen sincs autokorreláció! (Persze éppenséggel ettől még lehet történetesen valódi szignifikancia is, ezt ne felejtsük el.) Éppen ezért, ha a kérdésfeltevésünk az, hogy az autokorreláció késleltetések egy egész csoportjára együttesen is nulla-e (tipikusan ez a csoport az első valahány autokorreláció, tehát azon ρ t autokorrelációk melyre 1 t M), akkor ennek eldöntésére nem az a helyes mód, ha a fenti tesztet minden késleltetésre megismételjük. Ehelyett külön tesztet kell szerkeszteni a H 0 : ρ 1 = ρ 2 =... = ρ M = 0 nullhipotézis ellenőrzésére. A legnépszerűbb erre 4 az ún. Ljung Box-teszt (vagy Ljung Box Q); tesztstatisztikája és nulleloszlása: Q = T (T + 2) M k=1 2 ρ k H 0 χ 2 T k M 4 E teszt elődje a Box Pierce-teszt volt, melynek tesztstatisztikája és nulleloszlása: Q = T M k=1 ρ k 2 H 0 χ 2 M. Jobb kismintás tulajdonságai miatt ezt szinte teljesen felváltotta a Ljung Box-teszt.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,

Részletesebben

STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés

STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés Mit nevezünk idősornak? STATISZTIKA 10. Előadás Idősorok analízise Egyenlő időközökben végzett megfigyelések A sorrend kötött, y 1, y 2 y t y N N= időpontok száma Minden időponthoz egy adat, reprodukálhatatlanság

Részletesebben

Alapfogalmak. Trendelemzés Szezonalitás Modellek. Matematikai statisztika Gazdaságinformatikus MSc október 29. 1/49

Alapfogalmak. Trendelemzés Szezonalitás Modellek. Matematikai statisztika Gazdaságinformatikus MSc október 29. 1/49 Matematikai statisztika Gazdaságinformatikus MSc 8. előadás 2018. október 29. 1/49 alapfogalmak Elméleti idősor - valószínűségi változók egy indexelt {X t, t T } családja, avagy időtől függő véletlen mennyiség.

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

7-8-9. előadás Idősorok elemzése

7-8-9. előadás Idősorok elemzése Idősorok elemzése 7-8-9. előadás 2015. október 19-26. és november 2. Idősor fogalma sokasági szemlélet: elméleti idősor - valószínűségi változók egy indexelt {Y t, t T } családja, avagy időtől függő véletlen

Részletesebben

A maximum likelihood becslésről

A maximum likelihood becslésről A maximum likelihood becslésről Definíció Parametrikus becsléssel foglalkozunk. Adott egy modell, mellyel elképzeléseink szerint jól leírható a meghatározni kívánt rendszer. (A modell típusának és rendszámának

Részletesebben

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI MÉRÉSI EREDMÉYEK POTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI. A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk

Részletesebben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

Diagnosztika és előrejelzés

Diagnosztika és előrejelzés 2018. november 28. A diagnosztika feladata A modelldiagnosztika alapfeladatai: A modellillesztés jóságának vizsgálata (idősoros adatok esetén, a regressziónál már tanultuk), a reziduumok fehérzaj voltának

Részletesebben

Idősoros elemzés minta

Idősoros elemzés minta Idősoros elemzés minta Ferenci Tamás, tamas.ferenci@medstat.hu A felhasznált adatbázisról Elemzésemhez a francia frank árfolyamának 1986.01.03. és 1993.12.31. közötti értékeit használtam fel, mely idősorban

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

Kabos: Statisztika II. ROC elemzések 10.1. Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Kabos: Statisztika II. ROC elemzések 10.1. Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem. Kabos: Statisztika II. ROC elemzések 10.1 ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás szóhasználatával A riasztóberendezés érzékeli, ha támadás jön, és ilyenkor riaszt. Máskor nem. TruePositiveAlarm:

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I. Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Kvantitatív statisztikai módszerek Petrovics Petra Többváltozós lineáris regressziós

Részletesebben

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az

Részletesebben

Adatok statisztikai értékelésének főbb lehetőségei

Adatok statisztikai értékelésének főbb lehetőségei Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció

Részletesebben

Többváltozós lineáris regressziós modell feltételeinek

Többváltozós lineáris regressziós modell feltételeinek Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p

Részletesebben

Szezonális ingadozás. (Stacionárius idősoroknál, ahol nem beszélhetünk trendről, csak a véletlen hatást kell kiszűrni. Ezzel nem foglalkozunk)

Szezonális ingadozás. (Stacionárius idősoroknál, ahol nem beszélhetünk trendről, csak a véletlen hatást kell kiszűrni. Ezzel nem foglalkozunk) Szezonalitás Szezonális ingadozás Rendszeresen ismétlődő, azonos hullámhosszú és szabályos amplitúdóú, többnyire rövid távú ingadozásokat tekintük. Vizsgálatukkor a dekompozíciós modellekből a trend és

Részletesebben

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Matematikai statisztika c. tárgy oktatásának célja és tematikája Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:

Részletesebben

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,

Részletesebben

KOVÁCS BÉLA, MATEMATIKA I.

KOVÁCS BÉLA, MATEMATIKA I. KOVÁCS BÉLA, MATEmATIkA I. 4 IV. FÜGGVÉNYEk 1. LEkÉPEZÉSEk, függvények Definíció Legyen és két halmaz. Egy függvény -ből -ba egy olyan szabály, amely minden elemhez pontosan egy elemet rendel hozzá. Az

Részletesebben

Exponenciális kisimítás. Üzleti tervezés statisztikai alapjai

Exponenciális kisimítás. Üzleti tervezés statisztikai alapjai Exponenciális kisimítás Üzleti tervezés statisztikai alapjai Múlt-Jelen-Jövő kapcsolat Egyensúlyi helyzet Teljes konfliktus Részleges konfliktus: 0 < α < 1, folytatódik a múlt, de nem változatlanul módosítás:

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kettőnél több csoport vizsgálata. Makara B. Gábor Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10

Részletesebben

Idősoros elemzés. Ferenci Tamás, ft604@hszk.bme.hu 2009. január 7.

Idősoros elemzés. Ferenci Tamás, ft604@hszk.bme.hu 2009. január 7. Idősoros elemzés Ferenci Tamás, ft604@hszk.bme.hu 2009. január 7. A felhasznált adatbázisról Elemzésemhez a tanszéki honlapon rendelkezésre bocsátott TimeSeries.xls idősoros adatgyűjtemény egyik idősorát,

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció:

Részletesebben

GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TáTK Közgazdaságtudományi Tanszékén, az ELTE Közgazdaságtudományi Tanszék, az MTA Közgazdaságtudományi

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs

Részletesebben

A Statisztika alapjai

A Statisztika alapjai A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati

Részletesebben

Segítség az outputok értelmezéséhez

Segítség az outputok értelmezéséhez Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem agy számok törvényei Statisztikai mintavétel Várható érték becslése Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem A mérés mint statisztikai mintavétel A méréssel az eloszlásfüggvénnyel

Részletesebben

A mérési eredmény megadása

A mérési eredmény megadása A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk meg: a determinisztikus és a véletlenszerű

Részletesebben

Valószínűségi változók. Várható érték és szórás

Valószínűségi változók. Várható érték és szórás Matematikai statisztika gyakorlat Valószínűségi változók. Várható érték és szórás Valószínűségi változók 2016. március 7-11. 1 / 13 Valószínűségi változók Legyen a (Ω, A, P) valószínűségi mező. Egy X :

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Kettőnél több csoport vizsgálata Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet Gyógytápszerek (kilokalória/adag) Három gyógytápszer A B C 30 5 00 10 05 08 40 45 03 50 35 190 Kérdések: 1. Van-e

Részletesebben

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet GVMST22GNC Statisztika II. 3. előadás: 8. Hipotézisvizsgálat Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Hipotézisvizsgálat v becslés Becslés Ismeretlen paraméter Közeĺıtő

Részletesebben

Autoregresszív és mozgóátlag folyamatok. Géczi-Papp Renáta

Autoregresszív és mozgóátlag folyamatok. Géczi-Papp Renáta Autoregresszív és mozgóátlag folyamatok Géczi-Papp Renáta Autoregresszív folyamat Az Y t diszkrét paraméterű sztochasztikus folyamatok k-ad rendű autoregresszív folyamatnak nevezzük, ha Y t = α 1 Y t 1

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

Idősorok elemzése november 14. Spektrálelemzés, DF és ADF tesztek. Idősorok elemzése

Idősorok elemzése november 14. Spektrálelemzés, DF és ADF tesztek. Idősorok elemzése Spektrálelemzés, DF és ADF tesztek 2017. november 14. SPEKTRÁL-ELEMZÉS Példa - BKV villamosenergia-terhelési görbéje Figure: BKV villamosenergia-terhelési görbéje, negyedóránkénti mérések (2 hét adatai,

Részletesebben

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége [GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell

Részletesebben

(Independence, dependence, random variables)

(Independence, dependence, random variables) Két valószínűségi változó együttes vizsgálata Feltételes eloszlások Két diszkrét változó együttes eloszlása a lehetséges értékpárok és a hozzájuk tartozó valószínűségek (táblázat) Példa: Egy urna 3 fehér,

Részletesebben

Autoregresszív és mozgóátlag folyamatok

Autoregresszív és mozgóátlag folyamatok Géczi-Papp Renáta Autoregresszív és mozgóátlag folyamatok Autoregresszív folyamat Az Y t diszkrét paraméterű sztochasztikus folyamatok k-ad rendű autoregresszív folyamatnak nevezzük, ha Y t = α 1 Y t 1

Részletesebben

1. előadás. Lineáris algebra numerikus módszerei. Hibaszámítás Számábrázolás Kerekítés, levágás Klasszikus hibaanalízis Abszolút hiba Relatív hiba

1. előadás. Lineáris algebra numerikus módszerei. Hibaszámítás Számábrázolás Kerekítés, levágás Klasszikus hibaanalízis Abszolút hiba Relatív hiba Hibaforrások Hiba A feladatok megoldása során különféle hibaforrásokkal találkozunk: Modellhiba, amikor a valóságnak egy közelítését használjuk a feladat matematikai alakjának felírásához. (Pl. egy fizikai

Részletesebben

Az idősorok összetevői Trendszámítás Szezonalitás Prognosztika ZH

Az idősorok összetevői Trendszámítás Szezonalitás Prognosztika ZH Idősorok Idősor Statisztikai szempontból: az egyes időpontokhoz rendelt valószínűségi változók összessége. Speciális sztochasztikus kapcsolat; a magyarázóváltozó az idő Determinisztikus idősorelemzés esetén

Részletesebben

Ökonometria. Adminisztratív kérdések, bevezetés. Ferenci Tamás 1 tamas.ferenci@medstat.hu. Első fejezet. Budapesti Corvinus Egyetem

Ökonometria. Adminisztratív kérdések, bevezetés. Ferenci Tamás 1 tamas.ferenci@medstat.hu. Első fejezet. Budapesti Corvinus Egyetem Adminisztratív kérdések, bevezetés Ferenci Tamás 1 tamas.ferenci@medstat.hu 1 Statisztika Tanszék Budapesti Corvinus Egyetem Első fejezet Tartalom Technikai kérdések 1 Technikai kérdések Adminisztratív

Részletesebben

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H

Részletesebben

Miért fontos számunkra az előző gyakorlaton tárgyalt lineáris algebrai ismeretek

Miért fontos számunkra az előző gyakorlaton tárgyalt lineáris algebrai ismeretek Az november 23-i szeminárium témája Rövid összefoglaló Miért fontos számunkra az előző gyakorlaton tárgyalt lineáris algebrai ismeretek felfrissítése? Tekintsünk ξ 1,..., ξ k valószínűségi változókat,

Részletesebben

Az R halmazt a valós számok halmazának nevezzük, ha teljesíti az alábbi 3 axiómacsoport axiómáit.

Az R halmazt a valós számok halmazának nevezzük, ha teljesíti az alábbi 3 axiómacsoport axiómáit. 2. A VALÓS SZÁMOK 2.1 A valós számok aximómarendszere Az R halmazt a valós számok halmazának nevezzük, ha teljesíti az alábbi 3 axiómacsoport axiómáit. 1.Testaxiómák R-ben két művelet van értelmezve, az

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

A magyar teljesítménytúra-naptár fejlődése,

A magyar teljesítménytúra-naptár fejlődése, A magyar teljesítménytúra-naptár fejlődése, 28-216 Tartalomjegyzék Ferenci Tamás, tamas.ferenci@medstat.hu 217. február 2. Cél 1 Számítástechnikai megjegyzések 1 Eredmények 2 Túrák és túrázok száma..........................................

Részletesebben

Statisztika elméleti összefoglaló

Statisztika elméleti összefoglaló 1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11

Részletesebben

y ij = µ + α i + e ij

y ij = µ + α i + e ij Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

DIFFERENCIAEGYENLETEK

DIFFERENCIAEGYENLETEK DIFFERENCIAEGYENLETEK Példa: elsőrendű állandó e.h. lineáris differenciaegyenlet Ennek megoldása: Kezdeti feltétellel: Kezdeti feltétel nélkül ha 1 és a végtelen összeg (abszolút) konvergens: / 1 Minden

Részletesebben

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58 u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58 u- t- 2/58 eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ

Részletesebben

II. Két speciális Fibonacci sorozat, szinguláris elemek, természetes indexelés

II. Két speciális Fibonacci sorozat, szinguláris elemek, természetes indexelés II. Két speciális Fibonacci sorozat, szinguláris elemek, természetes indexelés Nagyon könnyen megfigyelhetjük, hogy akármilyen két számmal elindítunk egy Fibonacci sorozatot, a sorozat egymást követő tagjainak

Részletesebben

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz

Részletesebben

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x

Részletesebben

Statisztika 3. Dr Gősi Zsuzsanna Egyetemi adjunktus Koncentráció mérése Koncentráció általában a jelenségek tömörülését, összpontosulását értjük. Koncentráció meglétéről gyorsan tájékozódhatunk, ha sokaságot

Részletesebben

Elméleti összefoglalók dr. Kovács Péter

Elméleti összefoglalók dr. Kovács Péter Elméleti összefoglalók dr. Kovács Péter 1. Adatállományok létrehozása, kezelése... 2 2. Leíró statisztikai eljárások... 3 3. Várható értékek (átlagok) vizsgálatára irányuló próbák... 5 4. Eloszlások vizsgálata...

Részletesebben

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6. Matematikai geodéziai számítások 6. Lineáris regresszió számítás elektronikus távmérőkre Dr. Bácsatyai, László Matematikai geodéziai számítások 6.: Lineáris regresszió számítás elektronikus távmérőkre

Részletesebben

Bevezetés az ökonometriába

Bevezetés az ökonometriába Az idősorelemzés alapjai Gánics Gergely 1 gergely.ganics@freemail.hu 1 Statisztika Tanszék Budapesti Corvinus Egyetem Tizenegyedik előadas Tartalom Stacionaritás kérdései 1 Stacionaritás kérdései 2 3 (Nem)stacionaritás

Részletesebben

Mérési hibák 2006.10.04. 1

Mérési hibák 2006.10.04. 1 Mérési hibák 2006.10.04. 1 Mérés jel- és rendszerelméleti modellje Mérési hibák_labor/2 Mérési hibák mérési hiba: a meghatározandó értékre a mérés során kapott eredmény és ideális értéke közötti különbség

Részletesebben

Regressziós vizsgálatok

Regressziós vizsgálatok Regressziós vizsgálatok Regresszió (regression) Általános jelentése: visszaesés, hanyatlás, visszafelé mozgás, visszavezetés. Orvosi területen: visszafejlődés, involúció. A betegség tünetei, vagy maga

Részletesebben

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 15. Nemparaméteres próbák Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date: November

Részletesebben

Ökonometria. Dummy változók használata. Ferenci Tamás 1 tamas.ferenci@medstat.hu. Hetedik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék

Ökonometria. Dummy változók használata. Ferenci Tamás 1 tamas.ferenci@medstat.hu. Hetedik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék Dummy változók használata Ferenci Tamás 1 tamas.ferenci@medstat.hu 1 Statisztika Tanszék Budapesti Corvinus Egyetem Hetedik fejezet Tartalom IV. esettanulmány 1 IV. esettanulmány Uniós országok munkanélkülisége

Részletesebben

Többváltozós, valós értékű függvények

Többváltozós, valós értékű függvények TÖ Többváltozós, valós értékű függvények TÖ Definíció: többváltozós függvények Azokat a függvényeket, melyeknek az értelmezési tartománya R n egy részhalmaza, n változós függvényeknek nevezzük. TÖ Példák:.

Részletesebben

Készítette: Fegyverneki Sándor

Készítette: Fegyverneki Sándor VALÓSZÍNŰSÉGSZÁMÍTÁS Összefoglaló segédlet Készítette: Fegyverneki Sándor Miskolci Egyetem, 2001. i JELÖLÉSEK: N a természetes számok halmaza (pozitív egészek) R a valós számok halmaza R 2 {(x, y) x, y

Részletesebben

6. Előadás. Vereb György, DE OEC BSI, október 12.

6. Előadás. Vereb György, DE OEC BSI, október 12. 6. Előadás Visszatekintés: a normális eloszlás Becslés, mintavételezés Reprezentatív minta A statisztika, mint változó Paraméter és Statisztika Torzítatlan becslés A mintaközép eloszlása - centrális határeloszlás

Részletesebben

A leíró statisztikák

A leíró statisztikák A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az

Részletesebben

KOVÁCS BÉLA, MATEMATIKA I.

KOVÁCS BÉLA, MATEMATIKA I. KOVÁCS BÉLA, MATEmATIkA I. 1 I. HALmAZOk 1. JELÖLÉSEk A halmaz fogalmát tulajdonságait gyakran használjuk a matematikában. A halmazt nem definiáljuk, ezt alapfogalomnak tekintjük. Ez nem szokatlan, hiszen

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 2 II. A valószínűségi VÁLTOZÓ És JELLEMZÉsE 1. Valószínűségi VÁLTOZÓ Definíció: Az leképezést valószínűségi változónak nevezzük, ha

Részletesebben

Valószínűségszámítás összefoglaló

Valószínűségszámítás összefoglaló Statisztikai módszerek BMEGEVGAT Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:

Részletesebben

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6. Nyugat-magyarországi Egyetem Geoinformatikai Kara Dr. Bácsatyai László Matematikai geodéziai számítások 6. MGS6 modul Lineáris regresszió számítás elektronikus távmérőkre SZÉKESFEHÉRVÁR 2010 Jelen szellemi

Részletesebben

Korreláció és lineáris regresszió

Korreláció és lineáris regresszió Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.

Részletesebben

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek

Részletesebben

Swing Charting Játék az idővel (2.)

Swing Charting Játék az idővel (2.) Swing Charting Játék az idővel (2.) A megelőző cikkben olyan árfolyam ábrázolási és elemzési módszereket ismertettem, ahol az idő nem lineárisan, hanem az árfolyammozgás jelentősége alapján jelent meg.

Részletesebben

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus. Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza

Részletesebben

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás Véletlenszám generátorok és tesztelésük Tossenberger Tamás Érdekességek Pénzérme feldobó gép: $0,25-os érme 1/6000 valószínűséggel esik az élére 51% eséllyel érkezik a felfelé mutató oldalára Pörgetésnél

Részletesebben

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 9. előadás Előadó: Dr. Ertsey Imre Statisztikai hipotézis vizsgálatok elsősorban a biometriában alkalmazzák, újabban reprezentatív jellegű ökonómiai vizsgálatoknál, üzemi szinten élelmiszeripari

Részletesebben

Háromszögek fedése két körrel

Háromszögek fedése két körrel SZTE Bolyai Intézet, Geometria Tanszék 2010. április 24. Motiváció Jól ismert a kerületi szögek tétele, vagy más megfogalmazásban a látókörív tétel. Motiváció A tételből a következő állítás adódik: Motiváció

Részletesebben

Az eltérő hajlású szarufák és a taréjszelemen kapcsolatáról 1. rész. Eltérő keresztmetszet - magasságú szarufák esete

Az eltérő hajlású szarufák és a taréjszelemen kapcsolatáról 1. rész. Eltérő keresztmetszet - magasságú szarufák esete 1 Az eltérő hajlású szarufák és a taréjszelemen kapcsolatáról 1. rész Eltérő keresztmetszet - magasságú szarufák esete Az alábbi ábrát találtuk az interneten 1. ábra 1. ábra forrás( ok ): http://www.sema-soft.com/de/forum/files/firstpfettenverschiebung_432.jpg

Részletesebben

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23 TARTALOMJEGYZÉK 1. téma Átlagbecslés (Barna Katalin).... 7 2. téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23 3. téma Összefüggések vizsgálata, korrelációanalízis (Dr. Molnár Tamás)... 73 4. téma Összefüggések

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

KOVÁCS BÉLA, MATEMATIKA I.

KOVÁCS BÉLA, MATEMATIKA I. KOVÁCS BÉLA MATEmATIkA I 6 VI KOmPLEX SZÁmOk 1 A komplex SZÁmOk HALmAZA A komplex számok olyan halmazt alkotnak amelyekben elvégezhető az összeadás és a szorzás azaz két komplex szám összege és szorzata

Részletesebben

LINEÁRIS PROGRAMOZÁSI FELADATOK MEGOLDÁSA SZIMPLEX MÓDSZERREL

LINEÁRIS PROGRAMOZÁSI FELADATOK MEGOLDÁSA SZIMPLEX MÓDSZERREL LINEÁRIS PROGRAMOZÁSI FELADATOK MEGOLDÁSA SZIMPLEX MÓDSZERREL x 1-2x 2 6 -x 1-3x 3 = -7 x 1 - x 2-3x 3-2 3x 1-2x 2-2x 3 4 4x 1-2x 2 + x 3 max Alapfogalmak: feltételrendszer (narancs színnel jelölve), célfüggvény

Részletesebben

Gyakorlat: Sztochasztikus idősor-elemzés alapfogalmai II. Egységgyök-folyamatok és tesztek. Dr. Dombi Ákos

Gyakorlat: Sztochasztikus idősor-elemzés alapfogalmai II. Egységgyök-folyamatok és tesztek. Dr. Dombi Ákos Gyakorlat: Sztochasztikus idősor-elemzés alapfogalmai II. Egységgyök-folyamatok és tesztek Dr. Dombi Ákos (dombi@finance.bme.hu) ESETTANULMÁNY 1. Feladat: OTP részvény átlagárfolyamának (Y=AtlAr) stacionaritás

Részletesebben

Bevezetés a hipotézisvizsgálatokba

Bevezetés a hipotézisvizsgálatokba Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -

Részletesebben

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE Tartalomjegyzék 5 Tartalomjegyzék Előszó I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE 1. fejezet: Kontrollált kísérletek 21 1. A Salk-oltás kipróbálása 21 2. A porta-cava sönt 25 3. Történeti kontrollok 27 4. Összefoglalás

Részletesebben

KÖVETKEZTETŐ STATISZTIKA

KÖVETKEZTETŐ STATISZTIKA ÁVF GM szak 2010 ősz KÖVETKEZTETŐ STATISZTIKA A MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 ősz Utoljára módosítva: 2010-09-07 ÁVF Oktató: Lipécz György 1 A becslés alapfeladata Pl. Hányan láttak

Részletesebben

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes

Részletesebben

Mérési adatok illesztése, korreláció, regresszió

Mérési adatok illesztése, korreláció, regresszió Mérési adatok illesztése, korreláció, regresszió Korreláció, regresszió Két változó mennyiség közötti kapcsolatot vizsgálunk. Kérdés: van-e kapcsolat két, ugyanabban az egyénben, állatban, kísérleti mintában,

Részletesebben

Centrális határeloszlás-tétel

Centrális határeloszlás-tétel 13. fejezet Centrális határeloszlás-tétel A valószínűségszámítás legfontosabb állításai azok, amelyek független valószínűségi változók normalizált összegeire vonatkoznak. A legfontosabb ilyen tételek a

Részletesebben

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető! BGF KKK Módszertani Intézeti Tanszéki Osztály Budapest, 2012.. Név:... Neptun kód:... Érdemjegy:..... STATISZTIKA II. VIZSGADOLGOZAT Feladatok 1. 2. 3. 4. 5. 6. Összesen Szerezhető pontszám 21 20 7 22

Részletesebben

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Galbács Gábor KIUGRÓ ADATOK KISZŰRÉSE STATISZTIKAI TESZTEKKEL Dixon Q-tesztje Gyakori feladat az analitikai kémiában, hogy kiugrónak

Részletesebben

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1. Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,

Részletesebben

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.

Részletesebben