Sztochasztikus modellek vizsgálata. Baran Sándor

Hasonló dokumentumok
Miért fontos számunkra az előző gyakorlaton tárgyalt lineáris algebrai ismeretek

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A következő feladat célja az, hogy egyszerű módon konstruáljunk Poisson folyamatokat.

1. Példa. A gamma függvény és a Fubini-tétel.

Készítette: Fegyverneki Sándor

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A maximum likelihood becslésről

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

Valószínűségelmélet. Pap Gyula. Szegedi Tudományegyetem. Szeged, 2016/2017 tanév, I. félév

Fraktálok. Kontrakciók Affin leképezések. Czirbusz Sándor ELTE IK, Komputeralgebra Tanszék. TARTALOMJEGYZÉK Kontrakciók Affin transzformációk

Sztochasztikus folyamatok alapfogalmak

Funkcionálanalízis. n=1. n=1. x n y n. n=1

Matematika A2 vizsga mgeoldása június 4.

Vektorok, mátrixok, lineáris egyenletrendszerek

minden x D esetén, akkor x 0 -at a függvény maximumhelyének mondjuk, f(x 0 )-at pedig az (abszolút) maximumértékének.

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Valószínűségszámítás összefoglaló

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

1/1. Házi feladat. 1. Legyen p és q igaz vagy hamis matematikai kifejezés. Mutassuk meg, hogy

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

Boros Zoltán február

Centrális határeloszlás-tétel

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Mérhetőség, σ-algebrák, Lebesgue Stieltjes-integrál, véletlen változók és eloszlásfüggvényeik

Abszolút folytonos valószín ségi változó (4. el adás)

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

17. előadás: Vektorok a térben

Markov-láncok stacionárius eloszlása

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Sorozatok, sorok, függvények határértéke és folytonossága Leindler Schipp - Analízis I. könyve + jegyzetek, kidolgozások alapján

f(x) vagy f(x) a (x x 0 )-t használjuk. lim melyekre Mivel itt ɛ > 0 tetszőlegesen kicsi, így a a = 0, a = a, ami ellentmondás, bizonyítva

Gazdasági matematika II. vizsgadolgozat, megoldással,

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

előadás Diszkrét idejű tömegkiszolgálási modellek Poisson-folyamat Folytonos idejű Markov-láncok Folytonos idejű sorbanállás

LNM folytonos Az interpoláció Lagrange interpoláció. Lineáris algebra numerikus módszerei

5. előadás - Regressziószámítás

Explicit hibabecslés Maxwell-egyenletek numerikus megoldásához

1. Absztrakt terek 1. (x, y) x + y X és (λ, x) λx X. műveletek értelmezve vannak, és amelyekre teljesülnek a következő axiómák:

Matematikai statisztika I. témakör: Valószínűségszámítási ismétlés

Least Squares becslés

Felügyelt önálló tanulás - Analízis III.

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

A sorozat fogalma. függvényeket sorozatoknak nevezzük. Amennyiben az értékkészlet. az értékkészlet a komplex számok halmaza, akkor komplex

Alapfogalmak, valós számok Sorozatok, határérték Függvények határértéke, folytonosság A differenciálszámítás Függvénydiszkusszió Otthoni munka

Irányításelmélet és technika II.

VEKTORTEREK I. VEKTORTÉR, ALTÉR, GENERÁTORRENDSZER október 15. Irodalom. További ajánlott feladatok

Itô-formula. A sztochasztikus folyamatok egyik legfontosabb formulája. Medvegyev Péter Matematika tanszék

BIOMATEMATIKA ELŐADÁS

Megoldott feladatok november 30. n+3 szigorúan monoton csökken, 5. n+3. lim a n = lim. n+3 = 2n+3 n+4 2n+1

Lineáris algebra numerikus módszerei

ANALÍZIS III. ELMÉLETI KÉRDÉSEK

3. előadás Stabilitás

Differenciálegyenletek numerikus megoldása

3. Lineáris differenciálegyenletek

Fraktálok. Hausdorff távolság. Czirbusz Sándor ELTE IK, Komputeralgebra Tanszék március 14.

Norma Determináns, inverz Kondíciószám Direkt és inverz hibák Lin. egyenletrendszerek A Gauss-módszer. Lineáris algebra numerikus módszerei

Statisztika elméleti összefoglaló

ismertetem, hogy milyen probléma vizsgálatában jelent meg ez az eredmény. A kérdés a következő: Mikor mondhatjuk azt, hogy bizonyos események közül

1. Házi feladat. Határidő: I. Legyen f : R R, f(x) = x 2, valamint. d : R + 0 R+ 0

3. Fuzzy aritmetika. Gépi intelligencia I. Fodor János NIMGI1MIEM BMF NIK IMRI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Principal Component Analysis

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Feladatok a Gazdasági matematika II. tárgy gyakorlataihoz

T obbv altoz os f uggv enyek integr alja. 3. r esz aprilis 19.

10. Előadás. 1. Feltétel nélküli optimalizálás: Az eljárás alapjai

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás)

Valószínűségi változók. Várható érték és szórás

(Independence, dependence, random variables)

Matematika I. NÉV:... FELADATOK:

Diszkrét Matematika. zöld könyv ): XIII. fejezet: 1583, 1587, 1588, 1590, Matematikai feladatgyűjtemény II. (

Matematika I. NÉV:... FELADATOK: 2. Határozzuk meg az f(x) = 2x 3 + 2x 2 2x + 1 függvény szélsőértékeit a [ 2, 2] halmazon.

1.7. Elsőrendű lineáris differenciálegyenlet-rendszerek

Bevezetés az algebrába 2 Differencia- és differenciálegyenlet-rendszerek

Barczy Mátyás és Pap Gyula

DIFFERENCIAEGYENLETEK

Lagrange és Hamilton mechanika

Diszkrét matematika II., 8. előadás. Vektorterek

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

ANALÍZIS III. ELMÉLETI KÉRDÉSEK

12. Mikor nevezünk egy részhalmazt nyíltnak, illetve zártnak a valós számok körében?

Matematika III előadás

Bevezetés az algebrába 2 Vektor- és mátrixnorma

Differenciálegyenlet rendszerek

Differenciaegyenletek

differenciálegyenletek

Valószín ségelmélet. Pap Gyula

8n 5 n, Értelmezési tartomány, tengelymetszetek, paritás. (ii) Határérték. (iii) Első derivált, monotonitás,

Matematika I. Vektorok, egyenesek, síkok

Meghatározás: Olyan egyenlet, amely a független változók mellett tartalmaz egy vagy több függvényt és azok deriváltjait.

valós számot tartalmaz, mert az ilyen részhalmazon nem azonosság.

1. Számsorok, hatványsorok, Taylor-sor, Fourier-sor

Átírás:

Sztochasztikus modellek vizsgálata Habilitációs értekezés tézisei Baran Sándor Debreceni Egyetem Debrecen, 2005

Tartalomjegyzék Bevezetés 1 1. Regressziós modellek paraméterbecslései 3 1.1. Klasszikus regressziós modellek........................ 3 1.1.1. Lineáris modell............................. 3 1.1.2. Nemlineáris modell........................... 5 1.2. A lineáris hiba a változóban modell...................... 7 2. Folytonos sztochasztikus modellek 9 2.1. O-U folyamatok eltolásparaméterének becslése................ 9 2.1.1. Ornstein-Uhlenbeck folyamatok.................... 9 2.1.2. Ornstein-Uhlenbeck mezők....................... 12 2.1.3. Diszkrét approximáció......................... 15 2.2. A Wiener mező eltolásparaméterének becslése................ 16 2.2.1. Véges minták Radon Nikodym deriváltjai.............. 17 2.2.2. A folytonos megfigyelésekből származó becslés............ 18 3. Térbeli AR folyamatok paraméterbecslése 21 Bevezetés....................................... 21 3.1. Térbeli egyparaméteres autoregresszív modell................ 22 3.1.1. Kovarianciastruktúra.......................... 22 3.1.2. A becslés aszimptotikája........................ 24 3.2. Térbeli AR modellek közel instabil sorozata................. 25 3.2.1. Kovarianciastruktúra.......................... 26 3.2.2. A becslés aszimptotikája........................ 26 3.3. Térbeli kétparaméteres autoregresszív modell................. 27 3.3.1. Kovarianciastruktúra.......................... 27 3.3.2. A becslés aszimptotikája........................ 29 4. Alkalmazott statisztikai munkák 31 4.1. Sztochasztikus optimalizáció egy alkalmazása................. 31 4.1.1. Hiányosan megfigyelt Markov láncok................. 31 4.1.2. Szimulált hőkezelés........................... 32 4.1.3. Diszkrét geológiai struktúrák Markov mezős modellezése...... 33 4.2. A Down-szindróma valószínűsége....................... 36 4.2.1. A vizsgált modell............................ 36 4.2.2. A paraméterek becslése......................... 37 iii

iv TARTALOMJEGYZÉK 4.2.3. Eredmények............................... 38 Irodalomjegyzék 39

Jelölések g regressziós görbe y a regresszió függő változója x a regresszió magyarázó változója ε a regresszió hibája Θ paraméter halmaz β 0 a β ismeretlen paraméter valódi értéke 2 g(x,β) a g függvény β szerinti Jacobi mátrixa β β N természetes számok halmaza Z egész számok halmaza R valós számok halmaza R d d-dimenziós euklideszi tér S egy Markov lánc vagy Markov mező állapottere B(A) az A R d halmazon definiált Borel σ-algebra R d euklideszi normája C(A B) az A halmazból a B halmazba ható folytonos függvények tere L 2 (A) az A halmazon értelmezett négyzetesen integrálható függvények tere G a G halmaz határa I egység mátrix 1 csupa egyesből álló mátrix 0 csupa nullából álló mátrix Ā az A mátrix adjungáltja A az A mátrix transzponáltja (Ω, F, P) valószínűségi mező Var(x) az x szórásnégyzete vagy kovariancia mátrixa E várható érték E(ξ η) a ξ feltételes várható értéke η-ra nézve N (m, σ 2 ) m várható értékű és σ szórású normális eloszlás U(a, b) az [a, b] intervallumon értelmezett egyenletes eloszlás P X n X n L X 2 n X D X X l.i.m. W P X Ψ X n sztochasztikusan konvergál X-hez X n eloszlásban konvergál X-hez Xn négyzetes középben konvergál X-hez négyzetes középben vett határérték standard Wiener folyamat vagy standard Wiener mező az X folyamat által generált valószínűségi mérték egy Markov mező energiafüggvénye v

vi JELÖLÉSEK

Bevezetés A habilitációs cikkgyűjtemény a szerző 11 dolgozatát tartalmazza, melyek Ph.D. értekezése (lásd [12]) elkészülte után jelentek meg. Témájuk szerint e munkák négy nagy csoportba oszthatóak és ezt a beosztást követi ezen cikkgyűjtemény szerkezete is. Az első csoportot két dolgozat alkotja ([2] és [3]), melyekben a szerző a hagyományos és a hiba a változóban típusú regressziós modellek paraméterbecslésére vezet be új módszereket megvizsgálva azok aszimptotikus tulajdonságait. Ez a két dolgozat a szerző Ph.D. értekezéséhez kapcsolódó kutatómunkájának folytatásaként született és szorosan kapcsolódik az értekezésben szereplő öt munkához (lásd [13, 14, 15, 17] és [18]). A cikkgyűjtemény 2. fejezetében a szerzőnek a Wiener- illetve Ornstein-Uhlenbeck folyamatokkal kapcsolatos eredményei találhatóak, mely eredményeket Pap Gyulával és Martien van Zuijlennel közösen érte el ([4, 5, 6]). Ugyancsak e két társszerzővel közösen dolgozott a különböző térbeli autoregresszív mezők paraméterbecslései aszimptotikus tulajdonságainak meghatározásán (lásd [7, 8, 9]). Az ezen kutatások során kapott eredmények rövid összefoglalását a 3. fejezet tartalmazza. A 4. fejezet a szerző eddigi alkalmazott statisztikai munkáit foglalja össze, amik két jól elkülöníthető csoportba tartoznak. Az egyiket a sztochasztikus optimalizálással, azon belül is a szimulált hőkezelés módszerével foglalkozó két dolgozat alkotja, mely módszert Tommy Norberggel, Lars Rosénnal és Baran Ágnessel diszkrét geológiai struktúrák Markov mezőkkel való modellezésére alkalmazták ([1, 11]). A másik csoportba Veress Lajossal, a Debreceni Egyetem Nőgyógyászati Klinikájának tudományos munkatársával készített munka került (lásd [10]), amiben a szerzők egy olyan modellt írnak le és alkalmaznak helyi adatokra, melynek segítségével a várandós nők kora, α-fetoprotein, Human Chorialis Gonadotrophin és Graviditás Specifikus β1-glikoprotein szintje alapján megbecsülhető a Down szindróma bekövetkezésének valószínűsége. 1

2 BEVEZETE S

1. fejezet Regressziós modellek paraméterbecslései 1.1. Klasszikus regressziós modellek 1.1.1. Lineáris modell Tekintsük először a klasszikus y i = x i β 0 + ε i, i N, (1.1.1) alakú lineáris regressziós modellt, melynél az x i q-dimenziós független változóról és az ε i valós értékű hibáról feltesszük, hogy eloszása minden i N esetén megegyezik egy x illetve ε megfelelő dimenziós valószínűségi változó eloszlásával, valamint hogy a két sorozat független egymástól. Ily módon persze az {y i } is egy azonos eloszlású sorozat, eloszlása pedig megegyezik valamilyen y-nal jelölt skalár változó eloszlásával. Jelölje továbbá β 0 az y i és x i megfigyelések alapján megbecsülni kívánt β Θ R q paraméter valódi értékét. Tegyük még fel, hogy az x véletlen vektor eloszlása nem elfajuló, azaz tetszőleges β Θ esetén x (β β 0 ) szórása pozitív. A következő becslési módszert An, Hickernell és Zhu [20] vezette be. Legyen a w magfüggvény egy olyan sűrűségfüggvény, melyre w(t) = w( t), t > 0, t w(t)dt <, (1.1.2) ϕ w pedig jelölje a w Fourier transzformáltját. A β 0 paraméter β n becslése legyen az egyenlet egy megoldása, ahol A n (β) := 1 n 2 n l=1 s=1 A n ( β n ) = max β Θ A n(β) A módszer működése az alábbi elven alapul. Legyen n ( ϕ w yl y s (x l x s ) β ), β Θ. (1.1.3) ϕ(t, β) := E exp ( it(y x β) ) 3

4 1. FEJEZET. REGRESSZIÓS MODELLEK PARAMÉTERBECSLÉSEI és A(β) := ϕ(t, β) 2 w(t)dt. Könnyen látható, hogy az A n függvény az A függvény empirikus megfelelője, valamint hogy β 0 az A maximumhelye. Független, azonos eloszlású megfigyeléseket tételezve fel An, Hickernel és Zhu [20] igazolták, hogy n esetén A n (β) A(β) majdnem biztosan β-ban egyenletesen, belátva ezzel β n erős konzisztenciáját. Az An, Hickernel és Zhu [20] által megkövetelt függetlenség helyett tegyük most fel, hogy az (x i, ε i), i N, sorozat erősen keverő α(n) keverési együtthatókkal. Jelölje M l k az {x i, ε i : k i l} változók által generált σ-algebrát. Ekkor α(n):= sup α ( ( M k 1, Mk+n), ahol α M k 1, Mk+n) := sup P(BC) P(B)P(C). 1 k< B M k 1,C M k+n 1.1.1. Tétel. (Baran [2, Theorem 1]) Tegyük fel, hogy az (y i, x i ), i N, megfigyelések az (1.1.1) modellből származnak, a Θ paraméterhalmaz kompakt, az α(n) keverési együtthatókra pedig teljesül a α(n) < (1.1.4) n=1 keverési feltétel. Ekkor β n konzisztensen becsüli a β 0 valódi paraméterértéket, azaz n esetén β P n β 0. Az aszimptotikus normalitás igazolásához a (1.1.4) keverési feltételnél erősebbre van szükségünk. Tekintsük tehát a α ν/(2+ν) (k) < (1.1.5) k=1 feltételt, ahol ν valamely pozitív konstans. 1.1.2. Tétel. (Baran [2, Theorem 2]) Tegyük fel, hogy az (y i, x i ), i N, megfigyelések az (1.1.1) modellből származnak, a Θ paraméterhalmaz kompakt és konvex, β 0 a Θ halmaz belső pontja, a Var(x) mátrix pedig invertálható. Tegyük fel továbbá, hogy valamely ν > 0 konstans esetén E x 2+ν <, és ugyanezzel a konstanssal az (1.1.5) keverési feltétel is teljesül, valamint hogy a w magfüggvény pozitív egy a nulla körüli intervallumon és véges harmadik abszolút momentummal bír. Ezen kívül tegyük még fel, hogy ahol h(u, v) := lim n n 1 Var( n h(ξ k, δ k )) = Σ, k=1 t ( u Eξ )( sin(tv)e cos(tδ) cos(tv)e sin(tδ)w(t)dt, u R p, v R, a Σ mátrix pedig pozitív definit. Ebben az esetben, ha β n konzisztens, akkor aszimptotikusan normális is.

1.1. KLASSZIKUS REGRESSZIÓS MODELLEK 5 A vizsgált becslési módszer aszimptotikus tulajdonságainak elméleti igazolásán túl számítógépes szimuláció segítségével a becslést összevetjük a hagyományos legkisebb négyzetes becsléssel, valamint a nála robusztusabb legkisebb abszolút eltérést biztosító becsléssel is (lásd [2, Section 2]). 1.1.2. Nemlineáris modell Tekintsük most az y i = g(x i, β 0 ) + ε i, i N, (1.1.6) modellt, ahol g egy általunk ismert függvény, β 0 Θ R p, az {x i }, {y i } és {ε i } sorozatok pedig ugyanolyan tulajdonságokkal bírnak mint az (1.1.1) modell esetén. Az x elfajultságát kizáró feltétel helyett vezessük be az alábbit: A feltétel. Bármely β Θ, β β 0, esetén a g(x, β) g(x, β 0 ) valószínűségi változó nem elfajuló, azaz Var ( g(x, β) g(x, β 0 ) ) > 0. Ez utóbbi feltételre azért van szükség, hogy a modell különbséget tudjon tenni a β paraméter eltérő értékei között. Baran [3] több olyan példát is ismertet, amikor az (1.1.6) modell teljesíti az A feltételt. Az (1.1.4) becslőfüggvény helyett tekintsük most az à n (β) := 1 n 2 n n ( ϕ w yl y s (g(x l, β) g(x s, β)) ) (1.1.7) l=1 s=1 függvényt, a β 0 paraméter β n becslése pedig legyen ennek egy maximum helye. 1.1.3. Tétel. (Baran [3, Theorem 1]) Tegyük fel, hogy az (y i, x i ), i N, megfigyelések az (1.1.6) modellből származnak, mely teljesíti az A feltételt, a Θ paraméterhalmaz kompakt, g folytonos β-ban, E sup g(x, β) <, β Θ az (x i, ε i), i N, sorozat α(n) keverési együtthatóira pedig teljesül (1.1.4). Ekkor β n konzisztensen becsüli β 0 valódi paraméterértéket. Független megfigyelések esetén ettől erősebb állítás is igazolható. 1.1.4. Tétel. (Baran [3, Theorem 2]) Tegyük fel, hogy az (y i, x i ), i N, független megfigyelések az (1.1.6) modellből származnak, mely teljesíti az A feltételt, közös eloszlásuk pedig abszolút folytonos az R q+1 téren értelmezett Lebesgue mértékre nézve. Tegyük továbbá fel, hogy Θ kompakt, g(u, β) differenciálható u-ban és g(u,β) mindkét változójában folytonos. Mindezek mellett tegyük még fel, hogy ϕ w differenciálható u és dϕ w(v) dv <. dv Ekkor a β n a β 0 paraméter erősen konzisztens becslése, azaz n esetén β n β 0 majdnem biztosan.

6 1. FEJEZET. REGRESSZIÓS MODELLEK PARAMÉTERBECSLÉSEI A lineáris esethez hasonlóan itt is igazolható a becslés aszimptotikus normalitása is. 1.1.5. Tétel. (Baran [3, Theorem 3]) Tegyük fel, hogy az (y i, x i ), i N, megfigyelések az (1.1.6) modellből származnak, mely teljesíti az A feltételt, a Θ paraméterhalmaz kompakt és konvex, β 0 a Θ belső pontja, g kétszer differenciálható β szerint, a ( g(x, β0 ) ) Var β mátrix invertálható és g(x, β) E sup 2 <, β β Θ E sup 2 g(x, β) <. β β β Θ Tegyük fel, hogy lim E sup γ 0 β 1 β 2 γ lim E sup γ 0 β 1 β 2 γ lim E sup γ 0 β 1 β 2 γ g(x, β 1) β 2 g(x, β 1 ) 2 g(x, β 1 ) g(x, β 2 ) = 0, g(x, β1 ) g(x, β β β 2 ) = 0, 2 g(x, β 1 ) β β 2 g(x, β 2 ) = 0. β β Tegyük még fel, hogy valamely pozitív ν konstans esetén E 2 g(x, β) 1+2ν g(x, β) <, E 2+4ν < β β β teljesül minden β Θ esetén és ugyanezzel a konstanssal az (x i, ε i ), i N, sorozat α(n) keverési együtthatói eleget tesznek az (1.1.5) keverési feltételnek. Ezen kívül tegyük fel, hogy a w magfüggvény véges harmadik abszolút momentummal bír és ahol h(u, v) := ( g(u, β0 ) t β lim n n 1 Var ( n k=1 ) h(x k, ε k ) = Σ, E g(x, β ) 0) ( ) sin(tv)e cos(tε) cos(tv)e sin(tε) w(t)dt, β u R q, v R, a Σ mátrix pedig pozitív definit. Ekkor ha β n konzisztens, akkor teljesül rá az aszimptotikus normalitás is. A lineáris modellhez hasonlóan itt is elvégezzük a fent tárgyalt becslésnek, valamint a hagyományos legkisebb négyzetes és a legkisebb abszolút eltérést biztosító becslésnek a számítógépes szimuláció segítségével történő összehasonlítását (lásd [3, Section 5]).

1.2. A LINEÁRIS HIBA A VÁLTOZÓBAN MODELL 7 1.2. A lineáris hiba a változóban modell Tegyük most fel, hogy az (1.1.1) lineáris modell magyarázó változóját csak egy additív hibával terhelve tudjuk megfigyelni, ami a következő modellhez vezet: y i = x i β 0 + ε i, (1.2.1) x i = x i + δ i, i N. (1.2.2) Az {x i }, {y i } és {ε i } sorozatok itt is ugyanolyan tulajdonságokkal bírnak, mint az (1.1.1) modell esetén, a {δ i } q-dimenziós véletlen sorozatról pedig tegyük fel, hogy független az előbbi kettőtől és azonos eloszlású, mely eloszlás megegyezik egy δ véletlen vektor eloszlásával. Az ismeretlen paraméter β 0 valódi értékét ebben az esetben az y i és x i megfigyelések segítségével kell meghatároznunk. Baran [15] igazolta, hogy ha az (1.1.3) formulával definiált A n függvényben az x i megfigyeléseket egyszerűen kicseréljük a hibával terhelt x i megfigyelésekre, akkor az így kapott függvény maximumhelye (naiv becslés) már nem lesz a β 0 konzisztens becslése. Független, azonos eloszlású {ξ i }, {ε i } és {δ i } sorozatokat tételezve fel a Stefanski [49] által kifejlesztett ún. dekonvolúciós módszer segítségével a szerző úgy általánosította az (1.1.3) függvénnyel definiált becslést, hogy az használható legyen az (1.2.1) (1.2.2) modell esetén is. A β 0 paraméter β n becslése ebben az esetben legyen a  n (β) := 1 n 2 n n k=1 l=1 függvény maximum helye, ahol a ϕ k,l w E ( ϕ k,l ϕ k,l w (y k y l ( x k x l ) β, β), k, l N, valós segédfüggvényekre teljesül, hogy w (y k y l ( x k x l ) β, β) y k, y l, x k, x l ) = ϕw (y k y l (x k x l ) β). (1.2.3) Baran [15] belátta, hogy ha w(t) dt <, β Θ, ϕ δ (tβ )ϕ δ ( tβ ) teljesül, ahol ϕ δ a δ mérési hiba karakterisztikus függvénye, akkor a ϕ k,l ϕ δ (tβ )ϕ δ ( tβ ) { w (v, β) := eitv w(t)dt, ha k = l, e itv w(t)dt, ha k l, függvények kielégítik a (1.2.3) feltételt. Mindezeken túl bizonyos enyhe feltételek mellett a szerző igazolta a β n becslés erős konzisztenciáját. Tegyük most fel, hogy a {(x i, δ i, ε i)} sorozat erősen keverő α(n) keverési együtthatókkal. A dekonvolúciós módszer alapján ekkor az Ân becslőfüggvény felépítéséhez olyan ϕ k,l w segédfüggvényekre lenne szükségünk, melyekre teljesül E ( ϕ k,l w (y k y l ( x k x l ) β, β) y k y l, x k x l ) = ϕw (y k y l (x k x l ) β). Igazolható, hogy ha tetszőleges k, l N, k l, és β Θ esetén w(t) dt <, ϕ δl δ k (tβ )

8 1. FEJEZET. REGRESSZIÓS MODELLEK PARAMÉTERBECSLÉSEI akkor ϕ k,l ϕ δl δ k (tβ ) { w (v, β) := eitv w(t)dt, ha k = l, e itv w(t)dt, ha k l. Ezen segédfüggvények meghatározásához azonban ismernünk kellene a (δ k, δ l ), k, l N, párok együttes eloszlását, ami valós problémák esetén egy igen ritkán teljesülő feltétel. Az {x i }, {δ i } és {ε i } sorozatok gyenge függősége azonban azt sugalja, hogy az aszimptotikus tulajdonságok szempontjából mindegy, hogy az Ân segédfüggvényekből építjük fel. becslőfüggvényt a ϕ k,l w vagy a ϕ k,l w 1.2.1. Tétel. (Baran [2, Theorem 5]) Tegyük fel, hogy az (y i, x i ), i N, megfigyelések az (1.2.1) (1.2.2) modellből származnak, a Θ paraméterhalmaz kompakt és konvex, E x <, E δ <, az {(x i, δ i, ε i)} erősen keverő sorozat α(n) keverési együtthatóira pedig teljesül az (1.1.4) keverési feltétel. Tegyük még fel, hogy a w magfüggvényre teljesül valamint Ekkor n esetén β n sup β Θ P β 0. sup β Θ w(t) dt <, ϕ δ (tβ )ϕ δ ( tβ ) t w(t) 1 dt <. ϕ δ (tβ )ϕ δ ( tβ ) ϕ δ (tβ ) Az itt tárgyalt β n becslést számítógépes szimuláció segítségével az ebben a fejezetben említett naiv becsléssel, a naiv legkisebb négyzetes és legkisebb abszolút eltérést adó becsléssel (amikor a minimalizálandó becslőfüggvényben a magyarázó változót kicseréljük a hibával terhelt megfigyeléssel), valamint a speciálisan a hiba a változóban modellekre kifejlesztett regresszió kalibrációs becsléssel (lásd pl. [33] vagy [39]) hasonlítjuk össze (lásd [2, Section 4]).

2. fejezet Folytonos sztochasztikus modellek 2.1. Ornstein-Uhlenbeck folyamatok és mezők eltolásparaméterének becslése 2.1.1. Ornstein-Uhlenbeck folyamatok Tekintsük a d X(s) = α X(s) ds + σ dw (s), (2.1.1) sztochasztikus differenciálegyenlet stacionárius megoldásaként definiált { X(s) : s R} stacionárius Ornstein-Uhlenbeck folyamatot, ahol α > 0, σ > 0, {W (s) : s R} pedig egy standard Wiener folyamat. Könnyen látható, hogy ez egy nulla várható értékű Gauss folyamat, melyre E X(s 1 ) X(s 2 ) = σ2 2α e α s 1 s 2. Legyen továbbá Ỹ (s) := X(s) + m, s R, és [S 1, S 2 ] (, ). Ekkor az m paraméternek az {Ỹ (s) : s [S 1, S 2 ]} megfigyeléséből adódó maximum likelihood (ML) becslése m := Ỹ (S 1 ) + Ỹ (S 2) + α S 2 S 1 2 + α(s 2 S 1 ) Ỹ (s) ds, ami normális eloszlású m várható értékkel és σ 2 α 1 (2 + α(s 2 S 1 )) 1 szórásnégyzettel (lásd pl. [40, 41] illetve [22]). A dx(s) = αx(s)ds + σdw (s), s 0, X(0) = 0, egyenlet megoldásaként adódó {X(s) : s 0} folyamatot, ahol α R, σ > 0, tekinthetjük úgy, mint egy a nulla kezdeti értékből kiinduló Ornstein-Uhlenbeck folyamatot. Itt jegyezzük meg, hogy ez a folyamat előállítható X(s) = σ s 0 e α(u s) dw (u) alakban is. Legyen most Y (s) := X(s) + m, s 0, és legyen [S 1, S 2 ] (0, ). Ekkor az m paraméternek az {Y (s) : s [S 1, S 2 ]} megfigyeléséből adódó ML becslése m := coth(αs 1)Y (S 1 ) + Y (S 2 ) + α S 2 S 1 Y (s) ds, coth(αs 1 ) + 1 + α(s 2 S 1 ) 9

10 2. FEJEZET. FOLYTONOS SZTOCHASZTIKUS MODELLEK ami normális eloszlású m várható értékkel és σ 2 α 1 (coth(αs 1 ) + 1 + α(s 2 S 1 )) 1 szórásnégyzettel. Ennek egy speciális esete az α = 0 eset, amikor m = Y (S 1 ) N ( m, σ 2 S 1 ). Legyen most h : [S 1, S 2 ] R egy ismert függvény. Célunk, hogy meghatározzuk az m eltolásparaméternek az { X(s) + mh(s) : s [S 1, S 2 ]} illetve az {X(s) + mh(s) : s [S 1, S 2 ]} megfigyelésén alapuló ML becslését. Az { X(s) : s R} stacionárius Ornstein-Uhlenbeck folyamat felírható X(s) = σ 2α e αs W (e 2αs ), s R, alakban is, ahol {W (s) : s 0} egy standard Wiener folyamat. Ily módon az m paraméter { X(s)+mh(s) : s [S 1, S 2 ]} megfigyelésén alapuló m ML becslése megkapható ugyanezen paraméternek a {W (e 2αs ) + m 2ασ 1 e αs h(s) : s [S 1, S 2 ]}, vagy a { ( ) 2αu log u W (u) + m h : u [ e 2αS 1, e ]} 2αS 2 σ 2α megfigyelésén alapuló ML becslése segítségével. Legyen [a 1, a 2 ] (0, ), g : [a 1, a 2 ] R egy ismert függvény és tekintsük a Z(u) := W (u) + mg(u), u [a 1, a 2 ], folyamatot. Jelölje továbbá P Z és P W a Z illetve a W folyamat által a C([a 1, a 2 ] R) téren indukált valószínűségi mértéket. 2.1.1. Tétel. (Baran, Pap, Zuijlen [4, Theorem 2.1], [5, Theorem 1]) Ha g abszolút folytonos valamint g L 2 ([a 1, a 2 ]), akkor a P Z és P W mértékek ekvivalensek és a P Z mértéknek a P W mértékre vonatkozó Radon Nikodym deriváltja dp Z dp W (Z) = exp { 1 2 (Am2 2ζm) ahol A := g2 (a 1 ) a2 + [g (u)] 2 du, ζ := g(a 1)Z(a 1 ) a2 + g (u) dz(u). a 1 a 1 a 1 a 1 Ennek alapján az m eltolásparaméternek a {Z(u) : u [a 1, a 2 ]} megfigyelésén alapuló ML becslése m = ζ/a alakú és m N ( m, 1/A ). Legyen [S 1, S 2 ] (, ) és tekintsük az Ỹ (s) := X(s) + mh(s) folyamatot. Jelölje továbbá PY e és P ex az Ỹ illetve az X folyamat által a C([S 1, S 2 ] R) téren indukált valószínűségi mértéket. A 2.1.1. Tételt a ( ) 2αu log u g(u) := h σ 2α függvényre alkalmazva jutunk a következő eredményhez: 2.1.2. Tétel. (Baran, Pap, Zuijlen [4, Theorem 2.2], [5, Theorem 2]) Ha h abszolút folytonos valamint h L 2 ([S 1, S 2 ]), akkor a P e Y és P ex mértékek ekvivalensek és a P ey mértéknek a P ex mértékre vonatkozó Radon Nikodym deriváltja }, dp { ey (Ỹ dp ) = exp α } ex 2σ 2 (Am2 2ζm),

2.1. O-U FOLYAMATOK ELTOLÁSPARAMÉTERÉNEK BECSLÉSE 11 ahol A := h 2 (S 1 ) + h 2 (S 2 ) + ζ := 2h(S 1 )Ỹ (S 1) + S2 S2 S 1 ( αh 2 (s) + α 1 [h (u)] 2) ds, ( h(s) + α 1 h (s) ) ( ) dỹ (s) + αỹ (s) ds. S 1 Ennek alapján az m eltolásparaméternek az {Ỹ (s) : s [S 1, S 2 ]} megfigyelésén alapuló ML becslése m = ζ/a alakú és m N ( m, σ 2 /(αa) ). Ha feltesszük még, hogy h kétszer folytonosan differenciálható, akkor ζ felírható az alábbi alakban is: ζ = h(s 1 )Ỹ (S 1) + h(s 2 )Ỹ (S 2) + α 1( h (S 2 )Ỹ (S 2) h (S 1 )Ỹ (S 1) ) + S2 S 1 ( αh(s) α 1 h (s) ) Ỹ (s) ds. Vizsgáljuk most meg a nulla kezdeti értékből kiinduló {X(s) : s 0} Ornstein- Uhlenbeck folyamatot. Legyen [S 1, S 2 ] (0, ) és tekintsük az Y (s) := X(s) + mh(s) folyamatot. Ha α = 0, akkor X(s) = σw (s), s 0, így az m paraméternek az {Y (s) : s [S 1, S 2 ]} megfigyelésére alapuló ML becslése triviálisan megkapható az 2.1.1. Tételnek a g(u) := σ 1 h(u) függvényre való alkalmazásával. Az α 0 esetben az {X(s) : s 0} folyamat az alábbi alakba írható át: σ e αs W (e 2αs 1), ha α > 0, 2α X(s) = σ e αs W (1 e 2αs ), ha α < 0. 2α Alkalmazzuk a 2.1.1. Tételt a ( ) 2α(u + 1) log(u + 1) h, ha α > 0, σ 2α g(u) := ( ) 2α(u 1) log(1 u) h, ha α < 0, σ 2α függvényre mely az α értékétől függően az [ e 2αS 1 1, e 2αS 2 1 ] illetve az [ ] 1 e 2αS 1, 1 e 2αS 2 intervallumokon van értelmezve. Jelölje továbbá P Y és P X az Y illetve az X folyamat által a C([S 1, S 2 ] R) téren indukált valószínűségi mértéket. 2.1.3. Tétel. (Baran, Pap, Zuijlen [5, Theorem 3]) Ha α 0 valamint h abszolút folytonos és h L 2 ([S 1, S 2 ]), akkor a P Y és P X mértékek ekvivalensek és a P Y mértéknek a P X mértékre vonatkozó Radon Nikodym deriváltja dp { Y (Y ) = exp α } dp X 2σ 2 (Am2 2ζm), ahol A := coth(αs 1 )h 2 (S 1 ) + h 2 (S 2 ) + ζ := (1 + coth(αs 1 ))h(s 1 )Y (S 1 ) + S2 S 1 S2 ( αh 2 (s) + α 1 [h (s)] 2) ds, S 1 ( h(s) + α 1 h (s) ) (dy (s) + αy (s) ds).

12 2. FEJEZET. FOLYTONOS SZTOCHASZTIKUS MODELLEK Ennek alapján az m eltolásparaméternek az {Y (s) : s [S 1, S 2 ]} megfigyelésén alapuló ML becslése m = ζ/a alakú és m N ( m, σ 2 /(αa) ). Ha feltesszük még, hogy h kétszer folytonosan differenciálható, akkor ζ felírható az alábbi alakban is: ζ = coth(αs 1 )h(s 1 )Y (S 1 ) + h(s 2 )Y (S 2 ) + α 1( h (S 2 )Y (S 2 ) h (S 1 )Y (S 1 ) ) + S2 S 1 ( αh(s) α 1 h (s) ) Y (s) ds. Itt jegyeznénk meg, hogy ez utóbbi állításon alapul [23] számos eredménye. 2.1.2. Ornstein-Uhlenbeck mezők Az { X(s, t) : s, t R} stacionárius Ornstein-Uhlenbeck mező egy olyan nulla várható értékű Gauss mező, melyre E X(s 1, t 1 ) X(s 2, t 2 ) = σ2 4αβ e α s 2 s 1 β t 2 t 1, ahol α > 0, β > 0 és σ > 0. Tekintsük az Ỹ (s, t) := X(s, t) + m folyamatot. Sztochasztikus parciális diferenciálegyenletek alkalmazásával Arató, N. M. [24] igazolta, hogy az α = β = 1 esetben az m paraméternek a {Ỹ (s, t) : s, t [0, T ]} megfigyelésén alapuló ML becslése m := Ỹ (0, 0) + Ỹ (0, T ) + Ỹ (T, 0) + Ỹ (T, T ) + G Ỹ + G Ỹ (2 + T ) 2, ahol G := [0, T ] 2, G pedig a G halmaz határát jelöli. A koordinátánként a nulla kezdeti értékből kiinduló Ornstein-Uhlenbeck mezőt az X(s, t) := σ s t 0 0 e α(u s)+β(v t) dw (u, v), s, t 0, (2.1.2) formulával definiálhatjuk, ahol α R, β R, σ > 0, {W (s, t) : s, t 0} pedig egy standard Wiener mező. Legyen most h : [S 1, S 2 ] [T 1, T 2 ] R egy ismert függvény. Célunk, hogy meghatározzuk az m eltolásparaméternek az { X(s, t) + mh(s, t) : s [S 1, S 2 ], t [T 1, T 2 ]} illetve az {X(s, t) + mh(s, t) : s [S 1, S 2 ], t [T 1, T 2 ]} megfigyelésén alapuló ML becslését. Legyen [a 1, a 2 ], [b 1, b 2 ] (0, ), g : [a 1, a 2 ] [b 1, b 2 ] R és tekintsük a Z(s, t) := W (s, t) + mg(s, t) sztochasztikus mezőt. Jelölje továbbá P Z és P W a Z illetve a W mező által a C([a 1, a 2 ] [b 1, b 2 ] R) téren indukált valószínűségi mértéket. 2.1.4. Tétel. (Baran, Pap, Zuijlen [4, Theorem 3.1], [5, Theorem 4]) Ha g abszolút folytonos valamint 1 2 g L 2 ([a 1, a 2 ] [b 1, b 2 ]), akkor a P Z és P W mértékek ekvivalensek és a P Z mértéknek a P W mértékre vonatkozó Radon Nikodym deriváltja dp Z dp W (Z) = exp { 1 2 (Am2 2ζm) },

2.1. O-U FOLYAMATOK ELTOLÁSPARAMÉTERÉNEK BECSLÉSE 13 ahol A := g2 (a 1, b 1 ) a 1 b 1 + a2 ζ := g(a 1, b 1 )Z(a 1, b 1 ) + a 1 b 1 + a2 b2 a 1 b 1 [ 1 g(u, b 1 )] du + a 1 b 1 a2 1 2 g(u, v) Z(du, dv). 2 b2 b 1 a 1 1 g(u, b 1 ) b 1 Z(du, b 1 ) + 2 [ 2 g(a 1, v)] dv + a 1 b2 a2 b2 a 1 2 g(a 1, v) b 1 a 1 b 1 [ 1 2 g(u, v)] 2 dudv, Z(a 1, dv) Ennek alapján az m eltolásparaméternek a {Z(s, t) : s [a 1, a 2 ], t [b 1, b 2 ]} megfigyelésén alapuló ML becslése m = ζ/a alakú és m N ( m, 1/A ). Ismert, hogy az { X(s, t) : s, t R} stacionárius Ornstein-Uhlenbeck mező felírható X(s, t) = σ 2 αβ e αs βt W (e 2αs, e 2βt ), s, t R, alakban. Legyen [S 1, S 2 ], [T 1, T 2 ] (, ) és tekintsük az Ỹ (s, t) := X(s, t) + mh(s, t) véletlen mezőt. Jelölje továbbá PY e és P ex az Ỹ illetve az X véltlen mező által a C([S 1, S 2 ] [T 1, T 2 ]) R) téren indukált valószínűségi mértéket. A 2.1.4. Tételt a g(u, v) := 2 αβuv σ h ( log u 2α, log v 2β függvényre alkalmazva jutunk a következő eredményhez. 2.1.5. Tétel. (Baran, Pap, Zuijlen [4, Theorem 3.2], [5, Theorem 5]) Ha h abszolút folytonos valamint 1 2 h L 2 ([S 1, S 2 ] [T 1, T 2 ]), akkor a P ey és P ex mértékek ekvivalensek és a PY e mértéknek a P ey mértékre vonatkozó Radon Nikodym deriváltja { dpy e (Ỹ ) = exp αβ } 2σ 2 (Am2 2ζm), ahol dp e X A := h 2 (S 1, T 1 ) + h 2 (S 1, T 2 ) + h 2 (S 2, T 1 ) + h 2 (S 2, T 2 ) S2 ( + α ( h 2 (s, T 1 ) + h 2 (s, T 2 ) ) + α 1( [ 1 h(s, T 1 )] 2 + [ 1 h(s, T 2 )] 2)) ds + S 1 T2 T 1 S2 T2 ( β ( h 2 (S 1, t) + h 2 (S 2, t) ) + β 1( [ 2 h(s 1, t)] 2 + [ 2 h(s 2, t)] 2)) dt ( + αβh 2 (s, t)+α 1 β [ 1 h(s, t)] 2 +αβ 1 [ 2 h(s, t)] 2 +α 1 β 1 ([ 1 2 h(s, t)] 2) dsdt, S 1 T 1 S2 ζ := 4h(S 1, T 1 )Ỹ (S ( 1, T 1 ) + 2 h(s, T1 ) + α 1 1 h(s, T 1 ) ) ) (Ỹ (ds, T1 ) + αỹ (s, T 1) ds T2 + 2 + T 1 S2 T2 S 1 S 1 ( h(s1, t) + β 1 2 h(s 1, t) ) ) (Ỹ (S1, dt) + βỹ (S 1, t) dt T 1 ( h(s, t) + α 1 1 h(s, t) + β 1 2 h(s, t) + α 1 β 1 1 2 h(s, t) ) (Ỹ (ds, dt) + α Ỹ (s, dt) ds + βỹ (ds, t) dt + αβỹ (s, t) dsdt ). )

14 2. FEJEZET. FOLYTONOS SZTOCHASZTIKUS MODELLEK Ennek alapján az m eltolásparaméternek az {Ỹ (s, t) : s [S 1, S 2 ], t [T 1, T 2 ]} megfigyelésén alapuló ML becslése m = ζ/a alakú és m N ( m, σ 2 /(αβa) ). Ha feltesszük még, hogy h mindkét változója szerint kétszer folytonosan differenciálható, akkor ζ felírható az alábbi alakban is: ζ = [ (1 α 1 1 )(1 β 1 2 )h(s 1, T 1 ) ] Ỹ (S 1, T 1 )+ [ (1 α 1 1 )(1+β 1 2 )h(s 1, T 2 ) ] Ỹ (S 1, T 2 ) + [ (1+α 1 1 )(1 β 1 2 )h(s 2, T 1 ) ] Ỹ (S 2, T 1 )+ [ (1+α 1 1 )(1+β 1 2 )h(s 2, T 2 ) ] Ỹ (S 2, T 2 ) S2 [ + (α α 1 1)(1 2 β 1 2 )h(s, T 1 ) ] Ỹ (s, T 1 ) ds + + + + S 1 S2 S 1 T2 T 1 T2 T 1 S2 T2 S 1 [ (α α 1 2 1 )(1 + β 1 2 )h(s, T 2 ) ] Ỹ (s, T 2 ) ds [ (1 α 1 1 )(β β 1 2 2 )h(s 1, t) ] Ỹ (S 1, t) dt [ (1 + α 1 1 )(β β 1 2 2 )h(s 2, t) ] Ỹ (S 2, t) dt T 1 [ (α α 1 2 1 )(β β 1 2 2 )h(s, t)] Ỹ (s, t) dsdt. Vizsgáljuk most meg az (2.1.2) összefüggéssel definiált {X(s, t) : s, t 0} Ornstein- Uhlenbeck mezőt, ami az α 0 és β 0 esetben definiálható úgy is, mint egy nulla várható értékű és EX(s 1, t 1 )X(s 2, t 2 ) = σ2 ( e α s 1 s 2 e ) ( α(s 1+s 2 ) e β t 1 t 2 e ) β(t 1+t 2 ) 4αβ kovarianciastruktúrával bíró Gauss mező. Ebből kifolyólag, ha például α > 0 és β > 0, akkor X(s, t) = σ 2 αβ e αs βt W (e 2αs 1, e 2βt 1), s, t 0. Legyen [S 1, S 2 ], [T 1, T 2 ] (0, ) és tekintsük az Y (s, t) := X(s, t) + mh(s, t) véletlen mezőt. Jelölje továbbá P Y és P X az Y illetve az X véltlen mező által a C([S 1, S 2 ] [T 1, T 2 ]) R) téren indukált valószínűségi mértéket. A 2.1.4. Tételt a g(u, v) := 2 αβ(u + 1)(v + 1) σ függvényre alkalmazva az alábbi tételt kapjuk. ( log(u + 1) h, 2α ) log(v + 1) 2β 2.1.6. Tétel. (Baran, Pap, Zuijlen [5, Theorem 6]) Ha α 0 és β 0, valamint h abszolút folytonos és 1 2 h L 2 ([S 1, S 2 ] [T 1, T 2 ]), akkor a P Y és P X mértékek ekvivalensek és a P Y mértéknek a P Y mértékre vonatkozó Radon Nikodym deriváltja { dp Y (Y ) = exp αβ } dp X 2σ 2 (Am2 2ζm),

2.1. O-U FOLYAMATOK ELTOLÁSPARAMÉTERÉNEK BECSLÉSE 15 ahol A:= coth(αs 1 ) coth(βt 1 )h 2 (S 1, T 1 ) + coth(αs 1 )h 2 (S 1, T 2 ) + coth(βt 1 )h 2 (S 2, T 1 ) S2 ( + α ( h 2 (s, T 1 ) + h 2 (s, T 2 ) ) + α 1( [ 1 h(s, T 1 )] 2 + [ 1 h(s, T 2 )] 2)) ds + h 2 (S 2, T 2 ) + + S 1 T2 T 1 S2 T2 S 1 ( β ( h 2 (S 1, v) + h 2 (S 2, t) ) + β 1( [ 2 h(s 1, t)] 2 + [ 2 h(s 2, t)] 2)) dt T 1 ( αβh 2 (s, t)+α 1 β [ 1 h(s, t)] 2 +αβ 1 [ 2 h(s, t)] 2 +α 1 β 1 ([ 1 2 h(s, t)] 2) dsdt, ζ :=(1 + coth(αs 1 ))(1 + coth(βt 1 ))h(s 1, T 1 )Y (S 1, T 1 ) S2 ( + (1 + coth(βt 1 )) h(s, T1 ) + α 1 1 h(s, T 1 ) ) (Y (ds, T 1 ) + αy (s, T 1 ) ds) + (1 + coth(αs 1 )) + S2 T2 S 1 S 1 T2 T 1 ( h(s1, t) + β 1 2 h(s 1, t) ) (Y (S 1, dt) + βy (S 1, t) dt) T 1 ( h(s, t) + α 1 1 h(s, t) + β 1 2 h(s, t) + α 1 β 1 1 2 h(s, t) ) (Y (ds, dt) + αy (s, dt) ds + βy (ds, t) dt + αβy (s, t) dsdt). Ennek alapján az m eltolásparaméternek az {Y (s, t) : s [S 1, S 2 ], t [T 1, T 2 ]} megfigyelésén alapuló ML becslése m = ζ/a alakú és m N ( m, σ 2 /(αβa) ). Ha feltesszük még, hogy h mindkét változója szerint kétszer folytonosan differenciálható, akkor ζ felírható az alábbi alakban is: ζ = [ (coth(αs 1 ) α 1 1 )(coth(βt 1 ) β 1 2 )h(s 1, T 1 ) ] Y (S 1, T 1 ) + [ (coth(αs 1 ) α 1 1 )(1 + β 1 2 )h(s 1, T 2 ) ] Y (S 1, T 2 ) + [ (1 + α 1 1 )(coth(βt 1 ) β 1 2 )h(s 2, T 1 ) ] Y (S 2, T 1 ) + [ (1 + α 1 1 )(1 + β 1 2 )h(s 2, T 2 ) ] Y (S 2, T 2 ) + + + + + S2 S 1 S2 S 1 T2 T 1 T2 T 1 S2 T2 S 1 2.1.3. Diszkrét approximáció [ (α α 1 2 1 )(coth(βt 1) β 1 2 )h(s, T 1 ) ] Y (s, T 1 ) ds [ (α α 1 2 1)(1 + β 1 2 )h(s, T 2 ) ] Y (s, T 2 ) ds [ (coth(αs1 ) α 1 1 )(β β 1 2 2)h(S 1, t) ] Y (S 1, t) dt [ (1 + α 1 1 )(β β 1 2 2)h(S 2, t) ] Y (S 2, t) dt T 1 [ (α α 1 2 1)(β β 1 2 2)h(s, t) ] Y (s, t) dsdt. Az 2.1.1. és 2.1.4. Tételeket nem a szokásos sztochasztikus differenciálegyenleteket alkalmazó módszerrel bizonyítottuk (lásd pl. [24]), hanem a folytonos folyamat diszkrét

16 2. FEJEZET. FOLYTONOS SZTOCHASZTIKUS MODELLEK folyamattal való közelítése útján. A diszkrét időből a folytonos időbe való átmenet megvalósításához szükséges 2.1.7. Állítás, melynek ötletét Arató M. [22, Section 2.3.2] adta, önmagában is érdekes lehet és számos más esetben is például a 2.2.3. Tétel bizonyításánál jól használható. Legyen Γ egy tetszőleges index halmaz, X R Γ egy függvénytér, X pedig az X {x X : (x(γ 1 ),..., x(γ k )) B}, k N, γ 1,..., γ k Γ, B B(R k ) alakú cilinderhalazai által generált σ algebra. Egy {ξ γ : γ Γ} X-beli trajektóriákkal rendelkező sztochasztikus folyamat esetén jelölje P ξ a folyamat által az (X, X ) téren generált mértéket. Legyen továbbá Γ = {γ 1,..., γ k } Γ egy véges halmaz és jelölje Pξ Γ a ξ(γ ) := (ξ γ1,..., ξ γk ) véletlen vektor által a (R k, B(R k )) téren generált valószínűségi mértéket. 2.1.7. Állítás. (Baran, Pap, Zuijlen [5, Proposition 1]) Legyen {ξ γ : γ Γ} és {η γ : γ Γ} két X-beli trajektóriákkal bíró sztochasztikus folyamat. Tegyük fel, hogy létezik egy olyan f : X R mérhető függvény, hogy Ef(ξ) = 1 valamint tetszőleges Γ 0 Γ halmaz esetén létezik egy olyan Γ véges részhalmazaiból álló Γ n, n = 1, 2,..., sorozat melyre Γ 0 Γ n Γ, n = 1, 2,..., és n esetén dp Γn η dp Γn ξ (ξ(γ n )) P f(ξ). Ekkor P η abszolút folytonos a P ξ mértékre nézve és dp η dp ξ = f. 2.2. A Wiener mező eltolásparaméterének becslése Tekintsük a Z(s, t) := W (s, t) + m folyamatot, ahol m R egy ismeretlen paraméter, {W (s, t) : s, t 0} pedig egy standard Wiener mező. Legyen [a, b] (0, ) és vegyünk egy olyan γ : [a, b] R folytonos, szigorúan monoton csökkenő függvényt, melyre γ(b) > 0. Tekintsük továbbá a Γ := {(s, γ(s)) : s (a, b)} görbét valamint a G := {(s, t) R 2 : a s b, t γ(s) vagy s > b, t γ(b)} halmazt. Végezetül, legyen G a G egy olyan részhalmaza, ami tartalmazza a Γ egy ε- környezetét, azaz létezik olyan ε > 0, hogy {(s, t) R 2 : s [a, a+ε], t [γ(s), γ(a)] vagy s [a+ε, b], t [γ(s), γ(s)+ε]} G. Az [a, b] intervallumon kétszer folytonosan differenciálható γ görbét tételezve fel a sztochasztikus parciális differenciálegyenletek módszerével Arató N. M. [25] igazolta, hogy az m ismeretlen paraméter {Z(s, t) : (s, t) G} megfigyelésén alapuló m ML becslése a a megfigyelt Z folyamatnak a Γ görbe végpontjaiban vett értékeiből, a Z folyamatnak a Γ mentén vett súlyozott integráljából valamint a Z normális irányú deriváltjának a Γ mentén vett súlyozott integráljából áll össze. Célunk, hogy ezt az eredményt a korábban már emített diszkrét approximáció segítségével (lásd [4, 5]) és az eredeti feltételeknél általánosabb körülmények között igazoljuk. Ehhez mindenekelőtt meg kell határoznunk

2.2. A WIENER MEZŐ ELTOLÁSPARAMÉTERÉNEK BECSLÉSE 17 az m paraméternek az olyan véges mintákból számított ML becslését, mely minták tartalmazzák a {Z(s i, γ(s i )) : 1 i N} {Z(s i, γ(s i 1 )) : 2 i N} megfigyeléseket és esetleg néhány megfigyelést a N {Z(s, t) : s s i, t γ(s i )} i=1 halmazból, ahol rögzített N N esetén a P : a = s 1 < s 2 < < s N 1 < s N = b az [a, b] intervallum egy beosztása. 2.2.1. Véges minták Radon Nikodym deriváltjai Legyenek az 0 < s 1 < s 2 < < s L és 0 < t 1 < t 2 < < t M számok valósak és tekintsük még a 1 = λ 1 < λ 2 < < λ n λ n+1 = L és 1 = µ 1 < µ 2 < < µ n µ n+1 = M egészeket, ahol n N. Legyen R := {(i, j) N 2 : 1 i L, 1 j M}, n H := {(i, j) N 2 : λ k i L, µ n k+1 j M}, k=1 H + := {(λ k, µ n k+1 ) : k = 1,..., n}, H := {(λ k, µ n k+2 ) : k = 2,..., n}, H 1 := {(i, µ k ) : k = 1,..., n, λ n k+1 < i λ n k+2 }, H 2 := {(λ k, j) : k = 1,..., n, µ n k+1 < j µ n k+2 }, n H 1,2 := {(i, j) N 2 : λ k < i L, µ n k+1 < j M} = H \ (H + H H 1 H 2 ). k=1 (Példaként tekintsük a 2.1. ábrát.) 2.2.1. Lemma. (Baran, Pap, Zuijlen [6, Lemma 2.1]) A {W (s i, t j ) : (i, j) H} minta együttes sűrűségfüggvénye c f ( x i,j : (i, j) H + H ) g ( xi,j : (i, j) H ) alakú, ahol c egy normáló tényező, valamint f ( x i,j : (i, j) H + H ) := exp { g ( x i,j : (i, j) H ) = exp { ( 1 x i,j)2 2( s i )t j (i,j) H 1 (i,j) H + x2 i,j 2s i t j + ( 2 x i,j)2 2s i ( t j ) (i,j) H 2 (i,j) H (i,j) H 1,2 ahol 1 x i,j := x i,j x i 1,j, 2 x i,j := x i,j x i,j 1 és s i := s i s i 1. } x2 i,j, 2s i t j ( 1 2 x i,j)2 2( s i )( t j ) },

18 2. FEJEZET. FOLYTONOS SZTOCHASZTIKUS MODELLEK µ 4 µ 3 µ 2 µ 1 λ 1 λ 2 λ 3 λ 4 R : H + : H : H 1 : H 2 : H 1,2 : 2.1. ábra. Egy példa az R, H +, H, H 1, H 2 és H 1,2 index halmazokra az n = 3 esetben. 2.2.2. Lemma. (Baran, Pap, Zuijlen [6, Lemma 2.2]) Legyen H egy olyan index halmaz, amire H + H H H. Ekkor a { Z(s i, t j ) : (i, j) H } és a { W (s i, t j ) : (i, j) H } megfigyelések által generált P e H Z illetve P e H W valószínűségi mértékek ekvivalensek és H dp e { Z (x H dp e i,j : (i, j) H) = exp 1 } W 2 (A H e m 2 2y eh m), ahol A eh := (i,j) H + 1 s i t j (i,j) H 1 s i t j, y eh := (i,j) H + x i,j s i t j x i,j. s i t j (i,j) H Ennek alapján az m paraméternek a {Z(s, t) : (s, t) H} megfigyeléseken alapuló ML becslése m H e = ζ eh /A eh alakú, ahol és m e H N ( m, 1/A e H). ζh e := Z(s i, t j ) Z(s i, t j ) s i t j s i t j (i,j) H + (i,j) H 2.2.2. A folytonos megfigyelésekből származó becslés A {Z(s, t) : (s, t) G} mintát véges minták sorozatával közelítve majd elvégezve a határátmenetet a 2.1.7. Állítás és a 2.2.2. Lemma segítségével megkapjuk ezen szakasz és [6] fő eredményét.

2.2. A WIENER MEZŐ ELTOLÁSPARAMÉTERÉNEK BECSLÉSE 19 2.2.3. Tétel. (Baran, Pap, Zuijlen [6, Theorem 1.1]) Tegyük fel, hogy a γ : [a, b] R függvény szigorúan monoton csökkenő és folytonos az [a, b] intervallumon, γ(b) > 0, valamint γ kétszer folytonosan differenciálható (a, b)-n. Tegyük fel továbbá, hogy létezik a γ (a) := lim s a γ (s) [, 0] és a γ (b) := lim s b γ (s) [, 0] határérték és b a γ (s)γ (s) ds <. (1 + γ (s) 2 ) 2 Ekkor a Z illetve W mezők által a C( G R) téren generált P Z és P W valószínűségi mértékek ekvivalensek és a P Z mértéknek a P W mértékre vonatkozó Radon Nikodym deriváltja { dp Z (Z) = exp 1 } dp W 2 (Am2 2ζm), ahol A := 1 bγ(b) + b a ds s 2 γ(s), ζ := c 1Z(a, γ(a)) + c 2 Z(b, γ(b)) + y 1 Z + y 2 n Z, Γ Γ n Z a Z normális irányú deriváltját jelöli, 1 c 1 := aγ(a) (1 + γ (a) 2 ), ha γ (a) >, 0, ha γ (a) =, γ (b) 2 bγ(b) (1 + γ c 2 := (b) 2 ), ha γ (b) >, 1 bγ(b), ha γ (b) =, y 1 (s, γ(s)) := y 2 (s, γ(s)) := [ ] γ (s) (γ(s)γ (s) s) (1 + γ (s) 2 ) 2sγ(s)γ (s), s 2 γ(s) 2 (1 + γ (s) 2 ) 5/2 γ (s) sγ(s) (1 + γ (s) 2 ). Ennek alapján az m eltolásparaméternek a {Z(s, t) : (s, t) G} megfigyelésén alapuló ML becslése m = ζ/a alakú és m N ( m, 1/A ). Megjegyzés. Az Γ y 1Z és Γ y 2 n Z integrálok értelmezése Γ Γ b β y 1 Z := l.i.m. y 1 (s, γ(s))z(s, γ(s)) 1 + γ (s) 2 ds, α 0, β 0 a+α y 2 n Z := l.i.m. h 0 1 h Γ y 2 ( ) ( Z( + hn Γ ( )) Z( ) ), ahol n Γ a Γ görbe normálvektorát jelöli.

20 2. FEJEZET. FOLYTONOS SZTOCHASZTIKUS MODELLEK

3. fejezet Térbeli autoregresszív folyamatok paraméterbecslése Bevezetés Tekintsük az X k = { αx k 1 + ε k, ha k 1, 0, ha k = 0, egyenlettel definiált elsőrendű AR folyamatot. Az α paraméternek az {X k : k = 1,..., n} megfigyeléseken alapuló legkisebb négyzetes becslése α n = n k=1 X k 1X k n. k=1 X2 k 1 Ismeretes, hogy az α < 1 esetben (stabil eset) α n aszimptotikusan normális (lásd [21, 44]), míg az α = 1 esetben (instabil eset) 1 D W (t) dw (t) 0 n( α n 1) 1 W, 0 2 (t) dt ahol {W (t) : t [0, 1]} egy standard Wiener folyamat (lásd pl. [34, 48, 51]). Az időbeli autoregresszív modell térbeli általánosítása a Basu és Reinsel [27, 28, 29] által is vizsgált p 1 p 2 X k,l = α i,j X k i,l j + ε k,l, α 0,0 = 0 i=0 j=0 modell, ahol a szerzők meghatározták a modell stabilitásának feltételeit, továbbá a p 1 = p 2 =1 esetben igazolták, hogy a stabil esetben a paraméterek legkisebb négyzetes becslése aszimptotikusan normális. Az első olyan modell, ahol az instabil esetet is vizsgálták a Martin [45] által bevezetett X k,l = αx k 1,l + βx k,l 1 αβx k 1,l 1 + ε k,l, ún. duplán geometrikus modell. Az α < 1 és β < 1 paraméterértékehez tartozó stabil esetben az (α, β) paraméterpár számos az {X k,l : 1 k m, 1 l n} megfigyeléseken 21

22 3. FEJEZET. TÉRBELI AR FOLYAMATOK PARAMÉTERBECSLÉSE alapuló ( α m,n, β m,n ) becslésének igazolt az aszimptotikus normalitása (lásd pl. [27, 29]), de ellentétben az AR(1) modellel, ez a tulajdonság megmarad az α = β = 1 instabil esetben például a Gauss Newton becslés (n = m esetén lásd [30, 31]), míg az α = 1, β < 1 esetben, a legkisebb négyzetes becslés esetén [30]. Ez a modell azonban meglehetősen speciális, mivel a karakterisztikus polinomjának ϕ(u, v) = (u α)(v β) szorzat alakja miatt tekinthető úgy, mint két hagyományos AR(1) folyamat valamiféle kombinációja. Bhattacharyya et al. [31] megvizsgálta a közel instabil esetet is, amikor stabil modellek egy sorozatát tekintjük az α n = e c/n, β n = e d/n feltétel mellett, ahol c és d nem zéró konstansok. A szerzők igazolták, hogy az (α n, β n ) paraméterek ( α n, β n ) Gauss-Newton becsléseinek sorozata ebben az esetben is aszimptotikusan normális. 3.1. Térbeli egyparaméteres autoregresszív modell Tekintsük az X k,l = { α(x k 1,l + X k,l 1 ) + ε k,l, ha k, l 1, 0, egyébként, (3.1.1) egyenlettel definiált {X k,l : k, l Z + } folyamatot, amely a legegyszerűbb, hagyományos AR(1) folyamatokra nem visszavezethető térbeli autoregresszív mező. Rögzített m, n N esetén legyen R m,n := {(k, l) N 2 : 1 k m, 1 l n}. Az α paraméternek az {X k,l : (k, l) R m,n } megfigyeléseken alapuló legkisebb négyzetes becslése α Rm,n = (k,l) R m,n (X k 1,l + X k,l 1 )X k,l (k,l) R m,n (X k 1,l + X k,l 1 ) 2. (3.1.2) Ennek a becslésnek az aszimptotikus normalitását kívánjuk igazolni független, nulla várható értékkel, egységnyi szórással és véges negyedik momentummal bíró ε k,l hibatagokat tételezve fel. Az α < 1/2 paraméterértékekhez tartozó stabil esetben a fenti becslés aszimtotikus normalitása levezethető Basu és Reinsel [28] eredményeiből, így a továbbiakban csak az α = 1/2 esettel foglalkozunk. 3.1.1. Kovarianciastruktúra Az X k,l véletlen mező kovarianciastruktúrájának vizsgálatához vezessük be az Y k,l = { α(y k 1,l + Y k,l 1 ) + ε k,l, ha k + l 1, 0, ha k + l = 0, (3.1.3) segédfolyamatot, ahol az {ε k,l : k, l Z, k + l 1} hibatagok függetlenek, Eε k,l = 0 és Var ε k,l = 1. Rögzített k, l Z esetén legyen T k,l := {(i, j) Z 2 : i + j 1, i k, j l} és T k,l :=, ha k + l 0. (3.1.4) Ekkor Y k,l = (i,j) T k,l ( k + l i j k i ) α k+l i j ε i,j.

3.1. TÉRBELI EGYPARAMÉTERES AUTOREGRESSZÍV MODELL 23 Az Y k,l folyamat fenti mozgóátlag előállításából belátható, hogy tetszőleges k 1, l 1, k 2, l 2 egészekre, ahol k 1 + l 1 0 és k 2 + l 2 0, valamint tetszőleges α valós értékre Cov(Y k1,l 1, Y k2,l 2 ) = k 1 k 2 +l 1 l 2 m=1 ( k1 + k 2 + l 1 + l 2 2m k 1 + l 2 m Ezen kívül, az α = 1/2 esetben létezik olyan C > 0 konstans, hogy Tekintsük továbbá a Cov(Y k1,l 1, Y k2,l 2 ) C k 1 + l 1 + k 2 + l 2. ) α k 1+k 2 +l 1 +l 2 2m. Z (n) (s, t) := n 1/4 Y [ns]+1,[nt]+1, s, t R, s + t 0, U (n) (s, t) := n 1/4 X [ns]+1,[nt]+1, s, t R, s, t 0, n N, szakaszonként konstans véletlen mezőket, melyekre nyilvánvalóan teljesül, hogy U (n) (s, t) = Z (n) (s, t) Z (n) (s, 0) Z (n) (0, t). 3.1.1. Állítás. (Baran, Pap, Zuijlen [7, Proposition 8]) Legyen s 1, t 1, s 2, t 2 R, ahol s 1 + t 1 > 0 és s 2 + t 2 > 0. Ha α = 1/2, akkor ahol K(s 1, t 1, s 2, t 2 )= Ha α = 1/2, akkor lim n Cov(Z(n) (s 1, t 1 ), Z (n) (s 2, t 2 )) = K(s 1, t 1, s 2, t 2 ), { s1 2 π( +s 2 +t 1 +t 2 ) s 1 s 2 + t 1 t 2, ha s 1 s 2 =t 1 t 2, 0, egyébként. lim n ( 1)[ns 1]+[nt 1 ]+[ns 2 ]+[nt 2 ] Cov(Z (n) (s 1, t 1 ), Z (n) (s 2, t 2 )) = K(s 1, t 1, s 2, t 2 ). 3.1.2. Következmény. (Baran, Pap, Zuijlen [7, Corollary 9]) Legyenek az s 1, t 1, s 2, t 2 pozitív valós számok. Ha α = 1/2, akkor ahol lim Cov(U (n) (s 1, t 1 ), U (n) (s 2, t 2 )) = L(s 1, t 1, s 2, t 2 ), n L(s 1, t 1, s 2, t 2 ) := K(s 1, t 1, s 2, t 2 ) K(s 1, t 1, s 2, 0) K(s 1, t 1, 0, t 2 ) K(s 1, 0, s 2, t 2 ) K(0, t 1, s 2, t 2 ) + K(s 1, 0, s 2, 0) + K(0, t 1, 0, t 2 ).

24 3. FEJEZET. TÉRBELI AR FOLYAMATOK PARAMÉTERBECSLÉSE 3.1.2. A becslés aszimptotikája Tekintsük a (3.1.2) összefüggéssel definiált α Rm,n becslést. Könnyen látható, hogy α Rm,n α = A m,n /B m,n, ahol A m,n := (k,l) R m,n (X k 1,l + X k,l 1 )ε k,l, B m,n := (k,l) R m,n (X k 1,l + X k,l 1 ) 2. A 3.1.2. Következmény és a dominált konvergencia tétel segítségével igazolható a következő állítás. 3.1.3. Állítás. (Baran, Pap, Zuijlen [7, Proposition 2]) Ha α = 1/2 és m, n úgy, hogy m/n const > 0, akkor (mn) 5/4 B m,n P σ 2, ahol σ 2 := 15 π 32(2 5/2 + 3). A korábbi eszközökhöz a martingál központi határeloszlás tételt [43] is hozzávéve belátható az A m,n konvergenciája is. 3.1.4. Állítás. (Baran, Pap, Zuijlen [7, Proposition 3]) Ha α = 1/2 és m, n úgy, hogy m/n const > 0, akkor (mn) 5/8 A m,n D N ( 0, σ 2). Végezetül, a 3.1.3. és a 3.1.4. Állítás valamint Basu és Reinsel [28] eredményeinek következményeként kaphatjuk az alábbi tételt, ami [7] fő eredménye. 3.1.5. Tétel. (Baran, Pap, Zuijlen [7, Theorem 1]) Tegyük fel, hogy a (3.1.1) modell esetén az {ε k,l : k, l N} hibatagok függetlenek, Eε k,l = 0, Var ε k,l = 1 és sup{eε 4 k,l : k, l N} <. Ha α < 1/2 és m, n úgy, hogy m/n const > 0, akkor (mn) 1/2 ( α Rm,n α ) D N ( 0, σ 2 α), ahol σ 2 α := Ha α = 1/2 és m, n úgy, hogy m/n const > 0, akkor (mn) 5/8 ( α Rm,n α ) D N ( 0, σ 2), ahol σ 2 := α 2, ha α 0, (1 4α 2 ) 1/2 1 1/2, ha α = 0. 15 π 32(2 5/2 + 3). Megjegyzés. Vegyük észre, hogy σ 2 0 = lim α 0 σ 2 α, de σ 2 lim α 1/2 σ 2 α = 0.

3.2. TÉRBELI AR MODELLEK KÖZEL INSTABIL SOROZATA 25 3.2. Térbeli AR modellek közel instabil sorozatának aszimptotikus tulajdoságai Tekintsük az X k,l = α(x k 1,l + X k,l 1 ) + ε k,l, k, l Z, (3.2.1) egyenlet stacionárius megoldásaként definiált {X k,l : k, l Z} sztochasztikus mezőt. Ha α < 1/2 akkor ilyen megoldás létezik és előállítható X k,l = (i,j) U k,l ( k + l i j k i ) α k+l i j ε i,j alakban, ahol U k,l := {(i, j) Z 2 : i k, j l}, a sor konvergenciája pedig L 2 értelemben értendő. Tekintsük most a (3.2.1) egyenlet stacionárius megoldásainak egy közel instabil sorozatát. Legyen α n = 1 2 γ n n, ahol γ n > 0 és lim n γ n γ 0, (3.2.2) az {X (n) k,l : k, l Z}, n N, pedig legyen a (3.2.1) egyenlet α n paraméterhez tartozó stacionárius megoldása. Célunk az α n paraméter {X (n) k,l : (k, l) T k n,l n } megfigyeléseken alapuló (3.1.2) összefüggéssel definiált α (n) T kn,ln legkisebb négyzetes becslése aszimptotikus tulajdonságainak vizsgálata, ahol T kn,l n a (3.1.4) által definiált háromszög alakú megfigyelési tartomány, k n, l n Z, n N, és n esetén k n + l n, a hibatagok pedig független, azonos eloszlásúak nulla várható értékkel, egységnyi szórással és véges negyedik momentummal. Tegyük fel, hogy lim (k n + l n )n 1/2 γn 1/2 =, (3.2.3) n mely összefüggés meghatározza a megfigyelési tartomány növekedésének és az α n konvergenciasebességének egymáshoz való viszonyát. Nyilvánvaló, hogy a (3.2.3) feltétel teljesül például a γ > 0, k n = l n = n esetben. A továbbiakban feltehetjük, hogy a (k n + l n ) sorozat monoton növekvő. Legyen k n := és az α (n) T ekn, ln e eloszlása megegyezik, továbbá k n + l n = k n + l n, így a (k n, l n ) sorozat helyett nyugodtan [(k n + l n )/2] és l n := [(k n + l n + 1)/2]. A stacionaritás miatt az α (n) T kn,ln tekinthetjük a ( k n, l n ) sorozatot. Ez utóbbi sorozat beágyazható a (k n, l n ) sorozatba, ahol k n := [n/2] és l n := [(n + 1)/2], nevezetesen, a q n := k n + l n sorozatra k q n = k n és l q n = l n. Nyilvánvaló, hogy k n + l n = n. Definiáljunk egy (r n ) sorozatot a következő módon: r n := k ha q k n < q k+1. Ekkor r qn = n és számunkra elegendő az α (rn) T k n,l n aszimptotikus tulajdonságait vizsgálni a (3.2.3) feltételt helyettesítő feltétel mellett. lim n nr 1/2 n γr 1/2 n = (3.2.4)

26 3. FEJEZET. TÉRBELI AR FOLYAMATOK PARAMÉTERBECSLÉSE 3.2.1. Kovarianciastruktúra Legyen {X k,l : k, l Z} a (3.2.1) egyenletnek az α paraméterhez tartozó stacionárius megoldása. A stacionaritás miatt Cov(X i1,j 1, X i2,j 2 ) = Cov(X i1 i 2,j 1 j 2, X 0,0 ), i 1, j 1, i 2, j 2 Z. Legyen R k,l := Cov(X k,l, X 0,0 ), k, l R. 3.2.1. Lemma. (Baran, Pap, Zuijlen [8, Lemma 4]) Ha k, l Z és kl 0, akkor 0 R k,l = Ha k, l Z és kl > 0, akkor 1 1 4α 2 0 R k,l = R 0, k l k l 1 i=0 ( ) k + l 1 1 4α 2. 2α ( k l + 2i i ) α k l +2i. Legyen {X (n) k,l : k, l Z}, n N, a (3.2.1) egyenlet stacionárius megoldásainak korábban már definiált közel instabil sorozata. Legyen továbba (r n ) az N egy részsorozata és tetszőleges n N esetén tekintsük az szakaszonként konstans véletlen mezőt. X (n) (s, t) := rn 1/4 X (rn) [ns]+1,[nt]+1, s, t R, 3.2.2. Állítás. (Baran, Pap, Zuijlen [8, Proposition 5]) Legyen s 1, t 1, s 2, t 2 R. Az (3.2.4) feltétel mellett lim n γ1/2 r n Cov ( X (n) (s 1, t 1 ), X (n) (s 2, t 2 ) ) = 0, ha s 1 s 2 t 1 t 2, ( lim sup γr 1/2 Cov n X (n) (s 1, t 1 ), X (n) (s 2, t 2 ) ) 1 n 2, ha s 1 s 2 = t 1 t 2. 3.2.2. A becslés aszimptotikája Az egyszerűség kedvéért tegyük fel, hogy k n = [n/2], l n = [(n + 1)/2] és tekintsük az α rn paraméter α (rn) T kn,ln becslését. A 3.1. szakaszban vizsgált becsléshez hasonlóan α (rn) T kn,ln α rn = A n /B n, ahol A n := (i,j) T kn,ln ( (r X n) i 1,j + ) X(rn) (r i,j 1 ε n) i,j, B n := ( (r X n) i 1,j + 2 i,j 1) X(rn). (i,j) T kn,ln A dominált konvergencia tétel helyett a Fatou lemmát használva a 3.1.3. és 3.1.4. Állításokkal analóg állításokhoz jutunk. 3.2.3. Állítás. (Baran, Pap, Zuijlen [8, Proposition 2]) Az (3.2.4) feltétel mellett ha n, akkor n 2 rn 1/2 γr 1/2 P n B n 1.

3.3. TÉRBELI KÉTPARAMÉTERES AUTOREGRESSZÍV MODELL 27 3.2.4. Állítás. (Baran, Pap, Zuijlen [8, Proposition 3]) Az (3.2.4) feltétel mellett ha n, akkor n 1 rn 1/4 γr 1/4 n A D n N (0, 1). Végezetül, a 3.2.3. és a 3.2.4. Állítás következményeként megkaphatjuk [8] fő eredményét, ami az alábbi. 3.2.5. Tétel. (Baran, Pap, Zuijlen [8, Theorem 1]) Rögzített n N esetén legyen {X (n) k,l : k, l Z} az (3.2.1) egyenletnek a (3.2.2) összefüggéssel definiált α n paraméterhez tartozó stacionárius megoldása, ahol az {ε (n) k,l : k, l Z} hibatagok függetlenek, azonos eloszlásúak, Eε (n) 0,0 = 0, Var ε (n) 0,0 = 1 és sup { E (n) ε 4 0,0 : n N } <. Legyen továbbá k n, l n Z, n N, és tegyük fel hogy n esetén k n + l n és teljesül a (3.2.3) feltétel. Ekkor n esetén (k n + l n )n 1/4 γn ( α 1/4 (n) ) D T kn,ln α n N (0, 1). 3.3. Térbeli kétparaméteres autoregresszív modell Tekintsük most az (3.1.3) egyenlettel definiált folyamat természetes általánosításaként kapható {X k,l : k, l Z, k + l 0} folyamatot, amit az { αx k 1,l + βx k,l 1 + ε k,l, ha k + l 1, X k,l = (3.3.1) 0, ha k + l = 0, egyenlet definiál. A modell stabilitásának feltétele α + β < 1 (lásd [28, 32]), míg az α + β = 1 esetben instabil modellről beszélhetünk. Legyen T n,m a (3.1.4) kifejezéssel definiált háromszög alakú tartomány. Az (α, β) paramétereknek az {X k,l : (k, l) T n,m } megfigyeléseken alapuló legkisebb négyzetes becslése ) ( αtm,n = ( ) 1 X 2 k 1,l X k 1,l X k,l 1 ( ) Xk 1,l X k,l. (3.3.2) β Tm,n X k 1,l X k,l 1 X k,l 1 X k,l (k,l) T m,n X 2 k,l 1 (k,l) T m,n Ennek a becslésnek az aszimptotikus normalitását kívánjuk igazolni független, nulla várható értékkel, egységnyi szórással és véges nyolcadik momentummal bíró ε k,l hibatagokat tételezve fel. 3.3.1. Kovarianciastruktúra Az (3.3.1) egyenletből következik, hogy minden k, l Z, k + l 1, esetén X k,l = ( ) k + l i j α k i β l j ε i,j. (3.3.3) k i (i,j) T k,l A (3.3.3) mozgóátlag előállítás egyenes következménye, hogy tetszőleges k 1, l 1, k 2, l 2 egészekre, ahol k 1 + l 1 0 és k 2 + l 2 0 ( )( ) k1 + l 1 i j k2 + l 2 i j Cov(X k1,l 1, X k2,l 2 ) = α k 1+k 2 2i β l 1+l 2 2j. k 1 i k 2 i (i,j) T k1 k 2,l 1 l 2

28 3. FEJEZET. TÉRBELI AR FOLYAMATOK PARAMÉTERBECSLÉSE Igazolható [9, Lemma 2.1], hogy ( α + β ) k 1 k 2 + l 1 l 2 ) 2, ha α + β < 1, (1 ( α + β ) 2 Cov(X k1,l 1, X k2,l 2 ) ( ) 1/2, C α k1 + l 1 + k 2 + l 2 ha α + β = 1 és 0 < α < 1, k 1 + l 1 + k 2 + l 2, ha α + β = 1 és α {0, 1}, ahol C α > 0 egy kizárólag α-tól függő konstans. Legyen n N és tekintsük az Y (n) 1,0 (s, t) := X [ns]+1,[nt], Y (n) 0,1 (s, t) := X [ns],[nt]+1, Z (n) 1,0 (s, t) := n 1/4 X [ns]+1,[nt], Z (n) 0,1 (s, t) := n 1/4 X [ns],[nt]+1, U (n) 1,0 (s, t) := n 1/2 X [ns]+1,[nt], U (n) 0,1 (s, t) := n 1/2 X [ns],[nt]+1 szakaszonként konstans véletlen mezőket, ahol s, t R és s + t 0. 3.3.1. Állítás. (Baran, Pap, Zuijlen [9, Proposition 2.3]) Legyen s 1, t 1, s 2, t 2 R ahol s 1 + t 1 > 0 és s 2 + t 2 > 0. Ha α + β < 1 akkor lim n ( Cov ( Y (n) 1,0 (s 1, t 1 ), Y (n) 1,0 (s 2, t 2 ) ) Cov ( Y (n) 1,0 (s 1, t 1 ), Y (n) Cov ( Y (n) 1,0 (s 2, t 2 ), Y (n) 0,1 (s 1, t 1 ) ) Cov ( Y (n) 0,1 (s 1, t 1 ), Y (n) ahol s 1 = s 2, t 1 = t 2 esetén és y α,β (s 1, t 1, s 2, t 2 ) = 1 2 Σ 1 α,β = σ2 α,β 0,1 (s 2, t 2 ) ) ) 0,1 (s 2, t 2 ) ) = y α,β (s 1, t 1, s 2, t 2 ), ( ) 1 ϱα,β, ϱ α,β 1 σα,β 2 := ( (1 + α + β)(1 + α β)(1 α + β)(1 α β) ) 1/2, (1 α 2 β 2 )σα,β 2 1, ha αβ 0, 2αβσ ϱ α,β := α,β 2 0 egyébként, egyébként pedig y α,β (s 1, t 1, s 2, t 2 ) = 0, azaz a kétszer kettes nullákból álló mátrix. Ez utóbbi esetben a 0-hoz való konvergencia exponenciális sebességű. Ha 0 < α < 1 és β = 1 α akkor lim n ( Cov ( Z (n) 1,0 (s 1, t 1 ), Z (n) 1,0 (s 2, t 2 ) ) Cov ( Z (n) 1,0 (s 1, t 1 ), Z (n) Cov ( Z (n) 1,0 (s 2, t 2 ), Z (n) 0,1 (s 1, t 1 ) ) Cov ( Z (n) 0,1 (s 1, t 1 ), Z (n) ahol 1 a csupa egyesből álló kétszer kettes mátrixot jelöli, valamint 0,1 (s 2, t 2 ) ) ) 0,1 (s 2, t 2 ) ) =z α (s 1, t 1, s 2, t 2 )1, z α (s 1, t 1, s 2, t 2 ) = s1 + s 2 + t 1 + t 2 s 1 s 2 + t 1 t 2 2πα(1 α), ha (1 α)(s 1 s 2 ) = α(t 1 t 2 ), egyébként pedig z α (s 1, t 1, s 2, t 2 ) = 0. Ez utóbbi esetben a 0-hoz való konvergencia exponenciális sebességű.

3.3. TÉRBELI KÉTPARAMÉTERES AUTOREGRESSZÍV MODELL 29 lim n Ha α {0, 1} és β = 1 α akkor ( Cov ( U (n) 1,0 (s 1, t 1 ), U (n) 1,0 (s 2, t 2 ) ) Cov ( U (n) 1,0 (s 1, t 1 ), U (n) Cov ( U (n) 1,0 (s 2, t 2 ), U (n) 0,1 (s 1, t 1 ) ) Cov ( U (n) 0,1 (s 1, t 1 ), U (n) ahol I a kétszer kettes egység mátrix, valamint 0,1 (s 2, t 2 ) ) ) 0,1 (s 2, t 2 ) ) = u α (s 1, t 1, s 2, t 2 )I, u α (s 1, t 1, s 2, t 2 ) = s 1 + s 2 + t 1 + t 2 s 1 s 2 t 1 t 2, 2 ha (1 α)(s 1 s 2 ) = α(t 1 t 2 ), egyébként pedig u α (s 1, t 1, s 2, t 2 ) = 0. Látható, hogy az 0 < α < 1, β = 1 α esetben a határérték mátrix nem invertálható. Ebben az esetben viszont jó becslést tudunk adni a kovarianciák különbségére. 3.3.2. Állítás. (Baran, Pap, Zuijlen [9, Proposition 2.6]) Ha 0 < α < 1 és β = 1 α, akkor létezik egy olyan K α > 0 konstans, melyre tetszőleges n N és s 1, t 1, s 2, t 2 R, s 1 + t 1 > 0, s 2 + t 2 > 0, esetén Cov ( Z (n) i,j (s 1, t 1 ), Z (n) j,i (s 2, t 2 ) ) Cov ( Z (n) i,j (s 1, t 1 ), Z (n) i,j (s 2, t 2 ) ) Kα n 1/2, ahol (i, j) { (0, 1), (1, 0) }. 3.3.2. A becslés aszimptotikája Tekintsük a (3.3.2) összefüggéssel definiált becslést. Könnyen látható, hogy ) ( αtm,n α = B β 1 Tm,n β m,na m,n, ahol A m,n := (k,l) T m,n ( ) Xk 1,l ε k,l, B X k,l 1 ε m,n := k,l (k,l) T m,n ( X 2 k 1,l X k 1,l X k,l 1 X k 1,l X k,l 1 X 2 k,l 1 ). A 3.3.1. Állítás és a dominált konvergencia tétel segítségével igazolható a következő állítás. 3.3.3. Állítás. (Baran, Pap, Zuijlen [9, Proposition 1.2]) Ha α + β < 1 és m, n úgy, hogy m/n const > 0, akkor (mn) 1 L B 2 m,n Σ 1 α,β. Ha α + β = 1, 0 < α < 1 és m, n úgy, hogy m/n const > 0, akkor ahol σ 2 α := 2 9/2 15 π α (1 α ) (mn) 5/4 L B 2 m,n σ 2 α Ψ α,β, ( ) 1 sign(αβ) és Ψ α,β :=. sign(αβ) 1 Ha α + β = 1, α {0, 1} és m, n úgy, hogy m/n const > 0, akkor (mn) 3/2 B m,n L 2 4 3 I.

30 3. FEJEZET. TÉRBELI AR FOLYAMATOK PARAMÉTERBECSLÉSE A korábbi eszközökhöz a martingál központi határeloszlás tételt [43] is hozzávéve belátható az A m,n konvergenciája is. 3.3.4. Állítás. (Baran, Pap, Zuijlen [9, Proposition 1.3]) Ha α + β < 1 és m, n úgy, hogy m/n const > 0, akkor (mn) 1/2 A m,n D N ( 0, Σ 1 α,β). Ha α + β = 1, 0 < α < 1 és m, n úgy, hogy m/n const > 0, akkor (mn) 5/8 A m,n D N ( 0, σ 2 αψ α,β ). Ha α + β = 1, α {0, 1} és m, n úgy, hogy m/n const > 0, akkor (mn) 3/4 A D m,n N (0, 43 ) I. Az α + β < 1 illetve az α + β = 1, α {0, 1} esetben a 3.3.3. és 3.3.4. Állítás következményeként megkapjuk az (3.3.2) becslés aszimptotikus normalitását. A harmadik eset vizsgálatához vegyük észre, hogy Bm,n 1 = B m,n /det B m,n, ahol Bm,n a B m,n mátrix adjungáltját jelöli. A 3.3.1. és 3.3.2. Állítás valamint a dominált konvergencia tétel segítségével igazolható a következő eredmény. 3.3.5. Állítás. (Baran, Pap, Zuijlen [9, Proposition 1.4]) Ha α + β = 1, 0 < α < 1 és m, n úgy, hogy m/n const > 0, akkor (mn) 9/4 det B m,n P 2σ 2 αϱ 2 α, ahol ϱ 2 α = ( α (1 α ) ) 1. A korábbi eszközökhöz ismét a martingál központi határeloszlás véve hozzá kapjuk az alábbi állítást. 3.3.6. Állítás. (Baran, Pap, Zuijlen [9, Proposition 1.5]) Ha α + β = 1, 0 < α < 1 és m, n úgy, hogy m/n const > 0, akkor (mn) 7/4 Bm,n A m,n D N ( 0, 2σ 4 αϱ 2 αψ α,β ). Végezetül, a 3.3.3 3.3.6. Állítások következményeként megkaphatjuk [9] fő eredményét. 3.3.7. Tétel. (Baran, Pap, Zuijlen [9, Theorem 1.1]) Tegyük fel, hogy a (3.3.1) modell esetén az {ε k,l : k, l Z, k + l 1} hibatagok függetlenek, Eε k,l = 0, Var ε k,l = 1 és sup{eε 8 k,l : k, l Z, k + l 1} <. Ha α + β < 1 és m, n úgy, hogy m/n const > 0, akkor ) ( αtm,n (mn) 1/2 α D N (0, Σ α,β ). β Tm,n β Ha α + β = 1, 0 < α < 1 és m, n úgy, hogy m/n const > 0, akkor ) ( αtm,n (mn) 1/2 α D N ( ) 0, (2ϱ β 2 α Tm,n β ) 1 Ψ α,β. Ha α + β = 1, α {0, 1} és m, n úgy, hogy m/n const > 0, akkor ) ( αtm,n (mn) 3/4 α D N (0, 34 ) β Tm,n β I.

4. fejezet Alkalmazott statisztikai munkák 4.1. Sztochasztikus optimalizáció egy alkalmazása 4.1.1. Hiányosan megfigyelt Markov láncok Legyen {X i } egy véges S = {1, 2,... s} álapotterű P = (p ij ) s i,j=1 átmenetvalószínűségi mátrixszal rendelkező irreducibilis aperiodikus Markov lánc és jelölje π = (π 1, π 2,... π s ) a lánc stacionárius eloszlását. Ha az {X i } láncot minden egyes vizsgált időpontban meg tudjuk figyelni, akkor az átmenetvalószínűségek maximum-likelihood becslése az egyes átmenetek relatív gyakoriságával egyenlő (lásd pl. [26]). Tegyük most fel, hogy a láncot csak hiányosan tudjuk megfigyelni. Egy ilyen megfigyeléssorozatra példa... 0 0 1 0 0 2 2 1 0 0 0 0 1 0 0 2 2 1 0 0 0 0 1 0 0 2 2 1 0 0 0 0 1 0 0 2 2 1 0..., (4.1.1) ahol s = 2, a 0 pedig a hiányzó megfigyelést jelenti [11, Example 2]. A megfigyelésekhez tartozó likelihood függvény azonban ilyen esetben is felírható a stacionárius eloszlás és a p (k) ij, k = 1, 2,..., k-lépéses átmenetvalószínűségek függvényében. A (4.1.1) megfigyeléssorozat esetén ez L(P ) = π 1 p (3) 12 p 22 p 21 p (5) 11 p (3) 12 p 22 p 21 p (5) 11 p (3) 12 p 22 p 21 p (5) 11 p (3) 12 p 22 p 21. (4.1.2) Ily módon a P átmenetvalószínűségi mátrix ML becslése P = arg max L(P ). P Időnként ez a becslés előállítható zárt alakban is, de az esetek nagy részében valamilyen numerikus maximumkereső módszert kell alkalmaznunk. A (4.1.2) függvény L(x, y) = y ( ) 4 1 x + y x + y (x (1 x y)3 x)(1 y)y (4.1.3) ( ) 3 1 x + y (y + (1 x y)5 x), x = p 12, y = p 21, x + y > 0, alakja (4.1. ábra) azt mutatja, hogy a likelihood függvény több lokális maximummal is rendelkezhet. Ezekben az esetekben a hagyományos numerikus algoritmusok nem használhatóak. Itt jegyeznénk meg, hogy a gyakorlatban használatos algoritmusok általában minimumot keresnek, ezért ennél a problémánál is a likelihood függvény maximuma helyett a negatív logaritmusának a minimumát keressük. 31

32 4. FEJEZET. ALKALMAZOTT STATISZTIKAI MUNKÁK 1.2 1 x 10 6 0.8 0.6 L(x,y) 0.4 0.2 0 1 0.8 0.6 0.4 y 0.2 0 0 0.2 0.4 x 0.6 0.8 1 4.1. ábra. Az L(x, y) likelihood függvény. 4.1.2. Szimulált hőkezelés A szimulált hőkezelés (simulated annealing, SA) nevét egy fizikai folyamatról kapta, melynek során a szilárd anyagot az olvadáspontjáig hevítik, majd lehűtik oly módon, hogy a végére felvegye az optimális (minimális energiával bíró) kristályszerkezetet. Adott T hőmérsékleten a szilárd test atomjainak viselkedése jól modellezhető egy Monte Carlo módszer segítségével, ami még az ötvenes évekből származik [47]. A módszer minden egyes lépésében egy atomot véletlenszerűen kimozdítunk a helyéről, majd kiszámoljuk a rendszer ezen új állapotának energiáját. Jelölje E a régi és az új állapot energiája közti különbséget. Ha E < 0, akkor elfogadjuk a rendszer új állapotát, ha pedig nem, akkor az új állapot elfogadási valószínűsége exp( E/k B T ), ahol k B az ún. Boltzmann állandó. Ha ezt az eljárást elég sokszor megismételjük, akkor a rendszer eljut a hőegyensúly állapotába. Ezek után a hőmérséklet óvatos csökkentésével és a fenti eljárás ismétlésével elérhetjük, hogy T 0 esetén az algoritmus konvergáljon a globálisan minimális energiát biztosító állapot(ok)hoz. Matematikai szempontból ez az algoritmus elsősorban kombinatorikus optimalizálási problémák megoldására használható, ahol a minimalizálandó függvény játssza az energia szerepét, annak diszkrét értelmezési tartománya pedig az atomok állapotait reprezentálja (lásd pl. [19]). Ha a minimalizálandó függvény értelmezési tartománya nem diszkrét, akkor egy lehetséges megoldás annak diszkretizálása, de ez a módszer a gyakorlatban nem bizonyult használhatónak. A 4.1.1. szakaszban szereplő probléma megoldására Baran és Szabó [16] Corana et

4.1. SZTOCHASZTIKUS OPTIMALIZÁCIÓ EGY ALKALMAZÁSA 33 al. [37] módszerének továbbfejlesztésével leírt és a gyakorlatban is megvalósított egy algoritmust, melynek lényege a következő. Legyen f : D R d R a minimalizálandó függvény, x 0 R d az algoritmus kiinduló állapota, v h pedig a h {1, 2,..., d} koordinátairányba megtehető maximális lépéshossz. 1. lépés. Legyen x 0 az x=(x 1,..., x d ) aktuális állapot. 2. lépés. Válasszunk egy h koordináta irányt (sorban egymás után következnek). 3. lépés. Generáljunk egy új x=( x 1,..., x d ) állapotot: { x i + rv i, ha i = h, x i = i = 1, 2,..., d, x i, ha i h, ahol r U( 1, 1). Ha x D, próbálkozzunk újra. 4. lépés. A x állapotot ) (f( x) f(x))+ exp ( ct valószínűséggel fogadjuk el új aktuális állapotnak, ahol a + = a, ha a > 0, és a + = 0, egyébként, c pedig egy pozitív konstans. Ha nem fogadjuk el, ismételjük meg a 2 4 lépéseket. Az algoritmus a tényleges keresés megkezdése előtt az f függvény viselkedése alapján automatikusan meghatározza a megállási kritériumot és a kiinduló hőmérsékletet (lásd [42]), amit aztán T νt, 0 < ν < 1, polinomiális hűtéssel csökkentünk. A v h lépéshosszak menet közben folyamatosan változnak, amivel elérhető, hogy az algoritmus átlagosan a generált állapotok felét fogadja el. Az SA algoritmus leállásakor kapott minimumhelyből kiindulva még végrehajtunk egy hagyományos minimumkereső algoritmust, ami a vizsgált tesztfüggvények esetén minden esetben valamely globális minimumhely egy igen jó közelítését adta. A fent felvázolt algoritmus konvergenciájáról csak a gyakorlatban tudtunk meggyőződni, ha azonban a 2. lépésben a h koordinátairányt nem determinisztikusan, hanem a lehetséges irányokon értelmezett egyenletes eloszlás szerint választjuk ki és D = R d, akkor egy adott T hőmérsékleten az 1 4 lépésekkel leírt algoritmus egy olyan folytonos állapotterű homogén Markov lánccal modellezhető, melynek stacionárius eloszlása T 0 esetén tart az f globális minimumhelyein értelmezett egyenletes eloszláshoz (lásd [1, Theorem 2.1 2.3]). 4.1.3. Diszkrét geológiai struktúrák Markov mezős modellezése Az 4.1.1. szakaszban vizsgált hiányosan megfigyelt Markov láncok egy geológiai probléma kapcsán kerültek előtérbe [11]. Tekintsünk egy S = {1,..., s} állapotterű geológiai struktúrát (az állapotok pl. talaj- vagy kőzettípusok), amit az R={1,..., r} {1,..., c} Z 2 pontokban kívánunk megfigyelni. Jelölje C az x = (x (i,j) : (i, j) R), x (i,j) S lehetséges geológiai konfigurációk (általában igen nagy számosságú) halmazát. Egy adott x konfiguráció előfordulási valószínűsége legyen p(x) = exp( Ψ(x)) (4.1.4) exp( Ψ(x)), x C

34 4. FEJEZET. ALKALMAZOTT STATISZTIKAI MUNKÁK a. b. 4.2. ábra. a. Lerum térkép; b. ritkított Lerum térkép ahol Ψ(x) az x konfiguráció energiája. Tegyük fel, hogy x = x A x B, ahol A és B az R egy kettéosztása, x A az x megfigyelt, x B pedig nem a megfigyelhető része. Ekkor az x B -nek az x A megfigyelésekre vonatkozó feltételes valószínűsége p A (x B ) := p(x B x A ) = Cexp( Ψ A (x B )), ahol Ψ A (x B ) := Ψ(x A x B ). Kutatásaink célja, hogy Markov Chain Monte-Carlo technikával geológiai konfigurációkat szimuláljunk, valamint x A alapján megbecsüljük x B -t. x B = arg max p A (x B ) = arg min Ψ A (x B ). x B x B Mind a szimulációhoz, mind pedig a geológiai konfigurációk nem megfigyelhető részének becsléséhez ismernünk kell a Ψ(x) energiafüggvényt. Tegyük fel, hogy ennek alakja Ψ(x) = i,j ( ψ0 (x (i,j) )+ψ 1 (x (i,j 1), x (i,j) )+ψ 2 (x (i 1,j), x (i,j) ) +ψ 3 (x (i 1,j 1), x (i,j) ) +ψ 4 (x (i+1,j 1), x (i,j) ) ), ami négy irányú (Ny K, É D, ÉNy DK, DNy ÉK) függőséget feltételez az x konfigurációt alkotó változók között. Ezen belül a ψ 0 (x (i,j) ) függvény is négy, az egyes irányoknak megfelelő függvény átlaga: ψ 0 (x) = ( ψ 01 (x)+ψ 02 (x)+ψ 03 (x)+ψ 04 (x) ) /4. Az energiafüggvényt alkotó nyolc függvény nemparaméteres becslését úgy kaphatjuk meg, hogy minden l iránynak (l = 1, 2, 3, 4) megfeleltetünk egy p l (x, y) átmenetvalószínűségekkel és π l (x) stacionárius eloszlással bíró homogén Markov láncot. Ebből kiszámolva az egyes irányokhoz tartozó konfigurációk előfordulási valószínűségeit és összehasonlítva azokat (4.1.4) megfelelő tagjaival kapjuk, hogy egy-egy az adatoktól nem függő additív konstanstól eltekintve ψ 0l (x) = log π l (x), ψ l (x, y) = log π l (y) log p l (x, y), l = 1, 2, 3, 4.

4.1. SZTOCHASZTIKUS OPTIMALIZÁCIÓ EGY ALKALMAZÁSA 35 a. b. 4.3. ábra. a. Az eredeti LT alapján becsült Ψ (62.6% helyes); b. Az RLT alapján becsült Ψ (65.7% helyes). Ezek után, az adatokat tartalmazó mátrixban a sorokat, az oszlopokat illetve az átlókat egy-egy Markov lánc megfigyeléseinek tekintve az energiafüggvény l irányhoz tartozó komponenseinek becslése ψ 0l (x) = log π l (x) + C 0l, ψl (x, y) = log π l (y) log p l (x, y) + C l, ahol a C 0l és C l konstansok függetlenek az adatoktól, π l (x) és p l (x, y) pedig a π l (x) és a p l (x, y) ML becslése. Nem teljesen megfigyelt konfiguráció esetén az egyes irányoknak megfelelő Markov láncok megfigyelései hiányosak, így a π l (x) és p l (x, y) becsléseket a 4.1.1. és a 4.1.2. szakaszban tárgyalt módon kaphatjuk meg. Az energiafüggvény Ψ(x) becslésének ismeretében az egyes geológiai konfigurációk a Gibbs sampler segítségével szimulálhatóak, mely módszer az R pontjainak megfelelő megfigyeléseket egyenként szimulálva előállítja a (4.1.4) eloszlás becslésének egy realizációját (lásd [38]). A fent leírt módszer hatákonyságát két próbaterületen is teszteltük. Ebből az egyik a Lerum vidék, ami egy 5 5 km 2 -es terület Göteborgtól 25 km-re keleti irányban. Ezen a vidéken nyolcféle különböző fajtájú jégkori üledék található, azaz s = 8. Az általunk vizsgált térkép, ami a 4.2a. ábrán látható [11, Figure 1], egy 102 102 = 10404 egyenként 50 50 m 2 -es pixelből álló kép, ahol a különböző színek az egyes kőzettípusokat jelentik. 265 pixel ismeretlen (a fehérrel jelölt pixelek), mivel víz alatt vannak. A teszteléshez az eredeti megfigyeléseket megritkítottuk úgy, hogy az egyes megfigyeléseket 0.15 valószínűséggel tartottuk meg. Ezen ritkítás eredményeképpen kaptuk a 4.2b. ábrán látható [11, Figure 1] ritkított Lerum térképet (RLT). Ezek után az energiafüggvényt mind az eredeti Lerum térkép (LT), mind pedig az RLT alapján megbecsülve megpróbáltuk visszaállítani az RLT hiányzó részét a Gibbs sampler paramétereinek különböző értékei mellett (lásd pl. a 4.3. ábrát [11, Figure 1]). Azt tapasztaltuk, hogy az RLT alapján becsült energiafüggvénnyel készített becslések minden esetben jobban hasonlítottak az