4. előadás. Kiegyenlítő számítások MSc 2018/19 1 / 41

Hasonló dokumentumok
biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Továbblépés. Általános, lineáris modell. Példák. Jellemzık. Matematikai statisztika 12. elıadás,

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

A maximum likelihood becslésről

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Kísérlettervezés alapfogalmak

[Biomatematika 2] Orvosi biometria

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Loss Distribution Approach

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

6. Előadás. Vereb György, DE OEC BSI, október 12.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Határeloszlástétel a maximumokra. 3. előadás, március 1. A bizonyítás vázlata. Típusok. Tétel (Fisher és Tippet, 1928)

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Nemparaméteres próbák

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

Többváltozós lineáris regressziós modell feltételeinek

Kísérlettervezés alapfogalmak

egyetemi jegyzet Meskó Balázs

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Adatok statisztikai értékelésének főbb lehetőségei

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Bevezetés. 1. előadás, február 11. Módszerek. Tematika

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg

Bevezetés a hipotézisvizsgálatokba

[Biomatematika 2] Orvosi biometria

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Mérési hibák

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Valószínűségszámítás összefoglaló

y ij = µ + α i + e ij

Biostatisztika VIII. Mátyus László. 19 October

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

KÖZELÍTŐ INFERENCIA II.

[Biomatematika 2] Orvosi biometria

KÖZELÍTŐ INFERENCIA II.

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Valószínűségi változók. Várható érték és szórás

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

A Statisztika alapjai

Készítette: Fegyverneki Sándor

Számítógépes döntéstámogatás. Statisztikai elemzés

Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT

A valószínűségszámítás elemei

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Kvantitatív módszerek

Több valószínűségi változó együttes eloszlása, korreláció

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

A valószínűségszámítás elemei

Gyakorlati kérdések. 2. előadás, február 22. Szimuláció (Chambers, 1976) Michael-féle szórásstabilizált P-P plot

Algoritmusok Tervezése. 6. Előadás Algoritmusok 101 Dr. Bécsi Tamás

Baran Ágnes. Gyakorlat MATLAB. Baran Ágnes Gyakorlat 1 / 70

A mérési eredmény megadása

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Matematika III. 5. Nevezetes valószínűség-eloszlások Prof. Dr. Závoti, József

IBNR számítási módszerek áttekintése

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Normális eloszlás tesztje

Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Biomatematika 2 Orvosi biometria

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

Biometria az orvosi gyakorlatban. Számítógépes döntéstámogatás

Közlemény. Biostatisztika és informatika alapjai. Alapsokaság és minta

Pontfolyamatok definíciója. 5. előadás, március 10. Példák pontfolyamatokra. Pontfolyamatok gyenge konvergenciája

A Föld középpontja felé szabadon eső test sebessége növekszik, azaz, a

Statisztika elméleti összefoglaló

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

14 A Black-Scholes-Merton modell. Options, Futures, and Other Derivatives, 8th Edition, Copyright John C. Hull

Matematikai alapok és valószínőségszámítás. Normál eloszlás

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Monte Carlo módszerek a statisztikus fizikában. Az Ising modell. 8. előadás

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

Statisztikai módszerek a skálafüggetlen hálózatok

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Véletlenszám generátorok. 6. előadás

Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis

Babeş-Bolyai Tudományegyetem Fizika Kar, Kolozsvár. Hegyi Géza. Filozofia és Történelem Kar, Kolozsvár. M.A. Santos, R. Coelho és J.J.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Intervallumbecsle s Mintave tel+ Hipote zisvizsga lat Egyminta s pro ba k Ke tminta s pro ba k Egye b vizsga latok O sszef.

Átírás:

4. előadás Kiegyenlítő számítások MSc 2018/19 1 / 41

Áttekintés Extrém érték elmélet Monte Carlo eljárások 2 / 41

Extrém érték elmélet Bevezetés Alapvető módszerek (GEV és POT) Extrém érték eloszlások Alkalmazás: GNSS integritás vizsgálat 3 / 41

Bevezetés Az extrém érték elmélet (extreme value theory, EVT) célja olyan események valószínűségének a becslése, amelyek kívül esnek a megfigyelt adatok körén ilyen események lehetnek szélsőséges időjárási események földrengések, erdőtüzek GNSS életvédelmi célú szolgáltatás meghibásodása nagy kárértékű biztosítási események gépalkatrészek tönkremenetele (kifáradás, korrózió) tőzsdekrach 4 / 41

Bevezetés Az extrém érték elmélet alapvetően extrapolációt jelent a mérési adatok körén kívülre könnyen kritizálható, természeténél fogva nem megbízható modell feltevéseken alapszik, a valóság ennél mindig összetettebb Szilárd matematikai alapokon nyugszik nem javasoltak még más hihető alternatívát helyette a meglevő adatok legjobb felhasználására törekszik az extrém események valószínűségének kiszámítása céljából Óvatosságra van szükség az alkalmazása során 5 / 41

Hagyományos és extrém érték statisztika hagyományos statisztika: az átlagos viselkedésre összpontosít központi határeloszlás tétel extrém érték elmélet: a rendkívüli és ritka értékekre összpontosít Fisher-Tippett tétel 6 / 41

Alapvető módszerek Klasszikus (blokk) módszerek (GEV = Generalized Extreme Value) adott időszakon (blokk) belüli maximum értékekkel foglalkozik mi legyen az adott időszak? Küszöb feletti értékek elemzési módszere (POT = Peak Over Threshold) adott küszöbérték feletti értékekkel foglalkozik mi legyen az adott küszöbérték? 7 / 41

Közös jellemzők az extrém érték elmélet általánosan alkalmazható függetlenül a mért adatok eloszlásának (pl. Gauss eloszlás) feltételezésétől az eloszlások szélei az adatok és néhány általánosságban igaz feltételezés alapján meghatározhatók akkor is, ha nincs adat ebből a tartományból 8 / 41

Eloszlásfüggvények Blokk maximum M n =max {X 1,..., X n } ha n, akkor M n általánosított extrém érték (GEV) eloszlást követ Küszöb feletti értékek {X i u X i >u } nagyon nagy u küszöb esetén általánosított Pareto-féle eloszlást követ 9 / 41

GEV Fisher-Tippett tétel M n = max{x 1,, X n } eloszlása (n ) ξ 0 G( y )=exp( [ 1+ξ ( y μ σ ξ )] 1 ) ξ =0 G ( y)=exp( exp ( y μ σ )) ami az általánosított extrém érték eloszlás (GEV) paraméterek: μ hely, σ skála, ξ alak 10 / 41

GEV eloszlás típusok Gumbel ξ alak paramétertől függően 3 típusa van ξ =0 G( x)=exp ( exp [ x]) x= y μ σ Fréchet ξ =1/α>0 G( x)=exp( [ 1+ x α ] α) Weibull ξ = 1 /α<0 G( x)=exp( [ 1+ x α ]α) 11 / 41

GEV eloszlás típusok Gumbel ξ alak paramétertől függően 3 típusa van ξ =0 exponenciális szárny x= y μ σ Fréchet ξ =1/α>0 súlyos szárny Weibull ξ = 1 /α<0 felső végpont 12 / 41

GEV eloszlások A {X 1,, X n } mintára, melyből a maximumok származnak: Xi -k azonos eloszlású, egymástól független valószínűségi változók legyenek 13 / 41

Visszatérési szintek Adott idő (pl. 25, 50, 100 év) alatt várhatóan egyszer kapunk ilyen vagy magasabb értéket Ha E év alatt egyszer tér vissza: p = 1/E GEV p-kvantilise: G(z p )=1 p ξ 0 z p = μ σ ξ exp (1 y p ξ ) ahol ξ =0 z p = μ σ log y p y p =log(1 p) 14 / 41

Visszatérési szint görbe ábrázoljuk z p -t log(1 p) -vel szemben logaritmikus skálán lineáris (egyenes), ha ξ = 0 konvex görbe, határértéke μ σ, ha ξ < 0 ξ konkáv görbe, ha ξ > 0 Pirazzoli et al. 2007 15 / 41

Küszöb feletti értékek (POT) Azok az események extrémek, amelyek meghaladnak egy küszöböt Ha a küszöb elég magas, az azt meghaladó adatok hasonlóan viselkednek Előnye, hogy általában több adatunk van A küszöbérték helyes megválasztása kritikus pont 16 / 41

POT eloszlása Az Yi = {X i u X i > u}, vagyis egy u küszöbértéket meghaladó X i értékek eloszlása nagy u értékekre (u ) általánosított Pareto-féle eloszlást követ (GPD) paraméterek: σ skála, ξ alak H ( y X i >u )=1 ( 1+ξ y σ u ) 1 ξ 17 / 41

Küszöb választása: átlagos meghaladás ábra Tetszőleges u küszöbre ábrázoljuk az X i u várható értékét (átlagát) azokra a megfigyelésekre, melyekre X i > u az u függvényében Ha a Pareto modell igaz, akkor ez a görbe közelítőleg lineáris lesz Tehát úgy kell megválasztanunk a küszöb értékét, hogy a görbe már lineáris legyen 18 / 41

Átlagos meghaladás ábra R csomag: 'evir', meplot(danish) 19 / 41

POT eloszlás típusok ξ alak paramétertől függően 3 típusa van Gumbel ξ =0 exponenciális szárny H ( y)=1 exp ( y σ u ) Pareto(Fréchet) ξ >0 súlyos szárny 1 H ( y) cy 1 ξ Weibull ξ <0 felső végpont ω F = σ u ξ 20 / 41

Küszöb választás: paraméter - u ábra Tetszőleges u küszöbre ábrázoljuk a ξ vagy a σ paraméter becsült értékét azokra a megfigyelésekre, melyekre X i > u az u függvényében Ha a Pareto modell igaz, akkor ez a görbe közelítőleg konstans lesz Tehát úgy kell megválasztanunk a küszöb értékét, hogy a görbe konstans legyen 21 / 41

ξ(u) stabilitás ábra (parameter stability plot) R csomag: 'evir', shape(danish) 22 / 41

Alkalmazás: GNSS integritás vizsgálat légi irányítás szempontjából (ICAO LPV) a hiba (MI: Misleading Information) elfogadható maximális valószínűsége 2 10-7 150 s alatt (24 évente 1) klasszikus statisztikai módszerekkel nem kezelhető extrém érték elmélet jól használható az MI valószínűség becsléséhez GIMAT: GNSS Integrity Monitoring and Analysis Tool 23 / 41

VPE/VPL VPE: magassági pozíció hiba VPL: magassági biztonsági szint VPE/VPL > 1 := ML (félrevezető információ) 3 havi GPS/EGNOS adatok (> 6 millió epocha) vonal: Gauss-eloszlás Veerman et al. 2009 24 / 41

Extrém érték elmélet alkalmazása (GIMAT) átlagos meghaladás ábra paraméter stabilitás ábra 25 / 41

Monte Carlo eljárások Számítási algoritmusok széles köre, melyek ismételt véletlen mintavételezéssel állítanak elő számszerű eredményeket Hagyományos eszközökkel nehezen vagy egyáltalán nem vizsgálható problémák Fő alkalmazási területek: optimalizáció numerikus integrálás adott eloszlás szerinti minta generálása 26 / 41

Lépések 1) Meghatározzuk a lehetséges értékek tartományát 2) A tartományon megadott eloszlás szerint véletlen mintákat állítunk elő 3) A mintákon valamilyen előírt számítást végzünk 4) Összesítjük a kapott eredményeket 27 / 41

Mintavétel tetszőleges valószínűségeloszlásból Rendelkezünk a (0, 1) intervallumban egyenletes eloszlású véletlenszámokat szolgáltató eljárással Az F(x) eloszlásfüggvényű valószínűségeloszlásból szeretnénk n elemű mintát venni Ismerjük az F(x) eloszlásfüggvény inverzét, az F 1 (y) = F 1 (p) kvantilis függvényt Előállítunk n db yi egyenletes eloszlású véletlenszámot (i = 1,,n) Az x i = F 1 (y i ) a keresett n elemű minta 28 / 41

Mintavétel tetszőleges valószínűségeloszlásból y i =F (x i ) x i =F 1 ( y i ) F 1 (p) kvantilis függvény 29 / 41

Analitikusan megadható kvantilis függvények Devroye (1986) 30 / 41

Elutasító mintavétel javasolt eloszlából vett minta elfogadása/elutasítása cél eloszlás javasolt eloszlás elfogadjuk a mintát elutasítjuk a mintát 31 / 41

Véletlenszám generátorok fontos szempontok: statisztikai minőség előrejelezhetőség reprodukálható eredmények ismétlési periódus futásidő tárigény kódméret, bonyolultság tetszőleges dimenzióban egyenletes eloszlás 32 / 41

Véletlenszám generátorok http://www.pcg-random.org/ 33 / 41

Eloszlásfüggvények terjedése nem lineáris rendszeren keresztül Ismert a vizsgált rendszer modellje: y = g(x) Bemeneti xi (i = 1,, m) mennyiségek (együttes) vsz. eloszlás függvényei is ismertek: F i (x i ) ( F(x) ) Előállítunk az ismert Fi (x i ) eloszlások ( F(x) ) alapján véletlenszerűen egy lehetséges x bemenetet és meghatározzuk a g függvény alapján az y k (k = 1, n) kimeneteket Monte Carlo: Az eljárást sokszor (N-szer) megismételve az yk kimenetek mindegyikéből N elemű mintát kapunk A kimeneti mennyiségek tapasztalati eloszlásait meghatározzuk Az eloszlások segítségével az yk kimenetek legjellemzőbb értékeit és bizonytalanságait kiszámítjuk 34 / 41

Monte Carlo módszerek alkalmazása a mérési bizonytalanság meghatározására A GUM Supplement 1: Propagation of distributions using a Monte Carlo method 5.1.1 a) modell felállítása 1. a mérendő mennyiség, Y definiálása 2. az X = (X 1, X 2,, X N ) T bemeneti mennyiségek meghatározása, amiktől Y függ 3. az X-et és Y-t összekapcsoló modell megalkotása 4. a meglevő ismeretek alapján X i -k eloszlásfüggvényeinek (Gauss, egyenletes, háromszög, stb.) megadása, illetve nem független X i k együttes eloszlásfüggvényinek a megadása b) terjedés c) összefoglaló statisztikák készítése Y eloszlásfüggvényéről 35 / 41

Monte Carlo módszerek alkalmazása a mérési bizonytalanság meghatározására A GUM Supplement 1: Propagation of distributions using a Monte Carlo method 5.1.1 a) modell felállítása b) terjedés 1. az X i -k eloszlásfüggvényeinek terjedése a modellen keresztül, hogy megkapjuk Y eloszlásfüggvényét c) összefoglaló statisztikák készítése Y eloszlásfüggvényéről 1. az Y várható értéke lesz a mennyiség y becslése (nem minden alkalmazás számára megfelelő) 2. az Y standard bizonytalansága lesz az y mennyiség u(y) standard bizonytalansága (Cauchy eloszlás esetén nem létezik) 3. megbízhatósági tartomány készítése, mely Y -t előírt megbízhatósági valószínűséggel tartalmazza 36 / 41

Eloszlásfüggvények terjedése a mérendő mennyiség, Y eloszlásfüggvénye: η G Y (η)= g Y (z)dz a sűrűségfüggvény formális definíciója (δ a Dirac delta): g Y (η)= g X (ξ )δ(η f (ξ ))dξ N dξ 1 analitikusan az integrálás nem végrehajtható, helyette Monte Carlo számításra (MCM) van szükség 37 / 41

Eloszlásfüggvények terjedése Az eloszlások terjedésének illusztrációja N = 3 független bemeneti mennyiségre 38 / 41

Monte Carlo számítás az X bemeneti mennyiségek együttes g X (ξ) eloszlásfüggvényei p megbízhatósági valószínűség az Y = f(x) modell M db Monte Carlo kísérlet M db x 1,, x M vektor a g X (ξ) eloszlásfüggvényekből M db y r = f(x r ) modell érték, r = 1,, M az Y kimeneti mennyiség G tapasztalati eloszlásfüggvénye az Y kimeneti mennyiség y becslése és u(y) standard bizonytalansága az Y kimeneti mennyiség [y low, y high ] megbízhatósági intervalluma 39 / 41

MCM példa η=ξ 1 +ξ 2 +ξ 3 (Siebert Sommer, 2004) 40 / 41

Irodalom Steiner F. (1990): 5.1.3 pont Barabás B. (2010): Extrémérték-elmélet BME TTK Brodin E. (2006): A Non-mathematical Introduction to Statistics of Extremes NFT 3/2006 Friederichs P. (2007): An Introduction to Extreme Value Theory University of Bonn, COPS Summer School 41 / 41