Geostatisztika c. tárgy a BSc földrajz alapszak hallgatóinak

Hasonló dokumentumok
Geostatisztika I. Dr. Szabó Norbert Péter. BSc geográfus alapszak hallgatóinak

Geostatisztika. Dr. Szabó Norbert Péter. BSc műszaki földtudományi alapszak hallgatóinak

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

? közgazdasági statisztika

A paramétereket kísérletileg meghatározott yi értékekre támaszkodva becsülik. Ha n darab kisérletet (megfigyelést, mérést) végeznek, n darab

Matematikai statisztika

Megállapítható változók elemzése Függetlenségvizsgálat, illeszkedésvizsgálat, homogenitásvizsgálat

? közgazdasági statisztika

Statisztika. Eloszlásjellemzők

Változók függőségi viszonyainak vizsgálata

Matematikai statisztika elıadás III. éves elemzı szakosoknak. Zempléni András 9. elıadásból (részlet)

A MATEMATIKAI STATISZTIKA ELEMEI

Matematika B4 I. gyakorlat

Adatfeldolgozás, adatértékelés. Dr. Szűcs Péter, Dr. Madarász Tamás Miskolci Egyetem, Hidrogeológiai Mérnökgeológiai Tanszék

Regresszió és korreláció

Hipotéziselmélet. Statisztikai próbák I. Statisztikai próbák II. Informatikai Tudományok Doktori Iskola

Regresszió és korreláció

Ismérvek közötti kapcsolatok szorosságának vizsgálata. 1. Egy kis ismétlés: mérési skálák (Hunyadi-Vita: Statisztika I o)

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Matematikai statisztika

ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre

A sokaság/minta eloszlásának jellemzése

Tapasztalati eloszlás. Kumulált gyakorisági sorok. Példa. Értékösszegsor. Grafikus ábrázolás

2. METROLÓGIA ÉS HIBASZÁMíTÁS

4 2 lapultsági együttható =

Feladatok és megoldások a 11. heti gyakorlathoz

Függvénygörbe alatti terület a határozott integrál

GEOFIZIKA / 4. GRAVITÁCIÓS ANOMÁLIÁK PREDIKCIÓJA, ANALITIKAI FOLYTATÁSOK MÓDSZERE, GRAVITÁCIÓS ANOMÁLIATEREK SZŰRÉSE

Backtrack módszer (1.49)

Tartalomjegyzék. 4.3 Alkalmazás: sorozatgyártású tűgörgő átmérőjének jellemzése

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Intelligens adatelemzés ea. vázlat 1. rész

Statisztika 1. zárthelyi dolgozat március 21.

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

A pályázat címe: Rugalmas-képlékeny tartószerkezetek topológiai optimalizálásának néhány különleges feladata

STATISZTIKA II. kötet

Azonos névleges értékű, hitelesített súlyokból alkotott csoportok együttes mérési bizonytalansága

Korreláció- és regressziószámítás

Izsák János. ELTE TTK Állatrendszertani és Ökológiai Tanszék. Kézirat

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

BIOMATEMATIKA ELŐADÁS

MÉRÉSTECHNIKA. DR. HUBA ANTAL c. egy. tanár BME Mechatronika, Optika és Gépészeti Informatika Tanszék 2011

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

Regresszió. Fő cél: jóslás Történhet:

Mérési adatok feldolgozása Méréselmélet PE_MIK MI_BSc, VI_BSc 1

18. Valószín ségszámítás. (Valószín ségeloszlások, függetlenség. Valószín ségi változók várható

Miért pont úgy kombinálja kétfokozatú legkisebb négyzetek módszere (2SLS) az instrumentumokat, ahogy?

AZ OPTIMÁLIS MINTANAGYSÁG A KAPCSOLÓDÓ KÖLTSÉGEK ÉS BEVÉTELEK RELÁCIÓJÁBAN

1. A radioaktivitás statisztikus jellege

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

A matematikai statisztika elemei

VII. A határozatlan esetek kiküszöbölése

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

7. MÉRÉSEK KIÉRTÉKELÉSE FÜGGVÉNYILLESZTÉSSEL

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

A peremeloszlások. Valószínőségszámítás elıadás III. alk. matematikus szak. Példa. Valószínőségi vektorváltozók eloszlásfüggvénye.

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

I. Valószínűségelméleti és matematikai statisztikai alapok

Tulajdonságok. Teljes eseményrendszer. Valószínőségi változók függetlensége. Példák, szimulációk

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

10.M ALGEBRA < <

Arrhenius-paraméterek becslése közvetett és közvetlen mérések alapján

Ökonometria. /Elméleti jegyzet/

18. Differenciálszámítás

Méréselmélet PE_MIK MI_BSc, VI_BSc 1

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

Nevezetes sorozat-határértékek

Ha n darab standard normális eloszlású változót négyzetesen összegzünk, akkor kapjuk a χ 2 - eloszlást: N

Valószínűségszámítás. Ketskeméty László

A felhasznált térfogalmak: lineáris tér (vektortér), normált tér, Banach tér, euklideszi-tér, Hilbert tér. legjobban közelítõ elem, azaz v u

ALGEBRA. egyenlet megoldásait, ha tudjuk, hogy egész számok, továbbá p + q = 198.

Bevezetés a hipotézis vizsgálatba. Hipotézisvizsgálatok. Próbák leírása. Kétoldali és egyoldali hipotézisek. Illeszkedésvizsgálatok

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

Megoldás a, A sebességből és a hullámhosszból számított periódusidőket T a táblázat

Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X = 1) = p Ind(p) P(X = 0) = 1 p. Leíró és matematikai statisztika

Példák 2. Teljes eseményrendszer. Tulajdonságok. Példák diszkrét valószínőségi változókra

13. Tárcsák számítása. 1. A felületszerkezetek. A felületszerkezetek típusai

A heteroszkedaszticitásról egyszerûbben

Dr. Hanka László PhD. KOCKÁZAT BECSLÉSE A VALÓSZÍNŰSÉG KISZÁMÍTÁSA NÉLKÜL, A MEGBÍZHATÓSÁGI INDEX ÉS ALKALMAZÁSA

= dx 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05

Statisztikai. Statisztika Sportszervező BSc képzés NBG GI866G4. Statisztika fogalma. Statisztikai alapfogalmak. Statisztika fogalma

FELADATOK MÉRÉSELMÉLET tárgykörben. 1. Egy műszer osztálypontossága 2.5, a végkitérése 300 V. Mekkora a mérés abszolút hibája?

Szemmegoszlási jellemzők

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Alkalmazott Informatikai Tanszék

Méréstani összefoglaló

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

2. Hatványsorok. A végtelen soroknál tanultuk, hogy az. végtelen sort adja: 1 + x + x x n +...

MINTAVÉTEL A MARKETINGKUTATÁSBAN, KÜLÖNÖS TEKINTETTEL A DIVIZÍV ÉS AZ AGGLOMERATÍV RÉTEGZÉSRE

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

Regresszióanalízis. Példák. A regressziószámítás alapproblémája. A regressziószámítás alapproblémája. Informatikai Tudományok Doktori Iskola

Sorozatok október 15. Határozza meg a következ sorozatok határértékeit!

MATEMATIKA I. KATEGÓRIA (SZAKKÖZÉPISKOLA)

A G miatt (3tagra) Az egyenlőtlenségek két végét továbbvizsgálva, ha mindkét oldalt hatványozzuk:

KÍSÉRLETTERVEZÉS ÉS ÉRTÉKELÉS A MIKROBIOLÓGIAI GYAKORLATBAN

Dr. Tóth Zsuzsanna Eszter Dr. Jónás Tamás Erdei János. Gazdaságstatisztika. II. rész A matematikai statisztika alapjai

Valós függvénytan. rendezett pár, ( x, valós számok leképezése az csoportra. függvény mint előírás, pl. y x azt jelenti, hogy x

Átírás:

Geostatsztka c. tárgy a BSc földrajz alapszak hallgatóak Dr. Szabó Norbert Péter egyetem taársegéd Geofzka Taszék e-mal: orbert.szabo.phd@gmal.com gfmal@u-mskolc.hu

Tematka Adatredszerek, hsztogrammok és sűrűségmodellek. A legjellemzőbb érték meghatározása. Az adatredszerbe rejlő bzoytalaság jellemzése. Statsztka becslések, becslések határeloszlása. Statsztka (paraméteres és emparaméteres) próbák. A kovaraca és a korrelácó fogalma. A leárs függés mérőszámáak meghatározása. Következtetés be em mért térrészek jellemzőre krgeléssel. Kegyelítések, leárs és emleárs regresszó. Bevezetés a MATLAB programyelvbe. A Statstcs Toolbo éháy eleme. Geostatsztka c. tárgy a BSc geográfus alapszak hallgatóak ME 009

. Adatredszerek, hsztogrammok, sűrűségmodellek Geostatsztka c. tárgy a BSc geográfus alapszak hallgatóak ME 009

Adatredszerek ábrázolása a számegyeese Ábrázoljuk adatak mdegykét rövd voalkét a számegyeese. Pl. smételt rádoaktív mérés azoos mtá, azoos műszerrel, azoos körülméyek között. Azoos dőtartam alatt külöböző számú részecskét érzékelt a műszer. Atom bomlás folyamatok em determsztkusak. Statsztkus gadozás: mért értékek a várható érték körül szórak.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Adatredszerek ábrázolása a számegyeese Valószíű statsztkus hba: észlelt eseméyek száma meghatározott dő alatt középértékbe, mely ± statsztkus gadozást mutat. A ± / relatív hba értéke övelésével csökke. Megfgyelést lehetőleg hosszú dőre ll. agyszámú eseméyre terjesztjük k. Számegyeese balról jobbra ő az adatsűrűség, mamum elérése utá ugyaolya ütembe csökke. Itervallum helyétől függő gyakorsággal várhatuk adatokat. Mérés smétlés: adatszám változk az tervallumokba, adatsűrűségváltozás globálsa em.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Adatok előfordulás számáak ábrázolása A mérés sorá többször s előfordulhat ugyaaz az adat. Pl. Borsod II. szételep Múcsoy területére voatkozó vastagság adata. Tegelyek, : telepvastagság, y: előfordulás (darabszám).. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Adatredszerek ábrázolása, a hsztogram Résztervallumokét ábrázoljuk a darabszámot. Az y tegelye a darabszámak megfelelő magasságba tegellyel párhuzamos egyeest húzuk mde egyes résztervallumo. A kapott lépcsős függvéyt hsztogramak (tapasztalat sűrűségfüggvéyek) evezzük.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Adatredszerek ábrázolása, a hsztogram Résztervallumok hosszáak (h) meghatározása. Azoos h hosszúság: téglalap területe aráyos az adott résztervallumra eső adatszámmal (adatsűrűséggel). A h rossz megválasztása: - agy h: torzult globáls adatsűrűség kép, - ks h: zavaró agy ampltudójú fluktuácók.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Adatredszerek ábrázolása, a hsztogram Hsztogram e legye adatszám függő, mért adatok száma:. Adatsűrűség eloszlás globáls törvéyszerűsége függetleek legyeek -től. Ábrázoljuk az ordátá / aráyt, ez a relatív gyakorság. Gyakorság*00: az összes adat háy százaléka esett az adott résztervallumba. Hsztogram ormálása: hsztogram oszlopaak összterülete legye - h=, ez az abszcssza átskálázásával jár, - ordáta legye /(h), abszcsszát em kell átskáláz.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Nevezetes adatsűrűség modellek A hsztogram látszólagos adatsűrűség-ugrást mutat bzoyos helyeke. A globáls változás meete folyamatos. Bzoyos függvéytípusok közül választuk, aak paraméteret úgy választjuk meg, hogy a függvéygörbe a lehető legjobba lleszkedje a hsztogram (, y ) adatpárjahoz (ld. résztervallum közepé elhelyezett ullkörök). Adatok közelítőleg szmmetrkus eloszlásuak. Nevezetes adatsűrűség modellek szmmetrkus függvéyek: f (T ) f (T ) ahol T: szmmetra pot, f(): sűrűségfüggvéy.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Nevezetes adatsűrűség modellek Stadard alak: a szmmetrapot T=0, szélességet szabályzó paraméter S=. Általáos alak: (-T)/S ; f() f()/s. Ekkor a szmmetrapot =T-be kerül, és S -szerese elyújtott függvéy lesz az -tegely ráyába és a teljes görbe alatt terület: - f()d Aak valószíűsége, hogy az adat az [a,b] tervallumba esk: P(a b) f()d b a Az S paramétert skálaparaméterek, T -t helyparaméterek evezzük.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Nevezetes adatsűrűség modellek. Egyeletes adateloszlás sűrűségfüggvéye Az adatok S hosszúságú tervallumba egyeletese helyezkedek el. Sűrűségfüggvéye:, f u () S 0, Teljes számegyeesre vett tegrálja. S T egyébkét T S Ábra: egyeletes eloszlású sűrűségmodell llesztése a Borsod II. szételep-vastagság adatredszerére.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Nevezetes adatsűrűség modellek. Gauss-eloszlás sűrűségfüggvéye Normáls eloszlás, a mérés hbák tpkus (elfogadott) eloszlása. Stadard alakja: f G () e Általáos alakja: f G () S e (T) S Ábra: Gauss sűrűségmodell llesztése a Borsod II. szételep-vastagság adatredszerére.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Nevezetes adatsűrűség modellek 3. Laplace-eloszlás sűrűségfüggvéye Gaussál szélesebb száryú eloszlás, csökkeés helyett va a ktevőbe, kevésbé gyors csökkeés zérus értékre. Stadard alakja: f L () e Általáos alakja: f L () S e T S Ábra: Laplace sűrűségmodell llesztése a Borsod II. szételep-vastagság adatredszerére.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Nevezetes adatsűrűség modellek 4. Cauchy-eloszlás sűrűségfüggvéye Laplace sűrűségfüggvéyek =T-be hegyes csúcsa va, (jobb és bal oldal dfferecaháyadosok eltérőek). Cauchy-ak cs hegyes csúcsa, még súlyosabb száryak. Stadard alakja: f C () Általáos alakja: fc() S T S Ábra: Cauchy sűrűségmodell S S T llesztése a Borsod II. szételep-vastagság adatredszerére.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

A helyparaméter jeletése Helyparaméter (T): Szmmetrkus eloszlásál T a szmmetrapot, em szmmetrkusál em az. T jelöl k az adatsűrűség-eloszlás helyét az -tegelye, a mamáls sűrűség helye, a mérés adatredszer alapjá a mért meység legvalószíűbb értéke. T bzoyos esetekbe érdektele pl. szemcseagyság vzsgálatokál..6. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

A skálaparaméter jeletése Skálaparaméter (S): Sűrűségfüggvéy szélességét jellemz. Nagy S-él agy az adatok statsztkus gadozása. Határozatlasággal áll kapcsolatba. S smeretébe számítható k, T meghatározás hbája.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Sűrűségmodell llesztése az adatredszerre a legksebb égyzetek elve alapjá Illesztés követelméye: hsztogram potja összességükbe lehető legközelebb legyeek a sűrűségfüggvéyhez. Jelölések: : -edk adat, y = /(h): relatív gyakorság (ormált), f(,t,s): kegyelítő modell (aaltkus sűrűségfüggvéy). Keressük: az optmáls T és S értékpárt. Illeszkedés aál a T és S értékpárál a legjobb, ahol a mérésből (hsztogramból) meghatározott y -k és a f(,t,s) modellből számított y értékek eltéréseek égyzetösszege mmáls. Az optmalzácós feladat célfüggvéye: N y f,t,s m. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Sűrűségmodell llesztése az adatredszerre a legksebb égyzetek elve alapjá Általáos esetbe sorfejtéses alakba kereshetjük f()-et: f (,p) f (,p T() smert bázsfüggvéy-redszer, pl. polomáls közelítés:t j ()= j. Mmalzáladó célfüggvéy: J 0,p,...,pJ ) p0 p jt j() j N y p0 pt () pt ()... p jt j() m Mmum feltétel ott teljesül, ahol a parcáls derváltak egydejűleg zérus értékűek (értő párhuzamos az abszcsszával): p q N y p p T ( ) p T ( )... p T ( ) 0, q 0,,,..., J 0 j j. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009 Sűrűségmodell llesztése az adatredszerre a legksebb égyzetek elve alapjá Leárs algebra egyeletredszer adódk: Ismeretleek: p q együtthatók (q=0,,,,j). Ismert meységek: T j ( ) függvéyek (j=,,,j; =,,,). Megoldásfüggvéy a becsült paraméterekkel: J J J J J J 0 J J 0 J J 0 ) ( T y ) ( T p... ) ( )T ( T p ) )T ( ( T p ) ( T p ) T ( y ) ( )T T ( p... ) ( )T T ( p ) ( T p ) T ( p y ) ( T p... ) ( T p ) T ( p p J j j (becs.) j (becs.) 0 (becs.) T () p p ) f (,p

Modell-családok (szupermodellek) Mért adatok száma () legye agy. Sűrű és elég agy megbízhatósággal adottak a hsztogram potja. Alkalmazzuk aaltkus alakkal adott modellcsaládot, szupermodellt. Egy vagy több paraméter változtatásával más és más jellegű sűrűségmodellhez jutuk. Továbbakba T=0, S= stadard alakokkal fogalkozuk. Umodáls adateloszlás: egymamumú görbék, ekkor a mamum helyét móduszak evezzük.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Szmmetrkus szupermodellek. Az f a () szupermodell Sűrűségfüggvéy stadard alakja (a>) f a () (a) a : típusparaméter, : ormálás együttható. Gamma függvéy: faktoráls művelet általáosítása (z)=(z-)! ahol (z!= k=..z k). (a) a a ks értékeél súlyos száryak, agy értékekél rövdebbek., a a. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Szmmetrkus szupermodellek Az f a () szupermodell a= esetbe a Cauchy sűrűségfüggvéy, (a=)=/. Az f a () szupermodell a= esetbe a Gauss sűrűségfüggvéyhez tart. Geostatsztka feladatokál a=5 eset alkalmazása az optmáls. Gamma függvéy. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Szmmetrkus szupermodellek. Az f p () szupermodell Sűrűségfüggvéy stadard alakja (p>0) f p () (p)e p p, (p) p p p p :típusparaméter, : ormálás együttható. p=: Laplace sűrűségmodell. p-t övelve lapos mamum. Gyakorlatba p> és p rtká agyobb mt.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Egyparaméteres aszmmetrkus szupermodellek Aszmmetrkus adatsűrűség modellekél feáll: Ferdeség (skewess), szmmetrától való eltérés mérőszáma, (3-adk cetráls mometum és a szórás köbéek háyadosa) f (T ) f (T ) 3 3 ha a szmmetrkushoz képest jobbra "yúlk el" a sűrűségfüggvéy (>0), ha balra (<0), ha pedg szmmetrkus az eloszlás (=0). Szupermodell egatív varásáak képzése -, T eltolása.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Egyparaméteres aszmmetrkus szupermodellek. A Webull-féle szupermodell Sűrűségfüggvéy stadard alakja (>0, p), p - típusparaméter: f W () p p Módusz abszcsszá: m p p Ifleós potok abszcsszá: e p f, 3 p 4 3 p p 5p 6p p p. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Egyparaméteres aszmmetrkus szupermodellek. A logorm szupermodell Logartmkusa ormáls eloszlás, adatok logartmusa modellezhető Gauss sűrűségfüggvéyel. Sűrűségfüggvéy stadard alakja (>0, p>0), p - típusparaméter: f l () p e (l ) p Ércek fémtartalmát rögzítő adatredszerekél optmáls.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Egyparaméteres aszmmetrkus szupermodellek 3. A gamma szupermodell Sűrűségfüggvéy stadard alakja (>0, p>): f () (p) p e p p - típusparaméter: (p) p p (p) Gyakor próbastatsztka függvéy.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Kétparaméteres aszmmetrkus szupermodellek. A típuscsalád Sűrűségfüggvéy stadard alakja (0<<, p, q ): f () (p,q) p ( ) q p és q: típusparaméterek. Normálás téyező: (p, q) (p q) (p) (q). Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Kétparaméteres aszmmetrkus szupermodellek. Az F-szupermodell Sűrűségfüggvéy stadard alakja (>0, p>0, q>0): f F () (p, q) p p q (pq) p és q: típusparaméterek. Normálás téyező: (p,q) (p q) (p) (q) p q p. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Kumulatív gyakorság hsztogram Külöböző tervallumokba más és más az adatelőfordulás gyakorsága. Sűrűségfüggvéyek távol tartomáyába s poztív f()-ek vaak. Mlye aráyba várhatók egy ktütetett 0 -ál ksebb adatok? Kumulatív gyakorság hsztogram (tapasztalat eloszlásfüggvéy): lépcsős függvéy, amely mde -él megadja háy eél ksebb adatuk va. Értékkészlete [0,]. Ordtá ott ugrk fel a gyakorság adatak megfeklelő értékkel, ahol egy új mérés jeletkezk az abszcsszá.. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Kumulatív gyakorság hsztogram Résztervallumok határá (balról jobbra haladva) felrajzoljuk, hogy az adatok mlye aráyba ksebbek az tervallumhatárak megfelelő értékél (baloldal ábra). Hsztogramoszlop magasságával aráyos meredekségű összekapcsolodó szakaszok szerkesztése (jobboldal ábra).. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

Az eloszlásfüggvéy Adatok mlye aráyba ksebbek valamely 0 értékél? Kellőe agy adatszám eseté és f() smeretébe számítható. Az eloszlásfüggvéy: valós számhoz aak a valószíűségét redel, hogy a valószíűség változó eél ksebb értéket vesz fel: Mvel f() -re ormált, ezért 0 F() ; az f()0 matt F() mooto övekvő: F( ) F( ), ha <. Mlye aráyba fordulak elő 0 -ál agyobb adatok: -F(); mlye aráyba fordulak elő [a,b] tervallumo adatok: F(b)-F(a). Adatak háy százaléka ksebb, mt : 00*F(). Az eloszlásfüggvéy a sűrűségfüggvéy prmtív függvéye:. Adatredszerek, hsztogrammok, sűrűségmodellek ME 009 0 F(0) f () d df() f () d

Az eloszlásfüggvéy Normál eloszlás sűrűség- és eloszlásfüggvéye: df() f () d Gyakorlat példa: szemcse-eloszlás görbék. (Fredlud et al.,000: A equato to represet gra-sze dstrbuto.caada Geotech. J. Vol.37, pp. 8). Adatredszerek, hsztogrammok, sűrűségmodellek ME 009

. A legjellemzőbb érték meghatározása Geostatsztka c. tárgy a BSc geográfus alapszak hallgatóak ME 009

Mta alapjá meghatározott jellemző értékek Számta átlag: mtaátlag, azoos súllyal vesz fgyelembe az adatokat k Súlyozott átlag: az adatokat a pror súlyokkal (q) vesz fgyelembe k Medá: eél agyobb és ksebb elem ugyaay va a mtába med () / /,. A legjellemzőbb érték meghatározása ME 009 k q k k q k k () /, páratla páros

Mta alapjá meghatározott jellemző értékek A Leggyakorbb érték teratív súlyozott jellemző érték, jele: M. Outler: kugró adat (hbás műszer, elrotott mérés, adattovábbítás vagy rögzítés) Rezszteca: durva hbájú (kugró) adatokra érzéketle becslés algortmus. Robusztusság: tág típustartomáyra alkalmazható becslés algortmus.. A legjellemzőbb érték meghatározása ME 009

A leggyakorbb érték. Iterácó rögzített szélességparaméterű súlyfüggvéyel Súlyozás megbízhatóbb eredméyt ad, mt a számta átlag. Adatok zömétől távol eső potokak ks súlyt, a legagyobb adatsűrűség helye agy súlyt aduk. T -t em smerjük, az algortmus teratív lesz (agy és szmmetrkus umodáls eset). Súlyozott átlag orgóra szmmetrkus súlyfüggvéyel: T, T A súlyok T közelébe ma = értékűek, a távolsággal a súlyok csökkeek, outlerek eseté közel 0-ák ( most smert).. A legjellemzőbb érték meghatározása ME 009

A leggyakorbb érték Ekkor (ha em korlátozóduk szmmetrkus sűrűségeloszlásra és agy -re) az terácó eredméyekét adódó helyparaméterű meységet leggyakorbb értékek evezzük (j: terácós lépésszám): M,j. A súlyfüggvéy szélességparaméteréek meghatározása Súlyfüggvéybe M legye smert, és szélességparaméter smeretle () M,j M,j M. A legjellemzőbb érték meghatározása ME 009

A leggyakorbb érték Az megválasztása: - agy : mde adathoz ugyaakkora súly, kugró adatok tökre tehetk a becslést (. és. görbe), - ks : emcsak az outlerek, de még a cetrumhoz közel potok s fgyelme kívül maradak (4. görbe). Az a potok tömörödés tedecáját (kohézó) jellemz, agysága azzal fordította aráyos, eve dhézó.. A legjellemzőbb érték meghatározása ME 009

A leggyakorbb érték. A legjellemzőbb érték meghatározása ME 009 Az mmalzálása és a súlyok eff () effektív potszámáak (súlyok összege) egydejű mamalzálása: Az meghatározása optmalzácóval, lassú és elv lehetőség. Gyakorlatba terácós algortmussal határozzuk meg -t: Az em lehet agyobb a mtaterjedelemél: ma M M ) ( 3/ eff j j j M M M 3 m ma 3

A leggyakorbb érték. A legjellemzőbb érték meghatározása ME 009 3. Az M és meghatározása együttes meghatározása Első közelítéskét M -re E -t vagy med -t fogadjuk el (j=). A dhézó első közelítését a mtaterjedelemből becsüljük (j=). Majd pg-pog terácóval M -t és -t szmultá javítjuk: Stopkrtérum: amíg a dhézó formulájába a jobb és bal oldalo szereplő -ok meg em egyezek. Az általáosított leggyakorbb érték defícója:,j j,j j,j j M M M 3,j j j,j j j,j M M M k, k, k, M ) (k M ) (k M

Valószíűség változó várható értéke Relatív gyakorság: A eseméy bekövetkezéséek száma aráyítva az összes kísérlet számához ( A /). Valószíűség: egyre több kísérlet eseté a relatív gyakorság a P(A) számérték körül gadozk, A eseméy az összes kísérletek várhatóa háyad részébe következk be. Kolmogorov aómá:. 0 P(A),. P(A)=, 3. P(A+B)=P(A)+P(B), ha AB=0 (párokét kzáró eseméyek). Aómákból levezethető tételek:. P(o)=0, ha o: lehetetle eseméy,. P(Â)=-P(A), ha  az A eseméy elletéte, 3. P(A+B)=P(A)+P(B)-P(AB), ha A és B em zárják k egymást.. A legjellemzőbb érték meghatározása ME 009

Valószíűség változó várható értéke Valószíűség változó: az eseméytére értelmezett függvéy, melyek értéke attól függ melyk elem eseméy következett be. Dszkrét valószíűség változó eseté a valószíűség lehetséges eseméy eseté: p k P( k ), (k,,3,...), pk k Várható érték: az a szám, amely körül a valószíűség változó megfgyelt értékeek átlaga gadozk E() k Várható értékre voatkozó tételek: E(c) ce(), E(y ) E()E(y), E( y) E() E(y), E(a b) ae() b, k p k c :kost.,, y :függetle, y :em függetle a,b :kost. val.változók, val.változók,. A legjellemzőbb érték meghatározása ME 009

Jellemző értékek meghatározása a sűrűségfüggvéy smeretébe Aak valószíűsége, hogy az adat az [,+h] tervallumba esk: h 0 P(0 0 P(0 0 h) f()d f(0)h f (0) h 0 h) Az tervallumba esés valószíűsége közelítőleg egyelő a relatív gyakorsággal (tervallumba eső adatok száma/összes adatszám*tervallum hossza) 0 f (0) h. A legjellemzőbb érték meghatározása ME 009

Jellemző értékek meghatározása a sűrűségfüggvéy smeretébe Várható érték: az a szám, amely körül a valószíűség változó megfgyelt értékeek átlaga gadozk E kpk hkf (k ) k k Ha h-t csöketjük mde határo túl a kfejezés tart E f () d Hasolóa adódk a leggyakorbb érték és a dhézó folytoos formulája M M M M f ()d f ()d, Medá: eél agyobb és ksebb adat 50%-os relatív gyakorsággal fordul elő. A legjellemzőbb érték meghatározása ME 009 med f ()d 3 0.5 M M f ()d f ()d

3. Az adatredszerbe rejlő bzoytalaság jellemzése Geostatsztka c. tárgy a BSc geográfus alapszak hallgatóak ME 009

A hba megjeleése az adatredszerbe, hbatípusok. Szsztematkus (redszeres) hba: Determsztkus oka vaak. Azoos körülméyek között végzett mérésekél agysága és előjele em változk. Ilyeek a mérőeszköz tökéletleségéből származó hbák (a működés ll. htelesítés potatlasága), mérés módszerek specfkus hbá, vagy az elhayagolt külső hatásokból (yomás, hőmérséklet, páratartalom) eredő bzoytalaság. Részbe korrgálható.. Véletle hba: A mérést befolyásoló külső okok együttes következméyekét lép fel. Mde egyes mérésél másképp jeletkezk. Előjele egatív és poztív egyarát lehet (véletleszerűe fellépő köryezet hatások, mérőműszer működés hbája, beállítás- és leolvasás potatlaságok). Teljese em küszöbölhető k (átlagos hatásuk becsülhető). 3. Statsztkus hba: Nagyszámú egymástól függetle eseméy megfgyelésekor lép fel. Ilye például a részecskeszámlálásál észlelt hba (statsztkus gadozás). A mérés adatszám övelésével csökkethető. 3. Az adatredszerbe rejlő bzoytalaság jellemzése ME 009

Adatredszer 0 -tól való távolsága Valód hba: ha smerék valamely meység potos értékét ( potos ), majd végezék egyetle mérést erre a meységre, akkor mérésük eredméyéek a hbája - potos lee. Potos értéket em smerjük, azt med, E vagy M -el helyettesítjük. Ezek külöbözek, így a hbajellemzők s. Defáljuk egyetle adat távolságát 0 -tól, pl. 0 (p 0) Az =[,,, ] adatredszer 0 -tól való távolsága, pl. 0 p 0 p (p ); (p ) Ha pl. az -ál ksebb adateltérések hatását gyakorlatlag azoosak vesszük, és csökketjük a agy abszolút értékű eltérések hatását: 3. Az adatredszerbe rejlő bzoytalaság jellemzése ME 009 0 0

Adatredszer 0 -tól való távolsága A fet meységeket függetleítsük -től és a távolság dmezója egyezze meg dmezójával: Mdegykre gaz, hogyha az 0 távol va a leggyakrabba előforduló -ek tartomáyától a távolságok agyok. A vektor ormák 0 szert mmumhelyet az adatredszer jellemző értékekét fogadjuk el: - L -orma eseté: med (medá), - L -orma eseté: E (számta átlag), - P -orma eseté: M (leggyakorbb érték). 0 k, 0 0 0 0 p / p 0 p k P ; P L ; L ; L 3. Az adatredszerbe rejlő bzoytalaság jellemzése ME 009

Hbaformulák Ha a mmumhely értékét 0 helyébe írjuk, egyetle távolságjellegű adatot kapuk, amely jellemz az adatokak a mmumhelytől való távolságát. Nagy átlagos távolság eseté agy a határozatlaság. Ha egyetle adatot fogaduk el jellemző értékek, akkor ez a távolság a hba mértékéek tekthető. Nem a med, E vagy M jellemzők, haem az egyes adatok hbájáról (adatredszer bzoytalaságáról) beszélük. d U emp emp emp med E M közepeseltérés (L emprkus szórás(l orma) orma) emprkus határozatlaság (P orma, k ) Folytoos eloszlás (tegrálformulák) eseté elmélet szórásról stb. beszélük. 3. Az adatredszerbe rejlő bzoytalaság jellemzése ME 009

Kugró adatot tartalmazó adatredszer hbája Az =,,,6 adatsorra számítsuk k az L -, L -, P-ormák értékváltozásat 0 =4-től kezdve egy mooto értéksoro. A ormák mmumhelye felvett értéke adja az adatok hbáját. A ormák külöböző hbákat mutatak. Kugró adatokra az L -orma ge érzékey, P-orma legkevésbé. 3. Az adatredszerbe rejlő bzoytalaság jellemzése ME 009

Kugró adatot em tartalmazó adatredszer hbája Az adatsorból távolítsuk el a kugró adatot (=40). A ormagörbék szmmetrkusak és med =E =M =0. A hbák értéke s agyo közel. Nagy külöbség akkor várható, ha durva hbájú adatok vagy az adateloszlás sűrűségfüggvéyéek súlyosak a szárya. 3. Az adatredszerbe rejlő bzoytalaság jellemzése ME 009

Korrgált emprkus hbaformulák Az emprkus szóráségyzet ( ) torzított becslése az elmélet varacáak (), mvel E( ): Korrgált tapasztalat (emprkus) szórás defícója: A fet korrgált tapasztalat szórás már torzítatla becslése az elmélet szórásak, mvel E( )=. Bzoyítás: A korrgált tapasztalat szórás evezőjébe - szerepel, mvel meghatározása - függetle adatból törték. A számta közép ( átlag) függ a mtaelemektől, mely egy adatot kszámíthatóvá tesz., 3. Az adatredszerbe rejlő bzoytalaság jellemzése ME 009, E E E E

A dhézó, mt hbajellemző Az értéke outler eseté em sokat változott (ld. előző két ábra). Ha rögzített 0 mellett egyetle adatot mde határo túl övelék, akkor a P-orma értéke s mde határo túl őe. A dhézóál fordított a helyzet, egyre kább elhayagolható a távol adat szerepe. Ha egy általáos f()-el jellemzett adatredszerre Cauchy-eloszlást llesztük, akkor aak skálaparamétere optmáls esetbe a dhézó: f C () T A dhézó f()-hez legjobba hasolító Cauchy-eloszlás valószíű hbája. Valószíű hba: a szmmetrapottól jobbra és balra skálaparaméteryt felmérve a számegyeese, olya tervallumhoz jutuk, melybe 50%-os relatív gyakorsággal várhatók az adatok. 3. Az adatredszerbe rejlő bzoytalaság jellemzése ME 009

Valószíűség változó varacája Dszkrét valószíűség változókál a valószíűség lehetséges eseméy eseté: p k P( k ), (k,,3,...), pk k Szóráségyzet (varaca): a valószíűség változó várható értékétől való eltérést jellemz () E E() E() k k p k Varacára voatkozó tételek: E( ) E (a b) a ( y) (), (), () (y), a,b : kost.,, y : függetle val.változók, 3. Az adatredszerbe rejlő bzoytalaság jellemzése ME 009

Valószíűség változó varacája Csebsev-egyelőtleség: a valószíűség változó várható érték körül szóródására ad felvlágosítást E() ahol : tetszőleges poztív szám. Folytoos valószíűség változó varacája: Statsztka mometumok defcója: k k k k E E E E k E() k P E() () f () d k adk mometum, k adk cetráls mometum, k k adk abszolút mometum, k E() k adk cetráls abszolút mometum. 3. Az adatredszerbe rejlő bzoytalaság jellemzése ME 009

Kofdeca-tervallumok A dhézó a leggyakorbb előfordulás tervallumát jellemz. Arról s formál, hogy az adatok háy százaléka várható a dhézó valamlye többszörösét ktevő hosszúságú tervallumo kívül. Az ábrá látható példá szereplő százalékos előfordulás gyakorságot kofdecasztek, a hozzá tartozó tervallumot kofdeca-tervallumak evezzük. 3. Az adatredszerbe rejlő bzoytalaság jellemzése ME 009

Kofdeca-tervallumok A [-Q,Q] terszeksztls tervallumba az adatok /3-ada (66% kofdecaszt), a [-q,q] terkvartls tervallumba azok fele (50% kofdecaszt) várható. A q az alsó kvartls (adatok ¼-e ksebb), q felső kvartls (adatok ¼- e agyobb). A Q az alsó szetls (adatok /6-a ksebb), Q felső szetls (adatok /6-a agyobb). Hba jellemzése: terkvartls félterjedelem (q) és terszetls félterjedelem (Q). 3. Az adatredszerbe rejlő bzoytalaság jellemzése ME 009

Stadard Gauss-eloszlás szórása és a kvartlsek 3. Az adatredszerbe rejlő bzoytalaság jellemzése ME 009

Közvetette meghatározott meység hbája, a mérés hba terjedése Ha egy fzka meység függ más meységektől q=f(,y, ), akkor,y, mérésével és, y, hbák smeretébe, q meység átlagértéke és hbája jó közelítéssel meghatározható q q q f (, y) q, Függetle valószíűség változók eseté általáosa feáll: Így a fet szóráségyzetekre teljesül: A mérés hbára adódk: q ahol q,y q y c c c q q q q,y,y q y q y,y,y y y,y y 3. Az adatredszerbe rejlő bzoytalaság jellemzése ME 009

4. Mamum lkelhood becslés, becslések határeloszlása Geostatsztka c. tárgy a BSc geográfus alapszak hallgatóak ME 009

Sűrűségeloszlások paramétereek mamum lkelhood-becslése A mamum lkelhood elv mamáls hasolóságot keres a mta és a sűrűségfüggvéy között. A hasolóságot valószíűség-elmélet alapo mér. Tegyük fel, hogy smerjük f() típusát és skálaparaméterét. A helyparaméter meghatározása a cél. Pl. S= skálaparaméterű Cauchyeloszlásból származó 0 elemű mta helyparaméterét becsüljük. Vegyük ks -et és képezzük a mtaelemekre f( ) valószíűségeket. A teljes mtára így képzett valószíűségek szorzatáak mamumáál adódk az optmáls T érték. 4. Mamum lkelhood becslés, becslések határeloszlása ME 009

Sűrűségeloszlások paramétereek mamum lkelhood-becslése A mamum lkelhood elv szert mamum feltétel (ahol szorzótéyező elhagyható, mvel az függetle T -től): L Logartmálva a fet célfüggvéyt: f,t ma L * l f,t ma dl * dt 0 A célfüggvéy mamuma az smeretle paraméter szert dervált zérus értékéhez köthető. 4. Mamum lkelhood becslés, becslések határeloszlása ME 009

Gauss-eloszlás paramétereek mamum lkelhood-becslése A mamum lkelhood függvéy (hatváyozás azoossága): Logartmálva a fet célfüggvéyt: A helyparaméter és skálaparaméter becslése: T S e S e S,S,T f L T S G ma T S l S l l L L * 3 * T S 0 T S S ds dl 4. Mamum lkelhood becslés, becslések határeloszlása ME 009 * E T 0 T T T 0 T S dt dl

Becslések határeloszlása Becslések eloszlása övekvő mtaelemszám ( ) eseté egy eloszlástípust közelít, amt határeloszlásak evezük. Tetszőleges eloszlásból származó mta alapjá meghatározott számta átlagok (mtaátlagok) határeloszlása E () E() Az átlagok (mt becslések) eloszlása határesetbe N(,) Gausseloszlást közelít, ha véges a szórás. Ez a cetráls határeloszlástétel egy varása. Ha valamely becsléseloszlás Gauss típusú A / szórással, akkor A -t aszmptotkus szórásak evezzük. Nagy számok törvéye alapjá: az átlagképzés -el aráyos potosságövekedést mutat agy -ek eseté, ha véges a szórás. 4. Mamum lkelhood becslés, becslések határeloszlása ME 009

...... E... E... E E Becslések határeloszlása Bzoyítás és egy példa: 4. Mamum lkelhood becslés, becslések határeloszlása ME 009

5. Statsztka (paraméteres és emparaméteres) próbák Geostatsztka c. tárgy a BSc geográfus alapszak hallgatóak ME 009

Statsztka próbák az adatok smert eloszlástípusa eseté, hpotézs vzsgálatok Statsztka hpotézs: a megfgyelt meység eloszlásáak a típusára vagy az eloszlás paraméterere tett feltevés. Nullhpotézs (H 0 ): az előzetes feltevést gazak tételezzük fel. Ellehpotézs (H ): a ullhpotézssel szembeálló más lehetőség. Legye smert az meység eloszlása (Gauss) és szórása. A változóra vett mtába az átlag. Igaz-e hogy az egész sokaság várható értéke T 0? A mtaátlag em lesz potosa T 0. A mtaátlag mekkora eltérése eseté feltételezhetjük, hogy a várható érték T 0? H H 0 : E() T : E() A mtabel tapasztalat alátámasztja-e a következő ullhpotézst? Mvel cs a teljes sokaság a brtokukba, ezért kevés mérésre tudjuk csak a ullhpotézs feállását vzsgál. 5. Statsztka (paraméteres és emparaméteres) próbák ME 009 T 0 0

Egymtás u-próba Statsztka függvéy (statsztka): valamlye számítás utasítás, mely egyetle adatot számít db adat alapjá. A statsztka próba feladata megtalál a statsztka függvéyt (próbafüggvéyt), amelyek eloszlását H 0 feállása eseté smerjük. Legye a statsztka a következő, mely előállítja az u véletle változót: u / Az u változó s Gauss-eloszlású ( stadardzáltja). Eek smeretébe [-u, u ] megbízhatóság tervallum kostruálható, melybe u agy valószíűséggel esk: T0 T0 P u u P u / / ahol a krtkus tartomáyra esés valószíűsége, - a szgfkaca-szt. 5. Statsztka (paraméteres és emparaméteres) próbák ME 009 T 0

Egymtás u-próba Ha H 0 ullhpotézs gaz, akkor u agy valószíűséggel (-) esk a [u,u ] megbízhatóság tartomáyba és ks valószíűséggel a krtkus tartomáyba. Ha u a krtkus tartomáyba va, akkor H 0 ullhpotézst elvetjük, ha a megbízhatóság tartomáyo belül va, akkor elfogadjuk. 5. Statsztka (paraméteres és emparaméteres) próbák ME 009

Egyoldal statsztka próbák Az eddgekbe látott kétoldal próbáál a krtkus tartomáy két részből áll: F - (/) érték alatt és F - (- /) érték felett tartomáyból. Egyoldal próba eseté az ellehpotézs kétféle lehet (H 0 változatla): H H : : E() T E() T 0 0 jobboldal baloldal A krtkus tartomáy az eloszlásfüggvéy smeretébe F - (-)-ből számítható. 5. Statsztka (paraméteres és emparaméteres) próbák ME 009

Statsztka próbák hbafogalma Amkor u a krtkus tartomáyba esk és H 0 t elvetjük akkor valószíűséggel követük el hbát, ha H 0 mégs gaz. Ezt elsőfajú hbáak evezzük. Ha elfogadjuk H 0 -t egy adott valószíűség mellett, holott az em gaz. Ezt másodfajú hbáak () evezzük. A ullhpotézs elfogadása aál agyobb kockázattal jár, mél agyobb a szgfkaca-szt. Nem célszerű a bztoság sztet túl magasra állíta. 5. Statsztka (paraméteres és emparaméteres) próbák ME 009

Illeszkedés-vzsgálatok Típusmeghatározás: a mta megfelel-e egyetle eloszlástípusak valamlye szgfkaca-szte vagy sem. Grafkus ormaltásvzsgálat: a mta Gauss-eloszlásból származk-e. Gauss-papír készítése: abszcsszá a valószíűség változó értéke, ordátá a - verz eloszlásfüggvéy (stadard Gauss) szert átskálázott valószíűsége szerepelek (em egyeletes az osztás). Ordáta átskálázásával az m várható értékű szórású ormáls eloszlás képe egyees. -ből képezzük F -et, az ordáta-tegely eltolásával: m F() Pl. F(m)=(0); F(m+)=(). 5. Statsztka (paraméteres és emparaméteres) próbák ME 009

Geofzka adatredszerek lleszkedés-vzsgálatra F a (), a=5 5. Statsztka (paraméteres és emparaméteres) próbák ME 009

6. A kovaraca és a korrelácó fogalma. A leárs függés mérőszámáak meghatározása. Geostatsztka c. tárgy a BSc geográfus alapszak hallgatóak ME 009

Kétdmezós (,y) valószíűség változót dszkrét valószíűség vektorváltozóak evezzük, mely együttes valószíűsége: p Többdmezós eloszlások k P(, y y k ), (,k,,3,...), p Ha az egyk változót rögzítjük peremeloszlásról beszélük: P( ) pk, P(y yk ) k Az együttes eloszlásfüggvéy és a peremeloszlás függvéyek: F( F( 0 0, y F(, y ) P(, ) P( 0 0 0 0, y y ), y ) ) P(, y y 0 0 ) k 0 y y 0 p y y 0 k 0 k p P(y y k k k P( ) ) k 6. A kovaraca és a korrelácó fogalma. A leárs függés mérőszámáak meghatározása ME 009

6. A kovaraca és a korrelácó fogalma. A leárs függés mérőszámáak meghatározása ME 009 Peremsűrűség-függvéyek a szórások (, ) és várható értékek (m,m ) smeretébe: Normáls eloszlás együttes sűrűségfüggvéye, ahol r a valószíűség változók között kapcsolat erősségét kfejező együttható: Az f(,y) együttes sűrűségfüggvéy felülete alatt térfogat =. Kétdmezós Gauss-eloszlású valószíűség változó m y m y m r m r G e r y) (, f -m -m e f(y) e f()

Korrelálatla változók eloszlása Az f(,,., ) együttes (-dmezós) valószíűség-sűrűség függvéy megadja, hogy az első mérés mlye valószíűséggel esk, a másodk,. stb. köryezetébe. Az együttes sűrűségfüggvéyre korrelálatla adatok eseté: f (,,, ) f ()f () f ( ) Látható, hogy külööse agy értékek eseté ugyaaz a valószíűsége, hogy értéke kcs vagy agy. Ilyekor az adatok korrelálatlaok. 6. A kovaraca és a korrelácó fogalma. A leárs függés mérőszámáak meghatározása ME 009

Korrelált változók eloszlása Korrelált adatok eseté az együttes sűrűségfüggvéyél bzoyos agyságú értékek eseté csak bzoyos értékek szerepelek azoos valószíűséggel. Együttváltozás (tedeca) fgyelhető meg. Az ábrá agy értékekhez agy értékek tartozak ( : a korrelácó mértékével aráyos). 6. A kovaraca és a korrelácó fogalma. A leárs függés mérőszámáak meghatározása ME 009

Az együttváltozás mérőszáma Osszuk fel az (, ) síkot égy síkegyedre (váltakozó előjellel). Képezzük az ( - )( - ) függvéyt. Szorozzuk össze a fet függvéyt a sűrűségfüggvéyel és összegezzük előjelese a területeket. Az így kapott kovaraca a két valószíűség változó együttváltozásáak a mérőszáma. Korrelálatla eloszlásál cov(, )=0, md a égy síkegyedre azoos értékek esek. Korrelált eloszlás eseté vagy poztív (azoos előjelű v. ráyú) vagy egatív (elletétes ráyú) a változás. 6. A kovaraca és a korrelácó fogalma. A leárs függés mérőszámáak meghatározása ME 009

Az együttváltozás mérőszáma Az összegzés felírható tegrál alakba ( f felület alatt térfogatokat adjuk össze), ezzel a kovaraca defícója: cov( A kovaraca valószíűség-elmélet formulája: cov(, y) E Emprkus (tapasztalat) formula:, ) f (, )dd cov(, y) E() Ey E(y) y y k Látható, hogy =y eseté a kovaraca megegyezk a tapasztalat szóráségyzettel: cov(, ) k 6. A kovaraca és a korrelácó fogalma. A leárs függés mérőszámáak meghatározása ME 009

A leárs függés mérőszáma Korrelácós együttható: két változó között leárs kapcsolat szorosságát mérő szám (ormált kovaraca) R(, y) Az R - és között szám. Ha R = teljes korrelácó, R=0 leárs függetleség. Korrelácó erőssége: cov(, y) () (y) y y y y 0 < R 0.3: gyege korrelácó, 0.3 < R 0.6: közepes korrelácó, 0.6 < R : erős korrelácó. A korrelácós együttható előjele s az együttváltozás ráyára utal. k k k 6. A kovaraca és a korrelácó fogalma. A leárs függés mérőszámáak meghatározása ME 009

Példa korrelácó számításra Fúrólyukba mért fajlagos vezetőképesség kapcsolata a réz és vas kocetrácóval (Fország adatredszer, 008.) 6. A kovaraca és a korrelácó fogalma. A leárs függés mérőszámáak meghatározása ME 009

A leárs függés mérőszáma A korrelácós együttható megadja a leárs kapcsolat ráyát, aráyos a zaj mértékével, de em adja meg ömagába az egyees meredekségét. Négy külöböző kapcsolat eseté a leárs kapcsolat erőssége azoos. Az y változók átlagértéke=7.5, szórása=4., korrelácós együttható=0.86. Az llesztett egyees: y = 3 + 0.5. Forrás: Fracs Ascombe (Wkpéda) 6. A kovaraca és a korrelácó fogalma. A leárs függés mérőszámáak meghatározása ME 009

Többváltozós összefüggések korrelácós jellemzése Legye adott (, =,,,) valószíűség vektorváltozó. Változók eloszlása smeretébe (várható érték, szórás) a kovaraca mátr a párokét együttváltozásokat adja meg. Szmmetrkus mátr, mvel cov(, j )=cov( j, ): A korrelácós mátr a párokét kapcsolat erősségét adja meg. Szmmetrkus mátr, mvel R(, j )=R( j, ): σ ), cov( σ ), cov( ), cov( ), cov( σ C ), R( ), R( ), R( ), R( R N N 6. A kovaraca és a korrelácó fogalma. A leárs függés mérőszámáak meghatározása ME 009

7. Következtetés be em mért térrészek jellemzőre krgeléssel Geostatsztka c. tárgy a BSc geográfus alapszak hallgatóak ME 009

Problémafelvetés Legye z (=,,,7) mérés potokba smert egy vzsgált meység. Kérdés ugyaeze meység értéke a z 0 potba. Iterpolácós eljárással meghatározható a kérdéses érték: z 0 w z, ahol w d d homok homok agyag homok A 4 és 6-os potokak agyobb súlyt kellee ad, mt pl. az és - es potak, mvel azok azoos geológa egységbe tartozak. Hogya haszálhaták fel a geológa formácót az terpolácó sorá? Ábra Zhag 009 yomá 7. Következtetés be em mért térrészek jellemzőre krgeléssel ME 009

Térbel korrelácó vzsgálata Bohlg 005 yomá 7. Következtetés be em mért térrészek jellemzőre krgeléssel ME 009

A félvarogram Az adatok eloszlását Gauss-típusúak feltételezzük, azok gadozását szórással jellemezzük. A kérdéses meység potbel értékét a köryező (smert) adatok súlyozott átlagakét számítjuk. Olya súlyokat kell választuk, mellyel az eredméy szórása mmáls lesz. Félvarogram: a (h) görbe, mely a távolság függvéyébe megadja a vzsgált meység értékkülöbség égyzetösszegéek a felét h h h Zr h Z r ahol h: két vzsgált pot távolsága (térbe h vektor abszolút értéke), (h): egymástól h távolságba lévő összes potpár száma, Z(r ): a vzsgált meység értéke egy adott potba, Z(r +h): a vzsgált meység értéke a pottól h távolságra. r : -edk pot helyzete (térbe helyvektora). 7. Következtetés be em mért térrészek jellemzőre krgeléssel ME 009

A félvarogram A Z(r )-Z(r +h) külöbség (-) - szeresére vált, amkor a két pot helyet cserél. A külöbségek átlagértéke így zérus lesz. Az egyes külöbségek így az átlagértéktől való eltéréskét foghatók fel. A varogram így az emprkus szóráségyzet fele: Mél közelebb vaak a potok egymáshoz a Z értékek aál jobba korrelálak. A h -tól függő kovaraca COV Zr,Z r h H h ahol H: hatástávolság. A korrelácó két pot között csak e távolságg áll fe. Eze távolságo belül kell a h VARZ r Zr h potot választa az terpolácóhoz. VAR Zr COVZ r,z r H 7. Következtetés be em mért térrészek jellemzőre krgeléssel ME 009

Varogram modellek A mérés eredméyekből számított félvarogram potok bzoyos gadozással adják meg az emprkus varacát a h függvéyébe. Sma (statsztkus gadozást em mutató) elmélet függvéyek lleszthetők a tapasztalat félvarogramra. Gyakora alkalmazott modellek: - Szférkus modell: h C.5 C, h H 0.5 - Epoecáls modell: h C e A h - Gauss modell: h H 3, h h H 0 h H C e h A 7. Következtetés be em mért térrészek jellemzőre krgeléssel ME 009

Varogram modellek A görbék mdhárom esetbe C -hez tartaak: A hatástávolságot kegyelítéssel számítjuk (A: kostas). Epoecáls és Gauss modell eseté gyakorlat hatástávolságot határozuk meg: A kregelés szempotjából fotos kovaracát a félvarogramból számíthatjuk: COV H 0.95C C Zr,Z r h C h H VAR Z r 7. Következtetés be em mért térrészek jellemzőre krgeléssel ME 009

A kregelés Robusztus (em érzékey a varogram modellre ll. tektetbe vesz aak ráyfüggését azaz azotrópáját) súlyozott becslés eljárás be em mért potok jellemzőek a meghatározására. A P 0 potba smeretle Z(P 0 ) értéket db közel P pot Z(P ) értékéek súlyozott átlagakét közelítjük: w Z Z P 0 P A súlyok összege, így a becslés torzítatla. (Ha pl. mde köryező érték ugyaaz lee, csak ebbe az esetbe kapák a kérdéses potba s ugyaazt az értéket). A w súlyok meghatározását a becslés varacájáak (valód és a becsült érték eltéréséek a szóráségyzete) a mmumához kötjük: VAR Z P 0 w ZP m 7. Következtetés be em mért térrészek jellemzőre krgeléssel ME 009

A kregelés A mmalzálás a KW=C 0 leárs egyeletredszerre vezet, ahol K az ú. Krege-mátr: c c c c 3 A mátr elemeket a félvarogramból számítjuk k: c c c j 0 c c c c 3 c c c c 3 3 33 3 COV Z P VAR Z P COV Z P, Z P C h, C,, ZP C h. A súlyokat a W=K - C 0 egyeletredszerből határozzuk meg. A becslés varacáját a =W T C 0 skalár adja meg. 0 7. Következtetés be em mért térrészek jellemzőre krgeléssel ME 009 c c c c 3 j w w w w 0 3 c c c c P P j P P 0 0 0 03 0

Nyékládháza 004-es földmágeses mérés Mágeses térerősség méréssel a felszí alatt mágesezhető kőzeteket, felszíközel tárgyakat lokalzáljuk. 7. Következtetés be em mért térrészek jellemzőre krgeléssel ME 009

Nyékládháza 004-es földmágeses mérés Köryezetgeofzka mérés célja az volt, hogy felderítsük és lehatároljuk a szeméttelep határát és a fémes hulladékok helyét kmutassuk a mágeses térkép segítségével. m Kregeléssel szerkesztett mágeses zovoalas térkép m 7. Következtetés be em mért térrészek jellemzőre krgeléssel ME 009

Nyékládháza 004-es földmágeses mérés A félvarogram Az adatok statsztkája C Kregelés pothálózat, terpolácó eredméye 7. Következtetés be em mért térrészek jellemzőre krgeléssel ME 009

8. Kegyelítések, leárs és emleárs regresszó Geostatsztka c. tárgy a BSc geográfus alapszak hallgatóak ME 009

A leárs regresszó Regresszó számítással matematka kapcsolatot keresük egy tapasztalat úto megfgyelt függvéy változó között. Egyváltozós függvéykapcsolat eseté keressük az y=f(,p) regresszós függvéyt és a p paraméter(eke)t. Legegyszerűbb egyváltozós feladat a leárs regresszó. Ekkor keressük az (, y ) =,,, mérés potpárokra legjobba lleszkedő egyeest és aak egyeletét y m a ahol m : a regresszós egyees meredeksége ( egységy megváltozása mekkora változást déz elő y -ba) és a az ordáta-metszete. A fet egyelet (modell) segítségével számított adatsort állíthatuk elő, melyek eltérése a mért adatsortól az m és a paraméterek megválasztásától függ. 8. Kegyelítések, leárs és emleárs regresszó ME 009

A leárs regresszó A mérés és a számított adatok eltéréséek a mmalzálásával tudjuk meghatároz a mérés potokra legjobba lleszkedő regresszós egyees paraméteret: p=[m,a]. 8. Kegyelítések, leárs és emleárs regresszó ME 009

A leárs regresszó A mért és számított adatsor =,,, számú adat eseté: (mért) (mért) (mért) (mért) (szám.) (szám.) (szám.) y y, y,, y, y y, y,, y (szám.) y (szám.) m Az m és a paraméterek optmáls értékét a Gauss-féle legksebb égyzetek módszerével határozzuk meg. Az lleszkedés a mért és számított adatok között a lehető legjobb legye, azaz az eltérés legye mmáls: E A fet célfüggvéy mmumáak feltétele, melyek egydejűleg kell teljesüle: E E 0, 0, m a a (mért) (szám.) y y y m a 8. Kegyelítések, leárs és emleárs regresszó ME 009 m

A leárs regresszó A mmalzálás eredméye a két optmáls regresszós koeffces: m R y y, a y m ahol R y az és y változó korrelácós együtthatója, és y az és y adatsor szórása. A fet legksebb égyzetes kegyelítések jeletős hátráya az, hogy ge érzékeye reagál a kugró adatokra és az adatok eloszlás típusáak változására. Ekkor érdemes L -ormá alapuló vagy MFV (leggyakorbb érték) azaz P-orma szert kegyelítést végez, melyek rezsztes és robusztus becslés eéjárások. Pl. L -orma szert kegyelítés célfüggvéye R db A(p)=0 mellékfeltétel előírása mellett (ahol p : smeretleek, : Lagrage multplkátorok): R (mért) E y f,p Ap m r r 8. Kegyelítések, leárs és emleárs regresszó ME 009

Nemleárs regresszó Nemleárs regresszószámítást akkor alkalmazuk, ha a modell em leárs. Gyakra alkalmazzuk a polomok (pl. hatváyfüggvéyek) szert kegyelítést. Ekkor a célfüggvéy: N y (mért) f (,p) f (,p f (,p) 0,p,...,p Learzál s lehet az f függvéykapcsolatot. Az eredet változók helyett, velük összefüggő, de egymással leárs kapcsolatba lévő változókat vezetük be: y ae Y l y,x a e A b,b B Többváltozós regresszó (modell alapú adatfeldolgozás) ld. jövő félév! J ) p m 0 l y l a b J j p Y A BX 8. Kegyelítések, leárs és emleárs regresszó ME 009 j j

9. Bevezetés a MATLAB programyelvbe. A Statstcs Toolbo éháy eleme Geostatsztka c. tárgy a BSc geográfus alapszak hallgatóak ME 009

Sztetkus példa eloszlásokra MATLAB összefoglalás. Ld. a Geoformatka szoftverfejlesztés c. oktatás segédletet az ajálott rodalom részbe. Írjuk MATLAB scrptet az alább feladatra: Geeráljuk 00 elemű mtát [-,] tervallumból egyeletes ll. E=0 várható értékű és =/3 szórású ormáls eloszlásból. Ábrázoljuk grafkusa a két eloszlást, végezzük ormaltás vzsgálatot. Hasolítsuk össze az emprkus jellemzőket. 00 elemű mta geerálása egyeletes és Gauss eloszlásból: ufrd(,,00,); y ormrd(0,/ sqrt(3),00,); Normál eloszlás sűrűségfüggvéye és ábrázolása: t ormpdf([ : 0.:],0,/ sqrt(3)); subplot(,,); plot([ : 0.:], t); 9. Bevezetés a MATLAB programyelvbe. A Statstcs Toolbo éháy eleme ME 009

Sztetkus példa eloszlásokra Az egyeletes eloszlás sűrűségfüggvéye és ábrázolása: k ufpdf([ : 0.:],,); subplot(,,); plot([ : 0.:],k); Grafkus ormaltás vzsgálat (emprkus eloszlásfüggvéyt ábrázolja úgy, hogy az ordátát a stadard ormáls verz eloszlásfüggvéy szert skálázza). Ha az adatok lleszkedek az egyeesre Gauss eloszlásról va szó. subplot(,,3); ormplot(); subplot(,,4); ormplot(y); 9. Bevezetés a MATLAB programyelvbe. A StatstcsToolbo éháy eleme ME 009

Sztetkus példa eloszlásokra A két eloszlás elmélet várható értéke és szórása megegyezek. A korrelácó kcs, az eloszlások alakja matt eltérő terjedelem és lapultság adódk. Redezzük [,y] mátrba (00) az adatokat. A számta közép, medá, emprkus szóráségyzet és szórás: szkozep mea(z); med meda (z); empva var(z); szor std(z); A terjedelem, lapultság, kovaraca és korrelácós koeffcesek: terj rage(z); lap kurtoss(z) 3; kov cov(z); korr corrcoef (z); 9. Bevezetés a MATLAB programyelvbe. A Statstcs Toolbo éháy eleme ME 009

Sztetkus példa futás eredméye szkozep = -0.068 0.0008 med = 0.0353 0.037 empvar = 0.3650 0.94 szor = 0.604 0.543 terj =.9979 3.038 lapul = -.3064 0.07 kov = 0.3650-0.0083-0.0083 0.94 corr =.0000-0.054-0.054.0000 9. Bevezetés a MATLAB programyelvbe. A Statstcs Toolbo éháy eleme ME 009

Mály 00-es radoaktív mérés Egy mérés poto mértük azoos körülméyek között, azoos műszerrel, az dőegység alatt beérkező fotook számát 8 alkalommal (football salakpálya). 965 906 309 983 985 939 3046 309 986 308 3069 306 97 beutes 959 304 890 3007 968 95 3035 777 843 749 9. Bevezetés a MATLAB programyelvbe. A Statstcs Toolbo éháy eleme ME 009

Mály 00-es radoaktív mérés Végezzük grafkus lleszkedés-vzsgálatot ormáls eloszlásra: 9. Bevezetés a MATLAB programyelvbe. A Statstcs Toolbo éháy eleme ME 009

Mály 00-es radoaktív mérés Normáls eloszlást feltételezve határozzuk meg a sűrűségfüggvéy skála- és helyparaméterét a mamum lkelhood módszerrel. Ábrázoljuk az emprkus/folytoos sűrűség- és eloszlásfüggvéyt. lapultsag = -0.694 ferdeseg = f ( ) e 84 ( 944) 4-0.36 m = 944. szgma = 84.0745 kof_m (95%) =.99.4.958.8 kof_szgma (95%) = 74.884 95.8567 9. Bevezetés a MATLAB programyelvbe. A Statstcs Toolbo éháy eleme ME 009

Mály 00-es radoaktív mérés clc; fgure(); stem([:legth(beutes)]',beutes(:,)); label('mérés sorszáma'); ylabel('gamma beütés/perc'); fgure(); ormplot(beutes); fgure(3); subplot(,,); [,a]=hst(beutes,(600:30:300)); bar(a,/8); label('\gamma'); ylabel('f(\gamma)'); grd o; hold o; [m,szgma,kof_m,kof_szgma]=ormft(beutes); lapultsag=kurtoss(beutes)-3, ferdeseg=skewess(beutes), m, szgma, kof_m, kof_szgma, prob=ormpdf((600:30:300),m,szgma); plot((600:30:300),30*prob,'r'); subplot(,,); s=cumsum(); bar(a,s/8); label('\gamma'); ylabel('f(\gamma)'); grd o; hold o; eloszfgv=ormcdf((600:30:300),m,szgma); plot((600:30:300),eloszfgv,'r'); MATLAB program (scrpt): beutes: adatokat tartalmazó 8 elemű oszlopvektor. m: ormáls eloszlás helyparamétere. szgma: ormáls eloszlás szórása. kof_m: a helyparaméter kofdeca tervalluma 95%-os kofdeca szte. kof_szgma: a szórás kofdeca tervalluma 95%-os kofdeca szte. cumsum: kummulatív gyakorság. 9. Bevezetés a MATLAB programyelvbe. A Statstcs Toolbo éháy eleme ME 009

Sztetkus példa korrelácó számításra =[ 3 4 5], y=[- 3 5 6 9.4], N=legth(); atls=0; for =:N atls=atls+(); ed atl=atls/n; yatls=0; for =:N yatls=yatls+y(); ed yatl=yatls/n; s=0; for k=:n s=s+(((k)-atl)^); ed kov=s/(n-); szor=sqrt(kov); s=0; for k=:n s=s+(((k)-atl)*(y(k)-yatl)); ed kov=s/(n-); kov=s/(n-); s3=0; for k=:n s3=s3+((y(k)-yatl)^); ed kov=s3/(n-); szory=sqrt(kov); kovaraca=[kov kov;kov kov], korr=kov/(szor*szor); korr=kov/(szor*szory); korr=korr; korr=kov/(szory*szory); korrelaco=[korr korr;korr korr], Számítsuk k két adatsorra (,y ) a kovaraca és korrelácós mátrot, alkalmazzuk a korrgált tapasztalat szórásokat. = y = 3 4 5 -.0000 3.0000 5.0000 6.0000 9.4000 kovaraca = szoras_=.5000 5.9500.58 5.9500 4.750 korrelaco = szoras_y=.0000 0.9798 3.8408 0.9798.0000 9. Bevezetés a MATLAB programyelvbe. A Statstcs Toolbo éháy eleme ME 009

Nyékládháza 004-es földmágeses mérés Számítsuk k a kovaraca és a korrelácós mátrot az y=5m és y=8m adatsorra voatkozóa (5 adat/voal). m kovaraca = szoras_= 3099 635 5.98 635 304 korrelaco = szoras_y=.0000 0.780 4.9 0.780.0000 9. Bevezetés a MATLAB programyelvbe. A Statstcs Toolbo éháy eleme ME 009

Sztetkus példa leárs regresszóra Számítsuk k a leárs regresszós paramétereket a polyft függvéy valamt a korrelácós együttható és a szórások segítségével s. clc; clear all; =[0:0]; y_mert=[- 0.56.3 3.4 4 5.6 7.8 7.9 8.3 9 9.8]; eh=polyft(,y_mert,); y_szam=polyval(eh,); plot(,y_mert,'*'); hold o; plot(,y_szam); label(''); ylabel('y'); ttle('leárs regresszó'); m=eh(), a=eh(), R=corrcoef(,y_mert), Szgma=std(), Szgmay=std(y_mert), m_r=r(,)*std(y_mert)/std(), a_atl=mea(y_mert)-m*mea(), R = Szgma = Szgmay =.0000 0.98 3.366 3.737 0.98.0000 m = a = m_r = a_atl =.05-0.3745.05-0.3745 9. Bevezetés a MATLAB programyelvbe. A Statstcs Toolbo éháy eleme ME 009

Nyékládháza 006-os földmágeses mérés Számítsuk k a regresszós paramétereket a polyft függvéy segítségével. Az smételt mágeses térerősség méréseket egy poto (bázso) 8-h között végeztük a ap korrekcó végrehajtása céljából. 9. Bevezetés a MATLAB programyelvbe. A Statstcs Toolbo éháy eleme ME 009

Ajálott rodalom Steer Ferec, 990: A geostatsztka alapja. Taköyvkadó, Budapest. Ferec Steer: Optmum methods statstcs. Akadéma Kadó, Budapest, 997. Szabó Norbert Péter: Geoformatka szoftverfejlesztés. Oktatás segédlet, 006. Stoya Gsbert: Matlab, frssített kadás. Typote, 005. Matlab cetral webpage: www.mathworks.com. Geostatsztka c. tárgy a BSc geográfus alapszak hallgatóak ME 009

Köszööm a fgyelmet! Geostatsztka c. tárgy a BSc geográfus alapszak hallgatóak ME 009