Keresztkorreláció vizsgálata statisztikai teszttel



Hasonló dokumentumok
Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

4 2 lapultsági együttható =

Regresszió. Fő cél: jóslás Történhet:

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

Békefi Zoltán. Közlekedési létesítmények élettartamra vonatkozó hatékonyság vizsgálati módszereinek fejlesztése. PhD Disszertáció

Lineáris regresszió. Statisztika I., 4. alkalom

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

A sokaság/minta eloszlásának jellemzése

A multikritériumos elemzés célja, alkalmazási területe, adat-transzformációs eljárások, az osztályozási eljárások lényege

Dr. Ratkó István. Matematikai módszerek orvosi alkalmazásai Magyar Tudomány Napja. Gábor Dénes Főiskola

METROLÓGIA ÉS HIBASZÁMíTÁS

KOMBINATORIKA ELŐADÁS osztatlan matematika tanár hallgatók számára. Szita formula

Az entrópia statisztikus értelmezése

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Korreláció-számítás. 1. előadás. Döntéselőkészítés módszertana. Dr.

d(f(x), f(y)) q d(x, y), ahol 0 q < 1.

Statisztika I. 3. előadás. Előadó: Dr. Ertsey Imre

Fuzzy rendszerek. A fuzzy halmaz és a fuzzy logika

NKFP6-BKOMSZ05. Célzott mérőhálózat létrehozása a globális klímaváltozás magyarországi hatásainak nagypontosságú nyomon követésére. II.

Szárítás során kialakuló hővezetés számítása Excel VBA makróval

TATABÁNYA LÉGSZENNYEZETTSÉGE, IDŐJÁRÁSI JELLEMZŐI ÉS A TATABÁNYAI KLÍMAPROGRAM

Az elektromos kölcsönhatás

Intelligens elosztott rendszerek

A LÉGKÖR SZERKEZETE ÉS ÖSSZETÉTELE. Környezetmérnök BSc

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok október hó: (adott a vastagon szedett!) S i g i z i g i z i

Hely és elmozdulás - meghatározás távolságméréssel

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Regresszió-számítás. 2. előadás. Kvantitatív statisztikai módszerek. Dr.

Balogh Edina Árapasztó tározók működésének kockázatalapú elemzése PhD értekezés Témavezető: Dr. Koncsos László egyetemi tanár

Philosophiae Doctores. A sorozatban megjelent kötetek listája a kötet végén található

Adatelemzés és adatbányászat MSc

,...,q 3N és 3N impulzuskoordinátával: p 1,

Műszaki folyamatok közgazdasági elemzése. Kevert stratégiák és evolúciós játékok

Kidolgozott feladatok a nemparaméteres statisztika témaköréből

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Kísérlettervezési alapfogalmak:

Méréselmélet: 5. előadás,

Segítség az outputok értelmezéséhez

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Egy negyedrendű rekurzív sorozatcsaládról

Légszennyezés. Molnár Kata Környezettan BSc

Véletlenszám generátorok. 6. előadás

TÉRBELI STATISZTIKAI VIZSGÁLATOK, ÁTLAGOS JELLEMZŐK ÉS TENDENCIÁK MAGYARORSZÁGON. Bihari Zita, OMSZ Éghajlati Elemző Osztály OMSZ

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének

y ij = µ + α i + e ij

Függvények Megoldások

Biostatisztika e-book Dr. Dinya Elek

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉP SZINT Függvények

I. A közlekedési hálózatok jellemzői II. A közlekedési szükségletek jellemzői III. Analitikus forgalom-előrebecslési modell

Minősítéses mérőrendszerek képességvizsgálata

A hő terjedése szilárd test belsejében szakaszos tüzelés esetén

A levegő Szerkesztette: Vizkievicz András

A bankközi jutalék (MIF) elő- és utóélete a bankkártyapiacon. A bankközi jutalék létező és nem létező versenyhatásai a Visa és a Mastercard ügyek

MATEMATIKAI STATISZTIKA KISFELADAT. Feladatlap

Táblázatok 4/5. C: t-próbát alkalmazunk és mivel a t-statisztika értéke 3, ezért mind a 10%-os, mind. elutasítjuk a nullhipotézist.

A II. kategória Fizika OKTV mérési feladatainak megoldása

Forgalmas nagyvárosokban az erősen szennyezett levegő és a kedvezőtlen meteorológiai körülmények találkozása szmog (füstköd) kialakulásához vezethet.

Matematikai geodéziai számítások 6.

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Foglalkoztatáspolitika. Modellek, mérés.

Bevezetés a kémiai termodinamikába

[Biomatematika 2] Orvosi biometria

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉPSZINT Függvények

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

8. Programozási tételek felsoroló típusokra

Matematikai geodéziai számítások 6.

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Felmérő lap I. LIFE 00ENV/H/ Kelet Magyarországi Biomonitoring projekt Kelet- magyarországi Biomonitoring Hálózat

10. Alakzatok és minták detektálása

A LEVEGŐMINŐSÉG ELŐREJELZÉS MODELLEZÉSÉNEK HÁTTERE ÉS GYAKORLATA AZ ORSZÁGOS METEOROLÓGIAI SZOLGÁLATNÁL

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

A napsugárzás mérések szerepe a napenergia előrejelzésében

(eseményalgebra) (halmazalgebra) (kijelentéskalkulus)

Matematikai geodéziai számítások 10.

Komplex regionális elemzés és fejlesztés tanév DE Népegészségügyi Iskola Egészségpolitika tervezés és finanszírozás MSc

IDA ELŐADÁS I. Bolgár Bence október 17.

ÁLTALÁNOS STATISZTIKA

Jövedelem és szubjektív jóllét: az elemzési módszer megválasztásának hatása a levonható következtetésekre

Adatsorok jellegadó értékei

A DÖNTÉSELMÉLET ALAPJAI

Elosztott rendszerek játékelméleti elemzése: tervezés és öszönzés. Toka László

Varianciaanalízis 4/24/12

A Ga-Bi OLVADÉK TERMODINAMIKAI OPTIMALIZÁLÁSA

A gabonavertikum komplex beruházás-elemzés módszertani fejlesztése OTKA: Részletes zárójelentés Témavezető: Dr. Ertsey Imre

The original laser distance meter. The original laser distance meter

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉPSZINT Függvények

Extrém-érték elemzés. Extrém-érték eloszlások. A normálhatóság feltétele. Megjegyzések. Extrém-érték modellezés

Elektrokémia 03. Cellareakció potenciálja, elektródreakció potenciálja, Nernst-egyenlet. Láng Győző

Adatok statisztikai értékelésének főbb lehetőségei

A mágneses tér energiája, állandó mágnesek, erőhatások, veszteségek

Levegőminőségi helyzetkép Magyarországon

Mérési adatok illesztése, korreláció, regresszió

Ötvözetek mágneses tulajdonságú fázisainak vizsgálata a hiperbolikus modell alkalmazásával

Optikai elmozdulás érzékelő illesztése STMF4 mikrovezérlőhöz és robot helyzetérzékelése. Szakdolgozat

Összegzés a 92/2011.(XII.30.) NFM rendelet 9. melléklete alapján

Az egyenes egyenlete: 2 pont. Az összevont alak: 1 pont. Melyik ábrán látható e függvény grafikonjának egy részlete?

Átírás:

SZAKDOLGOZAT Keresztkorrelácó vzsgálata statsztka teszttel Készítette: Balogh Bertalan kéma BSc szakos hallgató Témavezető: Tóth Gergely egyetem docens Eötvös Loránd Tudományegyetem, Természettudomány Kar, Kéma Intézet, Fzka Kéma Tanszék Budapest, 011. 0/51

Tartalomjegyzék Köszönetnylvánítás...................................................... 1. Bevezetés......................................................... Korrelácós és regresszós számítások elv alapja..........................1. Alapfogalmak.................................................... Korrelácó vzsgálata két változó esetén..............................3. Lneárs korrelácó...............................................4. Szgnfkancavzsgálat...........................................5. Idősorok elemzése...............................................5.1. Alapfogalmak..............................................5. Autokorrelácó és keresztkorrelácó dősoroknál...................5.3. Korrelácós tesztek..........................................5.3.1. Neumann-teszt......................................5.3.. Durbn-Watson-teszt..................................5.3.3. Egyfaktorú ANOVA-teszt smételt mntavétellel........ 3. A légszennyezésekről............................................... 3.1 Globáls hatások................................................ 3.1.1. Üvegházhatás............................................. 3.1.. Ózonpajzs gyengülése...................................... 3.1.3. Savas esők............................................... 3.. Hely hatások.................................................. 4. Légszennyezés adatok és összefüggések vzsgálata a keresztkorrelácós teszttel.. 4.1. Célktűzés..................................................... 4.. A keresztkorrelácós teszt elmélete és számítógépes programja............ 4..1. Az autokorrelácós teszt átdolgozása keresztkorrelácóra... 4... A keresztkorrelácós teszt programja.. 4.3. A keresztkorrelácós teszt alkalmazása.............................. 4.3.1. Munkanap-hatás........................................... 4.3.. Az dőjárás különböző összetevőnek kapcsolata egymással......... 4.3.3. Korrelácó vzsgálata az dőjárás és a légszennyeződés adatok között............................................. 4.3.4. Korrelácó vzsgálata egyes légszennyezők között................ 4.4. Eredmények áttekntése.......................................... 5. Összefoglalás..................................................... Summary............................................................... Irodalomjegyzék......................................................... 3 5 5 6 7 9 9 9 10 1 13 14 14 19 19 19 0 1 1 4 4 4 4 5 6 8 8 36 43 44 47 48 49 1/51

Köszönetnylvánítás Szeretnék köszönetet mondan azoknak, akk segítséget nyújtottak, hogy dolgozatomat elkészítsem. Köszönettel tartozom Tóth Gergelynek, ak a vzsgálatokhoz szükséges statsztka tesztet alkalmazó programot, mely munkám kndulópontjaként szolgált, rendelkezésemre bocsátotta, és a megfelelő szakrodalmakhoz hozzáférést bztosított, valamnt folyamatos konzultácókkal segítette a dolgozat elkészülését. Továbbá köszönöm Dr. Salma Imrének, hogy a vzsgálandó dőjárás és légszennyezés adatokat összegyűjtötte és rendelkezésemre bocsátotta, valamnt, hogy az eredmények kértékeléséhez s segítségét nyújtott. /51

1. Bevezetés A természet folyamatokra jellemző adatokat rögzítő dősorok többnyre előre kszámíthatatlan, véletlenszerű változásokra jellemző lefutást mutatnak, azonban hosszabb dőszakban vzsgálva az egyes felvett adatsorok bzonyos trendek meglétére utalhatnak. Ezeknek a trendeknek a kmutatására alkalmasak az autokorrelácós vzsgálatok, míg az egyes adatsorok egymás közt összefüggéset (vagy az összefüggés hányát) a keresztkorrelácós vzsgálatok mutatják k. Ilyen vzsgálatokra több módszert fejlesztettek k. Legszélesebb körben különféle korrelácós vzsgálatok, autoregresszós modellezések terjedtek el. Napjankban már smert az dőkésleltetés bevezetésével bővített megsmételt mntavételes ANOVA teszt [1], amelyet a Szerzők mnt érzékeny és nagy jóslóerejű eljárást smertetnek. Munkám célja az volt, hogy ennek az új tesztnek a keresztkorrelácóra alkalmazott változatát létrehozzam, és annak alkalmazását megvzsgáljam légszennyezés adatsorok egymásra hatásának elemzése terén, és következtetéseket vonjak le arra nézve, hogy mennyre meggyőző ennek az új tesztnek az alkalmazhatósága. Alapgondolatom az volt, ha a teszt által kmutatott vagy kzárt korrelácókra a természet folyamatok smeretében kvétel nélkül vagy túlnyomó többségben meggyőző magyarázat található, akkor a teszt alkalmas lyen feladatokra. A természetben lejátszódó folyamatok bonyolult, esetenként ma sem teljesen smert összefüggések szernt hatnak egymásra. Nncs ez másképpen a különböző szennyező anyagok mért koncentrácónak elemzése esetén sem. A légszennyezés adatok és az dőjárás körülmények naponta rögzített értéke dősorokat képeznek, amelyek első ránézésre egyenként s szeszélyesen változó, nehezen értelmezhető képet mutatnak; egymás között összefüggéseknek vzsgálata pedg nagyon összetett feladat, éppen ezért kválóan alkalmas az új teszt alkalmazásának kpróbálására. Munkám során először áttekntettem a korrelácós vzsgálatok elmélet alapjat, különös tekntettel az újonnan kfejlesztendő teszt alapjául szolgáló módszerekre, majd pedg az eredet, autokorrelácós teszt számítógépes programjának átdolgozását (keresztkorrelácóra) mutattam be. Ezek után a város környezetre jellemző levegőszennyeződés adatok vzsgálatát végeztem. A vzsgálat kterjed az adatok dőben változására, valamnt arra, 3/51

hogy ezek az adatok hogyan hatnak egymásra, a változásokat hogyan befolyásolják bzonyos általunk s kontrollálható vagy tőlünk független körülmények. Ezeknek a szennyeződéseknek a szntje adott helyen tendencákat mutatva változhat, szezonáls és bzonyos esetekben az ember tevékenység alapján s magyarázható perodctással jellemezhető. A lokáls szennyezettség adatokat erősen befolyásolják az dőjárás körülmények s. A légszennyezés adatok fgyelemmel kísérése, az dőjárás és más környezet adatok egydejű megfgyelése alapot nyújt az egyes légszennyezők és a külső körülmények egymásra hatásának elemzésére, és a statsztka feldolgozás lehetőséget teremt előrejelzésekre s. Az elemző munka alap az önkormányzatok számára fontos döntések meghozatalára, lyenek például: partelepítés és városrendezés tervek, forgalomszervezés, közösség közlekedés átszervezése vagy rekonstrukcója, munkálatok ütemezése, egészségügy radókészültség előkészítése. Mndezekhez szükség van olyan matematka apparátus felhasználására, amely az egymástól függetlenül fellépő tényezők hatásanak összefüggéset és az összefüggések dőbel lefutását képes megbízhatóan feltárn. Munkám során az új teszt erre a célra történő alkalmazhatóságát s megvzsgáltam, vajon mlyen segítséget nyújthat ez az dőeltolásos módszer a modellezésben. 4/51

. Korrelácós és regresszós számítások elv alapja Két (vagy több) mérhető mennység között a kapcsolat (ha van) lehet determnsztkus (pl. U=R*I), vagy a véletlen által (s) befolyásolt, vagys sztochasztkus. A sztochasztkus kapcsolat vzsgálatára szolgál a korrelácó- és regresszó-számítás [7, 0, 3, 4]..1. Alapfogalmak Korrelácó A korrelácó-számítás arra az alapvető kérdésre ad választ, hogy van-e kapcsolat két vagy több változó között, és ha gen, az mennyre szoros. Regresszó Arra, hogy a kapcsolat megléte esetén hogyan lehet előre jelezn az egyes változók értékéből más változók várt értékét, a regresszós számítás ad választ. A varanca a sztochasztkus folyamatban a valószínűség változó és az E() várható érték között várható eltérés mérőszáma:, ennek négyzetgyöke a szórás: ( ) [8]. Idősoroknál, ahol a független változó értékét meghatározott dőpontokhoz kapcsolt mért y adat jelent, várt értékként az összes mért N darab adat átlagát tekntjük:, míg a becsült szórás: s N 1 ( y N 1 y), vagys s a valószínűség változó értékenek az átlagértéktől való eltérésére jellemző (felülvonással az átlagértéket jelölve). 5/51

.. Korrelácó vzsgálata két változó esetén Legegyszerűbb esetben két változó egydőben felvett értékenek összefüggését vzsgáljuk egy nagyobb számú sokaságból kragadott adott N számú mntán. Ez az egyterű és egydejű mnta kétváltozós sokaság, és munkahpotézsként feltételezzük, hogy normáls eloszlású. Két változó értéke egyszerűen ábrázolhatók derékszögű koordnátarendszerben, mnt az egyk változó () és másk változó (y) összetartozó értéket bemutató pontsereg. Egy lyen egyszerű ábrázolás sokat mondó kvaltatív képet nyújthat arról, hogy az adott adatsorok között van-e összefüggés, és ha van, akkor az mlyen szoros, és mlyen függvénnyel adható lletve közelíthető meg. Ha a kapott képen a pontok elosztása dffúz, és az összes pont vagy néhány túlzottan klógó pont kvételével a pontsereg nagyjából körvonallal keríthető be, nagy bzonyossággal mondható, hogy a két változó között nncs semmféle összefüggés. Ha a pontsereg többé-kevésbé keskeny ellpszssel keríthető be, akkor bzonyos összefüggés várható, mégpedg mnél megnyúltabb az ellpszs, a korrelácó annál szorosabb. Szoros korrelácó esetén egyre nkább krajzolódk, hogy a pontsereg egy egyeneshez vagy más, egyváltozós függvény képéhez közelít. Megfelelő transzformácókkal ez utóbbak s vsszavezethetők lneárs összefüggésekre. Ebben az esetben a koordnáta-tengelyeket az y* lletve * szernt skálázva a pontsereghez egyenes lleszthető. Logartmkus: y=b 0 +b 1 ln ; y*=y; *=ln Hatvány: y=a b ; lnearzált alakja lny=lna+bln; y*=lny; *=ln Eponencáls: y=ab ; lnearzált alakja lny=lna+*lnb; *=; y*=lny Hperbolkus: y= 1/(a+b) ; lnearzált alakja 1/y=a+b; *=; y*=1/y vagy y= a+b/ ; ekkor *=1/; y*=y 6/51

.3. Lneárs korrelácó Formalzálva: r=corr(,y ), ahol az és y egy vzsgálat során egydőben mért két adatot jelent. Legegyszerűbb esetben (lletve lnearzálás után) a pontsereg ksebb-nagyobb pontossággal egyenest jelöl k, ekkor az összefüggés lneárs. A legksebb négyzetek módszerével kjelölhető az az egyenes, amely legjobban lleszkedk a pontsereghez [0]. Az egyenes egyenlete a következő: y=b 0 +b 1, ahol b 1 =d d y /d ; b 0 = y -b 1 tt d =( - ); d y =(y - y ); felülvonással az átlagértéket, aláhúzással a becslést jelölve. Az egyenes elhelyezkedése önmagában s sokat mondó lehet, ránézésre eldönthető, hogy poztív vagy negatív korrelácó áll fenn. Szemlélet alapján s szoros korrelácó tételezhető fel, ha a pontok mnd vszonylag közel találhatók az egyeneshez. Vszont ha ez az egyenes vízszntes, akkor y változó még ekkor sncs korrelácóban az változóval. Statsztka adatok feldolgozásánál óvatosan kell ezt a kérdést kezeln, mert előfordulhat, hogy létezk korrelácó, de az változása csak nagyon ksmértékű y változással jár együtt. A változók között összefüggés erőssége a korrelácós koeffcenssel fejezhető k. Az elmélet korrelácós koeffcens, értékét a következő módon számíthatjuk [9]: y y y y y y (ahol a számláló a kovaranca kfejezése), másképpen Itt E a várható értéket, a változók szórását jelent. Mvel statsztka adatok felvételénél az elméletleg várható értékek és a szórások sem smertek, a tapasztalat korrelácós koeffcens számításához kell folyamodnunk, és annak smeretében becsülhetjük t. A várható érték helyébe a felvett adatok átlagát helyettesítjük, és a szórást () s az átlagtól való eltérések fgyelembe vételével közelítjük (s), így jutunk a Pearson-féle tapasztalat koeffcenshez (r), amelynek számítása a következő: 7/51

8/51 N y y N N y y r N N N 1 1 1 ) ( ) ( ) (, azaz N N N y y y y r 1 1 1 ) ( ) ( ) (, másképpen N N N y y y y r 1 1 1 ) ( ) ( ) )( ( ; ebből N y N y d d d d r 1 1 Az r (és ) korrelácós koeffcens értéke -1 és +1 között értékeket vehet fel, és a mnták számának növelésével egyre megbízhatóbban közelít -t. Mnél nagyobb a becsült nak, lletve az r-nek az abszolút értéke, a korrelácó annál szorosabb. Egy-egy feltűnően klógó pont, amely nem lleszkedk a több pont által kjelölt egyeneshez, erősen befolyásolhatja a korrelácós koeffcens értékét. Ilyenkor nagyon alapos vzsgálat szükséges annak eldöntéséhez, hogy vajon nem durva felvétel hba okozhatja-e a krívó eltérést, és hogy ez a pont teljesen fgyelmen kívül hagyható-e, vagy az általános szabályszerűség megállapítása mellett tovább, nagyobb mntán végzett adatfelvételt tesz szükségessé. Akár azért, mert bzonyos szélső értékenél másmlyen összefüggés feltárására van szükség, akár azért, mert nem jól választottuk meg a lnearzált függvény típusát és ez csak szélsőséges értékeknél mutat nagyobb eltérést. Ksszámú mnta esetén az s előfordulhat, hogy pár pont segítségével valamlyen prekoncepcó alapján történt az adott egyenes meghatározása. Láthatólag szoros korrelácót mutató eredmény esetén sem következtethetünk okvetlenül valós összefüggésre. Előfordulhat, hogy mnd, mnd y változása egyértelműen következk egy harmadk w változó értékeből. Ebben az esetben nncs értelme korrelácós számítást végezn. A korrelácós számítások eredményet tehát mnden esetben értelmezn és értékeln szükséges.

.4. Szgnfkancavzsgálat Különösen ks számú mnta esetén felmerülhet a gyanú, hogy a kmutatott korrelácó csak a véletlen műve. Meg akarunk bzonyosodn arról, hogy egy választott konfdenca-szntnél magasabb a valószínűsége annak, hogy a kmutatott korrelácó valóban létezk. Ahhoz, hogy az r értékét elfogadhatónak tartsuk, szgnfkancavzsgálatot kell végezn egy N- szabadságfokú t-statsztka felhasználásával (Studentpróba). Knduló hpotézs H 0 : =0; t r N 1 r Ha t abszolút értéke magasabb, mnt adott szgnfkancasznthez és szabadságfokhoz tartozó krtkus érték, akkor a H 0 : =0 hpotézst elvetjük, vagys elfogadjuk a korrelácó fennállását és r értékét. A fent említett krtkus érték számítása nem könnyű, de gyakorlat felhasználás céljából táblázatos formában rendelkezésre áll..5. Idősorok elemzése.5.1. Alapfogalmak Munkám során dősorokat vzsgáltam [7,10,11]. Itt az egyk változó, az dő befolyásolhatatlanul halad előre. Az dőskála egysége, amely az -edk és +1-edk dőpont különbsége, a továbbakban a mntavétel dőpontjanak sorszámára (1,,3,, N) hvatkozunk. A független változónak meghatározott dőpontokban (mntavétel) felvett értéke az dőtől okságlag független; mértékét más tényezőknek a mérés dőpontok között bekövetkezett változása határozza meg. Az így kapott összefüggés ábrázolása dőfüggvényhez közelít, légszennyezés adatok esetén korlátozott értékkészlettel. Idősor létrehozása: a) Folytonos folyamatból dszkrét mntavétel, ahol a mntavétel dőpontja t ; t -t -1 = (ekvdsztáns) b) Folytonos mérés dőközökre átlagolva. A regresszós elemzés az dősorok smert szakaszából von le következtetést két vagy több dősor kapcsolatának várható alakulásáról. Lehetőséget nyújt dőben 9/51

előrejelzésre, lletve arra, hogy az egyk tényező smeretében megbecsüljük a másk tényező értékét. Egy dősor tartalmazhat determnsztkus és sztochasztkus trendet. Sztochasztkus staconárus folyamatban t (t[t 1 ;t ] T) eloszlása független [t 1 ;t ] kválasztásától, tt T az dősor hossza. A sztochasztkus trendet tartalmazó sorok dővel változó véletlenszerű trendet tartalmaznak. t = t 1 + t. Legegyszerűbb esetben (véletlen bolyongás) Gauss- fehérzaj folyamat az t staconárus sztochasztkus folyamat, ha mnden t-re standard normáls eloszlású. A trendstaconárus folyamat formalzált leírása: t = 0 + 1 t+ t, ahol t egy trendstaconárus dősor; t=1,, N; t egy 0 várható értékű állandó szórású változó. Vektor autoregresszó (VAR): két smeretlen esetén y(t) és (t) függő változók egymás késleltetett értékere vannak felírva. A VAR modell felírása több függő változóra s lehetséges, erre utal az elnevezésben a vektor szó (függő változók vektora). A VAR(p) jelölésben a p a késleltetések számára utal. Egy kétváltozós vektor autoregresszív folyamat az alábbak szernt írható le: y t = 10 + 11 y t-1 + 1 y t- + + 1p y t-p + 11 t-1 + 1 t- + + 1p t-p + 1t ; és t = 0 + 1 t-1 + t- + + p t-p + 1 y t-1 + y t- + + p y t-p + t, ahol és smeretlen együtthatók, ε 1t és ε t a hbatagok..5.. Autokorrelácó és keresztkorrelácó dősoroknál Nncs értelme azt a kérdést feltenn, hogy egy adatsor hasonlít-e önmagára. Korrelácó állhat fenn egy adatsor és saját, dőben eltolt adata között, vagy a vzsgált adatsor és egy másk, tőle független adatsor között. Az autokorrelácó egyazon adatsor különböző (térben szomszédos vagy dőben eltolt) megfgyelés egységekre vonatkozó értéke között kapcsolatot mér. Az dőbel (egyterű) k-adrendű korrelácó formalzálva: r=corr( ; -k ). Az dőbel autokorrelácó k=1 esetén azt jelent, hogy mnden -edk dőponthoz tartozó adatot korreláltatjuk az egy dőponttal megelőző felvett értékkel. Az eltolás következtében az adatsor hossza k- val csökken, hszen az első k ponthoz nem lehet hozzárendeln korább adatot. 10/51

r k N k1 N ( )( 1 k ( ) ) ; k=1,, N-1 Parcáls autokorrelácó A parcáls autokorrelácó az t és t-k adatsor között korrelácót mutatja t-1, t-,, t-(k-1) kküszöbölésével [10, 11]. A parcáls autokorrelácó függvény mntából számított értéket úgy kapjuk, hogy egyre magasabb rendű autoregresszív egyenleteket becslünk. Az első parcáls autokorrelácó értékét az alább becsült a 11 koeffcens adja: y t =a 0 +a 11 y t-1 + t. A másodk parcáls autokorrelácó értékét az alább becsült a koeffcens adja: yt = a 0 + a 1 y t-1 + a y t- + t, és így tovább. A parcáls korrelogram a parcáls autokorrelácókat mutatja a késleltetés függvényében (yt és yt-k között) ábrázolva a több yt-j (j = 1,, k-1) kszűrésével. Két valószínűség változó között kapcsolat szorosságát kfejezhetjük a korrelácós együtthatóval. Egy dősor autokorrelácós függvénye az eredet adatsor és a kdővel eltolt adatsor (k=0,1, N-1) értékekhez tartozó (k) autokorrelácó tényezőből áll. Autokorrelácó-mátr: 1 1 P n = n mvel r y =r y. 1 1 1 1 n 1 1 n3 Jellemző függvényképek: n1 n n3 1 A P n autokorrelácó-mátr szmmetrkus, a) Normáls eloszlású független sorozat esetén a k értéke (k 0) elvleg 0, a gyakorlatban a véletlenszerű hbák matt 0 körül szűk tartományban ngadozk. b) Autokorrelált sorozatnál 0< k mozgóátlaggal jellemezhető, trend szernt alakul) <1, lecsengő jellegű (a függvény c) Perodkus függvény esetén az autokorrelácó-függvény lefutása s azonos peródus szernt alakul. 11/51

A keresztkorrelácó két adatsor között kapcsolat szorosságát vzsgálja (dőben vagy térben). Ha az egyk adatsor értéket vetjük össze a másk adatsor dőben eltolt megfelelő értékevel, akkor a késleltetett hatások s értékelhetők. Az dőben keresztkorrelácó formalzálva: r=corr(y ;w -k )..5.3. Korrelácós tesztek [1]. A korrelácó vzsgálatára több tesztet dolgoztak k. Az autokorrelácós tesztek az adatok megfelelő csoportosításával alkalmasak egydejű lletve dőbel keresztkorrelácós elemzésekre. Adatelemzés során különösen, ha az adatok dősorként kezelhetők bzonyos trend meglétét defnálhatjuk, ha az adatsor két pontjának várható értéke között különbség szgnfkánsan nagyobb, mnt amennyt a mntavétel bzonytalansága okoz. Ez azt jelent, hogy az adatok dőbel eltolódása az átlag dőbel szgnfkáns átalakulását hozza magával az eltolódás előtthez képest. Homoszkedasztkus adatok esetén (ekkor az adatok hbája nem függ attól, hogy az dősor melyk pontjához tartozk) az eredet és az dőben eltolt adatok között varanca dőbel alakulásának különbsége az átlag alakulásának tendencáját jelz. A legtöbb parametrkus trendtesztben az eltolódott adatokat az adathalmaz teljes varancájával helyettesítjük. A tesztekben null- és alternatív hpotézseket deklarálnak, és rendszernt a különböző varancák arányát számolják k és hasonlítják egy teszt-statsztkához, amelyből egy valószínűség jellegű p érték nyerhető. Ha a p érték ksebb (más esetekben nagyobb) mnt a megkívánt szgnfkancához számított érték, akkor a hpotézst el kell vetn. Olyan másodrendű staconárus dősoroknál, amelyeknél az átlag és a varanca dőfüggetlen, nem létezk tendenca. Ugyanakkor lehetséges autokorrelácó másodrendű staconárus dősoroknál, mvel az autokorrelácó csak az dőkésleltetéstől függ. A különböző lneárs modellek, mnt az autoregresszós, az ntegrált és mozgóátlagos valamnt nem-lneárs modellek kfejezk a sorozatok dőbel alakulását az előző adatok dőkésleltetésének függvényében. Tóth G. és munkatársa dősoros adatok parametrkus tesztekkel történő trendanalízsével foglalkoztak [1]. A fokozatos trendre vonatkozó Neumann-teszt, ennek a rezduálsokra alkalmazott varánsa, a Durbn-Watson teszt és az egylépcsős varancaanalízs (ANOVA) összevetésével azt találták, hogy az ANOVA az általuk történt 1/51

kegészítéssel összemérhető a korább tesztek erejével a poztív és negatív korrelácó meghatározása terén. Alkalmasan választott megsmételt mntavétellel és egy dőkésleltetés-változó bevezetésével a megsmételt mntavételes ANOVA teszt érzékenysége alapvető jellemző mnd a poztív, mnd a negatív autokorrelácó meghatározása terén homoszkedasztkus normál eloszlású adatsoroknál. Az dőkésleltetés-függő tesztek hatékony eszköznek tűnnek az dősorként kezelt adatok elemzése és különösen az adatmodellek tervezése során. Ezt a teszt kdolgozó azzal a módszerrel gazolták, hogy a teszteket különböző beépített trendű (esetenként fehér zajjal terhelt) szmulált adatokkal vzsgálták és hasonlították össze. A teszt alkalmasnak bzonyult Magyarországon mért különböző légszennyezés kísérlet dősorok elemzésére s..5.3.1. Neumann-teszt Az dőben egymást követő adatpárok különbségének négyzetösszegét a d N értékek számlálójaként vesszük, a nevezőt pedg az egyes adatok és az átlag eltérésének négyzetösszege adja a teljes adatsorra vonatkozóan, ahol N az adatok száma [5]: N d N 1 N 1 ; d N értéke 0 és 4 közé esk. Véletlenszerűen kválasztott normáls eloszlású adatok esetén d N =. Ha az egymást követő adatok között poztív autokorrelácó van, akkor d N <. d N érzékeny a negatív autokorrelácóra s, ha a szomszédos adatok jobban különböznek egymástól, mnt az átlagosan elvárható; ebben az esetben d N >. A null- és alternatív hpotézst Neumann az alábbak szernt körvonalazta. H 0 : nncs fokozatos trend az adatsorban, H 1 : fokozatos trend áll fenn az adatsorban. d N,krt értékek ksebbek -nél, és függenek N-től továbbá a megkívánt szgnfkancától (). H 0 -t elvetjük, ha d N < d N,krt. Például d N,krt (N=10, =0,05)=1,06; d N,krt (N=30, =0,05)=1,418; d N,krt (N=60, =0,05)=1,581. A krtkus érték kszámítása nem könnyű, és számos tudományos elemzést találn róla. A Neumann-teszt nem népszerű vzsgálat módszer, de van néhány újabb alkalmazása [18, 19] 13/51

.5.3.. Durbn-Watson-teszt A Neumann-teszt egy alesetét, a Durbn-Watson-tesztet gyakran használják autokorrelácó jelenlétének kmutatására regresszó után rezduálsokban [6,7]. A rezduálsok elsőrendű autokorrelácójának fennállása azt jelent, hogy a megfgyelések nem függetlenek egymástól. Szabályszerű legksebb négyzetösszeg alapján végzett regresszó esetén a rezduálsok átlaga egyenlő 0-val, ezért a fent képlet egyszerűsíthető: d DW = N e e N e 1 1. Ennek a tesztnek a hpotézse különbözk a Neumann-tesztétől [13]. A módszer poztív vagy negatív autokorrelácó kmutatására használatos. Két krtkus értéket használ, ezek N-től és a megkívánt -tól függenek. Ez a teszt csak akkor nyújt elfogadható választ, ha a rezduálsok normáls eloszlásúak. Poztív autokorrelácó esetén: ha d DW < d DW,alsó krt., a poztív autokorrelácó szgnfkáns. Ha d DW,alsó krt. <d DW < d DW,felső krt., nncs szgnfkáns válasz. Ha d DW,felső krt. <d DW, akkor a poztív autokorrelácó hányát vesszük elfogadottnak. Negatív autokorrelácó esetén: ha (4-d DW )< d DW,alsó krt., akkor a negatív autokorrelácó szgnfkáns. Ha d DW,alsó krt. <(4-d DW )< d DW,felső krt., nncs szgnfkáns válasz. Ha d DW,felső krt. <(4-d DW ), akkor szgnfkáns a negatív autokorrelácó hánya. A krtkus értékek kszámítása hasonló a Neumann-tesztéhez. A Durbn- Watson-tesztnek sok elemzése található különböző vonatkozásokban..5.3.3. Egyfaktorú ANOVA (Analyss of Varance) smételt mntavétellel [1] Az ANOVA (Analyss of Varance) [7,14,15] teszt számos, általában paralel elrendezésű csoport folytonos, normáls eloszlású tulajdonságának átlagát vet össze. Az egyfaktorú ANOVA teszt annak kmutatására szolgál, hogy egy változó vzsgálatára felvett különböző mnták átlagértéke korrelálnak-e egymással, ha gen, mlyen erős a korrelácó. 14/51

A különböző mnták egyesítéséből számítható teljes négyzetösszeg (négyzetre emelve és összegezve az adatok eltérését a nagy átlagtól) a csoporton belül és csoportok között részre osztható. Kndulópont az F-próba, am az átlagok eltérésére karaktersztkus csoportok között varancát vet össze a random ngadozást leíró csoportokon belül varancával. A csoportosító változót faktornak nevezzük. Ha egy faktornak a függő változóra gyakorolt befolyását elemezzük, akkor egyfaktoros varancaanalízsről beszélünk. A különbségek felkutatása mélyebb elemzésekkel smétléses vagy kontrasztbel összehasonlításokkal fokozható. Tegyük fel, hogy különböző helyeken felvett adatok függenek a mntavétel helyétől. Ez az eredet H 1 hpotézs, ennek ellentettje a H 0 nullhpotézs, amkor feltételezzük, hogy az egyes sorozatok között nncs semmféle összefüggés. Hpotézsünk gazolására G különböző helyen dősoros mntákat veszünk fel; a j-edk mntasorozat n j tagból áll, az összes mnta G j 1 n j =N. Azt találhatjuk, hogy az egyes csoportok eléggé hasonlítanak egymásra, például a j-edk csoport legksebb és legnagyobb értéke között tartományba beleesk az összes több csoport értékkészletének nagy része. Képezzük külön-külön mndegyk csoport átlagértékét és az összes mntára vonatkozó teljes (T) átlagértéket. nj j 1 n j j ; T G j G 1 1 j1 nj n j j Nagyon valószínű, hogy abban az esetben s, ha H 1 helytelen, az egyes csoportokra vonatkozó átlagértékek eltérnek egymástól. A csoportátlagok szórása, st feltéve, hogy mndegyk csoport n tagból áll, s (Fsher-Bartlett tétel). Az j tag n eltérése a teljes átlagtól két részből tevődk össze: egyk összetevő a saját csoportátlaghoz vett eltérés (csoporton belül), a másk a saját csoport átlagának eltérése a teljes átlagtól (csoportköz): ( j - T )=( j - j ) + ( j - T ). Ennek alapján a teljes négyzetösszeg s felbontható [14,15]: 15/51

G nj G nj 1 1 1 j j T j 1 j j j T G nj SSW= G j j ; SSB= n j j T 1 j 1 j 1 ; lletve ahol az első tag a négyzetösszegnek a csoporton belül (W), a másodk a csoportköz (B) összetevője. A varanca általános kfejezése: s = (- ) / D f, ahol D f a szabadságfok. A varanca kfejezéséhez D fb =G-1 ; D fw = G j 1 (n j -1), vagy ha n j mndegyk csoportnál ugyanaz a n, akkor D fw =G(n-1). A varanca csoporton belül és csoportköz összetevő a következők: s W = G j G nj j1 n 1 1 W j j 1 j ; s B G j 1 n j j G 1 sb Ebből az F= képlettel kszámolunk egy F értéket, amely F-eloszlást követ, s ha a halmazokon belül adatok normáls eloszlásúak és átlaguk ugyanaz. Az ANOVA használatának szükséges feltétele kapcsolatban van a halmazokon belül varancával. Adott halmazon belül adatoknak normáls eloszlásúnak kell lennük, és a halmazon belül varancának azonosnak kell lenne a másk csoportéval. Ugyanígy fgyelembe vehető az eltérő méretű halmazok kegyenlítése. Ha az összes adatunk n j mátrba van rendezve, ahol egy halmaz n j elemű, és G halmaz van, akkor az arány kszámítására a formula a következő: F n G n j j y G y j j j ( ) ( ) j n j N G 1 n j G n G y j j y j j ( ) j n j N G A H 0 hpotézst, vagys hogy a különböző adathalmazok átlaga egyenlő, elvetjük, ha F nagyobb, mnt a kívánt szgnfkancához tartozó egyfaktorú F krt érték. Az ANOVA megsmételt mntavételes továbbfejlesztése során először a Neumanntesztet helyettesítették az ANOVA teszttel. Mnden adat (kvéve az első és utolsó adatokat) két csoporthoz tartozk. Ez bzonyos nkonzsztencát okozhat az ANOVA esetén, ha az adatok ugyanolyan csoportosítását alkalmazzák, mert az adatoknak a T 16/51

csoportokban függetleneknek kell lennük. Ezért az adatok véletlenszerűen rányított megsmételt mntavételét alkalmazták. G=N/4 párt véletlenszerűen választottak olyan módon, hogy a párok metszete üres legyen. Más szavakkal: egy kválasztott adat csak egyetlen csoport eleme legyen. Egy párt két egymást követő elem alkot. Ez azt jelent, hogy az ANOVA-hoz az adatok felét használták. Nézzünk egy példát! Ha N=8 és G=, akkor 15 lehetőségünk van párokat képezn: 1 - és 3-4, 1 - és 4-5 1 - és 7-8 ; - 3 és 4-5 - 3 és 7-8 ; ; 5-6 és 7-8. Mndezek a választások egy p=1-p(f) értéket adnak, ahol F a fent képletből adódk a kválasztott párok elemere. p(f) annak a valószínűsége, hogy egy G-1 és G szabadságfokú Fscher-eloszlású változó értéke ksebb, mnt F. Néhányszor megsmételték a véletlenszerű kválasztást (pl. G/4 esetben) és az F értékek átlagát használták p=1-p(<f>) kszámításához. Hagyományos egyfaktorú ANOVA esetén a null-hpotézs (a halmazok átlagának egyenlősége) elvethető, ha p értéke ksebb az elvárt szgnfkancánál, pl. =0,05. Az dősorozat egyes szakaszara vonatkozó átlagok nem-egyenlő volta poztív autokorrelácót jelenthet. Az ANOVA teszt megsmételt mntavételes módszere közvetlenül kmutatja az egyenlőséget vagy annak hányát. Az átlagok túlságosan szoros egybeesését nem elemezték egyfaktorú hagyományos ANOVA teszttel, de a p-érték közel áll egy olyan ndkátorhoz, amely statsztkalag előnyben részesíthető, ha a csoportátlagok közel vannak egymáshoz. Ez lehet az adatok negatív autokorrelácójának a következménye. Ezért mnd a Neumann, mnd a Durbn-Watson teszt hpotézse átvhető a megsmételt mntavételes ANOVA módszerre. A Szerzők mndegyk teszt esetén javasolják p alkalmazását. ANOVA teszt a Neumann teszt kváltása esetén: a) H 0 : nncs fokozatos tendenca az adatsorban b) H 1 : létezk fokozatos trend c) H 0 elvetendő, ha 1-p(<F>) ksebb, mnt amegkívánt szgnfkanca (általában 0,05). ANOVA teszt a Durbn-Watson teszt kváltása esetén a) H 0 (DW): nncs autokorrelácó az adatsorban b) H 1,low (DW): van poztív autokorrelácó c) H 1,up (DW): negatív autokorrelácó van 17/51

d) H 0 (DW) elvetendő H 1,low javára, ha 1-p(<F>) ksebb, mnt e) H 0 (DW) elvetendő H 1,up javára, ha 1-p(<F>) nagyobb, mnt 1- Időfüggő ANOVA(h) és Neumann(h) tesztek formá megsmételt mntavétellel Másodrendú staconárs dősoroknál, ahol az átlagérték és a varanca dőfüggetlen, a statsztka autokorrelácó az alábbak szernt fejezhető k: Corr h N h h N A Corr(h) grafkus megjelenítését gyakran használják az dősorok különböző tulajdonságanak megjelenítésére, mnt amlyenek a perodkusság (szezonaltás), az autokorrelácós folyamatok nformácóvesztésére (leromlás) vagy a zajhatásokra. Az új módszer kdolgozó csoportok képzését alkalmazták ( megsmételt mntavétel ) nem egymást követő, hanem h távolságban lévő két elemből. A folyamatot többször lefuttatva átlagos p értékeket kaptak a h függvényében az 1- (<F(h)>) összefüggéshez, így a teszt kterjed a h-tól függő hpotézsek készletére, ahol h darab választ kaphatunk hpotézsenkre. Klasszkus statsztka tesztek esetén a válasz rendszernt egy logka érték, hogy a hpotézs megtartható-e vagy elvetendő. h- tól függő hpotézs-készlet esetén érdemes felvázoln a h függvényében az 1-(<F(h)>) összefüggést, hogy kjelöljük az elfogadás és elvetés tartományokat a grafkonon. A h mamáls értékét a Szerzők N/3-g korlátozták, hogy mnden h esetére megbízható statsztkát kapjanak a számítások során. 18/51

3. A légszennyezésekről 3.1. Globáls hatások [17] A levegő elsősorban ntrogénből és ogénből áll, számottevő még a nemesgázés víztartalom. Tovább, részben az ember egészségre s ártalmas természetes eredetű összetevők globálsan olyan ks koncentrácóban vannak jelen, amelyek nem jelentenek egészségügy veszélyforrást. Vszont közülük a szén-dod, a metán és az ózon azok, amelyek alacsony koncentrácójuk ellenére rendkívül mértékben hatnak az élővlág létfeltételere. 3.1.1. Üvegházhatás Az üvegházhatású gázok nagymértékben átlátszóak a napfény spektrumtartományában, de a földfelszínről a vlágűr felé vsszasugárzott nfravörös tartomány számára nkább átlátszatlanok. A földre érkező napenerga így csapdába kerül, és ematt a föld átlaghőmérséklete mntegy 33 C-kal melegebb, mnt amenny a beérkező és ksugárzott energa mérlegéből az üvegházhatás nélkül adódna. Az üvegházhatást okozó anyagok [] a ma általánosan elfogadott nézet szernt az alább arányban járulnak hozzá ennek a helyzetnek a kalakulásához (1. táblázat): 1. táblázat: Száraz légkörben előforduló üvegházhatású gázok koncentrácója, légkör tartózkodás deje és relatív üvegházhatáserőssége [] 19/51

A víz szerepe ma nem tsztázott két ellentétes hatás matt. Maga a vízmolekula üvegházhatású [1], vszont ha megnő a légkörbe jutó vízgőz mennysége, és így nő az üvegházhatás, akkor ott a vízgőz kondenzálódk, felhőket képez, melyek jelentős mértékben szórják a bejövő sugárzást és így csökkentk a felszínt elérő és melegítő sugárzást []. A metán szerepének a növekedése várható poztív vsszacsatolás révén: az általános felmelegedés során mocsárrá olvadó permafrost-övezetben a jégből távozk az addg lekötött metántartalom, míg a dntrogén-od képződése a növényés talajélet természetes velejárója, és ennek ntenztása az üvegházhatás erősödésével nehezen jelezhető előre. Az ember tevékenység az üvegházhatást okozó természetes eredetű anyagok koncentrácóját emel, másrészt korábban smeretlen, a természetes összetevőkhöz képest nagyságrendekkel erősebb üvegházhatású szennyezést s magával hoz. Ilyenek a halo-fluorkarbonok (HFC), a pol-fluorkarbonok (PFC) és a kén-heafluord. Ezek koncentrácójának növekedése befolyással van lletve lesz bolygónk átlaghőmérsékletére annak mnden következményével együtt: többek között elsvatagosodás, tengervíz szntjének emelkedése, trópus betegségek areájának kterjedése. Vannak olyan nézetek, hogy a Föld történetében voltak már ennél sokkal nagyobb globáls katasztrófák, például amkor a redukáló jellegű légkör odáló jellegűre változott. Bolygónknak valóban mndegy (Gaa elvan az ember nélkül s), de a ma élővlág, főleg az ember létfeltételenek megóvása a helyzet stabltását gényl. Az ember tevékenység jelenleg gyorsuló ütemben járul hozzá a kedvezőtlen hatásokhoz. Az utóbb 3-4 évszázezred során a légkör összetétele közel stabl volt, gaz, ezalatt s kmutatható a szén-dod tartalom perodkus ngadozása ez vszont végg a ma magas koncentrácó alatt maradt. 3.1.. Ózonpajzs gyengülése A magaslégkör ózon kszűr az UV-sugárzásnak az élővlágra veszélyes spektrumtartományát. A sztratoszférában az ózon fotokéma reakcóban keletkezk a légkör ogénből, és az ezzel párhuzamos bomlás folyamat révén a koncentrácója egyensúly helyzetben stablzálódk. Az ózonpajzsot a légkörbe került halofluorkarbonok tehetk/teszk tönkre. 0/51

3.1.3. Savas esők Az ember tevékenység matt növekszk a ntrogén-odok és kén-dod koncentrácója. Az egyre nkább csökkenő ph-jú esők a talajéletet és az épített környezetet s károsítják, az erdők faállománya betegszk, a bodverztás csökken, a talajok termőképessége és a műemlékek állaga gyorsulva romlk. 3.. Hely hatások Az ember megjelenését követően sokág ksebb mértékben, majd az utóbb évszázadokban rohamosan gyorsulva befolyásolja a környezetét, ezen belül a légkör összetételét s [3]. A globáls hatások lassan nylvánulnak meg, de a lokáls szennyezések rövd távon s kfejtk káros hatásukat. A lokáls, véletlenszerű par kbocsátások (pl. donbalesetek) nem tartoznak ebbe a vzsgálódás körbe, csak a mndennap életvtel során jelentkező hatások. A nagyvárosokban jellemzővé vált légszennyezés jesztő mértékben növelhet az allergás és légút megbetegedések gyakorságát és súlyosságát valamnt más egészségkárosodások fellépését. Munkám során 6 jellemző nagyváros légszennyezőt vettem fgyelembe: CO, SO, NO, NO X, PM10, O 3. Az dőjárás nagymértékben befolyásolja ezen anyagok koncentrácóját a levegőben, de ahhoz, hogy a mérésekből és számításokból nyert adatokat értelmezn tudjuk, először célszerű áttekntenünk ezeknek a légszennyező anyagoknak természetes és antropogén forrásat, nyelőt [4]. Ózon (O 3 ): Az ózon a légkör két rétegében s jelen van, egyrészt a sztratoszférában, 5-50 km tengersznt felett magasságban, másrészt pedg a földfelszín közelében. A sztratoszférában természetes úton keletkezk, és ez az ún. ózonpajzs véd a Föld felszínén élő élőlényeket a Napból érkező, számukra káros UVfénytől. A földfelszínhez közel, mnt légszennyező anyag van jelen, és fotokéma folyamatok során keletkezk; ehhez odáló anyagokra, szabad gyökökre és napfényre van szükség. A légkör más szennyezővel könnyen reagál, és veszélyes anyagok képződnek, mnt például az erősen mérgező PAN, azaz pero-acetl-ntrát, lletve a mérgező és rákkeltő aldehdek. 1/51

Természetes forrása: A sztratoszférában ogénből keletkezk egyensúly folyamatban. Antropogén forrása: Érdemleges ózonkbocsátás nncs. Az ózon napfény hatására képződk fotokéma úton, prekurzora főleg égéssel járó folyamatok során keletkeznek (CO, NO, valamnt számos llékony szerves vegyület). Ezek jellemző forrása a kpufogógáz és más égéstermékek. Csökkenő ntenztású napsugárzás mellett képződése lassul vagy megszűnk. Kén-dod (SO ): a kén-dod és az odácója során keletkező kén-trod a nedvességgel együtt savas aeroszolt képez, és a savas ülepedés egyk okozója. Természetes forrása: Vulkán tevékenység. Antropogén forrása: Elsősorban kéntartalmú tüzelőanyagok elégetése. A kbocsátás döntő részét a szenet használó erőművek és lakosság felhasználás, ksebb részét cseppfolyós (közte üzemanyagok) és gáznemű energahordozók elégetése okozza. A kokszot használó acélgyártás szntén nagy kbocsátó, és de sorolható a vegypar több ágazata (kénsavgyártás, szulfdos ércek pörkölése) s. Szén-monod (CO): a szén-monod az a légszennyező anyag, melyről elmondható, hogy ahol nagyobb koncentrácóban van jelen, sznte bztos, hogy ember tevékenységből származk. Természetes forrása: Vulkánok, erdő- és bozóttüzek, élőlények anyagcseréje. Antropogén forrása: Fosszls tüzelőanyagok tökéletlen égetése a kén-dodnál említett ágazatokban: erőművek, gépjárművek, lakosság fűtés, kohászat. PM10: A PM10 jelöléssel a levegőben szálló, 10 mkrométer átmérőnél ksebb szlárd vagy folyékony részecskéket (aeroszol) jelöljük; az ebbe a mérettartományba eső frakcó több nap alatt sem ülepedk k, így nemcsak a talajközel légrétegekben fordul elő. A szélmegporzású növények vrágpora ezt a mérettartományt felülről közelít. /51

Természetes forrása: Talajerózó, vulkánok, erdőtüzek. Antropogén forrása: Szén, olaj, fa égetése (hamu- és koromszemcsék); közút közlekedés (Deselkorom, súrlódó erőátvtel alkatrészek és gumköpeny kopása). A gépjárműforgalom különösen veszélyes forrás, mvel a rég típusú súrlódó betétekből (főleg fékbetét) azbeszt, az újabbakból pedg antmon-szulfd és rézszemcsék kerülnek a levegőbe [5]. Az elavult technológák megszűnésével a kohászat és cementgyártás kbocsátása radkálsan csökken. Ntrogén-odok (NO ), ntrogén-dod (NO ): NO X alatt főleg a ntrogén-monod és ntrogén-dod összességét érjük, de de érthető a dntrogén-od s. Mvel a dntrogén-od képződése főleg a növény anyagcseréhez köthető (kbocsátása a mértéktelen ntrogén-műtrágya használat matt egyre nő), jelen dolgozat szempontjából érdektelennek mondható. [,6] Ntrogén-dod általában nem kerül közvetlenül a levegőbe, hanem többnyre ntrogén-monodból képződk ogénnel reagálva. Természetes forrása: Talajbaktérumok, vulkán tevékenység, vllámlások. Antropogén forrása: Járművek, földgáztüzelés, fűtés, ntrogénművek (salétromsav-, műtrágya- és robbanószergyártás). 3/51

4. Légszennyezés adatok és összefüggések vzsgálata a keresztkorrelácós teszttel 4.1. Célktűzés Munkám célja az dőkésleltetéses ANOVA teszt megsmételt mntavételes, keresztkorrelácót vzsgáló új változatának létrehozása, számítógépes beprogramozása és alkalmazása volt egy adott nagyváros környezet légszennyezettség adatanak és az dőjárás jelenségenek együttes vzsgálatára, a teszt érzékenységének gazolására. Ebből a célból az alább lépéseket követtem: - Van-e egydejű és késleltetett kapcsolat a különböző légszennyező anyagok koncentrácóadata között - Van-e egydejű és késleltetett hatású kapcsolat a légszennyezés és az dőjárás alakulása között - A légszennyezés adatok elemzése a munkanap-hatás fgyelembe vételével, azaz esetünkben a gépjármű-forgalom és a légszennyezés összefüggésének vzsgálata - Az összefüggések magyarázatának keresése, ez alapján a teszt alkalmasságának vzsgálata 4.. A keresztkorrelácós teszt elmélete és számítógépes programja 4..1. Az autokorrelácós teszt átdolgozása keresztkorrelácóra A kértékeléseket az smételt mntavételes ANOVA teszt alapján végeztem, ennek során a felhasznált szakrodalom [1]. Az adatok feldolgozására szolgáló alapszoftvert (a teszt autokorrelácós változatát) Tóth Gergely és Csb Ádám a rendelkezésemre bocsátották. Ez a szoftver nterneten hozzáférhető programrészleteket s felhasznál. Az autokorrelácóra kdolgozott módszert és a támogató szoftvert átdolgoztam keresztkorrelácós elemzések céljára, és kbővítettem az adatok standardzálását szolgáló résszel. 4/51

Az alapszoftver átdolgozása az alább bővítéseket s magába foglalja: adatbeolvasás átdolgozása, adatpárok vételének módosítása, eredmények kírásának módosítása. A program több részlete azonos a teszt autokorrelácós változatára megírt programmal. Az átdolgozás során az eredet programhoz lleszkedve, a C nyelvet alkalmaztam. 4... A keresztkorrelácós teszt számítógépes programja Az adatok forrása részben [16] az Országos légszennyezettség mérőhálózat (Hungaran Ar Qualty Network) nap átlagokra vonatkozó nylvános eredménye, lletve részben Dr. Salma Imre egyéb forrásokból való gyűjtéseből származnak (az dőjárás és légszennyezettség adatok egyaránt). Mérőállomás: Budapest, Erzsébet tér. Várható volt, hogy az dőjárás tényezők hatása nem azonos az év mnden szakában, ezért az évet három különálló dőszakra osztottam: első, összevont másodk-harmadk, végül negyedk negyedév. Ezt az s ndokolja, hogy ha két dőszakban nagyon eltérő átlagok fordulnak elő, akkor az adott dőszakon belül ksebb ngadozásokra a teszt kevésbé érzékeny. Egy-egy dőszak adatat a következőképpen rendeztem: 6 légszennyező, 7 dőjárás, és 1 hétvége-hétköznap adat képezte a mátr oszlopat (=1 14), míg az adott dőszakban felvett adatok (j=1 n a, ahol n a a napok száma) a sorokat. Az adatok standardzálását a következőképpen oldottam meg (s=1; a =0): a j b j n a 1 b ( b n a j j b 1 j ) Itt a j a standardzált értékeket (későbbekben ll. y), b a mérés során nyert értékeket jelöl. Az egy dőszakban lévő napok, azaz adatpárok száma n a, az ANOVA kalkulácóhoz felhasznált csoportok száma n g =n a /4, egy csoport adatanak száma n =. Az dőkésleltetés mértéke h-1, ahol h=1,,3,...n a /4; f átlagának számításához egy-egy adott késleltetéshez a program (n a /4)-szer futott véletlenszerűen kválasztott n a /4 adatpárral. Az f-értékeket az alább képlet alapján határozta meg a program: 5/51

6/51 f= g n h n h g n n h h n n n y y n n y n y g g g g 1 1 1 1 1 1 1 1 ) ( ) ( 1 ) ( ) (, majd pedg az n a /4 f-értéket átlagolta. D fb = n g -1; D fw = n g (n -1), azaz mvel n =, D fw = g n n. A kapott p-ket egy fájlba írta a program, amt aztán Ecellel ábrázolva jól értelmezhető szemléletes ábrákká alakítottam át. 4.3. A keresztkorrelácós teszt alkalmazása Hogy az eredmények kértékeléséhez tartozó ábrákat értelmezn tudjuk, tekntsünk meg egy példagrafkont, mely két mesterségesen létrehozott adatsor korrelácóját vzsgálja. A két adatsort grafkonon s ábrázoljuk (1. ábra)! Ezekre az adatsorokra a programot lefuttatva, majd az eredményül kapott p- értékeket ábrázolva szemléletes ábrát (. ábra) kapunk. 1. ábra: kék vonal: = 0,3*sn(*π/3) + 0,7*Err, pros vonal: = 0,4*sn(*π/3) + 0,6*Err

. ábra: A tesztadatsorokra lefuttatott program eredménye grafkusan ábrázolva. A vízszntes tengelyen az dőeltolás mértéke látszódk (h), míg a függőlegesen a számított p-értékek. A nulla értékhez közel található az a tartomány (p < 0,05), ahol szgnfkáns poztív, és az 1 értékhez közel (p > 0,95), ahol szgnfkáns negatív korrelácót találtunk. A poztív korrelácót két dolog okozhatja: ha mndkét adatsor az átlagtól felfelé, vagy ha mndkettő az átlagtól lefelé helyezkedk el. Ez jelen esetben annyt jelent, hogy ha az első (az 1. ábrán kék vonallal ábrázolt) adatsor egy adatát kszemeljük, az azonos -nél, az eggyel nagyobb, a kettővel nagyobb, a hárommal nagyobb -nél a másodk (az 1. ábrán prossal jelölt) adatsor adata ugyanabban az rányban tér el az átlagtól, mnt az első adatsorból kszemelt adat. Körülbelül h=15-5 dőeltolás esetén az átlagtól való eltérés pont fordított rányú. Az alább következő ábráknál azt a megoldást választottam, hogy egy ábrán mutatom be az egész éves, és az dőszakokra bontott korrelácós grafkonokat. Így a négy grafkont tartalmazó ábrákon az első grafkon a teljes éves vzsgálatot, a másodk grafkon az első negyedéveset, a harmadk grafkon a másodk-harmadk negyedéveset, a negyedk pedg az utolsó negyedéveset mutatja. 7/51

4.3.1. Munkanap-hatás Ezekről a grafkonokról (3. ábra) tsztán leolvasható, hogy a szennyező anyagok kbocsátása hétvégén és hétköznap teljesen különbözk egymástól, ennek oka a közlekedésben keresendő. Hétköznap ugyans a nagyobb forgalom matt a szennyező anyagok kbocsátása nagyobb. Az ózon tt s fordítva vselkedk, mnt a több anyag, hétvégén láthatóan megnő az ózon koncentrácója a levegőben. Ez nylván nem az ózonkbocsátás matt van, hanem a prekurzorok előző napokban történt kbocsátása matt, melyek megnövelk a képződésének lehetőségét. Ezért van az s, hogy ha kéthárom-négy napja hétvége volt, az ózon mennysége mélypontra kerül. Az s látható, hogy az ózon mnmuma az első negyedévben ksebb eltolódást mutat a hétvégéhez képest. Az utolsó negyedévben kcst kaotkusabban mozognak a görbék, ennek a gyengébb megjósolhatóságnak oka az alacsony keveredés réteg. 3. ábra: a keresztkorrelácós teszt eredménye a hétvége-hétköznap vzsgálatára. Bal felső grafkon: egész év, jobb felső grafkon: első negyedév, bal alsó grafkon: másodk-harmadk negyedév, jobb alsó grafkon: negyedk negyedév. 4.3.. Az dőjárás különböző összetevőnek kapcsolata egymással Melőtt megtekntenénk az dőjárás és a szennyező anyagok között összefüggéseket, célszerű áttekntenünk, az egyes dőjárás tényezők hogyan függenek össze egymással, ezáltal könnyebben elemezhetjük a szennyező anyagokra tett 8/51

hatásukat. A vzsgált dőjárás tényezők a következők voltak: eső mennysége (mm), szélsebesség (m/s), keveredés réteg magassága (m), légnyomás (hpa), relatív páratartalom (%), átlaghőmérséklet ( C), napsugárzás / beérkező hőmennység (W/m ). Mnt látn fogjuk, egyáltalán nem függetlenek egymástól, hanem egy komple rendszerként kell tekntenünk őket. Lássuk felsorolásszerűen, mlyen kapcsolatban s állnak egymással! Keveredés réteg magassága A keveredés réteg magassága és a páratartalom között egyértelmű összefüggés fgyelhető meg (4. ábra). Eme két tényező negatív korrelácóban áll egymással, az év mnden részében, de különösen az első, másodk és harmadk negyedévben. Ez a negatív korrelácó körülbelül két napg fenn s áll, sőt, a másodk-harmadk negyedévben körülbelül egy héten át erős korrelácó fgyelhető meg eme két tényező között. Ez az összefüggés az egész éves adatsort vzsgálva s szembeötlő. A keveredés réteg magassága és az eső mennysége között s fgyelhető meg összefüggés, bár kevésbé erőteljes, mnt a pára esetén láttuk. Itt s elmondható, hogy az esős dőjárás és az alacsony keveredés réteg, valamnt a száraz dőjárás és a magas keveredés réteg általában együtt fordul elő. Ez az összefüggés vszont mamum csak körülbelül egy nap dőeltolással fgyelhető meg. A keveredés réteg és a szélsebesség összefüggése: e két tényező között egyértelműen poztív korrelácó áll fenn, amelynek érdekessége, hogy csak az első és negyedk negyedévben fgyelhető meg, ott 1 ll. 3 napg jellemző, vszont a másodk és harmadk negyedévben az általam használt módszerrel nem kmutatható. A keveredés réteg magassága a légnyomással szntén szoros kapcsolatot mutat, vszont a légnyomásra mondható el legnkább, hogy csak és kzárólag az ugyanazon a napon mért értékek állnak egymással poztív korrelácóban, egy nap múlva már semmlyen összefüggés nem mutatható k. A legegyértelműbb és leghosszabb poztív korrelácó a keveredésrétegmagasság esetében a hőmérséklettel mutatható k. Ez legnkább a másodk-harmadknegyedk negyedévben jellemző, és több mnt tíz napg fennáll. Ezt a korrelácót a teljes évre vonatkoztatva s nagyon jól megfgyelhetjük. A keveredés réteg a napsugárzással s poztív korrelácóban áll, mely korrelácó főleg a másodk-harmadk-negyedk negyedévben fgyelhető meg, és 9/51

körülbelül egy hétg fenn s áll. Az első negyedévben csak egy-két napg fgyelhető meg ez a korrelácó. Tehát összességében elmondható, hogy magasabb keveredés réteg előfordulása esetén alacsonyabb páratartalom, kevesebb eső, nagyobb szélsebesség, magasabb hőmérséklet, erősebb napsugárzás következk. 4. ábra: a keresztkorrelácós teszt eredménye a keveredés réteg vzsgálatára. Bal felső grafkon: egész év, jobb felső grafkon: első negyedév, bal alsó grafkon: másodkharmadk negyedév, jobb alsó grafkon: negyedk negyedév. Szélsebesség A szél és a keveredés réteg magassága között poztív korrelácó fgyelhető meg (5. ábra), de csak az első, és a negyedk félévben, és csak az aznap, és az egy nappal később értékek között áll fenn. A szél és a páratartalom negatív korrelácóban áll egymással, de csak az első, és negyedk negyedévben, és ott s csak egy napg érvényes ez a megfgyelés. A szélsebesség és a napsugárzás poztívan korrelál, mely korrelácó egy napg érvényes, és csak a másodk, harmadk és negyedk negyedévben észlelhető. 30/51

A szélsebesség a légnyomással semmlyen összefüggésben nncs, valamnt a hőmérséklettel sem fgyelhető meg egyértelmű korrelácó. A negyedk negyedévre gaz, hogy a szélsebesség poztív korrelácóban áll az eső mennységével, tehát, ha erősebb a szél, általában utána négy-öt napg esős az dő. Összességében tehát megfgyelhető, hogy a nagyobb szélsebességet dőben a magasabb keveredés réteg, alacsonyabb páratartalom, erősebb napsugárzás követ. 5. ábra: a keresztkorrelácós teszt eredménye a szélsebesség vzsgálatára. Bal felső grafkon: egész év, jobb felső grafkon: első negyedév, bal alsó grafkon: másodkharmadk negyedév, jobb alsó grafkon: negyedk negyedév. Páratartalom A pára és a napsugárzás kapcsolatát két dőszakra bontva érdemes megfgyeln (6. ábra). Az első, másodk, harmadk negyedévben egy aznap negatív korrelácó látható, vszont ez pont fordítva gaz az utolsó negyedévre, ott ugyans egy erőteljes poztív korrelácó fgyelhető meg. A pára a légnyomással nem mutat összefüggést. 31/51

Az egész évet vzsgálva megfgyelhető, hogy a relatív páratartalom erős negatív korrelácóban áll a hőmérséklettel. Ez negyedévekre bontva már nemgen megfgyelhető, csak az utolsó negyedévben egy ks mértékben. A páratartalom az esővel poztívan korrelál, ez azonban csak az aznap értékekre vonatkozk, hosszabbtávú összefüggés nem kmutatható. A páratartalom és a szélsebesség között csak egy enyhe poztív korrelácó látható, de csak aznap adatokra, és csak az utolsó negyedévben. A páratartalom a keveredés réteg magasságával s poztív korrelácóban áll, mnt megfgyelhető, eme összefüggés az aznap, egy nappal, lletve két nappal eltolt adatokra s fennáll. Általánosságban tehát elmondható, hogy a párásabb levegővel egy dőben a nagyobb csapadékmennység jellemző, és a magasabb keveredés réteg, vszont a párás levegőt nem megjósolhatóan követk az dőjárás több tényezője, ez nkább fordítva gaz. 6. ábra: a keresztkorrelácós teszt eredménye a relatív páratartalom vzsgálatára. Bal felső grafkon: egész év, jobb felső grafkon: első negyedév, bal alsó grafkon: másodkharmadk negyedév, jobb alsó grafkon: negyedk negyedév. 3/51