Magyarország-Románia Határon Átnyúló Együttműködési Programból 2007 2013 támogatott projekt (Projekt regisztrációs szám: HURO/0801/047)



Hasonló dokumentumok
Vízminőségi adatok értékelési módszerei. Bagyinszki György

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Vízkémiai vizsgálatok a Baradlabarlangban

A Fertő tó magyarországi területén mért vízkémiai paraméterek elemzése többváltozós feltáró adatelemző módszerekkel

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Antal Gergő Környezettudomány MSc. Témavezető: Kovács József

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

A használt termálvíz elhelyezés környezeti hatásának vizsgálata

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6.

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

A leíró statisztikák

Kútvizsgálatok. Jákfalvi Sándor Geogold Kárpátia Kft.

Segítség az outputok értelmezéséhez

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Megbízó: Tiszántúli Vízügyi Igazgatóság (TIVIZIG) Bihor Megyei Tanács (Consiliul Judeţean Bihor)

Nemzeti Akkreditáló Testület. MÓDOSÍTOTT RÉSZLETEZŐ OKIRAT (1) a NAT /2012 nyilvántartási számú akkreditált státuszhoz

VIZSGÁLÓLABORATÓRIUM ÁRJEGYZÉK

c adatpontok és az ismeretlen pont közötti kovariancia vektora

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Korrelációs kapcsolatok elemzése

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

A Bodrog-folyó vízkémiai adatainak elemzése egy- és kétváltozós statisztikai

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

y ij = µ + α i + e ij

Magyar Norbert. Elsőéves doktori beszámoló , ELTE TTK Budapest

RÉSZLETEZŐ OKIRAT a NAH /2016 nyilvántartási számú akkreditált státuszhoz

BESZIVÁRGÓ VIZEK VIZSGÁLATA A BUDAI-HEGYSÉG EGYIK

[Biomatematika 2] Orvosi biometria

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Jelentés a Duna-Dráva Cement KFT Beremendi Gyár Nagyharsányi és Beremendi bányaüzemének területén üzemeltetett vízföldtani monitoringról

a NAT /2008 számú akkreditálási ügyirathoz

Kútvizsgálat a romániai projektterületen Általános és vízminőségi jel emzés

2003. ÉVI ADATOK ÉVI ADATOK 6/2009. h

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis


Regressziós vizsgálatok

A Gömör-Tornai-karszt vízrendszerének vizsgálata kémiai és matematikai módszerek felhasználásával

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

a NAT /2008 nyilvántartási számú akkreditált státuszhoz

15. LINEÁRIS EGYENLETRENDSZEREK

A Markowitz modell: kvadratikus programozás

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

A felszín alatti vizek

Korreláció és lineáris regresszió

Minták előkészítése MSZ : Ft Mérés elemenként, kül. kivonatokból *

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének

Vízminőség, vízvédelem. Felszín alatti vizek

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

11. Előadás. 11. előadás Bevezetés a lineáris programozásba

A maximum likelihood becslésről

Mérési hibák

MSZ 20135: Ft nitrit+nitrát-nitrogén (NO2 - + NO3 - -N), [KCl] -os kivonatból. MSZ 20135: Ft ammónia-nitrogén (NH4 + -N),

Talajvízszint idősorok vizsgálata statisztikai módszerekkel a 4-es metró építésének pesti területén A D J U N K T U S

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Adatok statisztikai értékelésének főbb lehetőségei

Biomatematika 2 Orvosi biometria

Diszkriminancia-analízis

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Kutatásmódszertan és prezentációkészítés

Függvények Megoldások

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Jelentés a Duna-Dráva Cement KFT Beremendi Gyár Nagyharsányi és Beremendi bányaüzemének területén üzemeltetett vízföldtani monitoringról

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Ivóvíz: kémia

S atisztika 2. előadás

STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Least Squares becslés

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Iskolai jelentés. 10. évfolyam szövegértés

Többváltozós lineáris regressziós modell feltételeinek

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

radionuklidokkal és többváltozós adatelemzési módszerekkel

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet

Környezetvédelem / Laboratórium / Vizsgálati módszerek

1. Homogén lineáris egyenletrendszer megoldástere

Nemzeti Akkreditáló Hatóság. RÉSZLETEZŐ OKIRAT a NAH /2016 nyilvántartási számú akkreditált státuszhoz

[Biomatematika 2] Orvosi biometria

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

A mintavételek időpontjait az 1. sz., a mintavételi helyeket a 2. sz táblázat tartalmazza. 1.sz. táblázat Mintavételi időpontok

A mérési eredmény megadása

Matematikai geodéziai számítások 5.

A rózsadombi megcsapolódási terület vizeinek komplex idősoros vizsgálata

KOVÁCS BÉLA, MATEMATIKA I.

Lossos László-TIKÖVIZIG November 19.

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Függetlenségvizsgálat, Illeszkedésvizsgálat

A HÉVIZI-TÓ KÉMIAI PARAMÉTEREI 2008

Átírás:

Magyarország-Románia Határon Átnyúló Együttműködési Programból 2007 2013 támogatott projekt (Projekt regisztrációs szám: HURO/0801/047) Kutatási program a Körös medence Bihar-Bihor területén, a határon átnyúló felszín alatti víztest hidrogeológiai viszonyainak, állapotának megismerésére (HURO) Dinamikus faktoranalízis és klaszteranalízis 2010. december

Jelentés Szerződés száma: 8608/26.07.2010 Projekt címe: Kutatási program a Körös medence Bihar-Bihor területén, a határon átnyúló felszín alatti víztest hidrogeológiai viszonyainak, állapotának megismerésére (HURO) Magyarország-Románia Határon Átnyúló Együttműködési Programból 2007 2013 támogatott projekt Munkafázis Teljesítés: Megbízó: Megbízott: Törvényes képviselő: Projektvezető: Készítette: Dinamikus faktoranalízis és klaszteranalízis 2010. december Consiliul Judeţean Bihor KSZI-Geogold Carpatin Kissné Jáger Erika Ambrus Magdolna Geogold Carpatin Srl. Dr. Kovács József

1. Tartalomjegyzék 1. TARTALOMJEGYZÉK 1 2. A FELHASZNÁLT MATEMATIKAI MÓDSZEREKRŐL 2 2.1. KLASZTERANALÍZIS (DÉVÉNYI D. - GULYÁS O, 1988 ALAPJÁN) 3 2.2. DISZKRIMINANCIA ANALÍZIS 5 2.3. WILKS Λ STATISZTIKA 5 2.4. BOX-AND-WHISKERS PLOT 6 2.5. DINAMIKUS FAKTORANALÍZIS (KOVÁCS J., 2007 ALAPJÁN) 6 3. FORRÁSOK PARAMÉTEREINEK VIZSGÁLATA TÖBBVÁLTOZÓS ADATELEMZŐ MÓDSZEREKKEL 9 3.1. CSOPORTOSÍTÁS A SZERVETLEN PARAMÉTEREKRE 10 3.2. CSOPORTOSÍTÁS A SZERVES PARAMÉTEREKRE 17 3.3. ÖSSZEFOGLALÁS 21 4. VÍZTERMELŐ KUTAK PARAMÉTEREINEK VIZSGÁLATA TÖBBVÁLTOZÓS ADATELEMZŐ MÓDSZEREKKEL 23 4.1. CSOPORTOSÍTÁS AZ ÖSSZES MÉRT PARAMÉTERRE 23 5. DINAMIKUS FAKTOR ANALÍZIS ALKALMAZÁSA BIHAR MEGYE TALAJVÍZSZINT KÚTJAIRA 34 5.1. A FELHASZNÁLT ADATOK 34 5.2. EREDMÉNYEK ÉS ÉRTÉKELÉSÜK A DINAMIKUS FAKTORANALÍZIS ALKALMAZÁSA A VIZSGÁLT TERÜLETEN 35 5.3. FAKTORSÚLYOK VIZSGÁLATA 38 5.4. ÖSSZEFOGLALÁS 41 6. FELHASZNÁLT IRODALOM 43 1

2. A felhasznált matematikai módszerekről A földtudományokban rendelkezésre álló és vizsgált adathalmazt egy négydimenziós térben (1. ábra) lehet elképzelni, ahol a tengelyeket az idő, a kémiai, vizsgált komponensek és a megfigyelési pontok adják. Utóbbit egy x és egy y koordináta, vagyis két dimenzió határoz meg, így bővül ki a három dimenzió az absztrakt négy dimenziós térre.(kovács, 2007; Kovács et al, 2008). Annak függvényében, hogy melyik tengelyt metszük el egy arra merőleges síkkal, más-más vizsgálati módszert kell alkalmazni. A tengelyeket metsző síkokat nevezzük el S1, S2 és S3 síknak. S1 síkban (ilyen adatok voltak a vízkémiai paraméterek) többváltozós adatelemző módszerek alkalmazására van lehetőség. A mintavételi pontok hasonlóságát klaszteranalízissel vizsgáltuk, a csoportok létezésének ellenőrzésére diszkriminancia analízist is alkalmaztunk. S2 sík esetén az adott paraméter idősorát kaptuk meg mintavételi helyenként. Itt nyilvánvalóan idősoros vizsgálatok elvégzésére van lehetőség, ezek közül említhetőek a trend, periódus és zaj elemzésére vonatkozó módszerek. Ezek a klasszikus módszerek azonban céljainknak nem feleltek meg, ezért ebben az esetben egy célorientált és modern eszközt, a dinamikus faktoranalízist alkalmaztuk. Végül S3 síkban egy kiválasztott mintavételi helyen a paraméterek idősorai elemezhetők idősoros vizsgálatokkal. Ilyen irányú vizsgálatokra a kutatás céljainak megvalósításában, nem volt szükség. Kémiai komponensek z CO 3 2- NO 3 - Cl - S 2 Na + t 4 t 3 Mg 2+ Ca 2+ t 1 t2 mf1 (x, y ) 1 1 mf2 (x, y ) 2 2 S 3 mf3 (x, y ) 3 3 mfn (x, y ) n n Megfigyelési pontok S 1 Idő t t n 1. ábra. Adathalmaz ábrázolása négy dimenzióban (Kovács, 2007) 2

2.1. Klaszteranalízis (Dévényi D. - Gulyás O, 1988 alapján) A térben lévő mintavételi pontok hasonlóságának meghatározására a klaszteranalízis alkalmazható ahol minden paramétert azonos súlytényezővel vettünk figyelembe. A klaszteranalízis eredményét dendrogramokon kaptuk meg, és térképen ábrázoltuk (2. ábra), ahol az azonos csoporthoz tartozó mintavételi pontokat azonos geometriai alakzattal jelöltük. A klaszteranalízis talajvízszintekre történő alkalmazását Yakowitz mutatta be először 1976-ban a Vízgazdálkodási Intézet és az Arizonai Egyetem közös kutatási programja keretében. Hazánkban felszínalatti vizek vízszint- (Kovács, 2007), vízkémiai- (Kovács et al., 1997, 1998) és felszíni vizek paramétereinek idősoraira (Kovács, 2005; Kovács et al., 2008) használták nagy hatékonysággal. A klaszterezés felfogható egy kódolási műveletként, amely során a sok jellemzővel leírt bonyolult objektum egy számmal, csoportjának kódjával (klaszterének számával) jellemezhető. Ez a kód a csoportba tartozó objektumok általános és közös tulajdonságait tükrözi, azaz az egy csoportba tartozók hasonlóak. Ezeket a csoportokat klasztereknek nevezzük. A továbbiakban az objektumok összességét X-szel, az egyes osztályozandó objektumokat X i -vel jelöljük, azaz X={X1,X 2,...,Xn}, ahol n az objektumok száma. Feltételezzük, hogy az egyes objektumok N-dimenziós vektorok, X i ЄR N, Xi= {Xi1,Xi2,...,Xin}, vagyis az objektumokat tulajdonságaik, jellegük valamilyen számszerűsíthető értékeinek sorozatával definiáljuk. X i gyakran egy valószínűségi vektorváltozó mintájának i-edik eleme (vagy annak is felfogható). Azoknak az osztályoknak a számát, amelyekbe az {X i } objektumokat csoportosítani kívánjuk, M-mel jelöljük. Mindegyik C i klaszter az objektumnak egy részhalmazát tartalmazza: Ci = { Xi1, Xi 2,..., Xi Ci }. Itt és a továbbiakban C i jelöli az i-edik klaszterben lévő objektumok számát. Azt, hogy egy X j objektum i-edik klaszterbe tartozik, X j ЄC i -vel jelöljük. Az osztályok (klaszterek) az X-be tartozó valamennyi objektumot tartalmazzák, azaz valamely objektum egy és csakis egy klaszterbe tartozhat. Vagyis {C 1, C 2,..., C M } klaszterek rendszere az X objektumösszesség egy felbontása; X U M Ci i= 1 = és C i Cj = 0, ha i j. Rögtön észrevehető, hogy egy X objektumrendszerhez általában számtalan klasztercsoportot lehet rendelni. A hasonló objektumok egy klaszterbe tartoznak, a különböző tulajdonságúak pedig nem tartoznak ugyanabba a klaszterbe. A hasonlóság mérésére a metrikát alkalmazzuk. A metrika (távolság) két objektumhoz (N-dimenziós vektorhoz) egy nemnegatív számot rendel, azaz : : R N R N R + úgy, hogy (x, y) szimmetrikus, nemnegatív függvény, és igaz rá a háromszögegyenlőtlenség. Ha kicsi, akkor azt mondjuk, hogy a két objektum hasonló, amennyiben zérus, akkor azonos is. Ha nagy, akkor a tulajdonságaik eltérésére mutat, és az objektumok nem hasonlók. Munkánk során a klaszterezés módszerei közül az úgynevezett hierarchikus osztályozást alkalmaztuk, ami kezdetben minden elemet külön osztálynak tekint, majd az osztályok összevonásával lépésről lépésre újabb osztályozási szinteket alakít ki mindaddig, amíg az összes elem egyetlen osztályba nem kerül. 3

Az osztályozási algoritmus eredménye olyan fa-struktúrával jelenik meg, ahol a fa csomópontjaihoz h Є [0, max d(a, B)] értékek tartoznak. Az elmondottakat egy egyszerű példán keresztül mutatjuk be, ahol az egész számok objektumokat reprezentálnak. Az S-nek egy adott partíciója a fa-struktúra egy h szintjéhez tartozik, a sorozat első eleme az izolált pontok halmaza, az utolsó pedig az összes objektumból álló halmaz. Az ilyen típusú fa-struktúrát dendrogramnak nevezzük (2. ábra). h 4 h 3 h 2 h 1 1 2 4 7 8 h 0 2. ábra: dendrogram A különböző klasszifikáló módszerek minden esetben valamilyen osztályozást létesítenek az objektumok összességében. A kapott osztályozást többféle szempont szerint minősíthetjük. 1. Ahhoz, hogy két osztályozás összehasonlítható legyen, szükséges (de nem elégséges) feltétel, hogy az osztályok megfeleltethetők legyenek egymásnak, abban az értelemben, hogy a megfelelő osztályokba ugyanannyi objektum tartozzon. 2. A klasszifikációs módszerektől megköveteljük, hogy az eredmény független legyen a kiinduló osztályozástól. Egy további gyakori követelmény, hogy a módszer a lineáris transzformációkkal szemben invariáns legyen, azaz ha az x 1,..., x n pontok helyett az ax 1 +b,..., ax n +b pontokra alkalmazzuk az eljárást, az eredmény ne változzon. A hierarchikus csoportosító módszerek közül Ward csoportosító eljárását alkalmaztam, aki abból az információveszteségből indult ki, amely a megfigyelések csoportokba történő összevonásából ered. Ezt az információveszteséget úgy definiálta, mint a megfigyelések csoportátlagoktól való eltérési négyzetének összegét. Jelöljük T-vel a teljes mintaeltérés négyzetösszegét. Ekkor érvényes a következő felbontás: T = B + K g n g i i 2 2 xij x) = ( xij xi) + 2 ( n ( x x),, ahol i= 1 j= 1 i= 1 j= 1 i 1 n B a csoporton belüli eltérések négyzetösszege, K a csoportok közötti eltérések négyzetösszege, g a csoportok száma, n i az i-edik csoport elemszáma, x ij az i-edik csoportba tartozó j-edik megfigyelés, x i az i-edik csoport átlaga, x a teljes minta átlaga. g i i 4

Adott mintánál a T egyértelműen meghatározott. A B és K a csoportosítástól függően változik. A cél olyan csoportosítás létrehozása, ahol B minimális. Az algoritmus a következő lépésekre bontható: - n számú csoporttal kezdjük, akkor minden csoport egyelemű, így B = 0; - azt a két csoportot vonjuk össze, amely esetén B minimálisan növekszik; - a második lépést mindaddig folytatjuk, amíg egyetlen csoportot nem kapunk. A Ward-technika fogyatékossága, hogy nem adja minden esetben a B minimális értékét. Így előfordulhat, hogy a háromcsoportos felbontás minimális értéket adó változata a következő lépésben, két csoport esetén lesz optimális. 2.2. Diszkriminancia analízis A klaszteranalízis által meghatározott csoportok létezéséről meg kell győződni. Hipotézisvizsgálatként diszkriminancia analízist használtunk. Ezzel tudtuk ellenőrizni, hogy a mintavételi pontok csoportba tartozása valós-e, és ha igen, ez hány százalékban valósítható meg az adott független változókkal. E független változó metrikus-, míg a függő (csoportosító változó) nem metrikus, hanem általában kategorizált skálán mért. A csoportosító változó elnevezés onnan ered, hogy ez a változó lesz a csoportosítás alapja. A diszkriminancia analízis matematikailag arra keresi a választ, hogy a létrehozott csoportok mely változók alapján különböznek, azaz a csoportokba való tartozás előre jelezhető-e a független változók egy kiválasztott csoportja alapján. A regresszió elemzés egyenlete sokban hasonlít a diszkriminancia analíziséhez, de míg az első esetben a függő változóra adunk becslést, addig a második esetben arra, hogy az adott megfigyelés a csoporthoz tartozik-e, vagy sem. A klaszteranalízis (melynek ellenőrzésére a diszkriminanciaanalízist alkalmaztuk) és a diszkriminanciaelemzés közös vonása, hogy mindkét esetben csoportokat alakítunk ki, csak míg az első esetében ezek a csoportok előre nem adottak, addig a második esetben a csoportok előre adottak és a vizsgálat célja, hogy meghatározzuk a független változók azon lineáris kombinációját, ami a legjobban elkülöníti a csoportokat. 2.3. Wilks λ statisztika A felszín alatt zajló folyamatok jellegéből következik, hogy vannak olyan paraméterek, amelyek nagyobb-, és vannak, amelyek kisebb mértékben befolyásolják a hidrogeológiai folyamatokat, a kőzet víz kölcsönhatást stb., fontos információ annak ismerete, hogy mely paraméterek hogyan határozták meg a mintavételi pontok csoportba tartozását. Erre a alkalmas módszer a Wilks λ statisztika becslése. Ezt a statisztikát a csoportátlagok azonosságának tesztelésére alkalmazzák. A λ számított értéke a csoportokon belüli és a teljes eltérések négyzetösszegeinek hányadosa: Wilks λ = 2 ( xij xi ) i j 2 ( xij x) i j Ha a kapott λ érték egyenlő 1-el (λ=1) akkor a csoportok átlagai nem különböznek, tehát a vizsgált paraméter nem befolyásolta a csoportok alakulását. Ha a kapott λ érték egyenlő 0-val (λ=0) akkor a paraméter maximálisan befolyásolta a csoportok alakulását. Összegezve, a vizsgált paraméter λ értéke minél inkább egyhez közeli az annál kevésbé befolyásolja a csoportok alakulását. 5

2.4. Box-and-whiskers plot A klaszteranalízissel meghatározott csoportok statisztikáit mint fontos információkat - úgynevezett box-and-whiskers plot-okon mutatjuk be. Ezek a diagramok az adatok statisztikai megjelenítésének egyik eszközei. Segítségükkel valószínűségi változók több paraméterét ábrázolhatjuk egy ábrán, ezzel megkönnyítve az értelmezést (3. ábra). 3. ábra: Box-and-whiskers plot A box-ok (dobozok) felső és alsó határa között az interkvartilis terjedelem található (felső és alsó kvartilis különbsége). A doboz felső határa a felső, alsó határa pedig az alsó kvartilist jelöli. A fekete vízszintes vonal a dobozon belül a medián 1. A doboz tetejéből és aljából kiálló függőleges vonal végpontjai a 1,5-szeres interkvartilis terjedelmet adják meg. Ha a kapott érték a 1,5-3-szoros interkvartilis terjedelmen belül van, akkor kiugró értéknek tekintjük (jele: ), míg ha a 3-szoros interkvartilis terjedelmen is kívül esik, akkor extrém értéknek vesszük (Sajtos és Mitev 2007). A dinamikus faktor analízis eredményeinek azonosításakor felhasználjuk a korrelációszámítást, aminek célja a valószínűségi változók lineáris kapcsolatának, kapcsolatuk intenzitásának és irányának mérése. A korrelációs együttható a sztochasztikus kapcsolatok szorosságának mérésére szolgáló dimenzió nélküli mérőszám, értéke -1 és 1 között változhat. A korreláció alatt az egyszerű korrelációs együttható két vizsgált változó kovarianciájának 2 a két változó szórásával normált értékét értjük (jele: r). Ha r = 1, a két paraméter pozitív, lineáris, függvénykapcsolat van, ha r = -1, negatív, míg ha r = 0 nincs lineáris kapcsolat közöttük, így a két paraméter korrelálatlan. 2.5. Dinamikus faktoranalízis (Kovács J., 2007 alapján) A vizsgált területen a sekély felszínalatti víz természetes vízszintingadozásait, nagy területre változások érték. Ennek okai lehetnek természetesek (csapadék idő és térbeli eloszlásának változásai) illetve mesterségesek (vízkitermelés). Ezek hatása érezhető. A meglévő 1 A medián az az érték, amely alatt illetve felett helyezkedik el a mért értékek 50%-a. A kvartilisek ugyanezt jelentik azzal a különbséggel, hogy a 25%-os alsó kvartilis jelenti azt az értéket, ami alatt illetve felett helyezkedik el a mért értékek 25, illetve 75%-a. A felsõ kvartilis esetén pedig ez alatt illetve felett helyezkedik el a mért értékek 75, illetve 25%-a. 2 Két különböző változó együttmozgását adja meg, de értéke lehet (attól függően, hogy eloszlású valószínűségi változókról van szó) tetszőleges valós szám. Tehát, a sztochasztikus kapcsolat szorosságára nehéz lenne követeztetni. Célszerűbb egy olyan együtthatót választani, ami meghatározott kereteken belül mozoghat.(=korrelációs együttható) (Reimann- V. Nagy 1984) 6

determinisztikus modellek mellett, az idősoros vizsgálati módszerek lehetőséget adnak a hatótényezők sztochasztikus értelmezésére is. Nem nyilvánvaló, miként lehet meghatározni egy adott megfigyelési ponton például a vízkiemelés hatását, különösen, ha figyelembe vesszük a csapadékból származó utánpótlódás véletlen jellegét. A vízszintingadozások alapjául szolgáló rejtett háttérhatások meghatározásának hagyományos eljárása a faktoranalízis. Mivel ez független megfigyelésekre kidolgozott módszer - ami viszont a vízszint idősorok esetében nem áll fenn, hiszen azok dinamikus szerkezetét figyelembe kell venni faktoranalízis helyett a dinamikus faktoranalízist kell alkalmazni. E megfontolások alapján kialakítható volt egy valószínűségelméleten nyugvó matematikai modell. Az egyes megfigyelő kutak által biztosított adatok időfüggő véletlen mennyiségek megfigyeléseinek, méréseinek tekinthetők, s így az egyes kutak hidrográfjai felfoghatóak sztochasztikus folyamatok realizációiként. Az egyes megfigyelési pontokhoz (kutakhoz) tartozó folyamatok azonban nem önmagukban álló, egymástól független jelenségek, hanem egy és ugyanazon természeti jelenség különböző lokális körülmények közötti megnyilvánulásai. Ezért természetes ezeket a folyamatokat összefogva egyetlen többdimenziós folyamat komponenseiként szemlélni, mely komponensek természetesen valószínűségelméletileg összefüggőek. Hangsúlyozni kell azonban, hogy ez az összefüggés térbeli szerkezethez kötött, és ekkor az adatok egyetlen egydimenziós, de téridő-függő sztochasztikus folyamat megfigyeléseként interpretálhatóak, azonban jelen munkánkban nem ezt a megközelítést tartjuk célravezetőnek. A térbeli függésről azt feltételezzük, hogy a különböző helyeken megfigyelt folyamatok ugyanazon néhány látens hatás például párolgás, beszivárgás, vízkiemelés - befolyása alatt állnak, és csupán e hatások intenzitása függ a helytől. Így először ezen hatások identifikálása, majd pedig intenzitásuk térbeli eloszlásának becslése a célunk. A következőkben az általunk használt dinamikus faktor-modell rövid leírására kerül sor. Egy szokásos faktor-modell egyenlőség: Y = A F + ε (1) azt fejezi ki, hogy az Y megfigyelés úgy áll elő, mint néhány látens hatásnak (a faktorok F vektora) az A mátrix által meghatározott lineáris kombinációjához adódott véletlen zaj (ε) eredője. A megfigyelhető idősorok száma általában jelentősen nagyobb, mint a faktorok száma, így a faktormodell alkalmazása egyfajta dimenzió redukciót jelent. A dinamikus faktormodellek esetén figyelembe vett döntő különbség az, hogy mind a megfigyelések, mind a faktorok empirikus idősorok, s nem az általános modelleknél feltett független megfigyelések. A modell leírásának teljessé tételéhez a faktorok dinamikus szerkezetét pontosabban meg kell adni. Mindenek előtt az A-mátrix révén adott lineáris transzformációnak időtől függetlennek kell lennie. A megfigyelések időfüggőségét hangsúlyozandó, t függvényeként írjuk őket: Y(t) = (Y 1 (t),,y N (t)), 0 t T. és ezen N-dimenziós idősor gyenge stacionaritását is feltételezzük eltekintve egy lehetséges lineáris trendtől. Ezzel a rendszert - trendtől eltekintve stabilnak, azonos valószínűségi törvényszerűséget követőnek tételezzük fel az időben. Így (1) új formája az alábbi: Y ( t) = A F( t) + ε( t). (2) melyben az A-mátrix N M tagú és determinisztikus. A faktor idősor F(t) ennek megfelelően M dimenziós - M<<N - és ugyancsak gyengén stacionáriusnak, továbbá komponenseit korrelálatlanoknak feltételezzük. F () t = ( F () t,..., F () t ), 0 t T, 1 M 7

Végezetül az egyenletben szereplő ε () t = ( ε () t,..., ε () t ), 0 t T. 1 N egy N dimenziós Gauss fehér zaj. Jegyezzük meg itt, hogy ha a faktor is Gauss folyamat, akkor a modell linearitása miatt a megfigyelések is Gauss-folyamatok lesznek, és a gyenge stacionaritásból az erős is következik. Az F(t) faktorok bizonyos értelemben véve optimális becslésének megtalálására törekszünk: Fˆ ( ) () t = Fˆ () t,..., F ˆ () t 1 Modellünk becslésének a következő három, természetes követelményre kell összpontosítania: (i) A faktorok becslésének a megfigyelések idő-független homogén, lineáris transzformációinak kell lenniük. F ( t) = B Y( t) (3) (ii) Az F j (t) faktor idősor-komponenseknek múltbeli viselkedésük alapján lineárisan jól előrejelezhetőknek kell lenniük. E követelmény biztosan teljesül, ha azokat L j rendű autregressziós folyamatoknak tekintjük, egy konstanst is megengedve az autoregresszióban, a lineáris trend leírására: F j L j () t= c + c F( t k) + () t M j, 0 j, k j δ j (4) k= 1 Ebben az egyenletben a δ j (t)-k Gauss fehér zajok, függetlenek egymástól és ε(t)-től. Az autoregresszió választását nem csak egyszerű dinamikus szerkezete indokolja, hanem az a tény is, hogy a megfigyelőkutak hidrográfjai egyébként megbízhatóan modellezhetők autoregresszív folyamatokkal. (iii) A faktorok időfüggetlen lineáris transzformációja Yˆ ( t) = D Fˆ ( t) (5) az Y(t) megfigyelések jó becsléseit kell eredményezze ezeket faktor-prediktoroknak nevezzük. A modell-becslés folymatában feltesszük, hogy a látens faktorok előírt szerkezete ~ átörökítődik becsléseikre is, és ennek megfelelően t az alábbiak szerint kapható meg: ~ F j L j () t = c + c Fˆ ( t k) j,0 k= 1 j, k j Fˆ (t) legjobb empirikus előrejelzése, ( ) Másként szólva, ez épp a becsült faktorok behelyettesítése az autoregresszió legjobb előrejelzésébe. A valós értékek természetesen nem ismertek, így a c j,k együtthatókat becsülni kell. Ennek következményeképp a behelyettesítésre nem garantálható a (6) által adott előrejelzés optimalitása, mert ez egy autoregresszív folyamatra csak ismert együtthatók esetén teljesül. Ennek tudatában fogjuk a (6) kifejezést használni a becsült faktorok F ~ ( t) időbeli előrejelzésére. Így a faktorok megfigyelésekből becsült értékének és előrejelzésének különbsége kiszámítható minden t időpillanatra, 0 t T, és ezt centrálva a (4) autoregressziós folyamatot generáló zaj becslését kaphatjuk meg: δ ˆ j ~ ~ () t = F () t Fˆ () t [ F Fˆ ] j j j j j (6) F j 8

T 1 (Bármely X(t) esetén X jelöli az időátlagot: X = X() t.) A δ j (t)-k idő szerinti + 1 T t= 0 négyzetösszegét nevezzük az E (d) becsült dinamikus hibának: E (d) δ ˆ () t T = M j= 1t= Lj Hasonlóan, az (5) kifejezésben meghatározott faktor prediktor értéke teszi lehetővé, hogy a (2) kifejezés zajának, ε(t)-nek becslését előállítsuk, mint a ténylegesen megfigyelt értékek és a faktor-prediktorok centrált (0 várható értékű) különbségét: ε ˆ t = Y t Yˆ t Y Yˆ, i () i () i () [ i i ] j 2 melynek idő szerinti négyzetösszege E (s) a becsült statikus hiba: N E (s) = () t T i= 1 t= 0 2 ˆε i. Amennyiben egyik vagy másik megfigyelés jelentősége hagsúlyozottabb, vagy egyik vagy másik előrejelzés pontossága fontos szempont, úgy e cél eléréséhez mind a dinamikus, mind a statikus hiba definíciójába súlyokat éptíthetünk be. Mivel ezzel a lehetőséggel a továbbiakban nem kívánunk élni, ezért ennek formális leírásától e helyen eltekintünk. Az előírt (i)-(iii) követelményeket teljesítendő, a modell becslését akkor tekintjük jó - nak, ha a becsült statikus és dinamikus hibák összege minimális. Ez a következő függvény minimalizálását jelenti: N E (s) +E (d) 2 =Ψ( T) = ˆ () t + δˆ () t T M i i= 1 t= 0 j= 1 t= 0 T j 2 ε (7) az alábbi, a faktorok korrelálatlanságára tett feltételezésből származó megszorítás mellett: var( Fˆ ) = I M (8) 3. Források paramétereinek vizsgálata többváltozós adatelemző módszerekkel A vizsgált területen (Béli-hegység, Királyerdő, Réz-hegység, Tasádi-dombság) 133 forrásból vett vízmintáknak számos kémiai és fizikai paramétereire történt helyszíni és laboratóriumi vizsgálat. Ezek többsége szervetlen paraméterekhez kapcsolódik, de voltak olyanok melyek valamilyen módon szerves anyagokhoz kapcsolódnak illetve kapcsolhatók. 9

Ennek megfelelően, vizsgálataink alapvetően kétféleképpen végezhetők el. Az egyik - a szervetlen környezetre utaló - paraméterekre (ph, vas, mangán, nátrium, kálium, magnézium, klorid, hidrokarbonát, szulfát), míg a másik a szerves környezetre utaló paraméterkörrel (ammónium, nitrit, nitrát, KOI). Fontos megjegyeznünk, hogy számos olyan paraméter volt, amelyek mért értékei kimutatási határ alatt voltak. Ezeket a csoportosítás során a kimutatási határérték felével vettük figyelembe. Mielőtt adatelemző módszerekkel csoportosítást végeznénk, meg kell néznünk, hogy a négy különböző területről vett minták a terület függvényében milyen mértékben alkotnak csoportokat, hiszen a mintázott területek különböző földtani helyzetben vannak, így lehetséges, hogy a kémiai paraméterek alapján mintáink elkülönülnek annyira, hogy ez a területi elkülönültség elegendő további vizsgálatok céljaira. A választ diszkriminancia analízis alkalmazásával kaptuk meg, miszerint, ha a csoportosító változónak azt a területet jelöljük meg, ami a minta származási helye, akkor a csoportosítás csak 81,2%-ban helyes. Más szavakkal a minták egy ötöd része olyan helyzetben van, hogy térbeli elhelyezkedésének viszonyai nem határozzák meg egyértelműen kémiai paraméterei alakulását. Ebből az eredményből következik, hogy a mintavételi pontokat matematikai eszközökkel csoportosítsuk, határozzuk meg az egyes csoportok jellemző tulajdonságait és térbeli elhelyezkedését. 3.1. Csoportosítás a szervetlen paraméterekre A csoportosítást klaszteranalízissel végeztük, helyességét diszkriminancia analízissel javítottuk és ellenőriztük. A számítások végeredményeként, a források 100%-át sikerült matematikai értelemben helyesen csoportba sorolni, amellett, hogy a keresztellenőrzés 90,9%- volt. Ez azt jelenti, hogy adatelemzési szempontból lehet néhány olyan mintavételezési pont, aminek elhelyezkedése nem a megfelelő csoportban van. Kilenc csoport elkülönítésére került sor. A 9-es számú csoport, ami egyetlen mintavételi pontot tartalmazott, a klaszterezési eredményen is jól látható volt, hogy az rendkívül távol helyezkedett el a többi csoporttól. Ez a tény előre vetíti, hogy ez a mintavételi pont valószínűsíthetően több paraméter esetében jelentősen különbözik a többi forrástól. Kérdésként merül fel, hogy melyek voltak azok a paraméterek, amelyek jelentősebb mértékben szóltak bele a csoportok kialakulásába. Ezt mutatja be a Wilks' Lambda statisztika (1. táblázat). 10

vastartalom (mg/dm3) 0.006 magnéziumion tart. (mg/dm3) 0.210 hidrokarbonát-ion tart. (mg/dm3) 0.244 nátriumion tart. (mg/dm3) 0.259 mangán tartalom (mg/dm3) 0.289 kalciumion tart. (mg/dm3) 0.297 szulfátion tart. (mg/dm3) 0.300 kloridion tart. (mg/dm3) 0.339 ph 0.376 káliumion tart. (mg/dm3) 0.618 1.táblázat: Wilks' Lambda statisztika A Wilks' Lambda statisztika értékek azt mutatják, hogy mindegyik bár mértékében különböző vizsgálatba bevont paraméter jelentős szerepet töltött be a csoportok kialakításában, legkevésbé a kálium tartalom befolyásolja a csoportok kialakulását, azzal együtt, hogy 0,61 Wilks' Lambda statisztika értéke nem nagy, távol van az egytől, tehát még ez a paraméter is jelentős befolyással bír. Megjegyzendő, hogy a vastartalom a vizsgált területen fellelhető laterites képződményekből származik. Az egyes csoportokban helyet foglaló minták darabszámát és a csoportokon belül a mintázott területek arányát a 2. táblázat, míg a csoportok összetételét a területek százalékában a 3. táblázat mutatja be. Csoport száma A csoportban levő mintavételi pontok száma Királyerdő (%) Tasádi-dombság (%) Réz - hg. (%) Béli - hg. (%) 1 31 90.3 9.6 2 44 86.3 6.8 6.8 3 28 53.5 28.5 17.8 4 2 100 5 3 33.3 66.6 6 8 62.5 25 12.5 7 4 75 25 8 12 8.3 8.3 16.6 66.6 9 1 100 2.táblázat:A csoportokban helyet foglaló minták darabszáma és a csoporton belül a mintázott területek aránya. 11

Csoport összetétele a mintázott területek %-ában Csoport száma Királyerdő Tasádi-dombság Réz - hg. Béli - hg. 1 32.2 14.3 2 43.7 14.3 14.3 3 17.2 38.1 23.8 4 2.3 5 25 9.5 6 50 23.8 4.8 7 3.4 4.8 8 1.1 25 9.5 38.1 9 4.8 3.táblázat: A csoportok összetétele a területek százalékában A táblázatok tanúsága szerint 4 nagyobb csoport van, ezekben foglal helyet a mintázott pontok több mint 80 %-a. A legtöbb minta Királyerdőből származik. A csoport összetételek a mintázott területek százalékában c. összeállításból kiderül, hogy a királyerdei minták gyakorlatilag az első három, a Réz és a Béli hegység mintái szétszórtan, míg a Tasádidombságban vett négy minta három csoportban foglal helyet. A 3. táblázat kissé más megvilágításba helyezi a csoportok jellemző összetételét. Kiderül, hogy az 1. és 2. csoportot királyerdei minták jellemzik, nem elhanyagolható mennyiségű Réz- és Béli hegységbeli mintákkal. A Béli hegység legjellemzőbb csoportjaként a 8-ast, míg a Réz-hegység legjellemzőbb csoportjaként a 3-as csoport jelölhető meg. Az egyszerre figyelembe vett, több paraméter által kialakított csoportok box-whisker s ábráit paraméterenként érdemes áttekinteni, de mivel a csoportok által lefedett területek nem esnek egybe a földrajzi területekkel, célszerű minden paraméter esetére kettő box-whisker s ábrát megtekinteni. Az egyiket területi, míg a másikat a klaszteranalízis eredménye alapján. Itt jegyezzük meg, hogy a területek elnevezése nem fért ki az ábrára ezért azokat számokkal láttuk el. 4/a-b. ábra: 1: Béli hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (ph) Az összes mintában a négy területen, az átlagos ph tartalom 7.27 (4/a-b. ábra). A Rézhegységben mérték a legkisebb értékeket. A medián nem a dobozok közepén helyezkedik el, ami azt jelenti, hogy a ph értékek nem normális eloszlásúak. Két terület adatai tartalmaznak 12

kiugró értékeket, darabszám szerint többet a Királyerdő, kettő darab extrém értékkel. A sokváltozós adatelemzéssel kapott csoportosítás más képet mutat, jelentősen differenciálja a csoportokat ph szerint. Így fordulhat elő, hogy az 1. (leginkább királyerdei minták) és 8-as csoportban (vegyes összetételű csoport, sok Béli-hegységbeli mintával) a ph mediánja 7.8 körüli. A 4. csoport, mely kettő darab királyerdei minta, mediánja a legkisebb (6.) 5/a-b. ábra: 1: Béli hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (Mangán koncentráció) Az 5/a-b. ábrákon visszatükröződik, hogy a minták jelentős részénél (81%) a kimutatási határ alatt voltak a mangán koncentráció értékek, néhány, statisztikai értelemben kiugró és extrém érték mellett, melyek mind a három hegység területén jelentkeznek. A csoportosítás nyomán látható, a 4. csoport két királyerdői valamint az 5. csoport, elsősorban Réz-hegységi mintáinak emelkedettebb koncentráció tartalma. A királyerdei minták nagyobb részét tartalmazó 1., 2.és 6. csoport gyakorlatilag csak kimutatási határ alatt tartalmazott mangánt, hasonlóan a sok Béli-hegységbeli mintát magába foglaló 8 csoporthoz. A 9. csoport (Réz-hegységbeli, R-21 minta) a mangán esetében is kiemelkedően magas mangán tartalommal bír. 6/a-b. ábra: 1: Béli hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (Nátrium ion koncentráció) A nátrium ion koncentrációjára vonatkozóan (6/a-b ábrák) területi vonatkozásban a Rézhegység és a Tasádi-dombság mutatja a legnagyobb koncentrációt, míg a legkisebbeket a Királyerdei minták mutatják, bár ez utóbbi több kiugró illetve extrém értéket is tartalmaz, aminek részben oka, hogy az interkvartilis terjedelem egyébként a legszűkebb, és a medián 13

értéke is nagyon alacsony. Egyértelműen kijelenthető, hogy a legalacsonyabb Na koncentrációval a Királyerdei minták bírnak, innen származik az a 13 darab minta is, amelyek Na ion koncentrációja kimutatási határ alatt van. A Béli-hegység mintái is kisebb koncentrációt mutatnak, de van kettő minta, ami a hegységet jellemző koncentrációtól jelentősen eltér (B-7 kiugró, B-3 extrém értékkel). A klaszter analízis alapján egy kissé differenciáltabb képet kapunk. Az első négy csoport, melyek főleg királyerdei mintákból állnak, illetve azok vannak még e csoportokban a Béli-hegységből illetve a Réz-hegységből, amelyek alacsony (általában 5 mg/dm 3 alatti) Na koncentrációval bírnak. Szintén alacsony a koncentráció tartalom a 7. és a 8. csoportok esetében, a Béli-hegység illetve a Réz-hegység alacsonyabb Na koncentrációjú mintái találhatók meg itt. Az 5. és a 6. csoportoknak magasabb a Na koncentráció tartalma. Az 5. csoport csak Tasádi-dombsági illetve Réz-hegységi mintákat tartalmaz. A 6-os számú csoport mintáinak nagyobb része (5 darab), pedig a Királyerdő emelkedettebb Na koncentrációjú mintái közül kerül ki. 7/a-b. ábra: 1: Béli hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (Kálium tartalom) A kálium tartalom általában nagyon alacsony. Egyetlen minta kivételével (Királyerdő, Ke- 22, 8.69 mg/dm 3, 7/a-b. ábrák) 4 mg/dm 3 alatti mért érékeket találunk. A mintavételezett területek közül a Tasádi-dombság vett 4 darab minta nagyobb koncentráció mutat a többihez képest (7/a-b. ábrák), így lehetséges, hogy az egyéb területeken a kálium alacsonyabb, mint 2 mg/dm 3 értékeket mutat. A klaszterezéssel meghatározott csoportok sem mutatnak jelentős eltéréseket, kivéve a 4 számú csoportot, ami összesen kettő darab királyerdei mintából áll, amiből az egyik az előbb már említett Ke-22, míg a másik Ke-12 (1.54 mg/dm 3 értékkel). 14

8/a-b. ábra: 1: Béli hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (Kálcium ion koncentráció) A kalcium ion vonatkozásában, az egyes területekre vonatkozóan a Béli-hegység mintái általában a legkisebb és a Tasádi-dombság levő minták koncentráció tartalma a legnagyobb (8/a-b. ábrák). A csoportosítási eljárás alkalmazásaként árnyaltabb és változatosabb képet láthatunk. Ezt az elég kicsi Wilks' Lambda statisztika érték is mutatja (0.29). Fontos eredménynek tűnik, hogy a kalcium tartalom szempontjából a főleg Királyerdei mintákat tartalmazó 1. és 2. csoport között jelentős különbségek vannak. A legmagasabb mért értékeket is itt találjuk (Királyerdő, Ke-18, 147 mg/dm 3 illetve Királyerdő, Ke-25, 195 mg/dm 3 ). Legalacsonyabb a Ca + tartalom a 3. (28 darab minta) és a 4. (2 darab királyerdei minta) csoportokban. Ezek közül a 3-ikban mintegy 15 a Királyerdőből származik, igen alacsony kalcium koncentráció tartalommal. A 6., 7., 8. csoportok koncentráció tartalma az 1. és a 2. csoport közé esik. 9/a-b. ábra: 1: Béli hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (Magnézium ion koncentráció) A magnézium esetében a Királyerdő mintáinak van legkisebb koncentrációja, több kiugró és extrém érték mellett (9/a-b. ábrák). A Tasádi-dombságban vett minták lényegesen nagyobb koncentráció tartalommal bírnak. A Béli és a Réz hegység mediánja közel egyező 9-10 mg/dm 3. A Wilks' Lambda statisztika érték mutatja (0.21), hogy ez az ion a második legfontosabb csoportképző paraméter. Az első 4 csoport alacsonyabb (a minták túlnyomó részénél 5mg/dm 3 alatti) míg a többinél ettől magasabb értékeket találunk, míg 9. csoport (Réz-hegységből, R-21 minta) a magnézium esetében is kiemelkedően magas értékekkel bír. 15

10/a-b. ábra: 1: Béli hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (Klorid ion koncentráció) A klorid ion tartalom (10/a-b. ábrák) gyakorlatilag minden területen kisebb mint 15 mg/dm 3. Legnagyobb a Tasádi-dombságban levő négy mintában, míg Királyerdőben a minták 50% 2 mg/dm 3 koncentráció tartalommal bír. Ennek oka, hogy a kimutatási határ alatt levő 11 darab minta is innen származik. A klorid ion koncentrációja a Béli- (5 mg/dm 3 alatti) és a Rézhegységekben 10 mg/dm 3 alatti, de 3-4 mg/dm 3 feletti értékekkel. A klaszterezés talán legfontosabb eredménye az 5. és a 6. csoport emelkedettebb klorid ion tartalma, amely csoportok már egyéb paraméterek esetében is jelentős különbségekkel bírtak a többiekhez képest. 11/a-b. ábra: 1: Béli hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (Hidrogénkarbonát ion koncentráció) A hidrogénkarbonát ion jelentős koncentrációban van jelen, területenként bizonyos esetekben nagy különbségekkel (11/a. ábra). A csoportosításban ez az ion jelentős szereppel bír. Ez a tény jól látszik a 11/b. ábrán. Az egyes csoportokban (11/b. ábra) a koncentráció tartalmak képileg hasonlóan alakulnak, mint a kalcium esetében, kivételt a 9., csoport (Rézhegységből, R-21 minta) kiemelkedően magas értéke jelenti. 16

12/a-b. ábra: 1: Béli hgy, 2: Királyerdő, 3.Réz-hgy, 4: Tasádi-dombság (Szulfát ion koncentráció)kálium tartalom A szulfáttartalom vonatkozásában (12/a-b. ábra) a Béli-hegység és Királyerdő vonatkozásában a medián 10 mg/dm 3. Ennek az az oka, hogy jelentős, gyakorlatilag 50% volt azoknak a mintavételezési pontoknak a száma, amelyekben a szulfát ion tartalom kisebb volt, mint az alkalmazott módszer kimutatási határa és ezek a minták főként a Béli-hegységben és a Királyerdőben helyezkednek el. A legtöbb kiugró és extrém értékkel a Királyerdő néhány mintája bír. Az adatelemző módszer eredményeként egy árnyaltabb képet kaphatunk. Így az 1. csoport mediánja kimutatási határ alatt van, ugyanakkor tudjuk, hogy ez a csoport főként a Királyerdőből tartalmaz mintákat. A 2. jellemzően szintén erről a területről tartalmaz mintákat, de már a medián magasabban helyezkedik el. Érdekes a 3. csoport, ami csak 50%-ban királyerdei minta. E csoport mediánja a kimutatási határ, az a néhány minta, ami mérhető értékkel rendelkezik, területi elhelyezkedése vegyes (Béli - és Réz hegység, Királyerdő). A további csoportokban általában jelentősebb szulfát ion mennyiséget mértek, és mint eddigi vizsgálati eredményeink alapján tudjuk ezek, elhelyezkedése nem köthető szigorúan egyetlen területhez. 3.2. Csoportosítás a szerves paraméterekre A vizsgált területen 133 forrásból vett vízmintákat olyan kémiai paraméterekre is vizsgálták, amelyek szerves anyagokhoz (kémiai oxigén igény, nitrit, nitrát, ammónia) esetleg mezőgazdasági tevékenységhez kapcsolódnak (foszfát). Ezekre a paraméterekre is vizsgálatot kívántunk végezni, abból a célból, hogy megadjuk azon mintáknak a csoportjait, melyek hasonló módon szennyezettek. Számos olyan paraméter volt, amelyek mért értékei kimutatási határ alatt voltak. Ezeket a csoportosítás során a kimutatási határ értékével vettük figyelembe. A területenként vett mintaszámokat a 4. táblázat mutatja be. Terület (Teritoriu) Mintaszám Béli-hgy (Codru) 21 Királyerdő (Padurea Craiului) 87 Tasádi dombság (Tasad) 4 Réz-hgy (Plopis) 21 4.táblázat. A területenként vett mintaszámok. 17

Csoportosítást klaszter analízissel végeztük, helyességét diszkriminancia analízissel ellenőriztük és javítottuk. A számítások végeredményeként, a mintavételi pontok 99,2%-át sikerült matematikai értelemben helyesen csoportba sorolni. Fontosnak tartottuk megtudni, hogy a csoportosításba bevont paraméterek közül melyek milyen mértékben befolyásolták a csoportosítást. Eszerint az ammóniumion, foszfátion és a KOI ps tartalom közel azonosan nagy mértékben játszott szerepet a csoportosításban. Ezeknek a paramétereknek ilyen nagy szerepe felhívja a figyelmet, hogy a mintázott területeken néhol jelentős és környezetvédelmi szempontból valószínűleg aggályos antropogén tevékenység folyik. Legkevésbé volt szerepe a nitrát ionnak (lásd 5. táblázat). ammóniumion tart. (mg/dm 3 ) 0.263 foszfátion tart. (mg/dm 3 ) 0.297 KOI ps (mg/dm 3 ) 0.317 nitrition tart. (mg/dm 3 ) 0.381 nitrátion tart. (mg/dm 3 ) 0.825 5. táblázat. A csoportosításba bevont paraméterek befolyásoló ereje. A boksz-whisker s plotokat ezen paraméterekre vonatkozóan úgy véltük célszerű kétféle képpen megadni. Az egyiket mintavételi területek szerint, azért hogy legyen áttekintő kép egy egy terület viszonyairól, a másik a matematikai csoportosítás szerinti, ami alapján pontosabb információt kaphatunk az antropogén tevékenységből származó szennyezettség mértékére. Az egyes csoportokban levő minták területi hovatartozását mutatja be a 6. táblázat. Csoport Grupe 1 2 3 4 5 6 7 8 Béli-hgy Codru 2 3 10 1 1 2 1 1 Királyerdő Padurea Craiului 39 6 25 1 3 10 1 2 Tasád Tasad 2 1 Réz-hgy Plopis 2 9 2 2 2 3 1 Összesen 41 11 46 4 7 14 5 4 6.táblázat. A csoportosítás alapján az egyes minták területi eloszlása. Az 1. és a 6. számú csoportokat egyértelműen a Királyerdőbeli minták túlsúlya jellemzi. Királyerdőből jelentős számú minta van jelen a 3. csoportban is, de itt helyezkedik el a Béli- és a Réz-hegységbeli minták túlnyomó része is. Kissé hasonló a helyzet a 2. csoportban is, de itt csak 11 minta foglal helyet. A többi csoport kisebb számú tagokból áll és területileg is változatos eloszlással bírnak. 18