ELMÉLET MÓDSZERTAN PFENING VIOLA A legközelebbi szomszéd analízis alkalmazásának problémái és lehetőségek a módszer kiterjesztésére Bevezetés A területi elemzésekben gyakran képezik a vizsgálat tárgyát különböző pontszerűnek tekinthető jelenségek, objektumok, amelyekkel kapcsolatban arra a kérdésre keressük a választ, vajon a területi eloszlásukban felfedezhető-e valamilyen szabályszerűség, koncentráció, vagy pedig az véletlennek tekinthető. Az alakzat, mintázat meghatározása nem öncélú, hiszen a háttérben meghúzódó kérdések miért ilyen eloszlás alakult ki, milyen hatások játszottak szerepet annak változásában csak az elrendeződésnek és változásának ismeretében válaszolhatók meg. A pontalakzatok jellegének számszerűsítésére a szakirodalomban legáltalánosabban használt módszer a legközelebbi szomszéd analízis, amelynek alkalmazására már hazai munkákban is találhatunk példákat. A tanulmány célja, hogy bemutassa, milyen nehézségek léphetnek fel a matematikai-statisztikai alapokon nyugvó módszer alkalmazása során, mely korlátokat kell különösen szem előtt tartani. A tanulmány felveti a legközelebbi szomszéd analízis egy korábbiaktól eltérő kiterjesztési lehetőségét is, a módszert a magyarországi települések jövedelmi konfigurációjának vizsgálatában felhasználva. A legközelebbi szomszéd analízis módszere A társadalmi, gazdasági jelenségek területi egyenlőtlenségeinek kutatása alapvetően két részből tevődik össze. Egyrészt vizsgálhatók az egyenlőtlenségek mértékei (a területi egyenlőtlenségi mutatók segítségével), de ez önmagában nem ad teljes képet egy bizonyos jelenség területi eloszlásáról. Az egyenlőtlenségek mértéke mellett azok területi képe, konfigurációja a másik fontos vizsgálati szempont, hiszen azonos mértékű területi egyenlőtlenség többféle konfigurációban is testet ölthet (Nemes Nagy 2009). Természetesen a kutatás nem állhat meg a területi tagoltság mértékének és képének leírásánál, fel kell tárni az adott helyzet kialakulásában szerepet játszó okokat, tényezőket. Önmagában egy tematikus térkép már megjeleníti a vizsgált jelenség konfigurációját, de vannak olyan módszerek, amelyek segítségével számszerűsíteni lehet ezt a területi képet. A térbeli konfigurációt egy számmal jellemző módszer például a területi autokorreláció és a tanulmány témáját képező legközelebbi szomszéd analízis, amely tehát nem közvetlenül a miért -ekre keresi a választ, nem az alakzatot létrehozó és alakító tényezők kutatása áll a középpontjában, hanem a konfiguráció jellegét számszerűsíti. A mintázatot jellemző konkrét számérték lehetőséget teremt különböző jelenségek eloszlásának összehasonlítására, illetve egy konfiguráció változásának nyomon követésére.
A LEGKÖZELEBBI SZOMSZÉD ANALÍZIS ALKALMAZÁSA 23 A legközelebbi szomszéd analízist az ökológia területén a növénypopulációk vizsgálatára dolgozták ki (Clark Evens 1954), de már az 1960-as évek elején megjelent a módszer különböző földrajzi munkákban. A társadalom-földrajzi alkalmazásokat három nagy csoportra lehet osztani (Czirfusz Szabó 2008): egy nagyobb területegység település-, illetve városhálózatának (Czirfusz Szabó 2008, Győri 2005, Beluszky Győri 2004, Bajmócy Kiss 1999, Nemes Nagy 1996, 1998, Barr Lindsay Reinelt 1971, Dacey 1963, King 1961, 1962), egy városon belüli funkciók, szolgáltatások eloszlásának (Balogh 2005, Sherwood 1970, Getis 1964), valamint egy nagyobb területegységen különböző funkciók, szolgáltatások elhelyezkedésének vizsgálatára (Pinder Witherick 1973, Vasiliadis Kobotis 1999). A legközelebbi szomszéd index meghatározása A legközelebbi szomszéd analízis alapját az elemzett pontrendszer és egy hipotetikus, a vizsgált területtel megegyező pontsűrűségű, véletlen eloszlású pontrendszer összehasonlítása jelenti. A módszer kizárólag a pontok elhelyezkedéséből indul ki, azokhoz nem társít sem mennyiségi, sem minőségi jellemzőket, lényegét tekintve tisztán geometriaimatematikai alapokkal rendelkezik (Czirfusz Szabó 2008), de először az ökológiában alkalmazták (Clark Evens 1954). A legközelebbi szomszéd index a valóságos pontalakzatban mért legközelebbi szomszédok közötti távolság átlagértékének és az ugyanakkora pontsűrűségű, de véletlen eloszlásnál várható legközelebbi szomszédok közötti távolságértéknek a hányadosa. n A pontsűrűség (m) adott T nagyságú n pontot tartalmazó területen m =. Az m pontsűrűségű, véletlen eloszlású mintázatban a legközelebbi szomszédok várható átlagos T távolsága (D) matematikailag levezethető (Clark Evens 1954): 1 D = 2 m A konkrét, m pontsűrűségű eloszlás esetén meg kell határozni minden egyes pont legközelebbi szomszédjától való távolságát, majd ennek számtani átlagát kell venni (D x ). A valóságban megfigyelt és a véletlen eloszlás esetében várható távolságérték hányadosa a legközelebbi szomszéd index (L), amely tehát alkalmas a vizsgált pontalakzat véletlenszerű eloszlástól való eltérésének meghatározására: L = Dx D Az így kapott index előnye, hogy a két vagy akár több pontalakzatra kiszámított legközelebbi szomszéd indexek közvetlenül összehasonlíthatók, mivel a véletlenszerű eloszlástól való relatív eltérést fejezik ki. A legközelebbi szomszéd index lehetséges értékei Az eltérő pontalakzatok értékeinek összehasonlítását segíti az index azon tulajdonsága is, hogy van maximuma, illetve minimuma. A minimumérték L=0 maximális koncentráció esetében áll elő, tehát ha minden pont ugyanazon a helyen összpontosul. Ha a vizsgált pontalakzat véletlen eloszlású, L értéke 1 lesz. A legközelebbi szomszéd index maximu-
24 PFENING VIOLA mát a teljesen szabályos, hexagonális elrendeződés esetében éri el (Haworth Vincent 1976). L maximális értéke 2,1491. A valóságos pontalakzatok vizsgálata során nem lehet a szabályos, véletlenszerű vagy koncentrált elrendeződés határértékeit élesen megadni. A tapasztalatok alapján 0,9 1,3 közötti L-érték tekinthető véletlenszerű eloszlásnak. Az ennél magasabb értékekkel jellemezhető pontalakzatok mintázata a szabályosság, az alacsonyabb értékűek pedig a koncentráció felé mutatnak határozott eltolódást. A konfigurációból következtetni lehet a pontalakzatokat kialakító tényezők jellegére is. A koncentráció hátterében valamilyen vonzó hatást kell keresni. Véletlenszerű eloszlás esetében a vonzó- és a taszítótényezők egyensúlyban vannak, míg a szabályoshoz közelítő elrendeződésnél feltételezhető az utóbbiak túlsúlya (Nemes Nagy 1998). A legközelebbi szomszéd analízishez szükséges adatok jellemzői Dusek Tamás a területi elemzések eszközeit a felhasznált adatok alapján három nagy csoportba sorolta (Dusek 2004). 1. Azon módszerek, amelyek egyáltalán nem használnak fel térparaméteres adatokat (például átlag, szórás, korreláció), csak attribútum-adatokat. Ebben az esetben a vizsgálat területi jellege abban mutatkozik meg, hogy a jellemző (például népességszám, egy főre jutó személygépkocsik száma) területegységre (például megye, település) vonatkozik, de a kapott eredmények nem adnak információkat a jelenség területi elrendeződésének képéről. 2. Kizárólag térparaméteres adatokat (például koordináták, távolság, irány) felhasználó módszerek, amelyek a vizsgált jelenség egyéb nem területi jellemzőit (az attribútum-adatokat) figyelmen kívül hagyják. Ezen módszerek a kiválasztott, valamilyen közös jellemzővel rendelkező objektumok által létrehozott alakzat geometriáját vizsgálják. Idetartozik a legközelebbi szomszéd analízis. 3. Azon módszerek, amelyek térparaméteres adatokat és egyéb nem területi jellemzőket is szerepeltetnek a számításokban, például a súlypontmódszer, a területi autokorreláció, a gravitációs és potenciálmodellek (Dusek 2004). A legközelebbi szomszéd analízis módszeréhez csupán a vizsgált objektumok helyzetét meghatározó adatokra, koordinátákra, az ezekből számolt távolságokra, valamint a vizsgált terület méretére van szükség. A legközelebbi szomszéd analízis alkalmazása során felvetődő problémák Azonos vonatkozási, illetve vetületi rendszer A vizsgált objektumok főleg ha nagyobb területre (egy kontinensre vagy a Föld egészére vonatkoznak a számítások) koordinátáinál problémaként léphet fel, hogy azok nem azonos vonatkozási, illetve vetületi rendszerben értelmezendők. Ilyen esetekben szükség van az egységes rendszerbe való átalakítására.
A LEGKÖZELEBBI SZOMSZÉD ANALÍZIS ALKALMAZÁSA 25 A vizsgált terület lehatárolása, nagyságának meghatározása A legközelebbi szomszéd analízis egyik sarkalatos pontja a pontsűrűség minél precízebb meghatározása, hiszen erre épül a véletlen eloszlásnál várható legközelebbi szomszéd várható távolságának kiszámítása. Abban az esetben, ha pontosan ismerjük a vizsgált terület méretét és a benne foglalt pontok számát, akkor ez nem okoz gondot. De előfordul, hogy becslésekre kell támaszkodni, mert nem lehet pontosan megadni a vizsgált objektumok számát, vagy mintaterület lehatárolására van szükség (Clark Evens 1954). A társadalomföldrajzban ritkábban fordul elő, hogy a vizsgált terület határait maga a kutató húzza meg, mivel azok általában illeszkednek valamilyen meglévő közigazgatási egység határához. Amennyiben a mintaterület kiválasztását maga a kutató végzi, nagy körültekintéssel kell eljárnia. Elképzelhető olyan eset, hogy a kiválasztott területen elhelyezkedő pontok konfigurációja egyértelműen eltér attól, amit akkor tapasztalnánk, ha a tágabb környezet pontjait is figyelembe vennénk. Az 1. ábrán a kisebb négyzetbe eső, fekete pontok eloszlása szétszórt, a véletlenszerűhöz közeli, miközben a teljes területet vizsgálva a pontok határozottan koncentráltan helyezkednek el. A rosszul lehatárolt mintaterület ponteloszlására kapott index jelentősen el fog térni attól, mintha a teljes térrészre végeztük volna el a számításokat. 1. ábra A vizsgált terület lehatárolásának hatása a ponteloszlás konfigurációjára Minimális elemszám A legközelebbi szomszéd analízist, mivel valószínűségelméleti elemekre épül, csak viszonylag nagy elemszámú pontalakzat esetén lehet megfelelő megbízhatósággal alkalmazni. Getis Boots (1977) szerint minimum 50 pont esetén lesz megfelelő az index megbízhatósága (Nemes Nagy 1996, 1998). A szakirodalomban más határértéket is lehet találni, egyes források 30 pontban (Barr Lindsay Reinelt 1971) állapítják meg a szükséges elemszámot.
26 PFENING VIOLA A minimális pontszám problémájának hátterében az áll, hogy alacsony elemszám esetén egy újabb, a többi ponttól viszonylag távol elhelyezkedő pont beléptetése a vizsgálatba jelentősen módosíthatja a legközelebbi szomszéd pontok távolságának átlagát. A módosítóhatás mértéke annál kisebb, minél nagyobb a vizsgálat elemszáma. Nincsen szigorúan megszabva, hogy hány ponttól alkalmazható a módszer, hiszen az függ a kutató által elérni kívánt megbízhatóságtól, valamint a legközelebbi szomszédok távolságának szórásától, változatosságától is. Minél jobban szóródnak a távolságértékek, annál nagyobb elemszám szükséges a kívánt megbízhatóság eléréséhez. Az elemszám hatását szemléltetendő szerepel a következő szélsőséges esetet bemutató, elméleti példa. Tételezzük fel, hogy egy egységnyi oldalú négyzetben minden pont az egyik csúcsban összpontosul (tehát L értéke 0)! Megvizsgáljuk, hogy a pontok számának függvényében hogyan módosul L-index értéke, ha egy újabb, a szemközti csúcsban elhelyezett pontot léptetünk be, amely így maximális, 2 távolságra van a többi ponttól. A 2. ábrán lehet látni, hogy 50 pont alatti elemszámnál az index értékét nagyon jelentősen módosítja az új pont bevonása a vizsgálatba, majd ez a hatás fokozatosan csökken. 2. ábra Az újonnan beléptetett pont által okozott változás a legközelebbi szomszéd indexben a pontok számának függvényében 2,0 1,8 Legközelebbi szomszéd index változása 1,6 1,4 1,2 1,0 0,8 0,6 0,4 0,2 0,0 0 100 200 Pontok száma 300 400 500 A vizsgált objektumok pontként való kezelése A legközelebbi szomszéd index használatával kapcsolatban felmerülő további probléma, hogy a módszer a vizsgált jelenségeket, objektumokat mint dimenzió nélküli pontokat kezeli. A valóságban természetesen ezek meghatározott területtel rendelkeznek, azonban a legközelebbi szomszéd analízis során ettől a kiterjedéstől eltekintünk, és az objektumokat pontként kezeljük, de erre csak akkor van lehetőség, ha a vizsgált terület nagyságához képest az objektumok kiterjedése olyan kicsi, hogy jogosan reprezentálhatók pontként. Pontszerűnek tekinthetünk nagyon sok jelenséget a vizsgált terület méretének függvényében, például egy ország városait, településeit, egy kerület iskoláit, az utak mentén elhelyezkedő benzinkutakat, de akár egy rendőrségi körzetben történt bűncselekmények helyszíneit is.
A LEGKÖZELEBBI SZOMSZÉD ANALÍZIS ALKALMAZÁSA 27 A határhatás és kiküszöbölési lehetőségei A vizsgált terület lehatároltsága együtt jár a határhoz közeli pontok létezésével, amely akkor okoz gondot, ha a vizsgált terület egy pontjához egy határon kívüli pont közelebb helyezkedik el, mint a határon belüli legközelebbi szomszédja. Ilyen esetben, ha a határon kívüli pontot figyelmen kívül hagyjuk, a legközelebbi pont távolsága nagyobb lesz, mintha azt a ténylegesen legközelebbi, ám a területen kívüli szomszédtól számolnánk. Ez az index értékét felfelé torzítja (Nemes Nagy 1998). A határhatás annál erőteljesebben lép fel és torzítja az eredményeket, minél hosszúkásabb, elnyúltabb a vizsgált terület alakja (Sinclair 1985), illetve minél kevesebb pont szerepel a vizsgálatban (Pinder 1978). A problémára a módszert felhasználó szerzők több megoldási lehetőséget dolgoztak ki: 1. Clark és Evens (1954) tanulmányában azt javasolja, hogy ha a vizsgált területhez tartozó pont legközelebbi szomszédja a terület határain kívül található, akkor a közöttük lévő távolságot kell a ponthoz rendelni. Ezen módszer alkalmazása torzítja az eredményeket, mivel a vizsgált területen kívüli pontok, melyeket mint legközelebbi szomszédokat bevonhatunk a számításba, hatással vannak legközelebbi szomszédok között mért átlagtávolságára, viszont nem veszik figyelembe ezeket a vizsgált terület pontsűrűségében. Ennek következményeként a véletlen eloszlásnál várható legközelebbi szomszédok közötti távolság értékében sem fog hatásuk megjelenni (de Vos 1973). 2. Ebdon (1985) szerint a vizsgált terület összes pontját magában foglaló legkisebb téglalap területével kell számolni. A problémát ez esetben viszont az okozza, hogy nagy eltérés lehet az eredeti terület és téglalap nagysága között (Czirfusz Szabó 2008). 3. Egy másik lehetőség, hogy a vizsgált területben teljes egészében benne levő legnagyobb téglalap területével, és az ebbe beleeső pontokkal számolunk, ami viszont jelentős pontveszteséget eredményezhet. Ez utóbbi két módszer különösen az extrém alakú vizsgálati területeknél eredményezhet nagy különbségeket (Czirfusz Szabó 2008). 4. Dacey (1963) a határhoz közeli pontokat csak akkor vette figyelembe, ha a legközelebbi szomszédjuk távolsága kisebb volt, mint azok határtól való távolsága, de ez a megoldás sem tökéletes, mivel csökkenti a vizsgálatba bevont pontok számát. 5. Donelly (1978) dolgozta ki Clark és Evens módszerének határhatással korrigált formáját. Ezek szerint egy meghatározott pontsűrűségű (m) véletlen eloszlás esetében a legközelebbi szomszédok közötti távolság várható értékét a következőképpen lehet megadni: 1 0,041 L D = + (0,051+ ) x, ahol 2 m n n n a pontszám, m a pontsűrűség és L a vizsgált terület határának hossza (Sinclair 1985). 6. A legtöbb esetben eltekintenek a határhatástól, és a lehatárolt területre, valamint a benne elhelyezkedő teljes pontalakzatra végzik el a számításokat. Vannak olyan esetek, amikor érdemes a határon túli pontokra is figyelemmel lenni. Például egy olyan kutatás során, ahol egy ország nagyobb városainak vonzáskörzeteit
28 PFENING VIOLA elemzik, hasonlítják össze a vonzott települések elrendeződési mintázata alapján, célszerű bevonni a vizsgálatba az egy-egy város vonzáskörzetekbe tartozó, de határon túli településeket is. Kiterjesztési lehetőségek Társadalmi jellemzők beépítése a módszerbe A társadalomföldrajzban vizsgált, pontszerűnek tekintett jelenségek sokszor nem azonos súlyúak, a pontoknak nagyon eltérő jelentősége lehet a valóságban. Számtalan jellemző jöhet szóba mint súlyozási szempont, például a települések vizsgálata során a népességszám, gazdasági erő, jövedelemvolumen vagy bizonyos funkciókkal való ellátottság, a szolgáltatások, funkciók eloszlásának elemzésekor a vonzáskörzet népességszáma, kapacitás, egyéb méretbeli jellemzők. Két lehetőséget szeretnék bemutatni, amelyek révén az attribútumadatok is beépíthetők a legközelebbi szomszéd analízis módszerébe. Többdimenziós legközelebbi szomszéd analízis Már Clark és Evens (1954) tanulmányában megjelenik annak gondolata, hogy a két dimenzióra kidolgozott legközelebbi szomszéd analízist további dimenziók bevonásával lehet bővíteni. Ennek módszertanát Dacey (1963) dolgozta ki részletesen, tanulmányában egy olyan általános képletet vezetett le, amelynek segítségével k-dimenziós térben tudjuk meghatározni az n-edik legközelebbi szomszéd várható távolságát adott pontsűrűségű, véletlen eloszlás esetén. A földrajzi vizsgálatokban a módszer további dimenziókra való kiterjesztésének egyik lehetősége lehet, amikor a pontokhoz az x és y koordináták mellett magassági értékeket társítunk, aminek függőlegesen tagolt domborzat esetén komoly jelentősége lehet (Czirfusz Szabó 2008). Több dimenzió alkalmazása lehetőséget teremt különböző társadalmi, gazdasági szféráknak a vizsgálatba történő együttes bevonására. Erre szolgál példaként, ha a magyarországi települések földrajzi koordinátái mellé harmadik dimenzióként az egy főre jutó jövedelmet vonjuk be. Így a magyar településeket olyan háromdimenziós koordináta-rendszer pontjaiként kell elképzelni, amelynek tengelyeit a nyugat kelet, illetve az észak dél pozíció mellett az egy főre jutó jövedelem alkotják. A kialakuló ponthalmaz eloszlásának, konfigurációjának számszerűsítését a legközelebbi szomszéd analízis ezen továbbfejlesztett változatával lehet megvalósítani. Ahhoz, hogy a legközelebbi szomszédok átlagtávolságát egy többdimenziós térben meg tudjuk határozni, az egyes dimenzióknak azonos mértékegységgel mérhetőnek, kifejezhetőnek kell lennie. Amennyiben különböző társadalmi jellemzőket vonunk be a vizsgálatba, azok különböző mértékegységekkel rendelkeznek, amelyeket összehasonlíthatóvá kell tenni, például az adatok standardizálásával. Az egyes pontok, települések egymástól való távolsága ezen standardizált adatok segítségével határozható meg. P 1 (x 1 ; y 1 ; z 1 ) és P 2 (x 2 ; y 2 ; z 2 ) koordinátájú pontok távolsága a következő: 2 ) d = (x 1 x 2 + (y 1 y 2 + (z 1 z 2 A pontok egymástól mért távolságának ismeretében már egyszerűen meghatározható a legközelebbi szomszédok átlagos távolsága. A következő lépésben szükséges a vizsgált pontsűrűség és a véletlen eloszlás esetében a legközelebbi szomszédok várható távolságának kiszámítása, amely Dacey általános képletéből levezetve: 2 ) 2 )
A LEGKÖZELEBBI SZOMSZÉD ANALÍZIS ALKALMAZÁSA 29 4 3 3Γ 3 D =, ahol 3 πm 4 1 m a pontsűrűség, valamint a gamma-függvény alapján Γ x 2,6789 0, 8930 (Mogyoródi 1990). A pontsűrűség meghatározása problémát jelenthet, hiszen ehhez szükség 3 3 van arra a térfogatra, amelyben a vizsgált pontok elhelyezkednek, amellyel kapcsolatban ismét felvetődik a lehatárolás problémája. Ha túl nagy térfogatot határozunk meg, amelynek csak egy részét tölti ki ténylegesen a pontalakzat, akkor sokkal koncentráltabb érték fog eredményként adódni, mint ha kisebb térrészt lehatárolva végeznénk el a számításokat. Számításaim során a térrész térfogatát, amelyre a pontsűrűséget számoltam, úgy határoztam meg, hogy minden standardizált adatsorban megkerestem a minimumot és a maximumot, majd ezek különbségét (tehát a standardizált adatsorok terjedelmét) szoroztam össze. Így a legkisebb téglatest térfogatát vettem alapul, amelyben minden pont benne foglaltatik. Természetesen ennek a módszernek is vannak hátrányai, hiszen egy-egy kiugró érték jelentősen megnövelheti az így számolt térfogatot, ami a kapott eredményeket is nagyban befolyásolja. A valós és a véletlen eloszlás esetében várt érték hányadosa adja meg a legközelebbi szomszéd indexet. Az eredmények értékelése során vetődik fel, hogy vajon háromdimenziós térben mik lesznek az index szélsőértékei. A minimum nem változik, teljes koncentráció esetén 0 lesz az index értéke, a véletlenszerű eloszlásra pedig továbbra is 1 adódik. A problémát a teljesen szabályos elrendeződés esetén tapasztalható felső érték meghatározása jelenti. Háromdimenziós térben, szabályos konfiguráció esetén minden pont egy d oldalhosszúságú szabályos tetraéder csúcsaiban helyezkedik el. Így a legközelebbi pontok egymástól d távolságra vannak, és minden ponthoz egy d oldalhosszúságú szabályos d 2 tetraéder térfogata tartozik, amely 3. A pontsűrűséget ennek reciproka adja meg. Az 12 ezzel megegyező pontsűrűségű véletlen eloszlás esetében a legközelebbi szomszédok közötti várható távolságot a fenti képletbe helyettesítve kapjuk meg: 6 0,8930 x 3 3 0,8930d x 23 3 D = = 12 3 π12 3 π 3 d 2 A legközelebbi szomszédok közötti tényleges átlagtávolságot, azaz d-t, osztva ezen véletlenszerű eloszlás esetén várható értékkel, kapjuk meg a legközelebbi szomszéd index maximumát háromdimenziós térben, ami kerekítve 2,3194. Magyarország teljes településállományára ezen vizsgálatot 1990-ben (L=0,370), 1995-ben (L=0,369), 2000-ben (L=0,361) és 2006-ban (L=0,352) az egy főre jutó személyijövedelemadó-alap alapján elvégezve, a települések jövedelmi térben való koncentrált elhelyezkedése állapítható meg, amely a rendszerváltás óta eltelt időszakban fokozódott.
30 PFENING VIOLA Valamely jellemző alapján történő homogenizáció A legközelebbi szomszéd analízisbe lehetőség van attribútumadat beépítésére egy másik módon is, magának a vizsgált jelenségnek a meghatározása révén, például, ha csak az egy meghatározott népességnél nagyobb településeket elemezzük (így a népességet mint attribútumadatot vonjuk be a vizsgálatba). Ezzel ugyan kijelöljük az elemzett csoport tagjainak minimális méretét, de a kategória elemei közötti különbségekre a későbbiekben már nem lehetünk tekintettel, azok egyenrangú, ugyanolyan súlyú pontokként szerepelnek a számításokban, ami tehát azok homogenizálását jelenti. Hasonló homogenizációt jelent, ha nem az egész településhálózatot, hanem csupán a városokat vonjuk be az elemzésbe, ezzel kiválasztjuk a feltételezhetően jelentősebb, népesebb települések körét, de a közöttük lévő differenciákkal már nem foglalkozunk. A bemutatásra kerülő példában a magyarországi településeknek az egy főre jutó jövedelem alapján kirajzolódó konfigurációja képezi a vizsgálat tárgyát. Olyan kérdésekre kerestem a választ, hogy például tapasztalhatunk-e a települések jövedelem alapján kirajzolódó elrendeződésében valamiféle szabályosságot, esetleg a véletlenszerűség vagy a koncentráltság jellemzi jobban az elhelyezkedésüket. Megfigyelhető-e 1990 és 2006 között változás a konfigurációban, és ha igen, az milyen irányba mutat? Vajon megállapítható-e valamilyen összefüggés a jövedelmi pozíció és a jellemző eloszlás között? További lehetőség kínálkozik más mutatók alapján kirajzolódó konfigurációkkal való öszszevetésre. A vizsgálat alapját a települések egy főre jutó jövedelemszintje szerinti homogenizáció jelentette. Ezt úgy valósítottam meg, hogy a jövedelemadatok alapján 1990 és 2006 között minden évben sorrendbe rendeztem, majd decilisekre osztottam a településállományt. Minden decilisbe nagyjából ugyanannyi, az összes település 10%-a került. Az első decilis mindig a legjobb helyzetű településeket jelentette (legmagasabb egy főre jutó jövedelem), a tizedik decilisbe pedig az adott évben a legrosszabb helyzetű települések kerültek. A decilisekre való osztást magától értetődően minden évre újból elvégeztem, és természetesen az egyes tizedekbe tartozó települések köre változott. Következő lépésként minden év minden decilisére kiszámoltam az odatartozó települések körére a legközelebbi szomszéd index értékét. A települések közötti távolság meghatározásához középpontjuk koordinátáit használtam fel, amelyek egy Budapest origójú (0;0) nyugat kelet, észak dél irányítású derékszögű koordinátarendszer pontjaiként, kmben lettek meghatározva. A távolság kiszámítása során a Pitagorasz-tételből levezethető euklideszi távolságot használtam. Az adott decilisbe tartozó települések legközelebbi szomszédait egy mátrix segítségével tudtam megállapítani, amelynek egyes soraiban egy adott településnek ugyanazon decilis többi településétől való távolsága szerepelt. Ezen értékekből a minimumot kiválasztva, majd azokat átlagolva kaptam meg a legközelebbi szomszédok tényleges átlagtávolságát. Ezt viszonyítottam ahhoz a várt értékhez, mely a vizsgált decilisbe tartozó települések és legközelebbi szomszédaik közötti átlagtávolság lenne, ha azok az ország területén véletlenszerűen helyezkednének el. Az egy főre jutó jövedelmek alapján kialakított decilisekbe tartozó települések konfigurációját vizsgálva elmondható, hogy a középső tizedek esetében nem lehetett jelentős átrendeződést tapasztalni, azok jellemzően az egész időszak folyamán (1990 2006) a véletlenszerű eloszlás jegyeit mutatták. Ezen településkör az egy főre jutó jövedelem
A LEGKÖZELEBBI SZOMSZÉD ANALÍZIS ALKALMAZÁSA 31 országos átlagának 55 90%-ával rendelkezett. Az ennél szegényebb, de főként a gazdagabb települések elrendeződésében viszont jelentős változások mentek végbe a rendszerváltás óta. Az első, tehát legmagasabb jövedelmi decilis településeinél már 1990-ben is meg lehetett figyelni bizonyos mértékű koncentrációt, de eloszlásuk még inkább a véletlenszerűhöz állt közel (L=0,84). A vizsgált időszakban egy koncentrálódási folyamat indult meg, így 2006-ban a leggazdagabb települések földrajzilag már határozottan összpontosult elhelyezkedést mutattak (L=0,69). Hasonló, csak enyhébb folyamat játszódott le a 2., 8. és 9. tized konfigurációját vizsgálva is. 1990 óta jól érzékelhető koncentráció zajlott le a legmagasabb és a legalacsonyabb jövedelemkategóriákban, míg a köztes települések eloszlása hasonlóan a korábbiakhoz inkább a véletlenszerűség jegyeit mutatta. A leírt tendenciából a legszegényebb decilis kilóg, ott már 1990-ben is nagy volt a koncentráció (L=0,66), ami összességében alig változott 2006-ra. A 3. ábra a fent leírtakat szemlélteti, a görbék a vizsgálat kezdő és utolsó évében mutatják az egyes jövedelemdecilisekbe tartozó települések legközelebbi szomszéd indexének értékét. Az 1990-ben még lapos görbe 2006-ra kicsúcsosodott a legmagasabb és legalacsonyabb tizedekbe eső települések koncentráltabb elhelyezkedésének köszönhetően. 3. ábra A jövedelmi decilisekbe tartozó települések konfigurációjának változása, 1990 2006 1,00 0,95 1990 2006 Legközelebbi szomszéd index 0,90 0,85 0,80 0,75 0,70 0,65 0,60 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Decilisek Hogyan magyarázhatók a különböző jövedelmi csoportokba tartozó települések eloszlásának ilyen irányú változásai? A szocializmus alatt a településszintű egyenlőtlenségek alakulásában a településhierarchiában elfoglalt pozíció bírt meghatározó szereppel, ami egyértelműen a nagyobb településeknek, városoknak kedvezett. A fejlesztések elsődlegesen a megyeszékhelyeken valósultak meg, rajtuk kívül még a kisebb városok jutottak forrásokhoz, de a településállomány zömét alkotó falvak alig részesültek támogatásokban. A nagyobb népességű települések elhelyezkedését pedig véletlenszerű eloszlás jellemzi. A koncentráció jelei már 1990-ben is érzékelhetők voltak, a véletlenszerűen elhelyezkedő nagyobb települések mellett Budapest környéke, a Dunántúli-középhegység és a Balaton-parti települések tartoztak a legmagasabb jövedelmű tizedbe.
32 PFENING VIOLA A legalacsonyabb jövedelmű települések koncentrációja jelentős mértékben szintén a településmérettel magyarázható. A szocialista rendszerben a legkisebb települések voltak a leghátrányosabb helyzetben, állami támogatásokból alig részesültek. Ezen apró- és törpefalvak eleve koncentrált elhelyezkedést mutatnak, ami a legszegényebb települések legközelebbi szomszéd indexének értékét is befolyásolta. Területi elhelyezkedésüket tekintve Baranya, Zala, de elsősorban Szabolcs-Szatmár-Bereg és Borsod-Abaúj-Zemplén megye települései, valamint a keleti országhatár vidéke tartoztak a legszegényebbek sorába, 2006-ra ez a kör a Közép-Tisza-vidék és Nógrád megye néhány településével bővült. 1990 után mind az alacsonyabb (a tizedik decilistől eltekintve), mind a legmagasabb jövedelmi tizedekbe tartozó települések koncentráltabb elhelyezkedésűvé váltak. Ennek oka a fekvés felértékelődésében keresendő, mely fontos tényezővé vált a települések jövedelmi viszonyainak alakulásában, míg korábban egyértelműen a településhierarchiában elfoglalt helyzet volt a meghatározó (Nemes Nagy Jakobi Németh 2001). Természetesen ez nem jelenti azt, hogy a nagy települések kiestek volna a leggazdagabbak köréből. A rendszerváltást követően azonban, a fekvés felértékelődése révén, a fellendülő nyugati térségekben a városok mellett kisebb települések is bekerülhettek a legmagasabb jövedelmekkel rendelkezők közé, míg az ország többi részén ez elsősorban csak a városoknak, népesebb településeknek sikerült. A különböző jövedelmű települések konfigurációjának változása a legközelebbi szomszéd analízis eredményei alapján a területi tagoltság növekedését támasztja alá; mind a szegényebb, mind a gazdagabb tizedek településeinek koncentráltsága fokozódott 1990 óta. Összefoglalás A legközelebbi szomszéd analízis tisztán matematikai-geometriai alapokra épülő módszer, melynek társadalomtudományi alkalmazása hasonló nehézségeket vet fel az eredmények értékelése során, mint amit más, természettudományi analógiára épülő módszerek használata esetében is tapasztalhatunk. A legközelebbi szomszéd analízis lehetőséget nyújt a különböző, pontalakzatként értelmezhető jelenségek konfigurációjának megállapítására, lehetővé téve az időbeli és az egyes jelenségek közötti összehasonlítást. Nem ad választ viszont a mintázatot kialakító tényezőkre de ez nem is célja, így a módszer az ilyen jellegű, az elrendeződések okait is feltárni kívánó kutatásoknak egyik, de nem egyetlen eszköze lehet. A benne rejlő lehetőségeket a korlátok ismeretében viszont mindenképp érdemes kihasználni. A tanulmány ezen korlátokat (a vizsgált terület lehatárolása, az elemzett jelenség pontként kezelhetősége, a határhoz közel eső pontok indexértéket felfelé torzító hatása, a megbízható eredmények eléréséhez szükséges elemszám), illetve a legközelebbi szomszéd analízisben rejlő lehetőségeket (társadalmi, gazdasági jellemzők beépítése a több dimenzióra való kiterjesztésen, illetve a homogenizáción keresztül) kívánta bemutatni. IRODALOM Bajmócy Péter Kiss János (1999): Megyék, régiók és központjaik modellek tükrében. Tér és Társadalom 1 2. Balogh Nóra (2007): A bankszektor területi képe Magyarországon és Budapest bankhálózatának terület szempontú értékelése. Diplomamunka. Eötvös Loránd Tudományegyetem Regionális Földrajzi Tanszék, Budapest
A LEGKÖZELEBBI SZOMSZÉD ANALÍZIS ALKALMAZÁSA 33 Barr, Brenton Lindsay, Ian Reinelt, Erhard (1971): Patterns of Urban Spacing in the USSR: Analysis of Order Neighbor Statistics in Two-dimensional Space. Journal of Regional Science. Vol. 11. No. 2. Beluszky Pál Győri Róbert (2004): Fel is út, le is út (Városaink településhierarchiában elfoglalt pozícióinak változásai a 20. században). Tér és Társadalom 1. Czirfusz Márton Szabó Pál (2008): A legközelebbi szomszéd analízis és alkalmazási lehetőségei. Területi Statisztika 3. Clark, Philip J. Evans, Francis C. (1954): Distance to Nearest Neighbor as a Measure of Spatial Relationships in Populations. Ecology. Vol. 35. No. 4. Dacey, Michael F. (1963): Order Neighbor Statistics for a Class of Random Patterns in Multidimensional Space. Annals of the Association of American Geographers. Vol. 53. No. 4. De Vos, S. (1973): The use of nearest neighbour methods. Tijdschrift voor Economische en Sociale Geografie. Vol. 64. No. 5. Dusek Tamás (2004): A területi elemzések alapjai. Regionális Tudományi Tanulmányok 10. ELTE Regionális Földrajzi Tanszék MTA ELTE Regionális Tudományi Kutatócsoport, Budapest Ebdon, David (1985): Statistics in Geography. Second Edition. Blackwell Publishing Getis, Arthur (1964): Temporal Land-Use Pattern Analysis with the Use of Nearest Neighbour and Quadrat Methods. Annals of the Association American Geographers Vol. 54. No. 3. Győri Róbert (2005): A térszerkezet átalakulásának elemei a Kisalföld déli részén (a XVIII. század végétől a XX. század elejéig). Doktori értekezés. ELTE TTK Földtudományi Doktori Iskola, Budapest Haworth, J. Vincent, P. (1976): Maximizing the Nearest-Neighbour Statistic. Area. Vol. 8. No. 4. King, Leslie J. (1961): A Multivariate Analysis of the Spacing of Urban Settlements in the United States. Annals of the Association of American Geographers. Vol. 51. Issue 2. King, Leslie J. (1962): A quantitative expression of the pattern of urban settlements in selected areas of the United States. Tijdschrift voor Economische en Sociale Geografie Vol. 53. No. 1. Mogyoródi József (1990): Matematikai statisztika. Tankönyvkiadó, Budapest Nemes Nagy József (1996): Térbeli pontalakzatok vizsgálata. In: Szónokyné Ancsin Gabriella Herendi István (szerk.): Társadalomföldrajzi elemzések számítógépen. JATEPress, Szeged Nemes Nagy József (1998): A tér a társadalomkutatásban. Hilscher Rezső Szociálpolitikai Egyesület, Budapest Nemes Nagy József (2009): Terek, helyek, régiók. A regionális tudomány alapjai. Akadémiai Kiadó, Budapest Nemes Nagy József Jakobi Ákos Németh Nándor (2001): A jövedelemegyenlőtlenségek térségi és településszerkezeti összetevői. Statisztikai Szemle 10 11. Pinder, D. A. (1978): Correcting Underestimation in Nearest-Neighbour Analysis. Area. Vol. 10. No. 5. Pinder, D. A. Witherick, M. E. (1973): Nearest-neighbour analysis of linear point patterns. Tijdschrift voor Economische en Sociale Geografie. Vol. 64. No. 3. Sherwood, Kenneth B. (1970): Some applications of the nearest neighbour technique to the study of the movement of intra-urban functions. Tijdschrift voor Economische en Sociale Geografie Vol. 61. No. 6. Sinclair, Dennis F. (1985): On Tests of Spatial Randomness Using Mean Nearest Neighbor Distance. Ecology. Vol. 66. No. 3. Vasiliadis, Ch. A. Kobotis, A. (1999): Spatial analysis an application of nearest-neighbour analysis to tourism locations in Macedonia. Tourism Management 1999/20. Kulcsszavak: legközelebbi szomszéd analízis, pontalakzat, konfiguráció, matematikai-statisztikai módszerek. Resume The nearest-neighbour analysis is the most commonly used method to quantify point patterns. The nearestneighbour index (L) represents parameters of the spatial distribution with one single number in the interval of 0 and 2.149. The different patterns become easily comparable as the points of reference are the concentrated (L=0), the random (L=1) and the hexagonal (L=2.149) orders. The study focuses on the difficulties of using the nearest-neighbour analysis such as defining borders of the examined area, the possibilities of handling the examined phenomena as point patterns, the distortion effect of the points close to the border, and the necessary component number in order to achieve reliable results. Beyond the traditional method of examination of the location of the objects only, it is also possible to add other (social, economic) features through a multi-dimensional extension or homogenization.