Doktori kutatások a BME Építőmérnöki Karán 2008 1 Differenciális evolúciós algoritmus geodéziai alkalmazási lehetőségei Laky Sándor BME Általános és Felsőgeodézia Tanszék MTA-BME Fizikai Geodézia és Geodinamikai Kutatócsoport Témavezető: Dr. Földváry Lóránt Összefoglalás: Az evolúciós algoritmusok biológiai analógiákra épülő optimalizációs eljárások. Céljuk általában többváltozós függvények globális szélsőértékeinek feltérképezése. Ezen algoritmusokkal rokon eljárás az R. Storn és K. Price által 1997-ben bemutatott differenciális evolúciós (DE: Differential Evolution) eljárás [1]. Dolgozatunkban azt vizsgáljuk meg, hogy ez utóbbi módszer hogyan viszonyul a geodéziában a kiegyenlítő számítások területén hagyományosan alkalmazott számítási eljárásokhoz, és bemutatunk néhány alkalmazási példát a gyakorlatból: egy függvényillesztési feladatot, egy szabadálláspont-meghatározást, és egy szabadhálózat kiegyenlítését. Kulcsszavak: evolúciós algoritmus, differenciális evolúció, kiegyenlítő számítások, függvényillesztés, hálózatkiegyenlítés 1. Bevezetés: legkisebb négyzetes feladatok a geodéziában A geodéziai gyakorlatban a legkisebb négyzetek módszerét általában A x l (1) formájú lineáris egyenletrendszerek megoldására használjuk [2]. Az l tisztatag-vektor méréseinket (vagy méréseink redukált értékeit) tartalmazza, az A alakmátrixot előzetes ismereteink alapján levezetett együtthatók alkotják, és az x vektorban találhatók a meghatározandó paraméterek. A gyakorlatban a módszert abban az esetben alkalmazzuk, ha egyenletrendszerünk túlhatározott, azaz több mérést végzünk, mint ahány paramétert meg szeretnénk határozni (ezek a fölösmérések ). Mivel méréseink hibával terheltek, ezért a feladat pontos megoldása nem lehetséges, méréseinket javításokkal kell ellátni. Ekkor a feladat A x = l + v (2) alakúra módosul, ahol a v vektor méréseink javításait tartalmazza, és a feladat megoldása a v T v min (3) feltétellel egészül ki, azaz az összes lehetséges megoldás közül azt keressük, amely esetén a javítások négyzetösszege minimális lesz (a megoldás megegyezik a javításvektor L2
Doktori kutatások a BME Építőmérnöki Karán 2008 2 normájának minimalizálásával: v 2 min). A feladatot magát sokféleképpen megoldhatjuk, általánosan elterjed a Moore-Penrose pszeudoinverz használata. Súlyozás. A gyakorlatban méréseinket különböző középhibával (matematikai nyelven: szórással) tudjuk elvégezni. Nyilvánvaló, hogy ezeket az eltérő pontosságokat feladataink megoldása során valamilyen módon figyelembe kell venni. A súlyozott legkisebb négyzetek módszere esetén a javítások négyzetösszege helyett a v T P LL v min (4) szélsőértéket, azaz a javítások súlyozott négyzetösszegének minimumát keressük. Ha a P LL súlymátrixot a méréseink együttes eloszlását jellemző M LL variancia-kovariancia mátrix inverzeként vesszük fel, akkor a megoldás a paraméterek leghatékonyabb torzítatlan lineáris becslőjét (BLUE: Best Linear Unbiased Estimator) adja [3]. Linearitás kérdése. Ha a megoldandó egyenletrendszer nemlineáris egyenletekből áll, a legegyszerűbb, ha az egyenletek paraméterek szerinti Taylor-sorfejtésének csak konstans és lineáris tagjait figyelembe véve linearizáljuk azokat. Ekkor az A alakmátrix az egyenleteknek az x paraméterek szerinti parciális deriváltjaiból fog állni. Megfontolandó, hogy a sorba fejtést a paraméterek milyen x 0 értékei ( előzetes értékek ) körül végezzük el. Ha az x 0 a paraméterek tényleges értékétől messze esik, akkor a feladatot iteratív úton oldhatjuk meg (azaz a következő iterációban az előző iteráció eredményét tekintjük előzetes értéknek), azonban ha x 0 túlságosan messze esik a megoldástól, akkor a folyamat nem az általunk kívánt optimális érték felé fog konvergálni. Ez arra vezethető vissza, hogy a legkisebb négyzetes problémák megoldására hagyományosan használt módszer (pszeudoinverz) egy lokális feltételes szélsőérték keresési feladat megoldását adja, és a linearizált esetben, ha a linearizáció helye messze esik a megoldástól, a linearizált feladat optimális megoldása nem fog egybeesni az eredeti nemlineáris feladat optimális megoldásával. Fontos tehát az előzetes értékek megfelelő felvétele. Egy másik lehetőség, hogy olyan módszert választunk, amelyhez nem szükséges egyenleteink linearizálása, illetve nem igényelik deriváltak (gradiens) alkalmazását. Ilyen módszer például a numerikus eljárások közül a homotópia [4] (ez ugyan igényel előzetes értékeket, de azok megválasztására sokkal kevésbé érzékeny), a különböző globális szélsőértékkeresési eljárások; a szimbolikus eljárások közül pedig a nemlineáris Gauss-Jacobi kombinatorikus algoritmus [5]. A legkisebb négyzetes feladatok további osztályozása. Természetesen a két csoportosítás (súlyozott egységsúlyú és lineáris nemlineáris) mellett további szempontok szerint is lehetséges a feladatok besorolása. Például a totális (vagy teljes ) legkisebb négyzetek módszere (TLS: Total Least Squares) esetén figyelembe vesszük, hogy a gyakorlatban előfordulnak olyan esetek, amikor az alakmátrix elemeit is mérésekből vezetjük le [6]. Ilyen esetben indokolt, hogy a mátrix elemei is kaphassanak javításokat a megoldás során. 2. Differenciális evolúciós eljárás alkalmazása legkisebb négyzetes feladatok megoldására A különböző genetikai és evolúciós eljárások általános jellemzői: Globális szélsőértékkeresési eljárások, azaz alkalmasak több lokális szélsőértékkel rendelkező függvények globális szélsőértékének megkeresésére, vagy több lokális szélsőérték feltérképezésére. Sztochasztikus szélsőértékkeresési eljárások, azaz lefutásuk nem determinisztikus, a futás során véletlenszám-generátor által előállított mennyiségek is szerepet kapnak.
Doktori kutatások a BME Építőmérnöki Karán 2008 3 Nem igényelik előzetes értékek felvételét, igényelik viszont általában előzetes tartományok felvételét, amelyekbe a paraméterek értékeinek bele kell esniük. Magukban az algoritmusokban, és szóhasználatukban is gyakran köszönnek vissza biológiai analógiák. Ennek megfelelően egy konkrét értékekből álló paramétervektort egyednek nevezünk, a megoldás során egy iterációban vizsgált egyedek összességét populációnak hívjuk, a következő iterációra történő továbblépést pedig generációváltásnak. Két vagy több egyed kombinációjából ( keresztezéséből ) létrejövő újabb egyedet utódnak nevezünk, az egyed perturbált változatát mutánsnak, az egyedeknek a következő generációba való átlépés előtt pedig természetes kiválasztódáson kell átesniük, amely az egyedeket rátermettségük alapján szűri meg. A differenciális evolúciós (DE: Differencial Evolution) eljárás az evolúciós eljárásokkal rokon algoritmus [1]. A hagyományos evolúciós eljárásokhoz képest változás, hogy a mutációs lépésben nem előzetesen felvett paraméterű valószínűségi eloszlásokkal előállított véletlen mennyiségekre hagyatkozik, hanem az egyes egyedek közötti különbséget veszi alapul a mutánsok létrehozásához (innen származik a neve). Az algoritmus konkrét lépései az alábbiak. 1. Keresési tér lehatárolása. Meghatározzuk az x min és x max határértékeket, amelyek közé kell esnie a megoldásnak. A paraméterek számát jelölje n. x min = [x min,1 x min,2 x min,n ] x max = [x max,1 x max,2 x max,n ] (5) 2. Egyedek inicializálása. Az x i egyedeket értékekkel töltjük fel, általában egyenletes valószínűségi eloszlás szerint, az x min és x max határértékek között. Az egyedek száma (a populáció mérete) n p. x i = [x i1 ~ U(x min,1, x max,1 ) x i2 ~ U(x min,2, x max,2 ) x in ~ U(x min,n, x max,n )] (6) (Itt x ~ U(a, b) jelentése: x eloszlása az a és b közötti egyenletes eloszlást követi.) 3. Mutáció. Minden egyednek létrehozunk egy mutáns párt. Az i-edik egyed mutáns párját három véletlenszerűen kiválasztott, egymással nem megegyező egyedből állítjuk elő. Legyen ezeknek az egyedeknek a sorszáma r 1, r 2 és r 3. Azt, hogy az r 1 egyedhez képest mekkora a mutáció mértéke, a 0 és 1 közötti f mutációs faktor adja meg. r 1 ~ U(1, n p ); r 2 ~ U(1, n p ); r 3 ~ U(1, n p ); v i = x r1 + f (x r2 x r3 ) (7) 4. Keresztezés. A v i mutánst az x i egyeddel keresztezve kapjuk az u i utódjelöltet. Azt, hogy az utódjelöltben egy paraméter helyére melyik szülőből kerül át az érték, egy 0 és 1 közötti egyenletes eloszlású véletlen szám (r CRij ) határozza meg. Ha ez a szám meghaladja a felvett kereszteződési valószínűséget (CR), akkor az adott paraméter az x i egyedben felvett értéket kapja, ha nem, akkor az v i -ben felvett értéket. A minimálisan szükséges kereszteződés elérése végett a véletlenszerűen kiválasztott r-edik paraméter mindenképpen a mutánsból kerül át. (8) 5. Tartományvizsgálat. Ha az u i utódjelölt kívül esik az x min.. x max tartományon, több lehetőségünk is van. Alkalmazzuk most a következő módszert: amennyivel az utódjelölt
Doktori kutatások a BME Építőmérnöki Karán 2008 4 túllépi a megengedett határértéket, annyival a megengedett minimális érték fölé vagy maximális érték alá helyezzük vissza. (9) 6. Természetes kiválasztódás. Az u i utódjelölt és az x i egyed közül a következő generációba csak a rátermettebb juthat tovább. A rátermettség mérőszáma egy hagyományos legkisebb négyzetes feladat megoldása esetén a (3) célfüggvénynek az utódjelölt, illetve az egyed helyén felvett értéke. 7. Leállási feltétel vizsgálata. Az iteráció leállási feltételét sokféleképpen megfogalmazhatjuk. Alkalmazzuk most a következő megközelítést: mivel az egyedek mutációja az egyedek közötti különbségekkel történik, ha az egyes paraméterek értéke az összes egyedre nézve egy előre felvett σ max értéknél kisebb szórást mutat, az iterációt nincs értelme folytatni, hiszen további mutációval és keresztezéssel a célfüggvény értékében jelentős javulás már nem érhető el. Ha ez a feltétel még nem teljesül minden paraméterre, akkor az iteráció a 3. lépéstől folytatódik. Itt mutatkozik meg a differenciális eljárás önszabályozó mivolta: míg a paraméter-értékek szórása nagy, az effektív keresés is széleskörű, a folyamat előrehaladtával a paraméter-értékek szórása csökken, így a potenciális globális szélsőérték környezete kerül alaposabb feltérképezésre. A fentiek alapján az algoritmus lefutását befolyásoló változók az alábbiak: A paraméterek száma (n): ezt a megoldandó feladat szabja meg. Az egyedek száma (n p ): ha túl nagy egyedszámmal dolgozunk, a számításigény feleslegesen nő, ám túl kevés egyed felvétele a folyamat korai konvergenciájához vezethet, aminek eredményeképpen könnyen valamelyik lokális szélsőérték csapdájába eshetünk (az eljárás robusztussága csökken). Mutációs faktor (f) Keresztezési valószínűség (CR) Leállási feltétel (σ max ) Az utolsó három paraméter értékét az adott feladathoz igazítva megérzéssel, próbálgatással, vagy meta-optimalizációval ( az optimalizációs eljárás optimalizációja ) határozhatjuk meg. A szakirodalomban található egy elterjedt paraméterhármas (n p = 10 n, f = 0,8, CR = 0,9), amely a feladatok nagy részében elfogadható sebességű konvergencia mellett jó robusztusságot nyújt; illetve jó kiindulásként használható a feladatra jellemző optimális paraméterek meghatározására. 3. Alkalmazási példák 3.1. Egyszerű függvényillesztés hagyományos legkisebb négyzetek módszerével Az első bemutatott alkalmazási példa egy egyszerű függvényillesztés a legkisebb négyzetek módszerével. Az illesztés célja a GRACE műholdak gyorsulásmérésére jellemző hibahatás, a twang egy előfordulásának paraméter-meghatározása. A megnevezés a gyorsulás idősorban jelentkező rövid ideig tartó, csillapított szinuszos rezgést takar [7] (lásd 1. ábra). A jelenség modellezhető az idő (t) függvényében az a(t) = A sin(2 π f t+φ) e -t B (10)
Doktori kutatások a BME Építőmérnöki Karán 2008 5 függvénnyel, amelynek paraméterei az A kezdőamplitúdó, az f frekvencia, a φ kezdőfázis, és a B csillapítási tényező. (Itt feltételezzük, hogy az idősort a jeltől és trendtől már megszabadítottuk.) Feladatunk legkisebb négyzetes értelemben optimális becslést adni a twang egy konkrét előfordulásának paramétereire. A GRACE műholdak műszereinek ismeretében feltételezzük, hogy az időmérés pontossága elegendően jó ahhoz, hogy a feladatot teljes legkisebb négyzetek módszere helyett hagyományos legkisebb négyzetes feladatként oldhassuk meg, azaz a mérések időpontjait hibátlannak tekinthetjük. 1. ábra: Twang a (10) egyenlet alapján, az alább részletezett paraméterekkel. A feladatot először a hagyományos pszeudoinverzes módszerrel illetve ellenőrzésképpen szinguláris érték felbontással (SVD: Singular Value Decomposition [8]) megoldva keressük az előzetes értékek (azaz a linearizálás helyének) azon tartományát, amelyre a megoldás már konvergál. A módszer vizsgálata céljából most tökéletesen zajmentes, szimulált méréseket használunk. A twang mérési idősorának előállítására használt értékek: t = 0,00.. 6,00 sec (0,10 sec mintavételezéssel), A = 5,00 10-6 m/s 2, f = 2,00 Hz, φ = 3,14, B = 1,00. A vizsgálat során az A és B értékek előzetes értékei (A 0 és B 0 ) megegyeznek valódi értékeikkel, és vizsgáljuk a konvergencia érzékenységét az f és φ előzetes értékeire (f 0 és φ 0 ) nézve, azokat a valódi értékekhez képest egy ±40%-os sávban felvéve. A konvergencia feltételeként azt szabtuk meg, hogy legkésőbb a 20. iterációra a paraméterek becsült értéke a valódi értékekhez képest belül essen a ±5%-os sávon. Az eredmény a 2. ábrán látható. A megoldás az esetek kevesebb mint felében konvergált a valódi értékek felé: φ 0 felvételétől függően f 0 értékét kb. ±15% pontossággal kell ismernünk. Az iterációk száma tekintetében a konvergens tartományban már 3-4 ismétlés is kielégítő eredményt adott, a nem-konvergens tartományban azonban ugyanennyi iteráció után a feladat már annyira rosszul kondicionált, hogy a pszeudoinverz sem állítható elő.
Doktori kutatások a BME Építőmérnöki Karán 2008 6 2. ábra: Hagyományos legkisebb négyzetes megoldás konvergenciája φ 0 és f 0 előzetes értékek megválasztása függvényében. A konvergens tartományt szürke színnel jelöltük. Az evolúciós eljárás kedvező konvergencia-tulajdonságait szemléltetendő válasszuk meg úgy az x min és x max értékeket (lásd (5)), hogy az egyedek a valódi értékekhez képest ±40%-os sávban helyezkedjenek el, mind a négy paraméter esetében. Célfüggvényül a (3) függvényt választjuk, az evolúciós eljárás paramétereinek pedig a 2. fejezet végén ismertetett általános értékeket. Leállási feltételnek azt adtuk meg, hogy az összes egyedre nézve a paraméterek közül egyik szórása se haladja meg a 10-10 értéket. A folyamat (az egyedek nagy kezdeti szórása ellenére) gyorsan konvergál, a szükséges iterációk száma ~350. A 3. ábrán (logaritmikus skálán) látható, hogy a konvergencia sebessége exponenciális. 3. ábra: Differenciális evolúciós függvényillesztés konvergenciája A 4. ábrán magának az evolúciónak a folyamata látható. A jobb szemléltetés érdekében a keresési tér most a paraméterek valódi értékéhez képest ±90%-os tartományt fed le. Ez a konvergencia sebességére minimális hatással volt, a szükséges iterációk száma ~360-ra nőtt.
Doktori kutatások a BME Építőmérnöki Karán 2008 7 4. ábra: Az evolúció folyamata. Feketével a valódi ( mért ) idősor, szürkével az egyes egyedekből számított idősorok. Balról jobbra, fentről lefele haladva: inicializáció után közvetlenül, majd az 1., 4., 20., 30., és 100. iteráció után. 3.2. Robusztus szabadálláspont-meghatározás Következő alkalmazási példánk egy egypontos hálózatkiegyenlítés, közismertebb nevén egy szabadálláspont-meghatározás számítása. Az általános geodéziában naponta többször is előforduló feladat az alábbi: határozzuk meg ismert koordinátájú alappontokra végzett irányés távolságmérésekkel műszerünk álláspontjának koordinátáit, valamint a tájékozási szöget. A feladat visszavezethető kötött hálózat kiegyenlítésének egy speciális esetére, ahol egyetlen ismeretlen koordinátájú pontunk van. 5. ábra: Az alappontok és az ismeretlen koordinátájú álláspont elhelyezkedése. Az iránymérések és a pontok koordinátái között a kapcsolatot az egyenlet teremti meg, ahol P az álláspontunk, R az irányzott pont, I PR az iránymérés eredményének kiegyenlített értéke, Y P, X P, Y R, X R az álláspont és az irányzott pont koordinátái, z P pedig a tájékozási szög. A távolságmérések és a koordináták kapcsolatát a (11)
Doktori kutatások a BME Építőmérnöki Karán 2008 8 egyenlet írja le, itt t PR a mért (és vízszintesre redukált) távolság, a többi változó értelmezése pedig megegyezik az előzőekkel [2]. A konkrét feladat legyen a következő: első esetben műszerünk a P ponton áll, amelynek hibátlan koordinátái: Y P = 0,0000 m, X P = 0,0000 m. Innen irányozzuk az R 1.. R 5 alappontokat, amelyeknek koordinátái az 1. táblázatban láthatók. Mindegyik alappontra végzünk irány- és távmérést is. Irányméréseinket σ I = 7, távméréseinket σ t = ±(5 mm + 5 mm/km) szórású, normális eloszlású mérési zaj terheli, és azokat egymástól függetlennek tekintjük (azaz a kovarianciák értéke mindenhol zérus, így a P LL súlymátrix diagonálmátrix lesz). Végezzük el az álláspont koordinátáinak meghatározását (4) célfüggvény (súlyozott legkisebb négyzetek módszere) alapján! A második esetben a feldolgozás durvahibával terhelt, mivel az R 2 alappont ~3 cm-el elmozdult, ám erről a mérés és feldolgozás idején nincs tudomásunk: a számítást úgy hajtjuk végre, hogy az R 2 pont eredeti koordinátáit használjuk fel. Kérdés, hogy mennyire befolyásolja ez a változás a szabadálláspont-meghatározás pontosságát? Az eredményeket az 1. táblázat utolsó előtti sorában foglaltuk össze. Világosan látszódik a durvahiba bevezetésének hatása az álláspont meghatározott koordinátáira: Y irányban +6,0 mm, X irányban +2,6 mm eltérést tapasztaltunk. Felmerül a kérdés, hogy mit lehet tenni az ellen, hogy egy-egy durvahiba ne rontsa el ennyire a megoldást? A gyakorlatban több módszert is alkalmaznak: például a mérések javításainak utólagos vizsgálatából szűrik ki a durvahibás értékeket, majd azok kihagyásával újra megismétlik a számítást; vagy iteratív kiegyenlítést végeznek, amelynek során a nagyobb javítást kapó mérések súlyát folyamatosan csökkentik; stb. (12) 1. táblázat: Az alappontok koordinátái, az álláspont meghatározott koordinátái, és az álláspont meghatározott koordinátáinak szórása a durvahiba-mentes és durvahibás esetben Pontszám Durvahiba-mentes Durvahibás Y [m] X [m] Y [m] X [m] R 1-122,559 89,843 ua. ua. R 2 32,715 72,266 32,736 72,287 R 3 145,996-4,395 ua. ua. R 4 50,781-89,844 ua. ua. R 5-181,641-131,348 ua. ua. P, legkisebb négyzetek 0,0001 ± 0,0019 0,0056 ± 0,0023 0,0061 ± 0,0019 0,0082 ± 0,0023 P, medián 0,0023 ± 0,0058 0,0037 ± 0,0063 0,0028 ± 0,0051 0,0045 ± 0,0042 Használjuk most ki azt, hogy az evolúciós eljárás alkalmazása esetén célfüggvényünknek nem kell feltétlenül matematikai értelemben vett függvénynek lennie, hanem bármilyen algoritmussal elvégezhetjük annak kiszámítását. Cseréljük le a (4) célfüggvényt az alábbira: medián{p LL v} min. (13) Ebben az esetben a súlymátrixot úgy vesszük fel, hogy annak főátlójában lévő elemei a mérések szórásával legyenek fordítottan arányosak (azaz a legkisebb négyzetek módszerével ellentétben nem a varianciával). Az eredményeket (1. táblázat, utolsó sor) végigtekintve
Doktori kutatások a BME Építőmérnöki Karán 2008 9 látható, hogy azok várakozásainknak megfelelnek: a durvahiba a medián szerinti kiegyenlítést sokkal kevésbé rontotta el, mint a legkisebb négyzetek módszere szerinti kiegyenlítést: az eltérés Y irányban +0,5 mm, X irányban +0,8 mm. 3.3. Geodéziai szabadhálózatok robusztus kiegyenlítése Az előző pontban már szóba kerültek a geodéziai hálózatok, azoknak egy speciális változatával foglalkoztunk, ahol egy ismeretlen koordinátájú pontunk volt, és több adott koordinátájú alappontunk. Most vizsgáljunk meg egy másik esetet! Geodéziai szabadhálózatnak nevezzük azokat a geodéziai hálózatokat, amelyekben nincsen adott koordinátájú pont. Ezeknek a hálózatoknak a számítási munkáit általában egy helyi koordináta-rendszerben végzik (sokszor éppen maga a hálózat jelöli ki a koordinátarendszert), és utólag illesztik be őket egy magasabb rendű (például országos) rendszerbe. A feladat jellegéből adódik a megoldás legfőbb nehézsége: mivel nincs rögzített pont, a legkedvezőbb (pl. legkisebb négyzetek szerint optimális) hálózatalak mellett a hálózatot végtelen sok módon tudjuk elhelyezni a koordinátasíkon, így a hagyományos legkisebb négyzetes eljárás nem vezet eredményre. A feladat megoldására több elterjedt módszer is kínálkozik. A legegyszerűbb, ha önkényesen rögzítjük valamelyik pont koordinátáit, és az egyik hálózati oldal irányát. Ekkor a hálózatot kötött hálózattá alakítottuk, ami lehetővé teszi a hagyományos megoldási módszerek használatát, ám van egy hátulütője: hibaterjedés szempontjából nem kedvező. Ez azt jelenti, hogy a megkötött pont koordináta-középhibái zérusok lesznek, attól távolodva a koordinátaközéphibák folyamatosan nőnek (ezt peremhatásnak is szokták nevezni). A másik egyszerű megoldás, ha minimális normájú megoldást keresünk, azaz a mérési javítások súlyozott négyzetösszegének minimalizálása mellett feltételként adjuk meg a paraméterek előzetes és kiegyenlített értékei közötti eltérésvektorának L2 norma szerinti minimalizálását. Ilyen megoldást biztosít pl. az egyenletrendszer megoldása SVD-vel [8]. Természetesen az evolúciós algoritmus is alkalmas ilyen jellegű probléma megoldására. Ha általános algoritmust szeretnénk alkotni, akkor második célfüggvényként felvesszük az előzetes és a kiegyenlített koordináták eltérésének négyzetösszegét (ebben az esetben azonban a hagyományos megoldással ellentétben nem kell hogy az előzetes koordináták jó közelítései legyenek a kiegyenlített koordinátáknak, azoktól akár több méterre eltérhetnek), és egy multiobjektív ( több célfüggvényes ) eljárást alkalmazunk, amely a két célfüggvény egyidejű vizsgálatával Pareto-optimális megoldást ad. Ilyen eljárás például a DEMO (Differential Evolution for Multiobjective Optimization) [9]. A multiobjektív eljárás alkalmazása helyett válasszunk most egy másik lehetőséget: alakítsuk át magát az eredeti differenciális evolúciós algoritmust úgy, hogy az alkalmas legyen a feladat végrehajtására. Ezt azért tehetjük meg, mert esetünkben a két célfüggvény nem dolgozik egymás ellen : a végtelen sok, méréseinkre nézve optimális megoldás közül csak egyetlen olyan van, amely az előzetes és a kiegyenlített koordináták közötti eltérésekre megadott célfüggvényt is minimalizálja. Ellenkező esetben nem egyetlen optimális megoldásról beszélnénk, hanem a megoldások Pareto-optimális frontjáról. Esetünkben az algoritmus keresztezési és tartományvizsgálati (4. és 5.) lépése közé iktatunk be egy újabb lépést: az egyes utódjelölt vektorok által alkotott hálózatokat az előzetes koordináták által alkotott hálózatokra merevtest-szerű transzformációval (két koordinátatengely irányú eltolás, egy súlypont körüli elforgatás) ráillesztjük. Így biztosítjuk, hogy az
Doktori kutatások a BME Építőmérnöki Karán 2008 10 egyedek által alkotott hálózatok geometriájának (azaz alakjának és méretének) megváltoztatása nélkül a hálózat elhelyezését megkössük. 6. ábra: A sóskúti geodéziai mikrohálózat elrendezése. A konkrét számítási példát most egy valódi hálózaton, az Általános és Felsőgeodézia Tanszék sóskúti geodéziai mikrohálózatán mutatjuk be [10]. A hálózat vázlata a 6. ábrán látható. A számításokhoz a hálózat 2008. évi újramérésének adatait használtuk fel. A mérések középhibáit a méréskor használt Leica TCA 1800 típusú műszer gyári adatai alapján vettük fel: az iránymérések középhibája így σ I = ±1 lett, a távmérések középhibája pedig σ t = ±(1 mm + 2 mm/km). A kiegyenlítés robusztusságának vizsgálatára ezúttal két eszközt vetettünk be: egyrészt bevezettünk egy mesterséges durva mérési hibát (az 1 2 iránymérést 1 -al elrontottuk), másrészt megvizsgáltuk a kiegyenlítés eredményét a fölösmérések fokozatos eltávolítása mellett. Robusztus célfüggvényként ismét a (13) egyenletet alkalmaztuk. A kapott eredmények értelmezéséhez szükségünk volt egy viszonyítási alapra. Mivel ebben az esetben nem állnak rendelkezésünkre a valódi hibátlan koordináták, ezért referenciának a legkisebb négyzetek módszerével, 42-es (maximális) fölösmérésszám mellett, durvahibamentes esetben kapott koordinátákat tekintjük. Vizsgáljuk az egyes kiegyenlítések eredményeként kapott ponthelyek átlagos távolságát ettől az esettől (2. táblázat). 2. táblázat: Átlagos ponthely-távolságok csökkenő fölösmérés-szám mellett, durvahiba-mentes és durvahibás esetben. Fölösmérés Durvahiba-mentes Durvahibás Legkisebb négyzetek Medián Legkisebb négyzetek Medián 42 0,000 m 0,001 m 0,338 m 0,001 m 12 0,001 m 0,001 m 0,386 m 0,001 m 2 0,002 m 0,002 m 0,836 m 0,002 m Azt mondhatjuk, hogy az eredmények a várakozásoknak megfelelőek. A legkisebb négyzetek módszere közismerten érzékeny a durvahibákra. A medián szerinti kiegyenlítés ezzel szemben igen kevéssé bizonyult rájuk érzékenynek, és ezen kedvező tulajdonságát alacsony
Doktori kutatások a BME Építőmérnöki Karán 2008 11 fölösmérés-szám mellett is megtartotta; míg a durvahiba-mentes esetben a legkisebb négyzetek módszeréhez igen közeli eredményeket produkált. A 3. táblázatban láthatjuk, hogy ez a robusztusság nem járt következmények nélkül: bár az eredmények maguk kevésbé torzultak, mint a legkisebb négyzetek módszere esetén, a konfidencia-intervallumok átlagos mérete már a durvahiba-mentes esetben is meghaladja a legkisebb négyzetek módszere esetén levezetett méreteket. 3. táblázat: Átlagos 95%-os konfidencia-intervallumok csökkenő fölösmérés-szám mellett, durvahiba-mentes és durvahibás esetben. Fölösmérés Durvahiba-mentes Durvahibás Legkisebb négyzetek Medián Legkisebb négyzetek Medián 42 ±1 mm ±4 mm ±1 mm ±3 mm 12 ±2 mm ±5 mm ±2 mm ±4 mm 2 ±3 mm ±12 mm ±2 mm ±12 mm A [11] hivatkozásban bővebb összefoglalás található szabadhálózatok kiegyenlítéséről differenciális evolúciós eljárással (például részletezzük a folyamat leghatékonyabb paraméterezésének megkeresését, illetve egyéb kiegyenlítési normákkal is megvizsgáljuk a feladatot). 4. Összefoglalás Az előzőekben áttekintést adtunk a legkisebb négyzetes feladatokról. Bemutattunk egy általános sztochasztikus globális optimalizációs eljárást, a differenciális evolúciós algoritmust. Megvizsgáltuk az algoritmus alkalmazhatóságát különböző gyakorlati geodéziai feladatokra: egy műholdas gravimetriában előforduló egyszerű függvényillesztési feladatra, valamint két olyan esetre, amely az általános geodéziában mindennapos feladatnak minősül: egy szabadálláspont-meghatározás esetére ( egypontos kiegyenlítés ), valamint egy szabadhálózat kiegyenlítése esetére. Azt tapasztaltuk, hogy az eljárás számos előnyt nyújt, amelyek alkalmazását csábítóvá teszik ezen területeken: nem szükséges linearizálni a méréseink és a meghatározandó paraméterek között kapcsolatot teremtő egyenleteket (lásd (10), (11), (12) egyenletek), nem szükséges előzetes értékekkel rendelkeznünk a paraméterekre, csupán egy ésszerű tartományt kell lehatárolnunk (lásd 3.1. példa), és végül az eljárás rendkívül könnyen adoptálható a javítások négyzetösszege helyett más célfüggvényre, így könnyen alakítható át robusztus kiegyenlítési eljárássá (lásd 3.2. és 3.3. példa). Köszönetnyilvánítás. Köszönettel tartozom Babcsány Jánosnak és Dr. Rózsa Szabolcsnak (BME Általános és Felsőgeodézia Tanszék) a sóskúti geodéziai mikrohálózat 2008. évi mérési eredményeinek rendelkezésemre bocsátásáért.
Doktori kutatások a BME Építőmérnöki Karán 2008 12 IRODALOM: [1] Storn R, Price K (1997): Differential Evolution A Simple and Efficient Heuristic for Global Optimization over Continuous Spaces. Journal of Global Optimization 11, 341-359 [2] Detrekői Á (1991): Kiegyenlítő számítások. Tankönyvkiadó, Budapest. [3] AliReza Amiri-Simkooei (2007): Least-Squares Variance Component Estimation. Theory and GPS Applications. Doktori értekezés. Publications on Geodesy 64, Netherlands Geodetic Commission. 9. oldal (2.1.4 fejezet) [4] Paláncz B, Awange J L, Zaletnyik P, Lewis R H (2009): Linear Homotopy Solution of Nonlinear Systems of Equations in Geodesy. Journal of Geodesy (megjelenés alatt) [5] Awange J L (2002): Gröbner bases, multipolynomial resultants and the Gauss-Jacobi combinatorial algorithms adjustment of nonlinear GPS/LPS observations. Doktori értekezés. Stuttgarti Egyetem, Geodéziai Intézet [6] Markovsky I, Van Huffel S (2007): Overview of Total Least Squares Methods. Signal Processing 87, 2283-2302 [7] Laky S (2007): A GRACE műholdpár gyorsulásmérési adatainak szerepe és feldolgozása. Doktori kutatások a BME Építőmérnöki Karán, Budapest, 2007. 11. 07, 17-26 [8] Tóth Gy (2004): Korszerű matematikai módszerek a geodéziában. Elektronikus egyetemi jegyzet, 13-22, http://www.agt.bme.hu/tantargyak/korszmat/korszerumatematikajegyzet.pdf [9] Robič T, Filipič B (2005): DEMO: Differential Evolution for multiobjective optimization. Proceedings of the 3rd International Conference on Evolutionary Multicriterion Optimization (EMO 2005), 520-533 [10] Dede K, Szűcs L (2000): Geodéziai mérések a sóskúti hálózatban. Geomatikai Közlemények III., 125-132 [11] Laky S (2009): Differenciális evolúciós algoritmus alkalmazása geodéziai hálózatok kiegyenlítésére. Geomatikai Közlemények XII. (megjelenés alatt)