Számítógépes képelemzés 1 7. SZÁMÍTÓGÉPES KÉPELEMZÉS 7.1. Bevezetés Ebben a fejezetben a számítógépes képfeldolgozás és a képelemzés alapjait kívánjuk bemutatni. Elõször is tisztáznunk kell ezeknek a fogalmaknak a jelentését. A képfeldolgozás alkalmával a képek olyan típusú átalakítását végezzük el, amikor a lényeges információkat a lényegtelentõl különválasztjuk. Ilyen átalakítás során lehet kiszûrni az elektronmikroszkópos képeken meglévõ háttér zajt vagy ezzel a módszerrel lehet a felvételek készítése során keletkezõ elektromos zavarokat elválasztani az anyag szerkezetét bemutató képektõl. A másik lényeges fogalom a képelemzés, ami nem más, mint a képek számszerû adatokkal történõ jellemzése. Azt is mondhatjuk, hogy ekkor végezzük el a kép információ tartalmának mennyiségi interpretációját. Az így nyert paramétereket az adott képi környezetbe visszahelyezve még értelmeznünk is szükséges, ez az ún. képértelmezés *. A képelemzés a mindennapi életben is gyakran elõfordul. Amikor egy helyiség falának területét megbecsüljük azért, hogy tapétát vásároljunk, vagy egy mérõedényben meghatározzuk a folyadék magasságát, esetleg egy térképen végzünk távolságbecslést, akkor tulajdonképpen képelemzést végzünk (7.1-1. ábra). Természetesen a képek számszerû adatokkal történõ jellemzésének a biológiában, az ásványtanban, a kohászatban, a zoológiában, a botanikában, a félvezetõk területén van az igazi jelentõsége. Amikor egy alacsony karbon tartalmú acél ferrit szemcse méretét kívánjuk megbecsülni, vagy egy karbon szálakkal erõsített alumínium mátrixú kompozitot akarunk jellemezni (7.1-2. ábra), esetleg egy biológiai metszet azonosítását vagy ásványtani csiszolat értelmezését szeretnénk elvégezni, a számítógépes képelemzés módszereihez fordulunk. A képelemzés az ipar, a mezõgazdaság és a tudományos kutatás területén is használatos. Amikor a termékek minõségellenõrzését végezzük, vagy éppen gépalkatrészek összeszerelését akarjuk segíteni látó robotokkal, vagy esetleg a mûholdak segítségével készült térképeket, ûrfelvé- * A képek, illetve a képek adatainak értelmezése csak az adott szakterületre vonatkozó speciális szakismeretek birtokában lehetséges.
2 Számítógépes képelemzés teleket kívánunk jellemezni szintén a képfeldolgozást, képelemzést alkalmazzuk. 7.1-1. ábra. Képelemzés a mindennapi életben 7.1-2. ábra. Képelemzés az anyagtudományban (a) ferrites acél, N=100X, (b) karbon szálas kompozit, a szálak elhelyezkedésére jellemzõ hatósugár szerinti vázszerkezettel (Szalai Ibolya, 2000) 7.2. Az emberi látás alapjai Mielõtt részletesen foglalkoznánk a képfeldolgozás mûveleteivel, hasznos megismernünk az emberi látás alapjait. Ugyanis nagyon sok hasonlóság figyelhetõ meg a két terület között. A látás során öt különbözõ információt érzékelünk: a tárgyak világosságát, a tárgyak színét, a tárgyak alakját, a tárgyak mozgását és a tárgyak térbeliségét. A látás legfontosabb eszköze az emberi szem, amelynek sematikus rajzát a 7.2-1. ábra mutatja. Amikor a szemünk egy pontot élesen lát, akkor errõl az ún. fixált pontról a fénysugár a szaruhártyán (cornea), a
Számítógépes képelemzés 3 csarnokvízen és a szemlencsén keresztül jut a szemünkbe. A közegeken áthaladva mindenütt érvényes a fénytörésre vonatkozó Snellius-Descartes törvény, ami azt jelenti, hogy a beesési szög (α) és a törési szög (β) szinuszainak hányadosa az adott közegre jellemzõ fizikai állandó az ún. törésmutató (n): sinα n = (7.2-1) sin β 7.2-1. ábra. Az emberi szem felépítése A tárgy képe az emberi szem lencserendszerén keresztül a látóidegre vetül, ahol egy valódi, kicsinyített, fordított állású kép jön létre. Az emberi szem belsejét a retina borítja, amelynek két jellegzetes területe a látó gödör * és az ún. vakfolt. Míg a látógödörben a legélesebb a látás, addig a vakfolton nincsenek látóidegek (Ganong (1994)). A lencsét tartó izmok a lencse görbületét változtatva változtatják annak fókusztávolságát, így a szemünk különbözõ távolságban lévõ tárgyak képét tudja a retinára vetíteni. A lencsék fénytörõ képességét dioptriával fejezzük ki, ami nem más, mint a méterben kifejezett fókusztávolság * fovea centralis
4 Számítógépes képelemzés reciproka. Míg a szaruhártya fénytörõ képessége 40-43 dioptria, addig a szemlencse fiatalabb korban kb. 17-20 dioptria törõképességgel rendelkezik. A szem mûködéséhez az is hozzátartozik, hogy a szivárványhártya vagy más néven iris a pupillát szûkítõ izmokból áll, amely képes a szembe jutó fény mennyiségét szabályozni. A retinán a fény fotonok érzékelésére alkalmas pálcikák ( rodes ) és csapok ( comes ) találhatók. Az érzékelés alapja, hogy a szemünkben lévõ csapok és pálcikák (7.2-2. ábra) egy fotokémiai folyamat révén a fény fotonokat elektromos impulzussá alakítják, s ez jut el az idegpályákon keresztül az agy látókérgébe. A pálcikák teljes mennyisége kb. 120 millió, s ezek képesek akár egyetlen fény foton érzékelésére is, de közepes intenzitású fénynél már telítõdnek. Így a pálcikák felelõsek a világosság, fényintenzitás érzékeléséért, valamint a sötétben történõ látásért. Ugyanakkor a pálcikák színek érzékelésére nem alkalmasak. 7.2-2. ábra. A pálcika és a csap vázlatos képe
Számítógépes képelemzés 5 A csapok száma kb. 6 millió, ezek kisebb fény érzékenységûek, de a nagy fényintenzitású tartományban mûködnek. A csapok és a pálcikák ilyen irányú különbségét a 7.2-3. ábra mutatja. A sötétben eltöltött idõ függvényében láthatjuk a legkisebb hatásos fényintenzitás értékét. Amennyiben 4-5 percet töltünk el a sötét szobában, viszonylag nagy intenzitású fény szükséges ahhoz, hogy lássunk, ekkor a csapok lépnek mûködésbe. Nagyjából 20-25 perc múlva bekövetkezik az ún. sötét adaptáció, mikor egészen kis intenzitású fény érzékelésére is képesek vagyunk, s ezt a pálcikáknak köszönhetjük. 7.2-3. ábra. A sötét adaptáció A csapok felelõsek a színes látásért is. A retinában tulajdonképpen háromféle csap van: a vörös (red), a zöld (green) és a kék (blue) hullámhosszúságú fényre legérzékenyebb csap. A szelektivitás viszonylagos, például egy zöld típusú csap, vörös fénnyel is ingerelhetõ, de ehhez jóval nagyobb intenzitású fényre van szükség. Azt, hogy a különbözõ csapok milyen spektrális eloszlású fény érzékelésére alkalmasak a 7.2-4. ábra mutatja *. * A vörös szín érzékelését végzõ csapok jele P (protos), míg a zöld D (deuteros) ill. a kékt (tritos) jelet visel.
6 Számítógépes képelemzés 7.2-4. ábra. A különbözõ csapok által érzékelt fény spektruma. A kék hullámhossz tartományban érzékeny csapok neve: tritos, míg a zöld csap deuteros és a vörös pedig protos. A pálcikák és a csapok mennyiségének eloszlása a retina mentén a látógödörtõl mért szög függvényében nagyon különleges (7.2-5. ábra). Ugyanis a látógödörben egyáltalán nincsen pálcika, ott csak csapok találhatók, s ott van a hatmillió csap kb. 80 % a! Éppen ezért a látógödör alkalmas a legélesebb, valamint színekben is a leggazdagabb érzékelésére. A pálcikák mennyisége a perifériákon valamelyest nõ, itt viszont a csapok mennyisége minimális. A vakfoltban sem csap, sem pálcika nem található. A szemlencsét mozgató izmok az agy parancsára arra törekednek, hogy a kép mindig a látó gödörben legyen. Ugyanis az optikai ingerületeket továbbító idegrostok száma 1-1,2 millió körül van, így a látógödörben az idegsejtek és az ideg-rostok közötti áttétel 1:1 körüli, míg a retina más részein ez az áttétel 100:1. Ebbõl következik, hogy már a retinában van bizonyos mértékû képfeldolgozás, és így az agyba fõként az élekre, a hirtelen változásokra jutó információ jut.
Számítógépes képelemzés 7 7.2-5. ábra. A csapok és a pálcikák száma a látógödörtõl mért szög függvényében A két szem optikai tengelye egymástól 60-65 mm távolságban van. A térbeli látásnak az a lényege, hogy a fókuszban lévõ tárgy képe a látógödörbe vetül, míg az ettõl távolabb lévõ tárgy a retinának az egyik felére (nazális), míg a közeli pont a retina másik (temporális) részére (7.2-6. ábra). A tanulási folyamat során az agyunk elsajátította, hogy a retina nazális részén lévõ tárgyak a fixált ponttól távolabb vannak. Minél nagyobb a retinán leképzett tárgyrészletek közötti távolság, annál közelebbinek érzékeljük a fókuszban lévõ tárgyak környezetét.
8 Számítógépes képelemzés 7.2-6. ábra. A térbeli látás
Számítógépes képelemzés 9 Az emberi látást a következõ paraméterekkel jellemezhetjük: a) Geometriai felbontás. Az a legkisebb látószög, amely mellett sötét alapon lévõ két világos pont még éppen nem olvad egybe. Ennek nagysága függ a fény hullámhosszúságától, zöld fényben a legjobb a felbontás: 0,5 1,0 szögperc *. b) Fényintenzitás felbontás. Azt a fényerõsség intervallumot jelenti, amelyben a szemünk mûködni képes. Ez az intervallum hihetetlenül nagy (7.2-7. ábra), tudniillik a kétszeres fényerõsség változás, csak természetes logaritmus kettõ-szeres fényérzet növekedést eredményez. Vagyis a százszoros fényerõsség változás csak 4,6 (ln 100) szoros fényérzet erõsödést hoz létre. c) Színfelbontás. A színárnyalatok elkülönítésének képessége. Errõl a késõbbiekben lesz szó. d) Idõbeni felbontás. A recehártyánkon megjelenõ képek nem tûnnek el azonnal, az 1/8 másodpercnél rövidebb ideig tartó képek összeolvadnak az érzékelésünkben. Így az 1/15 másodpercnél rövidebb idõre fel villanó képeket nem tudjuk elkülöníteni, ezt használjuk ki a televíziós képek továbbításakor, amikor másodpercenként 16-25 állóképet látunk, amit folyamatos mozgásként érzékelünk. * A kényelmes olvasás szemtávolságában 250 [mm], ez az érték 0,07 0,15 [mm] pontok közötti távolságot jelent.
10 Számítógépes képelemzés 7.2-7. ábra. A szemünk által érzékelhetõ fényintenzitás értékek Az emberi szem 380-780 [nm] hullámhosszúságú tartományban érzékeli a fényt, ami a természetben elõforduló elektromágneses sugárzásoknak csak keskeny tartománya (7.2-8. ábra). Az agyunkban keletkezõ színérzetet a valóságban elõforduló szín három jellemzõje befolyásolja:
Számítógépes képelemzés 11 1) Színárnyalat (hue) a fény hullámhosszúságától függ. A szemünk kb. 200-féle színárnyalat megkülönböztetésére képes. 2) Világosság vagy fényintenzitás (intensity) a fényforrás által kibocsátott fotonok mennyisége, illetve az egységnyi felületre beérkezõ E=hν * energiájú fotonok száma. Például a barna szín spektrális eloszlása a sárgával azonos, de más a világosság értéke. Átlagosan mintegy ötszáz intenzitásfokozatot tudunk a szemünkkel megkülönböztetni. 3) Telítettség (saturation) a fehér összetevõ mennyiségétõl függ. A spektrum-színek 100 %-os telítettségûek, nincs fehér összetevõjük. Ugyanakkor például a rózsaszín néhány százalékban fehér összetevõt tartalmazó vörös. Az átlagos szem húsz különbözõ telítettségi fokozatot tud elkülöníteni. * Minden ν frekvenciájú (λ hullámhosszúságú) elektromágneses sugárzás E = hν = h c/λ energiával rendelkezik, ahol h a Planck-féle állandó, c pedig a fénysebesség.
12 Számítógépes képelemzés 7.2-8. ábra. A különbözõ elektromágneses sugárzások hullámhosszúsága A színárnyalat, a világosság, és a telítettség jellemzésére a színfát használjuk. Ezt mutatja a 7.2-9. ábra.
Számítógépes képelemzés 13 7.2-9. ábra. A színfa Amennyiben a tárgy által kibocsátott fény spektruma ϕ(λ), az egyes csapok érzékenységi függvénye pedig p(λ), d(λ) és t(λ), akkor a szemünk által érzéklet színérzetet az alábbi integrál fejezi ki: P = D = T = 780nm 380nm 780nm 380nm 780nm 380nm ϕ( λ)p( λ) dλ; ϕ( λ)d( λ) dλ; ϕ( λ)t( λ) dλ; (7.2-2) ahol: P, D, T a protos, deuteros illetve tritos típusú csapok kimenõ jele, p(λ), d(λ), t(λ) az egyes csapok spektrális érzékenysége, ϕ(λ) a csapokat megvilágító fény spektrális eloszlása. A csapok az õket megvilágító fényt a spektrális érzékenységüknek megfelelõen elnyelik, s az elnyelt energiának megfelelõ ingert továbbítják az agyba. A P, D, T ingerek egymáshoz viszonyított értékei alapján alakul ki a színérzet. Amennyiben ez az integrál azonos, hiába különbözõ a tárgyak által visszavert fény spektrális hullámhossz eloszlása, szemünk azokat nem képes megkülönböztetni. Egyébként a tárgyak valóságban azért lesznek különbözõ színûek (színárnyalatúak), mert a rájuk esõ fénysugárzás
14 Számítógépes képelemzés színét módosítja a felületük hullámhossztól függõ - fényvisszaverõ képessége. A tárgyak színét a fényforrás spektrális eloszlásának és a tárgy felületére jellemzõ spektrális reflektancia függvénynek a szorzata határozza meg. A következõkben bemutatjuk az emberi látás néhány olyan jellegzetességét, amelyeknek a képi információk feldolgozásakor különös jelentõsége van: a) A geometriai felbontóképesség a hullámhossz függvénye (7.2-10. ábra), amely zöld fény esetén maximumot mutat. A látható színtartomány széleihez közelebb esõ színek esetén ez a felbontóképesség romlik. b) A relatív fényérzékenység is a hullámhossz függvénye, amennyiben különbözõ hullámhosszúságú fényforrás ugyanolyan intenzitású fényt bocsát ki, a zöld fényforrást érzékeljük fényesebbnek (7.2-11. ábra). Itt is a vörös és a kék tartományban kisebb az érzékenység. 7.2-10. ábra. A relatív felbontóképesség
Számítógépes képelemzés 15 7.2-11. ábra. A relatív érzékenység c) Összetett alakzatok érzékelésekor törekszünk a folytonosságra, a d) 7.2-12. ábra a) képét egy négyszögvonalból és egy görbe szakaszból összetevõdõnek látjuk és nem három különbözõ geometriai idomnak. Keressük a zárt alakzatokat, a e) 7.2-12. ábra b) rajza nem egy folyamatos vonalnak látszik, hanem két zárt formának. Törekszünk a szimmetria felismerésére a f) 7.2-12. ábra c) képét nem W és M betûkbõl összetevõdõnek, hanem egy szimmetrikus vonalcsoportnak tekintjük. Képesek vagyunk az élek meghosszabbítására, így geometriai alakzatokat láthatunk ott, ahol azok a valóságban nem léteznek (7.2-13. ábra). Egymással érintkezõ sötét és világos képmezõ részletek határvonala mentén a sötétebb rész még sötétebbnek a világost még világosabbnak látjuk, ez az ún. Machféle jelenség (7.2-14. ábra).
16 Számítógépes képelemzés 7.2-12. ábra. Összetett alakzatok a) folytonosság érzékelése, b) zárt alakzatok, c) szimmetria felismerése 7.2-13. ábra. Viruális alakzatok érzékelése az élek meghosszabbításával a) virtuális háromszög, b) hatágú csillag, c) HÉT felirat
Számítógépes képelemzés 17 7.2-14. ábra. A Mach-féle jelenség
18 Számítógépes képelemzés A mindennapi életben többször találkozunk olyan jelenséggel, amely elsõ látásra megtéveszt bennünket. Ezt nevezzük optikai csalódásnak *. Ilyen optikai csalódások: hosszúsági csalódások, iránycsalódások, nagyságbeli csalódások, távlati csalódás, valamint az ún. szétsugárzási jelenség és a többértelmûség. Ezekre mutatunk be példákat a következõkben. Hosszúsági csalódások (7.2-15. ábra). A vonalszakaszok szemünk által érzékelt hosszúságát a vonalszakaszokra rajzolt osztás, a környezetben lévõ más szakaszok hosszúsága vagy a nyilak dõlési iránya egyaránt befolyásolja. A vízszintes hasábokból álló négyszöget keskenyebbnek érzékeljük, mint a függõleges hasábokból összerakottat. A függõlegesen álló hasábokat a valóságosnál szélesebbnek látjuk. A ferde téglalap átlóit az iránytól függõ távolságúra becsüljük. Alakváltozás (7.2-16. ábra). A tárgyak látszólagos alakját befolyásolja, hogy milyen irányú vonalak közé helyezzük. A Poggendorff-féle optikai csalódás az a jelenség, amikor egy vastagabb vonallal rajzolt geometriai idomba befutó ferde vonalak látszólag nem folyamatosan, hanem egy kicsit eltolódva folytatódnak. Ennek oka, hogy a szemünk a vastag vonalon kicsit tovább fut, így a vékonyabb vonal folyamatossága megszakad. Az egymással párhuzamosan futó vastagabb egyenesek a ferde vékonyabb vonalak hatására látszólag összetartanak. Méret csalódások. Az azonos méretû köröket látszólag különbözõnek látjuk (7.2-17. ábra) attól függõen, hogy milyen környezetben helyezkednek el. A négyzetek mérete is megváltozhat, amint ellipszis darabokat rajzolunk a négyzetek végére (7.2-18. ábra). Ezeknek a jelenségeknek az a magyarázata, hogy a szemünk sosem mozdulatlan, hanem akkor is végez rezgéseket, mikor szándékunk szerint egy pontra nézünk. A különbözõ geometriai alakzatok hatására hol a szélen, hol a középpontban látunk, és így az eredeti formák módosulnak. Kontraszthatás (7.2-19. ábra). A sötét háttérben megjelenõ világos mintákat mindig nagyobbnak látjuk, mint a világos alapon lévõ sötét mintát. Ezt a jelenséget világossági kontrasztnak nevezzük. Másik esetben a fekete-fehér vonalak alkotta rácsot nézve a keresztezõdésekben a valóságban nem létezõ szürke foltokat veszünk észre. Többértelmûség (7.2-20. ábra). Egy kép környezetét huzamosabb ideig figyelve hol az egyik, hol a másik részlet kerülhet elõtérbe, ami az összképben jelentõs változást okoz. Ha a tárgy vagy ábra kiemelkedik, a háttér vagy alap elmosódottá válik. Ilyen többértelmû kép a Rubin-ábra vagy a Necker-kocka. * A jelenséget másképpen vizuális illúziónak nevezzük.
Számítógépes képelemzés 19 7.2-15. ábra. Hosszúsági csalódások a) hosszúsági csalódás, b) hasábok méretének torzulása, c) ferde téglalap átlóinak látszólagos hoszúsága
20 Számítógépes képelemzés 7.2-16. ábra. Alakváltozás a) alakváltozás ferde vonalak között, b) Poggendorf-féle optikai csalódás, c) párhuzamos vonalak torzulása
Számítógépes képelemzés 21 7.2-17. ábra. Nagyságbeli csalódás körök esetén 7.2-18. ábra. Nagyságbeli csalódás különbözõ síkidomoknál a) körök, b) négyzetek
22 Számítógépes képelemzés 7.2-19. ábra. Fehér és fekete idomok a) szétsugárzás, b) kontraszt a) b) 7.2-20. ábra. Többértelmûség a) Necker- féle kocka, b) Rubin ábra
Számítógépes képelemzés 23 7.3. A képfeldolgozás története Elsõ generációs rendszerek Amikor létrejött a televízió a TV-kamerák segítségével lehetõvé vált a képek elektromos jelekké való átalakítása. Az automatikus képelemzõ rendszerek kialakulása gyakorlatilag ekkor kezdõdött. Az elsõ rendszerek egy TV-kamerából és egy analóg feketedés mérõ mûszerbõl álltak (7.3-1. ábra) A kvantitatív televíziós mikroszkóp (Quantitative Television Microscope), amelyet a Metals Research Ltd. fejlesztett ki (Underwood(1970)), nem volt képes egyedi objektumok mérésére, csupán arra szolgált, hogy meghatározza a teljes látótérben elõforduló sötét világos területek arányát. 7.3-1. ábra. Kvantítatív televiziós mikroszkóp A technológia további fejlesztésével ez a kvantitatív televíziós mikroszkóp alkalmassá vált objektumok elemzésére is. A mérés alapja az volt, hogy a TV vonalak hányszor metszettek bele ezekbe az objektumokba. Ezeknek az adatoknak az összegyûjtésével lehetett az objektumok darabszámát és kerületét meghatározni. Ezzel megnyílt az út a modern képelemzõ rendszerek kifejlesztéséhez. Persze ezen az úton még számos problémát kellett megoldani, mint például azt, hogy ha az objektum két vagy több nyúlvánnyal rendelkezett, akkor az elektronsugár az objektumba kétszer vagy háromszor metszett, és így a darabszám több volt a valóságosnál.
24 Számítógépes képelemzés 1968-ban Bausch & Lomb kidolgozta az elsõ képelemzõ rendszert, amely a fekete-fehér képet mikro-számítógép segítségével tárolta. Ebben az idõben a számítógépek memóriája még nem volt eléggé fejlett, ezért nem a teljes képet, hanem csak a szürke szintek átmeneteit (A) rögzítették a berendezésben (7.3-2. ábra). Ezzel a képi információk jelentõs tömörítését lehetett elérni, s a rendszer már alkalmas volt egyedi objektumok vizsgálatára is. Második generáció 7.3-2. ábra. Képek tömörítése A Bausch & Lomb továbbfejlesztette rendszerét és létrejött a Quantimet 720, az elsõ teljesen digitális elven mûködõ képelemzõ. A berendezés a képet egyedi képpontok (pixel) formájában tárolta, minden egyes képpont 64 különbözõ szürkeségi szinttel rendelkezhetett. Ebben az idõben a számítógép memóriák még eléggé egyszerûek voltak (1969-70.), így a Quantimet alacsony frissítési sebességet használt (10 kép/másodperc). A hetvenes évek elején kezdtek megjelenni az egyre korszerûbb számítógépek, és így a képelemzõ rendszerek is tovább fejlõdtek, képesek voltak egyre több paraméter meghatározására, és az egyedi objektumok minél teljesebb jellemzésére. 1974-ben a LEITZ radikálisan megváltoztatta az addig alkalmazott technológiát, s létrehozta a LEITZ TAS rendszert. A berendezés teljesen új koncepció szerint épült fel, amelynek alapja az a matematikai morfológia volt, amelyet az Ecole de Mines de Paris munkatársai dolgoztak ki. Ekkor
Számítógépes képelemzés 25 vezették be a képfeldolgozás legfontosabb alapmûveleteit: az eróziót, a dilatációt és a vázszerkezet elõállítását. Az erózió/dilatáció segítségével a képelemek (objektumok) méretét egy-egy képponttal csökkenteni/bõvíteni lehet, míg a vázszerkezet elõállítása (szkeletonizáció) egy olyan sok lépésbõl álló eróziót, aminek a végeredménye az objektum egy képpont szélességû vázszerkezete (7.3-3. ábra). A mûveletek végrehajtásával illetve kombinációjával lehetõvé vált a képek még teljesebb elemzése. Harmadik generáció 7.3-3. ábra. Morfológiai mûveletek 1980-81. között a Kontron és a Cambridge kifejlesztette a teljesen szoftver alapú képelemzõ berendezést (7.3-4. ábra). Ez a rendszer a teljes képet rögzíti a számítógép memóriájában. Így lehetõség van az eredeti (szürke) képek szûrésére, valamint az átalakított képek közötti logikai mûveletek elvégzésére. A szoftverek különbözõ algoritmusokat használnak a képek detektálására, mérésére, illetve az objektumok megkülönböztetésére. A nyolcvanas években tovább fejlõdtek a komputerek, növekedett a memória, s a mûveleti sebesség. A képelemzõ rendszerek sebessége is növekedett: százszor gyorsabbak lettek, mint a hetvenes években. A képek mérete 512x512 vagy 1024x1024 képpont (pixel) volt. A számítógépeknek egy szürke kép átalakítására 5-60 másodpercre volt szükségük, míg egy gyors Fourier transzformációt (FFT Fast Fourier Transform) 10 másodperc alatt tudtak elvégezni. A kutatólaboratóriumokban és a minõségellenõrzõ központokban ez a sebesség nem volt elegendõ a napi rutin vizsgálatokhoz.
26 Számítógépes képelemzés Negyedik generáció 7.3-4. ábra. Szoftver alapú képelemzõ A képfeldolgozás és az elemzés sebességének a növelésére több lehetõség kínálkozott. Az egyik esetben a képek rögzítését és a különbözõ képfeldolgozó mûveleteket egy megfelelõ célszámítógép, hardver segítségével végezték el. A speciális integrált áramkörök képesek voltak a képek gyors feldolgozására, szûrésére, az objektumok megkülönböztetésére és a mérésre. Ezekhez az ún. morfológiai processzorokhoz kapcsolt személyi számítógépek csupán az adatok kiolvasását, és a mûveletek irányítását végezték el. Ilyen hardver-alapú képelemzõket az IBM, a Macintosh, a VAX, a SUN fejlesztett ki. Ezen rendszerek hátránya volt, hogy a hardver-alapú integrált áramköröket nehezen lehetett adaptálni a különbözõ alkalmazásokhoz, rendszerint a C nyelven megírt képfeldolgozó programokat nem lehetett módosítani. Annak érdekében, hogy a képfeldolgozás mûvelete mégis felhasználóbarát maradjon, a C nyelvû programokat grafikus felhasználói felülettel kombinálták. Az utóbbiakat személyi számítógépeken futtatták. Ilyen rendszert fejlesztett ki a Clemex Technologies is.
Számítógépes képelemzés 27 7.3-5. ábra. Képelemzõ és morfológiai processzor Ötödik generáció A személyi számítógépek memóriájának és a CPU sebességének növekedésével lehetõvé vált a szoftver-alapú képelemzõ további fejlesztése. Az ötödik generációs eszközök olyan személyi számítógépek, amelyekben képfeldolgozó kártyát helyeznek el a videokamerák jelének átalakítására és a képek számítógépen való tárolására. Az újabban kifejlesztett teljesen digitális kamerákhoz már ezekre a képfeldolgozó kártyákra ( frame grabber card ) sincsen szükség, mert a képi információt a szabványos párhuzamos porton keresztül is képes a számítógép fogadni. Ezzel a fejlesztéssel a képfeldolgozó rendszerek a kutatólaboratóriumok és az ipari üzemek világából a mindennapi élet területére kerültek át. Újabb fejlõdést az intelligens-rendszerek megjelenése adhat, amelyek a feldolgozott képek alapján már tanulni is képesek, s nemcsak passzív, hanem aktív módon tudják elvégezni a képek feldolgozását, osztályozását.
28 Számítógépes képelemzés 7.4. Digitális képfeldolgozás 7.4.1 Bevezetés Ebben a fejezetben a képfeldolgozás és a matematikai morfológia azon mûveleteit mutatjuk be, amelyek a gyakorlati képelemzés során kiemelt fontosságúak. Nem nélkülözhetõk az egyes sztereológiai paraméterek mérésekor és nem hagyhatók figyelmen kívül azok értelmezésénél sem. Akár egy egyszerû zajszûrésrõl legyen szó, akár egy összetettebb szemcsehatár-meghatározás legyen terítéken, a szükségtelenül eltávolított, vagy tévesen bevitt információ mind-mind a mérési eredmények megbízhatóságát rontja. A képfeldolgozás alkalmazásakor érvényes általános elv, hogy a kevesebb - jobb, ám maga a szubjektív választás többnyire nem nélkülözhetõ. Itt foglalkozunk a képek mérésre történõ elõkészítésével, ám nem elemezzük a kívánt pontosság eléréséhez statisztikailag szükséges sokaságot (részben a paraméterek sokrétûsége, részben a könyv véges terjedelme miatt), így nem kerül sor az egyes képelemzési hibák számszerûsítésére sem. Ugyancsak nem térünk ki az egyes automatikus képelemzõk, illetve képelemzõ-szoftverek (vö. negyedik és ötödik generáció) számítástechnikai hátterére sem, ugyanis ez eszközönként változó. Ezeket azonban érdemes figyelembe venni legyen szó akár az egyes mért paraméterek közötti korrelációról, akár a mérési hibák számszerûsítésérõl. A paraméterek közötti korreláció gyakran a szoftverek mûködésének eredménye, mivel ezek egy-egy paramétert valamely másik mért értékbõl számítanak, s így mindkettõt "mérni" szükségtelen. Hasonlóan nem elemezzük a veszteséges tömörítéssel elmentett képek hibáit sem. Az egyes matematikai - matematikai morfológiai bizonyításokat, indoklásokat a lehetõségekhez mérten mellõzzük: megpróbáljuk minél gyakorlatiasabban megközelíteni a képfeldolgozást. Felhívjuk azonban a figyelmet arra, hogy a téma (tekintsük akár a konvolúciós elveket, a Fourier-transzformációs módszereket, vagy akár a képtömörítés, esetleg a morfológiai képátalakítások témakörét) kivételesen széles matematikai háttérrel rendelkezik, amelynek irodalma több kötetre rúg (Serra, 1982). Röviden a fogalmakról: "pixel" alatt képpontot (picture element), "bináris kép" alatt két színbõl (fekete és fehér) álló képet, "digitális kép" alatt pedig képpontok alkotta (amelyek 2 n szürkeségi szintûek lehetnek, n=8,9,10, ) képet értünk.
Számítógépes képelemzés 29 7.4.2 A képelemzés folyamata A képelemzés célja a jellemzõ paraméterek pontos és reprodukálható mérése. Ez legkönnyebben számítógéppel végezhetõ el, az alábbi lépésekben (mint ahogy errõl az elõzõ fejezetben már volt szó): 1) Képbevitel: a képek elektronikus formában történõ elõállítása, függetlenül a beviteli eszköztõl, amely lehet videokamera, digitális fényképezõ, scanner, videomagnó, stb. 2) A szürkekép elõállítása, digitalizálása: szürkeségi szintek hozzárendelése a kép egyes intenzitás értékeihez vagy egyes színeihez (RGB/XYZ színrendszerek). 3) Szürkekép-átalakítások: a vizsgálni kívánt jellegzetességek, objektumok kihangsúlyozása annak érdekében, hogy azokat még pontosabban detektálhassuk. 4) Szegmentálás (detektálás): az objektumok és a háttér elkülönítése valamilyen tulajdonságuk (pl. szürkeségi szintjük) alapján, aminek eredményeképpen bináris kép áll elõ. 5) Bináris transzformációk: az objektumok átalakítása, a mérendõ jellegzetességek elvi értelmezésüket leginkább megközelítõ alakra hozása (pl. a képen összetapadt, de a valóságban különálló szemcsék szétválasztása). 6) A kívánt mérés elvégzése, az eredmények értelmezése és dokumentálása. Az elõzõ fejezetben a képbevitelt és a szürkekép elõállítását (1 és 2 pontok) már részletesen bemutattuk, most a szürkekép-átalakításokat, a szegmentálást, a bináris átalakításokat és a mérést tekintjük át. Mielõtt erre rátérnénk, a teljesség kedvéért érintjük a képek tömörítésének témakörét: magyar nyelven is elérhetõ több olyan képfeldolgozással foglalkozó szakkönyv, amelyben a témakör matematikai háttere, hibaanalízise részletesen megtalálható (Álló (1985), Berke (1996, 2000)). Digitális képtömörítésrõl van szó - az eredmény tehát bizonyos matematikai algoritmusok számítógépes implementációja során áll elõ és elsõsorban az adatátvitel és a képarchiválás-dokumentálás fokozódó igénye miatt szükséges. A kép hordozta információ tárolása az egyes számítógépes képformátumokban nem egyformán helytakarékos. Definiáljuk a redundancia fogalmát az adat fogalmán keresztül: adat az, ami az információt hor-
30 Számítógépes képelemzés dozza, így redundánsnak nevezzük azt az adathalmazt, amely nem a legkevesebb adattal jellemzi ugyanazt az információt. Több vállfaját különböztethetjük meg, így például: 1) Kódolási redundancia: ha csak 0 és 255 szürkeségi szint van, az egy byte/képpont helyett ugyanazon képet 0 és 1 értékekkel kódolva egy bit/képpont arány érhetõ el. 2) Képi redundancia: homogén háttér elõtt azonos színû objektumok esetén elegendõ a határvonalakat tárolni, jó tömörítés érhetõ el, ha a határoló vonalak végigjárása során a lépéseknél az elõzõ lépéshez viszonyított irányt tároljuk, valamint akkor, ha az alakzatok szabályosak. 3) Pszichovizuális redundancia: az emberi szem számára információt nem hordozó adatok elhagyásával tömörítés lehetséges (24 bites tárolás csökkentése, zajszûrés, méretcsökkentés). Fontos kihangsúlyozni, hogy a képek tömörítése elsõsorban a redundáns információ kiszûrésével lehetséges. Definiáljuk a tömörítési arány fogalmát a tömörítés utáni adatmennyiség és az azt megelõzõ adatmennyiség hányadosaként. Ez az egyik legfontosabb jellemzõ, ami az egyes tömörítõ-eljárásokat rangsorolja, míg a másik a tömörítés során fellépõ információveszteség. Információveszteség szempontjából megkülönböztethetünk veszteségmentes és veszteséges tömörítési módszereket. Veszteségmentes tömörítési mód például a változó hosszúságú kódolás és a kontúrkövetés. A változó hosszúságú kódolás azon alapul, hogy amíg a szürkeségi szint értékei széles tartományban vehetnek fel értékeket, ezen értékek változásai általában zajszegény képeken keskeny értékkészletû, 0 átlagértékû függvénnyel jellemezhetõk. Azaz minél nagyobb a különbség abszolút értéke, annál kisebb valószínûséggel fordul elõ. Így a gyakoribb értékekhez a rendelkezésre álló készletbõl rövid kódot, a ritkábban elõfordulókhoz hosszabbat rendelünk, a kódolt eredmény tároló igénye az eredetinél kisebb lesz. A kontúrkövetés során azt használjuk ki, hogy míg a kontúr egy (x,y) pontja 8 biten adott, a további pontok ehhez viszonyított iránya már 3 biten tárolható. Veszteséges tömörítéssel jóval nagyobb tömörítési arányt érhetünk el, mivel a látvány változatlansága mellett bizonyos részletek elhanyagolhatók. Ez a képelemzõ munka szempontjából kisebb jelentõséggel bír, ugyanis egy, a mikroszerkezetrõl készült felvétel kvantitatív kiértékelése esetén nem a látvány minõsége az elsõdleges szempont. A legfontosabb talán a jpeg-szabvány, a diszkrét cosinus-transzformáció egyik legjellegzetesebb alkalmazási módja: ekkor a kép transzformáltjából a gyors vál-
Számítógépes képelemzés 31 tozásokért felelõs nagyfrekvenciás tagokat elhanyagolva jutunk kisebb tárterületet igénylõ formához, anélkül, hogy a látvány érdemben romlana. 7.4.3 Szürkekép-átalakító mûveletek A szürkekép elnevezés - a hétköznapi szóhasználatban fekete-fehér kép - arra utal, hogy a képpont mátrix értékei csak világosságkódokat tartalmaznak, azaz a fekete-fehér intervallumon belül különbözõ szürkeségi szintek alkotják a képet. Ez nagyban leegyszerûsíti az elvégzendõ matematikai mûveleteket, attól függõen, hogy 256, 512, 1024, stb. szürkeségi szintre bontottuk fel az adott képet. Színes képek elemzésére e helyütt nem térünk ki, csupán megemlítjük, hogy hasonló mûveleteket végezhetünk a színes kép három színsávja közül külön-külön bármelyiken, mivel a telítetlenséget szürkeségi szintként is felfoghatjuk. Az egyes színsávokban végzett mûveletek kombinációjaként rengeteg információhoz juthatunk. Ennek tárgyalása meghaladja e könyv kereteit. E módszereket napjainkban egyre kiterjedtebben alkalmazzák biológiai és orvostudományi szövetképek elemzésekor. Kiemeljük, hogy léteznek összefüggések színes képek szürkeképként történõ elemzésére, ekkor az egyes színekhez (színsáv-kombinációkhoz) egyegy szürkeségi szintet rendelünk, átalakításokat végzünk, majd az eredményt visszaalakítjuk a hozzárendelési táblázat alapján (Serra (2000)). A digitalizált képek gyakran nem olyan minõségûek, hogy bármiféle átalakítás nélkül méréseket végezhessünk rajtuk (elektromos zaj; szenynyezõdés; csiszolási, maratási hibák, stb.). Ezért szükséges "kijelölnünk", detektálnunk a kép kívánt tartományait, amelyeket azután számszerûen jellemezhetünk. Ezt nevezzük bináris képpé alakításnak, vagy szegmentálásnak, és többnyire - mivel ez a legkézenfekvõbb megoldás - egy-egy szürkeségi szint alatti illetve feletti képpontok elkülönítését értjük alatta. Ekkor a szürkekép átalakító mûveletek célja, hogy az objektumokat, amelyeket mérni kívánunk egy szürkeségi szintre hozzuk, esetleg egy szürkeségi szint-tartományba transzformáljuk. A szegmentálás azonban nem csak a küszöbértékeken keresztül valósítható meg: lehetséges az objektumok más jellemzõjük alapján történõ elkülönítése is, pl. textúra, morfológia. Erre jó példa a lemezes szerkezet azonosítása a periodikus textúra alapján. Ez a szegmentálás azonban nem más, mint egy olyan morfológiai transzformáció, amely az adott textúrát adott szürkeségi szintre alakítja, míg másokat változatlanul hagy. Így a
32 Számítógépes képelemzés továbbiakban a szürkeségi szint alapján történõ szegmentálásra, az ún. detektálásra szorítkozunk. Érdekesség, hogy léteznek "tanítható" képelemzõ rendszerek is: ezek a felhasználó által megjelölt tartományok sajátosságai alapján azonosítják a többi hasonló tartományt (Komenda (2000)). Megjegyzendõ, hogy sok probléma megoldható mind szürkeképen, mind bináris képen végzett mûveletek segítségével. A szürkeképátalakítások elõnye, hogy a kép teljes információtartalma figyelembe vehetõ, még a binárissá konvertálás elõtt. Szürkekép-átalakításokat a fentiekkel összhangban tehát akkor használunk, ha az elõállított bináris kép információtartalma eltér az eredetitõl. 7.5-1. táblázat. Szürkekép- és bináris átalakítások Probléma Megoldási lehetõség * "Lyukas" alakzatok Lyukkeresõ és -kitöltõ algoritmusok mind a szürke-, mind a bináris képen Szakadozott határok Nyitás, Zárás, bármelyik képen Zaj Nyitás a bináris képen; Nyitás fehér, Zárás fekete zaj esetén, a szürkeképen Érintkezõ részecskék Zárás a bináris, Vízválasztó-transzformáció a szürkeképen Az objektumok különbözõgradiens, ezt követõen Detektálás szürkeségi szintûek Szegmentálás szürkeségi szint szerint Ez az ún. detektálás, amely nem más, mint a kép figyelembe venni és elhanyagolni kívánt tartományainak elkülönítése. Értelemszerûen három eset lehetséges: valamely adott szürkeségi szint alatt megtartani a képpontokat, s a többit nem figyelembe venni, ennek inverzeként megtartani az adott szint felettieket, valamint két megadott szint közé esõ képpontokat megkeresni s a továbbiakban ezeket figyelembe venni. A detektálást követõen a képpontok szürkeségi szintjérõl már nem beszélhetünk: az egyes képpontokhoz 0 vagy 1 értéket rendeltünk (amelyeket egy egyszerû inverz képzéssel egymással megcserélhetünk, ha a komplementer halmazon kívánunk mûveleteket végezni). A detektálás a kép- A képátalakító mûveleteket a késõbbiekben részletesen bemutatjuk.
Számítógépes képelemzés 33 elemzési folyamat egyik legegyszerûbb, ugyanakkor talán a legkritikusabb pontja: mivel ekkor történik a mérendõ objektumok körvonalainak, határainak kijelölése ugyanakkor szubjektivitást is hordoz, ami a megfelelõ elõzetes szürkekép-átalakítással csökkenthetõ. Look-Up Table (LUT) transzformációk Más néven pontbeli intenzitás-transzformációk, általában egy meghatározott függvénykapcsolatot hajtanak végre az adott pontbeli szürkeségi szinten, így az eredmény csupán az adott pont kiindulási értékétõl függ, szomszédaitól nem. A kapcsolat gyakran matematikai (logaritmus, négyzet, négyzetgyök, exponenciális, komplementer képzés - azaz inverz kép elõállítása, stb.), ide tartozik a gamma-korrekció is: ( S ij S ) output max ( Sij ) = 1 S input max 1 γ (7.4-1) valamint a hisztogram-transzformációk, így a kiegyenlítés is. Az index nélküli S max ill. S min az ábrázolási tartomány határait jelentik (8 bites felbontásnál 0 ill. 255), míg ij indexszel az átalakítás elõtti (input) és utáni (output) kép pontjait jelöltük. Az eredményt az aktuálisan megjeleníthetõ, általában 0..255 szürkeségi szint-tartományba skálázzuk át, ahol a 0 a fekete, 255 a fehér szintjét jelöli: output ( S ) S ij ( S ) input max ij = 1 (7.4-2) max ( Sij ) Maga a detektálás is egyfajta pontbeli intenzitás-transzformáció. E módszerek célja gyakran csupán a kép megjelenítésének javítása, például a teljes szürkeségi tartomány kihasználásával (STRETCHING, mint hisztogram-transzformáció): ( S ) ( S ) ( S S input min input output ij ij max min min ij ) = ( S S ) + (7.4-3) max input min input ( Sij ) ( Sij ) Hisztogram alatt azt a diagramot értjük, amelynek vízszintes tengelyén a szürkeségi szinteket, függõleges tengelyén az adott szinthez tartozó képpontok számát ábrázoljuk. Stretching nyújtás.
34 Számítógépes képelemzés Megemlítjük, hogy a stretching ellentéteként az ún. SHRINKING az alábbi mûvelettel állítható elõ: S S ( S S max min output input min input min ij ) = (( S ) ( S ) ) max min ij ij + (7.4-4) input input ( Sij ) ( Sij ) A fényerõ módosítása (angol berendezéseken BRIGHTNESS ) a hisztogram eltolását jelenti, anélkül, hogy annak alakja megváltozna. A hisztogram-kiegyenlítés (EQUALIZATION ) egy elterjedt módszer a gyenge kontrasztú képek javítására, funkciójában tehát a stretching-hez hasonlít, ám gyakran kellemesebb látványt eredményez - fõként makrofényképek javításakor hasznos. Eredményként a lehetõ legegyenletesebb hisztogramot kapjuk (míg a stretching során a hisztogram általános alakja változatlan marad). A hisztogram-kiegyenlítés során az átalakítást alábbi lépéssorozatban hajthatjuk végre: 1) Állítsuk elõ a szürkeségi skála egyes értékeihez tartozó kumulatív összegeket! 2) Normáljuk az értékeket a 0..1 tartományba (osztás a képpontok számával)! 3) Szorozzuk meg ezen értékeket a maximális szürkeségi szinttel (8 bites képnél 255)! 4) A szorzat kerekített értékeit sorban rendeljük az egyes szürkeségi szintekhez! Mivel az eloszlásfüggvény a szürkeségi szintek függvényében monoton növekvõ, többé-kevésbé egyenessel közelíthetõ görbét kapunk, s így az output hisztogram közel egyenletes eloszlást tükröz. A hisztogramkiegyenlítés a szürkekép hisztogramjának módosítását jelenti annak érdekében, hogy az egyes szürkeségi tartományokba azonos darabszámú képpont essen. Bár alacsony kontrasztú képeken ez látványos javulást eredményez, az aktuális szürkeségi felbontás valójában nem javul, sõt, romolhat, mert általában több, azt megelõzõen különbözõ szürkeségi szint kerül ugyanazon értékre. A LUT transzformációkat gyakran valamilyen aritmetikai mûvelet követi, amely tulajdonképpen a négy számtani alapmûvelet elvégzését jelenti - értelemszerûen két input képbõl egy outputot elõállítva (amelyek Shrinking összehúzás. Brightness világosság. Equalization kiegyenlítés.
Számítógépes képelemzés 35 közül az egyik gyakran az eredeti, a másik pedig a transzformált kép). A transzformációt célszerûen megválasztva rengeteg, általunk nem kívánt információt szûrhetünk ki a képbõl. Egyébként maga a LUT kifejezés a számítástechnikai megvalósítás következménye, mivel a gyakorlatban a 256-féle szürkeségi szinthez tartozó 256-féle hozzárendelést kiszámítani és ezt követõen az egyes képpont értékeket kicserélni jóval kevesebb számítási igényel, mint minden egyes pontban elvégezni magát a transzformációt. Így például az invertálás a gyakorlatban a 7.5-1. ábra szerint zajlik: 7.5-1. ábra. Invertálás LUT transzformáció segítségével a) eredeti képmátrix részlete, b) táblázat, c) módosított képmátrix részlete Az LUT transzformációk másik csoportja jól szemléltethetõ egy olyan diagramon, ahol az input - output szürkeségi szintek hozzárendelését egyetlen görbe mutatja: az 1-el történõ szorzás tehát 45 fokos egyenesként, míg a kontraszt növelése - minthogy ez is egy pontbeli intenzitás-transzformáció - az egyenes meredekségének növekedéseként jelenik meg (7.5-2. ábra).
36 Számítógépes képelemzés 7.5-2. ábra. LUT transzformáció átviteli függvénye Az "Auto Contrast" transzformáció nem egyéb, mint a kép szürkeségi szintjének átkalibrálása a 0..255 tartományba az elõzõekben már említett egyenlet szerint. Hasonlóan az elõbbiekhez, az álszínes, "pszeudocolor" képek elõállítása ugyancsak LUT transzformáció: ha nagyon kis szürkeségi szintbeli különbségek (2-3) vizuális érzékeltetésére van szükség. A szem nagy színfelbontását kihasználva színezhetjük a képet, amivel a különbség azonnal nyilvánvalóvá válik (7.5-3. ábra).
Számítógépes képelemzés 37 7.5-3. ábra. Nem valódi színes (pszeud-color) képek elõállítása LUT transzformációval a) eredeti képmátrix részlete, b) táblázat a monitorral Végül, de nem utolsó sorban némiképp különállóként tárgyaljuk a háttérkorrekciót (shading correction). A megvilágítási vagy lencsehibákból adódó háttér hatásának kiküszöbölése érdekében a képelemzõ berendezések lehetõséget biztosítanak egy teljesen üres látómezõ (a gyakorlatban egy tükör) látványának elmentésére, amelyet - mint korrekciós tényezõt - felhasználva a késõbbiekben az elemzett képek valódi látványát jelenítik meg. Ez pusztán az illetõ korrigálandó képpont helyzetétõl függõ érték kivonását jelenti az elemzendõ kép szürkeségi szintjeibõl. Ekkor tehát nem output szürkeségi szintek hozzárendelése történik input szürkeségi szintekhez, hanem kivonandó szürkeségi szinteket rendelünk az egyes képpontok xy koordinátáihoz.
38 Számítógépes képelemzés Konvolúció A konvolúciós képátalakító mûvelet során a képpontok szürkeségi szintjét a szomszédok figyelembe vételével módosítjuk az alábbi módon. Helyezzük egy m x m méretû "kernel" (másképpen konvolúciós mátrix) középsõ elemét az input kép elsõ pontjára (7.5-4. ábra), szorozzuk meg a kép minden, a mátrixszal lefedett pontját a mátrix megfelelõ elemével, az eredményt normáljuk, végül helyettesítsük ezzel az értékkel az m x m szomszédság középsõ elemét (ez lesz az output szürkeségi szint a középsõ képpontnak megfelelõ helyen). Ezt követõen léptessük a mátrixot az input kép következõ pontjára és így tovább. 7.5-4. ábra. A konvolúció mûvelete a) eredeti képmátrix részlete, b) konvolúciós mátrix (kernel) Egyenlettel kifejezve: módosított 2 1 m S 5 = kisi (7.4-5) N i= 1 Itt N a normalizációs konstans, amely gyakran a konvolúciós mátrix elemeinek összege, de általános esetben bármilyen nullától különbözõ érték lehet. A konvolúciós kernelekre gyakran a szûrõ elnevezéssel hivatkozunk, ugyanis sok zajszûrõ, vagyis átlagoló kernelt alkalmazunk a gyakorlatban. Az átlagolás (AVERAGING, 7.5-5. ábra), lágyítás (SMOOTHING, 7.5-6. és 7.5-7. ábra), élkiemelés (EDGE DETECTION, 7.5-8. ábra), élesítés (SHARPENING, 7.5-9. ábra) igen jó példák arra, hogy milyen álta-
Számítógépes képelemzés 39 lánosan használható mûveletek végezhetõk el az adott pont környezetében lévõ szürkeségi értékek figyelembe vételével. Az átlagolás és a lágyítás hasonló mûveletek, az átlagolás során az egyes képpontok súlyozása azonos, egységnyi, míg lágyításnál a súlyozás biztosít lehetõséget a környezetbõl figyelembe veendõ pontok megadására és hatásának számszerûsítésére. A kernel hatásának mértéke az átlagolt terület nagyságától, azaz a kernel méretétõl is függ. Az élkiemelés (Laplace-, Sobel-kernelek, stb.) értelemszerûen az élek megkeresésére használatosak, függetlenül attól, hogy ez az él egy szemcsehatár, amelyiknek mindkét oldalán azonos szemcse van, avagy második fázisú részecske kontúrja, eltérõ fázisok között. a) eredeti kép b) kernel c) módosított kép 7.5-5. ábra. Átlagolás, N=9 a) eredeti kép, b) kernel, c) módosított kép 7.5-6. ábra. Lágyítás Gauss-típusú szûrõvel
40 Számítógépes képelemzés a) eredeti kép b) kernel c) módosított kép 7.5-7. ábra. Súlyozott-átlag kernel alkalmazása, N=3 Az élkiemelõ kernelek a képpontok szürkeségi szintje közötti különbséget veszik figyelembe a kép egyes irányaiban: a 7.5-8. ábrán bemutatott kernel a képpont bal és jobb oldala közti különbséget számítja, így a függõleges éleket keresi meg. Az él két oldalán a szürkeségi szint negatív helyettesítési értékhez vezethet: ekkor az értékek abszolút értékét vehetjük figyelembe, vagy átskálázhatjuk a szürkeségi szintek értékeit úgy, hogy pl. 0-127 a negatív, 128-255 a pozitív értékeket tartalmazza. a) eredeti kép b) kernel c) módosított kép 7.5-8. ábra. Függõleges él keresõ kernel
Számítógépes képelemzés 41 Egy másik érdekes élkiemelõ kernel a Sobel-operátor (7.5-9. ábra), amely a vízszintes éleket keresi meg, de 45 fokonként körbeforgatható, így más irányokban is alkalmazható. Az egyes irányokban kapott eredmények összevetésével a maximumot meghatározva kivételesen jó élképhez juthatunk. Általánosan: azon kernelek, amelyek elemeinek összege 0, élkiemelõ kerneleknek tekinthetõk, ugyanakkor a kapott eredmény nagyban függ az egyes elemek elhelyezkedésétõl. a) eredeti kép b) kernel c) módosított kép 7.5-9. ábra. Sobel-típusú horizontális él keresõ kernel Az élesítés nagyon szemléletes és tetszetõs eredményt ad, bár az output gyakran zajosabbá válik, ami meglehetõsen szûk korlátok közé szorítja ezen kernelek alkalmazhatóságát. A kernelek nagyon hasonlatosak az élkiemelésnél használatosakhoz, ekkor az elemek összege többnyire egy, ám ekkor a középsõ elem - az élesítés kívánt mértékétõl függõen - túlhangsúlyozott (7.5-10. ábra ).
42 Számítógépes képelemzés a) eredeti kép b) kernel c) módosított kép 7.5-10. ábra. Élesítõ kernel (a Scanning elektronmikroszkópos felvételt Kovács Árpád készítette) Szürkeképek morfológiai transzformációi Morfológiai transzformációk során az egyes képpontok szürkeségi szintjét ugyancsak szomszédaitól függõen változtatjuk meg, a bináris képek esetén logikai mûveletek, míg a szürkeképeknél "kisebb" / "nagyobb" relációk segítségével. A morfológiai transzformációk elõnye, hogy a lényegtelen információ kiküszöbölése megbízható módon zajlik, szemben a konvolúcióval, ahol a látvány átalakítása többnyire - bár kevésbé hangsúlyosan - megõrzi a lényegtelen részleteket. A gyakorlat azt mutatja, amennyiben pontos és megismételhetõ mérések elvégzése a cél, a legtöbb képelemzési probléma során a morfológiai transzformáció biztosítja a legmegbízhatóbb eredményt. Meg kell jegyeznünk, hogy mindezek ellenére nincs olyan mûveletsorozat, amely mindig kiemeli az objektumokat, azaz nem létezik általános érvényû eljárás. A módszer mindig a vizsgálat céljától, tárgyától, az elõkészítés és a képalkotás módjától függ. Szerencsére. Hiszen így alkalmasan megválasztott módszerekkel más és más információk nyerhetõk ugyanazon szerkezetrõl, még alaposabban jellemezve ezáltal magát az anyagot. Másrészt, bár lehetséges egy-egy próbatípushoz általános megoldást felállítani, mindig található olyan kép, amelyen az adott mûveletsorozat nem alkalmazható. Így tehát a morfológiai transzformációk célja nem egyetlen általános képátalakító-technika kialakítása, hanem a széleskörû alkalmazhatóság. Az alábbiakban áttekinjük a legygyakrabban alkalmazott morfológiai transzformációkat.
Számítógépes képelemzés 43 Az inferior (INF) és a superior (SUP) mûveletek eredménye két kép összehasonlításából adódik - értelemszerûen képpontonként történõ öszszevetésükkel. Az INF ill. SUP mûvelet az adott helyen álló képpont output szürkeségi szintjének rendre a két input kép megfelelõ képpontjainak szürkeségi szintje közül a kisebbiket ill. nagyobbikat rendeli. A leggyakoribb morfológiai transzformációk az erózió és a dilatáció. A figyelembe vett szomszédság méretét és alakját egy ún. szerkezeti elem (7.5-11. ábra), leggyakrabban egy 3x3-as négyzet jelöli ki. Így a szürkekép eróziója nem más, mint egy-egy pixel értékének helyettesítése az önmaga és nyolc szomszédja által alkotott csoport szürkeségi értékeinek minimumával, míg dilatáció során a maximumával. A morfológiai transzformációk általános jellemzõje, hogy megfordíthatatlanok: egy erodált kép eredetijét nem kaphatjuk vissza inverz mûvelettel, a dilatációval. Ezt a tulajdonságot gyakran kihasználjuk komplex képek átalakításakor (opening, closing, stb.). Az erózió és a dilatáció más megközelítésben komplementer mûveletek: miközben a háttér erodálódik, az objektumok dilatációját figyelhetjük meg (7.5-12.ábra). 7.5-11. ábra. Morfológiai transzformációk szerkezeti elemei
44 Számítógépes képelemzés a) eredeti kép b) erodált kép c) eredeti kép d) dilatált kép 7.5-12. ábra. Az erózió és a dilatáció eredménye a szürke képen
Számítógépes képelemzés 45 Szürkeségi szint 250 200 150 100 50 Szürkeségi szint 250 200 150 100 50 0 0 0 20 40 60 80 100 0 20 40 60 80 100 Képpont Képpont a) eredeti profil részlete b) erodált profil részlete Szürkeségi szint 250 200 150 100 50 Szürkeségi szint 250 200 150 100 50 0 0 0 20 40 60 80 100 0 20 40 60 80 100 Képpont Képpont c) eredeti profil részlete d) dilatált profil részlete 7.5-13. ábra. Az erózió és a dilatáció hatása a szürkeségi profilokra A szürkeségi profilok valamely kép adott képsorán szemléltetik a szürkeségi szintek változását. A 7.5-13. ábra mutatja, hogy a dilatáció nem eredményez (nem eredményezhet) magasabb szürkeségi szintet a képen, mint az eredeti maximuma, míg az erózió nem generál alacsonyabb szintet a kép minimumánál. Az opening, és a closing mûveletek az erózióból és a dilatációból származtathatók: a "nyitás" az erózió és az ekvivalens dilatáció, míg a "zárás" a dilatáció és az ekvivalens erózió egymást követõ végrehajtásából tevõdik össze. Az ekvivalens kifejezéssel arra utalunk, hogy nem fel- Elõfordulhat az az eset, hogy egy szürkeségi profilon a minimum csökkenését vagy a maximum növekedését látjuk ekkor az alkalmazott szerkezeti elem kétirányú kiterjedése miatt a figyelembe vett lokális minimum, illetve maximum nem az ábrázolt képsorban volt. A kép szürkeségi hisztogramján ez mindig tapasztalható.
46 Számítógépes képelemzés tétlenül egyetlen alkalommal történik a mûvelet; lehetséges két eróziót követõ két dilatáció végrehajtása is, de ekkor más eredményt kapunk, és így tovább. Az opening az apró és világos objektumokat távolítja el, míg a closing az apró, sötét jellegzetességek eltüntetésére használható (7.5-14. ábra). Az objektumok mérete az alkalmazott eróziók és dilatációk számától, valamint a szerkezeti elem alakjától és méretétõl függ. A szürkeségi hisztogram úgy változik, hogy nyitás során a kép nem lehet világosabb, mint az eredeti volt, azaz a szürkeségi szintek összege (a hisztogram alatti terület) legfeljebb megegyezik az eredetivel. a) eredeti kép b) nyitással módosított kép c) eredeti kép d) zárással módosított kép 7.5-14. ábra. Nyitás és zárás