A médiatechnológia alapjai



Hasonló dokumentumok
Loványi István vizsgakérdései kidolgozva (béta)

Készítette:

Képfeldolgozási módszerek a geoinformatikában

Mit lássunk élnek? Hol van az él? Milyen vastag legyen? Hol

Orvosi diagnosztikai célú röntgenképfeldolgozás

Számítógépi képelemzés

2) = 0 ahol x 1 és x 2 az ax 2 + bx + c = 0 ( a,b, c R és a 0 )

Konfokális mikroszkópia elméleti bevezetõ

1. óra Digitális képfeldolgozás

2. OPTIKA 2.1. Elmélet Geometriai optika

Feltételes formázás az Excel 2007-ben

Számítástechnikai és Automatizálási Kutatóintézet (MTA SZTAKI), 1111, Budapest, Kende utca 13 17,

Készítette: Bujnóczki Tibor Lezárva:

Mikrohullámok vizsgálata. x o

Gépjármű Diagnosztika. Szabó József Zoltán Főiskolai adjunktus BMF Mechatronika és Autótechnika Intézet

Számítógépes képelemzés projektmunkák 2012

Robotika. 3. Érzékelés Magyar Attila. Pannon Egyetem Műszaki Informatikai Kar Villamosmérnöki és Információs Rendszerek Tanszék

MATEMATIKA Kiss Árpád Országos Közoktatási Szolgáltató Intézmény Vizsgafejlesztő Központ

Jelalakvizsgálat oszcilloszkóppal

és követés Dr. Loványi István BME-IIT 2014 április

Kvantumkriptográfia III.

FAUR KRISZTINA BEÁTA, SZAbÓ IMRE, GEOTECHNIkA

Geoinformatika I. (vizsgakérdések)

NT Matematika 9. (Heuréka) Tanmenetjavaslat

MATEMATIKA 9. osztály Segédanyag 4 óra/hét

Corel PHOTO-PAINT X5 Maszkolástól nyomtatásig

Mössbauer Spektroszkópia

Következõ: Lineáris rendszerek jellemzõi és vizsgálatuk. Jelfeldolgozás. Lineáris rendszerek jellemzõi és vizsgálatuk

Számsorozatok Sorozat fogalma, példák sorozatokra, rekurzív sorozatokra, sorozat megadása Számtani sorozat Mértani sorozat Kamatszámítás

Geometriai alapfogalmak

Sugárkövetési algoritmusok (2. rész)

MŰSZERTECHNIKA Gépészmérnöki BSc Felkészülési kérdések és válaszok a ZH-hoz

Számítógépes grafika

Szeminárium-Rekurziók

ADATBÁZISKEZELÉS ADATBÁZIS

Mesterséges intelligencia, 7. előadás október 13. Készítette: Masa Tibor (KPM V.)

10. évfolyam, negyedik epochafüzet

Műszerek tulajdonságai

Aspektus könyvekben gyakran használt újszerű megfogalmazások szójegyzéke

- hányadost és az osztót összeszorozzuk, majd a maradékot hozzáadjuk a kapott értékhez

Kiegészítés a Párbeszédes Informatikai Rendszerek tantárgyhoz

Száloptika, endoszkópok

Diagnosztikai röntgen képalkotás, CT

Fraktál Univerzum /az áramló semmi/

TDK DOLGOZAT SZERZŐ: POZSEGOVICS PÉTER

TARTALOMJEGYZÉK ELŐSZÓ GONDOLKOZZ ÉS SZÁMOLJ! HOZZÁRENDELÉS, FÜGGVÉNY... 69

MUNKAANYAG. Dr. Engler Péter. A mérőfénykép. A követelménymodul megnevezése: Fotogrammetria feladatai

MUNKAANYAG. Földi László. Méret- és alakellenőrzések idomszerekkel, speciális mérőeszközökkel. A követelménymodul megnevezése:

(1. és 2. kérdéshez van vet-en egy 20 oldalas pdf a Transzformátorokról, ide azt írtam le, amit én kiválasztanék belőle a zh-kérdéshez.

Ergonómia előadás. Színek

Rajzolás PowerPoint 2007 programban

Dekonvolúció, Spike dekonvolúció. Konvolúciós föld model

Megjelenítési funkciók

HÍRADÁSTECHNIKA SZÖVETKEZET

Antik kinézet a Gimp segítségével

A lineáris programozás 1 A geometriai megoldás

Zárójelentés. Az autonóm mobil eszközök felhasználási területei, irányítási módszerek

képességgel és készséggel, hogy alkalmazni tudják matematikai tudásukat, és felismerjék, hogy a megismert fogalmakat és tételeket változatos

Matematika évfolyam

Újdonságok az ArchiTECH.PC V es verziójában

különösen a média közleményeiben való reális tájékozódást. Mindehhez elengedhetetlen egyszerű matematikai szövegek értelmezése, elemzése.

GAZDASÁGI STATISZTIKA

Az áprilisi vizsga anyaga a fekete betűkkel írott szöveg! A zölddel írott rész az érettségi vizsgáig még megtanulandó anyag!

TANMENETJAVASLAT AZ ÚJ KERETTANTERVHEZ MATEMATIKA 1. ÉVFOLYAM KÉSZÍTETTÉK: KURUCZNÉ BORBÉLY MÁRTA ÉS VARGA LÍVIA TANKÖNYVSZERZŐK 2013

Spektrográf elvi felépítése

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Dr. Engler Péter. Fotogrammetria 2. FOT2 modul. A fotogrammetria geometriai és matematikai alapjai

Összehasonlító elmozdulásmérés új lehetőségei a koherens optikai méréstechnikában

Általános gépészeti technológiai feladatok. Géprajzi alapismeretek Gépészeti szakszámítások

Fejezetek az abszolút geometriából 6. Merőleges és párhuzamos egyenesek

Helyi tanterv. Batthyány Kázmér Gimnázium Matematika emelt ( óra/hét) 9-12 évfolyam Készült: 2013 február

Modern Fizika Laboratórium Fizika BSc 22. Kvantumradír

Digitális Lakatfogós Multiméter AX-3550

MATEMATIKA TAGOZAT 5-8. BEVEZETŐ. 5. évfolyam

Matematikai statisztikai elemzések 1.

Elektromos zajcsökkentés vezetékelés és földelés szerepe. BME Fizika Tanszák Nanoszeminárium előadás Balogh Zoltán

Passzív optikai hálózat csillapításának mérése optikai adó-vevővel Összeállította: Békefi Ádám hallgató Mészáros István tanszéki mérnök

Hosszú élettartamú fényforrások megbízhatóságának vizsgálata Tóth Zoltán. 1. Bevezetés

Komputer statisztika gyakorlatok

statisztikai menürendszere Dr. Vargha András 2007

Optika feladatok (szemelvények a 333 Furfangos Feladat Fizikából könyvből)

LEÍRÁS. A gyártó cég fenntartja a jogot a készülék és a tartozékok összeállításának előzetes értesítés nélküli módosítására.

CCD detektorok Spektrofotométerek Optikai méréstechnika. Németh Zoltán

A MATLAB programozása. Féléves házifeladat. RGBdialog

különösen a média közleményeiben való reális tájékozódást. Mindehhez elengedhetetlen egyszerű matematikai szövegek értelmezése, elemzése.

EGÉSZSÉGÜGYI DÖNTÉS ELŐKÉSZÍTŐ

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Gráfelmélet II. Gráfok végigjárása

Tanmenet Matematika 8. osztály HETI ÓRASZÁM: 3,5 óra ( 4-3) ÉVES ÓRASZÁM: 126 óra

Matematika évfolyam. Vass Lajos Általános Iskola Helyi tanterv Matematika 1 4. osztály

Körmozgás és forgómozgás (Vázlat)

Az alap- és a képfelület fogalma, megadási módjai és tulajdonságai

Digitális képek szegmentálása. 5. Textúra. Kató Zoltán.

BIZONYTALAN ADATOK KEZELÉSE: FUZZY SZAKÉRTŐI RENDSZEREK

Környezetvédelmi mérések fotoakusztikus FTIR műszerrel

Slovenská komisia Fyzikálnej olympiády 51. ročník Fyzikálnej olympiády. Szlovákiai Fizikai Olimpiász Bizottság Fizikai Olimpiász 51.

SZABADALMI LEÍRÁS SZOLGÁLATI TALÁLMÁNY

4. A FORGÁCSOLÁS ELMÉLETE. Az anyagleválasztás a munkadarab és szerszám viszonylagos elmozdulása révén valósul meg. A forgácsolási folyamat

A TWAIN adatforrás használata

I. Gondolkodási módszerek: (6 óra) 1. Gondolkodási módszerek, a halmazelmélet elemei, a logika elemei. 1. Számfogalom, műveletek (4 óra)

Tantárgyi útmutató. Gazdasági matematika II.

Ittfoglalomösszea legfontosabbtudnivalókat, részleteka honlapon, illetvea gyakorlatvezetőtől is kaptok információkat.

Átírás:

A médiatechnológia alapjai Úgy döntöttem, hogy a Szirányi oktatta előadások számonkérhetőnek tűnő lényegét kiemelem, az alapján, amit a ZH-ról mondott: rövid kérdések. A rész és az egész: összefüggések a szenzorok mérési terében Scale-space axiómák Kicsinyítés/nagyítás során a kép lényege nem változhat meg. Ezt írják le az axiómák. - linearitás - eltolási invariancia - félcsoport - létezik infinitezimális generátor - lokális szélsőértékek helye nem változik - nem jön létre új tulajdonság - forgatási szimmetria Ha a képet a felére kicsinyítjük, akkor minden második pixelt eldobunk, ezzel sérül a mintavételi tétel. Az axiómák a Gauss simító függvény használatát teszik indokolttá. Simítás során a finom részletek eltűnnek, azonban a lényeg magmarad, így határozatlansági reláció alakul ki az alakzat helye és térfrekvenciája között. (Az emberi látás ezért több felbontást kezel.) A kicsinyítés/nagyítás során az élátmenetek helyei a scale-space axiómákat követik. Ezzel akár egy kép vázszerkezetét is megadhatjuk (Lindenberg). Anizotróp diffúzió Gradiensképzéssel meghatározzuk az éleket, majd ezek mentén Gauss függvény szerint alkalmazunk élsimítást úgy, hogy az élekre merőlegesen ne jöjjön létre elmosás. (Egyfajta mesterséges púderezés, fényképezőgépek, kamerák használják.) Az alakzat és minta szétválasztásához, textúra skála kiválasztásához is használhatjuk, ezért a képtömörítésben is van létjogosultsága. Skálafüggetlen lokális jellemzők Leírók, melyek segítségével a képpontok összehasonlíthatók. A lokális leírók specifikusak az alakra, így átfedések esetén kevesebb az információveszteség. Hessian detector Másodrendű deriváltképzéssel dupla élek állíthatók elő, a sarokpontok lesznek a jellemző pontok, amiken Gauss függvény szerint hajthatunk végre elmosást. Így az apró részletek nem zavarnak, a nagyok viszont nem tűnnek el. Automatikus skálakiválasztás (LOG) Lokális maximumképzést használ a skálajelzés leírására. 1

SIFT descriptor Egy kevésbé korrelált jellemző, mely meglehetősen bonyolult, és tovább nem tömöríthető. Az iránymenti gradiensek hisztogramját használja, és a textúrát elég jól leírja. Markovi kapcsolatok Markov véletlen mező (MRF) Alapfeltevés, hogy a szomszédos képpontok korreláltak, egymástól függnek. Lokális lépések során jutunk el a globális optimumba. Globális címkézéssel látjuk el a képpontokat, majd becsüljük az optimális címkézést (MAP). A becsült színt a képpontokra összehasonlítjuk a szomszédaival, az eltérést pedig büntetjük. Az iteráció során az energiaminimumra törekedve jutunk el a globális optimumba. Markovi jelölt pont folyamat (MPP) Valószínűségi leírással nyerünk ki alakzatokat. Az alakzatokat középpontjaik (pontfolyamat) és geometriai leírásaik (jelölés) együttesen határozzák meg. Gráf alapú képszegmentálás (textúrált területeken) A különböző jellegű területekhez eltérő textúrák tartoznak. (Az utakat élkereséssel lehet meghatározni, a beépített területeken nagyobb az élsűrűség, mint vegetáció esetén.) MRF modell segítségével színosztályokra bonthatjuk a képet, de megkülönböztethetünk textúrákat is az élsűrűség változásának figyelésével. Gráf alapú csoportosítás A különböző gráfok összehasonlításának gyakorlati jelentősége az arcfelismerésen túl a képek összeahasonlításánál van (pl. úthálózatok keresése textúra jellemzők alapján, retinavizsgálat, kínai betűk felismerése). Döntési és csoportosítási feladatok A klaszterező (csoportosító) függvénytől megköveteljük a skálafüggetlenséget, gazdagságot és konzisztenciát. Olyan klaszter, ami mindhárom tulajdonsággal rendelkezik, csak hierarchikus klaszterezés esetén van. Az alakfelismerés kihívásai Nehezíti az alakfelismerést, hogy az összehasonlítandó tárgy a referenciatárgyhoz képest más nézőpontban lehet, más a megvilágítás, skálázás, az alakzat takarásban van, eltorzult, zajos a kép, stb. Az emberi látáshoz gondolkodás, asszociáció is társul, éppen ezért a képfelismerés gyerekcipőben jár még. Óriási adatbázisokra és sok összehasonlítási paraméterre lenne szükség, nem is beszélve arról, hogy mit tekintünk egy adott tárgynak, pl. hogyan definiáljuk a széket. A képeket statisztikusan mintázatokra, alakzatokra daraboljuk, és ezekhez keresünk hasonló elemeket (pl. a bicikli vázból és kerékből áll). A feldarabolt képekhez leíróval együtt szavakat rendelünk, és ezeket hasonlítjük össze. (Két kerék és egy váz kiad egy biciklit, ha adott gráf szerint vannak összekötve.) 2

Sztochasztikus modellek Lucy-Richardson-algoritmus Kisebb méretű optikai lencsével készült fényképeken torzítás jelenik meg, azonban ez az algoritmus olyan kettős iterációt használ, amely ezt a torzítást javíta. (Képbecslésre és torzításbecslésre is felírható.) Vak dekonvolúció során a kimenetből becsüljük a bemenetet: felhasználjuk, hogy a fényesősség a fotonok valószínűségével arányos. Sztereókép mozgás alapján Két kamera képe összefésülhető azáltal, hogy az álló képpontokat egymásnak feleltetjük meg. 3D nézet előállítása A nézetek fúziója több irányból látott vetületek összekapcsolását jelenti. Képfeldolgozás A 2D képeket pixelek alkotják, melyek három-, négy- vagy hatszöges elrendezésben lehetnek. A 3D pixelek a voxelek, csak kockás elrendezésben lehetnek, ahol 6 lap, 18 él és 26 sarokszomszédság fordulhat elő. Mintavételezés Mintavételezés során a jelből kiválasztjuk az értékek egy véges halmazát, ezek a minták. Ez információvesztéssel jár, ezért meg kell határoznunk a legkisebb részletet, amire kíváncsiak vagyunk (térfrekvencia). Mintavételezési tétel Ha a jelben előforduló legnagyobb térfrekvenciájú jel frekvenciájának kétszeresével mintavételezünk, akkor információvesztés nélkül állítható vissza a mintákból az eredeti jel. Globális és lokális képi leírók A globális leírók az egész képet jellemzik (átlag, szórás, hisztogram), a lokális leírók csak egy részét (élek, átlag, szórás vagy hisztogram a kép egy adott részén). Hisztogram A hisztogram egy statisztikus eloszlás, mely azt mondja meg, hogy egy szürkeskálás kép adott világosságú képpontjaiból hány darab van. A hasonló színű területek általában Gauss-eloszlást követnek. Létrehozunk egy vektort, melyben annyi elem van, ahány kvantált szürkeskálás szín van. Végighaladva a pixeleken inkrementáljuk azt a vektorelemet, amelyik az adott pixel színéhez tartozik. Megjelenítés során a hisztogramot a kijelezhető maximális értékre normáljuk. Elkövethetünk a képen különféle transzformációkat a jobb láthatóság érdekében, de ezek plusz információt nem adnak a képhez. Hisztogram széthúzás A hisztogram széthúzása során a sötét-világos arányt meghagyva transzformáljuk úgy a képet, hogy a hisztogramot szétterítjük a nem használt színárnyalatokra is. A folyamat javítja a láthatóságot, de 3

ronthatja a vizuális élményt. Lineáris, négyzetes és négyzetgyökös transzformációs függvényt használhatunk. Hisztogram kiegyenlítés A hisztogram egy lépcsős transzformációs függvénnyel vonalassá alakítható, ezzel elérve, hogy a képen csak bizonyos színek jelennek meg. A kontrasztot növelhetjük vele, de akár fekete-fehérré is tehetünk egy szürkeárnyalatos képet. Színmegjelenítés A színek szűrők segítségével szétbonthatók a három alapszínre. Megtehetjük, hogy eltoljuk a színeket (hue rotation), vagy megváltoztatjuk a színtartalom arányát a fényerősséghez képest (saturation). Konvolúciók Konvolúciós eljárásokkal szűrések valósíthatók meg: elmosások (zajszűrések), élkiemelések, élszűrések (gradiensképzés). A konvolúcióval elmosott kép dekonvolúciós eljárással visszaélesíthető. Elmosás Fontos szempontok, hogy elmosás során megtartsuk az átlagot, (a konvolúciós együtthatók összege egy), az elmosás nem okozhat eltolódásokat (szimmetrikus), illetve, hogy izotróp, vagyis irányfüggetlen; minden irányban ugyanolyan hatású. Példa egy átlagoló konvolúciós kernelre: [ ] Élszűrés Egyik irányban gradiensképzés, másikban átlagolás (zajszűrés) megy végbe. Példa az x irányú gradiensképzést végrehantó konvolúciós kernelre: [ ] [ ] [ ] A konvolúciós ablak méretei miatt a kép szélén levő képpontokra akkor végezhető el a konvolúció, ha oldaltükrözést, körbejárást vagy konstanssal való feltöltést használunk. Tulajdonságok - f*g = g*f - f*(g*h) = (f*g)*h - f*(g+h) = f*g + f*h - a(f*g) = (af)*g = f*(ag) - F{f*g} = F{f}F{g} Műveletigény A konvolúció műveletigénye arányos a kernelmérettel, így nagy kernelméretre lassú lehet a művelet. A műveleti igény közelítő megoldásokkal csökkenthető. Egymás után elvégzendő konvolúciókat helyettesíthetünk egy olyan konvolúcióval, ahol a konvolúciós sugár a helyettesítendő konvolúciók sugarainak összege. 4

Élkeresés A képen az objektumok kontúrjait szeretnénk megkeresni, azon pontok halmazát, ahol a képpontok fényessége ugrásszerűen megváltozik. Élszűrő filter tulajdonságai - homogén területeken nem ad választ - izotróp (a szűrő válasza független az iránytól) - jó detekciót hajtson végre: zajokból származó hamis éleket ne találjon meg, ellenben az összes valódi élet találja meg - jó lokalizációt hajtson végre: a megtalált élek minél közelebb legyenek a valódi élekhez Képekre és élekre külön jel-zaj viszonyt definiálunk. Élek csak akkor detektálhatók, ha rájuk nézve a jel-zaj viszony 6dB felett van. Ha h az él amplitúdója, és σ a zajé, akkor Alapstruktúrák - él: drasztikus intenzitásváltás - vonal: vékony, hosszú, azonos szélességű és intenzitású tartomány - folt: azonos intenzitázú, zárt alakzatot képező régió - sarok: él vagy vonal törése, irányváltása Sokféle jelenség okozhat éleket: változhat egy 3D alakzat felületének normálisa ugrásszerűen, vagy változhat egy felületének mélysége folyamatosan. Éleket okozhatnak színváltozások és az árnyékok határán is megjelenhetnek. Éleknek van középpontjuk, irányuk és normálisuk, az élerősség pedig azt mondja meg, hogy mekkora az él intenzitása a környezetéhez képest. Az élkeresés módszerei Élek kereshetők első- illetve másodrendű gradiensképzéssel, vagy összetett módon (pl. Canny-szűrő). Léteznek ad-hoc módszerek, például a Sobel-operátor vagy a Roberts-oprtátor (45 fokos éleket emel ki). A Compass-filter egy pontban 45 fokonként végez gradiensmérést, és a legjobb válaszfüggvény irányát rendeli a képhez. Másodrendű gradiensképzésnél nem a szélsőértéknél, hanem a nullátmenetnél van az él; a zajhatásokat Gauss-féle eloszlással szűrjük, és mivel a másodrendű gradiensképzés a Laplace-operátort adja, a konvolúciót LOG operátorral valósítjuk meg. A Canny éldetektor azt a konvolúciós kernelt használja, ami a legjobban adja vissza az analóg képen végzett élkeresést. A Canny-szűrő egységnyi vastag élhálózatot hoz létre, főként lépcsős éleket talál azáltal, hogy a gradiensképzés után törli a nem lokális maximumokat, ezáltal élvékeonyítást hajt végre. Ezután hiszerézis küszöbölést alkalmazunk (thresholding), ami során az általunk megválasztott küszöbérték feletti jelet vesszük csak élnek, egy alsó küszöbszint alatti jelet pedig biztosan zajnak 5

tekintjük, és eldobjuk. A két szint közötti jelet akkor vesszük fel élnek, ha az élnormálisokra merőleges irányban nézve az egyik pontja élpont. Élerősítés Kontrasztosítás érhető el azáltal, hogy a jelből kivonjuk a másodrendű deriváltját. Jobbá is teheti a képet, de zajt is hozzátesz. Wallis-operátor Mivel a hisztogram műveletek nem szüntetik meg az elmosódát, lokális kontrasztkiegyenlítést használunk. A szürkeskálás kép várhatóértéke a fényerősség (M xy ), a szórása pedig a kontraszt (D xy ): úgy végezzünk el az élességfokozást, hogy ezek a tulajdonságok ne változzanak meg. Ha M 0 a megkövetelt átlagérték és D 0 a megkövetelt szórás, akkor az új kép felírható: Így az eltérés M 0 -hoz képest mozog, M 0 a kép elmosott része. Fotometria alapok Egy fényforrás a spektrális energia eloszlásával jellemezhető (adott hullámhosszon sugárzott fény teljesítménye). Egy fényforrás összteljesítménye ennek a hullámhossz szerinti integrálja. A szem által érzékelt fényesség függ a szem érzékenységi karakterisztikájától is (láthatósági görbe.) A CIE szabvány szerint három megfelelő erősségű, elemi színkomponensből állítjuk elő a színeket additív (színes TV) vagy szubtraktív (fényképészet, nyomtatás) színkeveréssel. Az RGB értékek megválasztása önkényes, azonban nem hordozzák a világosság információt, ezért koordinátatranszfortmációval az XYZ síkba térünk át az alábbi feltételekkel: - minden valós színingernek pozitív összetevők feleljenek meg - Y a fényerősség komponens - X = Y = Z = 1 az egyenlő energiájú fehér legyen. Így a színek euklideszi távolsággal összehasonlíthatók. Iterációs eljárások A számítási teljesítmény növekedésével olyan képfeldolgozási feladatokat el tudunk látni valós időben, melyek alig egy évtizede még elméletinek tűntek. Az iterációs eljárások alapgondolata, hogy a szomszédos képpontok nem véletlenszerűek, hanem korreláltak: alakokat, vonalakat, sarkokat adnak ki, így leírhatók, jellemezhetők valamilyen megváltozási valószínűséggel; Markov-mező írható fel rájuk. 6

Alapfeladat: légi felvételek összehasonlítása (történt-e beépítés). A képeket szegmentáljuk, a pixeleit oszályokba soroljuk be (kék/zöld, nagy élsűrűség), ezek alapján értelmezéssel töltjük fel a térképet (folyó/erdő, lakott terület). Ezeknek a besorolásoknak a képek közötti megváltozását vizsgáljuk. A kép azonban zajos: a lakott területeken is vannak fák, és nem lehet elmosást sem alkalmazni, mert akkor az utak tűnnének el (bizonytalan osztályhatárok). Ezek miatt Bayes-i valószínűségi modellt kell használni. (Mekkora a valószínűsége annak, hogy az adott objektum lakott terület, ha az élsűrűsége valamekkora.) Egy adott képpontra, és a szomszédjaira is felírunk egy valószínűségi modellt, és az energiakülönbségeiket összegezzük. A cél az, hogy lokálisan mindenki a minimum felé tartson úgy, hogy a szomszédja is vele együtt változik: így jön be az iteráció. A globális optimumot akkor érjük el, ha mindenki lokális minimumban van, és senki sem változik (befagy a rendszer). Textúrák elemzése Az élek közötti struktúrák leírására statisztikai jellemzőket használunk: másodrendű hisztogram. A mintázatok ismétlődési paramétereik statisztikusan becsülhetők. Például Fourier-transzformációval meghatározhatjuk a periodicitást, gradiensképzéssel megkaphatjuk a fő irányokat, majd a gradiens irányára vett hisztogramból következtethetünk az irányra. De azt is megtehetjük, hogy a kép egy cikkelyére végzünk Fourier-transzformációt. Egy terület kivágása azt jelenti, hogy a képet megszorozzuk egy 2D ablakozó függvénnyel. Azonban az ablakozó függvény nem lehet túl kicsi, mert akkor nem érvényesül a mintavételi tétel, és nem becsülhető meg a frekvencia. Ha túl nagy, akkor nem lesz jó a textúra. { } { } Olyan ablakozó függvényt kell választanom, aminek a Fourier-transzformáltja önmaga: Gaussfüggvény. A Gauss-függvénnyel történő ablakozó szűrőt Gábor-szűrőnek nevezzük. A textúra egy képi mintázat vagy valamely jellemzőjének ismétlődése. Nem kell periodikusnak lennie, elég, ha egy megadott elemkészletből dolgozunk, de lehet egy szabály, statisztika vagy képleírás ismétlődése is. (A homok is textúra, mert a szemcseméret adott, és a gyep is textúra, mert a fűszálak mérete és dőlése egyféle.) Julesz Béla függvények segítségével hozott létre textúrákat generált véletlen számokból. A képpontok korrelációját függőségi mátrixokkal írhatjuk le. Visszacsatolt konvolúciós szűrővel textúrák analízisére használható műveleteket egyidejűleg lehet elvégezni: konvolúció, dekonvolúció, mozgatás, korreláció és féltónusos kimenet. Textúra felismerést és szegmentálást is végezhetünk megfelelő szűrőáramkörökkel. 7

Kerület keresése, leírása A morfológiában éleket definiálunk, és logikai kapcsolatokat rendelünk hozzájuk. Hough-transzformáció Bináris képen kontúrokat keresünk: hosszú, folytonos éleket (pl. Canny-szűrővel). Az egyenes egyetlen ponttal leírható az origóból bocsátott merőleges, a távolság és a tengelyhez mért szög segítségével: - egy egyenes Hough-transzformáltja egyetlen pont - egy pont sokféle egyenessel leírható, így Houghtranszformáltja egy félszinusz - egy egyenes pontjai félszinuszok, melyek egy pontban metszik egymást A Hough-transzformáció segítségével egy szaggatott vonalat hozzárendelhetünk egy egyeneshez. Szürkeskálás képre is működik a Hough-transzformáció, ha a világosságra súlyozzuk. Zajos kép esetén szegmentálást is végrehajthatunk, így kiélesednek a kontúrok. Freeman-féle lánckód Egy kerület körbejárással jellemezhető; a különböző irányokhoz számokat rendelve megadhatjuk egy alakzat kerületét körbejárással. A Fourier-transzformáció csak a főirányokban végezhető el, ezért ez a felosztás nem ekvidisztáns (egymástól egyenlő távolságra levő). Aktív kontúrok és különböző éltérképek Aktív kontúr (snake) Energiaminimalizáló iterációs eljárás, ahol a körvonalat különböző erők vezérlik: - belső erők (pl. simasági feltételek a görbére) - külső, feltételes és képi erők (pl. kiinduló alakzat, élek, sarkok) A snake rátekeredik valami kezdeti kontúrra, rásimul a gradiensekre, és lokális energiaminimumkeresés során leírja azt. Egy elaszticitási paraméter segíti a rugalmasságot, és egy rigiditási paraméter segíti a merevséget: csökkenti a kilengéseket, azonban ez meg is akadályozza a snake-t, hogy a konkáv régiókba is bejusson. A képi alakzatokat (éleket és sarkokat) emeli ki, amelyek a minimumhelyeken találhatók meg. 8

Hátrányai: - érzékeny a kiindulási alakzatra - érzékeny a zajra - a konkáv régiókba nem tud belemenni Az aktív kontúr felhasználható objektumok körvonalának detektálására (pl. orvosi alkalmazásokban), éldetekcióra, képek összehasonlítására és mozgás követésére is. GVF Snake (Gradient Vector Flow) A külső energia negáltjának gradiense az élek közelében nagy, a homogén régiókban pedig nulla. Ennek megfelelően kis gradiensek esetén az energiát simítjuk, és csak nagy gradiensekre végezzük el az energiaminimalizálást. Előnyei/hátrányai: - kevésbé érzékeny a kiindulási görbére - kevésbé érzékeny a zajra a regularizációs paraméter miatt - a konkáv régiókba is bejut - a lokális maximumba ragadhat - a hegyes sarkokat, csücsköket lekerekíti A hátrányok kezelésére olyan külső energiát kell megválasztani, ami a sarokpontokat is megtalálja. Harris-féle sarokpont detektor A sarokpontoknál az intenzitás több irányban is meredeken változik. Ennek megfelelően megkülönböztethetünk lapos, él- és sarokrégiókat. A sarkosságot (görbület nagyságát) egyfajta karakterisztikus függvénnyel írjuk le: R. Értéke a sarkoknál pozitív, az éleknél negatív, és a lapos régiókban nulla, így lokális maximumkereséssel megkapjuk a sarokpontokat. A kinyert alakzatra már elvégezhetjük a GVF módszert (pl. a mozgáskövetésben: a videó képein a sarokpontok alapján végzünk összehasonlítást). Különböző karakterisztikus függvények definiálásával eltérő alkalmazásokat valósíthatunk meg: - sarok- és élrégiók kiemelése (R eig, R max, R logmax, R logmin ) - fontosabb pontok kihangsúlyozása (R sc*logmax ) Az együttes szempontok alapján (egyenletes és nem túlzott él- és sarokkiemelés, homogén régiók elhanyagolása) a legjobb karakterisztikus függvény az R logmax. 9

Lehetséges ZH kérdések Wallis-operátor paraméterei W, M 0, S 0, A max, p, ahol M a várható érték, S a szórás. Másodrendű hisztogram Pontok közötti statisztikai összefüggést írja le: 2D hisztogram. Ahol összefüggés van, ott csomósodás jön létre. Textúra A textúra egy képi mintázat vagy valamely jellemzőjének ismétlődése. Textúra meghatározása Visszacsatolt konvolúciós szűrővel textúrák analízisére használható műveleteket egyidejűleg lehet elvégezni: konvolúció, dekonvolúció, mozgatás, korreláció és féltónusos kimenet. Éldetekciók Élek kereshetők első- illetve másodrendű gradiensképzéssel, vagy összetett módon. Sobel-operátor, Roberts-operátor, Combass-filter, Canny szűrő. Markov-modell Egy S pixelrács s képpontjai korreláltak, Ω globális címkézéssel soroljuk őket osztályokba (MAP döntés) a szomszédos képpontok valószínűségi modelleinek alapján, majd iterációs lépések során keressük a globális optimumot. Optimum keresése Markov-modell esetén Alapfeltevés, hogy a szomszédos képpontok korreláltak, egymástól függnek. Lokális lépések során jutunk el a globális optimumba. Globális címkézéssel látjuk el a képpontokat, majd becsüljük az optimális címkézést (MAP). A becsült színt a képpontokra összehasonlítjuk a szomszédaival, az eltérést pedig büntetjük. Az iteráció során az energiaminimumra törekedve jutunk el a globális optimumba. Hol szerepelt a félév során Gauss-függvény? - élsimítás - hisztogramon a képpontok eloszlása - Gábor-szűrő ablakozása - LOG 10