Eötvös Loránd Tudományegyetem Természettudományi Kar Fotometrikus vöröseltolódás-becslési módszerek továbbfejlesztése Doktori értekezés tézisei Purger orbert Témavezető Dr. Csabai István egyetemi tanár ELTE TTK Komplex Rendszerek Fizikája Tanszék Fizika Doktori Iskola megbízott vezető: Dr. Csikor Ferenc egyetemi tanár Részecskefizika és csillagászat program vezető: Dr. Csikor Ferenc egyetemi tanár Budapest 2011
1. Bevezetés A dolgozat a galaxis fotometrikus vöröseltolódás becslés módszereibe nyújt betekintést. A több százmilliárd galaxis elhelyezkedése és egyéb tulajdonságaik megismerése kulcsfontosságú információkat hordoznak a Világegyetem szerkezetéről és fejlődéséről. A jelenlegi megfigyelési technikáink azonban jelentősen korlátozzák a megismerés lehetőségeit. Példa erre a Sloan Digital Sky Survey (SDSS-I), amely működése során a teljes égbolt negyedét lefényképezve közel 230 millió kiterjedt objektumot, galaxist azonosított az égbolton. Ez idő alatt azonban mindössze körülbelül 1 millió galaxis spektroszkópiai ujjlenyomatát és távolságát színképét, illetve annak vöröseltolódását - tudta lemérni. Ez a kevesebb, mint fél százalékos arány jól érzékelteti a technikai korlátokat, a mérési eljárás idő- és költségigényét. A fotometrikus vöröseltolódásbecslési módszerek azért jöttek létre, hogy ezen a hatásfokon javítsanak - lehetővé téve a vöröseltolódás becslését az objektumok fotometriája és korábban mért színképek, illetve modellek felhasználásával. Amit korábban a szegény ember spektroszkópiájának is neveztünk, mára szerves részét képezi a legnagyobb futó és tervezett képalkotó csillagászati felméréseknek. Az ambiciózus terv az, hogy akár például az LSST esetében - több tíz milliárd galaxis esetében is képesek leszünk jól behatárolható pontosságú vöröseltolódás becsléseket adni. Ennyi objektum esetében a vöröseltolódás már körülbelüli ismerete is fontos statisztikus információkat szolgáltat. A jobb térbeli szeparálhatóság segítségével pontosabban kiválaszthatóak a galaxis klaszterek, szupernóvák gazda galaxisainak körülbelüli távolsága határozható meg. A galaxisok képének apró torzulásai, mint a statisztikusan mérhető gyenge gravitációs lencsézés a távolsági feloszthatósággal kiegészítve precíz galaxis korrelációk, illetve akár tömeg profilok meghatározását teszik lehetővé. A barion akusztikus oszcilláció mérése hasonló módon elképzelhető fotometrikus vöröseltolódások felhasználásával. Ezek a technikák, illetve potenciális mérési lehetőségek pedig várhatóan jelentősen hozzájárulnak a sötét anyag és a sötét energia a Világegyetem ismeretlen 95%-ának megértéséhez.
A munkám célkitűzése volt a fotometrikus vöröseltolódás-becslési módszerek, elsősorban az úgynevezett empirikus módszerek fejlesztése annak érdekében, hogy az elvárásoknak megfelelően alkalmazhatóak legyenek a jövő nagyszabású csillagászati felméréseiben. 2. Alkalmazott módszerek Az Sloan Digital Sky Survey katalógusa nagyszerű környezetet biztosít a vöröseltolódás becslések vizsgálatához, hiszen mind nagy mennyiségű fotometria, mind pedig spektroszkópiai mérési eredmény rendelkezésre áll. Az SDSS és más nagyméretű csillagászati katalógusok hatékonyan csak adatbázis technológiákkal kezelhetőek, illetve hozzáférhetőek. A mérési adatok kezeléséhez így szükség volt az adatbázisok kezelésének, működésének ismeretére. Módszerként előtérbe került az adatbázis segítségével végezhető koordináta alapú illesztés két különböző felmérés adatai alapján, illetve a fotometrikus adatokban történő hatékony keresés. Előbbihez a szögtávolság, illetve legközelebbi szomszéd alapú kereséseket (HTM, illetve zóna index) alkalmaztam, utóbbihoz a kd keresési fa alapján segédkeztem hatékony implementáció létrehozásában. Utóbbi keresési technika a nagy adathalmazokon végzett empirikus vöröseltolódás becslésben is kulcsfontosságú szerepet játszott. Az SDSS DR6 és DR7 katalógusaihoz általam készített fotometrikus vöröseltolódás kiegészítő katalógus adatbetöltési módszereket igényelt. A Stripe 82 katalógus ismételt felvételeinek használata során az észlelési eredmények fluxus alapú összeadását (co-addition) alkalmaztam. A sablon alapú fotometrikus vöröseltolódás-becslés színképek kezelését, csillag populáció szintézis modellek használatát követelte meg. Itt, illetve a hibrid foto-z technika esetében is a K-korrekciót alkalmaztam az objektumokkal együtt mozgó rendszerbe történő transzformálásakor. Az empirikus vöröseltolódásbecslések használata során több különböző módszer fejlesztésére, illetve alkalmazására is sor került a gépi tanulás, illetve más, nem parametrikus statisztikai technikák köréből. Például polinom illesztés, k-legközelebbi szomszéd (k-nn) módszerek, iteratív lineáris illesztés és más k-nn regresszió technikák, kernel regresszió, neurális hálózatok, szupport vektor gép módszer. A becslések eredményeinek összevetéséhez a leíró statisztika eszközeit használtam. 1
3. Tézisek 1. A csillagászati mérési eredmények hatékony kezelését vizsgáltam. Az adatbázis kiszolgálón belül futó, magnitúdó paraméterek alapján kd keresési fát használó indexelési technika hatékonyságát fotometrikus vöröseltolódás-becslés alkalmazásával demonstráltam [1],[9],[10]. A Virtuális Obszervatórium keretei között több nagy csillagászati katalógust felkészítettem arra, hogy koordináta alapján egyszerűen és gyorsan párosíthatóak legyenek más felmérések eredményeivel [7]. A katalógusok nyilvánosan hozzáférhetőek. 2. Színkép sablon alapú vöröseltolódás becslés segítségével fotometrikus vöröseltolódás ( photo-z ) katalógust készítettem az SDSS DR4, DR5 [8] és DR6 [2] adataihoz. A becslések számításához bevontam az SDSS Déli Felmérésének területén készült speciális foto-z spektroszkópikus lemezek mérési eredményeit. Az SDSS DR6 Photoz katalógusa 200 millió galaxis fotometrikus vöröseltolódását és más fizikai paramétereit tartalmazza. 3. Kidolgoztam az empirikus k-legközelebbi szomszéd iteratív illesztésén alapuló photo-z módszer és a korábbi, sablon alapú módszer előnyeit ötvöző hibrid megoldást. A módszer felhasználásával új fotometrikus vöröseltolódás katalógust készítettem az SDSS DR7 230 millió galaxisához. A katalógus így továbbra is tartalmaz a fotometrikus vöröseltolódás alapján távolságmodulus, K-korrekció és abszolút magnitúdó értékeket. Az SDSS DR7 galaxisaira kapott fotometrikus vöröseltolódások várható hibája jelentősen, közel felére csökkent a DR6 esetében megadott becslésekhez képest [3],[5]. 4. Az k-nn regresszión alapuló módszert kiterjesztettem más, hasonló empirikus becslések bevonásával, mint a lokális becslő függvény és a távolság függvény módosítása, illetve kernel regresszió számítása. Az így implementált módszerekkel és a neurális hálózat modellel végzett összehasonlítás alapján megállapítottam, hogy az eljárásunkkal egyszerűen és gyorsan lehet robosztus becsléseket adni, amely nagyon jól összeegyeztethető a neurális hálózat alapú becslések pontosságával is [5]. 2
5. Az SDSS Déli Felmérése során halvány, kék galaxisokról készített speciális foto-z felvételek és a nagy pontosságú, összeadott Stripe 82 coadded fotometria hatását vizsgáltam a fotometrikus vöröseltolódás pontosságára [6]. A kék galaxisok kalibrációs adatait is tartalmazó referencia halmaz segítségével számolt fotometrikus vöröseltolódások a halvány objektumok esetében közel 30%-kal pontosabb becslésekre vezettek normál fotometria mellett. A pontosabb, mélyebb coadded fotometria egységesen javította a becslések minőségét, akár 50%-kal is csökkentve a fotometrikus vöröseltolódások hibáját. 6. Az SDSS Stripe 82 összeadott, mélyebb coadded fotometriáját és a meglévő egyedi észleléseket felhasználva vizsgáltam a jövőbeni, sok ismételt észlelés összeadásán alapuló nagyszabású égtérképezés esetében várható javulást a fotometrikus becslések pontosságában [6]. A vizsgálathoz több nagy galaxis felmérés vöröseltolódás eredményeit is párosítottam a fotometriai halmazzal, létrehozva így egy mélyebb, reprezentatívabb referencia halmazt. Az így becsülhető vöröseltolódások nagyon jó pontosságot mutattak az SDSS spektroszkópiai halmaz eredeti, z~0.5 mélységéhez képest: az új adatokkal már egészen z~1-ig. Az így keletkezett katalógus adatai hozzáférhetőek. A megfelelően párosított egyedi észleléseket ezek után fluxus szerint több lépésben átlagolva szimuláltam a kevesebb ismételt felvételből álló, köztes pontosságú felvételeket. Az így kapott eredmények valódi adatokon szemléltetik a becslések minőségének javulását az összeadásban szereplő, ismételt felvételek mennyiségének függvényében. 7. A Photo-z Accuracy Testing együttműködés keretein belül alkalmaztam az SDSS esetében használt sablon alapú és empirikus, k-nn regressziós módszereket [4]. Az idealizált, de zajjal ellátott teszt halmazon mindkét módszer az elvárásoknak megfelelő eredményeket biztosított. Gyakorlatilag a teszthalmaz előállításához használt kód referencia szintjéhez közel, a sörétzajjal összemérhetően. 3
4. Publikációk A tézispontokhoz kapcsolódó tudományos közlemények. [1] I. Csabai, L. Dobos, M. Trencséni, G. Herczegh, P. Józsa,. Purger, T. Budavári, A.S. Szalay Multidimensional indexing tools for the virtual observatory, Astronomische Nachrichten, 2007 Sep, Volume 328, 852-857. [2] Jennifer K. Adelman-McCarthy,.,. Purger and the other members of the SDSS collaboration. The Sixth Data Release of the Sloan Digital Sky Survey, The Astrophysical Journal Supplement Series, 2008 April, Volume 175, 297-313. [3] Kevork N. Abazajian,.,. Purger and the other members of the SDSS collaboration, The Seventh Data Release of the Sloan Digital Sky Survey, The Astrophysical Journal Supplement Series, 2009 June, Volume 182, 543-558. [4] H. Hildebrandt, S. Arnouts, P. Capak, L. A. Moustakas, C. Wolf, F. B. Abdalla, R. J. Assef, M. Banerji, N. Benítez, G. B. Brammer, T. Budavári, S. Carliles, D. Coe, T. Dahlen, R. Feldmann, D. Gerdes, B. Gillis, O. Ilbert, R. Kotulla, O. Lahav, I. H. Li, J.-M. Miralles,. Purger, S. Schmidt and J. Singal PHAT: Photo-z Accuracy Testing,2010, Astronomy & Astrophysics, 523 A31 [5].Purger, M. Trencséni, I. Csabai, K-nearest neighbor regression for estimating photometric redshifts, 2011, Astronomy & Astrophysics, beküldés alatt [6].Purger, M. Trencséni, I. Csabai, Photometric redshifts for SDSS Stripe 82, 2011, Monthly Notices of the Royal Astronomical Society, beküldés alatt A tézispontokhoz kapcsolódó konferencia közlemények [7]. Purger, T. Budavári, A. S. Szalay, A. Thakar, I. Csabai, Build Your Own SkyNode!, Astronomical Data Analysis Software and Systems (ADASS) XIII, Proceedings of the conference held 12-15 October, 2003 in Strasbourg, France. Edited by Francois Ochsenbein, Mark G. Allen and Daniel Egret. ASP Conference Proceedings, Vol. 314. San Francisco: Astronomical Society of the Pacific, 2004., p.201 [8]. Purger, I. Csabai,T. Budavári, Z. Győry, Photometric Redshifts For The SDSS Data Release 5, The Virtual Observatory in Action: New Science, New Technology, and Next Generation Facilities, 26th meeting of the IAU, Special Session 3, 17-18, 21-22 August, 2006 in Prague, Czech Republic. [9] L. Dobos, I. Csabai, M. Trencséni, G. Herczegh, P. Józsa,. Purger, Spatial Indexing and Visualization of Large Multi-Dimensional Databases, Astronomical Data Analysis Software and Systems XVI ASP Conference Series, Vol. 376, proceedings of the conference held 15-18 October 2006 in Tucson, Arizona, USA. Edited by Richard A. Shaw, Frank Hill and David J. Bell., p.629 [10] I. Csabai, M. Trencséni, L. Dobos, P. Józsa,. Purger, T. Budavári, A. S. Szalay Spatial Indexing of Large Multidimensional Databases., CIDR 2007, 207-218. 4