GPU-k a gravitációs hullám kutatásban



Hasonló dokumentumok
Folytonos gravitációs hullámok keresése GPU-k segítségével

A Wigner FK részvétele a VIRGO projektben

Adatfeldolgozás a kísérleti gravitációshullám fizikában

AZ UNIVERZUM SUTTOGÁSA

Fekete lyukak, gravitációs hullámok és az Einstein-teleszkóp

A Webtől a. Gridig. A Gridről dióhéjban. Debreczeni Gergely (MTA KFKI RMKI) Debreczeni.Gergely@wigner.mta.hu

Dr. Berta Miklós. Széchenyi István Egyetem. Dr. Berta Miklós: Gravitációs hullámok / 12

Gravitációs hullámok. Vasúth Mátyás. Wigner FK, RMI. Wigner FK,

Magas szintű optimalizálás

Gravitációs hullámok,

A Webtől a. Gridig. A Gridről dióhéjban. Debreczeni Gergely (MTA KFKI RMKI) Gergely.Debreczeni@rmki.kfki.hu

Pósfay Péter. ELTE, Wigner FK Témavezetők: Jakovác Antal, Barnaföldi Gergely G.

Grafikus csővezeték 1 / 44

SAT probléma kielégíthetőségének vizsgálata. masszív parallel. mesterséges neurális hálózat alkalmazásával

Készítette: Trosztel Mátyás Konzulens: Hajós Gergely

Az NIIF új szuperszámítógép infrastruktúrája Új lehetőségek a kutatói hálózatban

Informatika Rendszerek Alapjai

OpenCL - The open standard for parallel programming of heterogeneous systems

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

Kiegészítő részelőadás 1. Az algoritmusok hatékonyságának mérése

Számítógép-rendszerek fontos jellemzői (Hardver és Szoftver):

AliROOT szimulációk GPU alapokon

A VIRGO detektor missziója

Spektrográf elvi felépítése. B: maszk. A: távcső. Ø maszk. Rés Itt lencse, de általában komplex tükörrendszer

egy szisztolikus példa

Flynn féle osztályozás Single Isntruction Multiple Instruction Single Data SISD SIMD Multiple Data MISD MIMD

GPU alkalmazása az ALICE eseménygenerátorában

GPU-Accelerated Collocation Pattern Discovery

Nem roncsoló tesztelés diszkrét tomográfiával

NIIFI HPC Szolgáltatás

Dekonvolúció a mikroszkópiában. Barna László MTA Kísérleti Orvostudományi Kutatóintézet Nikon-KOKI képalkotó Központ

Ismerkedjünk tovább a számítógéppel. Alaplap és a processzeor

Képrekonstrukció 3. előadás

Automatikus irányzás digitális képek. feldolgozásával TURÁK BENCE DR. ÉGETŐ CSABA

III.6. MAP REDUCE ELVŰ ELOSZTOTT FELDOLGOZÁSI ALGORITMUSOK ÉS TESZTKÖRNYEZET KIDOLGOZÁSA ADATBÁNYÁSZATI FELADATOK VÉGREHAJTÁSÁHOZ

"A tízezer mérföldes utazás is egyetlen lépéssel kezdődik."

Számítógépek felépítése

A gravitációs hullámok miért mutathatók ki lézer-interferométerrel?

Geofizikai kutatómódszerek I.

OpenGL és a mátrixok

Whistlerek automatikus inverziójának megvalósítása GPU-kon az AWDANet mérőhálózatban

Bánhelyi Balázs, Csendes Tibor, Palatinus Endre és Lévai. Szeptember 28-30, 2011, Balatonöszöd, Hungary

Videókártya - CUDA kompatibilitás: CUDA weboldal: Példaterületek:

SZENZORFÚZIÓS ELJÁRÁSOK KIDOLGOZÁSA AUTONÓM JÁRMŰVEK PÁLYAKÖVETÉSÉRE ÉS IRÁNYÍTÁSÁRA

[ ]dx 2 # [ 1 # h( z,t)

Teljesítmény Mérés. Tóth Zsolt. Miskolci Egyetem. Tóth Zsolt (Miskolci Egyetem) Teljesítmény Mérés / 20

Fourier térbeli analízis, inverz probléma. Orvosi képdiagnosztika 5-7. ea ősz

Smalltalk 2. Készítette: Szabó Éva

Mérés és adatgyűjtés

A Mátrai Gravitációs és Geozikai Laboratórium és kutatási programja

Matematika. 1. évfolyam. I. félév

Adatelemzési eljárások az idegrendszer kutatásban Somogyvári Zoltán

Ejtési teszt modellezése a tervezés fázisában

Miről lesz szó? Videó tartalom elemzés (VCA) leegyszerűsített működése Kültéri védelem Közúthálózat megfigyelés Emberszámlálás

Programozási segédlet

1. Generáció( ):

Kutatási beszámoló február. Tangens delta mérésére alkalmas mérési összeállítás elkészítése

Mérési struktúrák

Kontrollcsoport-generálási lehetőségek retrospektív egészségügyi vizsgálatokhoz

A számítógépek felépítése. A számítógép felépítése

Az MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

Wavelet transzformáció

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

Matematika (alsó tagozat)

Az NIIF új szuperszámítógép infrastruktúrája Új lehet!ségek a kutatói hálózatban Debreceni Egyetem

Készítsünk fekete lyukat otthon!

Elektronika Előadás. Modulátorok, demodulátorok, lock-in erősítők

Tartalomjegyzék. Köszönetnyilvánítás. 1. Az alapok 1

Diszkrét matematika I., 12. előadás Dr. Takách Géza NyME FMK Informatikai Intézet takach november 30.

Informatika a valós világban: a számítógépek és környezetünk kapcsolódási lehetőségei

SZÁMÍTÓGÉPEK BELSŐ FELÉPÍTÉSE - 1

ÉRZÉKELŐK ÉS BEAVATKOZÓK I. 0. TANTÁRGY ISMERTETŐ

3. OSZTÁLY A TANANYAG ELRENDEZÉSE

1.1. Vektorok és operátorok mátrix formában

Sanxing SX601 P12S01. Egyfázisú SMART Fogyasztásmérő

Szimuláció RICHARD M. KARP és AVI WIGDERSON. (Készítette: Domoszlai László)

Fehérzajhoz a konstans érték kell - megoldás a digitális szűrő Összegezési súlyok sin x/x szerint (ez akár analóg is lehet!!!)

Mi van a számítógépben? Hardver

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

Mérési hibák

Morfológia. Sergyán Szabolcs Óbudai Egyetem Neumann János Informatikai Kar Szoftvertechnológia Intézet

Digitális hangszintmérő

Shift regiszter + XOR kapu: 2 n állapot

2000 Szentendre, Bükköspart 74 MeviMR 3XC magnetorezisztív járműérzékelő szenzor

A médiatechnológia alapjai

Leírás az ügyfelek számára

TUDOMÁNYOS ADATBÁZISOK MA ÉS A JÖVŐBEN. X64 ALAPÚ KISZOLGÁLÓ RENDSZEREK Tudomány Adatbázisok, 1. előadás, (c) 2010

Kémiai reakciók mechanizmusa számítógépes szimulációval

Mintavétel: szorzás az idő tartományban

VTOL UAV. Inerciális mérőrendszer kiválasztása vezetőnélküli repülőeszközök számára. Árvai László, Doktorandusz, ZMNE

Matematika és Számítástudomány Tanszék

Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com

Nemlineáris optimalizálási problémák párhuzamos megoldása grafikus processzorok felhasználásával

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Dr. Schuster György február / 32

Nagyságrendek. Kiegészítő anyag az Algoritmuselmélet tárgyhoz. Friedl Katalin BME SZIT február 1.

TULAJDONSÁGOK LEÍRÁS. Működési módok. Maszkoláselleni tulajdonság

Számítógép felépítése

3. jegyz könyv: Bolygómozgás

Átírás:

GPU-k a gravitációs hullám kutatásban Debreczeni Gergely MTA KFKI RMKI (Gergely.Debreczeni@rmki.kfki.hu) e-science Cafè 2011. november 14. Óbudai Egyetem Neumann János Informatikai Kar

Á.R.: Megfigyelhető jelenségek Gravitációs hullámok: Az általános relativitáselmélet által megjósolt jelenség. Hatalmas tömegek mozgásakor fellépő teridő torzulások tovaterjedései. Mindmáig csak közvetett (de nagyon meggyőző) bizonyítékunk van. Ált. Rel. megfigyelt jóslatai: Perihélium elfordulás Gravitációs lencsézés Az idő 'múlásának' változása 2

A Hulse- Taylor pulzár A grav. hull. kutatók Szent Grálja 1974 -ben fedezték fel (Russel Hulse, Joseph Taylor) Valószíűleg 2 neutron csillag 3,1 mm közeledés keringésenként 59 ms-os pulzálás 7,75 orás keringési idő 1993 megoszott Nobel-díj 3

Lehetséges GH források Csillagkettősök összeolvadása Sztochasztikus hullámok Pulzárok, neutron csillagok Szupernovák 4

Miért érdekesek? Az asztrofizikai objektumok teljesen új arcát láthatjuk meg Eddig láthatatlan dolgokat figyelhetünk meg Az emberiség új "érzékszerve" lenne Különböző elméletek tesztelése Wilheim Conrad Roentgen 1845-1923 5

Interferométerek A világ legpontosabb relatív mérése, 10-18 m pontosság! Rengeteg környezeti zaj kiküszöbölését kell megoldani Több izolált detektor kell, hogy koincidenciát tudjunk mérni A beeső gravitációs hullám megváltoztatja a karhosszúságot. Az interferencipontban ezáltal megváltozik a fényintenzitás. A mérés kimenete a két kar hosszúságának különbsége. 6

Bespirálozó kettőcsillagok Hullámformák A lehetséges hullámformákat ki lehet számolni és összehasonlítani a mérési adatokkal A "matched-filtering" módszert használjuk erre Nagyon érzékeny, de nagyon instabil módszer 7

A GPU-k felhasználása A Wiener-filter egy optimális lineáris szűrő módszer ismert jelalakok stacionárius zajban való kereséséhez. Fourier transzformáció Vektorok skaláris szorzása Vektorok összeadása, komplex konjugálása Integrálás (összegzés) A fenti algoritmusok művelet szinten is nagyon jól párhuzamosíthatók, ezen felül még paramétertér és adatszegmensek szintjén és feldarabolható a feladat. A GPU maximális kihasználtsága a cél! 8

A GPU-k felhasználása Ha a probléma visszavezethető az adatfolyam feldolgozás (stream processing) paradigmájára akkor sikeresen gyorsítható GPU-n Rengeteg probléma visszavezethető az Nincs CPU - GPU adat transzfer, a CPU csak vezérel, minden számolás a GPU-n alapvető kernel műveleti osztályok történik valamelyikére: A műveletek aritmetikai sűrűsége Leképezés (map) Összevonás (reduce) Szórás és gyűjtés (scatter and gather) Prefix összeg képzés (prefix sum) Pinned memoria használata Szűrés (filter) Globális és osztott memória használatának Rendezés (sort) Keresés (search) viszonylag kics, ezért egy kernel több adatdarabon is végrehajtja ugyanazt az operációt. Loop unrolling lehetségessé válik. optimalizálása 9

Pl.: Variancia számítás A variancia számítás például így végezhetö el GPU -n: Szorzatfüggvény: leképezés (map) művelet Templatekre kötegelt módon Minden adatelemre külön szál? Összegzés speciális redukálási művelet, az eredmény 1 elemű Az asszociatív műveletek hatékony párhuzamosításának elmélete már régóta létezik 10

Eredmények Miért jó ez a kísérletnek? Elért sebességnövekedés: CPU Quad Core AMD 3 GHz Gyorsabb, olcsóbb GPU: Tesla c2ö50 Az új detektorok érzékenyebbek lesznek, Mintavételezési frekvencia: 4096 Hz Adatcsonk mérete 2048 sec: 2 sokkal hoszabb jeleket képesek detektálni Szegmensek mérete 128 sec 500 template 23 amelyek feldolgozásához nagyságrendekkel többet kell számolni. minta További releváns több paraméterrel rendelkező releváns asztrofizikai modell tesztelése, vizsgálata is lehetővé válik. Régi CPU kód: 44 perc GPU kód: 17 másodperc! Az optikai és részecskefizikai teleszkópok riasztásai után minimális időkésedelemmel fel tudjuk dolgozni az adatokat. Több mint 2 nagyságrend az elért gyorsulás! 11

Összehasonlítás 5 GPU val kb 500 CPU számítási teljesítményét helyettesíthetjük: 3 Mft problémafüggő. Más 2.5 KW jellegű számítási vagy adatfeldolgozási feladatok más optimális megoldásokat igényelnek. 500 CPU-s klaszter (125 4 magos gép) összehasonlítás erősen 5 GPU + befogadó gépek 10-15 Mft 20-25 kw 107 Mft 37 kw A GPU kártyák (még) nem teljesen általános processzorok. HPC (pl: SGI Altrix ICE) Természetesen ez az Célprogramozás, régi kódok futtatás nem olyan egyszerű 12

Az RMKI Virgo csoport http://virgo.rmki.kfki.hu 13