AliROOT szimulációk GPU alapokon

Hasonló dokumentumok
GPU alkalmazása az ALICE eseménygenerátorában

Big Data. A CERN, mint a. egyik bölcsője... Barnaföldi Gergely Gábor. Berényi Dániel & Biró Gábor & Nagy-Egri Máté Ferenc & Andrew Lowe

Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT

Készítette: Trosztel Mátyás Konzulens: Hajós Gergely

OpenCL - The open standard for parallel programming of heterogeneous systems

A Geant4 használatának alapjai

OpenCL alapú eszközök verifikációja és validációja a gyakorlatban

ALICE: az Univerzum ősanyaga földi laboratóriumban. CERN20, MTA Budapest, október 3.

Töltött részecske multiplicitás analízise 14 TeV-es p+p ütközésekben

Az NIIF új szuperszámítógép infrastruktúrája Új lehetőségek a kutatói hálózatban

Vastag GEM alapú trigger detektor fejlesztése az LHC ALICE kísérlethez

Z bozonok az LHC nehézion programjában

efocus Content management, cikkírás referencia

A Wigner FK részvétele a VIRGO projektben

GPGPU programozás lehetőségei. Nagy Máté Ferenc Budapest ALICE ELTE TTK Fizika MSc 2011 e-science Café

Alapja a véletlen minták kiértékelése. Sok szabadság fokú csatolt rendszerek

Videókártya - CUDA kompatibilitás: CUDA weboldal: Példaterületek:

Az RMKI Grid-rendszere

Közösség detektálás gráfokban

Lenovo Ideapad U M5007UHV

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

Virtualizációs technológiák Linux alatt (teljesítményteszt)

TCP ANALÍZIS DIFFSERV KÖRNYEZETBEN

CMS Pixel Detektor működése

Feladatlap: Számítógép összetevők keresése

Monte Carlo módszerek a statisztikus fizikában. Az Ising modell. 8. előadás

Indul az LHC: a kísérletek

NOLLEX Nemzetközi Kft. Magyarországi kizárólagos disztribútor.

Nehézion ütközések az európai Szupergyorsítóban

Számítógépes alapismeretek

Ismétlés: Moore törvény. Tranzisztorok mérőszáma: n*százmillió, n*milliárd.

Worldwide LHC Computing Grid

Valósidejű térbeli megjelenítés, másként Fehér Krisztián

Ismerkedjünk tovább a számítógéppel. Alaplap és a processzeor

Valós idejű megoldások: Realtime ODS és Database In-Memory tapasztalatok

Új módszerek és eszközök infokommunikációs hálózatok forgalmának vizsgálatához

Kvantitatív módszerek

Teszt Az nvidia GeForce VGA kártyák gyakorlati teljesítménye a Dirt3-ban

Grayteq. Grayteq DLP Teljesítmény Benchmark. Grayteq DLP Benchmark. Sealar Corporate Proprietary Commercial-in-confidence

Magas szintű optimalizálás

Párhuzamos és Grid rendszerek

Számítógép-rendszerek fontos jellemzői (Hardver és Szoftver):

Újdonságok NCG CAM V10-ben

Az NIIF új szuperszámítógép infrastruktúrája Új lehet!ségek a kutatói hálózatban Debreceni Egyetem

április 24. INFO Savaria április 24. INFO Savaria április 24. INFO Savaria

A Webtől a. Gridig. A Gridről dióhéjban. Debreczeni Gergely (MTA KFKI RMKI) Debreczeni.Gergely@wigner.mta.hu

Mikrofizika egy óriási gyorsítón: a Nagy Hadron-ütköztető

Loss Distribution Approach

Az LHC adatfeldolgozásának számítástechnikai háttere 10 percben. Hajdu Csaba KFKI RMKI

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Tibeko SZÁMÍTÓGÉPEK. Mindegyik termékünk számlával és garanciával!

Autonóm jármű forgalomszimulátorba illesztése

elektronikus adattárolást memóriacím

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Ordering MCMC gyorsítása OpenCL környezetben

GPU-k a gravitációs hullám kutatásban

SAT probléma kielégíthetőségének vizsgálata. masszív parallel. mesterséges neurális hálózat alkalmazásával

Részecskefizika és az LHC: Válasz a kérdésekre

GPU-Accelerated Collocation Pattern Discovery

Folytonos gravitációs hullámok keresése GPU-k segítségével

6 x 2,8 mm AGYAS LÁNCKEREKEK 04B - 1 DIN ISO/R 606. Osztás 6,0 Bels szélesség 2,8 Görg átmér 4,0

Tibeko SZÁMÍTÓGÉPEK. Mindegyik termékünk számlával és garanciával!

Rendszermodellezés 1. ZH, A csoport, nagyfeladatok

R5 kutatási feladatok és várható eredmények. RFID future R Király Roland - Eger, EKF TTK MatInf

Kísérleti és elméleti TDK a nagyenergiás magfizikai területein

Győri HPC kutatások és alkalmazások

Tibeko SZÁMÍTÓGÉPEK. Mindegyik termékünk számlával és garanciával!

Memóriák - tárak. Memória. Kapacitás Ár. Sebesség. Háttértár. (felejtő) (nem felejtő)

A nagy hadron-ütköztető (LHC) és kísérletei

Megmérjük a láthatatlant

KÖSZÖNTJÜK HALLGATÓINKAT!

Nemlineáris optimalizálási problémák párhuzamos megoldása grafikus processzorok felhasználásával

Simon Balázs Dr. Goldschmidt Balázs Dr. Kondorosi Károly. BME, Irányítástechnika és Informatika Tanszék

Toshiba Satellite P70-B-10U

Hogyan kell 3D tartalmat megtekinteni egy BenQ kivetítőn? Minimális rendszerkövetelmények 3D tartalom lejátszásához BenQ kivetítőn:

NIIFI HPC Szolgáltatás

Visszacsatolt (mély) neurális hálózatok

Adatbázis és alkalmazás konszolidáció Oracle SPARC T4/5 alapon

Az LHC TOTEM kísérlete

Informatika 11. el adás: Hardver

Apple számítógépek összehasonlító táblázata

Első sor az érdekes, IBM PC ra alapul: 16 bites feldolgozás, 8 bites I/O (olcsóbb megoldás). 16 kbyte RAM. Nem volt háttértár, 5 db ISA foglalat

IBM SPSS Modeler 18.2 Újdonságok

Asztali PC kínálatunk:

Adatszerkezetek 2. Dr. Iványi Péter

Vélemény Siklér Ferenc tudományos doktori disszertációjáról

Ár: Ft Garancia: 2 Év

RSA algoritmus. P(M) = M e mod n. S(C) = C d mod n. A helyesség igazoláshoz szükséges számelméleti háttér. a φ(n) = 1 mod n, a (a 1,a 2,...

DELL Latitude E7450 (CA007LE7450EMEA_WIN-11) (CA007LE7450EMEA_WIN-11)

Teszt: Az nvidia GeForce kártyák Crysis 2-ben mért teljesítménye

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Oktatási laborok felszerelésének biztosítása (tájékoztató az eljárás eredményéről)

Intel Celeron G550 Intel HD Graphics kártyával (2,6 GHz, 2 MB gyorsítótár, 2 mag)

Valószínűségszámítás összefoglaló

ASUS X552WE-SX036H (X552WE-SX036H)

Gyorskalauz SUSE Linux Enterprise Desktop 11

OSOR.eu és EUPL két eszköz F/OSS megoldások európai

Lenovo Ideapad G Q5000VHV

DELL Latitude E5570 N007LE557015EMEA_WIN-11

Részecskefizikai gyorsítók

Átírás:

AliROOT szimulációk GPU alapokon Nagy Máté Ferenc & Barnaföldi Gergely Gábor Wigner FK ALICE Bp csoport OTKA: PD73596 és NK77816

TARTALOM 1. Az ALICE csoport és a GRID hálózat 2. Szimulációk és az AliROOT programcsomag 3. Részecskefizikai MC generátorok 4. TRandom3/4/5 benchmark eredmények 5. Proton-proton szimulációk

ALICE és a GRID ALICE egyike a 3 CERN LHC óriáskísérletnek. A detektorokból érkező adatok feldolgozásához szuperszámítógép parkra van szükség. Olcsóbb és kezelhetőbb a probléma elosztott rendszerrel. A kísérlet tagjainak kötelező hozzájárulni a GRID rendszerhez.

Pb-Pb ütközés vs. p-p esemény. Azonos eseményszám mellett több mint 100X annyi valószínűség alapú folyamat.

Szimulációk & AliROOT A használt szimulációs környezet az AliROOT. A szimulált eredményeket összevetjük a valós mérési eredményekkel. Ha a modellek jóslatai egyeznek a valósággal, elfogadjuk őket. Cél: GPU gyorsítás

AliROOT 2,7GB-os keretrendszer, több eseménygenerátort is magába foglal. Mindenkori verziója tartalmazza az aktuális ALICE detektor geometriáját.

Részecskefizikai Monte-Carlo generátorok Monte-Carlo szimulációnak nevezünk minden olyan eljárást, amelyben egymástól függetlenül generált véletlen számok határozzák meg a rendszer fejlődését, kimenetét. Az ilyen fizikai szimulációk eseményeit előállító modult hívjuk MC generátornak. Pszeudo random véletlen számok előnyösek a szimuláció reprodukálása miatt. A nagy léptékű mintavételezés miatt a gyorsaság centrális fontosságú.

CPU vs. GPU CPU-GPU fejlődés 6000 Teljesítmény [GFLOPS] 5000 4000 AMD NVIDIA CPU 3000 2000 1000 0 2001. April 2004. January 2006. October 2009. July 2012. April

gpu001 Intel Core-i7 2.66GHz, 12GB DDR3 1333MHz RAM 3 db Radeon 5970, 6GB GDDR5 VRAM (1GB/mag)

AliROOT gyorsítás Cél: PRNG@GPU A ROOT matematikai osztálya 3 alap generátort definiál. Ezekből a MersenneTwister algoritmust használó TRandom3 a legelterjedtebb. GPU alapú TRandom4: Mersenne-Twister GPU alapú Trandom5: MWC64X

TRandom4/TRandom5 Konstruktor tartalmaz mindent a tényleges szám generálásig: Platform lekérdezés Context létrehozás Device info lekérdezés Kernel fordítás Command queue létrehozás Buffer létrehozás Random seedek device-ra küldése Szálazonosítók beállítása

TRandom4 A gyorsabb működés érdekében nem lehet egyesével számot generálni. Egy RAM-ban lévő buffert tölt fel véletlen számokkal (~500k #). Kérésnél a bufferből másolja ki az eredményt. Esetszétválasztás lassítja, aszerint hogy a bufferben maradt-e annyi szám, amennyit kért a program. RAM-ból másolás plussz művelet a CPU implementációhoz képest. OpenCL miatt akár CPU-n is képes generálni.

PRNG eredmények

Egyszerű teszt: auto-korreláció

Eredmények - DieHard Átfogóbb vizsgálata a PRNG-nek: DieHarder Lelke: Kolmogorov-Smirnov teszt, eloszlások hasonlóságáról nyilatkozik. Eredeti DieHard tesztekből kettő ismerten hibásat kivéve és egy újat hozzávéve Trandom3/4/5 minden teszten átment!

Eredmények - Sebesség Generálási ráta 3 Ráta [db/ns] 2.5 2 1.5 1 0.5 0 TRandom4 kernel TRandom3 kernel Vizsgált PRNG Teljes generálási sebesség bő kétszer lassabb. Ok a túlságosan nagy overhead a feladat méretéhez képest. Kernel idő kevesebb, mint tizenhatod része a CPU verziónak.

Generálási idő [ns] Kernel idő és teljes generálási idő

Proton-proton szimuláció TRandom4 TRandom3 Detektor geometria nélkül, ötvenezer szimulált esemény transzverz momentum (pt), rapiditás (y) és azimut szög (ϕ) szerinti eloszlásai.

ÖSSZEFOGLALÁS Cél: GPU gyorsítás írása az AliROOT keretrendszerhez Eddigi eredmények: Nyílt forrású PRNG átalakítása Modul-szerű integráció a ROOT keretrendszerbe Generátor teljesítmény és eloszlás vizsgálata Szimuláción keresztüli igazolása a generátor helyes működésének Konklúzió: Visszafelé kompatibilis modul(ok) beépítése nem lehetetlen. Az eredmények ígéretesek, érdemes folytatni az ez irányú törekvéseket.