Big Data. A CERN, mint a. egyik bölcsője... Barnaföldi Gergely Gábor. Berényi Dániel & Biró Gábor & Nagy-Egri Máté Ferenc & Andrew Lowe

Hasonló dokumentumok
ALICE: az Univerzum ősanyaga földi laboratóriumban. CERN20, MTA Budapest, október 3.

Kísérleti és elméleti TDK a nagyenergiás magfizikai területein

AliROOT szimulációk GPU alapokon

Az extrém sűrű maganyag legforróbb és leghidegebb fázisainak vizsgálata

GPU alkalmazása az ALICE eseménygenerátorában

Nehézion ütközések az európai Szupergyorsítóban

NA61/SHINE: Az erősen kölcsönható anyag fázisdiagramja

Hazai és CERN-es DAQ fejlesztések

Vélemény Siklér Ferenc tudományos doktori disszertációjáról

Worldwide LHC Computing Grid

Az NIIF új szuperszámítógép infrastruktúrája Új lehetőségek a kutatói hálózatban

A Webtől a. Gridig. A Gridről dióhéjban. Debreczeni Gergely (MTA KFKI RMKI) Debreczeni.Gergely@wigner.mta.hu

OpenCL - The open standard for parallel programming of heterogeneous systems

CERN Grid and Big Data Science

Software Defined technológiák használata Oracle adatbázis konszolidációhoz

A PET-adatgy informatikai háttereh. Nagy Ferenc Elektronikai osztály, ATOMKI

az LHC ALICE Lévai P. az MTA KFKI RMKI csoport nevében

A Wigner FK részvétele a VIRGO projektben

Megmérjük a láthatatlant

Teraelektronvoltok és petabájtok küzdelme égen és földön

NIIFI HPC Szolgáltatás

Z bozonok az LHC nehézion programjában

Fragmentációs függvények parametrizációja Tsallis Pareto-alakú eloszlásokkal

Indul az LHC: a kísérletek

A Geant4 használatának alapjai

Mikrofizika egy óriási gyorsítón: a Nagy Hadron-ütköztető

Az RMKI Grid-rendszere

Az NIIF új szuperszámítógép infrastruktúrája Új lehet!ségek a kutatói hálózatban Debreceni Egyetem

Big Data: Paradigmaváltás a tudományban? Vagy annál is több?

Az MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

Bevezetés a nehéz-ion fizikába

HP-SEE projekt eredményei

Vastag GEM alapú trigger detektor fejlesztése az LHC ALICE kísérlethez

Parciális rekonfiguráció Heterogén számítási rendszerek VIMIMA15

Üzleti kritikus alkalmazások Novell Open Enterprise Serveren

Számítás(technika) a fizikában

Az LHC adatfeldolgozásának számítástechnikai háttere 10 percben. Hajdu Csaba KFKI RMKI

A részecskefizika kísérleti eszközei

EGI-InSPIRE. Café Grid március 24. Szeberényi Imre 3/25/ EGI-InSPIRE RI

Parciális rekonfiguráció Heterogán számítási rendszerek VIMIMA15

Bemutatkozik a CERN Fodor Zoltán

Részecskefizika és az LHC: Válasz a kérdésekre

Tényleg megvan a Higgs-bozon?

Fodor Zoltán KFKI-Részecske és Magfizikai Aug. 17, HTP-2007 Fodor Z. Bevezetés a nehézion fizikába 1

Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT

Mikrorendszerek tervezése

Az ALICE és a REGARD kollaborációk

A CERN, az LHC és a vadászat a Higgs bozon után. Genf

Négyprocesszoros közvetlen csatolású szerverek architektúrája:

Ami az Intel szerint is konvergens architektúra

Hogyan építsünk adatközpontot? Tarcsay György

A Detektortól a Végső Ábrákig

Speciális mágnesek tervezése, szimulációja részecskegyorsítókhoz

Nyomkövető szilícium detektorok a nagyenergiás fizikában (ITS)

WLAN Biztonság és Megfelelőségi Irányelvek

Bevezetés a nehézion-fizikába (Introduction to heavy ion physics)

Töltött részecske multiplicitás analízise 14 TeV-es p+p ütközésekben

BIG DATA ÉS GÉPI TANULÁS KÖRNYEZET AZ MTA CLOUD-ON KACSUK PÉTER, NAGY ENIKŐ, PINTYE ISTVÁN, HAJNAL ÁKOS, LOVAS RÓBERT

Informatikai laboratórium. 1. Laboratórium megnevezése: Informatikai laboratórium. 2. Laboratórium elhelyezése: Inf. épület 1. emelet 101.

Exadata, a világ leggyorsabb adatbázisgépe

Detektorok. Fodor Zoltán. Wigner fizikai Kutatóközpont. Hungarian Teachers Programme 2015

NOLLEX Nemzetközi Kft. Magyarországi kizárólagos disztribútor.

Programmable Chip. System on a Chip. Lazányi János. Tartalom. A hagyományos technológia SoC / PSoC SoPC Fejlesztés menete Mi van az FPGA-ban?

Mérés, Vezérlés. mérésadat rögzítés CMC - 99 CMC kis és nagytestvér

2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel

Wigner 115. A Felhők felett. Pető Gábor MTA Wigner FK, Adatközpont november 15.

Oracle Exalogic Elastic Cloud

Európai Nukleáris Kutatási Szervezet Európai Részecskefizikai Laboratórium. 62 év a részecskefizikai kutatásban

Az LHC kísérleteinek helyzete

Nemlineáris optimalizálási problémák párhuzamos megoldása grafikus processzorok felhasználásával

Grafikus csővezeték 1 / 44

Doktori értekezés tézisei

Bevezetés a részecskefizikába

Dedikált szerverhoszting katalógus november

Építsünk szuperszámítógépet szabad szoftverből!

A nagy hadron-ütköztető (LHC) és kísérletei

Matematika és Számítástudomány Tanszék

Hogy volt akkor? Hogy lenne ma?

Bemutatkozik a CERN. Fodor Zoltán HTP2015, Fodor Zoltán: Bemutatkozik a CERN

A Detektortól a Végső Ábrákig

NIIF Intézet szolgáltatásai 2. (alapszolgáltatások, szuperszámítástechnika) Marlok Tamás Sebők Tamás

OTKA NK62044 Tematikus OTKA Pályázat. Zárójelentés

JÁTSSZUNK RÉSZECSKEFIZIKÁT!

Intelligens kamera alkalmazás fejlesztése

Alkalmazott kutatások kozmikus részecskék detektálásával

A Magyar TÖK Mozgalom

Adatfolyam alapú RACER tömbprocesszor és algoritmus implementációs módszerek valamint azok alkalmazásai parallel, heterogén számítási architektúrákra

Gravitációs hullámok. Vasúth Mátyás. Wigner FK, RMI. Wigner FK,

Az Invitel adatközponti virtualizációja IBM alapokon

Alapja a véletlen minták kiértékelése. Sok szabadság fokú csatolt rendszerek

Kincskeresés kozmikus részecskékkel

Everything Over Ethernet

Amazon Web Services. Géhberger Dániel Szolgáltatások és alkalmazások március 28.

A legkisebb részecskék a világ legnagyobb gyorsítójában

Erős terek leírása a Wigner-formalizmussal

Apple számítógépek összehasonlító táblázata

Nyomkövető detektorok a részecskefizikától a vulkanológiáig

Higgs-bozon: a keresés húszéves kalandja

Témakiírások 2014/15. őszi félévben

Innovatív gáztöltésű részecskedetektorok

Átírás:

A CERN, mint a Big Data egyik bölcsője... Barnaföldi Gergely Gábor Berényi Dániel & Biró Gábor & Nagy-Egri Máté Ferenc & Andrew Lowe MTA Wigner FK Részecske- és Magfizikai Intézet & Wigner GPU Laboratórium

K I V O N A T A CERN és az LHC: Hol születik az adat? A legtöbb nyersadat feldolgozása LHC & WLCG Még több adat? Kutatási irányok az MTA Wigner FK GPU alapú Monte Carlo generátorok (MC@GPU) Vektorizált részecsketranszport (GeantV) Részecskekeltés nagyenergián (HIJING) Paramétertér redukció: jó-e fizikai paraméter? Mik az erőforrások? 2

Az LHC és legnagyobb kísérletei ATLAS CMS ALICE 3

Az ősanyag-vizsgáló: ALICE detektor 4

A korai Univerzum anyagát keressük! Az első 3 perc 13,6 Mrd év 5

A korai Univerzum anyaga: forró sűrű ősanyag proton-proton ólom-ólom Kvark Gluon Plazma (QGP): proton-proton vs. ólom-ólom forró, színes (kvark+gluon) a tökéletes folyadék... 6

A korai Univerzum anyaga: forró sűrű ősanyag proton-proton ólom-ólom Kvark Gluon Plazma (QGP): proton-proton vs. ólom-ólom forró, színes (kvark+gluon) a tökéletes folyadék... 7

A korai Univerzum anyaga: forró sűrű ősanyag proton-proton ólom-ólom Kvark Gluon Plazma (QGP): proton-proton vs. ólom-ólom forró, színes (kvark+gluon) a tökéletes folyadék... 8

Mit látunk a pilótafülkéből? 9

A track amit keresünk? 10

A track amit találunk! 11

...akkor mindez az ALICE kísérletben

Fizika az ALICE-szal

Egyszerű pálda: proton-proton ütközés Egy rekonstruált esemény az ALICE kísérletben 14

Big Data Bigger Data 15

Big Data Bigger Data 16

Big Data Bigger Data @ LHC WLCG Worldwide LHC Computing GRID: 15-20 Petabytes data évente...és még több... 17

Big Data Bigger Data @ LHC 18

Magyar részvétel az ALICE kísérletben TPC R&D Theory CRU R&D Analysis 4 44 Detector R&D ALICE Tier2 DAQ UG 19

Magyar részvétel DAQ fejlesztésekben TPC R&D Theory CRU R&D Analysis 4 44 Detector R&D ALICE Tier2 DAQ UG 20

ALICE DAQ: Információs versenypálya ALICE DAQ/DDL adatgyűjtő/továbbító rendszer A frontend elektronikák (FEE) és a adatgyűjtó számítógépek közötti kapcsolat a Detektor Data Link (DDL) és a Roead-Out Receiver Carc (RORC) 21

ALICE DAQ: Információs versenypálya ALICE DAQ/DDL adatgyűjtő/továbbító rendszer 500 db adat-link kártya: DDLs 450 db fogadó kártya: D-RORCs 2 PB/év adat kezelése Óriási sugárzási háttér (krad)! Minden detektor, de legfőbb a TPC Más CERN kísérletek is használják Sikertörténet reloaded... 22

ALICE DDL/DAQ:adatfeldolgozó sztráda Közös DAQ és trigger DAQ/HLT DDL2, RORC2 Prototípus KÉSZ Beszerelés/upgrade a Nagy Leállás alatt (2014-16) (LS1) and LS2 12 db DDL2 (6 Gb/s) link együtt DAQ LDC (36 Gb/s) forgalom. PCIe V2 8 buszokon (500 MB/s/lane) I/O 32 Gb/s FPGA alapú adatfeldolgozás már trigger DAQ szinten(e.g cluster finding) Jelen: 1 PC-ben 5 link (2Gb/s) I/O (10 Gb/s) Prototípus paraméterek (fejlesztés alatt) 12 link (6 Gb/s) 6 link DAQ LDC együtt (36 Gb/s). PCIe2 x8 (500 MB/s/sáv) I/O (32 Gb/s) Beszereléskor 12 links (10 Gb/s/PC) PCIe3 16 sávon I/O (128 Gb/s) 4 4 4 23

DDL SIU EVOLÚCIÓ SIU1 SIU2 SIU3 SIU IP CORE SIU IP CORE Det. Read-Out FPGA Det. Read-Out FPGA 1 ch @ 2 Gb/s ACTEL FPGA (CORE cost 560 CHF) Up to 6 Gb/s XILINX / ALTERA /ACTEL FPGA (CORE cost 0 CHF) 10 Gb/s XILINX / ALTERA / ACTEL FPGA (CORE cost 0 CHF) Custom DDL protocol Custom DDL protocol (same protocol but faster) RUN1 L S 1 RUN2 L S 2 Custom DDL 10 Gb/s Ethernet @ 10 Gb/s PCIe over fibre RUN3 24 24

RORC EVOLUCIÓ RORC1 RORC2 (aka C-RORC) RORC3 TBD 2 ch @ 2 Gb/s PCIe gen.1 x4 (1 GB/s) ALTERA FPGA 12 ch @ up to 6 Gb/s PCIe gen.2 x8 (4 GB/s) XILINX FPGA Custom DDL protocol Custom DDL protocol (same protocol but faster) RUN1 L S 1 RUN2 12 ch @ 10 Gb/s PCIe gen.3 ALTERA / XILINX L S 2 Custom DDL 10 Gb/s Ethernet @ 10 Gb/s PCIe over fibre RUN3 25 25

Magyar részvétel az adatanalízisben TPC R&D Theory CRU R&D Analysis 4 44 Detector R&D ALICE Tier2 DAQ UG 26

Egy kis fizikai: proton-proton ütközés Egyszerű elméleti modell pp ütközésre 27

A mért adat még nem elég

Részecsketranszport: sok erőforrás

MC generátorok a nagyenergiás fizikában Miért van szükség Monte Carlo generátorokra? Vannak fizikai problémák amelyekre nincs zárt, analitikus képlet, vagy determinisztikus leírás: Stohasztikus folyamatok (független események) numerikus (multi-d) integrálok optimalizációk Megoldási módszerek & és hibák Numerikus eremányek véletlen mintavételezése Hibabecslés (standard devitaion) Gyors random számok Computing & IT 30

Gyors számítások = parallel számítások Moore törvénye: Kétévente a tranzosztorok száma megduplázódik az számítástechnikai integrált áramkörökben. Amdalh törvénye: A párhuzamosítás során nyerhető gyorsítás, ha a program p hányada párhuzamosítható N szálon: 31

Hogyan használjuk ki jobban a WLCG-t WLCG: Kritikus pont a WN-ek száma és teljesítménye. Multicore gépek, single-thread számolások Ha van szabad multi-core kapacitás, akkor sofrware és middleware szintű belépés 32

Egy lehetőség: Vektorizáció

GeantV fejlesztés

Geometriai algoritmusok tömbösítése

Geometriai algoritmusok tömbösítése

Geometriai algoritmusok tömbösítése

Egy másik lehetőség: GPU@MC 38

Mikor jön el a GPU-pillanat? Nincs direkt válasz! Pilótatnulmány: opimalizáció Szükség van nagyon nagy skálájú számításokra 10x több idő kell programozásra, fejelsztésre Magas szintű hardverközeli programozás $$$$$$ Mit találunk a piacon? (komolyabb CUDA, stb... tudás nélkül) Libek & toolkek (BLAS, FFTW, CUBLAS, CUFFT) Wrapperek (C, FORTRAN CUDA) OpenCL standardok (Ati, NVidia) Mathematica, MatLab (GPU támogaztással) 39

GPU alapú PRNG MC Math AliRoot az ALICE adatszimulációs és rekonstrukciós, elemzőja 40

GPU alapú PRNG MC Tesztelt PRNG kódok Trandom1 (RANLUX) TRandom2 (Tausworthe) Trandom3: Original CPU based Mersenne Twister) algorithm Trandom4: CPU/GPU based SFMT (SIMD-oriented Fast Mersenne Twister) algorithm Trandom5: CPU/GPU based MWC64X algorithm 41

A PRNG minősége is számít ám... Milyen jó lehet egy PRNG? 1) Egyszerű teszt momentumok vizsgálata 2) teszt: autokorreláció 3) PRNG komplex teszt: Diehard test : R.G. Brown, D. Eddelbüttel, D. Bauer: Diehard 3.31.1 a Kolmogorov-Smirov teszten alapuló nyílt forráskódú csomag (G. Marsaglia alapján) 42

A PRNG minősége is számít ám TRandom3 TRandom4 TRandom5 43

A PRNG minősége is számít ám A PRNG DieHard minőségtesztje TRandom3 Original CPU based Mersenne Twister TRandom4 CPU/GPU based SFMT (SIMD-oriented Fast MT) Performance TRandom5 CPU/GPU based MWC64X algorithm 44

Egy kis fizikai: proton-proton ütközés 400k TRandom5 PRNG Transverzális impulzus spektrum dn/dpt (Tsallis) Rapiditás-eloszlás dn/dy (Gauss) Szögeloszlás dn/dφ (Izotrópia) 45

Egy kis fizikai: proton-proton ütközés Teszteljük a 'fizikát': Új/régi Trandom Számolások összehasonlítása TRandomX/TRandom3 aránynak ~1 nek kellene lennie 10% egyezés pt<6 GeV/c 5% egyezés y <5 5% egyzés teljes φ tartomány 46

MTA Wigner FK erőforrások GPU Labor (Nagy-Egri M. F.) http://gpu.wigner.mta.hu Wigner Felhő (Genagrid, Harangozó Sz., Bíró G.) Genagrid: http://genagrid.hu Wigner Felhő (Wigner Cloud): 2015 márciusában indul 800 core, 1-2 PB storage Wigner Adatközpont WDC CERN Tier0 site 10K (20k) core, 2020-ig 73k core

GenaGrid: Hardware SGI Altix ICE 8200XE 64 blades Intel Xeon X5365 3.00GHz x2 (8 core) 16GB DDR2 RAM InfiniBand

GenaGrid: Software Red Hat Enterprise Linux 6 GCC, G++, GFORTAN compilers OpenMPI middleware AMD OpenCL SDK HTCondor que system

Wigner GPU Lab Hardware

Amit ma feldolgozhatsz... ne halaszd holnapra! 51