A Webtől a. Gridig. A Gridről dióhéjban. Debreczeni Gergely (MTA KFKI RMKI) Gergely.Debreczeni@rmki.kfki.hu



Hasonló dokumentumok
A Webtől a. Gridig. A Gridről dióhéjban. Debreczeni Gergely (MTA KFKI RMKI) Debreczeni.Gergely@wigner.mta.hu

A Detektortól a Végső Ábrákig

A Detektortól a Végső Ábrákig

A Web-től a Grid-ig. A Gridről dióhéjban. Frohner Ákos (CERN IT/DM)

GPU-k a gravitációs hullám kutatásban

Folytonos gravitációs hullámok keresése GPU-k segítségével

Worldwide LHC Computing Grid

alkalmazásfejlesztő környezete

Az LHC adatfeldolgozásának számítástechnikai háttere 10 percben. Hajdu Csaba KFKI RMKI

Az NIIF új szuperszámítógép infrastruktúrája Új lehetőségek a kutatói hálózatban

EGI-InSPIRE. Café Grid március 24. Szeberényi Imre 3/25/ EGI-InSPIRE RI

A Wigner FK részvétele a VIRGO projektben

Az NIIF új szuperszámítógép infrastruktúrája Új lehet!ségek a kutatói hálózatban Debreceni Egyetem

HunGrid Grid technológiák hozzáférési lehetőségei az intézetben

Az RMKI Grid-rendszere

Bemutatkozik a CERN Fodor Zoltán

"A tízezer mérföldes utazás is egyetlen lépéssel kezdődik."

A CERN bemutatása. Horváth Dezső MTA KFKI RMKI és ATOMKI Hungarian Teachers Programme, 2011

Európai Nukleáris Kutatási Szervezet Európai Részecskefizikai Laboratórium. 58 év a részecskefizikai kutatásban

Példa: LHC, CERN, Genf Enabling Grids for E-sciencE

Informatika el adás: Hardver

Indul az LHC: a kísérletek

Enabling Grids for E-sciencE. Grid bevezető INFSO-RI

A felhőről általában. Kacsuk Péter MTA SZTAKI

KÖSZÖNTJÜK HALLGATÓINKAT!

Grafikus csővezeték 1 / 44

Gravitációs hullámok. Vasúth Mátyás. Wigner FK, RMI. Wigner FK,

Az MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

Ezeket a kiemelkedı sebességő számítógépeket nevezzük szuperszámítógépeknek.

AliROOT szimulációk GPU alapokon

WEB2GRID: Desktop Grid a Web 2.0 szolgálatában

A számítástechnika gyakorlata WIN 2000 I. Szerver, ügyfél Protokoll NT domain, Peer to Peer Internet o WWW oftp opop3, SMTP. Webmail (levelező)

Informatika 11. el adás: Hardver

AZ UNIVERZUM SUTTOGÁSA

NIIFI HPC Szolgáltatás

ALICE: az Univerzum ősanyaga földi laboratóriumban. CERN20, MTA Budapest, október 3.

A processzor hajtja végre a műveleteket. összeadás, szorzás, logikai műveletek (és, vagy, nem)

GPU alkalmazása az ALICE eseménygenerátorában

Informatika 10. évf.

Flynn féle osztályozás Single Isntruction Multiple Instruction Single Data SISD SIMD Multiple Data MISD MIMD

Fekete lyukak, gravitációs hullámok és az Einstein-teleszkóp

Európai Nukleáris Kutatási Szervezet Európai Részecskefizikai Laboratórium. 62 év a részecskefizikai kutatásban

Bevezetés az európai és magyar Grid rendszerekbe

BIG DATA ÉS GÉPI TANULÁS KÖRNYEZET AZ MTA CLOUD-ON KACSUK PÉTER, NAGY ENIKŐ, PINTYE ISTVÁN, HAJNAL ÁKOS, LOVAS RÓBERT

MTA Cloud Use cases MTA Cloud workshop. Hernáth Szabolcs MTA WIGNER FK

Bemutatkozik a CERN. Fodor Zoltán HTP2015, Fodor Zoltán: Bemutatkozik a CERN

Számítógép felépítése

Számítógép-rendszerek fontos jellemzői (Hardver és Szoftver):

Hozzáférés a HPC-hez, kezdő lépések (előadás és demó)

Mikrofizika egy óriási gyorsítón: a Nagy Hadron-ütköztető

Távközlési Világnap 2016 Győr, május 12. Dr. Bartolits István főosztályvezető Technológia-elemző Főosztály

Ismerkedjünk tovább a számítógéppel. Alaplap és a processzeor

A számítógépek felépítése. A számítógép felépítése

A HunGrid bemutatása és alkalmazása levegőszennyezés előrejelzésére 1

CERN: a szubatomi részecskék kutatásának európai központja

Térinformatika. Térinformatika. GIS alkalmazói szintek. Rendszer. GIS funkcionális vázlata. vezetői szintek

Kivonat. 1. Bevezetés (Mi a Grid?)

Web harvesztelés. Automatikus módszerekkel

Számítógépek felépítése

Pósfay Péter. ELTE, Wigner FK Témavezetők: Jakovác Antal, Barnaföldi Gergely G.

Rőczei Gábor Szeged, Networkshop

Nehézion ütközések az európai Szupergyorsítóban

Üdvözlöm Önöket a Konferencián!

Mi van a számítógépben? Hardver

Az internet az egész világot behálózó számítógép-hálózat.

Szuperszámítógépes teljesítmény szuperszámítógép nélkül A BinSYS Projekt

Bevezetés a részecskefizikába

NIIF szolgáltatások a múzeumok számára

HP-SEE projekt eredményei

SÉTA A HIGGS RÉSZECSKE HAZÁJÁBAN

Networkshop Kaposvár Balaskó Á., Kozlovszky M., Karóczkai K., Márton I., Kacsuk P. MTA SZTAKI

Számítógépes hálózatok

SDL Trados szervermegoldások. Szekeres Csaba SDL Trados partner M-Prospect Kft.

Java és web programozás

Bevezetés az informatikába 1.

Miért jó nekünk kutatóknak a felhő? Kacsuk Péter MTA SZTAKI

BEVEZETÉS AZ INTERNET ÉS A WORLD WIDE WEB VILÁGÁBA. Kvaszingerné Prantner Csilla, EKF

Magas szintű optimalizálás

Számítógépes alapismeretek 1.

SAMSUNG SSM-8000 szoftvercsomag

A JÖVŐ INTERNET KUTATÁSKOORDINÁCIÓS KÖZPONT SZERVEZETI ÉS MŰKÖDÉSI SZABÁLYZATA

Symantec Endpoint Protection

A számítógép egységei

Theory hungarian (Hungary)

Eddig ha játékról volt szó: PC vagy konzol Mára már elindult a cloud szolgáltatásokon keresztül játszható játékok elterjedése

Virtuális Obszervatórium. Gombos Gergő

Processzor (CPU - Central Processing Unit)

OpenCL - The open standard for parallel programming of heterogeneous systems

Az Invitel adatközponti virtualizációja IBM alapokon

Üzleti kritikus alkalmazások Novell Open Enterprise Serveren

IKT trendek és tapasztalatok a BME szemszögéből

Költséghatékony high-end adattároló megoldások Vitéz Gábor, Avaxio Kft.

A NetSupport School oktatást támogató rendszer

FELHŐ és a MAINFRAME. Irmes Sándor

KOPI. KOPI A fordítási plágiumok keresője MTA SZTAKI DSD. Pataki Máté Kovács László. Department of Distributed Systems

Tarantella Secure Global Desktop Enterprise Edition

Megmérjük a láthatatlant

Bepillantás a gépházba

Párhuzamos programozási platformok

Big Data. A CERN, mint a. egyik bölcsője... Barnaföldi Gergely Gábor. Berényi Dániel & Biró Gábor & Nagy-Egri Máté Ferenc & Andrew Lowe

Átírás:

A Webtől a Gridig A Gridről dióhéjban Debreczeni Gergely (MTA KFKI RMKI) Gergely.Debreczeni@rmki.kfki.hu

A tartalomból: Számítástechnika a CERN-ben A Web születése Az LHC Grid A Grid alkalmazásai Gyógyászat Gravitációs hullám kutatás A GPU-k mint szuperszámítógépek High-Performance computing, a GenaGrid project

A kezdetek... Wim Klein Képes volt egy 133 számjegyből álló szám 19. gyökét fejben meghatározni. Egyszerű matematikai műveletekben jóval gyorsabb volt kora számítógépeinél. 3

Az első számítógépek 1958-61: AZ első valódi nagyszámítógép a CERN-ben, a MERCURY. Két 40 bites szám összeadása 180, szorzása 300 us-ig tartott. Lyukszallag programozás. 1966-ban elajándékozták a lengyel 'ásványtani és bányászati' minisztériumnak. 4

Az első számítógépek 1961-63: Az IBM709 4x gyorsabb a MERCURY-nál. Mágnes szallagos egység 200 bpi sűrűséggel ír/olvas. Támogatja a FORTRAN programozási nyelvet! 5

Megjelent az Internet... Mi az Internet? - Az Internet összekapcsolt számítógépek millióinak rendszere. Neve az 'Interconnected networks' kifejezésre utal. A kapcsolat lényege nem a kábel vagy a rádiókapcsolat, hanem a közös nyelv (protokoll). A protokoll - A protokoll az egymással való kapcsolattartás és információcsere szabályainak összessége. Az Interneten való kommunikációhoz a Transmission Control Protokol/Internet Protokolt A TCP/IP - A TCP/IP óriási előnye, hogy rengeteg, teljesen különböző hálozaton használható. Ez a tulajdonsága kulcsfontosságú volt az Internet gyors elterjedésében. használjuk. 6

és a WEB. A World Wide Web (WWW) 'csak' egy, az Internetet használó szolgáltatás. (WEB Internet!!!). Segítségével információt oszhatunk meg, tehetünk nyilvánossá. A felhasználó a dokumentumokat feltölti egy webszerverre, amelynek egyedi címe (web address, vagy Uniform Resource Locator, URL) segítségével utalhatunk dokumentumokra. Kezdetben az információmegosztás statikus és egyirányú volt. Manapság a többirányú információmegosztást is támogató interaktív weboldalak, portálok, blogok uralják az internetet. Tim Berners-Lee 7

Miért is a CERN-ben fejlesztették ki a Web-et? A tudományos kutatásban rendkívül fontos az információ és az ötletek szabad áramlása. A CERN 80 országában dolgozó 6500 kutató nagy közös barkácsműhelye. Az LHC tervezésekor kritikus fontosságúvá vált az információ gyors, kőnnyű és globális megosztásának megvalósítása. 1989: Tim Berners-Lee javaslata az LHC információs rendszerére 1991: első www rendszerek 1993: első és sokáig népszerű Mosaic browser, ekkor már 500 webszerver, 1%-os forgalom! :-) 8

A Web napjainkban A mindennapok része, a tudományos, műszaki, diplomáciai és hétköznapi élet elképzelhetetlen nélküle. 2010 elején kb. 1.8 milliárd felhasználó 9

És mi a Grid? A Grid egy, az Internetre épülő szolgáltatás, csakúgy mint a Web. A Gridhez kapcsolt eszközök nem csak információt, osztanak meg, hanem tárterületet, számítási kapacitást, adazbázis információt, alkalmazásokat, hálozati forgalmat is! Neve az elektromos hálozatok analógiájára lett kitalálva. Hasonlat: Fogyasztók és szolgáltatók kenyérpirító és erőmű Ötlet: Évtizedek óta létezik, de globális méretekben csak most valósult meg. 10

Hogyan működik? A Gridet egy 'speciális' szoftver az ún. middleware (köztesréteg) tartja életben. A middleware 'automatikusan megtalálja' a felhasználó számára szükséges adatcsomagokat és legmegfelelőbb végrehajtási helyet (számítógépet). A middleware feladata továbbá a számítási terhelések egyenlő elosztása, a hálozati biztonság megteremtése, az erőforrások felügyelete, monitorozása, naplózás, számlázás es sok minden más. 11

Sokféle Grid létezik Ellentétben a Webbel jelenleg (még) nincs olyan, hogy Grid. Sokfajta Grid létezik, más-más feladatokra specializálva. Vállalati Gridek Önkéntes Gridek Tudományos Gridek Nemzeti Gridek Fájlmegosztó Gridek A nagyenergiás fizika nagyban elősegíti a különböző Gridek összekapcsolását egy globális Griddé. 12

Miért van szükség a Gridre? Napjaink tudományos kutatásához szükséges számításokat nem lehet hagyományos módon elvégezni. Biológia: Emberi genom Meteorológia: Hurrikán riasztás, előrejelzés Fizika: Récsecskefizika, gravitációs hullám kutatás Földtudomány: Ózonréteget vizsgálat Csillagászat: Csillagkatalógusok, exobolygók 13

Miért van szükség a Gridre? Az adatok, eredmények, programok és tárhely világméretű megosztása. Az elosztott rendszerek stabilitása nagyobb, nincs SPF (Single Point of Failure). Könyebben alakítható, fejleszthetó a számítástechnika fejlődésével Időszakos erőforrások használata is lehetővé válik A beszállítók folyamatos versenyeztetése DE nagy adminisztratív terhek, csoportok közötti versengés, politikai játszmák, nemzeti érdekek, etc... 14

A CERN és a Grid A CERN a világ legnagyobb részecskefizikai laboratóriuma. A CERN részecskegyorítóinak segítségével olyan alapvető kérdésekre válaszolunk mint: Hogyan született a világegyetem Miért van a dolgoknak tömege Hogyan viselkedik az antianyag A CERN viágméretú technikai és emberi közösséget hivatott kiszolgálni. Természetes, hogy itt született meg az LHC Grid. 15

Az LHC adatanalízise A detektorban egy ütközés = 1 Például a Higgs-bozon keletkezése: esemény A mérések célja, hogy megmérjül Egy bizonyos bomlása szerint 4 az ütközésben keletkezett részecskék müon nyomvonalat láthatunk a tulajdonságait (impulzus, töltés, detektorban. tömeg, energia, etc) Speciális nyomvonal kombinációk és energialeadások alapján azonosíthatók a különböző események. Több mint 8 millió esemény közül csupán 1 db ilyen! Rengeteg adatot kell rögzíteni, hogy a kellő számú eseményt megfigyelhessünk. 16

mega, giga, tera, peta, exa... Másodpercenként 40 millió ütközés 1 MegaByte digitális fénykép Az 'érdekes' események kiválogatása 1 GigaByte egy film után néhány 100 esemény mérete 3-4 MB 1 esemény, nagyobb mint 1 GB/sec tárolási sebességet igényel Sok milliárd ütközése évente, kb 10 PetaByte adatmennyiséget jelent Kb 10x ennyi MonteCarlo szimuláció szükséges! DE 1 TeraByte a világ éves könyvtermése 1 PetaByte Az LHC kisérletek adattermelése 1 ExaByte (1975) A világ éves információtermelése a köznyelvben illetve albánul 1 ZetaByte (1991) -?? 1 YottaByte (1991) -?? az 5 kiló = 500!!! 17

Az LHC adatözöne 10-15 millió GigaByte adat feldolgozása napjaink legjobb processzoraiból kb 100.000 db-ot igényel. Ha CD-n tárolnánk 20 km magas tornyot alkotna. Nem lehet egy helyre bezsúfolni, több összekapcsolt számítógépközpontra van szükség. A CERN számítógépterme, élvonalbeli, de hétköznapi, kereskedelmi PC-kből áll. Több mint 5000 sokprocesszoros gép, Probléma: nincs elég hely 18

A CERN számítógépközpontja 19

Az LCG munka közben Az LCG 2003-ban indult 12 ország részvételével. Magyarország (KFKI) 6.- ként csatlakozott! AZ LCG a NorduGrid, az EGEE és az OSG szolgáltatásait köti össze. Támogatja a Virtuális Szervezetek koncepcióját. Az első világméretű, 7/24 üzemű szolgáltatást biztosító, stabilan működő Grid! Ma több mint 250 központ, 40 ország, 5 kontinens, 80k+ processzor alkotja a rendszert. 20

Az LCG grid elemei Felhasználó Erőforrás kezelő (Resource broker) Számoló egység (Working node) Információs központ Műszakvezető (Computing element) Tároló egység (Storage element) 21

Az OpenLab project Az ipari partnerek a legfejletteb technikai eszközökkel és szakembergárdával látják el a CERN-t. A CERN cserébe pedig ezen eszközök olyan szintű tesztelését tudja megvalósítani ami egyébként nem vagy csak nehezen lenne lehetséges. https://openlab-mu-internal.web.cern.ch/openlab-mu-internal/ 22

A Grid Magyarországon - HunGrid Akadémiai intézmények http://grid.kfki.hu/ összekapcsolása (RMKI, SZTAKI, BME, ELTE, Debrecen) Kutatók, tanárok, diákok számára ingyenesen, szabadon, elérhető. (Személyes regisztráció szükséges) Eddigi kutatások: két-foton fizika, antianyag csapda szimuláció, levegőszennyezetség előrejelzés, statisztikus fizikai számítások, etc... 23

Az LHC @ HOME prgram http://lhcathome.cern.ch/ Az LHC @ HOME egy önkéntes Grid project. A SETI által is használt BOINC programkörnyezetet használja. A gyorsítóban keringő protonok pályályának stabilitásvizsgálatát végzi a program. Rengetek (desktop) PC és laptop vesz részt a világ számos pontjárol. Több mint 30.000 önkéntes 15.000 év CPU idő! (A SETI @ HOME-t 5 millió számítógépen futtaták.) Cél: extra számítási kapacitás megszerzése, népszerűsítés, diákok bevonása. 2004-ben indult a CERN 50 éves fennálásának évében. 24

Az Afrika @ HOME prgram Egy 3 hónapos diák project eredménye, több mint 500 számítógép csatlakozott 2 nap alatt. Több mint 100 CPU év 1 hónap alatt! Központi szerver Dakar-ban, a Tunis-i WSIS konferencián http://africa-at-home.cern.ch/ mutatták be. Malária terjedés szimulációja. 25

Az EGEE további alkalmazásai 1. Gyógyászat Madárinfluenza: Az EGEE-t használták, hogy a madárinfluenza elleni 300.000 lehetséges hatóanyag közül meghatározzák a legnagyobb eséllyel alkalmazhatókat. (Lásd még: http://foldit.it) 2000 számítógép 60 intézetében (Oroszország, Európa, Taiwan, Izrael, etc..) számolt 4 héten A neuraminidase a két leggyakoribb felületi protein egyikke elősegíti a telt volna. fertőzött sejtekben található virionok eltávolítását. (Kép: Ying-Ta Wu, Academia Sinica) keresztül. 1 számítógépnek 100 évébe Lehetséges ellenszereket sikerült azonosítani. 26

Az EGEE további alkalmazásai 2. Gravitációs hullám keresés Ált. Rel. megfigyelt jóslatai: Gravitációs hullámok: Az általános relativitáselmélet által megjósolt Perihélium elfordulás Gravitációs lencsézés Az idő 'múlásának' változása jelenség. Hatalmas tömegek mozgásakor fellépő teridő torzulások tovaterjedései. Mindmáig csak közvetett (de nagyon meggyőző) bizonyítékunk van. 27

Az EGEE további alkalmazásai 2. Gravitációs hullám keresés Csillagkettős becsavarodás Forgó neutroncsillagok Sztochasztikus grav. hullámok Robbanások, szupernovák 28

Az EGEE további alkalmazásai 2. Gravitációs hullám keresés Cascina, Olaszország 3 km-es karhosszúság Fabry-Perot kavitások 50/150-es jósági tényező 6800 m3, 10-10 mbar vákuum!! 20 W lézer http://www.virgo.infn.it/ stabil beton alapzat, 20-50 m mélyen 1 MW fogyaztás kiváló szeizmikus izoláció (10-5 ) 29

Az EGEE további alkalmazásai 2. Gravitációs hullám keresés 30

Az EGEE további alkalmazásai 2. Gravitációs hullám keresés http://virgo.rmki.kfki.hu/ Nagyon zajos mérési jelsorozatban kell megtalálni a nagyon kis amplitudójú jelet. Nem triviális a kereső algoritmusok aritmetikai sűrűsége nagyon nagy! Elosztott rendszerekre és hatalmas számítási kapacitásra van szükség! Lehet, hogy már megmértük, csak számítási kapacitás hiányában nem tudjuk kihámozni. Nagyon fontos a gyorsítás. 31

Az EGEE további alkalmazásai 2. Gravitációs hullám keresés 32

Az EGEE további alkalmazásai 2. Gravitációs hullám keresés Az RMKI koordinálja a jobok elosztását 33

A GPU-k mint szuperszámítógépek A GPU-k: Graphical Processing Unit. A számítógépek grafikus kártyája. http://gpu.kfki.hu/ Eredeti feladata a képernyőn megjelenő pixelek (képpontok) helyzetének és színének kiszámítása volt. A játékipar fejlődésével a GPU kártyák számítási kapacitása és memóriája gyorsan nőtt. A GPU-t segédprocesszorként használva számításokat végezhetünk el rajta. 34

A GPU-k mint szuperszámítógépek CPU - GPU összehasonlítás A GPU-k (elméleti) műveleti sebességének és memória sávszélességének gyorsulása jóval meghaladja a CPU-két! Természetesen nem minden probléma párhuzamosítható, de rengeteg jól elkülöníthető algoritmust használunk ami sikeresen és jóval hatékonyabban implementálható GPU-n! 35

A GPU-k mint szuperszámítógépek Alkalmazási példák A GPU kis processzorai Komplex vektorok nagyon gyorsak az skaláris szorzata elvégzésében, (szorzás, alapműveletek Gyors Fourier 15x 4x össueadás) de lassabbak Transzformáció (FFT) kiszámolásában (sin, cos, Hullámformák számolása 30x A sebességnövekedés Ising-modell szimuláció 60x Valós idejű bonyolult függvények tan). függ a probléma méretétől, tipusától, bonyolultásgától, és a képfeldolgozás 20x kívánt számítási pontosságtól. 36

High-Performance Computing A GenaGrid project Fenotípus, genotípus: Asszociációk, okozati összefüggések, függőségek és kontrol mechanizmusok azonosítása. Rengeteg megfigyelés, modellek és lehetséges gráfok irdatlan halmaza Teljes genom tanulmányozás (GAS) Részleges genom átvilágítás (PGSS) A cél a magyarázó vagy okozati változók relevanciájának meghatározása célváltozók szempontjából az okozati változók keresztfüggéseinek meghatározása. 37

High-Performance Computing A GenaGrid project 38

High-Performance Computing A GenaGrid project Az SGI gép http://genagrid.hu 512 CPU (64 x 8 ) Intel Xeon, X5365 @ 3 GHz 16 GB memória/8 mag 10 TB Raid5 disk tárhely Infiniband (40 Gb/s) belső kapcsolat Szoftver RedHat Enterprise Linux Condor és PBS ütemezők, SGI MPI, Tempo klaszter kezelő rendszer, OpenMPI, SGI ProPack Áramellátás Vízhűtés 37 KW felvett csúcsteljesítmény 7 TeraFlop számítási kapacitás 39

Összehasonlítás 64 blade 200 PC 4 dual GPU kartya 512 core 400 core 2048 core 6.5 TeraFlop 12 TeraFlop 7 TeraFlop 37 KW 30 KW 1.2 KW 15.3 MFt/TFlop 1.6 MFt/TFlop 0.08 MFt/TFlop 100 millió Ft HPC nagygép 20 millió Ft PC klaszter 0.6 millió Ft GPU klaszter 40

Összefoglalás A Web-bel ellentétben, (még) nincs olyan, hogy a Grid. Sokféle Grid létezik. A nagyenergiás részecskefizikai kutatások számítástechnikai fejlesztésit más tudományágak is használják. Az @HOME projectek segítségével mindenki bekapcsolódhat a kutatásokba, és rengeteket tanulhat belőle. Magyarországon a HunGrid a tanárok, diákok, kutatók számára is elérhető Különböző problémák különböző megoldásokat igényelnek, lásd HPC, GPU klaszter. Köszönöm a figyelmet! CERN látogatás http://cern.ch/szentlaszlo Debreczeni Gergely (Gergely.Debreczeni@rmki.kfki.hu) 41