Szuperszámítógépektől a klaszterekig. Kacsuk Péter www.lpds.sztaki.hu



Hasonló dokumentumok
Párhuzamos programozási platformok

Az NIIF új szuperszámítógép infrastruktúrája Új lehetőségek a kutatói hálózatban

Párhuzamos programozási platformok

Introduction to the Grid. Peter Kacsuk MTA SZTAKI

Ezeket a kiemelkedı sebességő számítógépeket nevezzük szuperszámítógépeknek.

Az NIIF új szuperszámítógép infrastruktúrája Új lehet!ségek a kutatói hálózatban Debreceni Egyetem

Bevezetés a párhuzamos programozási koncepciókba

NIIF Központi Elosztott Szolgáltatói Platform

Az MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

Cloud computing. Cloud computing. Dr. Bakonyi Péter.

TANÚSÍTVÁNY KARBANTARTÁS Jegyzıkönyv

Érzékelők és beavatkozók I.

ARM processzorok felépítése

Everything Over Ethernet

Using the CW-Net in a user defined IP network

Számítógép architektúrák I. Várady Géza

Infrastruktúra lehetőségek idén

Digitális Technika I. (VEMIVI1112D)

SZÁMÍTÓGÉPES ARCHITEKTÚRÁK

Osztott alkalmazások fejlesztési technológiái Áttekintés

SZÁMÍTÓGÉPES ARCHITEKTÚRÁK A STRUKTURÁLT SZÁMÍTÓGÉP-FELÉPÍTÉS. Misák Sándor. 2. előadás DE TTK

Cloud computing Dr. Bakonyi Péter.

Párhuzamos és Elosztott Rendszerek

Ethernet/IP címzés - gyakorlat

Computer Architecture

Tartalom. Történeti áttekintés. Történeti áttekintés Architektúra DCOM vs CORBA. Szoftvertechnológia

Ami az Intel szerint is konvergens architektúra

Dedikált szerverhoszting katalógus november

Flynn féle osztályozás Single Isntruction Multiple Instruction Single Data SISD SIMD Multiple Data MISD MIMD

GENERÁCIÓS ADATBÁZISOK A BIG DATA KÜLÖNBÖZŐ TERÜLETEIN

Összegzés és hogyan tovább

Párhuzamos és Grid rendszerek. Hol tartunk? Klaszter. Megismerkedtünk az alapfogalmakkal,

Adatintenzív alkalmazások grid-es környezetben

Az Invitel adatközponti virtualizációja IBM alapokon

KOGGM614 JÁRMŰIPARI KUTATÁS ÉS FEJLESZTÉS FOLYAMATA

A számítógép egységei

alkalmazásfejlesztő környezete

Pletykaalapú gépi tanulás teljesen elosztott környezetben

Live free() or die() Az openmosix cluster szoftver

Linuxot mindenre - Raspberry Pi

NIIFI HPC Szolgáltatás

FELHŐ és a MAINFRAME. Irmes Sándor

Számítógépes alapismeretek

Üzleti kritikus alkalmazások Novell Open Enterprise Serveren

2. Számítógépek működési elve. Bevezetés az informatikába. Vezérlés elve. Külső programvezérlés... Memória. Belső programvezérlés

1. Gyakorlat: Telepítés: Windows Server 2008 R2 Enterprise, Core, Windows 7

IBM Power 550 Express szerver

SAP Business One. Áttekintés, gyakorlati ismertetı. Mosaic Business System Kft.; Support:

Számítógépek felépítése

Weblog elemzés Hadoopon 1/39

2016/06/23 07:47 1/13 Kérdések

A Középtávú Időjárási Előrejelzések Európai Központjában készülő időjárási modell előrejelzések informatikai háttere

HA (High-availability) HPC (High-performance clusters) Grid Load-balancing. o o o o. Készítette: Molnár Veronika Fazekas Erzsébet

Csoportos üzenetszórás optimalizálása klaszter rendszerekben

HP-SEE projekt eredményei

Optimalizáció ESX-től View-ig. Pintér Kornél ügyfélszolgála3 mérnök

Utolsó módosítás:

Az Ön kézikönyve HP COMPAQ DC5700 MICROTOWER PC

Radware terhelés-megosztási megoldások a gyakorlatban

Hadoop és használata az LPDS cloud-on

Mérnök informatikus mesterszak mintatanterve (GE-MI) nappali tagozat/ MSc in, full time Érvényes: 2011/2012. tanév 1. félévétől, felmenő rendszerben

UNIX / Linux rendszeradminisztráció

Digitális Technika I. (VEMIVI1112D)

Nagy adattömbökkel végzett FORRÓ TI BOR tudományos számítások lehetőségei. kisszámítógépes rendszerekben. Kutató Intézet

Párhuzamos és Grid rendszerek

ALKALMAZÁS MONITOROZÁS A MERCURY MONITORRAL A CLUSTERGRID INFRASTRUKTÚRÁN. Gombás Gábor, gombasg@sztaki.hu MTA SZTAKI

Pályázati felhívás. Az Educatio Társadalmi Szolgáltató Nonprofit Kft. pályázatot ír ki. Informatikai eszközök értékesítése.

Parciális rekonfiguráció Heterogén számítási rendszerek VIMIMA15

Hitachi Flash Újdonságok. Szokol Zsolt Senior Solution Consultant 2016 március

T430 Szerver. Műszaki adatok

Párhuzamos és Grid rendszerek

Esettanulmány (Case Study)

Novell és Oracle: a csúcsteljesítményű, költséghatékony adatközpont megoldás. Sárecz Lajos Értékesítési konzultáns

ihardware Szerverkatalógus június Használt szerverek Kiemelt akciós ajánlatunk:

Kommunikációs rendszerek programozása. Switch-ek

A Webtől a. Gridig. A Gridről dióhéjban. Debreczeni Gergely (MTA KFKI RMKI) Debreczeni.Gergely@wigner.mta.hu

Könyvtári címkéző munkahely

Parciális rekonfiguráció Heterogán számítási rendszerek VIMIMA15

8. Fejezet Processzor (CPU) és memória: tervezés, implementáció, modern megoldások

8. Fejezet Processzor (CPU) és memória: tervezés, implementáció, modern megoldások

ATM GERINCHÁLÓZAT AZ ELTE-N

1 Copyright 2012, Oracle and/or its affiliates. All rights reserved. Insert Information Protection Policy Classification from Slide 13

Digitális Áramkörök (Villamosmérnök BSc / Mechatronikai mérnök MSc)

Symantec Endpoint Protection

Computer Setup. Felhasználói útmutató

GPGPU alapok. GPGPU alapok Grafikus kártyák evolúciója GPU programozás sajátosságai

Operációs rendszerek. Bemutatkozás

Útmutató a Computer Setup (F10) segédprogram használatához dx2300 minitorony

Számítógép Architektúrák

Operációs rendszerek az iskolában

Bevezetés az európai és magyar Grid rendszerekbe

Új tehetséggondozó programok és kutatások

"A tízezer mérföldes utazás is egyetlen lépéssel kezdődik."

A Magyar Posta Zrt Hyper-V infrastruktúrája. Bene Zsolt Infrastruktúra fejlesztő rendszermérnök Magyar Posta ZRT

NIIF szolgáltatások a múzeumok számára

Adattárházak és üzleti intelligencia alkalmazások hardver igényei. Kósa Barna

Grafikus csővezeték 1 / 44

Asztali PC kínálatunk:

HÁLÓZATI HASZNÁLATI ÚTMUTATÓ

SUSE Linux Enterprise High Availability. Kovács Lajos Vezető konzultáns

Átírás:

Szuperszámítógépektől a klaszterekig Kacsuk Péter www.lpds.sztaki.hu

Tartalomjegyzék Bevezetés Szuperszámítógépek kora Klaszterek Konklúzió 2

Számítógépe Nagysebességű rendszerek fejlődése GFlops 2100 2100 2100 2100 2100 2100 2100 2100 2100 3 Mainframe számítógép Klaszter Szuperszámítógép Metaszámítógép

4 A szuperszámítógépek megalkotásának eredeti motivációi Az un. nagy kihívást jelentő problémák megoldása heteket sőt hónapokat vett igénybe még a mainframe számítógépeken is Sok processzort kellett összekapcsolni speciális nagysebességű belső hálózatokkal annak érdekében, hogy a fenti problémákat ésszerű időn belül meg lehessen oldani

5 Sequential Architecture Limitations Sequential architectures reaching physica limitation (speed of light, thermodynamics) Hardware improvements like pipelining, Superscalar, etc., are non-scalable and requires sophisticated Compiler Technology. Vector Processing works well for certain kind of problems.

Alkalmazási területek Tudományos számítások csillagászati modellezések molekuláris biológia vegyészeti kutatások atomfizika, stb. Mérnöki számítások gépjárműipar (ütközésmodellezés, áramlástani formatervezés, stb.) 6

7 TOP 500 számítógép alkalmazási területeinek megoszlása

8

A szuperszámítógép korszak Áttörés: Transzputerek (1984) Fő típusok: Vektorprocesszorok Cray, NEC, Hitachi túl drága Szimmetrikus multiprocesszorok Sequent, Sun, SGI, IBM korlátozott mértékben bővíthető MPP (Masszívan párhuzamos processzorok) Cray T3E, Intel Paragon, SGI Origin-2000 9

Taxonomy of Architectures Simple classification by Flynn: (No. of instruction and data streams) > SISD - conventional > SIMD - data parallel, vector computing > MISD - systolic arrays > MIMD - very general, multiple approaches. Current focus is on MIMD model, using general purpose processors or multicomputers. 10

11 SISD : A Conventional Computer Instructions Data Input Processor Data Output Speed is limited by the rate at which computer can transfer information internally. Ex:PC, Macintosh, Workstations

The MISD Architecture Instruction Stream A Instruction Stream B Instruction Stream C Data Input Stream Processor A Processor B Processor C Data Output Stream More of an intellectual exercise than a practical configuration. Few built, but commercially not available 12

SIMD Architecture Instruction Stream Data Input stream A Data Input stream B Data Input stream C Processor A Processor B Processor C Data Output stream A Data Output stream B Data Output stream C C i <= A i * B Ex: CRAY machine vector processing, Thinking machine cm* 13

MIMD Architecture Instruction Stream A Instruction Stream B Instruction Stream C Data Input stream A Processor A Data Output stream A Data Input stream B Processor B Data Output stream B Data Input stream C Processor C MIMD computer works asynchronously. Data Output stream C 14 Shared memory (tightly coupled) MIMD Distributed memory (loosely coupled) MIMD

Shared Memory MIMD machine Processor Processor A Processor Processor B Processor Processor C M E M O R Y B U S M E M O R Y B U S M E M O R Y B U S Global address space 15 Global Memory System Comm: Source PE writes data to GM & destination retrieves it Easy to program High sustained performance Limitation 1 : Increase of processors leads to memory contention. Limitation 2 : reliability & expandability. A memory component or any processor failure affects the whole system.

16 Distributed Memory MIMD Communication network Processor Processor A Processor Processor B Processor Processor C Advantages: Isolated address space Easily expandable High peak performance Highly reliable Drawbacks: difficult load balancing, mapping M E M O R Y communication is more costly B U S Memory Memory System System A M E M O R Y B U S Memory Memory System System B M E M O R Y B U S Memory Memory System System C

Main HPC Architectures SISD - mainframes, workstations, PCs. SIMD Shared Memory - Vector machines, Cray... MIMD Shared Memory - Sequent, KSR, Tera, SGI, SUN. SIMD Distributed Memory - DAP, TMC CM-2... MIMD Distributed Memory - Cray T3D, Intel, Transputers, TMC CM-5, plus recent workstation clusters (IBM SP2, DEC, Sun, HP).

Main HPC Architectures NOTE: Modern sequential machines are not purely SISD - advanced RISC processors use many concepts from vector and parallel architectures (pipelining, parallel execution of instructions, prefetching of data, etc) in order to achieve one or more arithmetic operations per clock cycle. 18

TOP 500 számítógép architektúrájának megoszlása 19 Masszívan párhuzamos proc. Vektorproc. Szimmetrikus multiproc. Klaszter

20 Szuperszámítógép típusok életciklusa Elterjedtség Mainframe Vektorproc. MPP Vektorproc. MPP Klaszterek 1970 1980 1995 2000 MPP: Masszívan Párhuzamos Processzorok

21 Halak tápláléklánc

22 1984. évi számítógépek tápláléklánca Mainframe PC Munkaállomás Miniszámítógép Vektor Szuperszámítógép

23 1994. évi számítógépek tápláléklánca Mainframe (leáldozóban) PC Munkaállomás Miniszámítógép Vector Superszámítógép (kihalóban) MPP

24 Jelen és jövő számítógépes tápláléklánca Klaszter

25 A klaszter technológia eredete Szuperszám. technológia LAN technológia Elosztott rendszerek Klaszterek

26 A klaszterek három fő jellemzője 1. Egy klaszter komplett számítógépeket kapcsol össze (mint a metaszámítógépek) 2. A klasztert alkotó számítógépek lazán csatoltak (mint a metaszámítógépek) 3. A klasztert mint egyetlen, egységes számítási erőforrást használjuk: Single System Image (mint a szuperszámítógépek)

A két alapvető klaszter típus 1. Munkaállomás hálózat (NOW: network of workstations) cél: a szabad számítási ciklusok kihasználása módszer: háttérben futó feladatok kiosztása tulajdonos: munkaáll.-ok egyedi tulajdonban korlátozott SSI követelmények 27 2. Dedikált klaszterek (szuperszám.-ek) cél: nagy teljesítmény és sebesség módszer: párhuzamos feldolgozás tulajdonos: közös tulajdon erős SSI követelmények

Tipikus NOW struktúrája szerver További közös erőforrások 10 Mbit/s ethernet LAN 28 Munkaállomás #1 Munkaállomás #2 Munkaállomás #N

29 Tipikus dedikált klaszter struktúrája szerver 48 port, 2.4 Gbps kapcsoló 100Mbit/s gyors ethernet Munkaállomás #1 Munkaállomás #2... Munkaállomás #N

Műszaki jellemzők 1 db DELL Precision 610M szerver gép 2db Intel Pentium III Xeon 550MHz processzor 256 MB hibajavítós SDRAM memória 2x 18GB Ultra2 SCSI diszk 3db 100Mbit-es Ethernet interfész kártya 3D gyorsító videókártya, 32 MB RAM 40-szeres sebességű SCSI CD-ROM olvasó 17 DELL monitor 30

Műszaki jellemzők 28 db DELL Precision 410M munkaállomás 2db Intel Pentium III 500MHz processzor 128 MB hibajavítós SDRAM 9.1 GB Ultra2 SCSI diszk 100Mbit-es Ethernet interfész kártya 3D gyorsító videókártya, 32 MB RAM 40-szeres sebességű SCSI CD-ROM olvasó 15 DELL monitor Hálózat: 100Mbit-es Ethernet 48 portos Cisco 100Mbit-es Ethernet kapcsoló (fullduplex, 2.4Gbps) 31

Az MTA SZTAKI klaszter jellemzői 29 db duál-pentiumos PC Szuperszámítógép kapacitás Teljes memória kapacitás: 3.84 GB Teljes diszk kapacitás: 290 GB Hálózati áteresztőképesség: 2.4 Gbps Magyarország egyik leggyorsabb számítógép konfigurációja Csúcssebesség: ~ 30 Gflop Top500 belépő: 60 Gflop 32

Példa klaszter: Berkeley NOW 100 Sun UltraSparcs 200 disks Myrinet SA 160 MB/s Fast comm. AM, MPI,. Ether/ATM switched external net Global OS Self Config 33

34 Szuperszámítógépek, klaszterek és metaszámítógépek összehasonlítása I. Processing units (nodes) Supercomputer Cluster NOW Metacomputing system Microprocessors PCs, PCs, Supercomputers, workstations workstations clusters, PCs, workstations 100-1000 10-100 10-100 100-10000 Number of nodes Communication Buses, switches LAN LAN Internet network Node OS Homogeneous Typically Typically Heterogeneous homogeneous heterogeneous Inter-node Nonexistent Rarely Necessary Necessary security required

35 Szuperszámítógépek, klaszterek és metaszámítógépek összehasonlítása II. Programming models Programming language Supercomputer Cluster Metacomputing system Shared memory Message passing HPF (C/Fortran)+MPI Shared memory Message passing Peer-to-peer Client-server HPF (C/Fortran)+MPI Message passing Client-server Code shipping Proxy computing Intelligent mobile agents HPF (C/Fortran)+MPI Java/CORBA Middleware No Limited forms Toolkit approach Three-tier commodity (Java/CORBA) Object-oriented Programming environment Toolkit approach Integrated environment Toolkit approach Integrated environment Resource allocation Mapping Mapping Load balancing Load balancing QoS No No Yes Toolkit based Application specific Integrated environment Resource manager

Klaszter elérési üzemmódok Lokális elérés Klaszter = Közös erőforrás (Processzorok, Memória, Diszkek) Interne elérés 36 Sok felhasználó számára garantál legalább egy munkaállomást Sok munkaállomást biztosít néhány felhasználó számára

37 Klaszterek programozási nehézségei Programozás? High-Speed Switch Megfigyelés?

Szoftver környezet a klaszteren Operációs rendszerek RedHat Linux 6.1 Microsoft NT Kommunikációs könyvtárak párhuzamos programozáshoz PVM (Parallel Virtual Machine) MPI (Message Passing Interface) Virtuális közös memóriás rendszerek OpenMP 38 Párhuzamos programfejlesztő rendszer P-GRADE

39 Köszönöm a figyelmüket? További információ: www.lpds.sztaki.hu