Négyprocesszoros közvetlen csatolású szerverek architektúrája:



Hasonló dokumentumok
Ismétlés: Moore törvény. Tranzisztorok mérőszáma: n*százmillió, n*milliárd.

Teljesítmény: időegység alatt végrehajtott utasítások száma. Egységek: MIPS, GIPS, MFLOPS, GFLOPS, TFLOPS, PFLOPS. Mai nagyteljesítményű GPGPU k: 1-2

GPGPU-k és programozásuk Dezső, Sima Sándor, Szénási

ELŐADÁS SZÁMÍTÓGÉP MŰKÖDÉSE FIZIKA ÉS INFORMATIKA

Hibrid előadás: az ea másik felében a Morgen Stanley munkatársa kiegészítéseket fog hozzáfűzni a témához. Hagyományos és szerverrendszerek.

VLIW processzorok (Működési elvük, jellemzőik, előnyeik, hátrányaik, kereskedelmi rendszerek)

Digitális Technika I. (VEMIVI1112D)

PCI Express szabvány

Számítógép Architektúrák

Digitális Áramkörök (Villamosmérnök BSc / Mechatronikai mérnök MSc)

GPGPU alapok. GPGPU alapok Grafikus kártyák evolúciója GPU programozás sajátosságai

OpenCL Kovács, György

Digitális Technika I. (VEMIVI1112D)

GPGPU: Általános célú grafikus processzorok cgpu: computational GPU GPGPU = cgpu Adatpárhuzamos gyorsító: dedikált eszköz, ami eleve csak erre

Feladatlap: Számítógép összetevők keresése

Ikermaggal bıvített kimutatások

Memóriák - tárak. Memória. Kapacitás Ár. Sebesség. Háttértár. (felejtő) (nem felejtő)

Digitális Technika I. (VEMIVI1112D)

Ár: Ft Garancia: 2 Év

Dell Vostro 460. A figyelmeztetésekről VIGYÁZAT! A VIGYÁZAT jelzések esetleges tárgyi. Üzembe helyezés és információk a funkciókról

SAMSUNG Notebook és netbook katalógus 2011

Bevitel-Kivitel. Eddig a számítógép agyáról volt szó. Szükség van eszközökre. Processzusok, memória, stb

Ami az Intel szerint is konvergens architektúra

Első sor az érdekes, IBM PC ra alapul: 16 bites feldolgozás, 8 bites I/O (olcsóbb megoldás). 16 kbyte RAM. Nem volt háttértár, 5 db ISA foglalat

Újrakonfigurálható technológiák nagy teljesítményű alkalmazásai. Bevezető Szerver architektúrák Kommunikációs interfészek

GPGPU. GPU-k felépítése. Valasek Gábor

Számítógépes alapismeretek

Mikroprocesszorok (Microprocessors, CPU-s)

Megérkeztek a legújabb DELL Latitude E modellek. DELL NB Latitude E5500

MEMÓRIA TECHNOLÓGIÁK. Számítógép-architektúrák 4. gyakorlat. Dr. Lencse Gábor. tudományos főmunkatárs BME Híradástechnikai Tanszék

Újrakonfigurálható technológiák nagy teljesítményű alkalmazásai

LAN és Wireless LAN eszközök megoszlása

A Számítógépek hardver elemei

Számítógépek felépítése

A PC története. Informatika alapjai-9 Személyi számítógép (PC) 1/12. (Personal computer - From Wikipedia, the free encyclopedia)

Tagállamok - Árubeszerzésre irányuló szerződés - Ajánlati felhívás - Tárgyalásos eljárás. HU-Siófok: Asztali számítógépek 2011/S

I. Bevezető, az elektronikai tervezés során felmerülő megoldandó problémák rövid összefoglalása

Bepillantás a gépházba

Dedikált szerverhoszting katalógus november

A PC története. Informatika alapjai-9 Személyi számítógép (PC) 1/15. (Personal computer - From Wikipedia, the free encyclopedia)

TANÚSÍTVÁNY KARBANTARTÁS Jegyzıkönyv

Párhuzamos és Grid rendszerek

1 Bevezetés 2. 2 Hardver Csomópont hardverek Szerver hardver Kössünk össze mindent egymással hardverek...

Informatika 11. el adás: Hardver

3DMark 06 CPU. Magok / Szálak 8MB / MB /

Villamos jelek mintavételezése, feldolgozása. Mérésadatgyűjtés, jelfeldolgozás 9. előadás

Heterogén számítási rendszerek. Bevezető Szerver architektúrák Kommunikációs interfészek

ismerd meg! A PC vagyis a személyi számítógép

Számítógép Architektúrák

Apple Macintosh - A kezdetek és a jelen

Az INTEL mikroprocesszorok architekturális fejlődésének bemutatása

GPGPU programozás lehetőségei. Nagy Máté Ferenc Budapest ALICE ELTE TTK Fizika MSc 2011 e-science Café

AMD PROCESSZOROK KÉSZÍTETTE: NAGY ZOLTÁN MÁRK EHA KÓD: NAZKABF.SZE I. ÉVES PROGRAMTERVEZŐ-INFORMATIKUS,BSC

Informatika el adás: Hardver

Siklós, Felszabadulás u. 65. Telefon / Fax : 72/ Web:

Pályázati felhívás. Az Educatio Társadalmi Szolgáltató Nonprofit Kft. pályázatot ír ki. Informatikai eszközök értékesítése.

Parciális rekonfiguráció Heterogén számítási rendszerek VIMIMA15

Teszt: Az nvidia GeForce kártyák Crysis 2-ben mért teljesítménye

Budai Attila. Webalapú multimédiás interaktív oktatóprogramok

OpenCL - The open standard for parallel programming of heterogeneous systems

ihardware Szerverkatalógus június Használt szerverek Kiemelt akciós ajánlatunk:

Az NIIF új szuperszámítógép infrastruktúrája Új lehetőségek a kutatói hálózatban

* 800 MHz/PC-3200/ATA-100. SPECint_base2000/f c Pentium III. Pentium * 800 MHz/PC-2667/ATA-100 * * * * *

Számítógép fajtái. 1) személyi számítógép ( PC, Apple Macintosh) - asztali (desktop) - hordozható (laptop, notebook, palmtop)

Digitális rendszerek. Digitális logika szintje

Máté: Számítógép architektúrák

Jó állapotú, használt számítógépek garanciával!

Operációs rendszerek MINB240. Bevitel-Kivitel. 6. előadás Input és Output. Perifériák csoportosításá, használat szerint

IBM System x újdonságok

Apple számítógépek összehasonlító táblázata

Tájékoztató. Használható segédeszköz: -

Újrakonfigurálható technológiák nagy teljesítményű alkalmazásai

Programozható logikai vezérlõk

8. Fejezet Processzor (CPU) és memória: tervezés, implementáció, modern megoldások

5. tétel. A számítógép sematikus felépítése. (Ábra, buszok, CPU, Memória, IT, DMA, Periféria vezérlő)

A mikroszámítógép felépítése.

Ezeket a kiemelkedı sebességő számítógépeket nevezzük szuperszámítógépeknek.

A CUDA előnyei: - Elszórt memória olvasás (az adatok a memória bármely területéről olvashatóak) PC-Vilag.hu CUDA, a jövő technológiája?!

PÁRHUZAMOS SZÁMÍTÁSTECHNIKA MODUL AZ ÚJ TECHNOLÓGIÁKHOZ KAPCSOLÓDÓ MEGKÖZELÍTÉSBEN

Új tehetséggondozó programok és kutatások

Fejezetek az Információ-Technológia Kultúrtörténetéből. Elektronikus kalkulátorok, személyi számítógépek története

TEE Informatikai eszközök beszerzése az Eszterházy Károly Főiskola részére a TÁMOP C-11/1/KONV

Jó állapotú, használt számítógépek garanciával!

Máté: Számítógép architektúrák

A memória működése szoftverfejlesztői szemmel. Smidla József Operációkutatási Laboratórium november 20.

Digitális Áramkörök (Villamosmérnök BSc / Mechatronikai mérnök MSc)

Alaplap. Az alaplapról. Néhány processzorfoglalat. Slot. < Hardver

Nyíregyházi Egyetem Matematika és Informatika Intézete. Input/Output

Az NIIF optikai alapú országos gerinchálózata

Bevitel-Kivitel. Bevitel-Kivitel és Perifériák. Algoritmusok és Alkalmazásaik Tanszék Budapest december 16.

Szabó Georgina- 20/ Urbán Zsolt- 20/

KÖZBESZERZÉSI ADATBÁZIS

Az NIIF új szuperszámítógép infrastruktúrája Új lehet!ségek a kutatói hálózatban Debreceni Egyetem

2007 Nokia. Minden jog fenntartva. A Nokia, a Nokia Connecting People, az Nseries és az N77 a Nokia Corporation védjegye, illetve bejegyzett

8. Fejezet Processzor (CPU) és memória: tervezés, implementáció, modern megoldások

GPGPU. Architektúra esettanulmány

Asztali PC-k, notebookok beszerzése

Számítógép Architektúrák (MIKNB113A)

Tibeko SZÁMÍTÓGÉPEK. Mindegyik termékünk számlával és garanciával!

Magyar Nemzeti Filmalap Közhasznú Nonprofit Zrt. igazgatósága részére speciális filmszakmai informatikai eszközök beszerzése

Átírás:

SzA49. AMD többmagos 2 és 4 processzoros szerverarchitektúrái (a közvetlenül csatolt architektúra főbb jegyei, négyprocesszoros közvetlen csatolású szerverek architektúrája, többmagos szerverprocesszorok fejlődésének áttekintése, és a Magny-Course fontosabb jellemzői) A közvetlenül csatolt architektúra főbb jegyei: -Hyper-Transport 3.0: 4db x16 kapcsolat a processzorok között (a szomszédos processzorok, nem úgy, mint az Intelnél, hogy mindegyiket mindegyikkel) -összesen: ~19MB cache (L1+L2+L3) 12mag esetén, ~17MB cache (L1+L2+L3) 8mag esetén -integrált 4 csatornás DDR3 memóriavezérlő, 40 GB/s sávszélességgel CPU-nként -45nm gyártástechnológia -a processzorhoz közvetlenül (PCI hídon keresztül) kapcsolódik a periféria pl: PCI-X, SATA, stb Négyprocesszoros közvetlen csatolású szerverek architektúrája: Többmagos szerverprocesszorok fejlődésének áttekintése A két cég közül először az AMD cserélte le az FSB-t, a HyperTransport nevű busszal 2003-ban az Athlon 64 processzoroknál. Ez egy nyílt szabvány, elkülöníti az input és output adatok útját, így egyszerre lehet írni és olvasni. A lecserélés oka egyrészt a megnövekedett adatforgalom az FSB-n (több processzor terheli, magasabb órajellel), másrészt a memória és a processzor közti kommunikáció egyik szűk keresztmetszete lett az FSB. Ennek kiküszöbölésére a processzorhoz közvetlen csatolták a memóriát, belekerült a processzorba a memóriavezérlő. A gyártástechnológia szempontjából 2008-tól fokozatos átállás volt a 65nm-ről a 45nm-re, bevezették a coherent HTt, azaz a 2, ill 4 stb processzor (nem mag) tud egymással közvetlenül kommunikálni az SMP (Symmetric Multiprocessing) rendszerekben. Így az északi híd használata nélkül is kommunikálhatnak a processzorok egymással. Legfontosabb feladata a cache koherencia fenntartása a cache-kben. A Magny-Cours fontosabb jellemzői: -AMD Opteron 6100 sorozat processzorának kódneve -8 ill. 12 mag (2x4-es, 2 szilícium lapkán 4 mag vagy 2x6-os felosztásban, 2 szilícium lapkán 6 mag) -processzoronként 4db HT link -4 csatornás DDR3 memóriavezérlő (Unbuffered/Buffered RAM-ot is támogat) -minden mag saját L2-vel rendelkezik, míg az L3 cache közös (ld: ábra lent) 1

Az AMD Magny-Cours kódnevű Opteron processzora 2

SzA50. Sokmagos processzorok I. (Intel Larrabee processzora) Fejlesztés célja: - nagy teljesítményű grafikai processzor, HPC-re - nem egy termék, hanem mikroarhitektúra, 2005-től fejlesztik - 2008-ban bemutató, 2009-re jelent volna meg de visszavonták, mert megjelent a konkurencia jobb GPGPU-ja (nvidia Fermi) - 2TFlops a fejlesztési cél Jellemzői: - 45nm gyártástechnológia - magonként 256kbyte cache, minden magban 4x Hyper Threading - P54C Pentium magok x86 utasításkészlettel - a cache-koherencia a magok közt a ringbus segítségével biztosított - 2 irányú, irányonként 512bit széles ringbus a magok közt - külön textúrázó egysége van, ami a trilinear, anisotropic szűrést és a textúra kitömörítést végzi - GPU-orientált illetve alaplapba tehető változata is létezett tehát nem csak grafikus célra használható hanem operációs rendszert is képes lett volna kiszolgálni (elméleti síkon létezett egy négyprocesszoros Larrabee szerver változat, ahol QPI volt a processzorok közt) - sok hasznos tapasztalattal szolgált az Intel számára a Sandy Bridge kifejlesztésekor 3

SzA51. Sokmagos processzorok II. (Intel Tiled és SCC processzorai; általános felépítésük, alapelemek, kapcsolóhálózat, értékelésük) Intel Tiled: -80 mag (8x10 csempe ), első nagy magszámú megoldás -a magok közt routeres 2D kapcsolóhálózat -kis méretű chip kísérleti célokra fejlesztve -mezoszinkron működés: azonos frekvencián mennek a magok, de eltérő fázisban -kis méretű cache-k, -minimális utasításkészlet -nincs semmilyen fordító, sem op.rendszer ami támogatná -> tesztelési, kutatási célokra egyetemeknek adták -nincs memóriakontroller -1,6 TFLOPS single-precision számítási teljesítmény -a fejlesztés tanulsága: 1) érdemes a tranzisztorok egy részét on-die memóriaként felhasználni (azonban nem minden esetben hasznos) 2) cache-koherencia támogatása korlátozza a magszámot 3) gyors kommunikáció kell a magok között Intel SCC (Single-Chip Cloud Computing): -48db Pentium mag (24 csempe 2 maggal) -45nm gyártástechnológia -2D rácsos kapcsolóhálózat a magok között -shared memory (cache koherenciát biztosítani kell) -> cache controller -4 memóriavezérlő -fejlett energiaháztartás: saját feszültség- és frekvenciaszigetek (8db) -> disszipációt csökkenti -max. 125W TDP -C/C++ és JavaScript nyelvek támogatása (az Intel fejlesztői jelenleg ezekkel tesztelik a chipet) forrás: http://newsroom.intel.com/servlet/jiveservlet/downloadbody/1088-102-1-1165/intel_scc_whitepaper_4302010.pdf 4

SzA52. Heterogén mester/szolga elvű többmagos processzorok (Intel Cell processzora) Fejlesztés célja: -Sony, IBM és Toshiba közös terméke játékok/multimédia és HPC alkalmazásokra -Playstation 3 és QS2x Blade szerverekhez Jellemzői: - 1 mester 8 szolga - a mester a kapcsolóhálózaton keresztül DMA segítségével felprogramozza a szolgát (beteszi a programkódot és az adatokat a datacache-be) majd a szolga végrehatja és az eredményt ugyanebbe az adatcachebe teszi majd szól mesternek hogy kész - aszinkron aktív rendszer (aszinkron mert nem a mester szinkronizációs órajelére kell a feladatot elvégezniük a szolgáknak, hanem ha elkészültek akkor szólnak /kérés-válasz/ ) - kétirányú gyűrűs rendszer a szolgák a mester és memóriavezérlő között (96B/ciklus) - XDR Rambus Ram - napjainkra haldoklik mert túlságosan komplex a működése - párhuzamosan nyolc tranzakciót tud lebonyolítani a ringbuson keresztül (EIB) 5

SzA53. Heterogén csatolt többmagos processzorok (GPGPU-k fejlődésének áttekintése, kitekintés a további várható fejlődésre) Add-On (csatolt) architektúrák: -2006-ban jelentek meg -egy adott általános célú végrehajtóegységhez bedolgozóként speciális, dedikált egységek kapcsodnak -főprocesszor + gyorsítók -működése: CPU kapja az utasításfolyamot, kiosztja a speciális egységeknek (pl: belapátolja az adatot a GPU-ba az elvégzi, majd kilapátolja onnan) -a dedikált egység és az általános célú között jelentős működésbeli sebességkülönbségek vannak GPGPU-k fejlődésének áttekintése: -a GPU-k nagyobb ütemben fejlődtek, mint a CPU-k -a CPU-knál a cache a lapka több mint felét foglalta el, míg a GPU-knál a többlettranzisztorokból újabb magokat alakítottak ki, masszív párhuzamos feldolgozással a cache-k szerepe csökkent -jóval nagyobb felületű a GPU lapka, mint a CPU (harmadik ábra: Penryn CPU mag vs. nvidia GTX 280) Kitekintés a további várható fejlődésre: -a GPGPU-k teljesítménynövelése egyre nagyobb ütemben folytatódik -Sandy Bridge-el megjelentek a processzor szilíciumlapkájára integrált videovezérlők, idővel az OpenCL szabvány támogatása sem kizárt -CUDA (nvidia), OpenCL (nvidia, ATi), Brook+ (ATi) fejlődése (pl: C++ támogatás stb) -a világ leggyorsabb rendszerei ma már nem a homogén rendszerek közül valók (vagy heterogén master/slave elvű, vagy add-on elvű) -a fejlődési irány a több általános műveletvégzőhöz (CPU) több dedikált műveletvégző (pl GPU) felé halad M: Many D: Dedicated 6