* 800 MHz/PC-3200/ATA-100. SPECint_base2000/f c Pentium III. Pentium * 800 MHz/PC-2667/ATA-100 * * * * *

Hasonló dokumentumok
VLIW processzorok (Működési elvük, jellemzőik, előnyeik, hátrányaik, kereskedelmi rendszerek)

Számítógép architektúrák záróvizsga-kérdések február

Teljesítmény: időegység alatt végrehajtott utasítások száma. Egységek: MIPS, GIPS, MFLOPS, GFLOPS, TFLOPS, PFLOPS. Mai nagyteljesítményű GPGPU k: 1-2

Első sor az érdekes, IBM PC ra alapul: 16 bites feldolgozás, 8 bites I/O (olcsóbb megoldás). 16 kbyte RAM. Nem volt háttértár, 5 db ISA foglalat

Hibrid előadás: az ea másik felében a Morgen Stanley munkatársa kiegészítéseket fog hozzáfűzni a témához. Hagyományos és szerverrendszerek.

SZÁMÍTÓGÉP ARCHITEKTÚRÁK

Számítógép felépítése

Négyprocesszoros közvetlen csatolású szerverek architektúrája:

8. Fejezet Processzor (CPU) és memória: tervezés, implementáció, modern megoldások

Számítógépek felépítése

Ismétlés: Moore törvény. Tranzisztorok mérőszáma: n*százmillió, n*milliárd.

8. Fejezet Processzor (CPU) és memória: tervezés, implementáció, modern megoldások

2. Számítógépek működési elve. Bevezetés az informatikába. Vezérlés elve. Külső programvezérlés... Memória. Belső programvezérlés

Bepillantás a gépházba

Ismerkedjünk tovább a számítógéppel. Alaplap és a processzeor

Hardver Ismeretek IA32 -> IA64

Alaplap. Az alaplapról. Néhány processzorfoglalat. Slot. < Hardver

Architektúra, cache. Mirıl lesz szó? Mi a probléma? Teljesítmény. Cache elve. Megoldás. Egy rövid idıintervallum alatt a memóriahivatkozások a teljes

A processzor hajtja végre a műveleteket. összeadás, szorzás, logikai műveletek (és, vagy, nem)

Memóriák - tárak. Memória. Kapacitás Ár. Sebesség. Háttértár. (felejtő) (nem felejtő)

Módosított ábra: szaggatott nyíl: a fejlődési ív Az ábrából kimaradt a mobil szegmens (hordozható számítógépek). Y tengely: ár.

Digitális rendszerek. Digitális logika szintje

Számítógép Architektúrák

Alaplap. Slot. Bővítőkártyák. Csatolható tárolók. Portok. < Hardver

elektronikus adattárolást memóriacím

Digitális rendszerek. Mikroarchitektúra szintje

ELŐADÁS SZÁMÍTÓGÉP MŰKÖDÉSE FIZIKA ÉS INFORMATIKA

Feladatlap: Számítógép összetevők keresése

2017/12/16 21:33 1/7 Hardver alapok

5-6. ea Created by mrjrm & Pogácsa, frissítette: Félix

Dr. Sima Dezső. Architektúrák III. Készítette: Kappel Krisztián. komment by Krysz, Felix (2010, 2009 ősz)

Számítógép fajtái. 1) személyi számítógép ( PC, Apple Macintosh) - asztali (desktop) - hordozható (laptop, notebook, palmtop)

Számítógép Architektúrák

statikus RAM ( tároló eleme: flip-flop ),

Elvonatkoztatási szintek a digitális rendszertervezésben

AMD PROCESSZOROK KÉSZÍTETTE: NAGY ZOLTÁN MÁRK EHA KÓD: NAZKABF.SZE I. ÉVES PROGRAMTERVEZŐ-INFORMATIKUS,BSC

LAN és Wireless LAN eszközök megoszlása

Hordozható számítógép, noteszgép szó szerint: ölbevehető. Síkkijelzős, telepes, hordozható számítógép. (Informatikai fogalomtár)

Dell Inspiron 580s: Részletes műszaki adatok

Párhuzamos programozási platformok

Számítógépek felépítése

Dell Inspiron 560s: Részletes muszaki adatok

2016/08/31 02:45 1/6 Hardver alapok

SzA19. Az elágazások vizsgálata

8. témakör. Memóriák 1. Számítógép sematikus felépítése: 2.A memória fogalma: 3.A memóriák csoportosítása:

Számítógép egységei. A részek feladatai: Központi egység: Feladata a számítógép vezérlése, és a számítások elvégzése.

Párhuzamos programozási platformok

Magas szintű optimalizálás

Processzor (CPU - Central Processing Unit)

Számítógépek felépítése, alapfogalmak

Nagy Gergely április 4.

7. L = 100 mh és r s = 50 Ω tekercset 12 V-os egyenfeszültségű áramkörre kapcsolunk. Mennyi idő alatt éri el az áram az állandósult értékének 63 %-át?

5. tétel. A számítógép sematikus felépítése. (Ábra, buszok, CPU, Memória, IT, DMA, Periféria vezérlő)

Programmable Chip. System on a Chip. Lazányi János. Tartalom. A hagyományos technológia SoC / PSoC SoPC Fejlesztés menete Mi van az FPGA-ban?

1. MODUL - ÁLTALÁNOS FOGALMAK

Tájékoztató. Használható segédeszköz: -

Operandus típusok Bevezetés: Az utasítás-feldolgozás menete

Dell Inspiron 560/570: Részletes muszaki adatok

1 kérdés. Személyes kezdőlap Villamos Gelencsér Géza Simonyi teszt május 13. szombat Teszt feladatok 2017 Előzetes megtekintés

Nyíregyházi Egyetem Matematika és Informatika Intézete. Input/Output

6. óra Mi van a számítógépházban? A számítógép: elektronikus berendezés. Tárolja az adatokat, feldolgozza és az adatok ki és bevitelére is képes.

Flynn féle osztályozás Single Isntruction Multiple Instruction Single Data SISD SIMD Multiple Data MISD MIMD

A számítógép felépítése A processzor és csatlakoztatása

Kommunikációs rendszerek programozása. Wireless LAN hálózatok (WLAN)

Mikrorendszerek tervezése

2. Elméleti összefoglaló

A számítógép egységei

SZÁMÍTÓGÉPES ARCHITEKTÚRÁK

Számítógép Architektúrák

Számítógépes alapismeretek

Architektúra, memóriák

X. ANALÓG JELEK ILLESZTÉSE DIGITÁLIS ESZKÖZÖKHÖZ

Digitális eszközök típusai

Mérés és adatgyűjtés

Mikroprocesszorok (Microprocessors, CPU-s)

Számítási feladatok a 6. fejezethez

1. feladat R 1 = 2 W R 2 = 3 W R 3 = 5 W R t1 = 10 W R t2 = 20 W U 1 =200 V U 2 =150 V. Megoldás. R t1 R 3 R 1. R t2 R 2

A MEMÓRIA. A RAM-ok bemutatása

Ikermaggal bıvített kimutatások

Számítógép Architektúrák

A számítógép fő részei

UNIX / Linux rendszeradminisztráció

Az alaplap. Az alaplap összetevői

Számítógép architektúra

GPGPU: Általános célú grafikus processzorok cgpu: computational GPU GPGPU = cgpu Adatpárhuzamos gyorsító: dedikált eszköz, ami eleve csak erre

Max. 2 DIMM bővítőhely Nem ECC kétcsatornás 1333 MHz DDR3 SDRAM, 1 8 GB

Ajánlati felhívás "Informatikai eszközök beszerzése a kéményseprő ipari tevékenység ellátásához" tárgyban

Tagállamok - Árubeszerzésre irányuló szerződés - Ajánlati felhívás - Tárgyalásos eljárás. HU-Siófok: Asztali számítógépek 2011/S

Bevezetés. Többszálú, többmagos architektúrák és programozásuk Óbudai Egyetem, Neumann János Informatikai Kar

MÓDOSÍTOTT RÉSZLETEZŐ OKIRAT (2) a NAH /2014 nyilvántartási számú (2) akkreditált státuszhoz

Digitális címke nyomtató és kiszerelő állomás

Csoportos üzenetszórás optimalizálása klaszter rendszerekben

Intel Pentium G2120 Intel HD Graphics kártyával (3,1 GHz, 3 MB gyorsítótár, 2 mag)

Ajánlat kelte: november 18. Ajánlattevő: FTK Kft. Cím: 3531 Miskolc, Vászonfehérítő 32.

Számítógép Architektúrák

Digitális Technika I. (VEMIVI1112D)

Műveleti erősítők - Bevezetés

Hobbi Elektronika. Bevezetés az elektronikába: Térvezérlésű tranzisztorok (FET)

Apple számítógépek összehasonlító táblázata

5.1. fejezet - Általános 32 bites mikrovezérlő/processzor alkalmazástechnikája A Freescale

Átírás:

SzA42. A processzorok fejlődésének hatékonysági határa (ennek alapvető oka és megnyilvánulási formái, hogyan változik az Intel és az AMD x86 családok hatékonysága az órafrekvencia növelésekor, a két család tervezési filozófiájának összehasonlítása a hatékonyság szempontjából, a hatékonysági határ értelmezése) 0.55 Alapvető okok: 1) általános célú programoknál a funkcionális (alkalmazásban rejlő) párhuzamosság tovább nem fokozható 2) a processzor és a processzort kiszolgáló alrendszerek közötti sebességolló kinyílása -a 2. generációs szuperskalárokat követően az órafrekvenciák rohamos (tízévente 100-szoros) mértékű növekedésének időszakában a mikroarchitektúra egyes kiszolgáló alrendszereinek -operatív tár, (átviteli ráta, késleltetési idő) -gyorsítótárak, (L2 cache elérési ideje) -processzorbusz (átviteli ráta) sebességnövekedése egyre kevésbé tudta követni a processzorok igen gyors sebességnövekedését és így egy egyre táguló sebességolló nyílt ki a processzor és egyes kiszolgáló alrendszerei között. 3) a legjelentősebb sebességbeli különbség az operatív tár esetében történt -lassabb ütemben fejlődött a memória (elérési ideje, átviteli sebessége) mint a processzor következmények: -egyszeres kihasználtságú buszoknak vége Intel: Quad Data Rate: 4100MHz AMD: Double Data Rate: 2133MHz -kezdetben északi hídon keresztül kapcsolódott a memória, később közvetlen csatolt lett AMD 2003-tól (HypertTransport a mem. és proc. valamint a proc. és proc. között is (MP szerverek)) Intel 2008-tól Intel x86 processzorok hatékonyságának változása az órafrekvencia növelésével: -y tengely: hatékonyság SPECint rendszerrel mérve -x tengely: frekvencia Gigahertzben -látható, hogy fűrészfogas görbék jellemzik az ábrát, ennek oka: 1) az órafrekvencia növelésekor a hatékonyság csökken, viszont 2) az architektúrális újításokkor a hatékonyság nő SPECint_base2000/f c Pentium III Pentium 4 0.5 0.45 0.40 0.35 Katmai 512K dir L2 100 MHz PC-100 SCSI-U2W 100 MHz PC-100 Coppermine 256K on-die L2 100 MHz PC-133 Willamette 256K on-die L2 400 MHz PC-800 RDRAM Northwood A 400 MHz PC-800 RDRAM Northwood C Northwood B 533 MHz PC-800 RDRAM Irwindale 2M on-die L3 Prescott (2M) 2M on-die L2 800 MHz PC-3200 SATA-150 800 MHz HT PC-4300 SATA-150 Prescott (1M) 1M on-die L2 800 MHz/PC-3200/ 800 MHz/PC-2667/ 800 MHz/PC-3200/SATA-150/HT 800 MHz/PC-3200/ 0.30 ~ 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 f c (GHz) 1

AMD x86 processzorok hatékonyságának változása az órafrekvencia növelésével: -y tengely: hatékonyság SPECint rendszerrel mérve -x tengely: frekvencia Gigahertzben itt is fűrészfogas görbék jellemzik az ábrát, de az is látható, hogy: 1) alacsonyabb órajelen dolgoznak, mint az Intel (AMD max: 2,2-2,3GHz) 2) viszont magasabb hatékonyság (0,6 fölött, míg az Intel 0,5-t sem érte el) SPECint_base2000/f c 0.65 0.60 Athlon 64 Clawhammer 1M on-die L2 f memory =f FSB PC-3200 ATA-133 0.50 ~ Athlon Athlon-XP Barton 400 MHz/PC-3200/ 0.45 0.40 K7 512K dir L2 1 200 MHz K75 PC-100 512K dir L2 2,3 200 MHz PC-100 200 MHz PC-133 Palomino 256K on-die L2 266 MHz PC-2100 266 MHz PC-2100 Thorougbread 256K on-die L2 333 MHz/PC-2700/ 0.35 Thunderbird 256K on-die L2 200 MHz PC-133 0.30 ~ 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 f c (GHz) 1 f =0.5f L2 c 2 f =0.4f L2 c (f c =750/800/850 MHz) 3 f =0.3f L2 c (f c =900/950/1000 MHz) Összehasonlítás: Intel: -magasabb órajel, kisebb hatékonyság -a piacon az adott processzort azzal lehetett jól eladni, ha a frekvencia nagyságát feltüntették, szerintük attól lett jobb egy újabb processzor az elődjénél, ha magasabb órajelen járt (jobban eladható) AMD: -alacsonyabb órajel, nagyobb hatékonyság -az AMD az Intel folyamatos frekvencianövelésére válaszul vezette be az ekvivalencia-táblázatot, melyben az Intel és AMD termékeket lehetett egymásnak megfeleltetni (pl: AMD Athlon XP 2200+) Hatékonysági határ értelmezése: Az általános célú programoknál a funkcionális párhuzamosság tovább nem fokozható, azaz az általános célú alkalmazásokban utasításszinten rendelkezésre álló párhuzamosság kimerülése. A hatékonyság növelését célzó hardver többletráfordítások egyre csökkenő mértékben térülnek meg. 2

SzA43. Processzorok fejlődésének termikus határa (a dinamikus és a statikus disszipáció értelmezése, arányváltozása, az összdisszipáció növekedése az órafrekvencia növelésekor, a termikus határ értelmezése, megjelenése és következményei) A dinamikus és a statikus disszipáció értelmezése: a) dinamikus disszipáció: D d =ACV 2 f c A tranzisztorok működéséből adódó hőmennyiség. A processzorokban a tranzisztorok szórtkapacitásként írhatóak fel. Ekkora a tranzisztor működése felírható a kondenzátor feltöltésével és kisütésével. Magyarázat: A: aktív kapuk részaránya C: a kapuk összesített kapacitása V: tápfeszültség f c : órafrekvencia I leak : szivárgási áram Tehát a dinamikus disszipáció lineárisan függ az órafrekvenciától és négyzetesen a feszültségtől! 5V-ról fokozatosan csökkentették, ma nagyjából 1V környékén van. disszipáció csökkentő technikák: 1)-workload meghatározása, és az ehhez tartozó frekvenciaérték, ehhez két alrendszer szükséges: - ami meghatározza a szükséges teljesítményt - f c, V dd meghatározása (oprendszer feladata) 2)AVS (Adaptive Voltage Scaling) módszer: a chipre egy f c mérő, elkezdi csökkenteni a feszültséget, addig amíg az adott fc-t tartani lehet (alkalmazkodik a terheléshez) b) statikus (passzív) disszipáció: D s =VI leak A tranzisztorok kikapcsolt állapotában (mivel tökéletes szigetelő nincs) a Gate felől szivárog az áram, így a Source és a Drain között is áram folyik (szivárgási áram). egyik oka: a csíkszélesség csökkentés csökkentette a szigetelő méretét is disszipáció csökkentő technikák: 1) lekapcsol olyan egységeket, melyeket nem használ (pl: FPU) 2) tranzisztor a tápfeszültség és az adott alrendszer közé (egy db tranzisztornak kisebb lesz a szivárgási árama) 3) jobb szigetelő alkalmazása (eddigi szilícium-dioxid helyett, high-k szigetelő alkalmazása) Kapcsolási sebesség: 120 % Szivárgási áram: 10 % 3

Arányváltozása: Az összdisszipáció növekedése az órafrekvencia növelésekor: -Az órafrekvencia növelésével a dinamikus disszipáció növekszik, a növelés mértékével egyenes arányban. Ahhoz, hogy egy adott frekvenciát elérjünk, ahhoz egy bizonyos feszültség érték kell (nem lehet korlátlanul csökkenteni a feszültséget). -Mai processzorok >=1V környékén működnek, (így pl: 0,9 2 =0,81, tehát a feszültségtényező kisebb lesz a négyzetszám alapjánál) A termikus határ értelmezése, megjelenése és következményei: -Intel: 500MHz környékén jelenik meg a léghűtés -A hőfal a Pentium 4 harmadik (Prescott) magjánál jelenik meg (2000-es évek eleje, közepe), ez egyúttal a termikus határ is, tovább lényeges mértékben (az eddigi 100x/10év ütemben) nem növelhető a frekvencia. -Az Intel a korábban már bejelentett 4 GHz ill. nagyobb órafrekvenciájú Pentium 4 modellek visszavonására, sőt a Netburst architektúra továbbfejlesztésének leállítására kényszerült. -A léghűtés elméleti határa: 100W / 1cm 2 következményei: 1) Az órafrekvencia növelésén alapuló fejlesztési irány háttérbe szorulása 2) A processzorok tervezésében a disszipáció csökkentő technikák előtérbe kerülése 4

SzA44. Processzorok fejlődésének határa a skew -növekedése miatt (a skew értelmezése, növekedésének következményei, a soros periféria illetve rendszerbuszok megjelenése) A skew értelmezése: Skew: a párhuzamos vezetékek közötti futási idő különbségek 0. bit 63. bit Skew probléma: -a felfutó és lefutó él eltolódik (magasabb frekvenciákon még jobban, trapézosodik a jel) -a vezeték antennaként működik -> lezárás kell (lezárási impedancia, ha nem megfelelő a lezárás, reflexió keletkezik) -kapacitásként viselkedik: fel kell tölteni, ki kell sütni -> különböző ideig tart -zajra érzékeny -a vezetékek hossza nem azonos három féle rendszer valósítható meg: a) földhöz kialakított -zajra legérzékenyebb rendszer, antennaként működik b) adott feszültséghez képest kialakított rendszer -egy referencia feszültséghez képest változik a jel c) differenciális -zajokra érzéketlen, mindkét vezetékre hat a zaj, a különböző fázisban lévő hullámok kioltják egymást "0" "1" D+ D- Növekedésének következményei: -a processzorbusz egyre növekedő sebessége miatt (GHz) az impulzus szélességhez viszonyítva egyre dominánsabbá válik a zaj -soros buszok bevezetése -szimmetrikus elrendezés (2 vezeték) -differenciális rendszer ld: fent -lassú buszoknál is ezt használják költséghatékonyságból (USB, USB2.0) -a futási idő különbségeket az alaplapon a vezetők megfelelő elrendezésével próbálják kiegyenlíteni -kisebb feszültség alkalmazása (kisebb amplitúdó), nem 1-2V, hanem 100-500mV A soros periféria illetve rendszerbuszok megjelenése: -FBDIMM: 6-8 csatorna, szemben a párhuzamos 1-2 csatornával szemben -3-4x több csatorna, helytakarékosabb, olcsóbb megoldás -a modulok továbbra is párhuzamosak, de tartalmaznak soros-párhuzamos átalakítót -a memóriák kivételével már eddig is a soros átvitelt preferálták: pl: SATA, USB, PCI-e, HT, QPI -olcsóbb a megvalósítása (kisebb ráfordítás igény), helytakarékosabb 5

SzA45. EPIC architektúrák/processzorok (értelmezésük, megjelenésük kiváltó oka, fontosabb implementációk, várható jövőjük) Értelmezésük: -EPIC Explicitly Parallel Instruction Computer -továbbfejlesztett VLIW architektúra -fejlett szuperskalár vonások integrálása: -1994,1997 Intel-HP együttműködés -2001-ben IA-64, Intel Itanium processzor -SIMD támogatása -elágazásbecslés -explicit cache utasítások Megjelenésük kiváltó oka: a processzorok hatékonyságának stagnálása Fontosabb implementációk: Transmeta Crusoe: -a Transmeta első processzora -kisebb fogyasztású, mint az Intel és AMD processzorai (hosszabb akkumulátor élettartam a mobil eszközökben) -a Code Morphing Software (CMS) segítségével x86 utasításokat is képes volt végrehajtani (de nem volt teljesen kompatibilis az x86 architektúrával) -általános célú alkalmazásokban gyengébb teljesítményt mutatott -a déli híd sávszélessége bekorlátozta az erőteljesebb grafikai és I/O utasítások gyors feldolgozását Intel Itanium -Intel-HP közös processzora -2001-ben jelent meg, de az akkori processzorok teljesítménye alatt maradt (800MHz) -> bukás lett, ezért 2002-től elkezdték az Itanium processzorok cache méretét és FSB szélességét növelni -> Itanium2-128 bites szóhossz, regiszter-regiszter típusú architektúra -128db integer, 128db 82 bites lebegőpontos, 64db egybites predikátumregiszter és 8 db ugrási regiszter 6

-2010-ben megjelent az új Tukwilla magos Itanium 9300, 2 és 4 magos változatokban, 24MB osztott cache-el, integrált memóriavezérlővel, és a magok közt Quick Path Interconnect kapcsolattal, 1,4-1,7 GHz frekvencia között -2010-től a Microsoft nem támogatja az IA-64 architektúrát az operációs rendszereiben Várható jövőjük: Az IA-64 architektúra elterjedésével kapcsolatos várakozások 2004-től azonban a várakozások módosultak, az általános célú alkalmazásokban az EPIC architektúrák/processzorok kiszorulása következett (kihasználatlan lenne). Jelenleg csak szerver architektúrákban található meg az Itanium processzorcsalád. 7