Számítógép architektúrák. Tartalom. A memória. A memória



Hasonló dokumentumok
Számítógép architektúrák. Tartalom. A memória. A memória

Tartalom. Számítógép architektúrák. A memória. A tárak implementációja. A félvezető tárolók. Egy cella

Számítógép architektúrák. A memória

Számítógép architektúrák. A memória

Számítógép architektúrák. A memória

Memóriák - tárak. Memória. Kapacitás Ár. Sebesség. Háttértár. (felejtő) (nem felejtő)

MEMÓRIA TECHNOLÓGIÁK. Számítógép-architektúrák 4. gyakorlat. Dr. Lencse Gábor. tudományos főmunkatárs BME Híradástechnikai Tanszék

Architektúra, memóriák

Dr. Oniga István. DIGITÁLIS TECHNIKA 10 Memóriák

Dr. Oniga István. DIGITÁLIS TECHNIKA 10 Memóriák

Számítógép Architektúrák (MIKNB113A)

statikus RAM ( tároló eleme: flip-flop ),

(A DRAM-okkal kapcsolatban a bank megnyitása, bank aktiválása, banksor megnyitása vagy a lap megnyitása kifejezések szinonímák, ugyanazt jelentik.

DIGITÁLIS ADATTÁRAK (MEMÓRIÁK)

Számítógépek, számítógép rendszerek

Digitális rendszerek. Memória lapkák

ELŐADÁS SZÁMÍTÓGÉP MŰKÖDÉSE FIZIKA ÉS INFORMATIKA

Máté: Számítógép architektúrák

Digitális Rendszerek és Számítógép Architektúrák

Processzus. Operációs rendszerek MINB240. Memória gazdálkodás. Operációs rendszer néhány célja előadás Memóriakezelés

BEVEZETÉS AZ INFORMATIKÁBA - SZÁMÍTÓGÉP ARCHITEKTÚRÁK. Háber István Ihaber@pmmik.pte.hu

Operációs rendszerek Memóriakezelés 1.1

8. Fejezet Processzor (CPU) és memória: tervezés, implementáció, modern megoldások

Bevitel-Kivitel. Eddig a számítógép agyáról volt szó. Szükség van eszközökre. Processzusok, memória, stb

8. témakör. Memóriák 1. Számítógép sematikus felépítése: 2.A memória fogalma: 3.A memóriák csoportosítása:

8. Fejezet Processzor (CPU) és memória: tervezés, implementáció, modern megoldások

Első sor az érdekes, IBM PC ra alapul: 16 bites feldolgozás, 8 bites I/O (olcsóbb megoldás). 16 kbyte RAM. Nem volt háttértár, 5 db ISA foglalat

Dr. Illés Zoltán

elektronikus adattárolást memóriacím

6. óra Mi van a számítógépházban? A számítógép: elektronikus berendezés. Tárolja az adatokat, feldolgozza és az adatok ki és bevitelére is képes.

Számítógép Architektúrák

Máté: Számítógép architektúrák

A Számítógépek felépítése, mőködési módjai

A MEMÓRIA. A RAM-ok bemutatása

Az integrált áramkörök kimenetének kialakítása

Teljesítmény: időegység alatt végrehajtott utasítások száma. Egységek: MIPS, GIPS, MFLOPS, GFLOPS, TFLOPS, PFLOPS. Mai nagyteljesítményű GPGPU k: 1-2

Máté: Számítógép architektúrák

Számítógép felépítése

A számítógép egységei

A mikroszámítógép felépítése.

Számítógép egységei. Szoftver (a fizikai eszközöket működtető programok összessége)

Számítógépes alapismeretek

Közlekedés gépjárművek elektronikája, diagnosztikája. Mikroprocesszoros technika. Memóriák, címek, alapáramkörök. A programozás alapjai

Alaplap. Az alaplapról. Néhány processzorfoglalat. Slot. < Hardver

A program SZÁMÍTÓGÉP ARCHITEKTÚRÁK. Legáltalánosabb architektúra. Eszközök szerepe. A vezérlők programozása. A vezérlők (adapterek, kontrollerek)

Funkcionális áramkörök vizsgálata

A PC története. Informatika alapjai-9 Személyi számítógép (PC) 1/12. (Personal computer - From Wikipedia, the free encyclopedia)

Ismétlés: Moore törvény. Tranzisztorok mérőszáma: n*százmillió, n*milliárd.

Alaplap. Slot. Bővítőkártyák. Csatolható tárolók. Portok. < Hardver

Számítógépek felépítése, alapfogalmak

Operációs rendszerek MINB240. Bevitel-Kivitel. 6. előadás Input és Output. Perifériák csoportosításá, használat szerint

Ismerkedjünk tovább a számítógéppel. Alaplap és a processzeor

Tartalomjegyzék. 1. Alapfogalmak Az A/D (analóg-digitális) átalakítás...4

GQ-3x és GQ-4x USB univerzális programozó Kézikönyv

A számítógép alapfelépítése

Számítógép fajtái. 1) személyi számítógép ( PC, Apple Macintosh) - asztali (desktop) - hordozható (laptop, notebook, palmtop)

Cache, Cache és harmadszor is Cache

A memória működése szoftverfejlesztői szemmel. Smidla József Operációkutatási Laboratórium november 20.

Számítógépek felépítése

2016/06/23 07:47 1/13 Kérdések

Feladatlap: Számítógép összetevők keresése

Nagy adattömbökkel végzett FORRÓ TI BOR tudományos számítások lehetőségei. kisszámítógépes rendszerekben. Kutató Intézet

SZÁMÍTÓGÉPARCHITEKTÚRÁK

Számítógép Architektúrák

VLIW processzorok (Működési elvük, jellemzőik, előnyeik, hátrányaik, kereskedelmi rendszerek)

A processzor hajtja végre a műveleteket. összeadás, szorzás, logikai műveletek (és, vagy, nem)

2. Számítógépek működési elve. Bevezetés az informatikába. Vezérlés elve. Külső programvezérlés... Memória. Belső programvezérlés

Operációs rendszerek előadás Multiprogramozott operációs rendszerek

Haladó ismeretek: Laptopok és más hordozható eszközök

Máté: Számítógép architektúrák

Computer Architecture

Villamos jelek mintavételezése, feldolgozása. Mérésadatgyűjtés, jelfeldolgozás 9. előadás

Utasításrendszer jellemzése (utasítás részei) 1. műveleti kód 2. operandusok 3. következő utasítás címe (elmaradhat)

Máté: Számítógép architektúrák

Négyprocesszoros közvetlen csatolású szerverek architektúrája:

Számítógép Architektúrák

Mikrorendszerek tervezése

Digitális Technika I. (VEMIVI1112D)

1. Az utasítás beolvasása a processzorba

Autóipari beágyazott rendszerek

Programmable Chip. System on a Chip. Lazányi János. Tartalom. A hagyományos technológia SoC / PSoC SoPC Fejlesztés menete Mi van az FPGA-ban?

7. Fejezet A processzor és a memória

FPGA áramkörök alkalmazásainak vizsgálata

ARM processzorok felépítése

I 2 C, SPI, I 2 S, USB, PWM, UART, IrDA

TI TMDSEVM6472 rövid bemutatása

Bepillantás a gépházba

Egyszerű RISC CPU tervezése

MISKOLCI EGYETEM VILLAMOSMÉRNÖKI INTÉZET AUTOMATIZÁLÁSI TANSZÉK

Multimédia hardver szabványok

Memóriák. Digitális Rendszerek és Számítógép Architektúrák 2011

Az INTEL D-2920 analóg mikroprocesszor alkalmazása

Számítógép Architektúrák

Riak. Pronounced REE-ahk. Elosztott adattároló eszköz. Molnár Péter

Nyíregyházi Egyetem Matematika és Informatika Intézete. Input/Output

Máté: Számítógép architektúrák

A PC története. Informatika alapjai-9 Személyi számítógép (PC) 1/15. (Personal computer - From Wikipedia, the free encyclopedia)

Szupermikroprocesszorok és alkalmazásaik

Fábián Zoltán Hálózatok elmélet

ismerd meg! A PC vagyis a személyi számítógép

Átírás:

Számítógép architektúrák A memória Tartalom Félvezető tárolók DRAM, SRAM ROM, PROM Tokozások, memóriamodulok Lokalitás elve Gyorsítótárak (cache) A memória Vadász, 2007. Ea7 2 A memória Tár: programok és adatok tárolására. Címezhető cellák. Központi tár: (gyors) memóriabuszon v. a rendszerbuszon keresztül kapcsolódik a processzorhoz Memória a perifériavezérlőkön is! Ezek is címezhetők! Néha címtartományuk egybeesik, néha nem. Később figyeljük meg a memória-hierarchiát! A memória Vadász, 2007. Ea7 3 1

A tárak implementációja Régebben ferritgyűrüs tárak: mágnesezhetőségfluxusváltás elven. Nem felejtettek. Ma már magas-integráltságú félvezetős lapkák (milló számú tranzisztor[-kondenzátor] hálózata, tokban), memória modulra szerelve ciklikus működés! Két trend: kapacitás növelés, DRAM density elérési idő csökkentés. CPU speed DRAM speed idõ A memória Vadász, 2007. Ea7 4 A félvezető tárolók RAM: Random Access Memory random: egy cella elérése nem függ a többitől, akár véletlenszerűen bármelyiket címezhetjük. Sorokból ás oszlopokból álló háló, elemei a cellák DRAM: Dynamic RAM Egy cella egy tranzisztor-kapacitor pár, egy bithez. Dinamikusság: a kiolvasás-beírás, a frissítés is dinamikus, időt igénylő. Írható-olvasható, táp megszűnésével felejt. MOS, CMOS, NMOS technológiák. A memória Vadász, 2007. Ea7 5 Egy cella C kapu... Bit Line Word Line Sense Amp Írás: Állíts a bit vonalra magas v. alacsony szintet (a beírni kívánt bit szerint); Nyisd a kaput: megfelelően feltöltődik a C Olvasás Állítsd a bit vonalat fele feszültségre; Nyisd a kaput; A C szintjétől függően a Sense Amp érzékel A memória Vadász, 2007. Ea7 6 2

DRAM áramkörei Sorokból ás oszlopokból álló háló, elemei a cellák A lapkában további speciális áramkörök segítenek Cellák sor/oszlopainak kiválasztására (r/c address select/decoder, sor/oszlop cím bufferek) A cellákból kiolvasott jelek tárolására (sens amplifiers: elérési tranzisztorok, output buffers) Frissítési szekvenciák nyomon követésére (counter) A cellák írására, töltésük megemelésére (write enable) Kívülről segíthet a memória kontroller (esetleg CPU) Memória típus, sebesség, mennyiség azonosítás, hibakezelés A memória Vadász, 2007. Ea7 7 DRAM logikai felépítés A Cím buffer Sor dekódoló Oszlop dekódoló Elérési tr.-ok Memória mátrix Word Line Bit Line Cella Adat ki Adat be D Q A memória Vadász, 2007. Ea7 8 Egy 4 x 4-es mátrix Olvasás Írás A memória Vadász, 2007. Ea7 9 3

DRAM operációk Tipikus memóriaelérés (olvasás): Sorcím a cím-lábakon RAS jel leesik: sorcím rögzül a sor-cím-bufferben és az elérési tranzisztorok (sens amps) aktíválódnak; a RAS jel stabilizálódásával a teljes sor celláinak értékét felveszik az elérési tranzisztorok; Oszlopcím a cím-lábakon CAS jel leesik: oszlop cím rögzül az oszlop-cím-bufferekben; a CAS stabilizálódásakor a kiválasztott rész töltődik az output bufferba. RAS CAS A memória Vadász, 2007. Ea7 10 A D Technológiák Fast Page Mode RAM (egy sorcímzés mellett több oszlopcímzés), Extended Data Out (EDO) Burst Extended Data Output (BEDO) RAM (egy sorcímzés, egy oszlopcímzés mellet 4 adatcella) (dual bank, de az EDO halála miatt elavult) SDRAM: Synchronous DRAM (mehetünk a 66-100MHZ fölé) A mem zárolja a CPU-tól jövő cím, adat és kontrol infókat, autonóm módon dolgozik (a system clock kontrollja alatt), mialatt a CPU csinálhat mást. Valamennyi idő után az outputon ott az eredmény ESDRAM (Enhanced ): a szokásos SDRAM lapkán kisebb SRAM cache is van (akár 200 MHZ is) A memória Vadász, 2007. Ea7 11 Bemutatás éve 1987 Roadmap Technológia FPM Sebesség határ 50 ns Max Bps 176 MBps 1995 EDO 50 ns 186 Mbps 1997 PC66 SDRAM 60-66-83 MHz 240 MBps 1998 PC100 SDRAM 100 MHz 400 MBps 1999 RDRAM 800 MHz 1,6 GBps 1999/2000 PC133 SDRAM 133 MHz 532 MBps 2000 DDR SDRAM 266 MHz 1064 MBps A memória Vadász, 2007. Ea7 12 4

A piaci arányok SDRAM DDR RDRAM EDO DDR2 2002 55% 39% 5% 1% 2003 13% 81% 3% 3% 2004 8% 83% 2% 9% 2005 5% 58% 2% 35% A memória Vadász, 2007. Ea7 13 http://www20.tomshardware.com/motherboard/index.html Félvezető tárolók... ROM: Read Only Memory: csak olvasható. Ez is cellák hálózata, oszlop-sor tömbbe rendezve, diódák a cellákban, összekötést adnak ( 1 bit), nincs összekötés (0 bit). Kikapcsolva nem felejt a lapka. Elérések itt is random jellegűek. (oszlop-sor kiválasztás). Címtartományuk, címezhetőségük egybeeshet a DRAMokkal: a (központi) memória részben ROM-okból, részben DRAM-ból állhat. PROM, EPROM: Beégethető a tartalom, EPROMnál törölhető és újraírható... A memória Vadász, 2007. Ea7 14 PROM (Programmable ROM) Sor-oszlop háló, a cellákban olvadó biztosíték (fuse), Beégethető a tartalom. EPROM (Erasable PROM) törölhető és újraírható... Cellákban két kapus tranzisztor Floating gate Control gate Köztük oxidréteg 1 bit: összekötve a bit- és word line Félvezető tárolók... 0 bit: a kapu zárva A memória Vadász, 2007. Ea7 15 5

Félvezető tárolók... EEPROM (Electronical Erasable PROM) Mint az EPROM, de nem UV fény töröl. Lassú, mert 1 bájtot lehet egyszerre törölni, újraírni FLASH memory Ez valójában EEPROM, de egyszerre blokkot (512 bájtot) lehet újraírni. Már elég gyors. A memória Vadász, 2007. Ea7 16 Félvezető tárolók... SRAM: Static Random Access Memory ezek is írhatók, olvashatók, random elérésűek, kiolvasási idejük hallatlanul gyors (szinte 0), de drágák és energiaigényesek (ezért melegednek, hűtendők!) Gyorsító-tárakhoz (cache) használják. Egy cellájuk 4-6 tranzisztorból álló flip-flop áramkör nincs bennük kapacitor (olyanok, mint a CPU-k regiszeterei) A memória Vadász, 2007. Ea7 17 Memória (összefoglalás) RAM DRAM (Tokozott magas integráltságú áramköri lapkák) FPM, EDO, BEDO DRAM SDRAM, ESDRAM DDR, DDR2 RDRAM SRAM ROM PROM EPROM, EEPROM FLASH A memória Vadász, 2007. Ea7 18 6

A DRAM lapkák tokozása Dual In-Line Package Small Outline J-lead Thin Small Outline Package Chip Scale Package A memória Vadász, 2007. Ea7 19 Memória modulok Memória modulok hordozzák a lapkákat. Szabványok. Az alaplap(ok) foglalatába helyezhetők. Single In-line MM (SIMM) 32 bites CPU-khoz 72 érintkező a modulon Dual In-line MM (DIMM) 128, 184, 240 láb, 64 bites CPU-khoz is Small Outline DIMM (SODIMM) 144 (72) érintkező, sokkal kisebb, notebookokhoz Rambus (RIMM, SORIMM) 16 bites adatösvény, pipelining, gyors DDR400 (800 MHz-es frontside bus chipsethez) A memória Vadász, 2007. Ea7 20 History 30 pin-es SIMM (~1990) 72 pin-es SIMM (mid1990) 128 pin-es DIMM (~1997) 184 pin DDR DIMM (~2000) 184 pin DDR DIMM (~2002) 240 pin DDR2-800 DIMM A memória Vadász, 2007. Ea7 21 7

Bár növeljük a frekvenciát A memória időzítések (amit lehet, kell állítani) rosszabbak SDRAM: 2,5-2-2-5 (t CL -t RCD -t RP -t RAS ) DDR (200): 2,5-3-3-8 DDR2 (400): 5-5-5-15 DDR3 (800): 9-9-9-24 t CL CAS Latency: a CAS leesése utáni várakozás ideje, szokásosan 2, 2.5, 3 ciklus. Miután ez letelik, az adat a DQ lábakra került. t RCD RAS to CAS Delay: RAS leesés utáni várakozás, amíg a CAS jelet lehet küldeni. Szokásosan 2, 3 ciklus t RP RAS Precharge: Ezalatt az idő alatt a vezérlő ismét deaktiválja a sort. t RAS Active to precharge delay: ezalatt a sor aktív kell legyen, Csak ezután lehet deaktíválni. 5 8 ciklus szokott lenni. Teljesülnie kell: t RCD + t CL < t RAS http://www.tomshardware.com/2007/10/03/pc_memory/ A memória Vadász, 2007. Ea7 22 Növeljük a teljesítményt Szélességnövelés, pipelining, bursting Dual channel (párhuzamosítás) If you want maximum memory performance, you should install two memory modules into two different memory channels to have it run in dual-channel mode. This doubles memory bandwidth by providing a 128-bit data bus. Gyorsítótárak (cache) alkalmazásával Asszociatív tárak alkalmazásával Installing two memory modules into the same channel of the memory controller will force it into single-channel mode. A memória Vadász, 2007. Ea7 23 A gyorsítótárak (caches) A programok lokalitása: tapasztalat Kisebb kapacitású, de a CPU-hoz közelebbi és gyorsabb (SRAM) memória, amiben a központi memória tartalom egy része szintén megvan. A CPU egyszerre címzi a cache-t is, a központi memóriát is: ha találat van a cache-ben, csak onnan vesz! gond lehet az adat-konzisztencia! CPU lapka regiszterek L1 ALU cache cache sín rendszer sín Memória sín L2 cache MMU Mem vezérlő Memória A memória Vadász, 2007. Ea7 24 8

A lokalitás elve Principle of Locality Processzek statisztikailag megfigyelhető tulajdonsága, hogy egy idő-itervallumban címtartományuk egy szűk részét használják Időbeli lokalitás Hivatkozott címeiket újra Térbeli lokalitás Közeli címeiket A 80/20 szabály Az elv érvényesülése miatt van értelme kisebb, de gyorsabb átmeneti tárolók használatának Gyorsítótár; munkakészlet; TLB; diszk buffer cache A memória Vadász, 2007. Ea7 25 Lokalitás elve (illusztráció) Processz futása során instrukciók sorozatát hajtja végre (instrukció hivatkozás sorozat), Az instrukciókban memória-hivatkozások lehetnek (adat hivatkozás) A hivatkozások sorozata a hivatkozási lánc (Reference String): ω = r 1, r 2, r t, r T # r t : instr. vagy adat hiv. A memória Vadász, 2007. Ea7 26 for(i=1; i<=n; i++) a[i]=b[i]+c[i]; // n=1000 legyen A gépi nyelvű program regiszteres gépen kb: Cím 4000 4001 4002 4003 4004 4005 4006 4007 4008 4009 Kód/adat LOAD (R1), ONE LOAD (R2), n COMP R1, R2 JG 4009 LOAD (R3), B[R1] ADD (R3), C[R1] STOR A[R1], (R3) ADD (R1), ONE JUMP 4002 Megjegyzés R1 index reg inicializálás R2 határ reg inicializálás i > n tesztelés Feltételes ugrás B[i] betöltés R3-ba Összeadás A[i]-be tárolás I inkrementáció Ciklus újra Ciklus után Cím 6000-6999 7000-7999 8000-8999 9000 9001 Lokalitás elve (illusztráció) Kód/adat Tárolóhely A számára Tárolóhely B számára Tárolóhely C számára ONE Tárolóhely n számára Ekkor a hivatkozási lánc a következő (összesen 9 instrukció-hiv. ebből 7-re 1000-szer: 4000, 9000, 4001, 9001, (4002, 4003, 4004, 700i, 4005, 800i, 4006, 600i, 4007, 4008) 1000 4002, 4003, 4009 A memória Vadász, 2007. Ea7 27 9

Lokalitás elve (illusztráció) Ugyanez virtuális memória menedzselésnél, lapozós rendszerben Legyen a lapméret 1000, a virtuális cím: v= (p, o) (pl a[16] 6015 címe ekkor v=(6, 15) ) Ekkor a lapok hivatkozási lánca (összesen 5 lap): 4, 9, 4, 9, (4, 4, 4, 7, 4, 8, 4, 6, 4, 4) 1000 4, 4, 4 Kisméretű munkakészlet esetén sem valószínű a laphiba A memória Vadász, 2007. Ea7 28 Gyorsítótárak szintjei A gyorsítótár koncepció minden két szint között lehetséges, ahol a felsőbb szint gyorsabb, bár kisebb kapacitású. Az alsóbb szinthez fordulás gyakorisága csökkenni fog. Level 1 CPU-n belül ~ 10 ns 4 16 KB Level 2 Központi memória Diszkek SRAM cache sínen DRAM memória sínen Mágneses+mech I/O sínen ~ 20-30 ns ~ 60-195 ns ~ 10-12 ms 128 512 KB 128 512 MB 32 90 GB Internet Hálózaton ~ 1 s - határtalan A memória Vadász, 2007. Ea7 29 A klasszikus gyorsítótár A CPU és a központi memória között Hardveres megoldás, még az OS számára is láthatatlan Mostanában két szintes (L1, és L2 szint), néha három Gyakori a szétválasztott adat- és instrukció gyorsítótár megoldás (Neumann elvet sért, de gyorsít!) A cache tervezés során ügyelni kell az adat konzisztenciára (ugyanaz a tartalom mind gyorsítótárban, mind a központi memóriában) Címzés során mind a cache, mind a M címződik. Ha találat van a cache-ben (cache hit). Szó transzfer. ha nincs találat (cache miss). Cache miss penalty fogalom. Blokk transzfer. Memória írás (store) probléma: konzisztencia biztosítás A memória Vadász, 2007. Ea7 30 10

A regiszter, a cache és a M struktúra Központi memória (n szó) Regiszter fájl (valahány szó) 0 1 Szó átvitel c-1 címke A cache sorok készlete (c sor) k szóból álló blokk Blokk átvitel 0 1 2 3 k szóból álló blokk A címzés és találat (hit) során kiderül, mely cache sorban van a címzett szó. A címzés és miss esetében teljes k szóból álló blokk átvitele történik. 2 n -1 A memória Vadász, 2007. Ea7 31 Blokkos cache Cím Cimke Index Cache Cimke Kompar. A memória Vadász, 2007. Ea7 32 A cache tervezés A cache mérete A blokk mérete Újonnan felhozott adat használatának valószínűsége A cache-ből kicsorduló adat újrafelhasználásának valószínűsége Mapping: mely cache helyet foglaljon el egy-egy blokk Replacement algoritmus: mely blokk kerüljön ki a cache-ből, ha egy újnak kell a hely (LRU: Least Recently Used) Write Policy (store során) Memóriába is írjunk, ha cache blokkba írtunk, Csak akkor írjunk a memóriába, amikor a blokk helyére új kerül (replacemented). Write Buffer-es cache. A memória Vadász, 2007. Ea7 33 11

Egyszerű és Write Bufferes Cache CPU Data CPU Address Data Address Instruction Cache Cache Data Cache Write Buffer Main Memory Main Memory A memória Vadász, 2007. Ea7 34 Az asszociatív tár Tartalom szerint címezhető tár Translation Lookaside Buffer A CPU-hoz közeli tár, a memóriamenedzselést segíti Majd az OS tárgyban vesszük. A memória Vadász, 2007. Ea7 35 A memória hierarchia Gyorsabb elérés Drágább Kisebb kapacitás regs cache main memory Ezeket a CPU közvetlenül kezeli másodlagos tár, diszkek harmadlagos tár, szalag, CD File system és paging/swapping Archiválás A memória Vadász, 2007. Ea7 36 12

Számítógép architektúrák A memória VÉGE 13