Pannon Egyetem Villamosmérnöki és Inf. Rendszerek Tanszék Digitális Technika I. (VEMIVI1112D) Bevezetés. Hol tart ma a digitális technológia? Előadó: Dr. Vassányi István vassanyi@almos.vein.hu
Feltételek: Tárgy neve (kódja): Digitális Technika I. (VEMIVI1112D) Ajánlott könyvek: Dr. Arató Péter: Logikai rendszerek tervezése (BME kiadó) Franklin P. Posser, David E. Winkel: The Art of Digital Design (Prentice Hall) Óralátogatás: nem kötelező Követelmények: egy ZH lesz (utolsó előtti héten) Megajánlott jegy: Jegy(ZH) >= 4 Vizsgára bocsátás feltétele: a ZH-n legalább 2-es érdemjegy megszerzése PótZH: utolsó héten (aláírás feltétel teljesítése) Vizsga: írásbeli (szóbeli)
Kapcsolódó jegyzet, segédanyag: http://www.virt.vein.hu Oktatás Tantárgyak Digitális Technika I. Fóliák, óravázlatok (.ppt) Feltöltésük folyamatosan
Oktatási cél: A kombinációs és sorrendi hálózatok klasszikus tervezési módszereinek, illetve megvalósításainak ismertetése. MSI/LSI áramkörök működési táblázatainak, alkalmazásainak, valamint digitális áramkörök (TTL, CMOS) jellemzőinek megismerése
Hol tart ma a digitális technológia?
Bevezetés: CMOS
Mikro-minimalizálás elve: Gordon Moore törvénye (1965): rendkívüli jelentőséggel bír a memóriák és a félvezető áramkörök méretcsökkenése esetén. Tanulmány: félvezető áramkörök fejlődése (prognózis) A technológia fejlődésével minden 18 hónapban az 1 felületegységre (mm² eső tranzisztorok száma közel megduplázódik (integritási sűrűség) Ezzel szemben az eszközök ára csökken, vagy stagnál. 2010: Itanium 9300 (Tukwila): 2 milliárd tranzisztor / chip (2010), 70%-a cache 3D rétegszerkezet szilíciumon Működő 32nm/45nm csíkszélességű tranzisztor (high K fém dielektrikum, Hafnium) pl: Intel újgenerációs processzoraiban Metal gate (a PolySi ot váltja fel) 2012:* Itanium 9500 (Poulson) 32nm / 3.1 milliárd tranz. 8 mag, 54 MB L3 Cache, 12 utasítás/clock, több szintű párhuzamosság L2 cache: 6 MB, 768 kb per core 170 W @ 2.5 GHz 1300..4600 $ / db 2015: Itanium Kittson (??) * http://www.xbitlabs.com/news/cpu/display/20121108120233_intel_launches_eight_core_itanium_9500_poulson_mission_critical_server_processor.html Si)
Transistors per die / Memory capacity 1,00E+10 1,00E+09 1,00E+08 1,00E+07 1,00E+06 1,00E+05 1,00E+04 1,00E+03 Moore törvénye: Intel processzorok és memóriák 1970 és 2010 között 4004 1K 8080 16K 8008 4K 8086 64K 256K 8088 1M 4M Intel 386 Intel 286 64M Intel Itanium 2 Intel Pentium 4 Intel Core 2 Duo (E4300) 16M Intel Itanium Intel Pentium III Intel Pentium II Intel Celeron Intel Pentium Intel 486 Intel Itanium 2 (9MB Cache) Intel Core 2 Quad (Q6600) 256M 512M 128M 1G 2G 4G Intel Itanium (Tukwila) Intel Core i7 (EE-975) 1,00E+02 1,00E+01 1,00E+00 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010 2015 Year Microprocessor Memory
Year 1. Roadmap projections for Semiconductor technology (prediction) Smallest feature [µm] Dynamic Ram Chip size [mm²] Billions of bits / chip Chip size [mm²] Microprocessors Millions of transistors / cm² On-Chip Clock (MHz) Wiring Levels / chip 1995 0.35 190 0,064 250 4 300 4-5 900 1998 0.25 280 0,256 300 7 450 5 1350 2001 0.18 420 1 360 13 600 5-6 2000 2004 0.13 640 4 430 25 800 6 2600 2007 0.09 960 16 520 50 1000 6-7 3600 2010 0.07 1400 64 620 90 1100 7-8 4800 2. NOW and near future: 2004 0.09-0.13 3600 7 end of 2005 0.065 110 70 Mbit 500? 8 2009* 0.03 *EUV: extrem UV lithographical technique I/O /chip
Flash memory 2006-II. <50 nm 16 Gbit (max 32 GB) 16 milliárd! Samsung CF NOR technology 2008 40-20 nm 32 Gbit (max 64 GB) Samsung NAND CF (PRAM t) Sep-08 ~20 nm 16 Gbit (max 32 GB) Samsung SSD PRAM technology Órajelnövelés helyett Párhuzamosítás! Többmagos tech. Feature Size Millions of trans. Dissipation (TPD/ACP) Intel Core2 Duo/Extreme 65nm 143 mm 2 291 millió 2.9 GHz 65-125 W Conroe AMD Athlon 64 X2 5200+ 90nm SOI 199 mm 2 233 millió 2.6 GHz 65-80 W Windsor IBM Power6 (2 magos) 65nm SOI 341 mm 2 700 millió <5 GHz >100 W Intel Core2 Duo/Extreme 45nm (HKMG) 2x107mm 2 2 x 410 millió 2.6 GHz 130W Penryn Intel Core2 Quad (4 mag) 65nm 2x143mm 2 2 x 291 millió 2.6 GHz 130 W Conroe AMD Phenom Quad(4 m) 65nm SOI 285 mm 2 463 millió 2.2GHz 95 W Agena IBM Cell (8 magos) - PS3 90nm SOI 221 mm 2 231 millió 3.2 GHz 85 W Kvantumszámítógép D-Wave 2007.febr. sokváltozós feladatokra: biometrika, parametrikus adatbázisok, pénzügyi számítások számára
A párhuzamosítás háttere A kisebb méretekkel lineárisan csökken a disszipáció (és nő a sebesség), az órajel-frekvencia emelhető Viszont a területi elemsűrűség négyzetesen nő A nagyon kis területről nem lehet nagy hőt elvezetni Ez az órajelnövelés korlátja Egy, szupergyors magot a hőhalál miatt nem tudunk készíteni Viszont több mag létrehozásával a teljesítmény fokozható FELTÉVE hogy a feladat párhuzamosítható A párhuzamosítás több szinten képzelhető el: Áramköri/architekturális pl. pipeline szorzó Automatizált fordítás, pl. loop unrolling Funkcionális párhuzamosítás, többszálú programozás alkalmazáson belül Alkalmazások párhuzamos futtatása
Szuperszámítógépek (2014) Első szuperszámítógépek LARC: (Livermore US) atom-kutatásokra (1960) IBM 7030 / Strech (1961) 2015: 1. Tianhe-2 (Kína): Intel Xeon E5-2692 12C, 2.200GHz 3120000 cores, 33.8 Pflops, 17808 kw 2. Titan - Cray XK7, Opteron 6274 16C 2.200GHz (Cray), 560640 cores,17.6 PFlops, 8209 kw 3. Sequoia - BlueGene/Q, Power BQC 16C, 1.60 GHz (IBM) 1572864 cores, 17.2 PFlops, 7890 kw 4. K computer, SPARC64 VIIIfx 2.0GHz (Fujitsu) 705024 cores,10.5 Pflops,12660 kw
2013. 1. DOE/SC/Oak Ridge National Laboratory United States Titan - Cray XK7, Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA K20x Cray Inc. 560640 cores, 17.6 / 27.1 (elméleti) PetaFLOP/s, 8.209 MW 710 TB (32+6 GB/node), 18688 hybrid node:16-core AMD Opteron CPU + Tesla K20 GPU Cray linux op. rsz. 2. DOE/NNSA/LLNL United States Sequoia - BlueGene/Q, Power BQC 16C 1.60 GHz, Custom IBM 1572864 16.3 / 20.1 7890 3. RIKEN Advanced Institute for Computational Science (AICS) Japan K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect Fujitsu 705024 10.51 11280.4 12660
2012. 1. K Computer: SPARC64 (Kobe, Japan) 10.51 PetaFLOP/s (~1 millió PC) 88,128 db. 2.0GHz 8-core SPARC64 VIIIfx processzor (45 nm) 864 szekrényben, 705,024 mag, Szekrényenként 6 I/O és 96 számítási node (egyenként 16 GB memóriával), össz. 1327 TB m. 6 dimenziós tórusz hálózati topológia, lokális/globális fájlrendszer kombinációja 9.89 MW teljesítmény-felvétel (824 Gflops/KW: nagyon hatékony) 2. Tianhe-1A: NUDT TH MPP, X5670 2.93Ghz + NVIDIA Tesla GPUs, 186 368 processzor (Intel EM64T Xeon X5670 2.93 GHz ), 229 TB memória 2.57 PetaFLOP/s teljesítmény 3.) Jaguar Cray XT5-HE Opteron Six-Core 2.6 GHz (Oak Ridge Laboratory - Tennessee) 224 162 processzor (1.759 millió GFLOPs (~ 1.76 PetaFLOP teljesítmény) 10.) IBM Roadrunner BladeCenter QS22/LS21 Cluster, (LANL, Los Alamos) 129 600 processzoros rendszer (PowerXCell 8i 3.2 GHz ) 73 TB memória (N/A) 1.105 PetaFLOP/s
Tianhe-2
Ilyen volt: Tianhe-1A
Cray Titan
IBM Sequoia-Bluegene/Q
K computer (Fujitsu-Riken)
Jaguar Cray XT5-HE
Lehetőségek: Fetch-Decode- Execute (FDE) párhuzamosítás átlapolt végrehajtás (látszólagos) - pipeline teljesen párhuzamos végrehajtás (több processzor) pl. CELL BE (IBM) Heterogén multi-core-os rendszerek
Architekturális példák https://www-01.ibm.com/chips/techlib/techlib.nsf/products/cell_broadband_engine https://www-01.ibm.com/chips/techlib/techlib.nsf/techdocs/1aeee1270ea2776387257060006e61ba/$file/cbea_v1.02_11oct2007_pub.pdf
AMD X4 Phenom II. (4 mag, 45nm, 3GHz, 758 millió tranzisztor, 125W, Deneb kódnéven)
Intel Nehalem-EX: 80 mag ISSC 2007 Polaris: 80 mag 65 nm technológia 3D rétegszerkezet 1 TeraFLOPs. 4-5.1 GHz 100 175 W Intel Core i7 EE 980x 32nm 3.3 GHz 6 mag / 12 szál
Más alternatíva: D-Wave 2 kvantumszámítógép 2015: 1000 qubit-es változat qubit : a kvantum-rendszer alapegysége, amellyel a digitalis technikában ismert 0 és 1 állapotok két normalizált és kölcsönösen ortogonális kvantum állapot-pár segítségével ábrázolhatók { 0 >, 1 > }. A qubitek összefonódnak, ezáltal lekérdezhetők Félvezetők helyett szupravezető nióbiumot használnak mágneses vákuumban (0.01 K hőmérsékleten) a qubit megvalósítására Csak speciális (optimalizálási) problémákra: pl. megkeresni egy függvény minimumát. A feladatot a külső mágneses tér manipulációjával írják le. A qubit-rendszer a legalacsonyabb energiájú állapotra áll be. Prímszám-szorzatok faktorizálása (56153 a 2015-ös rekord) Komoly gond a stabilitás 2015. dec.: a Google új kvantumalgoritmussal demonstrálta a D-Wave 2 működését http://www.dwavesys.com