Pannon Egyetem Villamosmérnöki és Inf. Rendszerek Tanszék Digitális Technika I. (VEMIVI1112D) Bevezetés. Hol tart ma a digitális technológia? Előadó: Dr. Vassányi István vassanyi@almos.vein.hu
Feltételek: Tárgy neve (kódja): Digitális Technika I. (VEMIVI1112D) Ajánlott könyvek: Dr. Arató Péter: Logikai rendszerek tervezése (BME kiadó) Franklin P. Posser, David E. Winkel: The Art of Digital Design (Prentice Hall) Óralátogatás: nem kötelező Követelmények: egy ZH lesz (utolsó előtti héten) Megajánlott jegy: Jegy(ZH) >= 4 Vizsgára bocsátás feltétele: a ZH-n legalább 2-es érdemjegy megszerzése PótZH: utolsó héten (aláírás feltétel teljesítése) Vizsga: írásbeli (szóbeli)
Kapcsolódó jegyzet, segédanyag: http://www.virt.vein.hu Oktatás Tantárgyak Digitális Technika I. Fóliák, óravázlatok (.ppt) Feltöltésük folyamatosan
Oktatási cél: A kombinációs és sorrendi hálózatok klasszikus tervezési módszereinek, illetve megvalósításainak ismertetése. MSI/LSI áramkörök működési táblázatainak, alkalmazásainak, valamint digitális áramkörök (TTL, CMOS) jellemzőinek megismerése
Hol tart ma a digitális technológia?
Bevezetés: CMOS
Mikro-minimalizálás elve: Gordon Moore törvénye (1965): rendkívüli jelentőséggel bír a memóriák és a félvezető áramkörök méretcsökkenése esetén. Tanulmány: félvezető áramkörök fejlődése (prognózis) A technológia fejlődésével minden 18 hónapban az 1 felületegységre (mm² eső tranzisztorok száma közel megduplázódik (integritási sűrűség) Ezzel szemben az eszközök ára csökken, vagy stagnál. 2010: Itanium 9300 (Tukwila): 2 milliárd tranzisztor / chip (2010), 70%-a cache 3D rétegszerkezet szilíciumon Működő 32nm/45nm csíkszélességű tranzisztor (high K fém dielektrikum, Hafnium) pl: Intel újgenerációs processzoraiban Metal gate (a PolySi ot váltja fel) 2012:* Itanium 9500 (Poulson) 32nm / 3.1 milliárd tranz. 8 mag, 54 MB L3 Cache, 12 utasítás/clock, több szintű párhuzamosság L2 cache: 6 MB, 768 kb per core 170 W @ 2.5 GHz 1300..4600 $ / db * http://www.xbitlabs.com/news/cpu/display/20121108120233_intel_launches_eight_core_itanium_9500_poulson_mission_critical_server_processor.html Si)
Transistors per die / Memory capacity 1,00E+10 1,00E+09 1,00E+08 1,00E+07 1,00E+06 1,00E+05 1,00E+04 1,00E+03 Moore törvénye: Intel processzorok és memóriák 1970 és 2010 között 4004 1K 8080 16K 8008 4K 8086 64K 256K 8088 1M 4M Intel 386 Intel 286 64M Intel Itanium 2 Intel Core 2 Duo Intel Pentium 4 (E4300) 16M Intel Itanium Intel Pentium III Intel Pentium II Intel Celeron Intel Pentium Intel 486 Intel Itanium 2 (9MB Cache) Intel Core 2 Quad (Q6600) 256M 512M 128M 1G 2G 4G Intel Itanium (Tukwila) Intel Core i7 (EE-975) 1,00E+02 1,00E+01 1,00E+00 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010 2015 Year Microprocessor Memory
Year 1. Roadmap projections for Semiconductor technology (prediction) Smallest feature [µm] Dynamic Ram Chip size [mm²] Billions of bits / chip Chip size [mm²] Microprocessors Millions of transistors / cm² On-Chip Clock (MHz) Wiring Levels / chip 1995 0.35 190 0,064 250 4 300 4-5 900 1998 0.25 280 0,256 300 7 450 5 1350 2001 0.18 420 1 360 13 600 5-6 2000 2004 0.13 640 4 430 25 800 6 2600 2007 0.09 960 16 520 50 1000 6-7 3600 2010 0.07 1400 64 620 90 1100 7-8 4800 2. NOW and near future: 2004 0.09-0.13 3600 7 end of 2005 0.065 110 70 Mbit 500? 8 2009* 0.03 *EUV: extrem UV lithographical technique I/O /chip
Flash memory 2006-II. <50 nm 16 Gbit (max 32 GB) 16 milliárd! Samsung CF NOR technology 2008 40-20 nm 32 Gbit (max 64 GB) Samsung NAND CF (PRAM t) Sep-08 ~20 nm 16 Gbit (max 32 GB) Samsung SSD PRAM technology Órajelnövelés helyett Párhuzamosítás! Többmagos tech. Feature Size Millions of trans. Dissipation (TPD/ACP) Intel Core2 Duo/Extreme 65nm 143 mm 2 291 millió 2.9 GHz 65-125 W Conroe AMD Athlon 64 X2 5200+ 90nm SOI 199 mm 2 233 millió 2.6 GHz 65-80 W Windsor IBM Power6 (2 magos) 65nm SOI 341 mm 2 700 millió <5 GHz >100 W Intel Core2 Duo/Extreme 45nm (HKMG) 2x107mm 2 2 x 410 millió 2.6 GHz 130W Penryn Intel Core2 Quad (4 mag) 65nm 2x143mm 2 2 x 291 millió 2.6 GHz 130 W Conroe AMD Phenom Quad(4 m) 65nm SOI 285 mm 2 463 millió 2.2GHz 95 W Agena IBM Cell (8 magos) - PS3 90nm SOI 221 mm 2 231 millió 3.2 GHz 85 W Kvantumszámítógép D-Wave 2007.febr. sokváltozós feladatokra: biometrika, parametrikus adatbázisok, pénzügyi számítások számára
A párhuzamosítás háttere A kisebb méretekkel lineárisan csökken a disszipáció (és nő a sebesség), az órajel-frekvencia emelhető Viszont a területi elemsűrűség négyzetesen nő A nagyon kis területről nem lehet nagy hőt elvezetni Ez az órajelnövelés korlátja Egy, szupergyors magot a hőhalál miatt nem tudunk készíteni Viszont több mag létrehozásával a teljesítmény fokozható FELTÉVE hogy a feladat párhuzamosítható A párhuzamosítás több szinten képzelhető el: Áramköri/architekturális pl. pipeline szorzó Automatizált fordítás, pl. loop unrolling Funkcionális párhuzamosítás, többszálú programozás alkalmazáson belül Alkalmazások párhuzamos futtatása
Szuperszámítógépek (2014) Első szuperszámítógépek LARC: (Livermore US) atom-kutatásokra (1960) IBM 7030 / Strech (1961) 2014: 1. Tianhe-2 (Kína): Intel Xeon E5-2692 12C, 2.200GHz 3120000 cores, 33.8 Pflops, 17808 kw 2. Titan - Cray XK7, Opteron 6274 16C 2.200GHz (Cray), 560640 cores,17.6 PFlops, 8209 kw 3. Sequoia - BlueGene/Q, Power BQC 16C, 1.60 GHz (IBM) 1572864 cores, 17.2 PFlops, 7890 kw 4. K computer, SPARC64 VIIIfx 2.0GHz (Fujitsu) 705024 cores,10.5 Pflops,12660 kw
2013. 1. DOE/SC/Oak Ridge National Laboratory United States Titan - Cray XK7, Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA K20x Cray Inc. 560640 cores, 17.6 / 27.1 (elméleti) PetaFLOP/s, 8.209 MW 710 TB (32+6 GB/node), 18688 hybrid node:16-core AMD Opteron CPU + Tesla K20 GPU Cray linux op. rsz. 2. DOE/NNSA/LLNL United States Sequoia - BlueGene/Q, Power BQC 16C 1.60 GHz, Custom IBM 1572864 16.3 / 20.1 7890 3. RIKEN Advanced Institute for Computational Science (AICS) Japan K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect Fujitsu 705024 10.51 11280.4 12660
2012. 1. K Computer: SPARC64 (Kobe, Japan) 10.51 PetaFLOP/s (~1 millió PC) 88,128 db. 2.0GHz 8-core SPARC64 VIIIfx processzor (45 nm) 864 szekrényben, 705,024 mag, Szekrényenként 6 I/O és 96 számítási node (egyenként 16 GB memóriával), össz. 1327 TB m. 6 dimenziós tórusz hálózati topológia, lokális/globális fájlrendszer kombinációja 9.89 MW teljesítmény-felvétel (824 Gflops/KW: nagyon hatékony) 2. Tianhe-1A: NUDT TH MPP, X5670 2.93Ghz + NVIDIA Tesla GPUs, 186 368 processzor (Intel EM64T Xeon X5670 2.93 GHz ), 229 TB memória 2.57 PetaFLOP/s teljesítmény 3.) Jaguar Cray XT5-HE Opteron Six-Core 2.6 GHz (Oak Ridge Laboratory - Tennessee) 224 162 processzor (1.759 millió GFLOPs (~ 1.76 PetaFLOP teljesítmény) 10.) IBM Roadrunner BladeCenter QS22/LS21 Cluster, (LANL, Los Alamos) 129 600 processzoros rendszer (PowerXCell 8i 3.2 GHz ) 73 TB memória (N/A) 1.105 PetaFLOP/s
Tianhe-2
Cray Titan
IBM Sequoia-Bluegene/Q
K computer (Fujitsu-Riken)
Jaguar Cray XT5-HE
Lehetőségek: Fetch-Decode- Execute (FDE) párhuzamosítás átlapolt végrehajtás (látszólagos) - pipeline teljesen párhuzamos végrehajtás (több processzor) pl. CELL BE (IBM) Heterogén multi-core-os rendszerek
Tianhe-1A
Architekturális példák https://www-01.ibm.com/chips/techlib/techlib.nsf/products/cell_broadband_engine https://www-01.ibm.com/chips/techlib/techlib.nsf/techdocs/1aeee1270ea2776387257060006e61ba/$file/cbea_v1.02_11oct2007_pub.pdf
AMD X4 Phenom II. (4 mag, 45nm, 3GHz, 758 millió tranzisztor, 125W, Deneb kódnéven)
Intel Nehalem-EX: 80 mag ISSC 2007 Polaris: 80 mag 65 nm technológia 3D rétegszerkezet 1 TeraFLOPs. 4-5.1 GHz 100 175 W Intel Core i7 EE 980x 32nm 3.3 GHz 6 mag / 12 szál
Más alternatíva: D-Wave One Kvantumszámítógép 2013: 512 qubit-es változat qubit : a kvantum-rendszer alapegysége, amellyel Boole algebrában ismert 0 és 1 állapotok két normalizált és kölcsönösen ortogonális kvantum állapot-pár segítségével ábrázolhatók { 0 >, 1 > }, Félvezetők helyett szupravezető fémet használnak mágneses vákuumban: niobium (ultra alacsony hőmérsékleten) Még nem bizonyított In May 2013, Google Inc announced that it was launching the Quantum Artificial Intelligence Lab, to be hosted by NASA s Ames Research Center. The lab will house a 512-qubit quantum computer from D-Wave Systems, and the USRA (Universities Space Research Association) will invite researchers from around the world to share time on it. The goal is to study how quantum computing might advance machine learning [ http://www.dwavesys.com