RECOWARE XP-R 16 RISC alapú, multiprocesszoros célszámítógép újrakonfigurálható akcelerátorral



Hasonló dokumentumok
Ismerkedjünk tovább a számítógéppel. Alaplap és a processzeor

Számítógépek felépítése

Számítógépek felépítése, alapfogalmak

2. Számítógépek működési elve. Bevezetés az informatikába. Vezérlés elve. Külső programvezérlés... Memória. Belső programvezérlés

Számítógép felépítése

Programmable Chip. System on a Chip. Lazányi János. Tartalom. A hagyományos technológia SoC / PSoC SoPC Fejlesztés menete Mi van az FPGA-ban?

1. DIGITÁLIS TERVEZÉS PROGRAMOZHATÓ LOGIKAI ÁRAMKÖRÖKKEL (PLD)

8. Fejezet Processzor (CPU) és memória: tervezés, implementáció, modern megoldások

A számítógép egységei

Processzor (CPU - Central Processing Unit)

Számítógépek felépítése, alapfogalmak

Szárazföldi autonóm mobil robotok vezérlőrendszerének kialakítási lehetőségei. Kucsera Péter ZMNE Doktorandusz

5-6. ea Created by mrjrm & Pogácsa, frissítette: Félix

Utolsó módosítás:

Új kompakt X20 vezérlő integrált I/O pontokkal

Bepillantás a gépházba

Összeadás BCD számokkal

Nagy Gergely április 4.

8. Fejezet Processzor (CPU) és memória: tervezés, implementáció, modern megoldások

Jelfeldolgozás a közlekedésben

2016/06/23 07:47 1/13 Kérdések

Előadó: Nagy István (A65)

Programozható logikai vezérlő

1. Kombinációs hálózatok mérési gyakorlatai

Orvosi készülékekben használható modern fejlesztési technológiák lehetőségeinek vizsgálata

Operációs rendszerek. Bemutatkozás

Párhuzamos programozási platformok

Parciális rekonfiguráció Heterogán számítási rendszerek VIMIMA15

Digitális eszközök típusai

Párhuzamos programozási platformok

Számítógép-rendszerek fontos jellemzői (Hardver és Szoftver):

Mikroprocesszorok (Microprocessors, CPU-s)

A Xilinx FPGA-k. A programozható logikákr. Az FPGA fejlesztés s menete. BMF KVK MAI, Molnár Zsolt, 2008.

Verifikáció és validáció Általános bevezető

elektronikus adattárolást memóriacím

OpenCL alapú eszközök verifikációja és validációja a gyakorlatban

5. tétel. A számítógép sematikus felépítése. (Ábra, buszok, CPU, Memória, IT, DMA, Periféria vezérlő)

IT - Alapismeretek. Feladatgyűjtemény

Számítógép architektúra

Szupermikroprocesszorok és alkalmazásaik

VIDEOTON VT 32, VT 32x, VT 32xx grafikus munkaállomások

Multimédia hardver szabványok

Digitális technika VIMIAA01 9. hét Fehér Béla BME MIT

Digitális technika VIMIAA01 9. hét

I+K technológiák. Beágyazott rendszerek Dr. Aradi Szilárd

Joint Test Action Group (JTAG)

Hordozható számítógép, noteszgép szó szerint: ölbevehető. Síkkijelzős, telepes, hordozható számítógép. (Informatikai fogalomtár)

2017/12/16 21:33 1/7 Hardver alapok

egy szisztolikus példa

Bevezetés az informatikába

Szimuláció RICHARD M. KARP és AVI WIGDERSON. (Készítette: Domoszlai László)

Csoportos üzenetszórás optimalizálása klaszter rendszerekben

MSP430 programozás Energia környezetben. Kitekintés, további lehetőségek

A processzor hajtja végre a műveleteket. összeadás, szorzás, logikai műveletek (és, vagy, nem)

A mikroszámítógép felépítése.

Mikrorendszerek tervezése

1. MODUL - ÁLTALÁNOS FOGALMAK

Programozó- készülék Kezelőkozol RT óra (pl. PC) Digitális bemenetek ROM memória Digitális kimenetek RAM memória Analóg bemenet Analóg kimenet

2011. November 8. Boscolo New York Palace Budapest. Extrém teljesítmény Oracle Exadata és Oracle Exalogic rendszerekkel

UNIX / Linux rendszeradminisztráció

Projekt beszámoló. NEWSIT News basedearlywarning System forintradaytrading: Hír alapú Korai Figyelmeztető Rendszer Napon belüli Kereskedéshez

Adatok ábrázolása, adattípusok

Laboratóriumi műszerek megvalósítása ARM alapú mikrovezérlővel és Linux-szal

A személyi számítógép felépítése

Számítógép architektúrák. Bevezetés

SZÁMÍTÓGÉP ARCHITEKTÚRÁK

SZÁMÍTÓGÉPEK BELSŐ FELÉPÍTÉSE - 1

Informatikai alapismeretek földtudományi BSC számára

VI. SZOFTVERES PROGRAMOZÁSÚ VLSI ÁRAMKÖRÖK

Integrált áramkörök/5 ASIC áramkörök

Ajánlott adatbázis-szerver konfiguráció a Novitax szoftverekhez

A Microsoft terminálszolgáltatás ügyfél oldali hardverigényének meghatározása

Alapismeretek. Tanmenet

Az informatika fejlõdéstörténete

Mérő- és vezérlőberendezés megvalósítása ARM alapú mikrovezérlővel és Linux-szal

A Netburner fejlesztőeszköz alkalmazástechnikája

Elvonatkoztatási szintek a digitális rendszertervezésben

Léteznek nagyon jó integrált szoftver termékek a feladatra. Ezek többnyire drágák, és az üzemeltetésük sem túl egyszerű.

Bevezetés a párhuzamos programozási koncepciókba

SAT probléma kielégíthetőségének vizsgálata. masszív parallel. mesterséges neurális hálózat alkalmazásával

BMD Rendszerkövetelmények

Utolsó módosítás:

Laborgyakorlat Logikai áramkörök számítógéppel segített tervezése (CAD)

Alapismeretek. Tanmenet

2016/08/31 02:45 1/6 Hardver alapok

Számítógép fajtái. 1) személyi számítógép ( PC, Apple Macintosh) - asztali (desktop) - hordozható (laptop, notebook, palmtop)

Intelligens és összetett szenzorok

Hogyan tudom soros eszközeimet pillanatok alatt hálózatba kötni?

3. Az elektronikus számítógépek fejlődése napjainkig 1

Vezérlésfolyam gráf és X86 utasításkészlet

Programozás alapjai Bevezetés

Bevitel-Kivitel. Eddig a számítógép agyáról volt szó. Szükség van eszközökre. Processzusok, memória, stb

Operandus típusok Bevezetés: Az utasítás-feldolgozás menete

Teljesítmény Mérés. Tóth Zsolt. Miskolci Egyetem. Tóth Zsolt (Miskolci Egyetem) Teljesítmény Mérés / 20

Grafikus csővezeték 1 / 44

1.1. Általános áttekintés

Az operációs rendszer szerkezete, szolgáltatásai

OPERÁCIÓS RENDSZEREK I. BEVEZETÉS Koczka Ferenc -

1. Generáció( ):

IRÁNYÍTÁSTECHNIKAI ALAPFOGALMAK, VEZÉRLŐBERENDEZÉSEK FEJLŐDÉSE, PLC-GENERÁCIÓK

Átírás:

RECOWARE XP-R 16 RISC alapú, multiprocesszoros célszámítógép újrakonfigurálható akcelerátorral A RECOWARE XP-R 16 egy speciális erőforrással, akcelerátorral kiegészített, az alkalmazások széles területén szuperszámítógép teljesítményt nyújtó célberendezés, melyet a RECOWARE Kft. fejlesztett ki. A teljesítményt elsősorban az akcelerátor biztosítja azáltal, hogy lehetővé teszi utasítássorozatok, függvények, modellek áramköri implementációját, másrészt a rendszer biztosítja ezen erőforrások parallel működtetését is. Ma a legnagyobb számítástechnikai teljesítményt az ún. szuperszámítógépek nyújtják. Közös jellemzőjük a rendkívül nagy skalár és lebegőpontos műveletvégrehajtó sebességen felül a hatalmas I/O kapacitás, amellyel óriási mennyiségű háttértárat képesek kezelni és több száz felhasználót szimultán kiszolgálni. Ezek általános célú berendezések, minden alkalmazásban extra teljesítményt nyújtanak, ezért áruk rendkívül magas, 1 millió USD és 30 millió USD között van, kiépítéstől függően. Adott feladatra épített célberendezésekkel is szuperszámítógép teljesítmény érhető el. Ez a megoldás az általánosság elvének feladásával kedvezőbb árteljesítmény viszonyt eredményez. A célhardverek kifejlesztése azonban időigényes és - a ma már jelentős szimulációs támogatás mellett is - tartalmaz kockázati elemet. A megoldás legnagyobb hátránya, hogy csak az adott alkalmazásban nyújt extra teljesítményt. A RECOWARE XP-R 16 ezt a problémát oldja fel. RECOWARE XP-R 16 az általános célú célszámítógép (a hardware software úton történő rekonfigurálhatósága) A RECOWARE XP-R 16 a többszöri felhasználás lehetőségét, - azaz a berendezés általános használhatóságát úgy biztosítja, - hogy az alkalmazott speciális, nagyszámú kaput tartalmazó kapuáramköreinek funkciója - azaz kapcsolási rajza számítógépen megtervezhető, szimulálható és annak programjának betöltése után a kapcsolási rajz szerinti működését biztosítja. Egy másik/következő feladat során megfogalmazott kapcsolási rajz programjának elkészítése és betöltése - mert a kapuáramköri funkciók újraprogramozható elemeket tartalmaznak, - megváltoztatja a hardware működését. Ez a többszöri feladatra illeszthetőség biztosítja a RECOWARE XP-R 16 általánosan speciális célra történő alkalmazhatóságát. A RECOWARE XP-R 16 a szuperszámítógépek teljesítményét nyújtja széles alkalmazási területeken, lényegesen olcsóbb, megfizethető áron. A felmerülő, új

feladatok megoldásához nem kell új berendezést kifejleszteni, ez a programozható hardver elemek átkonfigurálásával könnyen megoldható. A RECOWARE XP-R 16 felépítése AZ MPR RENDSZER ETHERNET HÁLÓZAT FEJLESZTÕ RENDSZER R3000 VME SERVER R3000 16MByte RAM 1GByte Disc VME RACK 20slot 16 MPR-CPU 1.5KVA P. Supply XILINX DEVELOPMENT SYSTEM IBMPC486 XC-DS391,DS502 VME MPR-CPU R3052 A RECOWARE XP-R 16 a MIPS R3000 RISC mikroprocesszorra épül A 80-as éveket a CISC (Complex Instruction Set Computer) mikroprocesszorok uralták. Utasításkészletük ritkán használt bonyolult utasításokat is tartalmazott, az operandusok elérését többféle címzési mód is biztosította. A 80-as évek második felében komoly versenytársként jelentek meg a RISC (Reduced Instruction Set Computer) típusú mikroprocesszorok. A RISC (Reduced Instruction Set Computer) mikroprocesszorok kiemelkedő teljesítményükkel hódítanak a piacon. A gyors térhódításuk oka az a felismerés volt, hogy a programok viszonylag kis arányban használnak bonyolult, összetett utasitásokat. A bonyolult utasítások elhagyásával és a címzési módok csökkentésével (load/store) a mikropocesszorok architektúrája leegyszerűsödött, ami a teljesítmény soha nem tapasztalt növekedéséhez vezetett. A RECOWARE XP-R 16 XILINX FPGA-t (Field Programmable Logic Array) alkalmaz az alkalmazói programok gyorsításra

A mindennapi gyakorlatban sokszor találkozunk olyan ismétlődő programrészletekkel, amelyek a futási idő jelentős részét kitöltik. Amennyiben ezen programrészletek futási idejét sikerül valamilyen arányban lecsökkenteni, akkor gyakorlatilag az egész program futási ideje a fenti arányban lecsökken. Másként fogalmazva: a felhasználó számára az adott feladatban megnövekedik a gép (processzor) teljesítménye. Feladatfüggően, de akár több nagyságrendi sebességnövekedés érhető el, ha a gyakran használt utasítássorozatokat, programhurkokat, a speciális pl. lebegőpontos aritmetikai utasításokat, mint külön utasításokat definiáljuk és végrehajtásukat speciális hardverre (coprocesszor/accelerator) bízzuk. Ezt a speciális hardvert nevezzük akcelerátornak, vagy gyorsítónak. A RECOWARE XP-R 16 maximum 16 processzort tartalmaz Az egyedi processzor teljesítmény növelésének az aktuális technológiai lehetőségek szabnak határt. A további teljesítménynövelés lehetséges módja a feladaton belüli párhuzamosságok feltárása és a feladat egyidejű végrehajtása több processzoron; illetve multiuser operációs rendszeren belül több felhasználói program egyidejű futtatása több processzoron. A RECOWARE XP-R 16 CPU modulja RISC CPU 79R3052E 10KByte Cache RTC M146818 EPROM 512KByte DUART SCN2681 RS232 BUS CONTROLLER XC4005H VME DRAM 16MByte FIFO 4Kx9 USER INTERFACE ACCELE- RATOR1 PIGGY BACK SRAM 64Kx16 ACCELE- RATOR2 Az akcelerátor piggy-back -ént csatlakozik a CPUmodulhoz. Ez a megoldás biztosítja, hogy az újabb, gyorsabb, nagyobb integráltságú áramkörök megjelenésével, az alapkártyát változatlanul hagyva, csupán a speciális műveletvégző cseréjével a teljesítmény a mindenkori igények szerint flexibilisen növelhető.

Az akcelerátor hatékonyan képes együttműködni az általános célú mikroprocesszorral. Ez azt jelenti, hogy párhuzamosan dolgozik a RISC mikropocesszorral és csak minimálisan igényli annak közreműködését. Ez annak köszönhető, hogy az akcelerátor modul rendelkezik saját memóriával, amely autonóm módon képes adatot cserélni a főmemóriával. Az akcelerátor modulon egy különálló FPGA-ban van megvalósítva az a kommunikációs áramkör, amely a "felhasználói, szabad utasítás terület" illesztését végzi a standard mikroprocesszorhoz, és a főmemóriához. Ez a megoldás számos előnnyel jár. Könnyen adaptálható más hardver környezetre is, és az illesztés nem foglal helyet az utasítások számára rendelkezésre álló területből. Az illesztő interfész magasszintű szolgáltatásokat is nyújt a "programozható hardver" kezeléséhez (pl. konfigurálás). A gyorsítás mértéke a célorientált jellegből fakadóan rendkívül jelentős. Az alkalmazott megoldás miatt a várható teljesítmény megegyezik az adott feladatra épített célhardver teljesítményével. Az utasítások hardver implementációját nagybonyolultságú ún. FPGA (Field Programable Gate Array) áramkörök végzik, amelyek program-letöltéssel, szoftver úton konfigurálhatók. Az XPR-ben alkalmazott XILINX áramkörök nagy előnye, hogy tetszőleges számú alkalommal újraprogramozhatók. Ez biztosítja, hogy az akcelerátor nem csak egy adott feladathoz használható, hanem az igények szerint, rugalmasan átkonfigurálható. A XILINX áramkörcsalád legnagyobb tagja 20.000 kapu ekvivalens. (Az FPGA áramkörök fejlődése lépést tart a mikroprocesszorokéval.) A XILINX-ben megvalósított funkciók ma már max. 100 MHz-es rendszer órajellel működtethetők, de sebességük, belső komplexitásuk egyre növekszik. Az áramkörtervezéshez és a verifikáláshoz a XILINX cég hatékony fejlesztőrendszere áll rendelkezésre. A berendezés kihasználja a párhuzamosítás adta lehetőségeket. A 16 processzor modul képes egyidőben valamely feladaton vagy részfeladaton dolgozni. Ennek a megoldásnak az előnyei a következők: modularitás: bővíthetőség: megbízhatóság: azonos típusú processzorelemeket alkalmazva a teljesítmények széles skálája átfogható. a felhasználói igények növekedése esetén a konfiguráció további processzorokkal bővíthető. a rendszer működőképes marad egyes processzorelemek meghibásodása esetén is. A felhasználói programok fejlesztése (algoritmikus tesztelése) az ún. fejlesztőgépen történik. A fejlesztőgép operációs rendszere UNIX. A programfejlesztésre a UNIX operációs rendszer eszközeit lehet használni (szövegszerkesztő, fordítóprogram, assembler, szubrutinkönyvtárak, stb). Az MP-R 16 CPU modulokon (célgépeken) a UNIX rendszerhívásainak csak korlátozott részhalmaza (create, open, pipe, read, write, close, exit) kerül megvalósításra. A felhasználói programoknak a célgépen futó változata - mint bináris végrehajtható programok - a fejlesztőgépen állnak elő. A programoknak a célgépre való betöltését a fejlesztőrendszer végzi.

A RECOWARE XP-R 16 alkalmas arra, hogy a felhasználó saját maga definiálhasson utasításokat, amelyeket hardverben! implementálhat. Ezek, egy általános célú RISC mikroprocesszor utasításkészletét kiegészítve, mint társprocesszor utasítások kerülnek végrehajtásra, a felhasználó tetszőleges számú alkalommal újra definiálhatja speciális utasításait, a rendszer multiprocesszoros architektúrája és szoftver rendszere biztosítja egy feladat gyors, párhuzamos végrehajtását. A RECOWARE XP-R 16 specifikációja Általános jellemzők Processzorok száma 1-16 Processzor típusa MIPS R3000 (R3052) Működési frekvencia 50 MHz Cache méret 10-160 Kbyte Virtuális memória 4 Gbyte Accelerátorok száma 2-32 Accelerátor típusa XILINX Integráltsági foka 10.000 kapuekvivalens Operatív memória mérete 16-256 Mbyte Operatív memória védelme paritás Input/output felület 32bites VME rendszerbusz RS232(Monitor és diagnosztikai céllal) Teljesítmény jellemző Effektív teljesítmény 400-6400 MIPS Szoftver Fejlesztőgép UNIX multitasking/multiuser CPU Modul UNIX kernel A RECOWARE XP-R 16 alkalmazása dermatoglífiai feladatokban A következőkben bemutatjuk a RECOWARE XP-R 16 alkalmazási lehetőségét egy konkrét feladatban: ujjnyomatok összehasonlítása. Egy ujjnyomatazonosító rendszer egyik leginkább számításigényes része az ujjnyomatok (mintatár) elemeinek összehasonlítása a helyszínen talált ismeretlen személytől származó ujjnyom töredékekkel. Eltekintve az összehasonlítási algoritmus megbízhatóságától, mindenképpen meg kell felelni annak az elvárásnak, hogy hosszabb távon a naponta azonosításra beküldött nyomok napi feldolgozási - keresési ideje - ne haladja meg az egy napot: egyszerűbben fogalmazmazva ez azt jelenti, hogy a rendszer legfeljebb 24 órás válaszidőt adjon, és ne halmozódjon fel input oldalon naponta egyetlen nyomazonosítási igény

sem. (Amit pl. május 24-én azonosításra beküldtek, arra legkésőbb május 25-én válaszolni kell. Ha ez nem sikerülne, akkor a rendszer a megválaszolatlan, és ezért folyamatosan halmozódó azonosítási kérdéseket görgetné maga előtt, előbbutóbb elmaradva a bűnüldözés-bűnfelderítés esélyétől. A probléma megoldható azzal, hogy az összehasonlításhoz minél magasabb frekvenciájú számítógépet alkalmazunk, illetve ha ez nem elég, akkor minél több ilyen számítógépet működtetünk párhuzamosan ugyanazon azonosítási igény megoldására, vagy minél több számítógépet működtetünk a minél több napi azonosítási igény kiszolgálására. Általános célú számítógépek alkalmazását feltételezve hamarosan korlátokba ütközünk: az adott azonosítási algoritmus számítástechnikai igénye eléri az ésszerű - elfogadható ár/teljesítmény viszonyú számítástechnikai eszközök által biztosított - határokat a feladat párhuzamosításával is ugyanilyen ár/teljesítmény korlátokba ütközünk Az azonosítási feladat jellemzése az azonosítási algoritmus megbízhatósága egyértelműen az algoritmus időigényével exponenciálisan növekszik a mintatár (összehasonlítandó nyomatok száma) mérete országonként 1.000.000-50.000.000 között mozoghat (ez a válaszidővel lineáris összefüggésben van) a háttértár elérési időkhöz képest viszonylag kevés adaton kell igen sok műveletet végezni Az összehasonlítási algoritmus felépítése (A következőőkben ismertetett eljárás a tényleges eljárás igen leegyszerűsített változata.) a. Az azonosító eljárás belső ciklusa ponthalmaz (mintatár-nyomat) összehasonlítása ponthalmazzal (nyom) b. Az azonosító eljárás második ciklusa a ponthalmaz jellemzők hibáinak figyelembevételével (a mintatár torzulása, illetve az azonosítandó elem torzulásának (nyom) az első ciklus megismétlése c. Az azonosító eljárás külső ciklusa a fentebb emlitett összetett ciklusokat a nyilvántartásban (mintatár: 1.0000.000-50.000.000) szereplő nyomatok száma szerint kell végrehajtani (líneáris növekedés) Tegyük fel, hogy általános célú számítógéppel szeretnénk meggyorsítani a feldat megoldását (belső cklus: 50 utasítás, második ciklus ciklusszámlálója 20, a külső ciklus ciklusszámlálója 100.000 személyes nyilvántartás mellett 1.000.000 (mindenkinek 10 ujja van). Emiatt egy azonosítás 50*20*1.000.000 utasítást igényel.

A feldolgozó processzor teljesítményének növelésével - pl. 66 MHz-ről 133 MHz-re - mindössze fele időre csökkenthető egy-egy azonosítás időigénye (a 133 MHz is már-már a jelenlegi - elfogadaható árú - eszközök határán van). A RECOWARE XP-R 16 berendezéssel a belső ciklus idejét tudjuk csökkenteni a speciális célhardware-rel 50-ről 1-re. (Az összehasonlítást az akcelerátor végzi koprocesszorként.) Feltételezve, hogy a többi ciklust ugyanaz az általános célú (66 vagy 133 Mhz frekvenciájú) számítógép végzi, az összehasonlítási idő 1*20*1.000.000 azaz a korábbi idő ötvened része. (Hangsúlyozandó, hogy ezt az eredmény ugyanazon általános célú számítógépek alkalmazásával értük el, mindössze a belső ciklust segítettük speciális hardware eszközökkel. (Természetesen a második, illetve külső ciklust nem is tudtuk volna felgyorsítani jelentősen, hiszen azok általános célú számítógéppel fogalmazhatók meg)