infokommunikációs technológiák III.5 KILOPROCESSZOROS RENDSZEREK LOGISZTIKAI ALKALMAZÁSA (SZOLGAY PÉTER)
KILOPROCESSZOROS ARCHITEKTÚRÁK KUTATÁSA ÉS ALKALMAZÁSA Kutatási irányok: Stubendek Attila Nem Boole típusú számító architektúrák elemzése Hiba Antal Memória-elérés és processzorközi kommunikáció együttes kezelése rácsokon értelmezett számítások felosztásakor. (mesh partitioning). Optimalizációs módszerek válaszidejének javítása felhasználható részmegoldások generálásával. 2
MEMÓRIA-ELÉRÉS ÉS PROCESSZORKÖZI KOMMUNIKÁCIÓ EGYÜTTES KEZELÉSE (MOTIVÁCIÓ) 1 TeraFLOPS/chip számítási kapacitás (Virtex7, 3 TESLA K20) 10-30 GigaFLOPS számára elegendő off-chip memória sávszélesség. (DDR3-GDDR5) Szabályos olvasási mintázat szükséges adat lokalitás Az ismert rács-particionálási módszerek csak a processzorközi kommunikációra fókuszálnak. Az adatlokalitást csak utólag lehet javítani.
MEMÓRIA-ELÉRÉS ÉS PROCESSZORKÖZI KOMMUNIKÁCIÓ EGYÜTTES KEZELÉSE (EREDMÉNYEK) A felosztás is legyen strukturált. (rács-típusú) A rács-típusú felosztások közül a feltételeknek megfelelő optimális felosztás meghatározható, mivel ezek száma O(K*ln^2(K)), ahol legfeljebb K részre vághatjuk fel a rácsot. METIS partíciókhoz képest akár 50%-os adatlokalitás javulás is elérhető azonos kommunikációs szükséglettel. Egy esetben sem adott rosszabb eredményt, nagyobb rácsokra a kommunikációs szükséglet is javult. 3D strukturált téglatest-rács 10 részre osztása (METIS) 4
MEMÓRIA-ELÉRÉS ÉS PROCESSZORKÖZI KOMMUNIKÁCIÓ EGYÜTTES KEZELÉSE (EREDMÉNYEK) Az adatlokalitás növelése és a processzorközi kommunikáció csökkentése egymással ellentétes célok. Kidolgozásra kerültek módszerek amelyek az adatlokalitásra fókuszáltak, viszont ezek nem kezelték megfelelően a processzorközi kommunikációt. Mivel a processzorközi kommunikáció csökkentése már régóta kutatott terület jó megoldókkal, így egy METIS-AM1 hibrid módszert dolgoztunk ki, amiben az AM1 rész saját fejlesztés. A METIS-AM1 hibrid segítségével az adatlokalitás és processzorközi kommunikáció együttesen kezelhető. További cél egy olyan megoldó, ami nem egy kommunikációra optimalizált megoldásból indul ki, hanem ténylegesen egyszerre kezeli a két feltételt. 5
MEMÓRIA-ELÉRÉS ÉS PROCESSZORKÖZI KOMMUNIKÁCIÓ EGYÜTTES KEZELÉSE (EREDMÉNYEK) Eredmények alkalmazási körének pontos meghatározása: Teszteseteken mérések Elméleti megfontolások Strukturált téglatest alapú rácsok esetén a speciális megoldó használata ajánlott. A méretfüggetlen futási idő lehetővé teszi a paraméterek optimalizálását is. Nem strukturált esetben csak adatfolyam alapú architektúrák számára érdemes használni, ahol 1 részrács mérete legalább 0.5-1M csomópont. 6
FELHASZNÁLHATÓ RÉSZMEGOLDÁSOK GENERÁLÁSA (MOTIVÁCIÓ) Számos optimalizációs probléma esetén a megoldások egyfajta tervet definiálnak, amely részleteiben is felhasználható. A célfüggvény gyakran a végrehajtási idő és/vagy a feladat valósidejű. Jobb megoldásokat nyerhetünk ha a megoldó számára több idő áll rendelkezésre Válaszidő: A legkorábbi időpont, amikor a végrehajtás megkezdődhet. (egy részmegoldást felhasználunk) 7
FELHASZNÁLHATÓ RÉSZMEGOLDÁSOK GENERÁLÁSA (EREDMÉNYEK) Részmegoldás generálás metaheurisztikus modellje Variable Subset Merger (VSM) Származtatott módszerek a Disk Scheduling Problem és a Sequential Ordering Problem számára. VSM-SOP módszer empirikus vizsgálata különböző alsóbbrendű heurisztikákkal: Alsóbbrendű heurisztikák együttműködésének igazolása Válaszidő javulásának igazolása (triviális) Megoldások összehasonlítása a legjobb nem valósidejű megoldókkal. Alapvető hybridizációs lehetőségek megadása: Legjobb valósidejű megoldóval. Legjobb nem valósidejű megoldóval. Alkalmazási kör meghatározása. 8
FELHASZNÁLHATÓ RÉSZMEGOLDÁSOK GENERÁLÁSA (EREDMÉNYEK) Rövid, pár másodperces átlagos elemi végrehajtási idő esetén javul a teljes időszükséglet. Sok megkötés esetén 10-20 mp átlagos elemi végrehajtási idő esetén is jobb megoldás. Hosszabb átlagos elemi végrehajtási idő esetén csak hybrid módszer ajánlott. SOPLIB mintahalmazon mért és származtatott eredmények 9
KUTATÁSI TEVÉKENYSÉG AZ ÉRINTETT IDŐSZAKBAN Kutatási eredmények összegzése: Tézis kutatási eredményeket összefoglaló része. (Hiba Antal) Tézis (Stubendek Attila) Eredmények alkalmazási körének pontos meghatározása. (Hiba Antal) Publikációk: A. Hiba, Z. Nagy, M. Ruszinkó, P. Szolgay,,,Data locality-based mesh partitioning for dataflow machines Concurrency and Computation: Practise and Experience. (bírálati folyamat) A. Stubendek, K. Karacs and T. Roska,,Shape description based on projected edges and global statistical features, proc. Of NOLTA 2014 ISCAS 2015 spec. session szervezése kiloprocesszoros architektúrák témában (Szolgay Péter) 10
infokommunikációs technológiák KÖSZÖNÖM A FIGYELMET!