GPU-Accelerated Collocation Pattern Discovery

Hasonló dokumentumok
A CUDA előnyei: - Elszórt memória olvasás (az adatok a memória bármely területéről olvashatóak) PC-Vilag.hu CUDA, a jövő technológiája?!

Párhuzamos és Grid rendszerek

OpenCL - The open standard for parallel programming of heterogeneous systems

Készítette: Trosztel Mátyás Konzulens: Hajós Gergely

OpenCL alapú eszközök verifikációja és validációja a gyakorlatban

Térbeli együttes előfordulási minták GPU-val gyorsított felismerése

Magas szintű optimalizálás

Videókártya - CUDA kompatibilitás: CUDA weboldal: Példaterületek:

GPGPU alapok. GPGPU alapok Grafikus kártyák evolúciója GPU programozás sajátosságai

Diplomamunka. Miskolci Egyetem. GPGPU technológia kriptográfiai alkalmazása. Készítette: Csikó Richárd VIJFZK mérnök informatikus

GPGPU-k és programozásuk Dezső, Sima Sándor, Szénási

Győri HPC kutatások és alkalmazások

KÉPFELDOLGOZÓ ALGORITMUSOK FEJLESZTÉSE GRAFIKUS HARDVER KÖRNYEZETBEN

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

Nemlineáris optimalizálási problémák párhuzamos megoldása grafikus processzorok felhasználásával

Hallgatói segédlet: Nvidia CUDA C programok debugolása Nvidia Optimus technológiás laptopokon. Készítette: Kovács Andor. 2011/2012 első félév

GPGPU. Architektúra esettanulmány

Kétszemélyes játékok

AliROOT szimulációk GPU alapokon

GPGPU. GPU-k felépítése. Valasek Gábor

GPU alkalmazása az ALICE eseménygenerátorában

Grafikus csővezeték 1 / 44

Információ-architektúra

Területi statisztikai elemzések

Utolsó módosítás:

Processzusok (Processes), Szálak (Threads), Kommunikáció (IPC, Inter-Process Communication)

Teljesítmény Mérés. Tóth Zsolt. Miskolci Egyetem. Tóth Zsolt (Miskolci Egyetem) Teljesítmény Mérés / 20

Matematika és Számítástudomány Tanszék

GPGPU programozás oktatása

Processzusok (Processes), Szálak (Threads), Kommunikáció (IPC, Inter-Process Communication)

Gráfalgoritmusok és hatékony adatszerkezetek szemléltetése

KÖSZÖNTJÜK HALLGATÓINKAT!

Alapismeretek. Tanmenet

Hosszú távú ipari szennyezés vizsgálata Ajkán padlás por minták segítségével

Távérzékelés, a jöv ígéretes eszköze

Alapismeretek. Tanmenet

A vizsga részei A vizsga értékelése Gyakorlat i

Flynn féle osztályozás Single Isntruction Multiple Instruction Single Data SISD SIMD Multiple Data MISD MIMD

Számítsuk ki a nyelvet! Matematika, fizika és algoritmusok a nyelvben

Egyszerű programozási tételek

INFORMATIKA. 6 évfolyamos osztály

Párhuzamos programozási platformok

Takács Árpád K+F irányok

Informatika érettségi vizsga

Alapismeretek. Tanmenet

Nemzeti Alaptanterv Informatika műveltségterület Munkaanyag március

Algoritmizálás. Horváth Gyula Szegedi Tudományegyetem Természettudományi és Informatikai Kar

KÉSŐ AVAR ÜVEGGYÖNGYÖK ÖSSZETÉTEL- VIZSGÁLATA

Párhuzamos programozási platformok

GPU-k a gravitációs hullám kutatásban

FIT-jelentés :: Telephelyi jelentés. Tanulási környezet

Mindent olyan egyszerűvé kell tenni, amennyire csak lehet, de nem egyszerűbbé.

"A tízezer mérföldes utazás is egyetlen lépéssel kezdődik."

K+F gyakornoki pozíciók a Dolphio Consultingnál. ELTE, szeptember 14.

Réz - szén nanocső kompozit mikroszerkezete és mechanikai viselkedése

Informatika el adás: Hardver

JAVASLAT A TOP-K ELEMCSERÉK KERESÉSÉRE NAGY ONLINE KÖZÖSSÉGEKBEN

Haladó Grafika EA. Inkrementális képszintézis GPU-n

I. LABOR -Mesterséges neuron

Véletlen sorozatok ellenőrzésének módszerei. dolgozat

rendszerszemlélető, adatközpontú funkcionális

SAT probléma kielégíthetőségének vizsgálata. masszív parallel. mesterséges neurális hálózat alkalmazásával

Számítógép-rendszerek fontos jellemzői (Hardver és Szoftver):

van neve lehetnek bemeneti paraméterei (argumentumai) lehet visszatérési értéke a függvényt úgy használjuk, hogy meghívjuk

Bevezetés. Többszálú, többmagos architektúrák és programozásuk Óbudai Egyetem, Neumann János Informatikai Kar

Adaptív dinamikus szegmentálás idősorok indexeléséhez

Hajder Levente 2018/2019. II. félév

A tanulmány Klaus Berberich és Srikanta Bedathur Computing n-gram Statistics in MapReduce cikkét dolgozza fel.

Mindent olyan egyszerűvé kell tenni, amennyire csak lehet, de nem egyszerűbbé. (Albert Einstein) Halmazok 1

Utolsó módosítás:

Adatszerkezetek 2. Dr. Iványi Péter

OpenCL Kovács, György

Közösség detektálás gráfokban

GPGPU ÚJ ESZKÖZÖK AZ INFORMÁCIÓBIZTONSÁG TERÜLETÉN

Számítógépek felépítése

Láncolt listák Témakörök. Lista alapfogalmak

Algoritmuselmélet 12. előadás

C++ programozási nyelv

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

efocus Content management, cikkírás referencia

Szekvenciális hálózatok és automaták

FIT-jelentés :: Szegedi Tudományegyetem 6720 Szeged, Dugonics tér 13. Fenntartói azonosító: Fenntartói jelentés. Tanulási környezet

5. Hét Sorrendi hálózatok

Valósidejű térbeli megjelenítés, másként Fehér Krisztián

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

TUDOMÁNYOS ADATBÁZISOK MA ÉS A JÖVŐBEN. X64 ALAPÚ KISZOLGÁLÓ RENDSZEREK Tudomány Adatbázisok, 1. előadás, (c) 2010

Jurek Zoltán, Tóth Gyula

Mobil technológiák és alkalmazások

CUDA haladó ismeretek

Bánsághi Anna 2014 Bánsághi Anna 1 of 33

Országgyűlés Hivatala Exadata a törvényhozásban

A LEGO Mindstorms EV3 programozása

FIT-jelentés :: KLIK Nagykanizsai Tankerülete 8800 Nagykanizsa, Eötvös tér 16. Fenntartói azonosító: Fenntartói jelentés

Véges állapotú gépek (FSM) tervezése

Rőczei Gábor Szeged, Networkshop

TÉRINFORMATIKAI ALGORITMUSOK

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Párhuzamosítás adatbáziskezelő rendszerekben

Bevezetés az informatikába

Feladat. Bemenő adatok. Bemenő adatfájlok elvárt formája. Berezvai Dániel 1. beadandó/4. feladat április 13. Például (bemenet/pelda.

Átírás:

GPU-Accelerated Collocation Pattern Discovery Térbeli együttes előfordulási minták GPU-val gyorsított felismerése Gyenes Csilla Sallai Levente Szabó Andrea Eötvös Loránd Tudományegyetem Informatikai Kar 2013. november 26.

Tartalom 1 Bevezetés Motiváció Alapfogalmak Megvalósítás 2 icpi-fa 3 GPU-CM CUDA Eredmények 4 Összefoglalás

Tartalom 1 Bevezetés Motiváció Alapfogalmak Megvalósítás 2 icpi-fa 3 GPU-CM CUDA Eredmények 4 Összefoglalás

Feladat Witold Andrzejewski, Pawel Boinski Poznan Unversity of Technology, Institute of Computing Science, Piotrowo 2, 60-965 Poznan, Poland

Motiváció Motiváció Példák:

Motiváció Motiváció Példák: Fajok, üzleti típusok POI-k (kórházak, repterek, látnivalók)

Motiváció Motiváció Példák: Fajok, üzleti típusok POI-k (kórházak, repterek, látnivalók) Viselkedésanalízis: mobiltelefon hálózatot üzemeltető cég vizsgálhatja a kapcsolatot az ügyfelek és bizonyos szolgáltatások választása között

Motiváció Motiváció Példák: Fajok, üzleti típusok POI-k (kórházak, repterek, látnivalók) Viselkedésanalízis: mobiltelefon hálózatot üzemeltető cég vizsgálhatja a kapcsolatot az ügyfelek és bizonyos szolgáltatások választása között Továbbá ökológiában, meteorológiában az együttesen előforduló természeti jelenségek vizsgálatakor

Alapfogalmak Alapfogalmak Egybefüggő minták Olyan térbeli objektumok, amelyek gyakran együtt, egymás térbeli szomszédaiként helyezkednek el.

Alapfogalmak Alapfogalmak Egybefüggő minták Olyan térbeli objektumok, amelyek gyakran együtt, egymás térbeli szomszédaiként helyezkednek el. Térbeli objektumok A térbeli objektumok definiálhatóak a tér egy adott pontbeli tuajdonságával.

Alapfogalmak Alapfogalmak Részvételi arány Az f i tulajdonság részvételi arányát a C egybefüggő mintára vonatkoztatva Pr(C, f i ), C = {f 1,, f k } jelöli. Pr(C, f i ) az f i C-beli példányainak száma osztva az összes f i tulajdonságú elemmel.

Alapfogalmak Alapfogalmak Részvételi arány Az f i tulajdonság részvételi arányát a C egybefüggő mintára vonatkoztatva Pr(C, f i ), C = {f 1,, f k } jelöli. Pr(C, f i ) az f i C-beli példányainak száma osztva az összes f i tulajdonságú elemmel. Részvételi index A részvételi indexe P i (C), egy C = {f 1,, f k } csoportnak: P i (C) = min fi CPr(C, f i ).

Megvalósítás Megvalósítás Korábban az egybefüggő mintákat felismerő algoritmusok implementálása CPU-n történt

Megvalósítás Megvalósítás Korábban az egybefüggő mintákat felismerő algoritmusok implementálása CPU-n történt Újítás a hardver támogatás kihasználása, azaz a minták a grafikus kártyán, a GPU-n történő felismerése

Megvalósítás Megvalósítás Korábban az egybefüggő mintákat felismerő algoritmusok implementálása CPU-n történt Újítás a hardver támogatás kihasználása, azaz a minták a grafikus kártyán, a GPU-n történő felismerése Erre módszer: GPU-CM algoritmus, ami az icpi-fa GPU-val gyorsított verziója

Tartalom 1 Bevezetés Motiváció Alapfogalmak Megvalósítás 2 icpi-fa 3 GPU-CM CUDA Eredmények 4 Összefoglalás

icpi-fa

icpi-fa a különböző növények eloszlására

Tartalom 1 Bevezetés Motiváció Alapfogalmak Megvalósítás 2 icpi-fa 3 GPU-CM CUDA Eredmények 4 Összefoglalás

GPU-CM algoritmus Bemenet: icpi-fa

GPU-CM algoritmus Bemenet: icpi-fa Kimenet: gyakori egybefüggő minták és gyakoriságuk

GPU-CM algoritmus Bemenet: icpi-fa Kimenet: gyakori egybefüggő minták és gyakoriságuk (a) az icpi-fa beolvasása egy hashmapbe

GPU-CM algoritmus Bemenet: icpi-fa Kimenet: gyakori egybefüggő minták és gyakoriságuk (a) az icpi-fa beolvasása egy hashmapbe (b) az egyelemű minták építése a példányokból

GPU-CM algoritmus Bemenet: icpi-fa Kimenet: gyakori egybefüggő minták és gyakoriságuk (a) az icpi-fa beolvasása egy hashmapbe (b) az egyelemű minták építése a példányokból (c) az eddigi minták kibővítése, összefűzhető minták keresése és összefűzése

GPU-CM algoritmus Bemenet: icpi-fa Kimenet: gyakori egybefüggő minták és gyakoriságuk (a) az icpi-fa beolvasása egy hashmapbe (b) az egyelemű minták építése a példányokból (c) az eddigi minták kibővítése, összefűzhető minták keresése és összefűzése (d) mintajelöltek ritkítása: azon minta jelöltek eldobása, amelyekre a gyakoriság kisebb, mint az adott küszöb

GPU-CM algoritmus Bemenet: icpi-fa Kimenet: gyakori egybefüggő minták és gyakoriságuk (a) az icpi-fa beolvasása egy hashmapbe (b) az egyelemű minták építése a példányokból (c) az eddigi minták kibővítése, összefűzhető minták keresése és összefűzése (d) mintajelöltek ritkítása: azon minta jelöltek eldobása, amelyekre a gyakoriság kisebb, mint az adott küszöb (e) mintapéldányok létrehozása

GPU-CM algoritmus Bemenet: icpi-fa Kimenet: gyakori egybefüggő minták és gyakoriságuk (a) az icpi-fa beolvasása egy hashmapbe (b) az egyelemű minták építése a példányokból (c) az eddigi minták kibővítése, összefűzhető minták keresése és összefűzése (d) mintajelöltek ritkítása: azon minta jelöltek eldobása, amelyekre a gyakoriság kisebb, mint az adott küszöb (e) mintapéldányok létrehozása (f) (c)-től újrakezdve végigiterálunk a fán

CUDA Mi a CUDA? Compute Unified Device Architecture Az NVIDIA párhuzamos architektúra modellje a saját hardvereihez. A programok a kernelek, Több példányban futnak, minden példány egy szál, A szálak blokkot alkotnak, mellyet az SMX dolgoz fel, Az SMX 32 szálanként hajtja végre a blokkot

CUDA CUDA architektúra

Eredmények Eredmények Három mérés a CPU-s és GPU-s algoritmus sebességének összehasonltására:

Tartalom 1 Bevezetés Motiváció Alapfogalmak Megvalósítás 2 icpi-fa 3 GPU-CM CUDA Eredmények 4 Összefoglalás

További lehetőségek Javaslat Probléma: jelenleg a memóriát pazarolja, akkor is tárol értékeket és végez számításokat, ha logikailag üresek az elemek. Megoldás: változó hosszú listák kezelése az algoritmusban Javaslat Probéma: a GPU memóriája korlátozott Megoldás: olyan megoldás bevezetése, ami memória korlátos környezetben is működik (partíciós együttálló minta bányászat)

További lehetőségek Javaslat Probléma: Az icpi-fa építése CPU-n zajlik Megoldás: hatékony megoldás keresése a GPU-ra való átállásra Új cél: az algoritmus hangolása, azaz elérni a maximálisan kapható gyorsulást GPU-val.

Vége Köszönjük a figyelmet!