CancerGrid - Grid alkalmazása rákellenes hatóanyagok keresésének felgyorsítására



Hasonló dokumentumok
Felhő rendszerek és felhő föderációk. Kacsuk Péter MTA SZTAKI

WEB2GRID: Desktop Grid a Web 2.0 szolgálatában

Szuperszámítógépes teljesítmény szuperszámítógép nélkül A BinSYS Projekt

FEM 2.5-D EGY GEOFIZIKAI RENDSZER MEGVALÓSÍTÁSA A GRID-

Enabling Grids for E-sciencE. Grid bevezető INFSO-RI

Példa: LHC, CERN, Genf Enabling Grids for E-sciencE

Katona János SZIE Ybl Miklós Műszaki Főiskola, Budapest Ábrázolás és Számítástechnika Tanszék

Operációs rendszerek MINB240 V2+2+0

Dél dunántúli Régió innovációs potenciálja és a kistérségek lehetőségei

Miért jó nekünk kutatóknak a felhő? Kacsuk Péter MTA SZTAKI

Az Európai Bizottság mellett működő ESF (European Science Foundation) a. kilencvenes évek közepe óta támogatja és szervezi a European Social Survey

alkalmazásfejlesztő környezete

Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time)

Operációs rendszerek MINB240 V kredit KF Nagyváradi Anett 0. előadás Bevezetés

Taszkok ütemezése desktop-griden

A felhőről általában. Kacsuk Péter MTA SZTAKI

A WEB2GRID kutatás-fejlesztési projekt eredményei

MVC Java EE Java EE Kliensek JavaBeanek Java EE komponensek Web-alkalmazások Fejlesztői környezet. Java Web technológiák

Integrált téradatbázis alapú városirányítási rendszerek

Supporting scientific and Web 2.0 communities by desktop grids P. Kacsuk MTA SZTAKI (Univ. of Westminster)

A CONFLET RENDSZER ÚJ ARCHITEKTÚRÁJA. Pasztuhov Dániel, Dr. Szeberényi Imre, BME IIT

Book Template Title. Author Last Name, Author First Name

Fejlesztés, működtetés, felügyelet Hatékony infrastruktúra IBM szoftverekkel

TÁVOKTATÁSI TANANYAGOK FEJLESZTÉSÉNEK MÓDSZERTANI KÉRDÉSEI

Miért ASP.NET? Egyszerű webes alkalmazás fejlesztése. Történet ASP ASP.NET. Működés. Készítette: Simon Nándor

A szabad szoftverek alkalmazási lehetősége a közigazgatásban

Az IBM WebSphere Multichannel Bank Transformation Toolkit V7.1 felgyorsítja a többcsatornás alkalmazásfejlesztést

Operációs rendszerek. A Windows NT felépítése

A licensztől a megoldásig

DSD DSD. Egy országos méretű orvosi adatbázissal kapcsolatos informatikai kihívások. Kovács László Pataki Balázs Pataki Máté MTA SZTAKI DSD

Bioinformatikai és orvosbiológiai Grid alkalmazások az Egyesült Királyságban

SZTAKI Desktop Grid. l számára. MTA SZTAKI

Összegzés és hogyan tovább

MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

! $ $ % &" " '(!" # )( & $ * "$+," *-. &'#0$(0*" &! # & 0$ $-!#& "! "$ "( ). $ *"*/! $ * *"!%.$ :;!<7= $ # ( / /!. /! # *!!$ * -.+ "&**! $.

Az európai kutatás nyílt hozzáférését biztosító infrastruktúra. Karácsony Gyöngyi Debreceni Egyetem Egyetemi és Nemzeti Könyvtár

Alkalmazások teljesítmény problémáinak megszűntetése

Enabling Grids for E-sciencE. EGEE köztesréteg. Adat szolgáltatások a glite-ban. INFSO-RI

Az MTA Cloud a tudományos alkalmazások támogatására. Kacsuk Péter MTA SZTAKI

Osztott alkalmazások fejlesztési technológiái Áttekintés

Új generációs közösségi WEB szolgáltatások és alkalmazások támogatása GRID platformmal

BAKERY 1.0 Sütőipari vállalatirányítási rendszer

P-GRADE fejlesztőkörnyezet és Jini alapú GRID integrálása PVM programok végrehajtásához. Rendszerterv. Sipos Gergely

Web2Grid: Desktop Grid a Web 2.0 szolgálatában

Információs szupersztráda Informatika. Hálózatok. Információ- és tudásipar Globalizáció

Horizont 2020 Regionális Információs Nap Miskolc

Az Európai Unió kutatáspolitikájának új irányai

GUSE BEMUTATÓ. Az MTA CLOUD felhasználói számára készült guse bemutató v2.0. MTA Cloud csapat

MTA SZTAKI - A Grid fejlesztők és felhasználók szolgálatában

BI modul a lízing üzletágban márc. 21. Előadó: Salamon András

Excel ODBC-ADO API. Tevékenységpontok: - DBMS telepítés. - ODBC driver telepítése. - DSN létrehozatala. -Excel-ben ADO bevonása

Robotot vezérlő szoftverek fejlesztése Developing robot controller softwares

SQL Server High Availability. Bevezetés az SQL Server magas rendelkezésre állási megoldásaiba

HP-SEE. Rőczei Gábor NIIF Intézet

Gyakorlati tudnivalók nyertes pályázó és bíráló szemszögéből Prof. Dr. Dinnyés András,

III. "JÖVŐ INTERNET" TECHNOLÓGIÁK: ELOSZTOTT ÉS FELHŐ SZOLGÁLTATÁSOK, TÁRGYAK INTERNETE DR. SIMON GYULA

A Java EE 5 plattform

escience Regionális Egyetemi sközpont

8. osztály. Felhasznált tankönyv: Pedellus Tankönyvkiadó, Debrecen, 2009; 2009

Az alapellátás informatikájának fejlesztése az SH/8/1 projektben

Bevezetés az informatikába

Interreg IVC tapasztalatok és a DIFASS projekt eredményei. Németh Róbert Pannon Gazdasági Hálózat Egyesület

VirtualBox, Debian telepítés

Ficsor Lajos Általános Informatikai Tanszék Miskolci Egyetem

Informatikai Tesztek Katalógus

Az RMKI Grid-rendszere

Párhuzamos és Grid rendszerek. Hol tartunk? Klaszter. Megismerkedtünk az alapfogalmakkal,

Adatbányászat és Perszonalizáció architektúra

A Polycom RealPresence Group Series készülékek és tartozékok szoftverének és opcióinak telepítése. Áttekintés

Zalaegerszeg, Innotech konferencia

A szolgáltatásmenedzsment nemzetközi szabványa magyarul

ALKALMAZÁS MONITOROZÁS A MERCURY MONITORRAL A CLUSTERGRID INFRASTRUKTÚRÁN. Gombás Gábor, gombasg@sztaki.hu MTA SZTAKI

A Digitális Kulturális Örökség Megőrzésének Menetrendje

IBM Tivoli Endpoint Manager

Autodesk térképészeti és térinformatikai megoldásai az Önkormányzatok és Kistérségek számára

TÁJÉKOZTATÓ. Budapest-Csepel Önkormányzata aktuális pályázati lehetőségeiről ALPOLGÁRMESTER. Előterjesztő: Orosz Ferenc Alpolgármester

Párhuzamosított módszerek rácsos tartók geometriai érzékenységének vizsgálatára

Hogyan teszi lehetővé az informatika a globalizálódást?

Fábián Zoltán Hálózatok elmélet

OPERÁCIÓS RENDSZEREK II GYAKORLAT

TP-LINK Business Wireless Az EAP Kontrolleres Wi-Fi termékcsalád bemutatása - bevezető SMB Product Line

A Jövő Internet Nemzeti Kutatási Program és eredményei

A számítógépes termeléstervezés alapjai. Fundamentals of Production Information Engineering. Felsőfokú műszaki végzettség

SAS Enterprise BI Server

A fehérjék térszerkezetének jóslása (Szilágyi András, MTA Enzimológiai Intézete)

Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time)

Fejlesztési tapasztalatok multifunkciós tananyagok előállításával kapcsolatban Nagy Sándor

Az üzleti igények átültetése a gyakorlatba eszköz és módszertan: - ARIS és WebSphere megoldások együttes használata a folyamatmendzsmentben -

Adminisztratív, jogi és pénzügyi kérdések a H2020 pályázatok kapcsán

Kitöltési útmutató a MEC pályázati űrlaphoz

03. AZ F-SECURE POLICY MANAGER TELEPÍTÉSI LÉPÉSEI

Üzleti kritikus alkalmazások Novell Open Enterprise Serveren

Fejlesztői szemmel at K

Campus6 projekt megbeszélés Mohácsi János

1. Gyakorlat: Telepítés: Windows Server 2008 R2 Enterprise, Core, Windows 7

Mobil készülékek programozása

A USER Kft - mint Open Text partner - bemutatása

JAVA webes alkalmazások

Intelligens közlekedés: a járműipar és járműirányítás IKT igényei, a VehicleICT projekt. Lengyel László lengyel@aut.bme.hu

Interaktív webes térképezés GRASS GIS 7-tel. A Web Processing Service bemutatása

Átírás:

CancerGrid - Grid alkalmazása rákellenes hatóanyagok keresésének felgyorsítására Kovács József smith@sztaki.hu MTA SZTAKI Networkshop, Debrecen 2010

Tartalom A CancerGrid projekt Főbb adatai/célja Rövid vegyészeti háttere Számítási alkalmazások / algoritmusok Összetett alkalmazások SZTAKI Desktop Grid guse portál CancerGrid infrastruktúra

A CancerGrid projekt Alapadatok Cím EU Framework Program 6 (FP-6, 2006-2010) Life sciences, genomics and biotechnology for health FP6-2005-LIFESCTHTALTH-7 Proposal No.: 37559 Grid Aided Computer System For Rapid Anti-Cancer Drug Design Projekt időtartam 2007 Január 1, 2010 Június 31 Költségvetés Teljes: 3,847,425 EUR Támogatás: 2,804,075 EUR Elérhetőség www.cancergrid.eu

A CancerGrid konzorcium TargetEx, Inc., Hungary (coordinator) [chemistry] AMRI Hungary, Inc., Hungary [chemistry] Inte:Ligand, Austria [chemoinformatics] Tallinn University of Technology, Estonia [chemoinformatics] University of Helsinki, Finland [biotechnology] GKI Economic Research, Hungary [economics] SZTAKI, Hungary [computer science] University of Jerusalem, Israel [chemoinformatics] DAC, Italy [biotechnology] University of Bari, Italy [chemistry] University of Pompeu Fabra, Spain [chemoinformatics]

A CancerGrid projekt fő céljai 1. fókuszált, rákellenes molekulákat nagy eséllyel tartalmazó kémiai könyvtárak kifejlesztése, 2. a betegséggel összefüggő citotoxicitás előrejelzésére alkalmas modellek kialakítása, a kináz/hdac/mmp és egyéb enzim inhibíciós folyamatok és receptor antagonizmusok modellezése a HTS eredmények felhasználásával, illetve 3. olyan Grid-technológián alapuló számítógépes rendszer kifejlesztése, amelynek segítségével felgyorsítható és automatizálható a gyógyszertervezés in silico fázisa. Ez a rendszer remélhetőleg alkalmas lesz más célfehérjemolekulákra épülő gyógyszerkutatási projektek kémiai könyvtártervezésének felgyorsítására is.

Gyógyszerkutatás

Molekulatervezés Struktúra Tulajdonság N N O N N OH Tulajdonság-becslés Struktúratervezés Biológiai IC 50; LD 50 Fizikokémai logp; pk a ; TPSA Kémiai LogK; % yield

Kvantitatív szerkezet-hatás összefüggések QSAR (Quantitative Structure-Activity Relationship) módszer, szerves vegyületek, gyógyszermolekulák kémiai szerkezete és biológiai, toxikológiai vagy farmakológiai hatásai közötti kvantitatív összefüggéseket vizsgálja és lehetővé teszi egy szerkezetileg rokon molekula hatékonyságának matematikai és statisztikai módszerekkel való előrejelzését. A molekulák biológiai hatékonyságát assay-kel (biológiai próbákkal) mérik amelyekben meghatározzák a gátlási szintet bizonyos jeltovábbítási vagy metabolikus folyamatokban. A gyógyszerkutatásban gyakran használnak QSAR módszereket olyan szerkezetek azonosításához amelyeknek jó gátló hatásuk van bizonyos specifikus biológiai célpontokon viszont alacsony a toxicitásuk (nem-specifikus aktivitásuk). A 3D-QSAR három dimenziós szerkezet-hatás összefüggések vizsgálatával foglalkozik. Ilyenkor a molekulák 3D szerkezetét (konformációját) vizsgálják. Forrás: hu.wikipedia.org/wiki/kvantitatív_szerkezet-hatás_összefüggések

QSAR modellépítés és tulajdonság-becslés O OH Mért tulajdonság adatok (IC 50, LD 50, logp, stb.) N N N N O OH 2D-3D struktúra konvertálás (molekula mechanika) QSAR modell építése (BMLR, PLS, PCR, ANN) Becslési algoritmus 3D struktúra optimalizálása (kvantumkémia) Molekuláris deszkriptorok számítása Becsült tulajdonság adatok (IC 50, LD 50, logp, stb.)

A deszkriptor osztályok áttekintése Kvantumkémiai Számítás időigénye Topológiai Geometriai Elektrosztatikai Konstitúciós Információ tartalom

Alkalmazások CancerGrid-ben A projekt infrastruktúrájában jelenleg elérhető biokémiai alkalmazások Cmol3d 2D/3D molekula konverter Konformer generátor és kiválasztó algoritmus Mopac (quantum chemical calculation software) Qvantum kémiai számításokat végző eszköz MDC (molecule descriptor calculation) Deszkriptor számoló eszköz (Codessa programcsaládból) Fmt (matrix forming application) Deszkriptor mátrix készítő eszköz MDA (model building and prediction) QSAR model készítő eszköz

Segéd alkalmazások A projekt infrastruktúrájában jelenleg elérhető egyéb kiegészítő eszközök: File konverterek XML SD XML XML MOL MOL PROP DESC Adatbázis beszúró/kiolvasó eszközök DBread molekula property deszkriptor DBwrite konformer deszkriptor model deszkriptor

Összetett alkalmazások (workflowk) a CancerGrid projektben Deszkriptor számítás Tulajdonság előrejelzés Model építés Virtual Screening

Desktop Grid, mint végrehajtó rendszer Cél: szabad erőforrások kihasználása

SZTAKI Desktop Grid: BOINC projekt http://szdg.lpds.sztaki.hu/szdg

SZTAKI Desktop Grid: BOINC kiterjesztések SZTAKI Desktop Grid egy BOINC alapú rendszer kiegészítése különböző fejlesztési irányokba: BOINC server debian csomagolása Alkalmazás programozói interfész: DC-API Integráció különböző job menedzserekkel: pl.: Condor Különböző nem DG típusú alkalmazások támogatása: pl.: Java, MPI BOINC projektek teljesítményének egyesítése: hierarhikus DG-k Alkalmazások portolásának könnyítése: genwrapper Biztonsági fejlesztések: jogosítványok bevezetése, sandboxing Feladat (job) generálás könnyítése: 3GBridge Többségük letölthető a www.desktopgrid.hu címről, a többi fejlesztés alatti, kérhető innen desktopgrid@lpds.sztaki.hu

Alkalmazás a DesktopGriden Speciális előkészületet igényel, a BOINC API-t kell használnia Fájlkezeléshez Indítás után Init(), minden kilépési pontnál finish() függvények Eseményfigyelés állapotlementéshez Alkalmazás csak egy binárisból állhat, nem indíthat továbbiakat BOINC kliens Alkalmazás

Alkalmazás a DG-en GenWrapper-el alkalmazás fejlesztőnek nem kell ismernie a BOINC alkalmazások fejlesztési metodológiáját meglévő szekvenciális alkalmazásokat módosítás nélkül tudja futtatni egy shell szkript segítségével az alkalmazás több binárisból is állhat, egy bináris indíthat másikat is Főbb technikai paraméterek: Cross-platform: Windows, Linux, Mac OS X Flexibilis: POSIX Shell környezetet biztosít beépítve tartalmazza az összes főbb UNIX shell parancsot (pl.: sed, grep, awk, unzip, gzip, tar) Alkalmazások indítása shell szkripből történik Indítás előtt/ után tetszőleges előkészítő/ takarító függvények lehetnek olyan alkalmazást is be tudunk így illeszteni, amely forrásához nem ferünk hozzá BOINC kliens GenWrapper Szkript myprg $* Alkalmazás

Workflowk a guse/ws-pgrade rendszerben Külön alkalmazás-logika és adat Cross & dot product adatpárosítás 50 20 40 Generátor komponens: 1 inputból sok output készítése Kollektor components: sok inputból 1 output készítése Bármely komponens lehet generátor v. kollektor. Feltételes végrehajtás Beágyazás Rekurzió 1000 5000 5000 1 40 1 7042 tasks

guse Aciklikus workflow Feladat dedikált gépre Feladat glite VO-ba Feladat Globus 2 VO-ba Feladat Globus 4 VO-ba Feladat Desktop Grid-be Web service hívás Adatbázis manipuláció (R / W) File kliens gépről File GridFTP-ről File LFC katalógusból Szöveg Adatbázis lekérdezés eredménye

Portál DG jobs Local jobs workflowk kezelése 3G Bridge Job 1 Job 2 Job N Local Resource molekulák vizsgálata BOINC server WU 1 WU 2 WU N Portal Storage BOINC client GenWrapper for batch execution WU X Legacy WU Y Application Legacy Application Portál és DesktopGrid szerver molecule database DG kliensek a partnerektől Molekulaadatbázis szerver

A CancerGrid portál kezelőfelülete Workflow futtatás Workflow fejlesztés& konfiguráció Algoritmusok konfiguráció A CancerGrid portal által integrált komponensek Molekula adatbázis böngésző Struktúra megjelenítő

Molekula adatbázis kezelő felület

Példányosítás

Workflow konfiguráció

Workflowk listája

Job példány állapot (Részletes nézet)

guse alkalmazás monitor

Kliens monitor

A rendszer számokban Statisztika kb. 70 gép van csatlakoztatva a rendszerhez kliensként, új gépek beállítása az útóbbi időszakban folyamatos Mindössze 1 központi szerver, amelyet üzemeltetni kell (a kliensek nem igényelnek felügyeletet!) 13 algoritmus került beépítésre 4 workflow elérhető a rendszerben jelenleg 5-6 konzorciumi partner használta ezidáig különböző célokra Teljesítmény Pl. deszkriptor számítás 30.000 vegyületre (10 konformerrel) mindössze 5 nap alatt (ez a következő algoritmusok futását jelenti: CMOL3D, MOPAC és MDC). 1 PC-vel ez kb. 1 évig tartana Megjegyzés: Vannak gyorsabb algoritmusok, de a jelenleg használt számításintenzív algoritmusok sokkal hatékonyabban használják ki a Grid-et. A konformerek csökkentésével és a gépek növelésével a teljesítmény könnyen akár 100-szorosára is nőhet, azaz lehetőség van milliós számú molekulák 1 hét alatti feldolgozására. Jelenleg ez az irány

Konklúzió A CancerGrid projektben kifejlesztésre került egy zárt desktopgrid rendszer, melyet egy portálon keresztül hajtunk meg összetett alkalmazásokkal Tehát elkészült egy keretrendszer mely áll egy böngészőből elérhető portálból egy hozzáillesztett desktop grid szerverből alkalmazások desktop grides integrációját segítő eszközökből A keretrendszert a konzorciumi tagok segítségével kiegészítettük alkalmazásokkal/algoritmusokkal erőforrásokkal összetett (workflow) alkalmazásokkal tetszőleges kezelő felülettel Maga a keretrendszer tetszőleges igényekre szabható

További technikai információk a desktopgrid@lpds.sztaki.hu címen vagy a www.desktopgrid.hu oldalon Acknowledgement: CancerGrid EU FP6 project (FP6-2005-LIFESCTHTALTH-7) http://www.cancergrid.eu