MTA Cloud Use cases MTA Cloud workshop Hernáth Szabolcs MTA WIGNER FK
IT felhasználás dimenziói Felhasználók száma / jellege Kapacitás mérete / jellege Számítási feladat / szoftverkörnyezet Adatok mérete / jellege Elérés / rendelkezésre állás IT támogatás feladatai / költsége (Fenntarthatóság)
Speciális eset: Big Data O(10)+ PB strukturálatlan adat MapReduce programozási feladatok: sok adat skálázható, elosztott transzformálása és kiértékelése Hadoop környezet: kapacitás + szolgáltatások + fejlesztőeszközök
1. Eset: A magányos farkas(ok) Felhasználók Kapacitás Alkalmazás Adatok Elérhetőség IT támogatás 1-5 egyéni felhasználó Néhány PC, változó kihasználtsággal Néhány alkalmazás, adott környezet O(1-10) TB Ad hoc adatkezelés Változó jellegű, helyi hozzáférés Nincs, vagy minimális (változó kockázatok)
2. Eset: Mókus örs Felhasználók Kapacitás Alkalmazás Adatok Elérhetőség IT támogatás 10-15 fő kis csoport Kis klaszter: O(10) node, közepes kihasználtsággal Több alkalmazás, homogén környezet, egyszerű szolgáltatások O(10-100) TB, homogén jelleg, Egyszerű adatkezelési szolgáltatások Közepes rendelkezésre állás, gyors hozzáférés távoli elérhetőség Állandó rendszergazda feladatok, ad hoc jogosultságkezelés, jelentős biztonsági kockázatok
3. Eset: A cég Felhasználók Kapacitás Alkalmazás Adatok Elérhetőség IT támogatás O(100) felhasználó, több nagy és kis csoport szervezetben O(100) node klaszter(ek), magas kihasználtság Sok alkalmazás, változó és inhomogén környezet, sok komplex szolgáltatás O(100-1000) TB, változó és komplex adatkezelési szolgáltatások Magas SLA, távoli elérhetőség, állandó adminisztráció és sorbanállás Komolyan szervezett IT csapat, komplex jogosultságkezelés, helpdesk
4. Eset: A Birodalom Felhasználók Kapacitás Alkalmazás Adatok Elérhetőség IT támogatás O(10000) felhasználó, komplex szerveződésű közösségek O(100000) node elosztott infrastruktúrák (EGI grid, desktopgrid) O(1000) alkalmazás, sok komplex, változó, inhomogén környezet, sok komplex szolgáltatás O(10-100) PB, dedikált atakezelési infrastruktúra, sok komplex szolgáltatás Magas SLA, állandó távoli elérés, komplex adminisztráció, sorbanállás Több szervezet összehangolt munkája, komplex szolgáltatásrendszerek, kiemelt kockázatok
Skálázhatóság Ha egymillió kínai egy év alatt építi fel a Nagy Falat, akkor 365 millió kínai egy nap alatt teszi ugyanezt? A fenti modellek: eltérő problémákkal küzdenek korlátozottan fejlődőképesek nehezen átjárhatók A hagyományos modellek rosszul skálázhatók. A felhő rugalmasan skálázható!
Miért jobb a cloud? Hagyományos eset Néhány PC Kis autonóm klaszter Nagy megosztott klaszter Nagy elosztott rendszer Probléma Alacsony kapacitás, változó rendelkezésre állás és kihasználtság Közepes kapacitás, rendelkezésre állás és kihasználtság, járulékos feladatok Sok járulékos feladat, adminisztráció, sorbanállás Rengeteg járulékos feladat, bonyolult hozzáférés, sorbanállás Cloud megoldás On-demand kapacitás + magas SLA Skálázható kapacitás + magas SLA, járulékos feladatok automatizálása Járulékos ás adminisztratív feladatok automatizálása, ütemezhető kapacitás Járulékos ás adminisztratív feladatok automatizálása, egyszerű hozzáférés, ütemezhető kapacitás
Cloud felhasználói szerepkörök Nem informatikus kutató (biológus, kémikus, stb.) Kutatókat támogató informatikus Rendszergazda Mit szeretne kapni egy nem informatikus kutató? 1. Általános SaaS szolgáltatásokat (pl. biológusok és kémikusok Autodock szolgáltatást) 2. Speciális, testre szabott SaaS szolgáltatást Együttműködés informatikussal a szolgáltatás kifejlesztése érdekében Saját maga fejleszti a szolgáltatást, ha van informatikai képzettsége
Cloud felhasználói szerepkörök Intézeti informatikus: 1. Általános és speciális SaaS szolgáltatásokat fejleszt a nem informatikus kutatók számára 2. A fejlesztéshez PaaS platformot használ (pl. WS- PGRADE/gUSE) 3. Annak érdekében, hogy a PaaS platform hatékonyan működjön, a felhőben felépíti a szükséges futtató infrastruktúrát (pl. klasztert). Ilyenkor az MTA Cloud IaaS szolgáltatását használja
Konkrét példa Tfh egy biológus kutatócsoportnak több százezer molekulán kell elvégeznie a molekula dokkolási kísérletet. Több megoldási lehetőség van: 1. Hagyományos és korszerűtlen megoldás: PC beszerzés Fejlesztés Futtatás Időigény: Több hetes PC beszerzés (helyi rendszergazda) Több hónapos alkalmazásfejlesztés (informatikus) Több hónapos futtatás PC-n (biológus)
Konkrét példa 2. Korszerű, ideális megoldás: cloud AutoDock SaaS szolgáltatás a dokkolási feladatokra A kutató önállóan, informatikus segítsége nélkül dolgozhat Időigény: 1. Pár perc hozzáférési idő 2. Zéró fejlesztési idő 3. Néhány napos futásidő (a cloud SaaS-t biztosító IaaS kapacitása skálázható)
Konkrét példa 3. (köztes) Megoldási lehetőség: nincs Autodock SaaS szolgáltatás, de van PaaS fejlesztő rendszer Az informatikus fejleszti a dokkoló SaaS szolgáltatást Ehhez felhasználja a PaaS fejlesztő rendszert (pl. WS- PGRADE/gUSE). Időigény: 1. Pár perces hozzáférési idő (informatikus) - IaaS 2. Több hetes fejlesztési idő (informatikus) - PaaS 3. Több napos futásidő a felhőben (biológus) - SaaS Az így kifejlesztett SaaS szolgáltatást más MTA kutatók is használhatják
Melyik tevékenységeket hogyan támogatja a felhő? Beszerzés, azaz a kívánt infrastruktúra felállítása (IaaS): Virtuális gépek és lemezképek tárolása Virtualis gép indítása (ld. demo) Alkalmazás fejlesztés (PaaS): Pl. WS-PGRADE fejlesztő rendszer SaaS használat: Pl. WS-PGRADE end-user módú konfigurálása
Q & A Köszönöm a figyelmet! http://cloud.mta.hu