A gyógyszergyárakról. Mi a cél? A jogi környezet. Matematika a biológiában és a gyógyszerkutatásban & a webgráf



Hasonló dokumentumok
A fehérjehálózatok vizsgálatának matematikai módszereiről. ELTE Matematikai Intézet Protein Információs Technológia Csoport & URATIM Kft.

TDK lehetőségek az MTA TTK Enzimológiai Intézetben

Hogyan lesznek új gyógyszereink? Bevezetés a gyógyszerkutatásba

Tudásmenedzsment és gyógyszerinnováció

Új utak az antipszichotikus gyógyszerek fejlesztésében

Hogy keres a Google?

A PET szerepe a gyógyszerfejlesztésben. Berecz Roland DE KK Pszichiátriai Tanszék

A proteomika új tudománya és alkalmazása a rákdiagnosztikában

Felhő használata mindennapi alkalmazások futtatására. Németh Zsolt MTA SZTAKI

Hálózati folyamok. A használt fogalmak definiálása

Az internet az egész világot behálózó számítógép-hálózat.

Összefoglalás és gyakorlás

Gyógyszerkutatás és gyógyszerfejlesztés. Az új molekulától a gyógyszerig

Az Internet. avagy a hálózatok hálózata

MTA Cloud Use cases MTA Cloud workshop. Hernáth Szabolcs MTA WIGNER FK

A BIOLÓGIAI GYÓGY- SZEREK FEJLESZTÉSÉNEK FINANSZÍROZÁSA ÉS TERÁPIÁS CÉLTERÜLETEI

Szolgáltatási szint és performancia menedzsment a PerformanceVisor alkalmazással. HOUG konferencia, 2007 április 19.

A felhőről általában. Kacsuk Péter MTA SZTAKI

Miért jó nekünk kutatóknak a felhő? Kacsuk Péter MTA SZTAKI

GNTP. Személyre Szabott Orvoslás (SZO) Munkacsoport. Kérdőív Értékelő Összefoglalás

Hálózati folyamok. Tétel: A maximális folyam értéke megegyezik a minimális vágás értékével.

A párbeszéd szerepe az egészségügyi informatika oktatásában/művelésében

Társadalmi és gazdasági hálózatok modellezése

22. GRÁFOK ÁBRÁZOLÁSA

SZTE-ELTE PROTEOMIKAI INNOVÁCIÓ: KONCEPCIÓ, EREDMÉNYEK, JÖVŐKÉP

Véletlen gráfok. Backhausz Ágnes Eötvös Loránd Tudományegyetem és MTA Rényi Alfréd Matematikai Kutatóintézet december 2.

NYÍLT HOZZÁFÉRÉS ÉS INTÉZMÉNYI

Bakteriális identifikáció 16S rrns gén szekvencia alapján

Társadalmi és gazdasági hálózatok modellezése

BD Vacutainer Molekuláris Diagnosztikai termékei

Hálózatok fejlődése A hatványtörvény A preferential attachment A uniform attachment Vertex copy. SZTE Informatikai Intézet

Csima Judit BME, SZIT február 18.

Ezeket a kiemelkedı sebességő számítógépeket nevezzük szuperszámítógépeknek.

Gyógyszerbiztonság a klinikai farmakológus szemszögéből

10. Genomika 2. Microarrayek és típusaik

Az egészségpolitika alapjai: értékek, célok és eszközök október 18.

A gyógyszerészet és az egészségügyi informatika

2. Ismert térszerkezetű transzmembrán fehérjék adatbázisa: a PDBTM adatbázis. 3. A transzmembrán fehérje topológiai adatbázis, a TOPDB szerver

Bioinformatika előadás

Kvalitatív elemzésen alapuló reakciómechanizmus meghatározás

A genomikai oktatás helyzete a Debreceni Egyetemen

API-MÁGIA MILLIÓ SORNYI ADAT ÚJRARENDEZÉSE. Előadó: Jaksa Zsombor, drungli.com

Szervezetünk védelmének alapja: az immunológiai felismerés

A keringı tumor markerek klinikai alkalmazásának aktuális kérdései és irányelvei

A Barabási-Albert-féle gráfmodell

[S] v' [I] [1] Kompetitív gátlás

Humán genom variációk single nucleotide polymorphism (SNP)

ANOVA összefoglaló. Min múlik?

Web-fejlesztés NGM_IN002_1

A korszerű infokommunikációs technológia (IKT) alkalmazásával csak kis mértékben javíthatjuk az emberi agy információ tároló és feldolgozó képességét.

Leukotriénekre ható molekulák. Eggenhofer Judit OGYÉI-OGYI

Genetikai panel kialakítása a hazai tejhasznú szarvasmarha állományok hasznos élettartamának növelésére

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

MedInProt Szinergia IV. program. Szerkezetvizsgáló módszer a rendezetlen fehérjék szerkezetének és kölcsönhatásainak jellemzésére

Dr. Szűts Zoltán Facebook a felsőoktatásban?

Elkötelezettség a Kiválóságért. Közoktatási Kiválóság Mintaprojekt

Molekuláris biológiai eljárások alkalmazása a GMO analitikában és az élelmiszerbiztonság területén

Kutatói pályára felkészítı akadémiai ismeretek modul

Milyen weboldalt készítsünk?

Bioinformatika 2 10.el

Bevezetés a rendszerbiológiába

~ 1 ~ Ezek alapján a következő célokat valósítottuk meg a Ph.D. munkám során:

Elválasztástechnikai és bioinformatikai kutatások. Dr. Harangi János DE, TTK, Biokémiai Tanszék

Közösségi kommunikáció a gyakorlatban hatékony technikák és módszerek

BEVEZETÉS AZ INTERNET ÉS A WORLD WIDE WEB VILÁGÁBA. Kvaszingerné Prantner Csilla, EKF

"A tízezer mérföldes utazás is egyetlen lépéssel kezdődik."

transzláció DNS RNS Fehérje A fehérjék jelenléte nélkülözhetetlen minden sejt számára: enzimek, szerkezeti fehérjék, transzportfehérjék

TERÁPIÁBAN: VESZÉLY VAGY LEHETŐSÉG? Csupor Dezső

LEGFÉLTETTEBB INGATLANOS TITOK

1. A megyében végzett jelentősebb kutatási témák, projektek ráfordításainak ágazati megoszlása (összesen millió Ft-ról áll rendelkezésre adat):

A harkányi gyógyvízzel végzett vizsgálataink eredményei psoriasisban között. Dr. Hortobágyi Judit

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

LÉGI HIPERSPEKTRÁLIS TÁVÉRZÉKELÉSI TECHNOLÓGIA FEJLESZTÉSE PARLAGFŰVEL FERTŐZÖTT TERÜLETEK MEGHATÁROZÁSÁHOZ

április 24. INFO Savaria április 24. INFO Savaria április 24. INFO Savaria

Matematikai alapok és valószínőségszámítás. Valószínőségszámítási alapok

B17 vitamin rák ellen

SZOFTVERES SZEMLÉLTETÉS A MESTERSÉGES INTELLIGENCIA OKTATÁSÁBAN _ Jeszenszky Péter Debreceni Egyetem, Informatikai Kar jeszenszky.peter@inf.unideb.

A számítási felhő világa

Az egyetemi nyílt hozzáférésű publikációk és kiadói tevékenység tudománymetriai vizsgálata

Önszerveződő adatbázisok

Vérszérum anyagcseretermékek jellemzése kezelés alatt lévő tüdőrákos betegekben

ALKÍMIA MA Az anyagról mai szemmel, a régiek megszállottságával.

A T sejt receptor (TCR) heterodimer

Genomikai Medicina és Ritka Betegségek Intézete Semmelweis Egyetem

Étrend kiegészítők, ahogy a gyakorló gyógyszerész látja

Fejlett kereső és lekérdező eszközök egy elektronikus szakfolyóirathoz (IBVS)

Immunológia alapjai előadás Az immunológiai felismerés molekuláris összetevői. Az antigén fogalma. Antitestek, T- és B-sejt receptorok:

Immunológia alapjai. 10. előadás. Komplement rendszer

Hogyan kerülhetnének az étrend-kiegészítők az orvosok termék-palettájára?

NEPTUN ID BMENET ID. Címtár BME VPN. vcenter VPN SVN. Trac Wiki. Wifi

A számítástechnika gyakorlata WIN 2000 I. Szerver, ügyfél Protokoll NT domain, Peer to Peer Internet o WWW oftp opop3, SMTP. Webmail (levelező)

Biomassza alapú bioalkohol előállítási technológia fejlesztése metagenomikai eljárással

DR. HETÉNYI LÁSZLÓ MAGYAR GYÓGYSZERÉSZI KAMARA

(1) A T sejtek aktiválása (2) Az ön reaktív T sejtek toleranciája. α lánc. β lánc. V α. V β. C β. C α.

Molekuláris biológiai módszerek alkalmazása a biológiai környezeti kármentesítésben

Google Analytics. Miért fontos egy kisebb cég esetén is? Hogyan értsük meg a fontos összefüggéseket? Vajda Éva iwebma Analitikus Marketing

Hozzávalók keresése és csatolása

Komplex hálózatok: alapfogalmak, modellek, módszerek

Fine-Grained Network Time Synchronization using Reference Broadcast

Tények a Goji bogyóról:

Átírás:

Matematika a biológiában és a gyógyszerkutatásban és a webgráf Ördög Rafael, Bánky Dániel, Iván Gábor Juhász Péter, Szerencsi Balázs Grolmusz Vince matematikus egyetemi tanár ELTE Matematikai Intézet Protein Információs Technológia Csoport Matematika a biológiában és a gyógyszerkutatásban & a webgráf Webgráf: A WWW gráfja, a 90-es évek elején nézték komolyan (pl. Google PageRank: a fontos csúcsok meghatározása) Fehérje-fehérje interakciós gráfok: ezredfordulótól nézik széleskörően Mirıl lesz szó? A matematika alkalmazásáról a biológiában A webgráfokra kifejlesztett eljárások biológiai alkalmazásai Erdıs Webgráf Szerver Mi a cél? Szinte mindig: betegségek gyógyítása, vagy legalábbis kezelése (HIV) gyógyszeres vagy egyéb (pl. gén, vagy immunológiai (vakcinák) terápiával). A gyógyszergyárakról A magyar költségvetés 010-ben 13 x 10 1 Ft, azaz 60 milliárd USD. (a Harvard Egyetem vagyona (endowment) 7 milliárd USD) A Pfizer 008-as bevételei 48 milliárd USD, nyeresége 8 milliárd USD. Egy gyógyszermolekula kifejlesztése 1 milliárd USD, és utána még óriásit lehet bukni vele (perek, ügyvédek, kártérítések, piacról való kivonás) A gyógyszergyárak nem nagyon akarnak új gyógyszereket kifejleszteni: abból csak baj lehet. Nagyon sok döntés egy gyógyszer kifejlesztése: mindig megkérdezik: menjünk-e tovább? Sokszor rossz döntést hoznak, nem mindig megfelelıen tájékozott emberek. Pl. BCG oltás: ma nem engedélyeznék. Nagy veszély: Találunk egy jó gyógyszermolekulát -> fejlesztjük amíg tudjuk -> (el-oda) adjuk egy gyógyszergyárnak -> kizárólagosságot követel meg magának -> utána kidobja a molekulánkat, és nem lesz belıle semmi Az aszpirint kihozni más csomagolásban: kicsi, de biztos jövedelem; Új rákgyógyszerrel kijönni: kockázatos, és kicsi a piaca: a beteg vagy meggyógyul, és azért nem szedi tovább, vagy Elıny a pszichiátriai gyógyszereknél: pl. Cavinton, antidepresszánsok, neurodegenerativ betegségek ellenei szerek: sok-sok évig, naponta szedik, sokan. Az FDA és környéke, azaz az állami bürokrácia Ugye, mindenki kapott kiskorában BCG oltást? Ma ezt nem engedélyeznék, mert a HIV pozitívok komolyan megbetegedhetnek tıle, Hasonló a helyzet a penicilinnel vagy az aszpirinel is: (nem vicc) Fen-Phen and Vioxx: kivonták a forgalomból, sok milliárd $ veszteség Penicillin allergiás reakciója sokkal több embert ölt meg, mint a Vioxx, Aszpirin gyomorvérzést okozhat Furcsa világban élünk; ennek megváltoztatása nem a mi dolgunk, de azért szomorú: tízmilliók halnak meg borzasztó betegségekben évente az idióták miatt, mert nem engedélyezik a jó gyógyszereket, mert akinek valami ritka genetikai rendellenessége van, és lekvárt evett reggelire, és fáj a torka, és erıs hasmenés gyötri, annak esetleg megárthat a gyógyszer A jogi környezet Sok százmillió dolláros kártérítési perek (class action-ok) az USA-ban a gyógyszergyárak ellen; Ez hátráltatja a kutatást, nagyon drágává teszi a gyógyszerfejlesztést, jó gyógyszereket kidobnak, szomorú. Segíthet: a személyreszabott orvoslás 1

A biológiai, orvosi kutatások és a pénz Drága: sok anyag, vegyszer, több százmillió Ft-os eszközök (röntgenkrisztallográf, NMR, D gélelektroforézis, MS, szekvenátorok). Nagy munkaerıigényő Sok pénz kell hozzá, viszont nagy a kereslet is jó ötletekre és eljárásokra Bio-forradalom: vegyészek, fizikusok, matematikusok sokasága szeretne a piacból részt kapni Q és a KKKI, Enzimológiai Intézet a szomszédba költözik Izgalmas munka, ígéretes jövı. Kutatási feltételek ma Az internet miatt hihetetlenül jók; Olcsóak a számítógépek, kommunikáció Itthon is, másutt is vannak nehézségek, de a diákjaim évente többször mennek külföldi konferenciára, évente egyszerkétszer Amerikába vagy Ázsiába is Folyóiratokhoz, cikkekhez való hozzáférés igen jó (nem az ELTEnek köszönhetıen, hanem az open access-nek). II. rész: Hogyan keresünk és találunk új gyógyszermolekulákat? Miért fehérje a cél? A fehérjék egy jelentıs része enzim, (azaz katalizátor), mások segítik az enzimeket, megint mások a sejt kommunikációjában fontosak, vagy egy vázat adnak más folyamatok lezajlásának. Ha ezeket megzavarjuk, az enzimeket gátoljuk vagy mőködésüket elısegítjük, akkor befolyásoljuk a sejt mőködését. Lehet más is (sirna), errıl most ne beszéljünk. Hogyan válasszuk ki, hogy mely fehérje mőködését akarjuk befolyásolni? Olyan fontos fehérje mőködését kellene befolyásolni, amely nem jár káros mellékhatással. Pl. ha egy baktériumot akarunk kiirtani, akkor olyan bakteriális fehérjét jó megcélozni, amelyhez hasonló nincs az emberben. Ehhez: szekvenciális hasonlóságot jó megnézni (sok szó lesz errıl), illetve a funkcióját is a fehérje hálózatában, kapcsolatrendszerében. Célfehérje azonosítás Szekvenciák távolsága Fehérjék fontossága Fehérjék funkciója és kapcsolati rendszere (azaz gráfja vagy hálózata). Ezekrıl részletesen beszélünk majd. Ez sokkal jobb és egzaktabb módszer, mint a ma is sokat használt megálmodás, azaz azt a fehérjét támadják a kutatók, melyet ismerik, amivel tudnak dolgozni.

Megvan a célfehérje, hogyan használjuk? Jó lenne ha sokat tudnánk róla (3D szerkezet), lehetne termelni (beklónozni). 3D szerkezet: ez azért fontos, hogy a kismolekulákat hozzá tudjuk illeszteni Hogyan lehet ezt meghatározni? A fehérjék legnagyobb részénél (globuláris) az aminosavszekvencia meghatározza a (lényegileg egyértelmő) szerkezetet. Kiszámolni nehéz. Mivel támadjuk a fehérjét? Fehérjével nem jó: vagy immunválaszt vált ki (iv) vagy megemésztjük (orálisan). Hasonlóan sok aminosavból álló peptidekkel sem jó, ugyanezért. Kis peptidekkel vagy egyéb kismolekulákkal jó támadni a fehérjét: Az a cél, hogy a kismolekula a fehérjéhez kössön, és vagy megváltoztassa a konformációját (alakját), vagy pedig elzárja az aktív centrumát. Röntgenkrisztallográfia, NMR Honnan szerzünk kismolekulákat? Virtuális screening Kismolekula könyvtár fehérjeszerkezet dokkolóprogram kiértékelés Egy kismolekula leszállítva kb. 100. 1 millió kismolekula 100 millió. Ezeket ellenırizni kell (hogy tényleg azok-e), esetleg tisztítani, tárolni. Utána kidolgozni a mérést, és mind az egymilliót megmérni a fehérjével: ehhez elég sok fehérje kell. Vagy: virtuálisan keresünk jó fehérje-kismolekula párt. Kismolekula könyvtár A ZINC. Vegyületgyártók katalógusaiból összeállítva. 13 millió megvásárolható vegyület, dokkolásra kész 3D szerkezete, beszerzési információval. Dokkolóprogram Több dokkolóprogram kapható vagy letölthetı. A matematikai feladat megfogalmazása diszkrét-folytonos megoldások Saját Fregatt programunk, amivel már sok gyógyszerjelölt molekulát találtunk 3

Listák Sok jó találat legjobbak szőrése megrendelése laboratóriumi kipróbálása Ez már kivitelezhetı: 100 molekula 10 000, ez már kezelhetı. Wet-lab tesztek: kötés gátlás biológiai hatás sejttenyészet biológiai hatás állatkísérletek ADMET (absorption, distribution, metabolism, excretion, toxicology) Klinikai vizsgálatok I. II. III. Engedélyezés Néhány vélemény szerint: A jelenlegi egy-egy fehérjét vagy egy receptort tekintı vagy támadó terápiás eljárásokból túl sok új eredményt nem lehet kihozni. Sok betegség komplex, sok biokémiai folyamatot érint, sok fehérjével van kapcsolatban. Pl. depresszió: nem felelıs érte egyetlen fehérje. Molekuláris mechanizmus nincs felderítve, molekuláris marker sincs. Több fehérje együttes hatását kell nézni! Rendszerbiológia, Proteomika, (metabolomika, genomika, stb.) Proteomikai technikák széles körő elterjedése Hatalmas mennyiségő mérési adat és fehérjehálózat Az eredmények kézzel, ránézéssel nem értékelhetık ki Gyors, hibatőrı, biológiailag verifikált kiértékelési eljárásokra van szükség Itt és most nagy hálózatokban a fontos csúcsok megtalálására szeretnénk koncentrálni. Egy csúcs lehet fontos: 1. önmagában, a teljes hálózatban,. vagy néhány más csúcshoz képest A. típusú kérdés a biológiában például proteomikai mérések kiértékelésénél merül fel: Ha néhány fehérje koncentrációja megváltozik egy folyamatban, akkor szeretnénk tudni, hogy mely más fehérjék vannak ezekkel szoros kapcsolatban. Ha nem a saját méréseinket használjuk, hol találunk fehérjehálózatokat? MINT (UniRoma): 11 957 él, 9 587 fehérje, csak kisérleti DIP (UCLA): 57 683 él, 0 78 fehérje HPRD (Johns Hopkins): 38 806 él, 7 801 fehérje, humán IntAct (EMBL-EBI): 195 719 él, 59 017 fehérje KEGG (Kyoto Univ.) metabolikus hálózatok Generált hálózatok: nascent.pitgroup.org, nem csak modell organizmusokra 4

Milyen hálózatokat tekintünk? Fizikai interakciós hálózatok: Csúcsok: fehérjék, élek: két fehérje éllel van összekötve, ha köztük interakció van: mért {TAP, YH, ko-immunoprecitipáció vagy egyéb}, jósolt Irányítatlan gráfok: Metabolikus hálózatokat: Milyen hálózatokat tekintünk? Csúcsok: reakciók, élek az A-ból B-be: ha van az A reakciónak olyan terméke, amelyet a B használ fel. A B Az éleket lehet a fluxussal is címkézni. Példa: Az Mtb mikolsav pathway-e Diverzió: Hogy mőködik egy webkeresı? Letöltés (robot, crawler) Tárolás Indexezés Inverz indexezés De: kell, hogy a több milliárd weboldal közül a többmillió találatból a találati lista elején a FONTOS találatok legyenek. Web-gráf: csúcsok: a web oldalai élek: A B, ha az A oldal hivatkozik B-re; DEF : Fontos oldal azaz fontos csúcs: amelyre sok fontos csúcs hivatkozik... DEF 1:Fontos oldal azaz fontos csúcs: amelyre sokan hivatkoznak,azaz magas a be-foka: Sok alkalmazás; scientometria: hivatkozások száma, impakt faktor be-fok=4 hátránya: nem veszi figyelembe a hivatkozók minıségét, ezért befolyásolható Mint definíció, ez így persze rossz. De könnyen lehet egy iteratív algoritmust csinálni belıle: az elején mindenkinek adok egy egységnyi fontosságot, aztán ezt (pongyolán fogalmazva) a csúcsok átörökítik azokra a csúcsokra, akikre mutatnak, és ezt ismételjük, amíg egy stabilizálódott határ-eloszláshoz nem jutunk (ez legtöbbször létezik). Könnyen, gyorsan számolható, általában gyorsan konvergál. Ennek az eljárásnak a hibatőrését és robusztusságát lehet egy új ötlettel növelni. Ezt véletlen bolyongással lehet jól elmondani. 5

Elindítunk egy sétáló embert a gráfon: ha egy csúcsba ér, akkor egyenletes valószínőséggel valamely kimenı élen megy tovább, vagy egy c valószínőséggel teleportál, egy véletlenül kiválasztott csúcsba: Pl. c=0. 8/50 Egy csúcs fontossága az a valószínőség, amellyel ott tartózkodunk (pontosabban a határeloszlás) Irányítatlan gráfokban (ilyenek a fizikai interakciókat leíró gráfok) a PageRang nagyjából arányos a fokszámmal, azaz felesleges használni. De! Metabolikus gráfokban érdemes, hiszen azok irányítottak; sıt, a fluxust is figyelembe lehet venni: az élválasztási valószínőségeket lehet vele súlyozni. Igaz: A nagy befokú csúcsok PageRangja átlagosan nagy. Tehát hub-okra nagy értéket ad a PageRang általában. Érdemes nézni azt is, hogy mely csúcsok kapnak a be-fokuknál nagyobb/kisebb PageRangot. Példa: Az Mtb mikolsav-szintézis gráfja Relativ PageRank PageRank irányítatlan gráfban kb. arányos a csúcsok fokszámával. Nézzük a PageRank(v)/deg(v) hányadost Ez irányítatlan gráfban megközelítıleg konstans minden csúcsra. Nagy értéke a gráf belsı tulajdonságaitól függ, és független a hub tulajdonságtól! A hányados a mikolsav útvonalra: Más fajok más hálózataira: Node ID inha fabh kasb kasa UNK1 fabd pks13 fas accd5,accd4,acca3 acps fas PageRank scaled 13.0 14.7 11.8 14.1 33. 7.7 7.6 1.4 3.3 3.3 In-Degree 1 3 8 4 9 9 PageRank/In-Degree 13.0 7.3 5.9 4.7 4. 3.9 3.8 3.1.6.6 Mycobacterium tuberculosis, Plasmodium falciparum and MRSA Staphylococcus aureus-ban is nagyon sok olyan kisfokú (nem-hub) fehérjét találtunk magas PageRank/degree hányadossal, amelyek bizonyítottan jó célpontok. Persze sok olyat is, amelyekrıl ez nem ismert lehetséges új célpontok. 6

PageRang másik relativizált változata: a perszonalizált PageRang 1-(c+d) vsz. c vsz-el teleportál egyenletesen; d vsz-el a kiválasztott csúcsokba Azért nevezték perszonalizáltnak, mert a web egyes felhasználóinak személyes érdeklıdését is figyelembe lehet venni a csúcsok fontosságának kiszámolásánál. A perszonalizált PageRank néhány tulajdonsága: A biológiai hálózatok jelenlegi méreteire könnyen, gyorsan számolható; hibatőrı, Jól használható irányítatlan, fizikai interakciós hálózatokra is óriási hálózatokra (kb. 100 millió csúcstól) jó közelítı algoritmusok vannak a gyors kiszámítására is (így pl. www, vagy az agy hálózatára is használható {Fogaras, Rácz}). Miért hangsúlyozzuk a kiértékelı módszer hibatőrését? Proteomikai mérések erısen laborfüggı eredményeket szolgálatnak gyakran; Pl. 006-ban a Nature ugyanazon számában jelent meg Gavin et al. és Krogan et al. két cikke az élesztı (S. cerevisiae) teljes interaktómjáról; nagy (40% feletti) különbségek voltak a két csoport eredményei között. Értelmes kiértékeléshez jelentısen hibatőrı eljárások kellenek, különben értéktelen eredményeket kapunk. Alkalmazás proteomikai adatok analízisére Forgber et al (PlosOne 009. ápr.) melanoma páciensek vérszérumában az alábbi fehérjék megnövekedett szintjét találta: Enolase 1: P06733 Calumenin: O4385 HSP70 protein B: P08107,4-dienoyl-CoA reductase: Q9NUI1 Aldolase A: P04075 Fumarate hydratase: P07954 Aldose reductase: P1511 HSP70 protein 9B: Q96EY1 Aconitase : P1399 hnrnp1: P6599 VCP: P5507 LDH H: P07195 LAP3: Q944P7 UniProt accession numbers A perszonalizált PageRang biológiai alkalmazásai - Tekintettük a HPRD-ben megtalálható humán interaktomot (38 806 él, 7 801 fehérje); perszonalizáltunk az elızı oldalon látható mérési eredményekre megnéztük a legnagyobb perszonalizált PageRang-ú csúcsokat: 7

Az Erdıs Webgráf Szerver A www gráfja: csúcsok weboldalak, az X csúcsból irányított él mutat az Y csúcsba, ha az X oldal (hiper)hivatkozik az Y oldalra. Ez a webgráf. Példa: kp.elte.hu hivatkozik a webgraph.org-ra, akkor kp.elte.hu web-graph.org 356 csúcs, 13694 él, sugarú környezet Sokan és sokat vizsgálták: Google PageRank Hasonló oldalak (SimRank, ko-citáció) Power-law, small world, scale free networks, stb. Intézetünkben sokan foglalkoznak nagy gráfokkal (LEMON projekt, Nagy Hálózatok Kutatócsoport). Kerestünk, és nem találtunk rendszeresen frissített, fenntartott webgraph oldalt. Májusban indult: web-graph.org címen. Erdıs Pál (1913-1996) Minden idık egyik legismertebb magyar matematikusa, az Erdıs-Rényi véletlen gráfmodell egyik létrehozója. 15 éve hunyt el. Cél: használható mérető, rendszeresen frissített webgráf létrehozása Élek domének közt Így pár százmillió csúcsnál nem lesz több. Nehézségek: A web letöltése nagy (URL-ek száma 10 1 ), és minden URL-t meg kell nézni elıbb-utóbb Adatbázis: Egyetlen webcrawler egy sztenderd MySQL adatbázist másfél nap alatt telít, utána használhatatlan a rendszer; (jelenleg 50-100 webcrawlerünk fut) Nagyon sok jó ötlet kell; URL-ek sztenderdizálása: http://उद हरण.पर / http://παράδειγµα.δοκιµή/ /דוגמה.טעסט//: http /موقع.وزارة-الاتصالات.مصر//: http http://www. 中 中 中 中. 中 中.cn 8

További nehézségek: Dinamikus URL-ek; maps.google.hu 9,000,000 URL, cba.hu 6,000,000 rossz URL Analízis: Power law Rossz URL-ek, 16 proceszoros gépünket fagyasztotta le az alábbi URL: Pl. dobd.hu-n van 1000 aldomén pl. http://w503.dobd.hu és ezek mindegyikébıl legalább 100 link megy ki. Statisztika Time 011-07-01 15:59:45 URLs 144,116,89 Domains 1,63407 Edges 14,039,186 Napi URL kapacitás: május: 1 millió/nap ma: 3,3 millió/nap 60-80 crawler fut..hu,.eu domain Köszönöm a figyelmet! 9