Rendezetlen fehérjék kölcsönhatásainak vizsgálata: elmélet, predikciók és alkalmazások

Hasonló dokumentumok
TDK lehetőségek az MTA TTK Enzimológiai Intézetben

2. Ismert térszerkezetű transzmembrán fehérjék adatbázisa: a PDBTM adatbázis. 3. A transzmembrán fehérje topológiai adatbázis, a TOPDB szerver

Beszámoló a K OTKA Project keretében végzett munkáról. Szinopszis:

MedInProt Szinergia IV. program. Szerkezetvizsgáló módszer a rendezetlen fehérjék szerkezetének és kölcsönhatásainak jellemzésére

Bioinformatika 2 6. előadás

Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis

1. A megyében végzett jelentősebb kutatási témák, projektek ráfordításainak ágazati megoszlása (összesen millió Ft-ról áll rendelkezésre adat):

Hálózati modellek alkalmazása a molekuláris biológia néhány problémájára. Doktori (PhD) értekezés tézisei. Ágoston Vilmos

A fehérjék térszerkezetének jóslása (Szilágyi András, MTA Enzimológiai Intézete)

Miben különbözünk az egértől? Szabályozás a molekuláris biológiában

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Szekvenciaelemzés. Cserző Miklós 2017

A fehérjék térszerkezetének jóslása

A fehérjék szerkezeti hierarchiája. Fehérje-szerkezetek! Klasszikus szerkezet-funkció paradigma. szekvencia. funkció. szerkezet! Myoglobin.

Mai témák. Fehérjék dinamikájának jelentősége. Számítógépes modellezés jelentősége

GNTP. Személyre Szabott Orvoslás (SZO) Munkacsoport. Kérdőív Értékelő Összefoglalás

Célkitűzés/témák Fehérje-ligandum kölcsönhatások és a kötődés termodinamikai jellemzése

8. A fehérjék térszerkezetének jóslása

Hogyan lesznek új gyógyszereink? Bevezetés a gyógyszerkutatásba

Bioinformatika és genomanalízis az orvostudományban. Biológiai adatbázisok. Cserző Miklós 2018

FEHÉRJÉK A MÁGNESEKBEN. Bodor Andrea ELTE, Szerkezeti Kémiai és Biológiai Laboratórium. Alkímia Ma, Budapest,

Bioinformatika előadás

Genomadatbázisok Ld. Entrez Genome: Összes ismert genom, hierarchikus szervezésben (kromoszóma, térképek, gének, stb.)

A proteomika új tudománya és alkalmazása a rákdiagnosztikában

Elválasztástechnikai és bioinformatikai kutatások. Dr. Harangi János DE, TTK, Biokémiai Tanszék

Cserző Miklós Bioinformatika és genomanalízis az orvostudományban. Integrált biológiai adatbázisok

Molekuláris dinamika I. 10. előadás

Szoftver-mérés. Szoftver metrikák. Szoftver mérés

ALKÍMIA MA Az anyagról mai szemmel, a régiek megszállottságával.

IK Algoritmusok és Alkalmazásaik Tsz, TTK Operációkutatás Tsz. A LEMON C++ gráf optimalizálási könyvtár használata

Orvosi Genomtudomány 2014 Medical Genomics Április 8 Május 22 8th April 22nd May

Búza tartalékfehérjék mozgásának követése a transzgénikus rizs endospermium sejtjeiben

Felhő használata mindennapi alkalmazások futtatására. Németh Zsolt MTA SZTAKI

A tárgy címe: Bioinformatika

Bio-nanorendszerek. Vonderviszt Ferenc. Pannon Egyetem Nanotechnológia Tanszék

Univerzalitási osztályok nemegyensúlyi rendszerekben, Ódor Géza

Bevezetés a rendszerbiológiába

Intelligens molekulákkal a rák ellen

Bioinformatika 2 10.el

Fehérjék szerkezetének predikciója, szerkezeti adatok felhasználása adatbázisok segítségével, a számítógépes molekuladinamikai modellezés alapjai

Molekuláris dinamika. 10. előadás

TEMATIKA Biokémia és molekuláris biológia IB kurzus (bb5t1301)

Dózis-válasz görbe A dózis válasz kapcsolat ábrázolása a legáltalánosabb módja annak, hogy bemutassunk eredményeket a tudományban vagy a klinikai

Fehérje-fehérje kölcsönhatások és kölcsönhatási hálózatok. Szilágyi András

A MODELLALKOTÁS ELVEI ÉS MÓDSZEREI

Elektrosztatikus számítások. Elektrosztatikus számítások. Elektrosztatikus számítások. Elektrosztatikus számítások Definíciók

A TATA-kötő fehérje asszociált faktor 3 (TAF3) p53-mal való kölcsönhatásának funkcionális vizsgálata

Humánetológia Humán viselkedési komplex és kötődés. Miklósi Ádám, Etológia Tanszék

Molekuláris biológiai eljárások alkalmazása a GMO analitikában és az élelmiszerbiztonság területén

Zeke András, Garai Ágnes, Reményi Attila ELTE TTK Biológiai Intézet, Biokémiai Tanszék

Etológia. a viselkedés biológiája. Barta Zoltán.

Hemoglobin - myoglobin. Konzultációs e-tananyag Szikla Károly

Összefoglalók Kémia BSc 2012/2013 I. félév

Miskolci Egyetem GÉPÉSZMÉRNÖKI ÉS INFORMATIKAI KAR. Osztályozási fák, durva halmazok és alkalmazásaik. PhD értekezés

ERD14: egy funkcionálisan rendezetlen dehidrin fehérje szerkezeti és funkcionális jellemzése

Immunológia alapjai előadás. Az immunológiai felismerés molekuláris összetevői.

Szoftver újrafelhasználás

S atisztika 1. előadás

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

Kémiai reakciók mechanizmusa számítógépes szimulációval

Nagy bonyolultságú rendszerek fejlesztőeszközei

Immunológia alapjai. 10. előadás. Komplement rendszer

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Bevezetés. Cserző Miklós 2018

Genetikai kölcsönhatások rendszerbiológiája

Mit mond a XXI. század emberének a statisztika?

Fehérjék rövid bevezetés

Immunológia alapjai előadás. Az immunológiai felismerés molekuláris összetevői

Hidraulikus hálózatok robusztusságának növelése

Kémiai kötések. Kémiai kötések kj / mol 0,8 40 kj / mol

Adatok statisztikai értékelésének főbb lehetőségei

EGYSZERŰ, SZÉP ÉS IGAZ

VÁLLALATGAZDASÁGTAN II. Döntési Alapfogalmak

Prof. Dr. Krómer István. Óbudai Egyetem

transzláció DNS RNS Fehérje A fehérjék jelenléte nélkülözhetetlen minden sejt számára: enzimek, szerkezeti fehérjék, transzportfehérjék

Hibrid előfeldolgozó algoritmusok morfológiailag komplex nyelvek és erőforrásszegény domainek hatékony feldolgozására Orosz György

Bevezetés a kvantum informatikába és kommunikációba Féléves házi feladat (2013/2014. tavasz)

Akusztikai tervezés a geometriai akusztika módszereivel

A T sejt receptor (TCR) heterodimer

y ij = µ + α i + e ij

Nem kódoló RNS-ekből potenciálisan keletkező de novo fehérjék azonosítása és elemzése DIPLOMAMUNKA

A MIKROBIOLÓGIA GYAKORLAT FONTOSSÁGA A KÖZÉPISKOLÁBAN MÚLT, JELEN, JÖVŐ SPENGLER GABRIELLA

A Ritka Betegség Regiszterek szerepe a klinikai kutatásban Magyarósi Szilvia (SE, Genomikai Medicina és Ritka Betegségek Intézete)

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Bioinformatika előad

(1) A T sejtek aktiválása (2) Az ön reaktív T sejtek toleranciája. α lánc. β lánc. V α. V β. C β. C α.

BIOENERGETIKA TÁRSADALOM HARMONIKUS VIDÉKFEJLŐDÉS

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

TERMÉKFEJLESZTÉS (BMEGEGE MNTF)

Taxonómiai kutatások jelene és jövője a bagolylepkészetben

Az élő sejt fizikai Biológiája:

Bioinformatika november 10. MTA Természettudományi Kutatóközpont földszinti nagy előadó terem 1117 Budapest, Magyar Tudósok körútja 2.

Többgénes jellegek. 1. Klasszikus (poligénes) mennyiségi jellegek. 2.Szinte minden jelleg több gén irányítása alatt áll

Gépi tanulás a gyakorlatban. Bevezetés

Biotechnológia, egészség- és környezetvédelem. Műegyetem - Kutatóegyetem Biotechnológia, egészség-és környezetvédelem

Dodé Réka (ELTE BTK Nyelvtudomány Doktori IskolaAlkalmazott Alknyelvdok 2017 nyelvészet program) február 3. 1 / 17

Bevezetés a bioinformatikába. Harangi János DE, TEK, TTK Biokémiai Tanszék

1. Az informatika alapjai (vezetője: Dr. Dömösi Pál, DSc, egyetemi tanár) Kredit

Biológiai módszerek alkalmazása környezeti hatások okozta terhelések kimutatására

A Jövő Internet elméleti alapjai. Vaszil György Debreceni Egyetem, Informatikai Kar

TERMÉKFEJLESZTÉS (BMEGEGE MNTF)

Átírás:

Rendezetlen fehérjék kölcsönhatásainak vizsgálata: elmélet, predikciók és alkalmazások Doktori (PhD) értekezés tézisei Mészáros Bálint Témavezetők: Dr. Dosztányi Zsuzsanna, PhD és Prof. Simon István, PhD, DSc Statisztikus fizika, biológiai fizika és kvantumrendszerek fizikája doktori program, Fizika Doktori Iskola Eötvös Loránd Tudományegyetem, Természettudományi Kar Fehérjeszerkezet kutatócsoport, Enzimológiai Intézet Magyar Tudományos Akadémia, Természettudományi Kutatóközpont Budapest 2012

Bevezetés 1. Bevezetés A XX. század utolsó évtizedében végzett, nagy áteresztő képességű genomikai vizsálatok eredményei alapjaiban változtatták meg a fehérjékről alkotott képünket. A 90- es évek elejéig a szerkezeti biológia alaptétele volt, hogy a fehérjék helyes működéséhez elengedhetetlen egy jól meghatározott szerkezet, azonban az ennek ellentmondó eredmények fényében ezt a szerkezet-funkció paradigmát újra kellett értékelni. Egyre több olyan, ún. rendezetlen fehérje (intrinsically disordered proteins - IDP) vált ismertté, melyek fiziológiás körülmények között sem vesznek fel egy időben állandó szerkezetet, ennek ellenére képesek esszenciális szerepet betölteni különböző szabályozási folyamatokban, mint például a sejtciklus-szabályzás és az apoptózis. A rendezetlen fehérjéket funkcionális fontosságukkal összhangban több, szabályozással kapcsolatos betegségben is megfigyelték, mint például a cukorbetegség, amiloidózis, neurodegeneratív betegségek, vagy a rák. Ezek a megfigyelések vezettek ahhoz a hipotézishez, hogy a fehérje rendezetlenség sérülékennyé teszi a fehérjéket és egyfajta biológiai kockázatot rejt. Bár önmagukban nincs stabil térszerkezetük, a rendezetlen fehérjék partner molekulákkal (leggyakrabban másik fehérjével vagy RNS/DNS-sel) kialakított kölcsönhatásaik során képesek rendeződni, miközben szabadsági fokaik száma nagymértékben csökken. Ez a kapcsolt feltekeredési és kötési mechanizmus azt eredményezi, hogy az entrópikus veszteség hatására a kötési erősség gyengül, anélkül, hogy ez a specificitás rovására menne. Az így kialakított gyenge, de specifikus kötések elengedhetetlenek a szabályozási és jelátviteli folyamatokban. A rendezetlen fehérjék kölcsönhatásainak speciális tulajdonságai lehetővé teszik, hogy nagyszámú kölcsönhatásban vegyenek részt, és ezáltal a fehérje-fehérje kölcsönhatási hálózatok csomóponti szerepeit töltsék be. A rendezetlen fehérjék kölcsönhatásának elmélete mellett, a globuláris fehérjék és rövid fehérje szakaszok közti kölcsönhatások leírására kialakult egy attól független, 1

Bevezetés párhuzamosan fejlődő elmélet is. Ebben a lineáris motívum modellben a leírás alapját szerkezeti megfontolások helyett szekvenciális tulajdonságok adják. Bizonyos rendezett fehérje doméneknél megfigyelhető, hogy a kölcsönhatási partnereik tartalmaznak egy rövid, pár aminosavból álló szekvencia-mintázatot. Ez a szekvencia motívum képes a kölcsönhatást a fehérje többi részétől nagyrészt függetlenül közvetíteni, bár a motívumok szekvenciális környezete bizonyos esetekben nagyobb mértékben modulálja a kötést, mint azt az eredeti koncepció alapján várnánk. Bár ezek a motívumok leggyakrabban rendezetlen fehérje szakaszokra esnek, a rendezetlen kötőhelyek és a lineáris motívumok közötti pontos kapcsolat egyelőre nagyrészt tisztázatlan. A modern szekvenálási technikák eredményei nemcsak elméleti, hanem gyakorlati változásokat is hoztak magukkal a molekuláris biológiai kutatásokban. Az elmúlt évtizedekben az ismert adatmennyiség többszörösen meghaladta azt a szintet, ami manuálisan még kezelhető lenne, ami drasztikusan megnövelte a számítógépek szerepét a biológiában. Ennek megfelelően, a molekuláris biológiai kutatások túlnyomó többsége támaszkodik bioinformatikai eszközökre, számítógépes szimulációkra, vagy online adatbázisokra. Mivel a rendelkezésre álló kísérletes technikákat alapjában véve rendezett fehérjékre fejlesztették ki, a rendezetlen fehérjék kísérletes kutatása rendkívül bonyolult és költséges feladat, így a rendezetlen fehérjék azonosítását és leírását célzó bioinformatikai módszerek kiemelt fontossággal bírnak. A rendezetlen fehérjék felismerését követően számos rendezetlenség-becslő (predikciós) eljárást dolgoztak ki. Ezek többsége hagyományos gépi tanulási módszereken alapul, azonban a fehérje rendezetlenség becslése lehetséges a fehérje-feltekeredést irányító fizikai erők közvetlen modellezésével is. A legpontosabb ilyen módszer az IUPred, amely a globuláris fehérjék szerkezetéből a Boltzmann-statisztika alapján számolt statisztikus potenciálokkal képes megbecsülni a fehérjék aminosavjainak potenciális párkölcsönhatási energiáit. Bár a módszer aminosav-felbontású, ami az atomi szinthez képest alacsony, mégis képes helyesen megfogni a fehérje szerkezetek kialakulását hajtó fő erőket és így képes egy egységes modellben megfelelő pontossággal leírni mind a rendezett, mind a rendezetlen fehérjéket. 2

Célkitűzés 2. Célkitűzés A doktori munkám alapvető célja a rendezetlen fehérjék kölcsönhatási mechanizmusának mélyebb megismerése volt. Ennek során a rendezetlen fehérjék kölcsönhatásainak leírását célzó bioinformatikai eszközök és protokollok használatával és fejlesztésével biológiailag releváns eredményeket számoltam. Bár számos fehérje rendezetlenség becslő módszer létezett, a doktori munkám kezdetén (2007-ben) nem létezett nyilvánosan elérhető, általános, a rendezetlen fehérjék kölcsönható régióit becslő módszer. Ennek megfelelően az első célom egy olyan módszer, az ANCHOR kifejlesztése volt, amely képes a fehérje szekvenciából azonosítani azokat a szakaszokat, amelyek képesek egy rendezett fehérje partnerhez való kötődés során rendeződni. Az ANCHOR kifejlesztését követően azt különböző bioinformatikai vizsgálatok során használtam, melyek egyrészt releváns biológiai következtetésekkel szolgálnak, másrészt gyakorlati felhasználásuk is van. Ezeket a vizsgálatokat a szerkezeti- és rendszer szintű biológia következő témái köré építettem fel: a rendezetlen kötőhelyek megjelenése az evolúció során a rendezetlenség és rendezetlen kötőhelyek szerepe a patogének által okozott betegségekben, a Mycobacterium tuberculosis-on, mint modell organizmuson keresztül bemutatva a fehérje kölcsönhatások, funkciók és a rendezetlenség kapcsolata a rákos betegségek kialakulásában a rendezetlen kötőhelyek és a lineáris motívumok közötti kapcsolat felderítése a fehérje rendezetlenség elméleti leírásának alkalmazhatósága egy közös alapokon nyugvó, a rendezetlenség különböző fajtáit becslő módszer kifejlesztésében 3

Adatok és Módszerek 3. Adatok és Módszerek A bioinformatikai vizsgálatok gyakorlatának megfelelően, munkám nagymértékben számítógépes módszerekre és adatbázisokra támaszkodik. A standard bioinformatikai eszközök (mint például BLAST) használatán túl, minden megoldani kívánt problémára egyedi módszereket és protokollokat fejlesztettem ki, sőt, munkám egyik fő célja egy új predikciós algoritmus kidolgozása volt. A számítás-igényes programokat C-ben írtam, az adatbázisok összeállítását, a számítási protokollok fejlesztését és a statisztikai módszerek implementálását pedig Perl-ben végeztem, Linux operációs rendszer alatt. Minden egyes alprojekt során a módszereket és eredményeket szigorúan teszteltem gondosan összeállított pozitív- és negatív adatbázisok segítségével. Ezeket az adatbázisokat irodalmi adatok és különböző fehérje szekvencia- és szerkezeti adatbázisok alapján állítottam össze. A módszerek kiértékelése és az eredmények validálása során a megbízhatóságukat standard és egyedi statisztikai módszerekkel számszerűsítettem. Használt adatbázisok: UniProt: http://www.uniprot.org/ PDB: http://www.rcsb.org/ DisProt: http://www.disprot.org/ Pfam: http://pfam.sanger.ac.uk/ COSMIC: http://www.sanger.ac.uk/ genetics/cgp/cosmic/ UCSC Genome Browser: http://genome.ucsc.edu/ ELM database: http://elm.eu.org/ GeneOntology: http://geneontology.org/ IntAct: http://www.ebi.ac.uk/intact/ Programozási nyelvek: Perl, C, PHP, R Használt bioinformatikai eszközök: IUPred: http://iupred.enzim.hu/ DISOPRED2: http://bioinf.cs.ucl.ac.uk/disopred/ VSL2: http://www.ist.temple.edu/ disprot/predictorvsl2.php BLAST: http://blast.ncbi.nlm.nih.gov/ Ábrák készítésénél használt programok: Pymol, Gnuplot, R, PowerPoint 4

Eredmények és Diszkusszió 4. Eredmények és Diszkusszió 4.1. Az ANCHOR kifejlesztése Az IUPred alapjául szolgáló aminosav-aminosav kölcsönhatási energia becslő eljárás helyessége és sikeressége lehetővé tette, hogy ezt a modellt kiterjesszem a rendezetlen fehérjék kötésének leírására. Munkám során olyan módszert dolgoztam ki, amely képes a beadott fehérje szekvenciákban megbecsülni azon szakaszok helyét, amelyek rendezetlenek, de képesek egy rendezett fehérje partnerhez kötni és a kötés során meghatározott szerkezetet felvenni. Az ilyen rendezetlen kötőhelyek energetikai sajátosságai jól becsülhetők az energia-becslő módszerünkkel. Az a kölcsönhatási energia, amelyet a fehérje egy aminosava nyerhet egy globuláris fehérjével való (intermolekuláris) kölcsönhatás során, az intra-molekuláris kölcsönhatásokhoz hasonlóan modellezhető. Ezt a megközelítést alkalmazva kifejlesztettem az ANCHOR-t, egy módszert, amely képes az ismert rendezetlen kötőhelyek kb. 70%-át helyesen felismerni pusztán a szekvenciából. Bár a módszert rövid kölcsönható régiókon tanítottam be, képes hosszú, szegmentált kötőhelyek helyes felismerésére is. Emellett a módszer hatékonysága független a kötőhelyek aminosav-összetételétől, illetve a kötés során kialakuló szerkezet típusától. A módszerem általánosságának egyrészt elméleti jelentősége van, mivel ez alátámasztja az energia-becslésen alapuló eljárás általánosságát. Másrészt, technikai oldalról ez azt is jelenti, hogy az ANCHOR megkötés nélkül használható bármilyen fehérje szekvenciára. Ez a módszer volt az első (és eddig az egyetlen) általános ilyen módszer, amely szabadon hozzáférhető és is tölthető a http://anchor.enzim.hu címen található web-szerveren keresztül. A rendezetlen kötőhelyek becslésén túl a szerver kiszámolja az IUPred által adott rendezetlenségi profilt, valamint lehetővé teszi lineáris kötőmotívumok keresését is. A szerver grafikus kimenetét a humán Wiskott-Aldrich Szindróma fehérjére az 1. ábra mutatja. 5

Eredmények és Diszkusszió 1. ábra: Az ANCHOR szerver grafikus kimenete egy példa fehérjére Bementként a humán Wiskott-Aldrich Szindróma fehérjét használtam, motívum kereséssel együtt. A fehérje az N-terminális részén található rendezett domén kivételével teljesen rendezetlen. A piros volnal mutatja a rendezetlenségi predikciós profilt, a kék pedig az ANCHOR kimenetét. A 0,5 fölötti értékek jelölik a rendezetlen részeket (az IUPred esetén), illetve a becsült kötőhelyeket (az ANCHOR esetén), melyek kék dobozokkal is jelölve vannak a profilok alatt. Az ANCHOR a fehérjében számos rendezetlen kötőhelyet becsül, melyek közül többet is igazoltak kísérletes eljárásokkal. A motívum keresés során talált SH3 kötő motívumok helyét piros dobozok mutatják. A motívum pozíciók fölött külön sorokban szerepelnek a Cdc42-höz való kötődésben szerepet játszó CRIB motívum és prolin gazdag régiók pozíciói is. 4.2. Az ANCHOR biológiai alkalmazása teljes proteomokon Az egyedi fehérjék tanulmányozása mellett más predikciós algoritmusok együttes használatával az ANCHOR használható rendszer-, illetve evolúciós szintű vizsgálatokra is. Az IUPred és az ANCHOR kombinált használatával meg tudtam mutatni, hogy mind a rendezetlen fehérjék és a rendezetlen kötőhelyek aránya nő a vizsgált organizmusok komplexitásának növekedésével. Általánosságban igaz, hogy az eukarióta élőlények nagyobb arányban tartalmaznak rendezetlen fehérjéket, mint az archeák vagy a baktériumok, valamint hogy egy komplexebb élőlényben a rendezetlen fehérjeszakaszok és rendezetlen kötőhelyek tipikus hossza szignifikánsan nagyobb. Eredményeim arra utaltak, hogy az evolúció során az új rendezetlen fehérje szakaszok megjelenésének 6

Eredmények és Diszkusszió mozgatórugója az, hogy új kötőhelyek alakulhassanak ki. Ez a mechanizmus összhangban van a komplex jelátviteli útvonalak és szabályozási hálózatok megjelenésével. 4.3. A fehérje modularitás szerepe a patogének virulenciájában: esettanulmány a Mycobacterium tuberculosis-on A rendezetlenség és rendezetlen kötőhelyek proteom szintű vizsgálata érdekes példákat adott olyan organizmusokra, amelyek eltérnek az általános trendtől. Az egyik ilyen organizmus a Mycobacterium tuberculosis (MTB), ami a TBC fő kórokozója. Ez az obligát intracelluláris baktérium meglepően magas arányban tartalmaz rendezetlen régiókat és kötőhelyeket. Alapos domén- és szekvencia-analízisekkel, valamint evolúciós rokonság-profilok segítségével azonosítani tudtam két fehérje családot, amelyek nagy szerepet játszhatnak az MTB a humán gazdasejthez való sikeres adaptációjában. Ezen családok fehérjéi általában hosszúak, moduláris felépítésűek és hosszú rendezetlen szakaszokat tartalmaznak. Bár a protokollt MTB-n fejlesztettem ki, az organizmusfüggetlen, így általában bármilyen élőlény fehérje szekvenciáin alkalmazható arra, hogy ígéretes gyógyszer-célpont fehérjékkel szolgáljon. 4.4. A fehérje rendezetlenség, fehérje funkció és rákban való szerep összefüggéseinek nagyskálás vizsgálata Munkatársaimmal elvégeztünk egy másik nagyskálás vizsgálatot is, amely a fehérjék rákkal összefüggésben álló pontmutációit célozta. Korábbi tanulmányok rámutattak, hogy a rákhoz köthető fehérjék között nagy arányban fordulnak elő rendezetlen fehérjék. Ennek alapján állították fel azt a hipotézist, mely szerint a rendezetlenségnek biológiai kockázata van, ami védtelenebbé teszi a fehérjéket a rákos mutációkkal szemben. A rákos mutációk eloszlásának alapos vizsgálatával különböző szerkezeti elemeken azonban meg tudtuk mutatni, hogy a megfelelő háttéreloszlások figyelembe vételével a rákos mutációk valójában inkább a rendezett fehérje részeket preferálják. Az általam elvégzett funkcionális vizsgálat arra is rámutatott, hogy a rendezetlenség és a rákban való 7

Eredmények és Diszkusszió részvétel közötti kapcsolat indirekt és ezt a kapcsolatot sikeresen meg lehet magyarázni a fehérjék funkcióján keresztül. 4.5. Rendezetlen kötőhelyek és lineáris motívumok a két kölcsönhatási modell közti kapcsolat Az eddig tárgyalt rendezetlen kötőhely modellen kívül a rendezett domének és rövid fehérje szakaszok közti kölcsönhatásoknak létezik egy alternatív leírása is, lineáris motívumokkal. Bár a két modell határozottan különbözik, gyakran ugyanazokat a fehérje-fehérje kölcsönhatásokat írják le példaként. A növekvő számú közös példa ellenére azonban a két modell közti kapcsolat vizsgálata egy alig kutatott terület. A két elmélet kapcsolatának vizsgálatát predikciós módszereken keresztül közelítettem meg: a rendezetlen kötőhelyek azonosításához az ANCHOR-t, a motívumok kereséséhez pedig az ELM adatbázisban lévő motívumokat használtam. Az annotált motívum példákon keresztül meg tudtam mutatni, hogy az ANCHOR által becsült régiók és a valódi motívumok előfordulásai között erős korreláció van. A két módszer kombinálása egyesíti az egyes modellek előnyeit: a motívum leírás figyelembe tudja venni egyes aminosavak kölcsönhatásban betöltött esszenciális szerepét, illetve információt ad a kölcsönható partner fehérje kilétéről. Emellett az ANCHOR használata drámaian csökkenti a hamis pozitív találatok számát (ami a motívum keresések legfőbb hátránya), illetve képes figyelembe venni a motívum közelében található környező aminosavak moduláló hatását is. Az ANCHOR szűrőként való alkalmazását motívum-keresésekben a humán proteomon elvégzett, nagyskálás, magi receptor kötő fehérje keresésen demonstráltam. Az eredményeim haszna két oldalon is megmutatkozik: egyrészt elméleti szempontból mélyebb megértést ad a kölcsönhatások mechanizmusáról, másrészt gyakorlati szempontból egy rutinszerűen használható, kombinált módszert ad, mely alkalmazható kísérletes munkák tervezésénél és kiértékelésénél az alaptudománytól a gyógyszerkutatásig. 8

Eredmények és Diszkusszió 4.6. A fehérjék szerkezetének és kölcsönhatásainak egységes tárgyalása korlátok és lehetőségek A rendezetlenség leírásánál általánosan alkalmazott kép bináris, vagyis a kísérletes mérések alapján egy fehérjét, vagy fehérje szakaszt vagy rendezettnek, vagy rendezetlennek annotálnak. Ezzel összhangban a jelenleg elérhető bioinformatikai predikciós módszerek is két állapotot vesznek csak figyelembe. A valóságban azonban a rendezetlenség egy komplex, folytonos jelenség, és a fehérjék flexibilitása a tripszin merev szerkezetétől az ACTR szinte random-coil állapotáig terjedhet. Munkám során megmutattam, hogy ez a heterogenitás megmagyarázható a fehérjék közös termodinamikai leírásán keresztül, továbbá, hogy ez a leírás kiterjeszthető a rendezetlen fehérjék különböző kölcsönhatási módjainak modellezésére is. Bár jelenleg is léteznek a különböző, részlegesen rendezett szerkezeti elemek becslését szolgáló módszerek, mint például a COILS algoritmus a coiled-coil struktúrák becslésére, ezek a módszerek általában nem biofizikai alapokon nyugszanak. Ennek fényében az IUPred és az ANCHOR sikerének talán legfontosabb üzenete az, hogy lehetséges a rendezetlen és rendezett fehérjék közös fizikai leírása egy egyesített modellben. Az alapvető leírás további finomításával és továbbfejlesztésével lehetőség nyílik a fehérjék alternatív konformációjának leírására pusztán a szekvenciából. A rövidtávú kölcsönhatások modellezésével és az entrópikus tagok effektív becslésével ez a megközelítés adhatja az alapját olyan új generációs predikciós módszerek fejlesztésének, illetve olyan elméleti leírás megalkotásának, melyek képesek figyelembe venni a fehérje rendezetlenség folytonos spektrumát. Mivel a fehérjék funkciói és kölcsönhatási módjai szorosan kapcsolódnak a flexibilitáshoz, ezek az eredmények segítenek elmélyíteni a rendezetlen fehérjék kölcsönhatásainak megértését. 9

Publikációk 5. Publikációk A doktori értekezésem alapjául az alábbi cikkeimben ismertetett eredmények szolgáltak: 1. Mészáros B, Simon I, Dosztányi Z. Prediction of protein binding regions in disordered proteins. PLoS Comput Biol 5(5):e1000376 (2009) 2. Dosztányi Z, Mészáros B, Simon I. ANCHOR: web server for predicting protein binding regions in disordered proteins. Bioinformatics 25(20):2745-6 (2009) 3. Dosztányi Z, Mészáros B, Simon I. Bioinformatical approaches to characterize intrinsically disordered/unstructured proteins. Brief Bioinform 11(2):225-43 (2010) 4. Mészáros B, Simon I, Dosztányi Z. The expanding view of protein-protein interactions: complexes involving intrinsically disordered proteins. Phys Biol 8(3):035003 (2011) 5. Mészáros B, Tóth J, Vértessy BG, Dosztányi Z, Simon I. Proteins with complex architecture as potential targets for drug design: a case study of Mycobacterium tuberculosis. PLoS Comput Biol 7(7):e1002118 (2011) 6. Pajkos M, Mészáros B, Simon I, Dosztányi Z. Is there a biological cost of protein disorder? Analysis of cancer-associated mutations. Mol Biosyst 8(1):296-307 (2012) 7. Mészáros B, Dosztányi Z, Simon I. Disordered binding regions and linear motifs two sides of the coin. In preparation - 2012 10