Receptorfehérj rjék szerkezetének felderítése Homológia modellezés Fehérjék rövid bevezetés makromolekulák számos biológiai funkció hordozói: enzimatikus katalízis, molekula transzport, immunválaszok, hormonok, transzkripció szabályozása 20 különböző aminosav (AS) (hosszú láncok) 3D szerkezet (folding) specifikus funkció Fehérjék szerkezete Elsődleges szerkezet (AS sorrend) Másodlagos szerkezet A polipeptid gerincet alkotó atomok térbeli elhelyezkedése az oldalláncok konformációinak figyelmen kívül hagyásával α, β Harmadlagos szerkezet Az egész fehérje 3D szerkezete (hélixek és redők közötti kölcsönhatások) Negyedleges szerkezet Az alegységek térbeli elrendezése (2 vagy több polipeptid lánc) Különböző szerkezeti osztályok 4MBN all-α főleg α-hélix 3CNA all-β főleg β-redők 4LYZ α+β hélixek és redők elkülönülve 1TIM α/β hélixek és Redők keveredve Az ideális célfehérje Általában az enzim/receptor gátlása egy patogén szervezet (malária plazmódium) elpusztulásához vagy a metabolizmus folyamatának megváltozásához vezet. Az ideális célfehérje Az élő szervezet túléléséhez nélkülözhetetlen. A metabolikus útvonal kritikus lépésében van szerepe. Sebezhetővé teszi a szervezetet. A célfehérje koncentrációja alacsony. Alkalmas HTS rendszerben történő tesztelésre. 1
Miért van szükség homológia modellezésre? A kísérletes szerkezet-meghatározás költséges és időigényes. ab initio fehérje folding 100 AS, 3 konf./oldalánc kb 10 48 különböző konformációt jelent! Több az ismert szekvenciák száma, mint az ismert szerkezeteké. A szerkezet ismerete nélkülözhetetlen a funkció megértéséhez. Mi a homológia modellezés? Megjósolja egy ismeretlen szerkezetű, de ismert szekvenciájú fehérje (TARGET) 3D-s szerkezetét ismert szerkezetű fehérjékkel (TEMPLATÁT) való összevetés alapján. Amennyiben hasonlóság fedezhető fel a TARGET és a TEMPLÁT fehérjék szekvenciája között, szerkezeti hasonlóságok tételezhetők fel. Általánosan, kb. 30%-os szekvencia azonosság szükséges egy megfelelő modell felállításához. Hogyan? Egy fehérje szerkezetét az aminosav sorrend egyedileg meghatározza (de a szekvencia nem minden esetben elegendő): prionok ph, ionok, kofaktorok, saperonok Milyen gyakorisággal használhatjuk? 62.787 szerkezet a PDB-ben (de csak ~4000 ha 30%-nál kisebb azonosságúakat és a 3.0 Å-nél jobb felbontásúakat vesszük figyelembe). Az evolúció során a szerkezet konzerváltabb, mint a szekvencia. szerkezet > funkció >> szekvencia Az összes szekvencia kb 25% modellezhető és kb 50%-ról nyerhető szerkezeti információ Fehérje folding A harmadlagos szerkezet megtartása szükséges a megfelelő funkcionalitáshoz. Számos másodlagos kötőerő stabilizálja: elektrosztatikus, H-híd, hidrofób kölcsönhatások, stb. Bizonyos vegyületek, pl. urea (8M) vagy guanidinium-kl klorid denaturálja a fehérjéket (unfolding( unfolding). Bizonyos fehérjék (pl. ribonukleáz A) reverzibilisen denaturálódhatnak, újra felveszik a szerkezetüket (refolding) Ebből az következik, hogy az AS sorrend tartalmazza a megfelelő harmadlagos szerkezet kialakításához szükséges információkat. Strukt kturális genomika Fehérjék és más makromolekulák 3D struktúráinak feltárása. Az ismert fehérjék családokba történő besorolása. Családonként legalább egy fehérje szerkezetének meghatározása. Az elkövetkező 10 évben több mint 10.000 fehérje szerkezetének megoldása. A fehérjék szerkezetére alapozott ismeretek és szabályok megállapítása. Az ismert organizmusokban található fehérjék szerkezetének predikciója a felhalmozott ismeretek és szabályok alapján. 2
3D szerkezet meghatározása Két módszer: Röntgenkrisztallográfia fehérje kristály jó felbontás NMR csak kis fehérjék (< 250 AS) Adatbázisok Az atomi koordináták jegyzetekkel ellátott, osztályozott archívuma. A legjobb: Protein Data Bank (PDB) fehérjék, receptor-ligand komplexek, nukleinsavak, szénhidrátok honlap: www.rcsb.org/pdb Miért olyan fontos terület a bioinformatika? Human genome project (1996-2006) Különböző organizmusok DNS szekvenciájának meghatározása számos kérdésre adhat választ - szervezetek fejlődése - betegségek, rendellenességek kezelése Fehérjék funkcióinak megfejtése Probléma Swissprot: 524 420 szekvencia (2011. 01. 25.) (2010. 01. 26.: 514211, 2008. 01. 28.: 333445) PDB: 70 695 ismert szerkezet (2011. 01. 18.) (2010. 01. 26.: 62 787) Az ismert fehérje szekvenciák ~15%-nak ismerjük a szerkezetét. Csökkenthető ez a szakadék a predikciós technikák alkalmazásával? Fehérje szerkezet predikciós megközelítések Másodlagos szerkezet predikciója Homológia modellezés Gombolyfelismerés (folding) Ab initio Hatóanyag-fejlesztés A szerkezet ellenőrzése (ismert/ismeretlen) Ha ismeretlen: tudás-alapú homológia modellezés. Specifikus kismolekulák/inhibitorok keresése Szerkezet-alapú hatóanyag-tervezés Hatóanyag fehérje kölcsönhatások Dokkolás 3
Szekvencia azonosság és a molekula modellezési módszerek Módszer Szekvencia azonosság (ismert szerkezetekkel) ab initio 0-20% Szekvencia azonosság és a modell pontossága Sebesség meghatározó faktorok 100% processzor idő Gombolyfelismerés 20-35% (folding) Homológia modellezés >35% 75% 50% 25% a modell minősége és loop modellezés szekvencia illesztés hibái a homológia megállapítása A homológia modellezés lépései templát azonosítás illesztés (alignment) peptidgerinc generálás egyszerűsített loopok generálása oldalláncok optimálása modell optimálás (energia minimálás) modell megerősítése validálás az előző lépések tetszés szerinti ismétlése: több modell készítése Templát azonosítás Szekvencia keresés Blast Psi-Blast Fold-felismerő eljárások Biológiai információk alkalmazása Funkcionális megjegyzések (adatbázis) Aktív hely/minták A templát A legjobb templát kiválasztása nagyon fontos! Nem biztos, hogy a legnagyobb %-os azonosságú templát a megfelelő Templát 1: 93% id, 3.5 Å felbontás Templát 2: 90% id, 1.5 Å felbontás Ubiquitin és SUMO-2 15% szekvencia azonosság, de 1.5Å RMSD 1UBI 1WM2 4
A felbontás fontossága 4 Å kicsi Ramachandran ábrázolás Peptidgerinc torziós szögei 3 Å 2 Å N 1 Å nagy H Templát jósága Ramachandran ábrázolás Szekvencia azonosság felderítése (alignment) 0 240 260 280 1ad3 : LKPSEVSGHMADLLATLIPQY-M---DQNLYLVVKGGVPETTELLK--ERFDHIMYTGSTAVGKIVMAAAAK- : 200 1cw3 : MKVAEQTPLTALYVANLIKEAGF---PPGVVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSS : 254 1ad3_4 : LKPSEVSGHMADLLATLIPQY-M---DQNLYLVVKGGVPETTELL--KERFDHIMYTGSTAVGKIV-MAAAAK : 200 1cw3_4 : MKVAEQTPLTALYVANLIKEAGF---PPGVVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSS : 254 1ad3_5 : LKPSEVSGHMADLLATLIPQY-M---DQNLYLVVKGGVPETTELLKER--FDHIMYTGSTAVGKIV-MAAAAK : 200 1cw3_5 : MKVAEQTPLTALYVANLIKEAGF---PPGVVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSS : 254 1ad3_6 : LKPSEVSGHMADLLATLIPQY-M---DQNLYLVVKGGVPETTELLKER--FDHIMYTGSTAVGKIV-MAAAAK : 200 1cw3_6 : MKVAEQTPLTALYVANLIKEAGF---PPGVVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSS : 254 1ad3_ce : LKPSEVSGHMADLLATLIPQYM----DQNLYLVVKGGV-PETTELLKE-RFDHIMYTGSTAVGKIVMAAAA-K : 200 1cw3_ce : MKVAEQT---PLTALYVANLIKEAGFPPGVVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSS : 254 6K E 3 a a 6i 6 6V G p 6 D 6 5TGST 6G466 AA Specifikus algoritmusok alkalmazása (blastn, psiblast, stb.) Azonos, hasonló, eltérő AA-k megtalálása Hézagok (gap) beillesztése a megfelelő helyekre Röntgen kriszt. NMR Szekvencia azonosság felderítése (alignment) Peptidgerinc kialakítása A templát illeszkedő régióinak atomi koordinátái. Számos alkalmazással elvégezhető: - Modeller CASP6 modulja: http://salilab.org/modeller/modeller.html - SWISS-MOD Server http://swissmodel.expasy.org/ - SCWRL (SideChain placement With Rotamer Library) http://www1.jcsg.org/scripts/prod/scwrl/serve.cgi A humán és patkány ß 2 -adrenerg receptorok összevetése 5
Peptidgerinc kialakítása Loop modellezése Tudás alapú: Szekvencia keresés a PDB-ben hasonló kiindulási szerkezet Energia alapú: A szerkezet energiája alapján történő modellezés Monte Carlo szimuláció molekuladinamika (MD) Ezek kombinációja LOBO: http://protein.cribi.unipd.it/lobo/help.html Loop Rosetta módszer Fragmens keresés (10/AS): - a keresett szekvenciával azonos szekvencia és másodlagos szerkezet A kapott szerkezetek kombinálása (Monte Carlo). Rohl et al. Proteins 55:656-677, 2004 http://www.rosettacommons.org/ Homologia modellezés loopok 1A14L.pdb a SICHO b CABS c REFINER d MODELLER Zöld Natíve loop szerkezet Piros modellezett loop szerkezet Oldalláncok Ha a szekvencia azonosság nagy - az oldalláncok kölcsönhatási pontjainak hálózata konzervált - a rotamerek megőrzése célszerűbb, mint újak számolása. Oldalláncok - pontosság A belső térben lévő oldalláncok esetében pontosabb a predikció Kísérleti ok: A felszíni oldalláncok flexibilisebbek. Elméleti ok: a hidrofób kölcsönhatások kezelése könnyebb a fehérje belsejében, mint az elektrosztatikus kölcsönhatások (pl. H-híd) számítása a víz irányába. 6
A modell finomítása Energia minimalizálás Molekuladinamika Nagy hibák, mint atomok ütközése kiküszöbölhető A módszerek nem tökéletesek apróbb hibák kerülhetnek a modellbe Hibakezelés Ha a felépítés során hiba kerül a modellbe, nem lehet utólag kijavítani A megfelelő illesztés (alignment) nem kárpótol a rossz templát választásért. Egy jó loop modell nem javíthat egy rossz templát választás okozta hibákon. Ha hibát követtünk el, akkor az aktuális lépést újra meg kell tervezni és ismételni. Validálás A legtöbb program a kötéshosszakat és szögeket jól adja meg. A célfehérje Ramachandran-ábrája a templáthoz nagyon hasonló (jó minőségű templát kiválasztása!). Biológiai/biokémiai adatok aktív hely oldalláncai modifikációs helyek kölcsönhatási helyek Validálás ProQ szerver ProQ: neurális hálózaton alapuló szolgáltatás. Megfelelő modell megtalálása Más programok a natív szerkezetek megtalálására fókuszálnak. Honlap: http://www.sbc.su.se/~bjorn/proq/ Szerkezet validálása ProCheck http://www.biochem.ucl.ac.uk/~roman/procheck/ procheck.html WhatIf szerver http://swift.cmbi.kun.nl/wiwwwi/ Homológia modellező szerver erverekek Eva-CM: folyamatos és automatizált működés más szerverek bevonásával Működés, információ, szerverek listája: http://cubic.bioc.columbia.edu/eva/doc/intro_cm.html 7
Összefoglalás A sikeres homológia modellezés az alábbiak függvénye: Az alkalmazott templát minősége Szekvencia illesztés/alignment (biológiai információk felhasználása) Modellező programok, eljárások (ne csak egyet alkalmazzunk) Mindig validálni kell a végső modellt! 8