Fehérje-fehérje kölcsönhatások és kölcsönhatási hálózatok Szilágyi András
Vázlat Fehérje-fehérje kölcsönhatások Kölcsönhatási hálózatok Kísérleti módszerek Bioinformatikai vonatkozások adatbázisok szerkezetfüggetlen predikciós módszerek szerkezet alapú predikciós módszerek
Fehérje-fehérje kölcsönhatások Sejtbeli fehérjekoncentráció: 300-400 g/l (a tér 20-30%-át kitöltik) Szinte minden fehérje kölcsönhat más fehérjékkel Jeltovábbítás, transzport, sejtmozgás, legtöbb szabályozó mechanizmus: fehérje-fehérje kölcsönhatások közvetítésével mőködik
A fehérje-fehérje kölcsönhatások típusai Összetétel szerint: Homo-oligomerek (azonos láncok) Hetero-oligomerek (különbözı láncok) A monomerek stabilitása szerint: Obligát komplexek (a monomerek önmagukban nem találhatóak meg a sejtben) Nem-obligát komplexek (a monomerek függetlenül is léteznek) A komplex életideje szerint: Tranziens komplexek (in vivo asszociáció-disszociáció) gyenge: állandóan felszakadó és újraformálódó kapcsolat erıs: külsı jel hatására következik be a felszakadás vagy újraformálódás Permanens komplexek (állandó, stabil, erıs kapcsolat, a komplex sohasem bomlik fel)
A: P22 Arc represszor: obligát homodimer (bakteriofág génjének represszora) B: Humán katepszin D: obligát heterodimer (intracell. proteáz) C: Lizin: nem-obligát, gyenge, tranziens homodimer (spermiumban van, megtermékenyítéskor a pete burkát kilyukasztja) D: RhoA-RhoGAP komplex: nemobligát, tranziens heterodimer (jelátviteli útvonal része) E: thrombin-rhodniin komplex: nem-obligát permanens heterodimer (a rhodniin egy vérszívó rovar thrombin inhibitora, ezáltal gátolja a véralvadást) F: Szarvasmarha G fehérje (Gα- Gβγ komplex): nem-obligát, erıs tranziens heterotrimer (GTP-kötı fehérje, jelátviteli kaszkád része)
A kölcsönhatási felületek A komplexek kb. egyharmadánál hidrofób mag figyelhetı meg, poláros győrővel körülvéve jellegzetességei
A többinél kis hidrofób foltok, poláros kölcsönhatások és néha elszórt vízmolekulák láthatók
Egyes komplexeknél nagymértékben egybefonódnak az alegységek
Mitıl függ, milyen a kölcsönhatási felület? Obligát (kétállapotú) vagy nem obligát (háromállapotú) a komplex
Hot spots (forró pontok) Olyan aminosavak a kötıfelületen, amelyeket alaninra cserélve a kötési affinitás jelentısen lecsökken Párban vannak Jól korrelálnak az evolúciós konzerváltsággal
Az élesztı fehérjéinek kölcsönhatási gráfja Skálamentes, ultra-kisvilág típusú, továbbá moduláris (hierarchikus) Kölcsönhatási hálózatok
A hálózatok tulajdonságai Fokszám (k): egy adott csúcs hány másik csúccsal van összekötve P(k): a fokszám valószínőségeloszlása Klaszterezıdési koefficiens (C): egy adott csúcs szomszédai egymással hány kapcsolatot létesítenek a lehetséges maximumhoz képest C(k): k szomszéddal rendelkezı csúcsok átlagos klaszterezıdési koefficiense L: két csúcs között az útvonal átlagos hossza (élek száma)
Hálózatos fogalmak definíciója Skálamentes: P(k) hatványfüggvény szerinti, azaz P(k) ~ k γ Hierarchikus (moduláris): C(k) ~ 1/k Kisvilág: L ~ log N Ultra-kisvilág: L ~ log log N [N a hálózat mérete]
A skálamentesség eredete Preferenciális kapcsolódás: egy új csúcs gyakrabban kapcsolódik olyan csúcsokhoz, amelyeknek sok szomszédja van (hubok), mint amelyeknek kevés Evolúciós magyarázat: Génduplikációnál az új fehérje kölcsönhatásai megegyeznek a régiével. Ezért a hub fehérjék fokszáma gyorsabban nı, mint a nem huboké. Fizikai magyarázat: egy fehérje partnereinek száma a hidrofób felszínével korrelál (ld. késıbb)
Kísérleti módszerek 1. Szerkezeti információt adó módszerek: Röntgenkrisztallográfia NMR (már >100 kda-ig) FRET (Fluorescence resonance energy transfer): távolságmérés oldalláncok között Egymolekulás elektronmikroszkópia: mutatja a molekula alakját, ebbe szerkezeti modellek bedokkolhatóak Mutációk
Kísérleti módszerek 2. Kinetikai és termodinamikai adatokat szolgáltató módszerek: ITC (izotermikus titrációs kalorimetria): a komplexképzéskor képzıdı hıt méri, ebbıl kötési állandó és entalpia számítható SPR (Surface Plasmon Resonance) S: fémfólia, L: lézer, D: detektor, P: prizma Bizonyos szögnél a visszavert fény intenzitásának minimuma van a fémfóliában terjedı elektromágneses hullámok miatt. Ezt a fóliához kötött molekulák tömege is befolyásolja, így a jelenség kötési állandók mérésére is felhasználható.
Kísérleti módszerek 3. Mechanikai alapú módszerek, pl. atomierımikroszkópia (AFM), stb. Erıvel szétválasztjuk a kapcsolódó molekulákat. Az erı mérhetı, itt pl. ismert referenciakötéshez hasonlítjuk (DNS duplex)
Kísérleti módszerek 4. A kölcsönható partner megtalálása: Élesztı kéthibrid módszer (Yeast two-hybrid): az egyik fehérjét egy transzkripciós aktivátor DNS-kötı doménjével, a másikat az aktivációs doménjével fuzionáltatjuk. Ha a két fehérje kölcsönhatásba lép, az aktivátor aktivál egy riporter gént, amely színreakciót ad. Teljes proteomra alkalmazható, hálózatot ad.
Kísérleti módszerek 5. TAP-MS (Tandem Affinity Purification + Mass Spectrometry): A fehérje N-terminálisára 3 részbıl álló tag-et fuzionáltatnak. Két affinitáskromatográfiás és egy proteolitikus hasítási lépés után a fehérje a hozzá kapcsolódó partnerekkel együtt tisztítódik meg, majd tömegspektrometriával azonosítható. Nem közvetlen kölcsönhatásról ad információt, hanem egy adott fehérjével komplexben lévı fehérjékrıl. Automatizálható, így teljes proteomra alkalmazható.
A kísérleti módszerek összehasonlítása Különbözı Y2H és TAP-MS módszerek: nagyon kicsi átfedés, nagy hibaszázalék: Y2H módszer TAP-MS módszer Kölcsönhatások száma
A Y2H módszer megbízhatatlan Két független kísérletet nézve a partnerek száma nem korrelál:
A skálamentesség eredete: másik magyarázat Az Y2H mérésekbıl kapott hálózat mégsem lehet random, mert skálamentes. Mibıl ered a skálamentesség? Deeds et al. 2006: Ha feltételezzük, hogy egy fehérje partnereinek száma a felületének hidrofób hányadával korrelál, visszakapjuk a skálamentes hálózatot: Következtetés: a skálamentesség adódhat a nemspecifikus fehérje-fehérje kötıdés fizikai jellegébıl is, nem okvetlenül kell evolúciós eredetet mögé látni
Bioinformatikai vonatkozások 1. Adatbázisok 2. Szerkezetfüggetlen predikciós módszerek 3. Szerkezet alapú predikciós módszerek 4. Hálózat alapú módszerek
Fehérje-fehérje kölcsönhatások adatbázisai Adatbázisok
Predikciós feladatok Mibıl? Szekvencia Genomiális kontextus Rokon szekvenciák Monomerek szerkezete Mit? Kölcsönható oldalláncok Kölcsönható felszínrészletek A fehérjekomplex térszerkezete Kölcsönható partnerek
Szerkezetfüggetlen predikciós módszerek Genomiális kontextuson alapuló módszerek: Filogenetikai profilok módszere Rosetta-kı módszer Szomszédos gének módszere Nem közvetlen, fizikai kölcsönhatást prediktálnak, hanem funkcionális kapcsolatot!
Filogenetikai profilok módszere Filogenetikai profil: annak leírása, hogy egy adott gén mely organizmusokban található meg és melyekben nem (teljes genomok ismerete szükséges) Az azonos, v. nagyon hasonló (vagy éppen teljesen v. majdnem komplementer) filogenetikai profillal rendelkezõ gének között funkcionális kapcsolat valószínûsíthetõ, hiszen ez azt jelenti, hogy a szóban forgó gének mindenhol együtt fordulnak elõ.
Filogenetikai profilok módszere (példa) Példa: Gén Org2 Org3 Org4 ~~~~ ~~~~ ~~~~ ~~~~ Gén1 1 0 1 Gén2 1 1 0 Gén3 0 1 1 Gén4 1 0 0 Gén5 1 1 1 Gén6 0 1 1 Gén7 1 1 0 (0, ill. 1 jelöli az adott gén hiányát, ill. jelenlétét az adott organizmusban.) A táblázat alapján megállapíthatjuk, hogy: Gén2 és Gén7 filogenetikai profilja azonos Gén3 és Gén6 filogenetikai profilja azonos Következtetés: Gén2 és Gén7 között funkcionális kapcsolat valószínûsíthetõ Gén3 és Gén6 között funkcionális kapcsolat valószínûsíthetõ Hátrányok: A bemenı adatok csak teljes genomok lehetnek Önkényességre van szükség a gén jelenlétének vagy hiányának megállapításához használt küszöbökben Az azonos filogenetikai profil nem jelent közvetlen, fizikai kölcsönhatást a két fehérje között. Huynen et al (2000) szerint ez csak az esetek 34%- ában teljesül.
Rosetta-kõ módszer (doménfúziók módszere) Mi a Rosetta-kõ? Az ókori Egyiptomból, Rosetta városából származó kõlap, melyen ugyanaz a szöveg 3 különbözõ nyelven és írással (hieroglif, démotikus és görög) található meg. Ez tette lehetõvé a hieroglifák megfejtését a görög változat alapján. Sok esetben valamely organizmus két különálló fehérjéje fúziós fehérjeként (egyetlen polipeptidlánccá összeolvadva) található meg valamely más organizmusban. Ha két fehérje megtalálható fúziós fehérjeként is, akkor közöttük funkcionális kapcsolat valószínûsíthetõ. Bonyodalmak: Vannak "promiszkuita" domének, amelyek nagyon sok más fehérjével fuzionálnak Nem mindig utal közvetlen, fizikai kapcsolatra: Huynen et al. szerint csak az esetek 55%-ában
Szomszédos gének módszere Ha két gén az organizmusok nagy részében egymás mellett található a kromoszómán, akkor valószínûsíthetõen funkcionális kapcsolat van közöttük Prokariótáknál gyakoriak az operonok (több, rokon funkciójú gén egymás után található, egy közös promoter alatt) Eukariótáknál az operonok ritkábbak, de a génszomszédság mégis jellemzõ Hátrány: a szomszédság nem jelent fizikai kölcsönhatást. Huynen et al. szerint az így azonosított fehérjepárok 30%-ánál van közvetlen, további 33%-ánál közvetett fizikai kölcsönhatás.
A kölcsönható fehérjék koevolúcióján alapuló módszerek: Filogenetikai fák hasonlósága In silico kéthibrid módszer A génexpresszió koevolúciója
Filogenetikai fák hasonlósága Elkészítjük két fehérjecsalád többszörös szekvenciaösszerendezését Mindkét összerendezésben csak az azonos fajokat tartjuk meg Elkészítjük a szekvenciák távolságmátrixát Felépítjük a filogenetikai fákat A két távolságmátrix hasonlóságát a távolságok korrelációjával mérjük Elegendıen nagy korreláció a két fehérjecsalád koevolúciójára utal, ez fizikai kölcsönhatást is valószínősít
A: Elkészítjük két fehérjecsalád többszörös szekvencia-összerendezését B: A két, fajok szerint rendezett alignmentet egymás mellé rakva összekapcsoljuk Elvégezzük a korrelált mutációk analízisét C: A korrelációs koefficiensekbıl hisztogramokat készítünk: P 11 és P 22 a fehérjén belüli, P 12 a két fehérje közötti korrelációs koefficiensek hisztogramja Ebbıl a kölcsönhatási index: In silico kéthibrid módszer A legnagyobb kölcsönhatási indexő lehetséges partnerek a legvalószínőbb fizikailag kölcsönható partnerek. Teljes proteomra alkalmazható (mint a Y2H), hálózatot ad Nemcsak párokat ad meg, hanem a valószínő kölcsönható régiókat is!
A génexpresszió koevolúcióján alapuló módszer Az egymással kölcsönható fehérjék expressziós szintje várhatóan hasonló (a sztöchiometrikus arányoknak megfelelıen) Az expressziós szint becsülhetı a kodonhasználatból. Codon Adaptation Index (CAI): azt méri, hogy mennyire a legnagyobb expressziót biztosító kodonokat használja az adott gén. Minden fehérjecsaládon belül meghatározva a CAI értékeket, ha két család CAI értékei korrelálnak egymással, az a két fehérje fizikai kölcsönhatására utal. Fraser et al 2004: az expressziós szint koevolúciója alapján jobban prediktálható a fizikai kölcsönhatás, mint a szekvenciák koevolúciója alapján. Hátrány: egyes fajoknál a kodonhasználat kevésbé korrelál az expressziós szinttel, ezeknél a módszer nem alkalmazható.
Szerkezeten alapuló predikciós módszerek Kölcsönhatások modellezése homológia alapján Fehérje-fehérje dokkolás
Kölcsönhatások modellezése homológia alapján Homológiamodellezés: Szekvencia + ismert szerkezető, hasonló szekvenciájú fehérje szekvenciaillesztés jósolt térszerkezet (modell) Kölcsönhatások modellezése: Két szekvencia. 30-40% szekvenciaazonosság ismert szerkezető komplex két alegységével Kérdés: 1. kölcsönhatnak-e, 2. ha igen, milyen a komplex szerkezete??
Kölcsönhatások modellezése homológia alapján: InterPreTS szerver www.russell.embl.de/interprets
Fehérje-fehérje dokkolás? A fehérje felszínének reprezentációja: molekuláris felszín (Connolly) rácsra vetítés gömbharmonikusok háromszögekre bontás stb. Keresıalgoritmus: végig kell próbálni az összes lehetséges rotációt és transzlációt: Fourier-transzformációs módszer genetikus algoritmusok Monte Carlo stb.
Fehérje-fehérje dokkolás geometriai alapon: Katchalski-Katzir et al. 1992 A két fehérjeszerkezetet kockarácsra vetítjük: ρ nagy negatív, δ kis pozitív
Fehérje-fehérje dokkolás geometriai alapon: Katchalski-Katzir et al. 1992 korreláció, ennek a maximumát keressük. Direkt számolással N 6 lépés volna Ehelyett Fourier-transzformációt alkalmazunk: Ezt megismételjük minden lehetséges orientációban is (a 3 Euler-szöget léptetve), majd a korrelációs csúcsok közül a legnagyobbat választjuk
Fehérje-fehérje dokkolás Geometriai illeszkedés önmagában nem elég a korrekt dokkoláshoz, de az elektrosztatikus és a hidrofób komplementaritást is figyelembe véve már jó eredményeket kapunk. Ha van információ a kölcsönható oldalláncokról, az nagyban leszőkíti a keresést, s így növeli a dokkolás sikerének esélyét Fourier-transzformáció az alapja egy sor ismert dokkoló programnak, mint pl. FTDock, 3D-Dock, GRAMM, DOT, ZDock, HEX CAPRI: Critical Assessment of Predicted Interactions: dokkolási verseny A fehérjekomplexek osztályozása a dokkolás nehézsége szerint:
A predikciós módszerek korlátai Az egydoménes fehérjéknek már csaknem minden lehetséges szerkezete ismert, a lehetséges kölcsönhatásoknak azonban csak töredéke: A szerkezetileg különbözı kölcsönhatási módok száma kb. 10 000, ebbıl mindössze 2000 ismert. Mivel évente 200-300 új kölcsönhatás-szerkezet válik ismertté, kb. 20 év, mire mind ismertté válnak. A gyengén kölcsönható komplexeket nehéz kristályosítani, így sok, fontos kölcsönhatásról nincs információ Nincs jó és teljes referencia-adatkészlet Nagyon kevés fizikai paraméter (kötési állandó, stb.) áll rendelkezésre