7. Fehérjeszekvenciák és térszerkezetek analízise.



Hasonló dokumentumok
Bioinformatika előad

Bioinformatika 2 6. előadás

Bioinformatika 2 5. előadás

A fehérjék térszerkezetének jóslása

Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis

8. A fehérjék térszerkezetének jóslása

A fehérjék szerkezeti hierarchiája. Fehérje-szerkezetek! Klasszikus szerkezet-funkció paradigma. szekvencia. funkció. szerkezet! Myoglobin.

Bioinformatika előad

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Bioinformatikai modellek. Cserző Miklós 2017

A tárgy címe: Bioinformatika

A fehérjék térszerkezetének jóslása (Szilágyi András, MTA Enzimológiai Intézete)

Fehérjeszerkezet, és tekeredés

2. Ismert térszerkezetű transzmembrán fehérjék adatbázisa: a PDBTM adatbázis. 3. A transzmembrán fehérje topológiai adatbázis, a TOPDB szerver

Elektrosztatikus számítások. Elektrosztatikus számítások. Elektrosztatikus számítások. Elektrosztatikus számítások Definíciók

Bioinformatika 2 4. előadás

Bakteriális identifikáció 16S rrns gén szekvencia alapján

A fehérjék szerkezete és az azt meghatározó kölcsönhatások

Elválasztástechnikai és bioinformatikai kutatások. Dr. Harangi János DE, TTK, Biokémiai Tanszék

Felhő használata mindennapi alkalmazások futtatására. Németh Zsolt MTA SZTAKI

Bevezetés a bioinformatikába. Harangi János DE, TEK, TTK Biokémiai Tanszék

Bioinformatika előadás

A fehérjék hierarchikus szerkezete

TDK lehetőségek az MTA TTK Enzimológiai Intézetben

ALKÍMIA MA Az anyagról mai szemmel, a régiek megszállottságával.

A racionális gyógyszertervezés lehetőségei. A racionális gyógyszertervezés lehetőségei. A racionális gyógyszertervezés lehetőségei

Hemoglobin - myoglobin. Konzultációs e-tananyag Szikla Károly

A rácsmodell. Szabadenergia felületek.

Éldetektálás, szegmentálás (folytatás) Orvosi képdiagnosztika 11_2 ea

Röntgen-gamma spektrometria

Fehérje-fehérje kölcsönhatások és kölcsönhatási hálózatok. Szilágyi András

Fehérjék felépítése és struktúrája. Aminosav oldalláncok. A fehérjék királis elemekből (α-l-aminosavakból) épülnek fel

Fehérjék rövid bevezetés

Használati útmutató Az online példatárhoz

A fehérjék hierarchikus szerkezete. Szerkezeti hierarchia. A fehérjék építőkövei az aminosavak. Fehérjék felosztása

Cserző Miklós Bioinformatika és genomanalízis az orvostudományban. Integrált biológiai adatbázisok

MEDICINÁLIS ALAPISMERETEK AZ ÉLŐ SZERVEZETEK KÉMIAI ÉPÍTŐKÖVEI AZ AMINOSAVAK ÉS FEHÉRJÉK 1. kulcsszó cím: Aminosavak

Gyakorlati bioinformatika

Infobionika ROBOTIKA. X. Előadás. Robot manipulátorok II. Direkt és inverz kinematika. Készült a HEFOP P /1.0 projekt keretében

Adatelemzési eljárások az idegrendszer kutatásban Somogyvári Zoltán

Több oxigéntartalmú funkciós csoportot tartalmazó vegyületek

A T sejt receptor (TCR) heterodimer

A MALDI-TOF tömegspektrometria alkalmazási és fejlesztési lehetőségei a patogén mikroorganizmusok vizsgálatában

5/11/2015 TÖMEGSPEKTROMETRIA. Tömegspektrometria - áttekintés. Ionizáció és analizátor. Tömegspektrométer. Analizátor: KVADRUPOL

(1) A T sejtek aktiválása (2) Az ön reaktív T sejtek toleranciája. α lánc. β lánc. V α. V β. C β. C α.

Víz. Az élő anyag szerkezeti egységei. A vízmolekula szerkezete. Olyan mindennapi, hogy fel sem tűnik, milyen különleges

A TÖMEGSPEKTROMETRIA ALAPJAI

Enzimek. Enzimek! IUBMB: szisztematikus nevek. Enzimek jellemzése! acetilkolin-észteráz! legalább 10 nagyságrend gyorsulás. szubsztrát-specificitás

Bioinformatika és genomanalízis az orvostudományban. Biológiai adatbázisok. Cserző Miklós 2018

Tusnády E. Gábor. Sztochasztikus modellek a fehérjekutatásban. Doktori (Ph.D.) értekezés. ELTE TTK Szerkezeti Biokémia Program

c adatpontok és az ismeretlen pont közötti kovariancia vektora

Célkitűzés/témák Fehérje-ligandum kölcsönhatások és a kötődés termodinamikai jellemzése

Bioinformatika előadás

Röntgendiffrakció, tömegspektrometria, infravörös spektrometria.

Sugárzások kölcsönhatása az anyaggal

Kutatási terület. Szervetlen és szerves molekulák szerkezetének ab initio tanulmányozása

Az anyagi rendszer fogalma, csoportosítása

Bioinformatika 2 10.el

Szádfal szerkezet ellenőrzés Adatbev.

Bioinformatika 2 9. előadás

A BIOLÓGIAI JELENSÉGEK FIZIKAI HÁTTERE Zimányi László

Bio-nanorendszerek. Vonderviszt Ferenc. Pannon Egyetem Nanotechnológia Tanszék

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Szekvenciaelemzés. Cserző Miklós 2017

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Nukleinsavak építőkövei

Részecske azonosítás kísérleti módszerei

Méréselmélet MI BSc 1

FEHÉRJÉK A MÁGNESEKBEN. Bodor Andrea ELTE, Szerkezeti Kémiai és Biológiai Laboratórium. Alkímia Ma, Budapest,

Modern Fizika Labor. Fizika BSc. Értékelés: A mérés dátuma: A mérés száma és címe: 13. mérés: Molekulamodellezés PC-n április 29.

Szádfal szerkezet tervezés Adatbev.

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Szimulációk egyszerősített fehérjemodellekkel. Szilágyi András

Sillabusz orvosi kémia szemináriumokhoz 1. Kémiai kötések

Tömegspektrometria. Tömeganalizátorok

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Kötések kialakítása - oktett elmélet

Kémiai kötések. Kémiai kötések. A bemutatót összeállította: Fogarasi József, Petrik Lajos SZKI, 2011

Képfeldolgozás. 1. el adás. A képfeldolgozás m veletei. Mechatronikai mérnök szak BME, 2008

5. Másodlagos adatbázisok

3. A kémiai kötés. Kémiai kölcsönhatás

Evans-Searles fluktuációs tétel Crooks fluktuációs tétel Jarzynski egyenlőség

Erőterek. Erőterek. Erőterek. Erőterek. Erőterek. Erőterek. Probléma: fehérjéknél nagy dimenziók értelmetlen QM eredmények.

x = cos αx sin αy y = sin αx + cos αy 2. Mi a X/Y/Z tengely körüli forgatás transzformációs mátrixa 3D-ben?

1. változat. 4. Jelöld meg azt az oxidot, melynek megfelelője a vas(iii)-hidroxid! A FeO; Б Fe 2 O 3 ; В OF 2 ; Г Fe 3 O 4.

Rendezetlen fehérjék kölcsönhatásainak vizsgálata: elmélet, predikciók és alkalmazások

Kémiai kötés. Általános Kémia, szerkezet Slide 1 /39

Biológiai módszerek alkalmazása környezeti hatások okozta terhelések kimutatására

Szénhidrátkémiai kutatások bioinformatikai esetek. Dr. Harangi János DE, TTK, Biokémiai Tanszék

MedInProt Szinergia IV. program. Szerkezetvizsgáló módszer a rendezetlen fehérjék szerkezetének és kölcsönhatásainak jellemzésére

Biofizika I. DIFFÚZIÓ OZMÓZIS

GEOSTATISZTIKA II. Geográfus MSc szak. 2019/2020 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

A SZILÁRDTEST FOGALMA. Szilárdtest: makroszkópikus, szilárd, rendezett anyagdarab. molekula klaszter szilárdtest > σ λ : rel.


Az informatika kulcsfogalmai

Kolloidstabilitás. Berka Márta 2010/2011/II

A fehérjék hierarchikus szerkezete

Elektronegativitás. Elektronegativitás

Kémiai kötés Lewis elmélet

Etológia Emelt A viselkedés mérése. Miklósi Ádám egyetemi tanár ELTE TTK Etológia Tanszék 2018

Átírás:

7. Fehérjeszekvenciák és térszerkezetek analízise. 1. Egyszerû elemzések 2. Térszerkezet predikció 2.1. A probléma bonyolultsága 2.2. A predikció szintjei 2.3. 1D predikciók (másodlagos szerkezet, hozzáférhetõség, transzmembrán hélixek 3. Térszerkezetek elemzése: 3.1. Minõségellenõrzés 3.2. Másodlagos szerkezet 3.3. Szerkezeti motívumok 3.4. Kölcsönhatás ligandumokkal 3.5. Töltésviszonyok 3.6. Felszínek, üregek Egyszerû elemzések (lásd Expasy Tools) Fehérjeazonosítás AACompIdent: fehérje azonosítása aminosav összetétel alapján. Megadható még az izoelektromos pont (pi) és a molekulatömeg (Mw). Eredmény: rangsorolt lista a SWISSPROT ban lévõ, a megadott adatokhoz közeli paraméterekkel rendelkezõ fehérjékrõl. Távoli homológiák detektálhatók ezen a módon! PROPSEARCH: A megadott szekvenciából (csak az aminosav összetételbõl) 144 tulajdonságot számít ki (pl. nagy és kis oldalláncok részaránya, átlagos hidrofobicitás, átlagos töltés, bizonyos dipeptidek gyakorisága, stb.) Ezek alapján keres hasonlót a szekvenciaadatbázisokban. Távoli homológiák detektálhatóak vele! Fehérjeazonosítás tömegspektrometriai eredmények alapján Tömegspektrometria: valamilyen specifikus proteázzal (pl. tripszin) való emésztés után megadja a kapott peptidek pontos molekulatömegét. Ennek alapján a fehérje azonosítható. Leggyakrabban használt módszer: MALDI (Matrix Assisted Laser Desorption/Ionisation Mass Spectrometry) A fehérjét (annak fragmentumait) UV elnyelõ anyagba ágyazzák (mátrix), ezt a réteget UV lézerrel lövik, mire a molekulák ionizálódnak és leválnak a mátrixról. Elektromos térben felgyorsulnak, detektor méri a becsapódást. A becsapódásig eltelt idõbõl számítható a tömeg. Spektrum: 1

MOWSE: megadva az emésztéshez használt proteázt és a peptidtömegeket, rangsorolt listát ad az OWL adatbázisban lévõ, a megadott adatoknak megfelelõ fehérjékrõl Fizikai tulajdonságok a szekvenciából ProtParam: a szekvenciából egy sor mennyiséget számít ki (Mw, pi, aminosav és atomösszetétel, extinkciós koefficiens, stb.) PeptideMass: a megadott szekvencia proteolitikus emésztési fragmentumainak tömegét számítja ki SAPS (Statistical Analysis of Protein Sequences): rengeteg fizikai és kémiai információt számít a szekvenciából (aminosav összetétel, töltéseloszlás, pozitív és negatív töltésû klaszterek, mintázatok, hidrofób szegmensek, repetitív régiók, periodicitás, stb.) Térszerkezet predikció A probléma bonyolultsága Általánosságban: találjuk meg egy tetszõleges szekvencia azon konformációját, amely a szabadentalpia globális minimumát adja. Egyszerû modellekben kimutatható: a feladat ún. NP nehéz, vagyis a megoldásához szükséges idõ a (fehérje)mérettel nempolinomiális függvény szerint (hanem annál gyorsabban) növekszik. (Vagyis bizonyos mérethatár fölött nem megoldható.) Gyakorlatban: a valódi fehérjék szekvenciái nagyon specifikusak (evolúció során kiválogatódtak); a predikcióhoz felhasználhatjuk a már ismert térszerkezeteket mint tudásbázist A gyakorlatban tehát a probléma kezelhetõ. A predikció szintjei Jósolhatóak a fehérjeszerkezet egy, két, ill. háromdimenziós aspektusai: (1D, 2D és 3D információ. A 2D a kontaktustérkép.) 1D: aminosavakhoz köthetõ tulajdonságok, melyek 1D stringként írhatóak fel. Pl.: szekvencia, másodlagos szerkezet, oldószer általi hozzáférhetõség, hidrofobicitás 2D: aminosavpárok közötti távolságok, kontaktusok 3D: az összes atomi koordináta 2

1D predikciók Másodlagos szerkezet jóslása a szekvenciából A fontosabb módszerek az Expasy Tools oldalról elérhetõek. Módszerek (rengeteg van, ez csak néhány példa): 1. generációs 2. generációs 3. generációs Konszenzus Módszer Mûködés elve Kb. pontosság (%) Chou Fasman (CF) Garnier Osguthorpe Robson (GOR I, GOR II) Az egyes aminosavtípusok elõfordulásának valószínûsége a különbözõ másodlagos szerkezeti elemekben Lim 57 Nagano Statisztikai adatok 61 GOR III (aminosavpárok, ill. triplettek) 62 Ptitsyn Finkelstein Fizikai kémiai tul. 61 Qian Sejnowski Neuronhálózat 60 GOR IV 63 Szegmensstatisztika Schneider 63 NSSP 70 Többszörös összerendezések, LPAG neuronhálózat 68 PHD 73 JPRED SOPMA CNRS Több más módszer alapján konszenzus 55 56 73 75 1. és 2. generációs módszerek: az egyes aminosavaknak a különbözõ másodlagos szerkezetekben való elõfordulásának gyakoriságai alapján dolgoznak. Pontosság <70%, béta szerkezetre csak 28 48%, túl rövid hélixek és béta szálak Chou Fasman: Alfa hélixet indít ott, ahol 6 egymás melletti aminosav közül 4 nek 1,03 a hélixben levési valószínûsége, béta szálat ott, ahol 5 egymás melletti aminosav közül 3 nak legalább 1,0 a bétában levési valószínûsége. Ezután a hélixeket és béta szálakat kiterjeszti mindkét irányba addig, amíg 4 egymás melletti aminosav átlagos hélix, ill. béta képzési valószínûsége 1,0 alá nem esik. Béta kanyar jóslása hasonló módon. GOR (Garnier Osguthorpe Robson): 17 aminosav szélességû ablakban vizsgálja az aminosavak elõfordulását, ezek alapján jósolja az ablak középsõ pozíciójában lévõ aminosavhoz tartozó másodlagos szerkezetet 3. generációs módszerek: a vizsgált szekvenciákhoz hasonlóakat keresnek és ezekbõl többszörös összerendezést készítenek, majd a többszörös összerendezésekben rejlõ információt használják fel. A többszörös összerendezések információt tartalmaznak az együtt mutálódó aminosavakról (korrelált mutációk), ezek többnyire a térszerkezetben egymáshoz közel vannak, tehát a többszörös összerendezés információt tartalmaz a fehérje harmadlagos szerkezetérõl, ily módon segíti a másodlagos szerkezet jóslását. Konszenzusos módszerek: több más módszert (2. és 3. generációs módszereket) alkalmaznak, az eredmények konszenzusát veszik. Pl. JPRED: Példa 3

PHD módszer (ma a legjobb, akár 77% pontosság) [Burkhard Rost] 1. adatbázisból kikeressük a rokon szekvenciákat (BLAST program) 2. Elkészítjük ezek többszörös összerendezését (MaxHom program) 3. Az összerendezés szûrése, jó homológok megtartása, újból összerendezés 4. A végsõ összerendezés alapján mindegyik pozícióra elkészítjük az elõforduló aminosavcserék profilját 5. Ez szolgál bemenetként a neuronhálózatnak Bár a PHD módszer a legjobbnak látszik, mégsem mindig az, ezért helyes, ha konszenzus módszert alkalmazunk, ill. több módszert együtt. Oldószer általi hozzáférhetõség predikciója Felszíni vagy eltemetett az oldallánc Kezdetleges predikció: az oldallánc hidrofobicitása alapján > gyenge eredmény Jobb predikció: evolúciós információ bevitele többszörös összerendezések útján > 75% pontosságú jóslás (PHDacc) Transzmembrán hélixek predikciója Transzmembrán fehérjék topológiája Három állapot: bent, kint, membránban Hidrofobicitási plot: valamilyen hidrofobicitási skála (itt: Kyte Doolittle) alapján, simítással. Pl. egy transzmembrán fehérjére a ProtScale programmal: 4

Jó, de durva becslést ad a transzmembrán régiókra. Kifinomultabb módszerek; a többszörös összerendezést használók itt is eredményesek (>95% pontosság) Pl. TMPRED, HMMTOP. Legpontosabbnak tûnik: rejtett Markov modell (HMMTOP by Tusnády Gábor): közel 100%. De: kevés az ismert szerkezet, így kevéssé ismert a megbízhatóság. 2D predikciók Oldallánc kontaktusok predikciója Az összes kontaktusból elvben felépíthetõ a 3D szerkezet Próbálkoztak kontaktusokat jósolni a következõk alapján: szekvenciában távoli aminosavak együtt elõforduló (korrelált) mutációi statisztika átlagtér potenciálok neuronhálózatok Az eddigi eredmények nem kielégítõek Fehérjeszerkezetek elemzése Célja: a mûködés mechanizmusának részletes megértése, az egyes szerkezeti motívumok felismerése, jelentõségük feltárása, stb. Minõségellenõrzés PDB ben lévõ szerkezetek nagy része tökéletlen, hibákat tartalmaz. A modellezéssel nyert szerkezetek még inkább. Minõségellenõrzés elvei: Kémiai felépítés: megvan e minden atom, nem szakadt e a lánc, stb. Sztereokémia: Kötéshosszak, kötésszögek, torziós szögek megfelelnek e az elvárható (a jó szerkezetek átlagából számított) értékeknek? Nincsenek e túl közel esõ atomok? Fehérjetulajdonságok: Ramachandran térképen a fi és pszi szögek eloszlása (nincs e valami a tiltott zónában, stb.); oldalláncok jó környezetben vannak e, megfelelõen szoros e a hidrofób mag pakoltsága, stb. Többféle program: PROCHECK, WHAT_CHECK PROCHECK kimenetek pl.: 5

Ramachandran plot Oldallánc paraméterek 6

Geometriai torzulások Másodlagos szerkezet A meglévõ atomi térszerkezet alapján hogyan definiáljuk a benne lévõ másodlagos szerkezeti elemeket? Másodlagos szerk. definiálható a fi, pszi szögek alapján is, de ez nem megbízható Bevált: a hidrogénkötési mintázat alapján (pl. hélixek: i >i+4 H kötések, stb.) Standard módszer: DSSP program (és adatbázis). Példa Kódok: H: Hélix, E: Béta szál, B: izolált H kötés, S: görbület, G: 3 10 hélix, stb. 7

Szerkezeti motívumok PROMOTIF program és adatbázis. Fõlánc H kötései Hélixek 8

Béta turnök Kölcsönhatás ligandumokkal Vizualizálható: LIGPLOT H kötéseket és hidrofób felszíneket mutatja 9

Töltésviszonyok Poisson Boltzmann módszerrel számítható az elektrosztatikus potenciál a fehérje felszínén és környezetében: DELPHI program. Megjelenítés: GRASP program (nem ingyenesek). acetilkolin észteráz Szubsztrát közelében a fókuszáló hatás, stb. leírható. Felszínek, üregek A felszín meghatározása: Vízmolekula (1,4 angström sugarú gömbbel modellezve) végiggördítése a felszínen Hozzáférhetõ felszín: a vízmolekula közepe által leírt felszín Molekuláris felszín: a vízmolekula felülete által leírt felszín 10

Standard program: Molecular Surface Package (Connolly) (nem ingyenes; számos ingyenes program van, amelyek rosszabbak) Az apoláros, pozitív, és negatív töltésû felszínrészek más más színnel jelölve Kék színnel jelöltük a fehérje belsejében lévõ üregeket. 11