A fehérjék térszerkezetének jóslása



Hasonló dokumentumok
8. A fehérjék térszerkezetének jóslása

A fehérjék térszerkezetének jóslása (Szilágyi András, MTA Enzimológiai Intézete)

Bioinformatika előad

7. Fehérjeszekvenciák és térszerkezetek analízise.

Szimulációk egyszerősített fehérjemodellekkel. Szilágyi András

Mai témák. Fehérjék dinamikájának jelentősége. Számítógépes modellezés jelentősége

Fehérjék rövid bevezetés

Genomadatbázisok Ld. Entrez Genome: Összes ismert genom, hierarchikus szervezésben (kromoszóma, térképek, gének, stb.)

Bioinformatika 2 6. előadás

Fehérje-fehérje kölcsönhatások és kölcsönhatási hálózatok. Szilágyi András

A fehérjék szerkezete és az azt meghatározó kölcsönhatások

Fehérjék szerkezetének predikciója, szerkezeti adatok felhasználása adatbázisok segítségével, a számítógépes molekuladinamikai modellezés alapjai

Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis

Az élő anyag szerkezeti egységei: víz, nukleinsavak, fehérjék. elrendeződés, rend, rendszer, periodikus ismétlődés

Problémák és megoldások a bioinformatikában. Válogatott fejezetek a bioinformatikából. Gyimesi Gergely, február 25.

A proteomika új tudománya és alkalmazása a rákdiagnosztikában

Bioinformatika 2 5. előadás

DNS, RNS, Fehérjék. makromolekulák biofizikája. Biológiai makromolekulák. A makromolekulák TÖMEG szerinti mennyisége a sejtben NAGY

Bioinformatika előad

Gyorsjelentés. az informatikai eszközök iskolafejlesztő célú alkalmazásának országos helyzetéről február 28-án, elemér napján KÉSZÍTETTÉK:

Matematikai statisztikai elemzések 2.

Hisztamin receptorok térszerkezetének vizsgálata és alkalmazása a gyógyszerkutatásban

A TÖMEGKÖZLEKEDÉSI KÖZSZOLGÁLTATÁS SZOLGÁLTATÓ JELLEGÉNEK MEGALAPOZÁSA: MEGÁLLÓHELY ELLÁTOTTSÁG BUDAPESTEN. Összefoglaló

org.hibernate.lazyinitializationexception: illegal access to loading collection at

A vállalkozás beszámolója

1) CO 2 hidrolízise a) semleges és b) bázikus körülmények között.

Proteomkutatás egy új tudományág születése

Feloldódnak-e a szociálismunkás-képzés dilemmái? Iskolaszövetség konferenciája Budai István PhD Budapest, június 2.

SZENT ISTVÁN EGYETEM

2. Ismert térszerkezetű transzmembrán fehérjék adatbázisa: a PDBTM adatbázis. 3. A transzmembrán fehérje topológiai adatbázis, a TOPDB szerver

Értelmezési szempontok

EMLÉKEZTETŐ. Az OKA tizenkettedik üléséről (2007. szeptember :00, SZMM, Tükörterem)

Tisztább termelés és energiahatékonyság integrálása a vállalati gyakorlatban (gyakorlati útmutató)

Reiczigel Jenő,

Zárójelentés. Állati rotavírusok összehasonlító genomvizsgálata. c. OTKA kutatási programról. Bányai Krisztián (MTA ATK ÁOTI)

Dualitás Dualitási tételek Általános LP feladat Komplementáris lazaság 2015/ Szegedi Tudományegyetem Informatikai Tanszékcsoport

HAZAI KÉRDÕÍV-ADAPTÁCIÓK

A TERMELÉSI FOLYAMATOK HATÉKONY ÉS OPTIMÁLIS IRÁNYÍTÁSA A KOMPLEX MÓDSZER ALKALMAZÁSÁVAL

SZAKMASPECIFIKUS BERUHÁZÁSI ELJÁRÁSREND előzetes javaslat 1

A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata

EGÉSZSÉGÜGYI DÖNTÉS ELŐKÉSZÍTŐ

Az informatikai stratégia kialakításának és megvalósításának irányelvei

Okos mérés a magyar villamos elosztóknál

PageRank algoritmus Hubs and Authorities. Adatbányászat. Webbányászat PageRank, Hubs and Authorities. Szegedi Tudományegyetem.

Technológiai Elôretekintési Program EMBERI ERÔFORRÁSOK

Ageometriai problémamegoldás útja a rajzoknál kezdõdik, hiszen a helyes következtetéshez

ERD14: egy funkcionálisan rendezetlen dehidrin fehérje szerkezeti és funkcionális jellemzése

Regressziószámítás alkalmazása kistérségi adatokon

GAZDASÁGMATEMATIKA KÖZÉPHALADÓ SZINTEN

ELŐADÁS ÁTTEKINTÉSE 6. ea.: Projekttervezés III.

Sztochasztikus folyamatok 1. házi feladat

Közhasznúsági jelentés 2010.

Nem kódoló RNS-ekből potenciálisan keletkező de novo fehérjék azonosítása és elemzése DIPLOMAMUNKA

Mesterséges intelligencia 1 előadások

Standardizálás Főátlagok bontása Alkalmazások Feladatok Vége

A BARCSAY JENŐ ÁLTALÁNOS ISKOLA PEDAGÓGIAI PROGRAMJA III. TANULÓK ÉRTÉKELÉSE

Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László

Biológiai makromolekulák szerkezete

Az alábbi áttekintés Délkelet-Európa (a volt Jugoszlávia országai

Elméleti tribológia és méréstechnika Összefüggések felület- és kenőanyag-minőség, súrlódás és kopás között

Nyelvi hálózatok és a mentális lexikon

SZENT ISTVÁN EGYETEM, GÖDÖLLŐ Gazdálkodás- és Szervezéstudományok Doktori Iskola. DOKTORI (PhD) ÉRTEKEZÉS TÉZISEI

Termelési rendszerek és folyamatok

14.4. Elõtanulmány az Információs Hadviselésrõl Honvédelmi Minisztérium Elektronikai, Logisztikai és Vagyonkezelõ Rt: Jávor Endre (2000)

AZ ÁLTALÁNOS ISKOLÁSOK IDEGENNYELV-TANULÁSI ATTITŰDJEI ÉS MOTIVÁCIÓJA

SSE-MOVE: ÁTALAKULÓ TÁRSADALOMBIZTOSÍTÁS

HELYZETKÉP A SZLOVÁKIAI MAGYAR KÖZOKTATÁSRÓL. A Szlovákiai Magyar Oktatási Fórum konferenciájának anyaga

A pozitív (avagy fehér) pedagógia aspektusai a mindennapi oktatási-nevelési folyamatban

Talajvizsgálat! eredmények gyakorlati hasznosítása

AZ ÉLELMISZERPIACI KUTATÓMUNKÁLATOK SZOCIÁLIS VONATKOZÁSAI ÍRTA:

S25-vung S25, ungar., A31008-H3100-A19-2-3A19. Kezelési útmutató

1A A A


ÁLLATTARTÁS MŰSZAKI ISMERETEI. Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP /1/A

Az építményt érő vízhatások

A szívizom perfúzió számítógépes mérése koszorúér angiogramokon

LAKOSSÁGI MEGTAKARÍTÁSOK: TÉNYEZÕK ÉS INDIKÁTOROK AZ ELÕREJELZÉSHEZ

Standardizálás, transzformációk

A replikáció mechanizmusa

A vállalatértékesítés hét aranyszabálya

4. Programozási nyelvek osztályozása. Amatőr és professzionális

Monte Carlo módszerek

SIMA Tartalom. Michelin mezıgazdasági abroncsai. A legjobb megtérüléső befektetés. Sajtókapcsolat:

Szerkesztette: Vizkievicz András

15. BESZÉD ÉS GONDOLKODÁS

* Modern piacelmélet. ELTE TáTK Közgazdaságtudományi Tanszék. Tárgyfelelős neve * Modern piacelmélet Összejátszás, kartell

Nevelési tanácsadó Logopédiai intézet OM azonosító:

A évi integritásfelmérések céljai, módszertana és eredményei

Bioinformatics: Blending. Biology and Computer Science

A tremor elektrofiziológiai vizsgálata mozgászavarral járó kórképekben. Doktori tézisek. Dr. Farkas Zsuzsanna

L Ph 1. Az Egyenlítő fölötti közelítőleg homogén földi mágneses térben a proton (a mágneses indukció

Statisztika I. 6. előadás. Előadó: Dr. Ertsey Imre

Röntgendiffrakció, tömegspektrometria, infravörös spektrometria.


Szakmai ajánlás. az egységes villamos energia feszültség minőség monitoring rendszer kialakítására

AMINOSAVAK, FEHÉRJÉK

7. A Poisson folyamat


A BETON NYOMÓSZILÁRDSÁGI OSZTÁLYÁNAK ÉRTELMEZÉSE ÉS VÁLTOZÁSA 1949-TŐL NAPJAINKIG

Az Ön professzionális vállalati alkalmazása. Emberi erőforrás és projektmenedzsment szoftver

Átírás:

A fehérjék térszerkezetének jóslása 1. A probléma bonyolultsága 2. A predikció szintjei 3. 1D predikciók (másodlagos szerkezet, hozzáférhetõség, transzmembrán hélixek 4. 2D predikciók (oldallánc kontaktusok, szálkontaktusok) 5. 3D predikciók (homológiamodellezés, gombolyfelismerés és felfûzés, ab initio modellezés) A probléma bonyolultsága Általánosságban: találjuk meg egy tetszõleges szekvencia azon konformációját, amely a szabadentalpia globális minimumát adja. Egyszerû modellekben kimutatható: a feladat ún. NP nehéz, vagyis a megoldásához szükséges idõ a (fehérje)mérettel nempolinomiális függvény szerint (hanem annál gyorsabban) növekszik. (Vagyis bizonyos mérethatár fölött nem megoldható.) Gyakorlatban: a valódi fehérjék szekvenciái nagyon specifikusak (evolúció során kiválogatódtak); a predikcióhoz felhasználhatjuk a már ismert térszerkezeteket mint tudásbázist A gyakorlatban tehát a probléma kezelhetõ. A predikció szintjei Jósolhatóak a fehérjeszerkezet egy, két, ill. háromdimenziós aspektusai: (1D, 2D és 3D információ. A 2D a kontaktustérkép.) 1D: aminosavakhoz köthetõ tulajdonságok, melyek 1D stringként írhatóak fel. Pl.: szekvencia, másodlagos szerkezet, oldószer általi hozzáférhetõség, hidrofobicitás 2D: aminosavpárok közötti távolságok, kontaktusok 3D: az összes atomi koordináta 1D predikciók Másodlagos szerkezet jóslása a szekvenciából 1

Módszer Mûködés elve Kb. pontosság (%) 1. generációs 2. generációs Chou Fasman (CF) Garnier Osguthorpe Robson (GOR I, GOR II) Az egyes aminosavtípusok elõfordulásának valószínûsége a különbözõ másodlagos szerkezeti elemekben Lim 57 Nagano Statisztikai adatok 61 (aminosavpárok, ill. GOR III triplettek) 62 55 56 Ptitsyn Finkelstein Fizikai kémiai tul. 61 Qian Sejnowski Neuronhálózat 60 GOR IV Szegmensstatisztika 63 Schneider 63 3. generációs NSSP Többszörös 70 LPAG összerendezések, neuronhálózat 68 PHD 73 1. és 2. generációs módszerek: pontosság <70%, béta szerkezetre csak 28 48%, túl rövid hélixek és béta szálak. Miért pontatlanok? Szokásos magyarázat: mert nem veszik figyelembe a szekvenciában egymástól távol, de a térszerkezetben közel lévõ aminosavak hatását a másodlagos szerkezetre. 3. generációs módszerek: több hasonló aminosavszekvencia többszörös összerendezésében rejlõ információt használják fel. Miért pontosabbak? Az egymástól a szekvenciában távol, de a térszerkezetben közel lévõ aminosavak gyakran mutálódnak egyszerre (korrelált mutációk), s ez az információ a többszörös szekvenciaösszerendezésekben megvan. A többszörös összerendezés tehát impliciten a térszerkezetre vonatkozóan is tartalmaz információt, ezáltal lehet pontosabb a másodlagos szerkezet jóslása. PHD módszer (ma a legjobb, akár 77% pontosság) [Burkhard Rost] 1. adatbázisból kikeressük a rokon szekvenciákat (BLAST program) 2. Elkészítjük ezek többszörös összerendezését (MaxHom program) 3. Az összerendezés szûrése, jó homológok megtartása, újból összerendezés 4. A végsõ összerendezés alapján mindegyik pozícióra elkészítjük az elõforduló aminosavcserék profilját 5. Ez szolgál bemenetként a neuronhálózatnak 2

Oldószer általi hozzáférhetõség predikciója Felszíni vagy eltemetett az oldallánc Kezdetleges predikció: az oldallánc hidrofobicitása alapján > gyenge eredmény Jobb predikció: evolúciós információ bevitele többszörös összerendezések útján > 75% pontosságú jóslás (PHDacc) Transzmembrán hélixek predikciója Transzmembrán fehérjék topológiája Három állapot: bent, kint, membránban Több módszer; a többszörös összerendezést használók itt is eredményesek (>95% pontosság) Legpontosabb: rejtett Markov modell (Tusnády G.): közel 100% Oldallánc kontaktusok predikciója 2D predikciók Az összes kontaktusból elvben felépíthetõ a 3D szerkezet Próbálkoztak kontaktusokat jósolni a következõk alapján: szekvenciában távoli aminosavak együtt elõforduló (korrelált) mutációi statisztika átlagtér potenciálok neuronhálózatok Az eddigi eredmények nem kielégítõek CASP ok 3D predikciók CASP: Critical Assessment of Methods of Protein Structure Prediction (fehérjeszerkezet jóslási módszerek kritikai felülvizsgálata): kétévenként megrendezett "verseny" a predikcióval foglalkozó kutatócsoportok között CASP1 (1994), CASP2 (1996), CASP3 (1998), CASP4 (2000). CAFASP1 (1998), CAFASP2 (200): FA=Fully Automated: teljesen automatikus módszerek ellenõrzése Forgatókönyv: Röntgenes és NMR es csoportoktól begyûjtik azon fehérjék szekvenciáit, melyek szerkezete várhatóan rövidesen ismertté válik a kutatócsoportok néhány hónap alatt ezekre predikciókat küldenek be decemberben (mikor már megvanak a kísérleti szerkezetek) összeülnek és megbeszélik az eredményt; a legsikeresebb jósok elõadást tartanak; a Proteins c. folyóirat különszámot ad ki (a következõ év októbere táján, tehát a CASP4 eredményeit még nem közölték). Három kategória Homológiamodellezés (komparatív modellezés): ha a szekvenciánkhoz van ismert térszerkezetû, a szekvenciánkkal számottevõ szekvenciaazonosságot (> 20%) mutató homológ, akkor annak térszerkezete alapján építhetjük fel a mi szekvenciánk jósolt térszerkezetét. 3

Gombolyfelismerés (fold recognition): alacsony szekvenciaazonosság mellett meg kell találni, van e az ismert térszerkezetek között a szekvenciánkkal kompatibilis gomboly, s melyik az. Ha találtunk ilyet, akkor homológiamodellezéssel szerkezet is építhetõ. Emlékeztetõ: gomboly alatt (az angol fold szó fordítása) a fehérje nagy vonalakban vett szerkezetét, a polipeptidlánc gerincének hozzávetõleges térbeli lefutását értjük. A hasonló szerkezetû fehérjék tehát azonos gombollyal rendelkeznek. Ab initio predikció: nincs számottevõ szekvenciaazonosság ismert térszerkezetû fehérjével, s nincs kompatibilis gomboly sem, tehát a szekvenciánkhoz tartozó gomboly ismeretlen. A térszerkezet predikció ilyenkor fizikai elvek felhasználásával történhet. A predikció várható sikeressége A szekvencia adatbázis gyorsabban növekszik, mint a térszerkezeti adatbázis Térszerkezet jobban konzerválódott, mint a szekvencia: két fehérje 30% os szekvenciaazonossága esetén térszerkezetük nagyon hasonló. 20 30% között (szürkületi zóna) a hasonlóság kérdésessé válik, de még 10% alatti szekvenciaazonosság esetén is elõfordulhat Térszerkezet jóslás legjobban használható módszerei: Homológiamodellezés: ha az ismeretlen térszerkezetû fehérje szekvenciája >20 25% azonosságot mutat egy már ismert térszerkezetûével, akkor jó közelítõ modell építhetõ "Gombolyfelismerõ" (fold recognition) eljárások: az esetek egy részében kisebb szekvenciaazonosság esetén is azonosítják a "gombolyt", ezután pedig a homológiamodellezés már alkalmazható a megtalált hasonló térszerkezet felhasználásával. Adott szekvencia mekkora valószínûséggel modellezhetõ a fenti eljárásokkal? Attól függ, honnan vesszük a szekvenciát: (HoMo: homológiamodellezés, FoRc: fold recognition [gombolyfelismerés], UFo: unknown fold [ismeretlen gomboly], UFo+FoRC: határeset) PDB erõsen redundáns: a benne lévõ szerkezetek 58% a modellezhetõ lenne más ismert szerkezetek alapján SWISS PROT szekvenciaadatbázis szintén torz: a benne lévõ szekvenciák kb. 30% ára lehetne homológiamodellezéssel modellt építeni Újonnan megszekvenált genomok fehérjéi: csak kb. 10% ra lenne építhetõ homológiamodell; kb. 40% felismerhetõ lenne gombolyfelismeréssel, a többi 50% teljesen új szerkezet Szerkezeti genomika: célja, hogy a genomban kódolt fehérjék közül kiválogassa azokat a fehérjéket, amelyek szerkezetét kísérletesen (röntgen, NMR) meghatározva az összes többi fehérje homológiamodellezhetõvé válik Homológiamodellezés A homológiamodellek rendkívül hasznosak kísérletek tervezéséhez, hipotézisek felállításához, stb. Hagyományos módszer: lánctöredékek összeszerelése Kiindulás: referenciafehérjék (más néven: templátok vagy anyaszerkezetek): a modellezendõ fehérje szekvenciájával jelentõs azonosságot mutató fehérjék ismert szerkezete "Új" fehérje (más néven: célfehérje): a modellezendõ fehérje, melynek csak a szekvenciája ismert 4

A három fehérjét egymásra illesztjük, így kitûnik, melyek a szerkezetileg konzerválódott régiók (SCR ek) és a variábilis régiók (VR ek): A három fehérje szekvenciáját a térszerkezetek fedése alapján összerendezzük, majd hozzárendezzük az új fehérje szekvenciáját: Az új fehérje felépítése: az SCR eket bármelyik referenciafehérjébõl átvehetjük: 5

A VR eket egyenként megvizsgáljuk. A referenciafehérjék megfelelõ VR jei közül kiválasztjuk a legilleszkedõbbeket. Ha nincs megfelelõ, akkor adatbázisban keresünk odaillõ hurkot. Így elõáll a durva modell, mely darabokból van összeszerelve. Energiaminimalizálással finomítható. Oldalláncok modellezése: az oldalláncokat ki kell cserélni a célfehérjének megfelelõre. Konformációjuk beállítása: a templátfehérjékbõl átvenni, amennyire lehet, ill. különféle optimalizálási eljárások (pl. rotamerkonformációkkal) Hurkok modellezése: ha a templátfehérjék között nincs megfelelõ, akkor hurokadatbázisban keresünk megfelelõt, vagy valamilyen konformációkeresõ eljárást alkalmazunk 6

A modell pontossága: az SCR ek közepén a legpontosabb, a hurkokban a legpontatlanabb A térbeli kényszerek kielégítésén alapuló módszer MODELLER program (Andrej Sali) A templátszerkezetekbõl térbeli kényszereket vezet le a célszerkezetre vonatkozóan (pl. atompárok távolsága, atomhármasok szöge, stb.) A kényszereket egy célfüggvénybe egyesíti, majd random kiinduló szerkezetbõl kiindulva szimulált hõkezeléssel optimalizálja Jó minõségû szerkezeteket állít elõ, kevés sztereokémiai hiba Homológiamodellezés a CASP3 on Alkalmazott módszerek: a fenti módszerek kombinációi, speciális algoritmusokkal bõvítve, sok helyen emberi beavatkozással Sikeresség: X: szekvenciaazonosság a templáttal, Y: rmsd a valódi szerkezettõl rmsd: root mean square deviation, két szerkezet egymástól való különbözõségének mértéke, tkp. az egymásnak megfelelõ atomok közötti távolságok négyzetes közepe. Látható: kb. 30% szekvenciaazonosság fölött igen jó modell építhetõ A nagyobb, templát nélküli hurkok és az oldalláncok modellezése nem kielégítõ pontosságú Legkritikusabb tényezõ: a szekvencia szerkezet összerendezés. Az összerendezést nagyon gondosan kell elkészíteni, pl. figyelembe véve a templátszerkezetekben konzerválódott H kötéseket, kontaktusokat, stb. Az elkészült modellt megvizsgálva az összerendezésen javítani lehet, s annak alapján jobb modellt építeni Gombolyfelismerés Távoli homológok (<25% szekvenciaazonosság) gyakran azonos gombollyal rendelkeznek. A feladat ennek felismerése Két dolog kell hozzá: Egy "gombolykönyvtár", ami az ismert térszerkezeteket (gombolyokat) tartalmazza valamilyen formában. Egy összehasonlító módszer, amellyel meg tudjuk állapítani, hogy egy adott szekvencia mennyire illeszthetõ, húzható rá egy adott térszerkezetre A módszer: a szekvenciánkat egyenként az összes gombollyal összehasonlítjuk, hogy megtaláljuk, van e köztük olyan, amit a szekvenciánk felvehet. Általános eljárás: felfûzés (threading): az ismeretlen szerkezetû fehérje szekvenciáját valamiképpen "fel kell fûzni" az ismert térszerkezetekre, és valamilyen potenciálfüggvénnyel értékelni kell a szekvencia és a szerkezet illeszkedését Korábbi eljárások: az oldalláncok környezetét vették alapul (környezet polaritása, eltemetettség, másodlagos szerkezet, stb.) Újabb eljárások: a párpotenciálokon van a hangsúly (az ismert térszerkezetekben található aminosav aminosav kontaktusok alapján levezetett potenciálfüggvények) 7

Felfûzés a CASP3 on A hat legeredményesebb csoport módszerei: Három csoport (Jones, Sippl, Bryant) párpotenciálokon alapuló pontozófüggvényt alkalmazott, kiegészítésekkel: Jones csoportja és Sippl csoportja (ProFIT program): a potenciálfüggvény az aminosavpárok szekvenciabeli és térbeli távolságától is függ; továbbá a jósolt másodlagos szerkezetet is figyelembe veszik Bryant: a kontaktpotenciálokon felül az ismert térszerkezetekben talált, konzerválódott hidrofób magok ismeretére is támaszkodott K. Karplus: tisztán szekvencia alapú módszer, ún. rejtett Markov modell Nishikawa, Koretke csoportjai: sokféle módszer kombinációját alkalmazták, ezek alapján konszenzus Eredmények: A legjobb gombolyfelismerési predikciók. X: a fehérje hossza; Y: az 5 angströmnél kisebb rmsd vel (a valódi szerkezettõl való eltérés) prediktált aminosavak száma Látható: az eredmény vegyes. Néhány fehérjére jó a predikció, a többségre elég rossz, némelyikre csapnivaló A felfûzési módszerek egyelõre nem kielégítõek (egyetlen módszer sem képes az esetek >40% ában helyes eredményt adni) Távoli homológiák felismerése Ha szekvenciahasonlóság alapján a szekvenciánkhoz nem találunk ismert térszerkezetû homológot, akkor segíthet egy olyan módszer, amely távoli homológokat is megtalál, s ezek között lehet egy olyan, ismert térszerkezetû homológ, amelyet fel tudunk használni a térszerkezet jósláshoz. A gombolyfelismerés is tkp. távoli homológiát detektál (felismeri a rokonságot két fehérje között az alacsony szekvenciabeli hasonlóság ellenére). A probléma másik megközelítése: tisztán a szekvenciák alapján dolgozunk PSI BLAST program (Position Specific Iterated Basic Local Alignment Search Tool): a BLAST összerendezés keresõ program kiterjesztése: Elõbb egy hagyományos BLAST kereséssel kigyûjti egy szekvencia homológjait, ezekbõl többszörös összerendezést készít A többszörös összerendezésbõl elkészít egy szekvenciaprofilt A szekvenciaprofillal újból keresést végez a szekvenciaadatbázison Ezáltal távolabbi homológokat is megtalál A PSI BLAST a felfûzési módszerekkel összemérhetõ hatásfokkal találja meg a távoli homológokat, így a gombolyfelismerés versenytársa lehet. Ab initio térszerkezetjóslás CASP3 A célszerkezetek: 8

Az alkalmazott módszerek Nincs standard eljárás. Sokféle, egyedi módszer: Skolnick és mtsai: többszörös szekvenciaösszerendezésekbõl kényszerfeltételeket vezettek le a másodlagos és harmadlagos szerkezetre [kontaktusok] nézve. Ezután rácsmodellként szimulálták a fehérje felgombolyodását; 1000 szimuláció közül a legalacsonyabb energiát eredményezõt tekintették végleges modellnek Scheraga és mtsai: "egyesített atom" modellben (csak alfa szénatomok) konformációkeresés, majd "összes atom" modellben finomítás Osguthorpe: egyszerûsített fehérjemodell, molekuladinamikai szimulált hõkezelés Levitt és mtsai: tetraéderes rácsmodellként generálták az összes lehetséges konformációt, majd a legalacsonyabb energiájúakat alapul véve, másodlagosszerkezet jóslást is felhasználva, áttértek "összes atom" modellekre, ezeket egy komplex pontozófüggvénnyel értékelték Mosberg és mtsai: másodlagosszerkezet jóslás után manuálisan illesztgették össze a másodlagos szerkezet elemeit, hogy eltemetõdjenek a hidrofób felszínek Baker és mtsai: 3 9 aminosav hosszúságú fragmentumokra kerestek modelleket az ismert szerkezetek adatbázisában, majd ezeket összeillesztették, egy energiafüggvénnyel értékelték, majd a szemre legjobban kinézõ mellett döntöttek Eredmények Több csoportnak sikerült >30 aminosavas fragmentumokat jó közelítéssel jósolni (< 4 angström rmsd) Az alfa és az alfa béta típusú fehérjék architektúráját többnyire jól megközelítették 9

A tudás alapú (ismert szerkezetek adatbázisára támaszkodó) módszerek jobban teljesítettek, mint a fizikai alapú módszerek Egészében véve komoly elõrelépés van a CASP2 höz képest CAFASP1 Teljesen automatikus gombolyfelismerési módszerek tesztje Eredmény: jóval gyengébben mûködnek, mint emberi beavatkozással További kilátások CASP4: már lezajlott, de még nem közölték az eredményeket. Nagyobb szabású predikciós projektek kezdõdtek a szerkezeti genomikai programok kapcsán Már van MODBASE modelladatbázis, mely folyamatosan bõvül. A kísérletes szerkezetek meghatározásával párhuzamosan ellenõrizhetõk a modellek 10