Semmelweis Egyetem / Élettni Intézet / Bupest Bioinformtik és genomnlízis z orvostuományn Töszörös szekveni illesztés Cserző Miklós 2018
Semmelweis Egyetem / Élettni Intézet / Bupest A mi előás A töszörös illesztés iológii jelentősége A prolém komplexitás Progresszív mószer Itertív mószer Gloális mószerek Genetikus lgoritmus szimulált ermeés Kpsolóó tázisok Bioinformtik és genomnlízis z orvostuományn - 4 2
Semmelweis Egyetem / Élettni Intézet / Bupest Aminósvk helyettesítése Egy elrontott minósv sere tönkre teszi fehérjét Akár szekveniálisn 85%-n eltérő fehérjék szerkezete is lehet zonos Bizonyos minósvk szerkezet izonyos pontjin izonyos mértéken helyettesíthetik egymást Más pontokon más szályok érvényesek Bioinformtik és genomnlízis z orvostuományn - 4 3
Semmelweis Egyetem / Élettni Intézet / Bupest A töszörös illesztés jelentősége Az illesztés során láthtóvá válnk szekveniák konzervált és nem konzervált részei A szerkezet és funkió szempontjáól minkét rész fontos, sk másképp Two homologous sequenes whisper... full multiple lignment shouts out lou. A. Lesk Bioinformtik és genomnlízis z orvostuományn - 4 4
Semmelweis Egyetem / Élettni Intézet / Bupest Bioinformtik és genomnlízis z orvostuományn - 4 5
Semmelweis Egyetem / Élettni Intézet / Bupest A prolém komplexitás 3 szekveni esetén illesztőfelület helyett illesztőtérfogt ( 1000 3 fehérjékre) N szekveni esetén N-imenziós sztkt tér Len Nseq ezen még lehet segíteni Dinmikus progrmozás: Nem kell teljes illesztőfelület elég egy sor Memóritkrékos Viszont töször kell átszámolni z illesztőfelületet futási iő hossz Bioinformtik és genomnlízis z orvostuományn - 4 6
Semmelweis Egyetem / Élettni Intézet / Bupest Továi onyolmk Hány esetet kell vizsgálni egy-egy elemi lépésen? Minen oszlop etűk és etolások komináiój Betű: 1, etolás: 0 A lehetőségek szám: 2 n -1 Heurisztikus megolás: Nem vizsgál meg minen lehetőséget Nem grntált, hogy legjo megolást tlálj meg Eljut egy elég jó megoláshoz gyorsn Bioinformtik és genomnlízis z orvostuományn - 4 7
Semmelweis Egyetem / Élettni Intézet / Bupest Progresszív (hierrhikus) mószer A emenő szekveniákt páronként illesztjük (N-W szerint, n 2 -tel rányos) Filogenetiki fát építünk ez lpján Kiválsztjuk két legközelei rokont Ehhez egyesével hozzávesszük töi szekveniát A hsonlóktól hlunk távoli rokonok felé Az egyszer már illesztett részt nem piszkáljuk Bioinformtik és genomnlízis z orvostuományn - 4 8
Semmelweis Egyetem / Élettni Intézet / Bupest Az eljárás menete Bemenő tok Csirke Illesztés Csirke egér Renezés Emer Mjom Töszörös illesztés Egér Emer Kuk Kuty Mjom Csirke emer Csirke kuk... Egér Kuty Csirke Kuk Bioinformtik és genomnlízis z orvostuományn - 4 9
Semmelweis Egyetem / Élettni Intézet / Bupest A Clustl slá Letölthető: http://www.lustl.org/ Winows, M és Linux verzión is Ugynott okumentáió, tutoril st.. Vgy we-en keresztül elérhető: http://www.ei..uk/tools/ms/lustlw2/ Nem kell helyi gépre feltenni, e megkötésekkel lehet sk hsználni Bioinformtik és genomnlízis z orvostuományn - 4 10
Semmelweis Egyetem / Élettni Intézet / Bupest Bioinformtik és genomnlízis z orvostuományn - 4 11
Semmelweis Egyetem / Élettni Intézet / Bupest Bioinformtik és genomnlízis z orvostuományn - 4 12
Semmelweis Egyetem / Élettni Intézet / Bupest Prméterek Szekveni Bioinformtik és genomnlízis z orvostuományn - 4 13
Semmelweis Egyetem / Élettni Intézet / Bupest A Gonnet mátrix Bioinformtik és genomnlízis z orvostuományn - 4 14
Semmelweis Egyetem / Élettni Intézet / Bupest A T-Coffee slá Honlp: http://toffee.rg.t/ Letölthető, e sk Linux renszerre A honlpon szerver szolgálttás is elérhető Vn lehetőség z összes lehetséges prméter állításár Fő eltérés: képes más progrmok illesztéseit kominálni Felhsználhtó szerkezeti informáió is Bioinformtik és genomnlízis z orvostuományn - 4 15
Semmelweis Egyetem / Élettni Intézet / Bupest Az lgoritmus A emenő szekveniákt páronként illesztjük Eől könyvtárt készítünk: ez z egymásnk megfelelő minósvk listáj Az így kpott list-elemekhez súlyokt renelünk Bővítjük listát: egy hrmik szekvenián keresztül is összetrtozik két minósv? H igen, megnöveljük z ereeti súlyfktort Az illesztés súlyfktorok lpján készül Bioinformtik és genomnlízis z orvostuományn - 4 16
Semmelweis Egyetem / Élettni Intézet / Bupest sirke egér i j P konzervált A.A. Könyvtári ejegyzés: sirke(i) egér(j) súlyozás: W(sirke(i),egér(j))=P A könyvtár kiterjesztése: i sirke k kuk W (sirke(i),kuk(k)) egér kuk j k* W (egér(j),kuk(k*)) k = k*? W kise kettő közül W + W St.. Bioinformtik és genomnlízis z orvostuományn - 4 17
Semmelweis Egyetem / Élettni Intézet / Bupest Progresszív illesztés A szekveniákt páronként illesztjük Először leginká hsonlókt vesszük A távoli rokonok felé hlunk Az illesztőfelületet súlyozó fktorok ják Bioinformtik és genomnlízis z orvostuományn - 4 18
Semmelweis Egyetem / Élettni Intézet / Bupest A mószer tuljonsági Tö szekveni-illsztést is fel lehet hsználni (lokális és gloális ereményt is) Az egyes eremények nem feltétlenül vnnk összhngn egymássl Ilyenkor győzzön jo ( ngyo súlyú) Pontos ereményt ClustlW-nál, és elég gyors is Bioinformtik és genomnlízis z orvostuományn - 4 19
Semmelweis Egyetem / Élettni Intézet / Bupest Bioinformtik és genomnlízis z orvostuományn - 4 20
Semmelweis Egyetem / Élettni Intézet / Bupest Bioinformtik és genomnlízis z orvostuományn - 4 21
Semmelweis Egyetem / Élettni Intézet / Bupest Bioinformtik és genomnlízis z orvostuományn - 4 22
Semmelweis Egyetem / Élettni Intézet / Bupest Bioinformtik és genomnlízis z orvostuományn - 4 23
Semmelweis Egyetem / Élettni Intézet / Bupest A DIALIGN renszer Honlp: http://ilign.gois.e/ Letölthető Linux renszerre We-en keresztül is hsználhtó Ugynott elérhető: interktív illesztés megjelenítő Fehérje és DNS szekveniát is kezel Bioinformtik és genomnlízis z orvostuományn - 4 24
Semmelweis Egyetem / Élettni Intézet / Bupest Hogyn műköik Rövi, tolás nélküli szkszokt keres Ezek ják mj z illsztés vázát A tlált szkszok nem feltétlenül képesek konzisztens illesztést ni Ki kell oni z inkonzisztens szkszokt A töi horgony-pontokt jelöl ki z illesztésen A horgony-pontokól kiinulv illesztünk Bioinformtik és genomnlízis z orvostuományn - 4 25
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 26
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 27
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 28
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 29
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 30
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 31
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 32
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 33
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 34
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 35
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 36
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 37
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 38
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 39
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 40
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 41
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 42
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 43
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 44
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 45
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 46
Semmelweis Egyetem / Élettni Intézet / Bupest S1 S2 S3 S4 S5 S6 Bioinformtik és genomnlízis z orvostuományn - 4 47
Semmelweis Egyetem / Élettni Intézet / Bupest Bioinformtik és genomnlízis z orvostuományn - 4 48
Semmelweis Egyetem / Élettni Intézet / Bupest Szünet Bioinformtik és genomnlízis z orvostuományn - 4 49
Semmelweis Egyetem / Élettni Intézet / Bupest Itertív eljárások A progresszív eljárásn z egyszer már elfogott illesztés nem móosul H egy hi ekerül egyszer, z enn is mr Esetleg még továi hiákt okoz Az itrtív mószerek felülvizsgálják már illesztett részeket is Így jvítják végereményt Bioinformtik és genomnlízis z orvostuományn - 4 50
Semmelweis Egyetem / Élettni Intézet / Bupest A MUSCLE eljárás Honlp: http://www.rive5.om/musle/ We szolgálttás z EBI felületen keresztül Letölthető Linux és Winows változtn is Bőséges okumentáió elérhető we-en A progrm szöveges felületen keresztül hsználhtó Bioinformtik és genomnlízis z orvostuományn - 4 51
Semmelweis Egyetem / Élettni Intézet / Bupest Az lgoritmus A folymt 3 fázisn műköik: Vázltos illsztés: K-mer szvk lpján számolt távolság-mátrix Vázltos szármzástni f Progresszív illesztés Finomított illesztés: Az illesztés lpján számolt távolság-mátrix Finomított szármzástni f Finomított progresszív illesztés Bioinformtik és genomnlízis z orvostuományn - 4 52
Semmelweis Egyetem / Élettni Intézet / Bupest Itertív finomítás A f egy ágát eltöröljük A két részt külön hsználv új illesztést készítünk Komináljuk két illesztést H jvult z illesztés, megtrtjuk z ereményt és új iklust kezünk Aig sináljuk, míg nem jvul tová Bioinformtik és genomnlízis z orvostuományn - 4 53
Semmelweis Egyetem / Élettni Intézet / Bupest Bioinformtik és genomnlízis z orvostuományn - 4 54
Semmelweis Egyetem / Élettni Intézet / Bupest Bioinformtik és genomnlízis z orvostuományn - 4 55
Semmelweis Egyetem / Élettni Intézet / Bupest Továi mószerek Iteráiós eljárások: Genetikus lgoritmus Szimulált ermeés (simulte nneling) Az egesz illesztés változik, semmi sem rögzített A gloális megolás él Ngy számítási kpitást igényel Bioinformtik és genomnlízis z orvostuományn - 4 56
Semmelweis Egyetem / Élettni Intézet / Bupest Genetikus lgoritmus iológii nlógi Létrehozunk véletlenszrű változtokt - szülők Ezeket egymássl komináljuk - utóok Továi véletlenszrű változttások mutáió Kiválsztjuk legjokt szelekió Ezek lesznek szülők kovetkező iklusn Bioinformtik és genomnlízis z orvostuományn - 4 57
Semmelweis Egyetem / Élettni Intézet / Bupest Bioinformtik és genomnlízis z orvostuományn - 4 58
Semmelweis Egyetem / Élettni Intézet / Bupest szülők Bioinformtik és genomnlízis z orvostuományn - 4 59
Semmelweis Egyetem / Élettni Intézet / Bupest szülők Bioinformtik és genomnlízis z orvostuományn - 4 60
Semmelweis Egyetem / Élettni Intézet / Bupest szülők Bioinformtik és genomnlízis z orvostuományn - 4 61
Semmelweis Egyetem / Élettni Intézet / Bupest szülők utóok Bioinformtik és genomnlízis z orvostuományn - 4 62
Semmelweis Egyetem / Élettni Intézet / Bupest szülők utóok Bioinformtik és genomnlízis z orvostuományn - 4 63
Semmelweis Egyetem / Élettni Intézet / Bupest szülők utóok kiválsztás Bioinformtik és genomnlízis z orvostuományn - 4 64
Semmelweis Egyetem / Élettni Intézet / Bupest szülők utóok kiválsztás Bioinformtik és genomnlízis z orvostuományn - 4 65
Semmelweis Egyetem / Élettni Intézet / Bupest szülők utóok kiválsztás túlélők Bioinformtik és genomnlízis z orvostuományn - 4 66
Semmelweis Egyetem / Élettni Intézet / Bupest szülők utóok kiválsztás túlélők Bioinformtik és genomnlízis z orvostuományn - 4 67
Semmelweis Egyetem / Élettni Intézet / Bupest Szimulált ermeés fiziki nlógi felmelegítjük renszert Hgyuk kihűlni A renszer megerme Beáll fázisátmenet kikristályosoik Megint felmelegítjük, e most nem nnyir St Bioinformtik és genomnlízis z orvostuományn - 4 68
Semmelweis Egyetem / Élettni Intézet / Bupest Töszörös illesztés esetén A szekveniákt telerkjuk etolássl Kis gokn elvesszük felesleges etolásokt H z illesztés már nem jvul tová, visszteszünk egy g etolást. St.. Bioinformtik és genomnlízis z orvostuományn - 4 69
Semmelweis Egyetem / Élettni Intézet / Bupest Ellenőrző tázisok Sok lehetőség zvrón sok megolás Melyik legjo? Minen szerző sját teszteket közöl Szükség vn egy közös összehsonlítási lpr Tö ilyen is vn... Bioinformtik és genomnlízis z orvostuományn - 4 70
Semmelweis Egyetem / Élettni Intézet / Bupest A BALiBASE tázis Kifejezettem töszörös illesztések kiróálásár és minősítésére készült 10 ktegórián meg előre elkészített refereni illsztéseket A legtöhöz elérhető szerkezet is Az illeszések kézzel készültek Az tok szon letölthetők: http://lgi.fr/lise/ Bioinformtik és genomnlízis z orvostuományn - 4 71
Semmelweis Egyetem / Élettni Intézet / Bupest Bioinformtik és genomnlízis z orvostuományn - 4 72
Semmelweis Egyetem / Élettni Intézet / Bupest Egyenlő evolúiós távolságú szekveniák Bioinformtik és genomnlízis z orvostuományn - 4 73
Semmelweis Egyetem / Élettni Intézet / Bupest Fehérjesláok egy kilógó, távoli tggl Bioinformtik és genomnlízis z orvostuományn - 4 74
Semmelweis Egyetem / Élettni Intézet / Bupest Alsláok gyenge homológiávl Bioinformtik és genomnlízis z orvostuományn - 4 75
Semmelweis Egyetem / Élettni Intézet / Bupest A terminálisokon túlnyúló végek Bioinformtik és genomnlízis z orvostuományn - 4 76
Semmelweis Egyetem / Élettni Intézet / Bupest Hosszú etolások középen Bioinformtik és genomnlízis z orvostuományn - 4 77
Semmelweis Egyetem / Élettni Intézet / Bupest Repetitív elemeket trtlmzó szekveniák Bioinformtik és genomnlízis z orvostuományn - 4 78
Semmelweis Egyetem / Élettni Intézet / Bupest Trnszmemrán szekveniák Bioinformtik és genomnlízis z orvostuományn - 4 79
Semmelweis Egyetem / Élettni Intézet / Bupest Pélák irkuláris permutáiór Bioinformtik és genomnlízis z orvostuományn - 4 80
Semmelweis Egyetem / Élettni Intézet / Bupest SABmrk tázis A teljes protein univerzumot lefei Csk 25 szekveniát trtlmz sláonként lkonyzón -gyüjtemény ngyon lsony fokú rokonság ngyslá -gyüjtemény kisit ngyo fokú rokonság A gyüjtemények szánékosn trtlmznk nem oillő szekveniákt http://ioinformtis.vu..e/tses/t ses.html Bioinformtik és genomnlízis z orvostuományn - 4 81
Semmelweis Egyetem / Élettni Intézet / Bupest Bioinformtik és genomnlízis z orvostuományn - 4 82
Semmelweis Egyetem / Élettni Intézet / Bupest Továi tázisok HOMSTAD: http://mizuguhil.org/homstr/ OXBENCH: http://www.ompio.unee..uk/ Bioinformtik és genomnlízis z orvostuományn - 4 83
Semmelweis Egyetem / Élettni Intézet / Bupest Bioinformtik és genomnlízis z orvostuományn - 4 84
Semmelweis Egyetem / Élettni Intézet / Bupest Bioinformtik és genomnlízis z orvostuományn - 4 85
Semmelweis Egyetem / Élettni Intézet / Bupest Mit tnultunk m? A töszörös szekveni illesztés leghtékony ioinformtiki mószer A feltnk nins egzkt megolás, nnyir komplex Heurisztikus megolások vnnk: elfoghtó megolást kpunk elfoghtó iő ltt Az eltérő eljárások más ereményt nk Bioinformtik és genomnlízis z orvostuományn - 4 86
Semmelweis Egyetem / Élettni Intézet / Bupest Felt 4 Válssz ki egy kényelmes szervert töszörös illesztési feltok elvégzéséhez és próál is ki. Bioinformtik és genomnlízis z orvostuományn - 4 87