A mai el!adás témája: Miklós István Állapot Emisszió Útvonal Legvalószín!bb útvonal (Viterbi path) Szuboptimális útvonal

Hasonló dokumentumok
Bioinformatics: Blending. Biology and Computer Science

Bioinformatika és genomanalízis az orvostudományban. Biológiai adatbázisok. Cserző Miklós 2018

Genome 373: Hidden Markov Models I. Doug Fowler

2. Ismert térszerkezetű transzmembrán fehérjék adatbázisa: a PDBTM adatbázis. 3. A transzmembrán fehérje topológiai adatbázis, a TOPDB szerver

Orvosi Genomtudomány 2014 Medical Genomics Április 8 Május 22 8th April 22nd May

Angol Középfokú Nyelvvizsgázók Bibliája: Nyelvtani összefoglalás, 30 kidolgozott szóbeli tétel, esszé és minta levelek + rendhagyó igék jelentéssel

A mai el!adás. Bioinformatika és genom analízis az orvostudományban (AOGENBIG_1M) Mi a bioinformatika? Pontosítjuk a definíciót

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Bioinformatikai modellek. Cserző Miklós 2017

Miben különbözünk az egértől? Szabályozás a molekuláris biológiában

Phenotype. Genotype. It is like any other experiment! What is a bioinformatics experiment? Remember the Goal. Infectious Disease Paradigm

A MOLEKULÁRIS BIOLÓGIA ISMERETÁBRÁZOLÁSI PROBLÉMÁI

Mapping Sequencing Reads to a Reference Genome

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Bevezetés. Cserző Miklós 2018

Supporting Information

Bevezetés a bioinformatikába. Harangi János DE, TEK, TTK Biokémiai Tanszék

Bioinformatika 2 6. előadás

ANGOL NYELV KÖZÉPSZINT SZÓBELI VIZSGA I. VIZSGÁZTATÓI PÉLDÁNY

Cloud computing. Cloud computing. Dr. Bakonyi Péter.

Tudományos Ismeretterjesztő Társulat

Suppl. Materials. Polyhydroxyalkanoate (PHA) Granules Have no Phospholipids. Germany

Budapest By Vince Kiado, Klösz György

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Szekvenciaelemzés. Cserző Miklós 2017

8. A fehérjék térszerkezetének jóslása

Hálózati modellek alkalmazása a molekuláris biológia néhány problémájára. Doktori (PhD) értekezés tézisei. Ágoston Vilmos

Bioinformatikai és orvosbiológiai Grid alkalmazások az Egyesült Királyságban

Genomadatbázisok Ld. Entrez Genome: Összes ismert genom, hierarchikus szervezésben (kromoszóma, térképek, gének, stb.)

Cloud computing Dr. Bakonyi Péter.

Correlation & Linear Regression in SPSS

TDK lehetőségek az MTA TTK Enzimológiai Intézetben

Tutorial 1 The Central Dogma of molecular biology

escience Regionális Egyetemi sközpont

Üzleti élet Nyitás. Nagyon hivatalos, a címzettnek meghatározott rangja van, aminek szerepelnie kell

Üzleti élet Nyitás. Nagyon hivatalos, a címzettnek meghatározott rangja van, aminek szerepelnie kell

A cell-based screening system for RNA Polymerase I inhibitors

Problémák és megoldások a bioinformatikában. Válogatott fejezetek a bioinformatikából. Gyimesi Gergely, február 25.

A TANTÁRGY ADATLAPJA

Mr. Adam Smith Smith's Plastics 8 Crossfield Road Selly Oak Birmingham West Midlands B29 1WQ

(Asking for permission) (-hatok/-hetek?; Szabad ni? Lehet ni?) Az engedélykérés kifejezésére a következő segédigéket használhatjuk: vagy vagy vagy

University of Bristol - Explore Bristol Research

Cserző Miklós Bioinformatika és genomanalízis az orvostudományban. Integrált biológiai adatbázisok

Gyakorlati bioinformatika

On The Number Of Slim Semimodular Lattices

A genetikai lelet értelmezése monogénes betegségekben

Word and Polygon List for Obtuse Triangular Billiards II

Széchenyi István Egyetem

ANGOL NYELVI SZINTFELMÉRŐ 2012 A CSOPORT. to into after of about on for in at from

ANGOL NYELV KÖZÉPSZINT SZÓBELI VIZSGA I. VIZSGÁZTATÓI PÉLDÁNY

Bakteriális identifikáció 16S rrns gén szekvencia alapján

GERONTOLÓGIA. 6. Biogerontológia: öregedési elméletek SEMSEI IMRE. Debreceni Egyetem Orvos- és Egészségtudományi Centrum Egészségügyi Kar

Mai témák. Fehérjék dinamikájának jelentősége. Számítógépes modellezés jelentősége

TestLine - Angol teszt Minta feladatsor

Szerződéses kutatások/contract research

Modellkiválasztás és struktúrák tanulása

Beszámoló a K OTKA Project keretében végzett munkáról. Szinopszis:

Fehérje expressziós rendszerek. Gyógyszerészi Biotechnológia

ANGOL MAGYAR PARBESZEDEK ES PDF

Current Weed Control strategies in sorghum I

Hamar Péter. RNS világ. Lánczos Kornél Gimnázium, Székesfehérvár, október

Trinucleotide Repeat Diseases: CRISPR Cas9 PacBio no PCR Sequencing MFMER slide-1

JEROMOS A BARATOM PDF

A fehérjék térszerkezetének jóslása

Expression analysis of PIN genes in root tips and nodules of Lotus japonicus

STUDENT LOGBOOK. 1 week general practice course for the 6 th year medical students SEMMELWEIS EGYETEM. Name of the student:

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Factor Analysis

CLUSTALW Multiple Sequence Alignment

Business Opening. Very formal, recipient has a special title that must be used in place of their name

Fehérjék szerkezetének predikciója, szerkezeti adatok felhasználása adatbázisok segítségével, a számítógépes molekuladinamikai modellezés alapjai

Az Országos Széchényi Könyvtár

Travel General. General - Essentials. General - Conversation. Asking for help. Asking if a person speaks English

Vállalati kockázatkezelés jelentősége

XSLT XML. DEIM Forum 2013 B2-1 XML XML XML XML XSLT XSLT XSLT XML XSLT XSLT

A humán mitokondriális genom: Evolúció, mutációk, polimorfizmusok, populációs vonatkozások. Egyed Balázs ELTE Genetikai Tanszék

Longman Exams Dictionary egynyelvű angol szótár nyelvvizsgára készülőknek

13. RNS szintézis és splicing

Márkaépítés a YouTube-on

Intézményi IKI Gazdasági Nyelvi Vizsga

IRODALOMJEGYZÉK 67: 181: 97: 229: 190: 39: 48: 32: 16: 103: 17: 25: 12:

Minta ANGOL NYELV KÖZÉPSZINT SZÓBELI VIZSGA II. Minta VIZSGÁZTATÓI PÉLDÁNY

Get Instant Access to ebook Modon PDF at Our Huge Library MODON PDF. ==> Download: MODON PDF

Kétdimenziós mesterséges festési eljárások. Hatások és alkalmazások

MAGYARORSZAG UJJAEPITESE ES PDF

10. Genomika 2. Microarrayek és típusaik

Számítógépes Hálózatok GY 8.hét

Egy új DNS motívum típus in silico jellemzése és szerepe a génszabályozásban Zárójelentés - OTKA # PD73575, BIOIN Cserző Miklós

Fehérjék rövid bevezetés

The beet R locus encodes a new cytochrome P450 required for red. betalain production.

Alapfogalmak. A bevezető előadáson elhangzottakhoz a tankönyv alábbi fejezetei tartoznak: 1. Bevezetés a sejtbiológiába

NASODRILL ORRSPRAY: TARTÁLY- ÉS DOBOZFELIRAT, VALAMINT A BETEGTÁJÉKOZTATÓ SZÖVEGE. CSECSEMŐ GYERMEK FELNŐTT 100 ml-es üveg

Ültetési és öntözési javaslatok. Planting and watering instructions

Molekuláris evolúció második gyakorlat

Felhő használata mindennapi alkalmazások futtatására. Németh Zsolt MTA SZTAKI

Betekintés a komplex hálózatok világába

INDEXSTRUKTÚRÁK III.

Using the CW-Net in a user defined IP network

Software Engineering Babeş-Bolyai Tudományegyetem Kolozsvár

2. Local communities involved in landscape architecture in Óbuda

KN-CP50. MANUAL (p. 2) Digital compass. ANLEITUNG (s. 4) Digitaler Kompass. GEBRUIKSAANWIJZING (p. 10) Digitaal kompas

A tárgy címe: Bioinformatika

Smaller Pleasures. Apróbb örömök. Keleti lakk tárgyak Répás János Sándor mûhelyébõl Lacquerware from the workshop of Répás János Sándor

A fehérjék térszerkezetének jóslása (Szilágyi András, MTA Enzimológiai Intézete)

Átírás:

Bioinformatika és genom analízis az orvostudományban (AOGENBIG_1M) Miklós István SOTE, 2008. november 6. A mai el!adás témája: Struktúrák predikciója Az összehasonlító bioinformatika alapelvei Rejtett Markov modellek és mesterséges neuronhálók Alkalmazások! Génpredikció! Alternatív splicing! Transzmembrán topológia predikció Esettanulmányok! Prionfehérjék! I. típusú T sejt epitópok predikciója! MHC Fehérjedokkolás Összehasonlító bioinformatika Rejtett Markov Modellek (HMM) Központi dogmája: A struktúra konzervatívabb, mint a szekvencia Rosetta k!: Arthur Lesk: What one or two homologous sequences whisper, a full multiple alignment shouts out loud. Richard Durbin példája: AYTGTHISSQKLIISCLPNOTKSIAIHIDDENAWYA AYTGTHISSQKLIISCLPNOTKSIAIHIDDENAWYA DEFYTHISPSQALISCAMPLETELYIHIDDENYWAE Definíciók Állapot A gráf egy pontja, amely valamely tulajdonságot hivatott reprezentálni Els! HMM a bioinformatikában: CpG szigetek Emisszió Az állapotok emittálnak (kibocsájtanak) karaktereket, a tulajdonságuknak megfelel! eloszlásból Útvonal Egy séta a gráfon a megfelel! kibocsájtásokkal. Ha a karaktereket a kibocsájtó állapotoknak megfelel! tulajdonságokkal asszociáljuk, akkor egy útvonal egyben predikció is az egyes karakterek tulajdonságaira Legvalószín!bb útvonal (Viterbi path) A legvalószín"bb predikció a struktúrára Szuboptimális útvonal Alternatív predikciók a struktúrára

Els! HMM a bioinformatikában: CpG szigetek Miért m"ködik? A CpG szigetekben valószín"bb, hogy egy C után G jön, ezért azok az útvonalak a HMM-ben, amelyekben a CpG szigeteket a megfelel! almodel generálta, sokkal valószín"bbek. Pozícióspecifikus pontozómátrixok és HMM-ek Egy HMM annyival több egy pozócióspecifikus pontozómátrixtól, hogy az optimális útvonal függ az átmeneti valószín"ségekt!l is. Profile HMM : pozícióspecifikus pontozómátrix valószín"ségi modellbe áttranszformálva Mesterséges neuronhálók A pozícióspecifikus értékelések tetsz!legesen kombinálhatók, így egyes pozíciók közötti kapcsolatok felfedezhet!ek OUTPUT From V. Brusic HIDDEN A C DE F G H I K L MN P Q R S T VWY A C DE F G H I K L MNP Q R S T VWY INPUT Y Els! alkalmazása az evolúciós információknak Jones et al. (1998) J. Mol. Biol. Eredmények I. Illesztett protein szekvenciák közös struktúrájának a meghatározása! " L Rejtett Markov Modell A kibocsájtási valószín"ségeket egy id!folytonos Markov modell adja meg. ML Evolúciós fa Posterior decoding

Eredmények II. Génkeresés/annotáció A feladat megkeresni a kódoló régiókat a genomban és annotálni ezeket Promoter 5 utr < --------- coding region ------> 3 utr Bacterial gene: continuous coding region, known signals?? 5 utr < --- coding region ----------- > 3 utr polyaaa site Human gene: fragmented coding region, unknown signals, contained in much more DNA A filogenetikai információ általában javítja a becslés pontosságát Rejtett Markov modellek génkeresésre Genescan-Doublescan Genescan (HMM) Doublescan (pair-hmm) Burge & Karlin (1997) J. Mol. Biol. 268:78-94. Meyer & Durbin (2002) Bioinformatics 18:1309-1318

Alternatív splicing predikció SLAM-mal Cawley & Pachter (2003) Bioinformatics Alternatív splicing predikció SLAM-mal Átfed! gének RNS szerkezetek mrns-ben Meyer & Miklós (2005) Nucleic Acids Research Fekete: kódoló régió, Szürke: át nem íródó régió A CAV1 fehérjében lokális RNS térszerkezet A CFTR alternatív splicingja Pagani et al. (2005) PNAS A CFTR alternatív splicingja Pagani et al. (2005) PNAS

A CFTR alternatív splicingja Pagani et al. (2005) PNAS A CFTR alternatív splicingja Meyer & Miklós (2005) NAR A CFTR alternatív splicingja Meyer & Miklós (2005) NAR Transzmembrán topológia predikció Tusnády & Simon (1998) J. Mol. Biol. Transzmembrán topológia predikció Eredmények

HMMTOP online server Prionfehérjék http://www.enzim.hu/hmmtop/ Tompa, Tusnády, Cserz!, Simon (2001) PNAS Prediktált transzmembrán hélixek száma Feltételezett evolúció Epitópkeresés HMM-mel és ANN-nel Epitópkeresés HMM-mel és ANN-nel Srinivasan et al. (2004) Bioinformatics Srinivasan et al. (2004) Bioinformatics Rejtett Markov modellekkel és mesterséges neuronhálózatokkal 9 aminosavból álló peptideket vizsgáltak A modelleket trenírozni lehet adathalmazokon, a használt adthalmaz! 604 köt! és! 2358 nem-köt! peptidb!l állt A ROC értékek a trenírozott modellekre 80-90% körül volt ANN predikció forró pontokra a humán papillóma vírus fehérjéjében. Kör: forró pont, téglalap: fals positiv predikció

Dokkolás A feladat annak a meghatározása, hogy mely molekula passzol bele egy adott enzim aktív zsebébe 3D modellezéssel Klasszikus és kvantumfizikai törvények alapján Rendkívül számolásigényes Fight Aids @ home Dokkolás AIDS elleni gyógyszertervezésre a saját számítógépünkön "Why should I join?" About 42 million people are living with HIV or AIDS around the world. HIV mutates and evolves very quickly. Drug resistance is on the rise. If there is any "bioterrorism" in the world, it comes from Nature itself, in the form of HIV, and we need to fight this very real and long-standing problem now - more than any other threat to humanity. So every computer counts! Your CPU helps to screen millions of candidate drug compounds computationally against detailed models of evolving AIDS viruses an accomplishment previously impossible without expensive supercomputers. FightAIDS@Home accelerates AIDS research by connecting you to a global "grid" of distributed computing power. Together, we are making a difference! Your donation of spare computer cycles helps us in our entirely non-profit, scientific endeavours Fight Aids @ home Dokkolás Eddig több, mint 14000 felhasználó csatlakozott a programhoz In silico válogatás adatbázisból Ligand database Molecular docking Target Protein Ligand docked into protein s active site Receptorome és receptoromics Roth (2005) Pharmacology and Therapeutics

Klasszikus bioinformatika Összefoglalás Az adatok többsége szekvenciális (RNS, DNS, fehérjék) Központi hipotézis: a struktúra konzervatívabb, mint a szekvencia Ab initio vagy komparatív predikció A mutációk struktúrafügg!k, a f! mutációtípusok: szubsztitúciók, beszúrások, törlések System biology Rendszerszint" összehasonlítása a biokémiai rendszereknek! Gének elrendez!dése a genomban! Biokémiai hálózatok (reakció-útvonalak, interakciók, regulációk)! Génexpresszió Jöv! hétt!l Irodalomjegyzék Jones, Thorne, Goldman (1996) Using evolutionary trees in protein secondary structure prediction and other comparative sequence analyses. J. Mol. Biol. 263:196-208. Meyer & Durbin (2002) Comparative ab initio prediction of gene structures using pair HMMs Bioinformatics 18:1309-1318 Cawley & Pachter (2003) HMM sampling and applications to gene finding and alternative splicing. Bioinformatics, 19 Suppl. 2:ii36 ii41 Meyer & Miklós (2005) Statistical evidence for conserved, local secondary structure in the coding regions of eukaryotic mrnas and pre-mrnas Nucleic Acids Research 33:6338-6348 Pagani, Raponi & Baralle (2005) Synonymous mutations in CFTR exon 12 affect splicing and are not neutral in evolution. PNAS 102:6368-6372 Tusnády & Simon (1998) Principles Governing Amino Acid Composition of Integral Membrane Proteins: Application to Topology Prediction. J. Mol. Biol. 283:489-506 P. Tompa, G. E. Tusnády, M. Cserz!, and I. Simon (2001) Prion protein: Evolution caught en route. PNAS 98(8):4431 4436. Srinivasan, Zhang, Khan, August, Brusic (2005) Prediction of clas I T-cell epitopes: evidence of presence of immunological hot spots inside antigens. Bioinformatics 20 Suppl. 1:i297-i302.