Gyakorlati bioinformatika



Hasonló dokumentumok
Problémák és megoldások a bioinformatikában. Válogatott fejezetek a bioinformatikából. Gyimesi Gergely, február 25.

A tárgy címe: Bioinformatika

CLUSTALW Multiple Sequence Alignment

Az evolúció az adatok mögött

Molekuláris evolúció második gyakorlat

Orvosi Genomtudomány 2014 Medical Genomics Április 8 Május 22 8th April 22nd May

Filogenetikai analízis. Törzsfák szerkesztése

Bioinformatika és genomanalízis az orvostudományban. Biológiai adatbázisok. Cserző Miklós 2018

Bevezetés a bioinformatikába. Harangi János DE, TEK, TTK Biokémiai Tanszék

Juhász Angéla MTA ATK MI Alkalmazott Genomikai Osztály SZEKVENCIA ADATBÁZISOK

A humán mitokondriális genom: Evolúció, mutációk, polimorfizmusok, populációs vonatkozások. Egyed Balázs ELTE Genetikai Tanszék

Bioinformatika 2 2. előadás

Genetikus algoritmusok

Bakteriális identifikáció 16S rrns gén szekvencia alapján

MOLEKULÁRIS FILOGENETIKAI ELEMZÉSEK EGY DISZKRÉT MATEMATIKAI

Pontfelhő létrehozás és használat Regard3D és CloudCompare nyílt forráskódú szoftverekkel. dr. Siki Zoltán

A bakteriális kommunikáció és kooperáció génjeinek elhelyezkedése ismert genomokban.

Bioinformatika 2 4. előadás

Technológiai-üzemeltetési stratégiák csoportosítása hisztorikus idsorok szimbolikus epizód reprezentációján alapulva

3. Páronkénti szekvencia összerendezés

A mai el!adás. Bioinformatika és genom analízis az orvostudományban (AOGENBIG_1M) Mi a bioinformatika? Pontosítjuk a definíciót

Ez a rész öt fejezetből áll. A tizenharmadik fejezet az informatika egyik legdinamikusabbban fejlődő területének, a bioinformatikának az alapvető

Dobzhansky: In Biology nothing makes sense except in the light of Evolution.

DNS-szekvencia meghatározás

Animal welfare, etológia és tartástechnológia

Mai témák. Fehérjék dinamikájának jelentősége. Számítógépes modellezés jelentősége

MOLEKULÁRIS FILOGENETIKAI ELEMZÉSEK EGY DISZKRÉT MATEMATIKAI

BIOINFORMATIKA Ungvári Ildikó

Evolutionary Tree Reconstruction and its Applications in Protein Classification

KIEGÉSZÍTŽ FELADATOK. Készlet Bud. Kap. Pápa Sopr. Veszp. Kecsk Pécs Szomb Igény

Cserző Miklós Bioinformatika és genomanalízis az orvostudományban. Integrált biológiai adatbázisok

Genomadatbázisok Ld. Entrez Genome: Összes ismert genom, hierarchikus szervezésben (kromoszóma, térképek, gének, stb.)

DOKTORI ÉRTEKEZÉS TÉZISEI. Hepatitiszt okozó vírusok molekuláris vizsgálata. N. Szomor Katalin. Budapest 2009.

NÖVÉNYI GENOMIKA JÓRI BALÁZS

Zárójelentés. Állati rotavírusok összehasonlító genomvizsgálata. c. OTKA kutatási programról. Bányai Krisztián (MTA ATK ÁOTI)

Szent István Egyetem Állatorvos-tudományi Doktori Iskola. Sertés circovírusok járványtani vizsgálata

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Szekvenciaelemzés. Cserző Miklós 2017

Biokémiai hasonlóságok

Bioinformatika előadás

Least Squares becslés

GERONTOLÓGIA. 6. Biogerontológia: öregedési elméletek SEMSEI IMRE. Debreceni Egyetem Orvos- és Egészségtudományi Centrum Egészségügyi Kar

Evolúcióbiológia. Biológus B.Sc tavaszi félév

A PNP kóroktanának molekuláris vizsgálata Dán Ádám és Rónai Zsuzsanna

Az evolúció folyamatos változások olyan sorozata, melynek során bizonyos populációk öröklődő jellegei nemzedékről nemzedékre változnak.

Miben különbözünk az egértől? Szabályozás a molekuláris biológiában

FOLOSIREA BAZELOR DE DATE GENETICE ÎN EDUCAŢIE GENETIKAI ADATBÁZISOK FELHASZNÁLÁSA AZ OKTATÁSBAN

Szent István Egyetem Állatorvos-tudományi Doktori Iskola

Bioinformatika 2 6. előadás

Biomassza alapú bioalkohol előállítási technológia fejlesztése metagenomikai eljárással

Hidraulikus hálózatok robusztusságának növelése

Idősorok elemzése. Salánki Ágnes

SZÁLLÍTÁSI FELADAT KÖRUTAZÁSI MODELL WINDOWS QUANTITATIVE SUPPORT BUSINESS PROGRAMMAL (QSB) JEGYZET Ábragyűjtemény Dr. Réger Béla LÉPÉSRŐL - LÉPÉSRE

Bioinformatika előad

A Multi Locus Sequence Typing (MLST) alkalmazhatósága az élelmiszermikrobiológiában

Interaktív, grafikus környezet. Magasszintû alkalmazási nyelv (KAL) Integrált grafikus interface könyvtár. Intelligens kapcsolat más szoftverekkel

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2007/2008

A mutáns fenotípushoz szorosan kapcsolt markerek (1N1R és U212D) segítségével BAC (Bacterial Artifical Chromosome) klónokat azonosítottunk egy másik

Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis

Nem-lineáris programozási feladatok

Fehérjék szerkezetének predikciója, szerkezeti adatok felhasználása adatbázisok segítségével, a számítógépes molekuladinamikai modellezés alapjai

HÁZI FELADAT PROGRAMOZÁS I. évf. Fizikus BSc. 2009/2010. I. félév

A HUMÁN GENOM PROJEKT Sasvári-Székely Mária* Semmelweis Egyetem, Orvosi Vegytani, Molekuláris Biológiai és Pathobiokémiai Intézet

Programozási módszertan. Dinamikus programozás: A leghosszabb közös részsorozat

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2010/2011 1/363

Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP /1/A projekt

Hasonlósági keresés molekulagráfokon: legnagyobb közös részgráf keresése

A bioinformatika gyökerei

MUTÁCIÓK. A mutáció az örökítő anyag spontán, maradandó megváltozása, amelynek során új genetikai tulajdonság keletkezik.

Humán genom variációk single nucleotide polymorphism (SNP)

Természetismeret 4. osztály - 3. forduló -

Az orvosi biotechnológiai mesterképzés megfeleltetése az Európai Unió új társadalmi kihívásainak a Pécsi Tudományegyetemen és a Debreceni Egyetemen

Biológus MSc. Molekuláris biológiai alapismeretek

Epigenetikai Szabályozás

Fehérje expressziós rendszerek. Gyógyszerészi Biotechnológia

Molekuláris genetikai vizsgáló. módszerek az immundefektusok. diagnosztikájában

5. osztály. Matematika

Bioinformatika előadás

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Bevezetés. Cserző Miklós 2018

ÁLLATTENYÉSZTÉSI TUDOMÁNYOK DOKTORI ISKOLA Doktori Iskola vezető: Dr. Bánszki Tamás, MTA doktora. Témavezetők: mezőgazdaság-tudomány kandidátusa

PROKARIÓTA GENOMOK ÖSSZEHASONLÍTÓ ANALÍZISE BIOINFORMATIKAI MÓDSZEREKKEL. Doktori (Ph.D.) értekezés tézisei. Kassainé Jáger Edit Andrea

NÖVÉNYGENETIKA. Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP /1/A

7. Fehérjeszekvenciák és térszerkezetek analízise.

Bioinformatika gyakorlat csilabusz

Bioinformatika előadás

ÚJDONSÁGOK A MINITAB STATISZTIKAI SZOFTVER ÚJ KIADÁSÁNÁL (MINITAB 18)

A bakteriális kommunikáció és kooperáció génjeinek elhelyezkedése ismert genomokban.

Szekvencia összehasonlítások II. Bioinformatika és genom analízis az orvostudományban (AOGENBIG_1M)

BIOLÓGIA OSZTÁLYOZÓ VIZSGA ÉS JAVÍTÓVIZSGA KÖVETELMÉNYEK (2016)

1A A A

ÁLLATTENYÉSZTÉSI GENETIKA

TÉMAKÖRÖK. Ősi RNS világ BEVEZETÉS. RNS-ek tradicionális szerepben

AZ EGRI BORVIDÉK BOTRYTIS CINEREA POPULÁCIÓINAK GENETIKAI JELLEMZÉSE

Kutyafélék viselkedésgenetikája. Miklósi Ádám 2015

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

MIKOVINY SÁMUEL TÉRINFORMATIKAI EMLÉKVERSENY

Szent István Egyetem Állatorvos-tudományi Doktori Iskola. Rágcsálók és denevérek adenovírusainak genetikai elemzése

Fehérjék rövid bevezetés

Tipizálási módszerek alkalmazása methicillin-rezisztens Staphylococcus aureus (MRSA) törzsek molekuláris epidemiológiai vizsgálatai során

A genomikai oktatás helyzete a Debreceni Egyetemen

Bioinformatika 2 9. előadás

Átírás:

Gyakorlati bioinformatika Szekvenciaillesztés PhD kurzus 2. Szekvenciaillesztés Bagossi Péter Fajtái: - egyszer ill. többszörös illesztés - globális ill. lokális illesztés Alkalmazása: - adatbázisokban való keresés - szekvenciák összehasonlítása - szerkezet/funkció jóslása Algoritmusok: - Smith-Waterman - Pearson-Lipman - Needleman-Wunsch Programok: - FASTA - BLAST - ClustalW Pontozási rendszereket - PAM - BLOSUM - Overington Szekvenciaillesztés HIV proteinázok egyszer illesztése A hasonlóság egy megfigyelhet, mérhet mennyiség pl. pontszám, százalék), a homológia pedig az ebbl levont minségi következtetést jelenti, azaz hogy a két gén/fehérje közös evoluciós családfáról származik. Egy adott illesztéshez számolható egy adott pontszám, azonban fontos annak meghatározása, hogy ez a pontszám elég magas-e ahhoz, hogy bizonyítsa a homológiát. Az E érték annak az eseménynek a valószínségét mutatja, hogy az adatbázisban való keresés során véletlenül kapunk azonos nagyságú pontszámot, és nagysága függ az adott szekvencia hosszától, a hasonlóságtól és az adatbázis nagyságától. HIV- HIV-2 HIV- HIV-2 PQITLWQRPLVTIRIGGQLKEALLDTGADDTVLEEMNLPGKWKPKMIGGIGGFIKVRQY PQFSLWKRPVVTAHIEGQPVEVLLDTGADDSIVAGIELGNNYSPKIVGGIGGFINTKEY ** ** ** ** * ** * ******** * ** ******* * DQIPVEICGHKAIGTVLVGPTPVNIIGRNLLTQIGCTLNF KNVEIEVLNKKVRATIMTGDTPINIFGRNILTALGMSLNL * * * * ** ** *** ** * ** Retrovirális proteinázok többszörös illesztése Retrovirális proteinázok szerkezeti illesztése HIV- PQITLW..QRPLVTIRIG...GQLKEALLDTGADDTVLEE..MN...LPGKWK..PKMIGGIGGFIKVRQY HIV-2 PQFSLW..KRPVVTAHIE...GQPVEVLLDTGADDSIVAG..IE...LGNNYS..PKIVGGIGGFINTKEY SIV PQFSLW..RRPVVTAHIE...GQPVEVLLDTGADDSIVTG..IE...LGPHYT..PKIVGGIGGFINTKEY EIAV VTYNLE..KRPTTIVLIN...DTPLNVLLDTGADTSVLTTAHYNRLKYRGRKYQ..GTGIGGVGGNVETFST FIV -TTTTLE..KRPEILIFVN...GYPIKFLLDTGADITILNRRDFQ.VKN.SIENG..RQNMIGVGGGKRGTNY RSV LAMTMEHKDRPLVRVILTNTGSHPVKQRSVYITALLDSGADITIISEEDWP...TDWPVMEAANPQIHGIGGGIPMRKS ** *** *** * ** HIV-.DQIPVEICG...HKAIGTVLVG...PTPVNIIGRNLLTQIGCTLNF.. HIV-2.KNVEIEVLN...KKVRATIMTG...DTPINIFGRNILTALGMSLNL.. SIV.KNVEIEVLG...KRIKGTIMTG...DTPINIFGRNILTALGMSLNL.. EIAV.P.VTIKKKG...RHIKTRMLVA...DIPVTILGRDILQDLGAKLVL.. FIV.INVHLEIRDENYKT.QCIFGNVCVLEDNSLIQPLLGRDNMIKFNIRLVMAQ RSV RDMIELGVINRDGSLERPLLLFPAVA...MVRGSILGRDCLQGLGLRLTNL. **

Szekvenciaillesztés 2 3 Globális illesztés 2 3 2 3 BLAST Lokális illesztés 2 3 4 2 2 2 4 3 4 2 2

Clustal-W Clustal-X http://bips.u-strasbg.fr/fr/documentation/clustalx/ 3

FASTA formátum PIR formátum 4

Gombák D. klockeri N. crassa C. krusei sütéleszt Molekuláris evolúció Madarak pingvin Emlsök tyúk Kétéltek kecskebéka Rovarok moly tehén kutya ló nyúl légy kenguru ponty pekingi kacsa galamb tekns tonhal macskacápa angolna búza Hüllk Halak Növények bab szezám ricinus napraforgó A természetes mutációs változások szimulálhatóak két vagy több szekvencia olyan illesztésével, amelyben a változtatások számát amely egyik szekvenciát átalakítja a másikká) minimalizálták. A filogenetikai fa ennek a függvénynek a grafikus megjelenítése, amelyben a mutációk száma arányos az egyes ágak hosszúságával. gypsy-dm:0.4506, gypsy-dv:0.630) :0.2933, bfv:0.2969, efv:0.9698) :0.03334, ffv:0.24583) :0.03729, hfv:0.02698, sfvcpz:0.02902) :0.09724, sfv:0.09470, sfv3:0.09884) :0.02884) :0.4790) :0.6035, ty3:0.4323) :0.0274, ty-at:0.3865, PHYLIP PHYLogeny Inference Package, consists of 35 programs. protpars: protein parsimony dollop: Dollo and polymorphism parsimony dnapars: DNA sequence parsimony dolpenny: Dollo and polymorphism branch and bound parsimony dnapenny: DNA parsimony branch and bound dolmove: Dollo and polymorphism interactive parsimony dnamove: interactive DNA parsimony clique: 0/ characters compatibility method dnacomp: DNA compatibility factor: Character recoding program dnaml: DNA maximum likelihood drawgram: Rooted tree drawing program dnamlk: DNA maximum likelihood with clock drawtree: Unrooted tree drawing program proml: Protein sequence maximum likelihood consense: Consensus tree program promlk: Protein sequence maximum likelihood with clock treedist: Tree distance program dnainvar: DNA invariants retree: interactive tree rearrangement program dnadist: DNA distance protdist: Protein sequence distance restdist: Restriction sites and fragments distances restml: Restriction sites maximum likelihood seqboot: Bootstrapping/Jackknifing fitch: Fitch-Margoliash distance matrix method kitsch: Fitch-Margoliash distance matrix with clock neighbor: Neighbor-Joining and UPGMA method contml: Maximum likelihood continuous characters and gene frequencies contrast: Contrast method gendist: Genetic distance pars: Unordered multistate parsimony mix: Mixed method parsimony penny: Branch and bound mixed method parsimony move: Interactive mixed method parsimony PHYLIP drawgram: rooted tree drawing program drawtree: unrooted tree drawing program 5

2. Gyakorlati feladat Töltsd le az adatbázisból az általad korábban választott humán gén - egér, sertés és csirke homológját, majd: - illesszd össze a nukleotid szekvenciákat ClustalW) - a szekvenciákat fordítsd le fehérje szintre Expasy) - illesszd össze a fehérje szekvenciákat ClustalW) - a fehérje szekvenciákat fordítsd vissza DNS szintre Expasy) - hasonlítsd össze az eredeti és a visszafordított DNS szekvenciát ClustalW) - készitsd el a gén és a fehérje filogenetikai fáját és hasonlítsd össze ket ClustalW, Phylip) Az egybeszerkesztett dokumentumot email-ben küld el a peter@indi.biochem.dote.hu cimre! 6