Bioinformatics: Blending. Biology and Computer Science

Hasonló dokumentumok
Phenotype. Genotype. It is like any other experiment! What is a bioinformatics experiment? Remember the Goal. Infectious Disease Paradigm

Genome 373: Hidden Markov Models I. Doug Fowler

On The Number Of Slim Semimodular Lattices

tccattaattcgacagaccagagttaaataatccttgtatgccattgtgatcacatctacagttcagattttgtatttca

Correlation & Linear Regression in SPSS

8. A fehérjék térszerkezetének jóslása

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Correlation & Linear. Petra Petrovics.

Rotary District 1911 DISTRICT TÁMOGATÁS IGÉNYLŐ LAP District Grants Application Form

A teszt a következő diával indul! The test begins with the next slide!

Mapping Sequencing Reads to a Reference Genome

- eqµah ³. -ry³eblbmebjkargar³

Nan Wang, Qingming Dong, Jingjing Li, Rohit K. Jangra, Meiyun Fan, Allan R. Brasier, Stanley M. Lemon, Lawrence M. Pfeffer, Kui Li

A fehérjék térszerkezetének jóslása

Tájékoztató a évi határon átnyúló pénzügyi fogyasztói jogviták rendezésével összefüggő és egyéb nemzetközi tevékenységről

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Factor Analysis

ANGOL NYELV KÖZÉPSZINT SZÓBELI VIZSGA I. VIZSGÁZTATÓI PÉLDÁNY

MATEMATIKA ANGOL NYELVEN

Proxer 7 Manager szoftver felhasználói leírás

Klaszterezés, 2. rész

Trinucleotide Repeat Diseases: CRISPR Cas9 PacBio no PCR Sequencing MFMER slide-1

Cluster Analysis. Potyó László

Significance assessment in local sequence alignment with gaps. Ralf Bundschuh Department of Physics, The Ohio State University

CLUSTALW Multiple Sequence Alignment

Professional competence, autonomy and their effects

Mai témák. Fehérjék dinamikájának jelentősége. Számítógépes modellezés jelentősége

Which letter(s) show(s) a. Melyik betű(k) mutat(nak) . 1 flexor muscle group? flexor izomcsoportot? . 2 extensor muscle group?

The beet R locus encodes a new cytochrome P450 required for red. betalain production.

Directors and Officers Liability Insurance Questionnaire Adatlap vezetõ tisztségviselõk és felügyelõbizottsági tagok felelõsségbiztosításához

Computer Architecture

Ismeri Magyarországot?

INTELLIGENT ENERGY EUROPE PROGRAMME BUILD UP SKILLS TRAINBUD. Quality label system

ANGOL NYELV KÖZÉPSZINT SZÓBELI VIZSGA I. VIZSGÁZTATÓI PÉLDÁNY

EnergiaOtthon. Energy Home. Coal-burning. Széntüzelésű. Elektromos

Correlation & Linear Regression in SPSS

(NGB_TA024_1) MÉRÉSI JEGYZŐKÖNYV

Performance Modeling of Intelligent Car Parking Systems

Orvosi Genomtudomány 2014 Medical Genomics Április 8 Május 22 8th April 22nd May

A MOLEKULÁRIS BIOLÓGIA ISMERETÁBRÁZOLÁSI PROBLÉMÁI

Gottsegen National Institute of Cardiology. Prof. A. JÁNOSI

++Buy( Kaspersky Anti- Virus 2014 top sites for computer software ]

Angol Középfokú Nyelvvizsgázók Bibliája: Nyelvtani összefoglalás, 30 kidolgozott szóbeli tétel, esszé és minta levelek + rendhagyó igék jelentéssel

*#Discount~ Kaspersky Internet Security - multidevice 2015 best software to buy for mac ]

MATEMATIKA ANGOL NYELVEN

TANMENETJAVASLATOK. Általánosságban: egy lecke mindig egy heti anyagot jelent, a heti óraszámnak megfelelően.

Tanmenetjavaslat heti 3 óra

Flowering time. Col C24 Cvi C24xCol C24xCvi ColxCvi

ELIXIR-Magyarország: lehetőségek és kihívások: Bálint Bálint L, Debreceni Egyetem, ELIXIR-Magyarország oktatási koordinátor

program 1. nap / 1st day (április 15. / 15 april)

Searching in an Unsorted Database

Csima Judit április 9.

Where in the Genome does Replication Begin?

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Nonparametric Tests

Supporting Information

MOZGÓKÉPKULTÚRA ÉS MÉDIAISMERET ANGOL NYELVEN

pjnc-pgluc Codon-optimized Gaussia luciferase (pgluc) Vector backbone: JM83 pjnc-pgluc is resistant to ampicillin and neomycin High or low copy:

Fedezze fel a tudományos irodalom összefüggéseit a Web of Knowledge segítségével

Out-Look. Display. Analog Bar. Testing Mode. Main Parameter. Battery Indicator. Second Parameter. Testing Frequency

MATEMATIKA ANGOL NYELVEN

Minta ANGOL NYELV KÖZÉPSZINT SZÓBELI VIZSGA II. Minta VIZSGÁZTATÓI PÉLDÁNY

ELEKTRONIKAI ALAPISMERETEK ANGOL NYELVEN

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Nonparametric Tests. Petra Petrovics.

USER MANUAL Guest user

Pletykaalapú gépi tanulás teljesen elosztott környezetben

JEROMOS A BARATOM PDF

first base of sequence is at -32 with respect to the ATG of start site of At1g10010 start site of At1g10010

4. Gyakorlat: Csoportházirend beállítások

LinkedIn munkafüzet. Munkafüzet

Limitations and challenges of genetic barcode quantification

Munkahelykeresés. Önéletrajz és állásinterjú 12. ÉVFOLYAM. Felkészülés a felnőtt szerepekre. A modul szerzõje: Simon Gabriella SZKB_212_04

MATEMATIKA ANGOL NYELVEN

Felfedezés és értékelés, avagy támogató eszközök a Thomson Reuterst l

Nem kódoló RNS-ekből potenciálisan keletkező de novo fehérjék azonosítása és elemzése DIPLOMAMUNKA

A parlamenti munka szövegbányászati elemzése

ENROLLMENT FORM / BEIRATKOZÁSI ADATLAP

Tutorial 1 The Central Dogma of molecular biology

Mobil webszerverek. Márton Gábor Nokia Research Center. W3C Mobilweb Műhelykonferencia, Budapest október 18.

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Hypothesis Testing. Petra Petrovics.

A Margit híd pillérszobrának 3D-s digitális alakzatrekonstrukciója Nagy Zoltán 1 Túri Zoltán 2

Supplementary Table 1. Cystometric parameters in sham-operated wild type and Trpv4 -/- rats during saline infusion and

Tudományos Ismeretterjesztő Társulat

Molekuláris evolúció második gyakorlat

OROSZ MÁRTA DR., GÁLFFY GABRIELLA DR., KOVÁCS DOROTTYA ÁGH TAMÁS DR., MÉSZÁROS ÁGNES DR.

L' G' F F' M G. A) rotation 180 about the origin B) translation: (x, y) (x + 3, y + 2) C) reflection across y =

ELEKTRONIKAI ALAPISMERETEK ANGOL NYELVEN

EEA, Eionet and Country visits. Bernt Röndell - SES

Bird species status and trends reporting format for the period (Annex 2)

Longman Exams Dictionary egynyelvű angol szótár nyelvvizsgára készülőknek

Learn how to get started with Dropbox: Take your stuff anywhere. Send large files. Keep your files safe. Work on files together. Welcome to Dropbox!

Intézményi IKI Gazdasági Nyelvi Vizsga

INDEXSTRUKTÚRÁK III.

Kategória: Category: ...% európai / European...% USA-beli / from the USA...% egyéb / other

Tudományos Ismeretterjesztő Társulat

Hozzáférés és újrahasznosítás

és Gazdaságtudományi Egyetem, Alkalmazott Biotechnológiai és Élelmiszer-tudományi Tanszék Network of Excellence

EBBEN A VIZSGARÉSZBEN A VIZSGAFELADAT ARÁNYA

Mark Auspitz, Fayez Quereshy, Allan Okrainec, Alvina Tse, Sanjeev Sockalingam, Michelle Cleghorn, Timothy Jackson

Where in the Genome does Replication Begin?

The problem. Each unitary transform having eigenvector has eigenvalues in the form of. Phase ratio:

Vállalati kockázatkezelés jelentősége

MATEMATIKA ANGOL NYELVEN MATHEMATICS

Átírás:

Bioinformatics: Blending Biology and Computer Science MDNMSITNTPTSNDACLSIVHSLMCHRQ GGESETFAKRAIESLVKKLKEKKDELDSL ITAITTNGAHPSKCVTIQRTLDGRLQVAG RKGFPHVIYARLWRWPDLHKNELKHVK YCQYAFDLKCDSVCVNPYHYERVVSPGI DLSGLTLQSNAPSSMMVKDEYVHDFEG QPSLSTEGHSIQTIQHPPSNRASTETYST PALLAPSESNATSTANFPNIPVASTSQPA SILGGSHSEGLLQIASGPQPGQQQNGFT GQPATYHHNSTTTWTGSRTAPYTPNLP HHQNGHLQHHPPMPPHPGHYWPVHNE LAFQPPISNHPAPEYWCSIAYFEMDVQV GETFKVPSSCPIVTVDGYVDPSGGDRFC LGQLSNVHRTEAIERAR

Techniques BLAST Database Searches Entrez Database Data Mining Multiple Sequence Alignments Motif Searches 3D Structure Analysis

The Challenge Your colleagues have given you a DNA sequence of unknown origin. Mystery DNA Sequence What is it? What does it do? BLAST IT!!! 1 actctgctgg tggcctcgcg taccactgtg gccaagcggt agctggaacg tgcagccgac 61 caccatgggg agtagcaaga gcaagcctaa ggaccccagc cagcgccggc gcagcctgga 121 gccacccgac agcacccacc acgggggatt cccagcctcg cagaccccca acaagacagc 181 agcccccgac acgcaccgca cccccagccg ctccttcggg accgtggcca ccgagcccaa 241 gctcttcgag gacttcaaca cttctgacac cgttacgtcg ccgcagcgtg ccggggcact 301 ggctggcggc gtcaccactt tcgtggctct ctacgactac gagtcctgga ttgaaacgga 361 cttgtccttc aagaaaggag aacgcctgca gattgtcaac aacacggaag gtaactggtg 421 gctggctcat tccgtgacta caggacagac gggctacatc cccagtaact atgtcgcgcc 481 ctcagactcc atccaggctg aagagtggta ctttgggaag atcactcgtc gggagtccga 541 gcggctgctg ctcaaccccg aaaacccccg gggaaccttc ttggtccggg agagcgagac 601 gacaaaaggt gcctattgcc tctccgtttc tgactttgac aacgccaagg ggctcaatgt 661 gaagcactac aagatccgca agctggacag cggcggcttc tacatcacct cacgcacaca 721 gttcagcagc ctgcagcagc tggtggccta ctactccaaa catgctgatg gcttgtgcca 781 ccgcctgacc aacgtctgcc ccacgtccaa gccccagacc cagggactcg ccaaggacgc 841 gtgggaaatc ccccgggagt cgctgcggct ggaggtgaag ctggggcagg gctgctttgg 901 agaggtctgg atggggacct ggaacggcac caccagagtg gccataaaga ctctgaagcc 961 cggcaccatg tccccggagg ccttcctgca ggaagcccaa gtgatgaaga agctccagca 1021 tgagaagctg gttcaactgt acgcagtcgt gtcggaagag cccatctaca tcgtcattga 1081 gtacatgagc aaggggagcc tcctggattt cctgaaggga gagatgggca agtacctgcg 1141 gctgccacag ctcgttgata tggctgatca gattgcatcc ggcatggcct atgtggagag 1201 gatgaactac gtgcaccgag acctgcgggc ggccaacatc ctggtggggg agaacctggt 1261 gtgcaaggtg gctgactttg ggctggcacg cctcatcgag gacaacgagt acacagcacg 1321 gcaaggtgcc aagttcccca tcaagtggac agcccccgag gcagccctct atggccggtt 1381 caccatcaag tcggatgtct ggtccttcgg catcctgctg actgagctga ccaccaaggg 1441 ccggatgcca tacccaggga tgggcaacgg ggaggtgctg gaccgggtgg agaggggcta 1501 ccgcatgccc tgcccgcccg agtgccccga gtcgctgcat gaccttatgt gccagtgctg 1561 gcggagggac cctgaggagc ggcccacttt tgagtacctg caggcccagc tgctccctgc 1621 ttgtgtgttg gaggtcgctg agtagtgcgc gagcaaaatt taagctacaa caaggcaagg 1681 cttggccgac aattgcatga agaatctgct tagggttagg cgttttgcgc tgcttcgcga 1741 tgtacgggcc agatatacgc gtatctgagg ggactagggt gtgtttaggc gaaaagcggg 1801 g

ENTREZ/BLAST ENTREZ (http://www.ncbi.nlm.nih.gov/entrez/query.fcgi) An all-purpose tool for biomedical research data mining BLAST (http://www.ncbi.nlm.nih.gov/blast) Basic Local Alignment Search Tool used to explore sequence databases.

BLAST Results Identification Number Score gi 210270 gb M33292.1 ALRVSRC Rous sarcoma virus (Schmidt-R... 3570 0.0 gi 61498 emb V01169.1 REASV5 Avian sarcoma virus src gene a... 3459 0.0 gi 212700 gb J00844.1 CHKSRC Chicken c-src gene, complete c... 2977 0.0 gi 210264 gb M21526.1 ALRSRCAC Rous sarcoma virus defective... 2970 0.0 gi 61706 emb X15345.1 RERSVH19 Hamster H-19 proviral DNA (L... 2902 0.0 gi 61896 emb X51861.1 RSVPRSRC Duck adapted Rous sarcoma vi... 2839 0.0 gi 4885608 ref NM_005417.1 Homo sapiens v-src sarcoma (Sch... 1160 0.0 gi 15321730 gb M24704.2 XELSRCA Xenopus laevis pp60c-src pr... 375 e-100 gi 338458 gb K03218.1 HUMSRC11 Human c-src-1 proto-oncogene... 174 2e-4 Name Collect the corresponding Protein sequences Use the identification number (210270) to search ENTREZ (http://www.ncbi.nlm.nih.gov/entrez/)

Multiple Sequence Alignments Compare a series of proteins to determine how similar they are to each other http://pir.georgetown.edu/pirwww/search/multaln.html

How s that for similarity? Why are viral proteins similar to human and chicken proteins? ONCOGENES v-src MGSSKSKPKDPSQRRRSLEPPDSTHHGG---FPASQTPNKTAAPDTHRTPSRSFGTVATE avian_src MGSSKSKPKDPSQRRRSLEPPDSTHHGG---FPASQTPNKTAAPDTHRTPSRSFGTVATE chicken_src MGSSKSKPKDPSQRRRSLEPPDSTHHGG---FPASQTPNKTAAPDTHRTPSRSFGTVATE human_c-src MGSNKSKPKDASQRRRSLEPAENVHGAGGGAFPASQTPSKPASADGHRGPSAAFAPAAAE ***.******.*********.:..*.* *******.*.*:.* ** ** :*...*:* v-src PKLFEDFNTSDTVTSPQRAGALAGGVTTFVALYDYESWIETDLSFKKGERLQIVNNTEGN avian_src PKLFGGFNTSDTVTSPQRAGALAGGVTTFVALYDYESWIETDLSFKKGERLQIVNNTEGN chicken_src PKLFGGFNTSDTVTSPQRAGALAGGVTTFVALYDYESRTETDLSFKKGERLQIVNNTEGD human_c-src PKLFGGFNSSDTVTSPQRAGPLAGGVTTFVALYDYESRTETDLSFKKGERLQIVNNTEGD ****.**:***********.**************** ********************: v-src WWLAHSVTTGQTGYIPSNYVAPSDSIQAEEWYFGKITRRESERLLLNPENPRGTFLVRES avian_src WWLAHSLTTGQTGYIPSNYVAPSDSIQAEEWYFGKITRRESERLLLNPENPRGTFLVRES chicken_src WWLAHSLTTGQTGYIPSNYVAPSDSIQAEEWYFGKITRRESERLLLNPENPRGTFLVRES human_c-src WWLAHSLSTGQTGYIPSNYVAPSDSIQAEEWYFGKITRRESERLLLNAENPRGTFLVRES ******::***************************************.************ v-src ETTKGAYCLSVSDFDNAKGLNVKHYKIRKLDSGGFYITSRTQFSSLQQLVAYYSKHADGL avian_src ETTKGAYCLSVSDFDNAKGLNVKHYKIRKLDSGGFYITSRTQFSSLQQLVAYYSKHADGL chicken_src ETTKGAYCLSVSDFDNAKGLNVKHYKIRKLDSGGFYITSRTQFSSLQQLVAYYSKHADGL human_c-src ETTKGAYCLSVSDFDNAKGLNVKHYKIRKLDSGGFYITSRTQFNSLQQLVAYYSKHADGL *******************************************.**************** v-src CHRLTNVCPTSKPQTQGLAKDAWEIPRESLRLEVKLGQGCFGEVWMGTWNGTTRVAIKTL avian_src CHRLTNVCPTSKPQTQGLAKDAWEIPRESLRLEVKLGQGCFGEVWMGTWNGTTRVAIKTL chicken_src CHRLTNVCPTSKPQTQGLAKDAWEIPRESLRLEVKLGQGCFGEVWMGTWNGTTRVAIKTL human_c-src CHRLTTVCPTSKPQTQGLAKDAWEIPRESLRLEVKLGQGCFGEVWMGTWNGTTRVAIKTL *****.****************************************************** v-src KPGTMSPEAFLQEAQVMKKLQHEKLVQLYAVVSEEPIYIVIEYMSKGSLLDFLKGEMGKY avian_src KPGTMSPEAFLQEAQVMKKLRHEKLVQLYAVVSEEPIYIVIEYMSKGSLLDFLKGEMGKY chicken_src KPGTMSPEAFLQEAQVMKKLRHEKLVQLYAVVSEEPIYIVTEYMSKGSLLDFLKGEMGKY human_c-src KPGTMSPEAFLQEAQVMKKLRHEKLVQLYAVVSEEPIYIVTEYMSKGSLLDFLKGETGKY ********************:******************* *************** *** v-src LRLPQLVDMADQIASGMAYVERMNYVHRDLRAANILVGENLVCKVADFGLARLIEDNEYT avian_src LRLPQLVDMAAQIASGMAYVERMNYVHRDLRAANILVGENLVCKVADFGLARLIEDNEYT chicken_src LRLPQLVDMAAQIASGMAYVERMNYVHRDLRAANILVGENLVCKVADFGLARLIEDNEYT human_c-src LRLPQLVDMAAQIASGMAYVERMNYVHRDLRAANILVGENLVCKVADFGLARLIEDNEYT ********** ************************************************* v-src ARQGAKFPIKWTAPEAALYGRFTIKSDVWSFGILLTELTTKGRMPYPGMGNGEVLDRVER avian_src ARQGAKFPIKWTAPEAALYGRFTIKSDVWSFGILLTELTTKGRVPYPGMGNGEVLDRVER chicken_src ARQGAKFPIKWTAPEAALYGRFTIKSDVWSFGILLTELTTKGRVPYPGMVNREVLDQVER human_c-src ARQGAKFPIKWTAPEAALYGRFTIKSDVWSFGILLTELTTKGRVPYPGMVNREVLDQVER *******************************************:***** * ****:*** v-src GYRMPCPPECPESLHDLMCQCWRRDPEERPTFEYLQAQLLPACVLEVAE------- avian_src GYRMPCPPECPESLHDLMCQCWRRDPEERPTFEYLQAQLLPACVLEVAE------- chicken_src GYRMPCPPECPESLHDLMCQCWRRDPEERPTFEYLQAFLEDYFTSTEPQYQPGENL human_c-src GYRMPCPPECPESLHDLMCQCWRKEPEERPTFEYLQAFLEDYFTSTEPQYQPGENL ***********************::************ *..: 97% identical

Motifs Regions of conserved sequence and function. http://pfam.wustl.edu/hmmsearch.shtml

Protein Structures Why are protein structures valuable to research? Visualize how your protein looks Identify common domains Locate important amino acid positions Predict potential functions Model mutations

Summary BLAST Database Searches Entrez Database Data Mining Multiple Sequence Alignments Motif Searches 3D Structure Analysis Find It On The Web - http://web.wi.mit.edu/proteins/ai/home.html