Crash Course in Omics Terminology and Concepts

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Crash Course in Omics Terminology and Concepts"

Átírás

1 Bacterial Viral Parasitic Host Genomics Crash Course in Omics Terminology and Concepts Jessica Kissinger June 8, 2008 Microarray Proteomic Genetics Immunology Genome assembly 5X random genome shotgun Library insert size Mated end pairs Contigs Scaffolds Shotgun DNA Sequencing (Technology) DNA target sample Primer End Reads (Mates) 550bp SHEAR SEQUENCE SIZE SELECT LIGATE & CLONE Vector e.g., 10Kbp ± 8% std.dev. 1

2 Anatomy of a WGS Assembly STS Chromosome Pairs Give Order & Orientation Read pair (mates) Reads > Contigs > Scaffolds > Chromosomes Mated end reads and Sequence Tagged Sites provide order and orientation for contigs and scaffolds STS-mapped Scaffolds Contig Gap (mean & std. dev. Known) Consensus Reads (of several haplotypes) SNPs External Reads Assembly without pairs results in contigs whose order and orientation are not known. Contig? Pairs, especially groups of corroborating ones, link the contigs into scaffolds where the size of gaps is well characterized. Scaffold Consensus (15-30Kbp) Reads 2-pair Mean & Std.Dev. is known An Assembly of reads AAGCTTCGCCAGGCTGTAAATCCCGTGAGTCGTCCTCACAAATCATCAAGCAGGTGTCCTCAGGGAGACTGCCTGACTGAGTTATGCTAATTCCTTTCTACTTTGGCGTGGTCACGTGT AACCATATCCGAATCATTTCTCTAGCCCTACGAACAGGTAAGAGCGCTAGGGATGTCCGTGGAGTAGTGTGCTTACTCGATAATATTCAGTTGGGACTACCAGCGAGGCGCTCGCTTTG CTCACGCAATGCCTGAGACAGTTGCAGAATGAATGGTAACCGACAAACGCGTTCATATGCGTTTTCAAACTTAGTAGACGCGTACTGTCTGAAACTGGCGGTCACAGGCACCAGATAAC GCCCTTGGCATCGGCATGTCTCGTACAGAGGTCCGTATGTAGTGCCACGACTTCTAAATCCGGCGACAGGCTGGTCTTTTGTCTTACCACGTATTAGCCCGCGTGCGATTTCTCGGAGC GCACCTGTTCAACACTAGAAAACGGAGTTTCCTGATCGAGAAGCCACCACCTTTCCAGAAGTTGAACGCTAGCATGTCATTCGATTTTCACCCCCCGCGTAGTTCCTGTGTGTCATTCG TTGTCGAGACAACTCTGTCCCGCCCCGGTGCTGTTCCATATGCGTGACTTTCCCGCAATTTTTTCAGACTTTCAGGAAAGACAGGCTCCGGAACGATCTCGTCCATGACTGGTAAATCC ACGACACCGCAATGGCCCCCAGCACCTCTATCTCTCGTGCCAGGGGACTAACGTTGTATGCGTCTGCGTCTTGTCTTTTTGCATTCGCTTTCCAAAAAAGAGAGCCATCCGTTCCCCCG CACATTCAACGCCGCGAGTGCGGTTTTTGTCTTTTTTGAGTGGTAGGACGCTTTTCATGCGCGAACTACGTGGACATTAAGTTCCATTCTCTTTTTCGACAGCACGAAACCTTGCATTC AAACCCGCCCGCGGAAGATCCGATCTTGCTGCTGTTCGCAGTCCCAGTAGCGTCCTGTCGGCCGCGCCGTCTCTGTTGGTGGGCAGCCGCTACACCTGTTATCTGACTGCCGTGCGCGA AAATGACGCCATTTTTGGGAAAATCGGGGAACTTCATTCTTTAAAAGTATGCGGAGGTTTCCTTTTTCTTCTGTTCGTTTCTTTTTCTCGGGTTTGATAACCGTGTTCGATGTAAGCAC TTTCCGTCTCTCCTCCGTGCTTTGTTCGACATCGAGACCAGGTGTGCAGATCCTTCGCTTGTCGATCCGGAGACGCGTGTCTCGTAGAACCTTTTCATTTTACCACACGGCAGTGCGGA GCACTGCTCTGAGTGCAGCAGGGACGGGTGAAGTTTCGCTTTAGTAGTGCGTTTCTGCTCTACGGGGCGTTGTCGTGTCTGGGAAGATGCAGAAACCGGTGTGTCTGGTCGTCGCGATG ACCCCCAAGAGGGGCATCGGCATCAACAACGGCCTCCCGTGGCCCCACTTGACCACAGATTTCAAACACTTTTCTCGTGTGACAAAAACGACGCCCGAAGAAGCCAGTCGCCTGAACGG GTGGCTTCCCAGGAAATTTGCAAAGACGGGCGACTCTGGACTTCCCTCTCCATCAGTCGGCAAGAGATTCAACGCCGTTGTCATGGGACGGAAAACCTGGGAAAGCATGCCTCGAAAGT TTAGACCCCTCGTGGACAGATTGAACATCGTCGTTTCCTCTTCCCTGTGAGCACACACAGTAGTCGCCACACGCTGTTTGAGACGTGTCAATCTCCAAGAGTGTGGACGCTGTTCCACG TCTTCAAATGTTTCCCAACATCCGTCGTCTAGTAGACACACCAACAAAAAGCACACGGCGAATCTGCTCATCGGAGGGAGGAGCCGGGGGGCACACAACTATCCTCAACTCTCGAACGA ACATATCCGGGGCCGCGAAGACGTCCAGTCTCTCAAATCCAACCCGGAACGCAAACATTTCTGCATCAAGTCACGATTGCGCCGGTACCTCCATGTGTAAGCAGTTCCATGAAACCTCC GATATTACACACGACTGTGGATATGAATTATATGCAGATGCATATATACTGAGACGCCGATGCAACTATAGGTTTCCTGGCCCTCCATGGATATTTCAGACCTTCCTCTCACATTTGGT TTGCCCGTACACCTCCGTTACGCTTTTTTTCTGGCTTTCTTCTTCGTCTCTGTTTATCAGCAAAGAAGAAGACATTGCGGCGGAGAAGCCTCAAGCTGAAGGCCAGCAGCGCGTCCGAG TCTGTGCTTCACTCCCAGCAGCTCTCAGCCTTCTGGAGGAAGAGTACAAGGATTCTGTCGACCAGATTTTTGTCGTGGGTATGTTGTCCTAAACTCCTTGGAACTCCATTCTTGGTCAG AAACGTACTGAAACTGTATACATGTATATACAGATGTATGGATAATATCTAGAGAAGATACAGGGAAGACTGGCAAGGATGAAAAGACATGCAGCTTTAACGAAGCAGAGGGCATTGGC GAGAGGGACGCCCGTTATGCTGTGTGATGTGGCTGTGAATCTTACCTCGCCGTTTGACTTGCTGCAGCGCTTTGTCCACTTGAACGTGACTTCTTGTTTCTACCTTCCCCAACGCCTTC TATTCCCTTCACTGCGAAAGCGCGCTCAGTGGGCCGTCACCGAACACCCTTGGTTCTTTCGTTCAGCTGTTGTCCTCTTTCTCGCGTTGCTTCCTGTGGCGTCGTGGCTCGGCTTCTCT CTCTTTCCTGTTGGTGCGTCCAGACTATGTCGCCTGTTTCCCCACCCTTCTCGGCTTGTGCTTTCAGGAGGAGCGGGACTGTACGAGGCAGCGCTGTCTCTGGGCGTTGCCTCTCACCT GTACATCACGCGTGTAGCCCGCGAGTTTCCGTGCGACGTTTTCTTCCCTGCGTTCCCCGGAGATGACATTCTTTCAAACAAATCAACTGCTGCGCAGGCTGCAGCTCCTGCCGAGTCTG TGTTCGTTCCCTTTTGTCCGGAGCTCGGAAGAGAGAAGGACAATGAAGCGACGTATCGACCCATCTTCATTTCCAAGACCTTCTCAGACAACGGGGTACCCTACGACTTTGTGGTTCTC GAGAAGAGAAGGAAGACTGACGACGCAGCCACTGCGGAACCGGTAAGAGGCAACCGAAGCGCGTAGATAAGAAAAACAACAAAGAGAAGGTGAAACACGAAGAGAAGGGAAAATGCGGA GAAACCGTGGATTTACAAAGATATCAAGAGCAATGCTTTGTGGAGATTTTTTTTAATTCAGTAGAGACACCCGCCGTGCGAGGTGTGTAGAAATAACTGCGACCCTGGAGACAGAGATG CCGCGAGTACACCACTTGTCGTTTTTCCTCCTATGTTCATGACGGGTGCTGAACGTCTATCGTACTTAATTGGAGGAGTCGTCTCCGAAGCAGCTTTGGCTGGCCATCCGTGTGTTTGC CTTGTTCCTGAAAAGCCAGAAGGCGCTCCACAGTGAGGCGATATACAGGGACGCCTACCGGAGCCCCGTTTTCTGCCTTTGTCGACTCTTGCAGAGCAACGCAATGAGCTCCTTGACGT CCACGAGGGAGACAACTCCCGTGCACGGGTTGCAGGCTCCTTCTTCGGCCGCAGCCATTGCCCCGGTGTTGGCGTGGATGGACGAAGAAGACCGGAAAAAACGCGAGCAAAAGGAACTG ATTCGGGCCGTTCCGCATGTTCACTTTAGAGGCCATGAAGAATTCCAGTACCTTGATCTCATTGCCGACATTATTAACAATGGAAGGACAATGGATGACCGAACGGGTAACGGCGACTG CGAGAAAAAGCCACACCGTTTTCTCCTGTGATTCTGTCCGCAAGCCCTCTTTTGCTTCATCCACCCTTTGCTATTCTCCGCCGCCTTCCTTTTCTGCTCCATGTTCAATTCGTTCGCTT CTTCAGTCTTTCCATCTTCCCCTGTTACCTCTGTCATTCGTTTTCTTGCCTCTATTTAACTGTGTTCTACTCACAGTCTGCATTCCGCGATAGACGAGCTTCCACGTCTTGCGTCTCGA CAAGCAACTGTCATTTGTACGCGCCTCCCTCCACCGTGAATCGGATTGTCGGTTCGCCGGTTCCTGGGTCAGAAAAGGCCTGCGCCAGTATTCTGAATAATACCCTTCGCCATTGTAAA GAGGCGAAGGAACAAAGAGATATTTCGGCGCATCTTTTGTGCGGCGCGTTTCCTCGTGCTTCACACCGATGCCCTTCTGTGCATGTCTTCTGCTCCTCGTCCTTCTCTCTTTTTCCCTG TTTAGGCGTTGGTGTCATCTCCAAATTCGGCTGCACTATGCGCTACTCGCTGGATCAGGCCTTTCCACTTCTCACCACAAAGCGTGTGTTCTGGAAAGGGTAAGGGCGTCTTCAGTGAA TGCATATATTTGACTTCAGACATTCTTAACTGTTTGACAACCAACGTACAAATTTGTTTGTCCGTGTGCGTGTTCGACATGTCAAGTATGTGAAGAGTCGCTACTGTAGACTAACGCAC GAACCAGATTTGTTTATCTGCATGCGCTGTGCACCCGTTTCTGAGTGTCTGGAGTTTCCGCAACCTTCCTTTGAATTTCTGGGTTCGTTTTTTTATGCGCGCACTGGTTTGCATGTGGC CTGAGAGAGCACAGATCGAAGGTGGGGTGATGTGGCGTCGCTGCAGAGAAACTCCGGCGAAGGCGACAGATAAAGGAGAGTGGAAATCATTGAACAGTGTCGGTCGTCTGTTGTTTCGC AGGGTCCTCGAAGAGTTGCTGTGGTTCATTCGCGGCGACACGAACGCAAACCATCTTTCTGAGAAGGGCGTGAAGGCAAGTCTACGTTGTACCTCTTGTCTCTGCCGAAGCTCAGATGT CTCCACGGCGTTGGTTTCTTTTCGTTTTTGCTTTCGTGGCATTACCATCGAGTCACCACTCATAGTTGCGTGTGTCTACATGTTTTCTAGAACGTCCGTTGTGTTGCCTCGTGGCGACC 2

3 Six Frame Translation Reading Frames & ORFs 5' 3' atgcccaagctgaatagcgtagaggggttttcatcatttgaggacgatgtataa 1 atg ccc aag ctg aat agc gta gag ggg ttt tca tca ttt gag gac gat gta taa M P K L N S V E G F S S F E D D V * 2 tgc cca agc tga ata gcg tag agg ggt ttt cat cat ttg agg acg atg tat C P S * I A * R G F H H L R T M Y 3 gcc caa gct gaa tag cgt aga ggg gtt ttc atc att tga gga cga tgt ata A Q A E * R R G V F I I * G R C I AAGCTTCGCCAGGCTGTAAATCCCGTGAGTCGTCCTCACAAATCATCAAGCAGGTGTCCTCAGGGAGACTGCCTGACTGAGTTATGCTAATTCCTTTCTACTTTGGCGTG GTCACGTGTAACCATATCCGAATCATTTCTCTAGCCCTACGAACAGGTAAGAGCGCTAGGGATGTCCGTGGAGTAGTGTGCTTACTCGATAATATTCAGTTGGGACTACC AGCGAGGCGCTCGCTTTGCTCACGCAATGCCTGAGACAGTTGCAGAATGAATGGTAACCGACAAACGCGTTCATATGCGTTTTCAAACTTAGTAGACGCGTACTGTCTGA AACTGGCGGTCACAGGCACCAGATAACGCCCTTGGCATCGGCATGTCTCGTACAGAGGTCCGTATGTAGTGCCACGACTTCTAAATCCGGCGACAGGCTGGTCTTTTGTC TTACCACGTATTAGCCCGCGTGCGATTTCTCGGAGCGCACCTGTTCAACACTAGAAAACGGAGTTTCCTGATCGAGAAGCCACCACCTTTCCAGAAGTTGAACGCTAGCA TGTCATTCGATTTTCACCCCCCGCGTAGTTCCTGTGTGTCATTCGTTGTCGAGACAACTCTGTCCCGCCCCGGTGCTGTTCCATATGCGTGACTTTCCCGCAATTTTTTC AGACTTTCAGGAAAGACAGGCTCCGGAACGATCTCGTCCATGACTGGTAAATCCACGACACCGCAATGGCCCCCAGCACCTCTATCTCTCGTGCCAGGGGACTAACGTTG TATGCGTCTGCGTCTTGTCTTTTTGCATTCGCTTTCCAAAAAAGAGAGCCATCCGTTCCCCCGCACATTCAACGCCGCGAGTGCGGTTTTTGTCTTTTTTGAGTGGTAGG ACGCTTTTCATGCGCGAACTACGTGGACATTAAGTTCCATTCTCTTTTTCGACAGCACGAAACCTTGCATTCAAACCCGCCCGCGGAAGATCCGATCTTGCTGCTGTTCG CAGTCCCAGTAGCGTCCTGTCGGCCGCGCCGTCTCTGTTGGTGGGCAGCCGCTACACCTGTTATCTGACTGCCGTGCGCGAAAATGACGCCATTTTTGGGAAAATCGGGG AACTTCATTCTTTAAAAGTATGCGGAGGTTTCCTTTTTCTTCTGTTCGTTTCTTTTTCTCGGGTTTGATAACCGTGTTCGATGTAAGCACTTTCCGTCTCTCCTCCGTGC TTTGTTCGACATCGAGACCAGGTGTGCAGATCCTTCGCTTGTCGATCCGGAGACGCGTGTCTCGTAGAACCTTTTCATTTTACCACACGGCAGTGCGGAGCACTGCTCTG AGTGCAGCAGGGACGGGTGAAGTTTCGCTTTAGTAGTGCGTTTCTGCTCTACGGGGCGTTGTCGTGTCTGGGAAGATGCAGAAACCGGTGTGTCTGGTCGTCGCGATGAC CCCCAAGAGGGGCATCGGCATCAACAACGGCCTCCCGTGGCCCCACTTGACCACAGATTTCAAACACTTTTCTCGTGTGACAAAAACGACGCCCGAAGAAGCCAGTCGCC TGAACGGGTGGCTTCCCAGGAAATTTGCAAAGACGGGCGACTCTGGACTTCCCTCTCCATCAGTCGGCAAGAGATTCAACGCCGTTGTCATGGGACGGAAAACCTGGGAA AGCATGCCTCGAAAGTTTAGACCCCTCGTGGACAGATTGAACATCGTCGTTTCCTCTTCCCTGTGAGCACACACAGTAGTCGCCACACGCTGTTTGAGACGTGTCAATCT CCAAGAGTGTGGACGCTGTTCCACGTCTTCAAATGTTTCCCAACATCCGTCGTCTAGTAGACACACCAACAAAAAGCACACGGCGAATCTGCTCATCGGAGGGAGGAGCC GGGGGGCACACAACTATCCTCAACTCTCGAACGAACATATCCGGGGCCGCGAAGACGTCCAGTCTCTCAAATCCAACCCGGAACGCAAACATTTCTGCATCAAGTCACGA TTGCGCCGGTACCTCCATGTGTAAGCAGTTCCATGAAACCTCCGATATTACACACGACTGTGGATATGAATTATATGCAGATGCATATATACTGAGACGCCGATGCAACT ATAGGTTTCCTGGCCCTCCATGGATATTTCAGACCTTCCTCTCACATTTGGTTTGCCCGTACACCTCCGTTACGCTTTTTTTCTGGCTTTCTTCTTCGTCTCTGTTTATC AGCAAAGAAGAAGACATTGCGGCGGAGAAGCCTCAAGCTGAAGGCCAGCAGCGCGTCCGAGTCTGTGCTTCACTCCCAGCAGCTCTCAGCCTTCTGGAGGAAGAGTACAA GGATTCTGTCGACCAGATTTTTGTCGTGGGTATGTTGTCCTAAACTCCTTGGAACTCCATTCTTGGTCAGAAACGTACTGAAACTGTATACATGTATATACAGATGTATG GATAATATCTAGAGAAGATACAGGGAAGACTGGCAAGGATGAAAAGACATGCAGCTTTAACGAAGCAGAGGGCATTGGCGAGAGGGACGCCCGTTATGCTGTGTGATGTG GCTGTGAATCTTACCTCGCCGTTTGACTTGCTGCAGCGCTTTGTCCACTTGAACGTGACTTCTTGTTTCTACCTTCCCCAACGCCTTCTATTCCCTTCACTGCGAAAGCG CGCTCAGTGGGCCGTCACCGAACACCCTTGGTTCTTTCGTTCAGCTGTTGTCCTCTTTCTCGCGTTGCTTCCTGTGGCGTCGTGGCTCGGCTTCTCTCTCTTTCCTGTTG GTGCGTCCAGACTATGTCGCCTGTTTCCCCACCCTTCTCGGCTTGTGCTTTCAGGAGGAGCGGGACTGTACGAGGCAGCGCTGTCTCTGGGCGTTGCCTCTCACCTGTAC ATCACGCGTGTAGCCCGCGAGTTTCCGTGCGACGTTTTCTTCCCTGCGTTCCCCGGAGATGACATTCTTTCAAACAAATCAACTGCTGCGCAGGCTGCAGCTCCTGCCGA GTCTGTGTTCGTTCCCTTTTGTCCGGAGCTCGGAAGAGAGAAGGACAATGAAGCGACGTATCGACCCATCTTCATTTCCAAGACCTTCTCAGACAACGGGGTACCCTACG ACTTTGTGGTTCTCGAGAAGAGAAGGAAGACTGACGACGCAGCCACTGCGGAACCGGTAAGAGGCAACCGAAGCGCGTAGATAAGAAAAACAACAAAGAGAAGGTGAAAC ACGAAGAGAAGGGAAAATGCGGAGAAACCGTGGATTTACAAAGATATCAAGAGCAATGCTTTGTGGAGATTTTTTTTAATTCAGTAGAGACACCCGCCGTGCGAGGTGTG TAGAAATAACTGCGACCCTGGAGACAGAGATGCCGCGAGTACACCACTTGTCGTTTTTCCTCCTATGTTCATGACGGGTGCTGAACGTCTATCGTACTTAATTGGAGGAG TCGTCTCCGAAGCAGCTTTGGCTGGCCATCCGTGTGTTTGCCTTGTTCCTGAAAAGCCAGAAGGCGCTCCACAGTGAGGCGATATACAGGGACGCCTACCGGAGCCCCGT TTTCTGCCTTTGTCGACTCTTGCAGAGCAACGCAATGAGCTCCTTGACGTCCACGAGGGAGACAACTCCCGTGCACGGGTTGCAGGCTCCTTCTTCGGCCGCAGCCATTG CCCCGGTGTTGGCGTGGATGGACGAAGAAGACCGGAAAAAACGCGAGCAAAAGGAACTGATTCGGGCCGTTCCGCATGTTCACTTTAGAGGCCATGAAGAATTCCAGTAC CTTGATCTCATTGCCGACATTATTAACAATGGAAGGACAATGGATGACCGAACGGGTAACGGCGACTGCGAGAAAAAGCCACACCGTTTTCTCCTGTGATTCTGTCCGCA AGCCCTCTTTTGCTTCATCCACCCTTTGCTATTCTCCGCCGCCTTCCTTTTCTGCTCCATGTTCAATTCGTTCGCTTCTTCAGTCTTTCCATCTTCCCCTGTTACCTCTG TCATTCGTTTTCTTGCCTCTATTTAACTGTGTTCTACTCACAGTCTGCATTCCGCGATAGACGAGCTTCCACGTCTTGCGTCTCGACAAGCAACTGTCATTTGTACGCGC CTCCCTCCACCGTGAATCGGATTGTCGGTTCGCCGGTTCCTGGGTCAGAAAAGGCCTGCGCCAGTATTCTGAATAATACCCTTCGCCATTGTAAAGAGGCGAAGGAACAA AGAGATATTTCGGCGCATCTTTTGTGCGGCGCGTTTCCTCGTGCTTCACACCGATGCCCTTCTGTGCATGTCTTCTGCTCCTCGTCCTTCTCTCTTTTTCCCTGTTTAGG CGTTGGTGTCATCTCCAAATTCGGCTGCACTATGCGCTACTCGCTGGATCAGGCCTTTCCACTTCTCACCACAAAGCGTGTGTTCTGGAAAGGGTAAGGGCGTCTTCAGT GAATGCATATATTTGACTTCAGACATTCTTAACTGTTTGACAACCAACGTACAAATTTGTTTGTCCGTGTGCGTGTTCGACATGTCAAGTATGTGAAGAGTCGCTACTGT AGACTAACGCACGAACCAGATTTGTTTATCTGCATGCGCTGTGCACCCGTTTCTGAGTGTCTGGAGTTTCCGCAACCTTCCTTTGAATTTCTGGGTTCGTTTTTTTATGC AAGCTTCGCCAGGCTGTAAATCCCGTGAGTCGTCCTCACAAATCATCAAGCAGGTGTCCTCAGGGAGACTGCCTGACTGAGTTATGCTAATTCCTTTCTACTTTGGCGTG GTCACGTGTAACCATATCCGAATCATTTCTCTAGCCCTACGAACAGGTAAGAGCGCTAGGGATGTCCGTGGAGTAGTGTGCTTACTCGATAATATTCAGTTGGGACTACC AGCGAGGCGCTCGCTTTGCTCACGCAATGCCTGAGACAGTTGCAGAATGAATGGTAACCGACAAACGCGTTCATATGCGTTTTCAAACTTAGTAGACGCGTACTGTCTGA AACTGGCGGTCACAGGCACCAGATAACGCCCTTGGCATCGGCATGTCTCGTACAGAGGTCCGTATGTAGTGCCACGACTTCTAAATCCGGCGACAGGCTGGTCTTTTGTC TTACCACGTATTAGCCCGCGTGCGATTTCTCGGAGCGCACCTGTTCAACACTAGAAAACGGAGTTTCCTGATCGAGAAGCCACCACCTTTCCAGAAGTTGAACGCTAGCA TGTCATTCGATTTTCACCCCCCGCGTAGTTCCTGTGTGTCATTCGTTGTCGAGACAACTCTGTCCCGCCCCGGTGCTGTTCCATATGCGTGACTTTCCCGCAATTTTTTC AGACTTTCAGGAAAGACAGGCTCCGGAACGATCTCGTCCATGACTGGTAAATCCACGACACCGCAATGGCCCCCAGCACCTCTATCTCTCGTGCCAGGGGACTAACGTTG TATGCGTCTGCGTCTTGTCTTTTTGCATTCGCTTTCCAAAAAAGAGAGCCATCCGTTCCCCCGCACATTCAACGCCGCGAGTGCGGTTTTTGTCTTTTTTGAGTGGTAGG ACGCTTTTCATGCGCGAACTACGTGGACATTAAGTTCCATTCTCTTTTTCGACAGCACGAAACCTTGCATTCAAACCCGCCCGCGGAAGATCCGATCTTGCTGCTGTTCG CAGTCCCAGTAGCGTCCTGTCGGCCGCGCCGTCTCTGTTGGTGGGCAGCCGCTACACCTGTTATCTGACTGCCGTGCGCGAAAATGACGCCATTTTTGGGAAAATCGGGG AACTTCATTCTTTAAAAGTATGCGGAGGTTTCCTTTTTCTTCTGTTCGTTTCTTTTTCTCGGGTTTGATAACCGTGTTCGATGTAAGCACTTTCCGTCTCTCCTCCGTGC TTTGTTCGACATCGAGACCAGGTGTGCAGATCCTTCGCTTGTCGATCCGGAGACGCGTGTCTCGTAGAACCTTTTCATTTTACCACACGGCAGTGCGGAGCACTGCTCTG AGTGCAGCAGGGACGGGTGAAGTTTCGCTTTAGTAGTGCGTTTCTGCTCTACGGGGCGTTGTCGTGTCTGGGAAGATGCAGAAACCGGTGTGTCTGGTCGTCGCGATGAC CCCCAAGAGGGGCATCGGCATCAACAACGGCCTCCCGTGGCCCCACTTGACCACAGATTTCAAACACTTTTCTCGTGTGACAAAAACGACGCCCGAAGAAGCCAGTCGCC TGAACGGGTGGCTTCCCAGGAAATTTGCAAAGACGGGCGACTCTGGACTTCCCTCTCCATCAGTCGGCAAGAGATTCAACGCCGTTGTCATGGGACGGAAAACCTGGGAA AGCATGCCTCGAAAGTTTAGACCCCTCGTGGACAGATTGAACATCGTCGTTTCCTCTTCCCTGTGAGCACACACAGTAGTCGCCACACGCTGTTTGAGACGTGTCAATCT CCAAGAGTGTGGACGCTGTTCCACGTCTTCAAATGTTTCCCAACATCCGTCGTCTAGTAGACACACCAACAAAAAGCACACGGCGAATCTGCTCATCGGAGGGAGGAGCC GGGGGGCACACAACTATCCTCAACTCTCGAACGAACATATCCGGGGCCGCGAAGACGTCCAGTCTCTCAAATCCAACCCGGAACGCAAACATTTCTGCATCAAGTCACGA TTGCGCCGGTACCTCCATGTGTAAGCAGTTCCATGAAACCTCCGATATTACACACGACTGTGGATATGAATTATATGCAGATGCATATATACTGAGACGCCGATGCAACT ATAGGTTTCCTGGCCCTCCATGGATATTTCAGACCTTCCTCTCACATTTGGTTTGCCCGTACACCTCCGTTACGCTTTTTTTCTGGCTTTCTTCTTCGTCTCTGTTTATC AGCAAAGAAGAAGACATTGCGGCGGAGAAGCCTCAAGCTGAAGGCCAGCAGCGCGTCCGAGTCTGTGCTTCACTCCCAGCAGCTCTCAGCCTTCTGGAGGAAGAGTACAA GGATTCTGTCGACCAGATTTTTGTCGTGGGTATGTTGTCCTAAACTCCTTGGAACTCCATTCTTGGTCAGAAACGTACTGAAACTGTATACATGTATATACAGATGTATG GATAATATCTAGAGAAGATACAGGGAAGACTGGCAAGGATGAAAAGACATGCAGCTTTAACGAAGCAGAGGGCATTGGCGAGAGGGACGCCCGTTATGCTGTGTGATGTG GCTGTGAATCTTACCTCGCCGTTTGACTTGCTGCAGCGCTTTGTCCACTTGAACGTGACTTCTTGTTTCTACCTTCCCCAACGCCTTCTATTCCCTTCACTGCGAAAGCG CGCTCAGTGGGCCGTCACCGAACACCCTTGGTTCTTTCGTTCAGCTGTTGTCCTCTTTCTCGCGTTGCTTCCTGTGGCGTCGTGGCTCGGCTTCTCTCTCTTTCCTGTTG GTGCGTCCAGACTATGTCGCCTGTTTCCCCACCCTTCTCGGCTTGTGCTTTCAGGAGGAGCGGGACTGTACGAGGCAGCGCTGTCTCTGGGCGTTGCCTCTCACCTGTAC ATCACGCGTGTAGCCCGCGAGTTTCCGTGCGACGTTTTCTTCCCTGCGTTCCCCGGAGATGACATTCTTTCAAACAAATCAACTGCTGCGCAGGCTGCAGCTCCTGCCGA GTCTGTGTTCGTTCCCTTTTGTCCGGAGCTCGGAAGAGAGAAGGACAATGAAGCGACGTATCGACCCATCTTCATTTCCAAGACCTTCTCAGACAACGGGGTACCCTACG ACTTTGTGGTTCTCGAGAAGAGAAGGAAGACTGACGACGCAGCCACTGCGGAACCGGTAAGAGGCAACCGAAGCGCGTAGATAAGAAAAACAACAAAGAGAAGGTGAAAC ACGAAGAGAAGGGAAAATGCGGAGAAACCGTGGATTTACAAAGATATCAAGAGCAATGCTTTGTGGAGATTTTTTTTAATTCAGTAGAGACACCCGCCGTGCGAGGTGTG TAGAAATAACTGCGACCCTGGAGACAGAGATGCCGCGAGTACACCACTTGTCGTTTTTCCTCCTATGTTCATGACGGGTGCTGAACGTCTATCGTACTTAATTGGAGGAG TCGTCTCCGAAGCAGCTTTGGCTGGCCATCCGTGTGTTTGCCTTGTTCCTGAAAAGCCAGAAGGCGCTCCACAGTGAGGCGATATACAGGGACGCCTACCGGAGCCCCGT TTTCTGCCTTTGTCGACTCTTGCAGAGCAACGCAATGAGCTCCTTGACGTCCACGAGGGAGACAACTCCCGTGCACGGGTTGCAGGCTCCTTCTTCGGCCGCAGCCATTG CCCCGGTGTTGGCGTGGATGGACGAAGAAGACCGGAAAAAACGCGAGCAAAAGGAACTGATTCGGGCCGTTCCGCATGTTCACTTTAGAGGCCATGAAGAATTCCAGTAC CTTGATCTCATTGCCGACATTATTAACAATGGAAGGACAATGGATGACCGAACGGGTAACGGCGACTGCGAGAAAAAGCCACACCGTTTTCTCCTGTGATTCTGTCCGCA AGCCCTCTTTTGCTTCATCCACCCTTTGCTATTCTCCGCCGCCTTCCTTTTCTGCTCCATGTTCAATTCGTTCGCTTCTTCAGTCTTTCCATCTTCCCCTGTTACCTCTG TCATTCGTTTTCTTGCCTCTATTTAACTGTGTTCTACTCACAGTCTGCATTCCGCGATAGACGAGCTTCCACGTCTTGCGTCTCGACAAGCAACTGTCATTTGTACGCGC CTCCCTCCACCGTGAATCGGATTGTCGGTTCGCCGGTTCCTGGGTCAGAAAAGGCCTGCGCCAGTATTCTGAATAATACCCTTCGCCATTGTAAAGAGGCGAAGGAACAA AGAGATATTTCGGCGCATCTTTTGTGCGGCGCGTTTCCTCGTGCTTCACACCGATGCCCTTCTGTGCATGTCTTCTGCTCCTCGTCCTTCTCTCTTTTTCCCTGTTTAGG CGTTGGTGTCATCTCCAAATTCGGCTGCACTATGCGCTACTCGCTGGATCAGGCCTTTCCACTTCTCACCACAAAGCGTGTGTTCTGGAAAGGGTAAGGGCGTCTTCAGT GAATGCATATATTTGACTTCAGACATTCTTAACTGTTTGACAACCAACGTACAAATTTGTTTGTCCGTGTGCGTGTTCGACATGTCAAGTATGTGAAGAGTCGCTACTGT AGACTAACGCACGAACCAGATTTGTTTATCTGCATGCGCTGTGCACCCGTTTCTGAGTGTCTGGAGTTTCCGCAACCTTCCTTTGAATTTCTGGGTTCGTTTTTTTATGC 3

4 AAGCTTCGCCAGGCTGTAAATCCCGTGAGTCGTCCTCACAAATCATCAAGCAGGTGTCCTCAGGGAGACTGCCTGACTGAGTTATGCTAATTCCTTTCTACTTTGGCGTG GTCACGTGTAACCATATCCGAATCATTTCTCTAGCCCTACGAACAGGTAAGAGCGCTAGGGATGTCCGTGGAGTAGTGTGCTTACTCGATAATATTCAGTTGGGACTACC AGCGAGGCGCTCGCTTTGCTCACGCAATGCCTGAGACAGTTGCAGAATGAATGGTAACCGACAAACGCGTTCATATGCGTTTTCAAACTTAGTAGACGCGTACTGTCTGA AACTGGCGGTCACAGGCACCAGATAACGCCCTTGGCATCGGCATGTCTCGTACAGAGGTCCGTATGTAGTGCCACGACTTCTAAATCCGGCGACAGGCTGGTCTTTTGTC TTACCACGTATTAGCCCGCGTGCGATTTCTCGGAGCGCACCTGTTCAACACTAGAAAACGGAGTTTCCTGATCGAGAAGCCACCACCTTTCCAGAAGTTGAACGCTAGCA TGTCATTCGATTTTCACCCCCCGCGTAGTTCCTGTGTGTCATTCGTTGTCGAGACAACTCTGTCCCGCCCCGGTGCTGTTCCATATGCGTGACTTTCCCGCAATTTTTTC AGACTTTCAGGAAAGACAGGCTCCGGAACGATCTCGTCCATGACTGGTAAATCCACGACACCGCAATGGCCCCCAGCACCTCTATCTCTCGTGCCAGGGGACTAACGTTG TATGCGTCTGCGTCTTGTCTTTTTGCATTCGCTTTCCAAAAAAGAGAGCCATCCGTTCCCCCGCACATTCAACGCCGCGAGTGCGGTTTTTGTCTTTTTTGAGTGGTAGG ACGCTTTTCATGCGCGAACTACGTGGACATTAAGTTCCATTCTCTTTTTCGACAGCACGAAACCTTGCATTCAAACCCGCCCGCGGAAGATCCGATCTTGCTGCTGTTCG CAGTCCCAGTAGCGTCCTGTCGGCCGCGCCGTCTCTGTTGGTGGGCAGCCGCTACACCTGTTATCTGACTGCCGTGCGCGAAAATGACGCCATTTTTGGGAAAATCGGGG AACTTCATTCTTTAAAAGTATGCGGAGGTTTCCTTTTTCTTCTGTTCGTTTCTTTTTCTCGGGTTTGATAACCGTGTTCGATGTAAGCACTTTCCGTCTCTCCTCCGTGC TTTGTTCGACATCGAGACCAGGTGTGCAGATCCTTCGCTTGTCGATCCGGAGACGCGTGTCTCGTAGAACCTTTTCATTTTACCACACGGCAGTGCGGAGCACTGCTCTG AGTGCAGCAGGGACGGGTGAAGTTTCGCTTTAGTAGTGCGTTTCTGCTCTACGGGGCGTTGTCGTGTCTGGGAAGATGCAGAAACCGGTGTGTCTGGTCGTCGCGATGAC CCCCAAGAGGGGCATCGGCATCAACAACGGCCTCCCGTGGCCCCACTTGACCACAGATTTCAAACACTTTTCTCGTGTGACAAAAACGACGCCCGAAGAAGCCAGTCGCC TGAACGGGTGGCTTCCCAGGAAATTTGCAAAGACGGGCGACTCTGGACTTCCCTCTCCATCAGTCGGCAAGAGATTCAACGCCGTTGTCATGGGACGGAAAACCTGGGAA AGCATGCCTCGAAAGTTTAGACCCCTCGTGGACAGATTGAACATCGTCGTTTCCTCTTCCCTGTGAGCACACACAGTAGTCGCCACACGCTGTTTGAGACGTGTCAATCT CCAAGAGTGTGGACGCTGTTCCACGTCTTCAAATGTTTCCCAACATCCGTCGTCTAGTAGACACACCAACAAAAAGCACACGGCGAATCTGCTCATCGGAGGGAGGAGCC GGGGGGCACACAACTATCCTCAACTCTCGAACGAACATATCCGGGGCCGCGAAGACGTCCAGTCTCTCAAATCCAACCCGGAACGCAAACATTTCTGCATCAAGTCACGA TTGCGCCGGTACCTCCATGTGTAAGCAGTTCCATGAAACCTCCGATATTACACACGACTGTGGATATGAATTATATGCAGATGCATATATACTGAGACGCCGATGCAACT ATAGGTTTCCTGGCCCTCCATGGATATTTCAGACCTTCCTCTCACATTTGGTTTGCCCGTACACCTCCGTTACGCTTTTTTTCTGGCTTTCTTCTTCGTCTCTGTTTATC AGCAAAGAAGAAGACATTGCGGCGGAGAAGCCTCAAGCTGAAGGCCAGCAGCGCGTCCGAGTCTGTGCTTCACTCCCAGCAGCTCTCAGCCTTCTGGAGGAAGAGTACAA GGATTCTGTCGACCAGATTTTTGTCGTGGGTATGTTGTCCTAAACTCCTTGGAACTCCATTCTTGGTCAGAAACGTACTGAAACTGTATACATGTATATACAGATGTATG GATAATATCTAGAGAAGATACAGGGAAGACTGGCAAGGATGAAAAGACATGCAGCTTTAACGAAGCAGAGGGCATTGGCGAGAGGGACGCCCGTTATGCTGTGTGATGTG GCTGTGAATCTTACCTCGCCGTTTGACTTGCTGCAGCGCTTTGTCCACTTGAACGTGACTTCTTGTTTCTACCTTCCCCAACGCCTTCTATTCCCTTCACTGCGAAAGCG CGCTCAGTGGGCCGTCACCGAACACCCTTGGTTCTTTCGTTCAGCTGTTGTCCTCTTTCTCGCGTTGCTTCCTGTGGCGTCGTGGCTCGGCTTCTCTCTCTTTCCTGTTG GTGCGTCCAGACTATGTCGCCTGTTTCCCCACCCTTCTCGGCTTGTGCTTTCAGGAGGAGCGGGACTGTACGAGGCAGCGCTGTCTCTGGGCGTTGCCTCTCACCTGTAC ATCACGCGTGTAGCCCGCGAGTTTCCGTGCGACGTTTTCTTCCCTGCGTTCCCCGGAGATGACATTCTTTCAAACAAATCAACTGCTGCGCAGGCTGCAGCTCCTGCCGA GTCTGTGTTCGTTCCCTTTTGTCCGGAGCTCGGAAGAGAGAAGGACAATGAAGCGACGTATCGACCCATCTTCATTTCCAAGACCTTCTCAGACAACGGGGTACCCTACG ACTTTGTGGTTCTCGAGAAGAGAAGGAAGACTGACGACGCAGCCACTGCGGAACCGGTAAGAGGCAACCGAAGCGCGTAGATAAGAAAAACAACAAAGAGAAGGTGAAAC ACGAAGAGAAGGGAAAATGCGGAGAAACCGTGGATTTACAAAGATATCAAGAGCAATGCTTTGTGGAGATTTTTTTTAATTCAGTAGAGACACCCGCCGTGCGAGGTGTG TAGAAATAACTGCGACCCTGGAGACAGAGATGCCGCGAGTACACCACTTGTCGTTTTTCCTCCTATGTTCATGACGGGTGCTGAACGTCTATCGTACTTAATTGGAGGAG TCGTCTCCGAAGCAGCTTTGGCTGGCCATCCGTGTGTTTGCCTTGTTCCTGAAAAGCCAGAAGGCGCTCCACAGTGAGGCGATATACAGGGACGCCTACCGGAGCCCCGT TTTCTGCCTTTGTCGACTCTTGCAGAGCAACGCAATGAGCTCCTTGACGTCCACGAGGGAGACAACTCCCGTGCACGGGTTGCAGGCTCCTTCTTCGGCCGCAGCCATTG CCCCGGTGTTGGCGTGGATGGACGAAGAAGACCGGAAAAAACGCGAGCAAAAGGAACTGATTCGGGCCGTTCCGCATGTTCACTTTAGAGGCCATGAAGAATTCCAGTAC CTTGATCTCATTGCCGACATTATTAACAATGGAAGGACAATGGATGACCGAACGGGTAACGGCGACTGCGAGAAAAAGCCACACCGTTTTCTCCTGTGATTCTGTCCGCA AGCCCTCTTTTGCTTCATCCACCCTTTGCTATTCTCCGCCGCCTTCCTTTTCTGCTCCATGTTCAATTCGTTCGCTTCTTCAGTCTTTCCATCTTCCCCTGTTACCTCTG TCATTCGTTTTCTTGCCTCTATTTAACTGTGTTCTACTCACAGTCTGCATTCCGCGATAGACGAGCTTCCACGTCTTGCGTCTCGACAAGCAACTGTCATTTGTACGCGC CTCCCTCCACCGTGAATCGGATTGTCGGTTCGCCGGTTCCTGGGTCAGAAAAGGCCTGCGCCAGTATTCTGAATAATACCCTTCGCCATTGTAAAGAGGCGAAGGAACAA AGAGATATTTCGGCGCATCTTTTGTGCGGCGCGTTTCCTCGTGCTTCACACCGATGCCCTTCTGTGCATGTCTTCTGCTCCTCGTCCTTCTCTCTTTTTCCCTGTTTAGG CGTTGGTGTCATCTCCAAATTCGGCTGCACTATGCGCTACTCGCTGGATCAGGCCTTTCCACTTCTCACCACAAAGCGTGTGTTCTGGAAAGGGTAAGGGCGTCTTCAGT GAATGCATATATTTGACTTCAGACATTCTTAACTGTTTGACAACCAACGTACAAATTTGTTTGTCCGTGTGCGTGTTCGACATGTCAAGTATGTGAAGAGTCGCTACTGT AGACTAACGCACGAACCAGATTTGTTTATCTGCATGCGCTGTGCACCCGTTTCTGAGTGTCTGGAGTTTCCGCAACCTTCCTTTGAATTTCTGGGTTCGTTTTTTTATGC ATGCAGAAACCGGTGTGTCTGGTCGTCGCGATGACCCCCAAGAGGGGCATCGGCATCAACAACGGCCTCCCGTGGCCCC ACTTGACCACAGATTTCAAACACTTTTCTCGTGTGACAAAAACGACGCCCGAAGAAGCCAGTCGCCTGAACGGGTGGCT TCCCAGGAAATTTGCAAAGACGGGCGACTCTGGACTTCCCTCTCCATCAGTCGGCAAGAGATTCAACGCCGTTGTCATG GGACGGAAAACCTGGGAAAGCATGCCTCGAAAGTTTAGACCCCTCGTGGACAGATTGAACATCGTCGTTTCCTCTTCCC TCAAAGAAGAAGACATTGCGGCGGAGAAGCCTCAAGCTGAAGGCCAGCAGCGCGTCCGAGTCTGTGCTTCACTCCCAGC AGCTCTCAGCCTTCTGGAGGAAGAGTACAAGGATTCTGTCGACCAGATTTTTGTCGTGGGAGGAGCGGGACTGTACGAG GCAGCGCTGTCTCTGGGCGTTGCCTCTCACCTGTACATCACGCGTGTAGCCCGCGAGTTTCCGTGCGACGTTTTCTTCC CTGCGTTCCCCGGAGATGACATTCTTTCAAACAAATCAACTGCTGCGCAGGCTGCAGCTCCTGCCGAGTCTGTGTTCGT TCCCTTTTGTCCGGAGCTCGGAAGAGAGAAGGACAATGAAGCGACGTATCGACCCATCTTCATTTCCAAGACCTTCTCA GACAACGGGGTACCCTACGACTTTGTGGTTCTCGAGAAGAGAAGGAAGACTGACGACGCAGCCACTGCGGAACCGAGCA ACGCAATGAGCTCCTTGACGTCCACGAGGGAGACAACTCCCGTGCACGGGTTGCAGGCTCCTTCTTCGGCCGCAGCCAT TGCCCCGGTGTTGGCGTGGATGGACGAAGAAGACCGGAAAAAACGCGAGCAAAAGGAACTGATTCGGGCCGTTCCGCAT GTTCACTTTAGAGGCCATGAAGAATTCCAGTACCTTGATCTCATTGCCGACATTATTAACAATGGAAGGACAATGGATG ACCGAACGG >Translation Frame 1 MQKPVCLVVAMTPKRGIGINNGLPWPHLTTDFKHFSRVTKTTPEEASRLN GWLPRKFAKTGDSGLPSPSVGKRFNAVVMGRKTWESMPRKFRPLVDRLNI VVSSSLKEEDIAAEKPQAEGQQRVRVCASLPAALSLLEEEYKDSVDQIFV VGGAGLYEAALSLGVASHLYITRVAREFPCDVFFPAFPGDDILSNKSTAA QAAAPAESVFVPFCPELGREKDNEATYRPIFISKTFSDNGVPYDFVVLEK RRKTDDAATAEPSNAMSSLTSTRETTPVHGLQAPSSAAAIAPVLAWMDEE DRKKREQKELIRAVPHVHFRGHEEFQYLDLIADIINNGRTMDDRT Terminology Different prediction methods often generate different results exon 1 exon 2 union intersection 4

5 Bioinformatics uses algorithms Algorithms are sets of rules for solving problems or identifying patterns Algorithms can be general or case specific and often need to be trained Computational analysis, like wet-bench analyses are only as good as the tools, techniques and material allow, and all interpretations come with caveats (like the experimental conditions, often call parameters in bioinformatics. How to find an intron Must begin with GT and end with AG Must be longer than 19 nucleotides Must contain a branchpoint A Donor GT often followed by a sequence pattern. This pattern is species specific Acceptor AG often proceeded by pyrimidine stretch Has a mean length of X as is observed in this species 5

6 Chromosomal Synteny Human/Mouse Finer-scale synteny 6

7 Evolutionary relationships Homology - related by evolutionary descent not equivalent to similarity Orthology - same gene in different organisms, e.g. alpha hemoglobin in humans and chimps Paralogy - genes within an organism related by gene duplication, e.g. alpha and beta hemoglobin in humans Xenology - genes related by gene transfer Functional Genomics Always has a time and space component Expression Profiles The pattern of expression of one or more genes over time or a set of experimental conditions, e.g. during development or a drug treatment or in a genetic mutant such as a gene knock-out. Microarrays cdna microarrays GeneChip in situ synthesized oligonucleotide arrays Oligomer (~70mer) arrays Experiments are almost always Competitions between conditions or stages 7

8 cdna array grid cdna Microarrays Robotic microarrayer Chip Oligo Array Hybridization mrna Probe labeling AAAAAAA TTTTTTT AAAAAAA Oligo dt Cy5 dutp Reverse transcriptase or Cy3 dutp TTTTTTT AAAAAAA Labeled cdna 8

9 General Scanning ScanArray 3000 Scans, Red, Green and Merged 9

10 Ratios of experimental to control expression are often expressed as colors rather than numbers Cluster expression ratios/profiles based on correlations 10

11 A Dendrogram of clustered expression profiles Clustered Microarray Data Genes with Similar Expression Profiles are Grouped together Other RNA expression Expressed Sequence Tags, ESTs Often represent partial cdna Often clustered Come from libraries that may, or may not be normalized Often used to identify genes in genomes and locations of introns SAGE-tags (Serial Analysis of Gene Expression) Primary purpose is to assay relative levels of gene expression Protein Expression 11

12 Typical 2 D gel High throughput mass spectrometry Direct identification of proteins from biological sample. Capillary liquid chromatography apparatus (LC) coupled with... Electrospray tandem mass spectroscopy (MS/MS) Sequest software links mass spectra with genomic sequence database. How Tandem MS Works I P A P K Individual mass spectra Complex mixture Protein Liquid chromatography Collision Inducted Dissociation (CID) I P A P K I P A P K I P A P K Ionized Peptides Isolation Fragmentation Measurement Combined mass spectrum I P A P K Peptides 12

13 Tandem MS protein data Sequest Database Search Mass Spectrometer Protein Database Nucleic Acid Database EST Database Tandem Mass Spectrum Theoretical Mass Spectrum Correlation Analysis Ranked Score of Matched Peptides Peptide database ENNPCKLQYDYNTNVTHGFGQEYPCETDIVERFSDTEGAQCDKKKIKDNSEGACAPYRRL HVCVRNLENINDYSKINNKHNLLVEVCLAAKYEGESITGRYPQHQETNPDTKSQLCTVLA RSFADIGDIIRGKDLYRGGNTKEKKKRKKLEENLKTIFGHIYDELKNGKTNGEEELQKRY RGDKDNDFYQLREDWWDANRETVWKAITCNAGSYQYSQPTCGRGEIPYVTLSKCQCIAGE VPTYFDYVPQYLRWFEEWAEDFCRKKKKKIPNVKTNCRQVQRGKEKYCDRDGYNCDGTIR KQYIYRLDTDCTKCSLACKTFAEWIDNQKEQFDKQKQKYQNEISGGGGRRQKRSTHSTKE YEGYEKHFNEELRNEGKDVRSFLQLLSKEKICKERIQVGEETANYGNFENESNTFSHTEY CDRCPLCGVDCSSDNCRKKPDKSCDEQITDKEYPPENTTKIPKLTAEKRKTGILKKYEKF CKNSDGNNGGQIKKWECHYEKNDKDDGNGDINNCIQGDWKTSKNVYYPISYYSFFYGSII DMLNESIEWRERLKSCINDAKLGKCRKGCKNPCECYKRWVEKKKDEWDKIKEFFRKQKDL LKDIAGMDAGELLEFYLENIFLEDMKNANGDPKVIEKFKEILGKENEEVQDPLKTKKTID DFLEKELNEAKNCVEKNPDNECPKQKAPGDGAAPSDPPREDITHHDGEHSSDEDEEEEEE EEQQPPAEGTEQGEEKSESKEVVEQQETPQKDTEKTVPTTTPTVDVCDTVKTALADTGSL NAACSLKYVTGKNYGWRCIAPSGTTSGKDGAICVPPRTQELCLYYLKELSDTTQKGLREA FIKTAAQETYLLWQKYKEDKQNETASTELDIDDPQTQLNGGEIPEDFKRQMFYTFGDYRD LFLGRYIGNDLDKVNNNITAVFQNGDHIPNGQKTDRQRQEFWGTYGKDIWKGMLCALQEA GGKKTLTETYNYSNVTFNGHLTGTKLNEFASRPSFLRWMTEWGDQFCRERITQLQILKER CMVYQYNGDKGKDDKKEKCTEACTYYKEWLTNWQDNYKKQNQRYTEVKGTSPYKEDSDVK ESKYAHGYLRKILKNIICTSGTDIAYCNCMEGTSTTDSSNNDNIPESLKYPPIEIEEGCT CKDPSPGEVIPEKKVPEPKVLPKPPKLPKRQPKERDFPTPALKNAMLSSTIMWSIGIGFA TFTYFYLKKKTKSTIDLLRVINIPKSDYDIPTKLSPNRYIPYTSGKYRGKRYIYLEGDSG TDSGYTDHYSDITSSSESEYEELDINDIYAPRAPKYKTLIEVVLEPSGNNTTASGNNTPS DTQNDIQNDGIPSSKITDNEWNTLKDEFISQYLQSEQPNDVPNDYSSGDIPLNTQPNTLY FDNPDEKPFITSIHDRDLYSGEEYSYNVNMVNTNNDIPISGKNGTYSGIDLINDSLNSNN A protein network Note: ORFs in addition to predicted Genes must be searched Networks have edges and nodes 13

14 Protein Networks, often established by Y2H studies Homologous chromsomes (in a diploid) Loci, alleles and SNPs Alleles and Phenotype A a AAGCCTCATC ACGCCTCATC Some phenotypes are caused by a single locus in the genome and a single allele at that locus (e.g. some flower colors, or Drosophila eye color) Other phenotypes (Type-I diabetes, heart disease are multi-locus or complex (i.e. many genes are involved, each potentially with many alleles) SNP =Single Nucleotide Polymorphism 14

15 Populations and alleles have geographic boundaries Alleles have frequencies in different populations Ontologies Terms to link equivalent concepts that have different names Gene Ontologies Sequence Ontologies BioMedical Ontologies Cell component Ontologies A parasite isolate comes from a particular population, a particular location and will have a specific haplotype (e.g. representation of alleles) often characterized via SNPs Community Databases (>1,000) Best listings NAR database and server issues NCBI - KEGG - PFAM - GO - Interpro - ProDom e.php Cyc

Crash Course in Omics Terminology and Concepts. Genome assembly. Clone-by-Clone Genome Sequencing. Shotgun DNA Sequencing (Technology)

Crash Course in Omics Terminology and Concepts. Genome assembly. Clone-by-Clone Genome Sequencing. Shotgun DNA Sequencing (Technology) Bacterial Viral Parasitic Host Genomics Crash Course in Omics Terminology and Concepts Jessica Kissinger June 4, 2007 Microarray Proteomic Genetics Immunology Genome assembly 5X random genome shotgun Library

Részletesebben

Welcome! EuPathDB Workshop Crash Course in Omics Terminology, Concepts & Data Types

Welcome! EuPathDB Workshop Crash Course in Omics Terminology, Concepts & Data Types Welcome! EuPathDB Workshop 2012 Crash Course in Omics Terminology, Concepts & Data Types Jessie Kissinger June 17, 2012 1 Protein Expression! Interactions! Genome and Annotation! RNA Sequencing! Structure!

Részletesebben

Welcome! EuPathDB Workshop 2010

Welcome! EuPathDB Workshop 2010 Welcome! EuPathDB Workshop 2010 Important Information It might rain, afternoon showers are common Air conditioned buildings may be cold, you may want a sweater You do not need your laptop for workshop

Részletesebben

Phenotype. Genotype. It is like any other experiment! What is a bioinformatics experiment? Remember the Goal. Infectious Disease Paradigm

Phenotype. Genotype. It is like any other experiment! What is a bioinformatics experiment? Remember the Goal. Infectious Disease Paradigm It is like any other experiment! What is a bioinformatics experiment? You need to know your data/input sources You need to understand your methods and their assumptions You need a plan to get from point

Részletesebben

Crash Course in Omics Terminology, Concepts & Data Types

Crash Course in Omics Terminology, Concepts & Data Types Crash Course in Omics Terminology, Concepts & Data Types 13 th Annual EuPathDB Workshop Jessie Kissinger June 17th, 2018 FungiDB MicrosporidiaDB AmoebaDB PlasmoDB ToxoDB CryptoDB PiroplasmaDB TrichDB GiardiaDB

Részletesebben

Crash Course in Omics Terminology, Concepts & Data Types

Crash Course in Omics Terminology, Concepts & Data Types Crash Course in Omics Terminology, Concepts & Data Types 12 th Annual EuPathDB Workshop: 2017 Jessie Kissinger June 18, 2017 FungiDB MicrosporidiaDB AmoebaDB PlasmoDB ToxoDB CryptoDB PiroplasmaDB TrichDB

Részletesebben

Crash Course in Omics Terminology, Concepts & Data Types

Crash Course in Omics Terminology, Concepts & Data Types Crash Course in Omics Terminology, Concepts & Data Types 14 th Annual EuPathDB Workshop Jessie Kissinger June 2, 2019 FungiDB MicrosporidiaDB AmoebaDB PlasmoDB ToxoDB CryptoDB PiroplasmaDB TrichDB GiardiaDB

Részletesebben

Trinucleotide Repeat Diseases: CRISPR Cas9 PacBio no PCR Sequencing MFMER slide-1

Trinucleotide Repeat Diseases: CRISPR Cas9 PacBio no PCR Sequencing MFMER slide-1 Trinucleotide Repeat Diseases: CRISPR Cas9 PacBio no PCR Sequencing 2015 MFMER slide-1 Fuch s Eye Disease TCF 4 gene Fuchs occurs in about 4% of the US population. Leads to deteriorating vision without

Részletesebben

SOLiD Technology. library preparation & Sequencing Chemistry (sequencing by ligation!) Imaging and analysis. Application specific sample preparation

SOLiD Technology. library preparation & Sequencing Chemistry (sequencing by ligation!) Imaging and analysis. Application specific sample preparation SOLiD Technology Application specific sample preparation Application specific data analysis library preparation & emulsion PCR Sequencing Chemistry (sequencing by ligation!) Imaging and analysis SOLiD

Részletesebben

Supplemental Table S1. Overview of MYB transcription factor genes analyzed for expression in red and pink tomato fruit.

Supplemental Table S1. Overview of MYB transcription factor genes analyzed for expression in red and pink tomato fruit. Supplemental Table S1. Overview of MYB transcription factor genes analyzed for expression in red and pink tomato fruit. MYB Primer pairs TC AtMYB Forward Reverse TC199266 MYB12 AGGCTCTTGGAGGTCGTTACC CAACTCTTTCCGCATCTCAATAATC

Részletesebben

Supplementary Figure 1

Supplementary Figure 1 Supplementary Figure 1 Plot of delta-afe of sequence variants detected between resistant and susceptible pool over the genome sequence of the WB42 line of B. vulgaris ssp. maritima. The delta-afe values

Részletesebben

Flowering time. Col C24 Cvi C24xCol C24xCvi ColxCvi

Flowering time. Col C24 Cvi C24xCol C24xCvi ColxCvi Flowering time Rosette leaf number 50 45 40 35 30 25 20 15 10 5 0 Col C24 Cvi C24xCol C24xCvi ColxCvi Figure S1. Flowering time in three F 1 hybrids and their parental lines as measured by leaf number

Részletesebben

Mapping Sequencing Reads to a Reference Genome

Mapping Sequencing Reads to a Reference Genome Mapping Sequencing Reads to a Reference Genome High Throughput Sequencing RN Example applications: Sequencing a genome (DN) Sequencing a transcriptome and gene expression studies (RN) ChIP (chromatin immunoprecipitation)

Részletesebben

Name Sequences* Length (mer) NHT-1 attcgctgcctgcagggatccctattgatcaaagtgccaaacaccg 48

Name Sequences* Length (mer) NHT-1 attcgctgcctgcagggatccctattgatcaaagtgccaaacaccg 48 1. Plasmids and their source: - par3283 (Dr. Studier F.W., Brookheaven National laboratory, NY, USA) - pff19g ( Dr. Messing J Waksman Institute, Rutgers University, USA) - pbin-hygtx and pbin-tetr (Prof.

Részletesebben

Nan Wang, Qingming Dong, Jingjing Li, Rohit K. Jangra, Meiyun Fan, Allan R. Brasier, Stanley M. Lemon, Lawrence M. Pfeffer, Kui Li

Nan Wang, Qingming Dong, Jingjing Li, Rohit K. Jangra, Meiyun Fan, Allan R. Brasier, Stanley M. Lemon, Lawrence M. Pfeffer, Kui Li Supplemental Material IRF3-dependent and NF- B-independent viral induction of the zinc-finger antiviral protein Nan Wang, Qingming Dong, Jingjing Li, Rohit K. Jangra, Meiyun Fan, Allan R. Brasier, Stanley

Részletesebben

discosnp demo - Peterlongo Pierre 1 DISCOSNP++: Live demo

discosnp demo - Peterlongo Pierre 1 DISCOSNP++: Live demo discosnp demo - Peterlongo Pierre 1 DISCOSNP++: Live demo Download and install discosnp demo - Peterlongo Pierre 3 Download web page: github.com/gatb/discosnp Chose latest release (2.2.10 today) discosnp

Részletesebben

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Szekvenciaelemzés. Cserző Miklós 2017

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Szekvenciaelemzés. Cserző Miklós 2017 Bioinformatika és genomanalízis az orvostudományban Szekvenciaelemzés Cserző Miklós 2017 A mai előadás Szekvencia analízis statisztikus szempontból Annotálás homológia alapján Az annotálás szempontjai

Részletesebben

Supplementary Table 1. Cystometric parameters in sham-operated wild type and Trpv4 -/- rats during saline infusion and

Supplementary Table 1. Cystometric parameters in sham-operated wild type and Trpv4 -/- rats during saline infusion and WT sham Trpv4 -/- sham Saline 10µM GSK1016709A P value Saline 10µM GSK1016709A P value Number 10 10 8 8 Intercontractile interval (sec) 143 (102 155) 98.4 (71.4 148) 0.01 96 (92 121) 109 (95 123) 0.3 Voided

Részletesebben

Supplementary: A strategy to optimize the generation of stable chromobody cell lines for

Supplementary: A strategy to optimize the generation of stable chromobody cell lines for Supplementary: A strategy to optimize the generation of stable chromobody cell lines for visualization and quantification of endogenous proteins in living cells Bettina-Maria Keller 1, Julia Maier 1, Melissa

Részletesebben

Tutorial 1 The Central Dogma of molecular biology

Tutorial 1 The Central Dogma of molecular biology oday DN RN rotein utorial 1 he entral Dogma of molecular biology Information flow in genetics:» ranscription» ranslation» Making sense of genomic information Information content in DN - Information content

Részletesebben

Cluster Analysis. Potyó László

Cluster Analysis. Potyó László Cluster Analysis Potyó László What is Cluster Analysis? Cluster: a collection of data objects Similar to one another within the same cluster Dissimilar to the objects in other clusters Cluster analysis

Részletesebben

Bioinformatics: Blending. Biology and Computer Science

Bioinformatics: Blending. Biology and Computer Science Bioinformatics: Blending Biology and Computer Science MDNMSITNTPTSNDACLSIVHSLMCHRQ GGESETFAKRAIESLVKKLKEKKDELDSL ITAITTNGAHPSKCVTIQRTLDGRLQVAG RKGFPHVIYARLWRWPDLHKNELKHVK YCQYAFDLKCDSVCVNPYHYERVVSPGI DLSGLTLQSNAPSSMMVKDEYVHDFEG

Részletesebben

Supplementary materials to: Whole-mount single molecule FISH method for zebrafish embryo

Supplementary materials to: Whole-mount single molecule FISH method for zebrafish embryo Supplementary materials to: Whole-mount single molecule FISH method for zebrafish embryo Yuma Oka and Thomas N. Sato Supplementary Figure S1. Whole-mount smfish with and without the methanol pretreatment.

Részletesebben

Genome 373: Hidden Markov Models I. Doug Fowler

Genome 373: Hidden Markov Models I. Doug Fowler Genome 373: Hidden Markov Models I Doug Fowler Review From Gene Prediction I transcriptional start site G open reading frame transcriptional termination site promoter 5 untranslated region 3 untranslated

Részletesebben

first base of sequence is at -32 with respect to the ATG of start site of At1g10010 start site of At1g10010

first base of sequence is at -32 with respect to the ATG of start site of At1g10010 start site of At1g10010 Plantegenet, Weber et al., 5 sequence alignments for stably heritable ELP and control genes. Sequences represent the Crick strand for the 5 region of the respective genes, i.e. they start with the base

Részletesebben

DI-, TETRA- ÉS HEXAPLOID TRITICUM FAJOK GENOMJAINAK ELEMZÉSE ÉS AZOK ÖSSZEHASONLÍTÁSA FLUORESZCENS IN SITU HIBRIDIZÁCIÓVAL

DI-, TETRA- ÉS HEXAPLOID TRITICUM FAJOK GENOMJAINAK ELEMZÉSE ÉS AZOK ÖSSZEHASONLÍTÁSA FLUORESZCENS IN SITU HIBRIDIZÁCIÓVAL Hagyomány és haladás a növénynemesítésben DI-, TETRA- ÉS HEXAPLOID TRITICUM FAJOK GENOMJAINAK ELEMZÉSE ÉS AZOK ÖSSZEHASONLÍTÁSA FLUORESZCENS IN SITU HIBRIDIZÁCIÓVAL VARGA MÓNIKA, MOLNÁR ISTVÁN ÉS KOVÁCS

Részletesebben

Supporting Information

Supporting Information Supporting Information Cell-free GFP simulations Cell-free simulations of degfp production were consistent with experimental measurements (Fig. S1). Dual emmission GFP was produced under a P70a promoter

Részletesebben

Supporting Information

Supporting Information Supporting Information Plasmid Construction DNA cloning was carried out according to standard protocols. The sequence of all plasmids was confirmed by DNA sequencing and amplified using the E. coli strain

Részletesebben

Supporting Information

Supporting Information Supporting Information Paired design of dcas9 as a systematic platform for the detection of featured nucleic acid sequences in pathogenic strains Yihao Zhang 1,2,8, Long Qian 4,8, Weijia Wei 1,3,7,8, Yu

Részletesebben

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Factor Analysis

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Factor Analysis Factor Analysis Factor analysis is a multiple statistical method, which analyzes the correlation relation between data, and it is for data reduction, dimension reduction and to explore the structure. Aim

Részletesebben

EN United in diversity EN A8-0206/419. Amendment

EN United in diversity EN A8-0206/419. Amendment 22.3.2019 A8-0206/419 419 Article 2 paragraph 4 point a point i (i) the identity of the road transport operator; (i) the identity of the road transport operator by means of its intra-community tax identification

Részletesebben

Expression analysis of PIN genes in root tips and nodules of Lotus japonicus

Expression analysis of PIN genes in root tips and nodules of Lotus japonicus Article Expression analysis of PIN genes in root tips and nodules of Lotus japonicus Izabela Sańko-Sawczenko 1, Dominika Dmitruk 1, Barbara Łotocka 1, Elżbieta Różańska 1 and Weronika Czarnocka 1, * 1

Részletesebben

Klaszterezés, 2. rész

Klaszterezés, 2. rész Klaszterezés, 2. rész Csima Judit BME, VIK, Számítástudományi és Információelméleti Tanszék 208. április 6. Csima Judit Klaszterezés, 2. rész / 29 Hierarchikus klaszterezés egymásba ágyazott klasztereket

Részletesebben

Report on esi Scientific plans 7 th EU Framework Program. José Castell Vice-President ecopa, ES

Report on esi Scientific plans 7 th EU Framework Program. José Castell Vice-President ecopa, ES Report on esi Scientific plans 7 th EU Framework Program José Castell Vice-President ecopa, ES the Seventh Framework Programme (2007-2013) Ecopa scientific plans for 2007-2008?

Részletesebben

Correlation & Linear Regression in SPSS

Correlation & Linear Regression in SPSS Petra Petrovics Correlation & Linear Regression in SPSS 4 th seminar Types of dependence association between two nominal data mixed between a nominal and a ratio data correlation among ratio data Correlation

Részletesebben

10. Genomika 2. Microarrayek és típusaik

10. Genomika 2. Microarrayek és típusaik 10. Genomika 2. 1. Microarray technikák és bioinformatikai vonatkozásaik Microarrayek és típusaik Korrelált génexpresszió mint a funkcionális genomika eszköze 2. Kombinált megközelítés a funkcionális genomikában

Részletesebben

Forensic SNP Genotyping using Nanopore MinION Sequencing

Forensic SNP Genotyping using Nanopore MinION Sequencing Forensic SNP Genotyping using Nanopore MinION Sequencing AUTHORS Senne Cornelis 1, Yannick Gansemans 1, Lieselot Deleye 1, Dieter Deforce 1,#,Filip Van Nieuwerburgh 1,#,* 1 Laboratory of Pharmaceutical

Részletesebben

Eredeti gyógyszerkutatás. ELTE TTK vegyészhallgatók számára Dr Arányi Péter 2009 március, 4.ea. Szerkezet optimalizálás (I.)

Eredeti gyógyszerkutatás. ELTE TTK vegyészhallgatók számára Dr Arányi Péter 2009 március, 4.ea. Szerkezet optimalizálás (I.) Eredeti gyógyszerkutatás ELTE TTK vegyészhallgatók számára Dr Arányi Péter 2009 március, 4.ea. Szerkezet optimalizálás (I.) 1 How do we proceed? New target Internal Literature Validation Selected Target

Részletesebben

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Nonparametric Tests

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Nonparametric Tests Nonparametric Tests Petra Petrovics Hypothesis Testing Parametric Tests Mean of a population Population proportion Population Standard Deviation Nonparametric Tests Test for Independence Analysis of Variance

Részletesebben

Orvosi Genomtudomány 2014 Medical Genomics 2014. Április 8 Május 22 8th April 22nd May

Orvosi Genomtudomány 2014 Medical Genomics 2014. Április 8 Május 22 8th April 22nd May Orvosi Genomtudomány 2014 Medical Genomics 2014 Április 8 Május 22 8th April 22nd May Hét / 1st week (9. kalendariumi het) Takács László / Fehér Zsigmond Magyar kurzus Datum/ido Ápr. 8 Apr. 9 10:00 10:45

Részletesebben

FAMILY STRUCTURES THROUGH THE LIFE CYCLE

FAMILY STRUCTURES THROUGH THE LIFE CYCLE FAMILY STRUCTURES THROUGH THE LIFE CYCLE István Harcsa Judit Monostori A magyar társadalom 2012-ben: trendek és perspektívák EU összehasonlításban Budapest, 2012 november 22-23 Introduction Factors which

Részletesebben

Szoftver-technológia II. Tervezési minták. Irodalom. Szoftver-technológia II.

Szoftver-technológia II. Tervezési minták. Irodalom. Szoftver-technológia II. Tervezési minták Irodalom Steven R. Schach: Object Oriented & Classical Software Engineering, McGRAW-HILL, 6th edition, 2005, chapter 8. E. Gamma, R. Helm, R. Johnson, J. Vlissides:Design patterns: Elements

Részletesebben

Bevezetés a kvantum-informatikába és kommunikációba 2015/2016 tavasz

Bevezetés a kvantum-informatikába és kommunikációba 2015/2016 tavasz Bevezetés a kvantum-informatikába és kommunikációba 2015/2016 tavasz Kvantumkapuk, áramkörök 2016. március 3. A kvantummechanika posztulátumai (1-2) 1. Állapotleírás Zárt fizikai rendszer aktuális állapota

Részletesebben

MIKROSZATELIT DNS- VIZSGÁLATOK A MOCSÁRI TEKNŐS NÉGY DUNÁNTÚLI ÁLLOMÁNYÁN

MIKROSZATELIT DNS- VIZSGÁLATOK A MOCSÁRI TEKNŐS NÉGY DUNÁNTÚLI ÁLLOMÁNYÁN MIKROSZATELIT DNS- VIZSGÁLATOK A MOCSÁRI TEKNŐS NÉGY DUNÁNTÚLI ÁLLOMÁNYÁN Molnár Tamás 1, Lanszki József 1, Magyary István 1, Jeney Zsigmond 2, Lehoczky István 2 1 Kaposvári Egyetem Állattudományi Kar,

Részletesebben

Pletykaalapú gépi tanulás teljesen elosztott környezetben

Pletykaalapú gépi tanulás teljesen elosztott környezetben Pletykaalapú gépi tanulás teljesen elosztott környezetben Hegedűs István Jelasity Márk témavezető Szegedi Tudományegyetem MTA-SZTE Mesterséges Intelligencia Kutatócsopot Motiváció Az adat adatközpontokban

Részletesebben

CLUSTALW Multiple Sequence Alignment

CLUSTALW Multiple Sequence Alignment Version 3.2 CLUSTALW Multiple Sequence Alignment Selected Sequences) FETA_GORGO FETA_HORSE FETA_HUMAN FETA_MOUSE FETA_PANTR FETA_RAT Import Alignments) Return Help Report Bugs Fasta label *) Workbench

Részletesebben

Correlation & Linear Regression in SPSS

Correlation & Linear Regression in SPSS Correlation & Linear Regression in SPSS Types of dependence association between two nominal data mixed between a nominal and a ratio data correlation among ratio data Exercise 1 - Correlation File / Open

Részletesebben

Cashback 2015 Deposit Promotion teljes szabályzat

Cashback 2015 Deposit Promotion teljes szabályzat Cashback 2015 Deposit Promotion teljes szabályzat 1. Definitions 1. Definíciók: a) Account Client s trading account or any other accounts and/or registers maintained for Számla Az ügyfél kereskedési számlája

Részletesebben

(A F) H&E staining of the duodenum in the indicated genotypes at E16.5 (A, D), E18.5

(A F) H&E staining of the duodenum in the indicated genotypes at E16.5 (A, D), E18.5 Fig. S1. Brg1 ablation leads to abnormal villous structure in the duodenum in the perinatal period (A F) H&E staining of the duodenum in the indicated genotypes at E16.5 (A, D), E18.5 (B, E), and P0.5

Részletesebben

Supplemental Information. Investigation of Penicillin Binding Protein. (PBP)-like Peptide Cyclase and Hydrolase

Supplemental Information. Investigation of Penicillin Binding Protein. (PBP)-like Peptide Cyclase and Hydrolase Cell Chemical Biology, Volume upplemental Information Investigation of Penicillin Binding Protein (PBP)-like Peptide Cyclase and ydrolase in urugamide on-ribosomal Peptide Biosynthesis Yongjun Zhou, Xiao

Részletesebben

4. Gyakorlat: Csoportházirend beállítások

4. Gyakorlat: Csoportházirend beállítások 4. Gyakorlat: Csoportházirend beállítások 4.1. A Default Domain Policy jelszóra vonatkozó beállításai 4.2. Parancsikon, mappa és hálózati meghajtó megjelenítése csoport házirend segítségével 4.3. Alkalmazások

Részletesebben

Markerless Escherichia coli rrn Deletion Strains for Genetic Determination of Ribosomal Binding Sites

Markerless Escherichia coli rrn Deletion Strains for Genetic Determination of Ribosomal Binding Sites Markerless Escherichia coli rrn Deletion Strains for Genetic Determination of Ribosomal Binding Sites Selwyn Quan *, Ole Skovgaard, Robert E. McLaughlin, Ed T. Buurman,1, and Catherine L. Squires * Department

Részletesebben

Performance Modeling of Intelligent Car Parking Systems

Performance Modeling of Intelligent Car Parking Systems Performance Modeling of Intelligent Car Parking Systems Károly Farkas Gábor Horváth András Mészáros Miklós Telek Technical University of Budapest, Hungary EPEW 2014, Florence, Italy Outline Intelligent

Részletesebben

Expansion of Red Deer and afforestation in Hungary

Expansion of Red Deer and afforestation in Hungary Expansion of Red Deer and afforestation in Hungary László Szemethy, Róbert Lehoczki, Krisztián Katona, Norbert Bleier, Sándor Csányi www.vmi.szie.hu Background and importance large herbivores are overpopulated

Részletesebben

16F628A megszakítás kezelése

16F628A megszakítás kezelése 16F628A megszakítás kezelése A 'megszakítás' azt jelenti, hogy a program normális, szekvenciális futása valamilyen külső hatás miatt átmenetileg felfüggesztődik, és a vezérlést egy külön rutin, a megszakításkezelő

Részletesebben

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Correlation & Linear. Petra Petrovics.

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Correlation & Linear. Petra Petrovics. Correlation & Linear Regression in SPSS Petra Petrovics PhD Student Types of dependence association between two nominal data mixed between a nominal and a ratio data correlation among ratio data Exercise

Részletesebben

On The Number Of Slim Semimodular Lattices

On The Number Of Slim Semimodular Lattices On The Number Of Slim Semimodular Lattices Gábor Czédli, Tamás Dékány, László Ozsvárt, Nóra Szakács, Balázs Udvari Bolyai Institute, University of Szeged Conference on Universal Algebra and Lattice Theory

Részletesebben

Involvement of ER Stress in Dysmyelination of Pelizaeus-Merzbacher Disease with PLP1 Missense Mutations Shown by ipsc-derived Oligodendrocytes

Involvement of ER Stress in Dysmyelination of Pelizaeus-Merzbacher Disease with PLP1 Missense Mutations Shown by ipsc-derived Oligodendrocytes Stem Cell Reports, Volume 2 Supplemental Information Involvement of ER Stress in Dysmyelination of Pelizaeus-Merzbacher Disease with PLP1 Missense Mutations Shown by ipsc-derived Oligodendrocytes Yuko

Részletesebben

Using the CW-Net in a user defined IP network

Using the CW-Net in a user defined IP network Using the CW-Net in a user defined IP network Data transmission and device control through IP platform CW-Net Basically, CableWorld's CW-Net operates in the 10.123.13.xxx IP address range. User Defined

Részletesebben

A rosszindulatú daganatos halálozás változása 1975 és 2001 között Magyarországon

A rosszindulatú daganatos halálozás változása 1975 és 2001 között Magyarországon A rosszindulatú daganatos halálozás változása és között Eredeti közlemény Gaudi István 1,2, Kásler Miklós 2 1 MTA Számítástechnikai és Automatizálási Kutató Intézete, Budapest 2 Országos Onkológiai Intézet,

Részletesebben

A HUMÁN GENOM PROJEKT Sasvári-Székely Mária* Semmelweis Egyetem, Orvosi Vegytani, Molekuláris Biológiai és Pathobiokémiai Intézet

A HUMÁN GENOM PROJEKT Sasvári-Székely Mária* Semmelweis Egyetem, Orvosi Vegytani, Molekuláris Biológiai és Pathobiokémiai Intézet A HUMÁN GENOM PROJEKT Sasvári-Székely Mária* Semmelweis Egyetem, Orvosi Vegytani, Molekuláris Biológiai és Pathobiokémiai Intézet *Levelezési cím: Dr. Sasvári-Székely Mária, Semmelweis Egyetem, Orvosi

Részletesebben

tccattaattcgacagaccagagttaaataatccttgtatgccattgtgatcacatctacagttcagattttgtatttca

tccattaattcgacagaccagagttaaataatccttgtatgccattgtgatcacatctacagttcagattttgtatttca Figure Legends for Supplementary Materials: Fig. 1. Nucleotide sequence of the zebrafish lumican (zlum) gene. Exons are indicated by uppercase letters, and introns are indicated by lowercase letters. The

Részletesebben

PIACI HIRDETMÉNY / MARKET NOTICE

PIACI HIRDETMÉNY / MARKET NOTICE PIACI HIRDETMÉNY / MARKET NOTICE HUPX DAM Másnapi Aukció / HUPX DAM Day-Ahead Auction Iktatási szám / Notice #: Dátum / Of: 18/11/2014 HUPX-MN-DAM-2014-0023 Tárgy / Subject: Változások a HUPX másnapi piac

Részletesebben

EEA, Eionet and Country visits. Bernt Röndell - SES

EEA, Eionet and Country visits. Bernt Röndell - SES EEA, Eionet and Country visits Bernt Röndell - SES Európai Környezetvédelmi Ügynökség Küldetésünk Annak elősegítése, hogy az EU és a tagállamok a szükséges információk alapján hozhassák meg a környezet

Részletesebben

Felnőttképzés Európában

Felnőttképzés Európában Felnőttképzés Európában Nincs szükség annyi diplomásra, amennyit képeznek Helyettük szakképzett emberekre lenne kereslet Az itthon OKJ-s képzés európai hagyományában két vonal érvényesül: - dán - német

Részletesebben

Az Open Data jogi háttere. Dr. Telek Eszter

Az Open Data jogi háttere. Dr. Telek Eszter Az Open Data jogi háttere Dr. Telek Eszter Egy kis ismétlés Open Data/Open Access/Open Knowledge gyökerei Open Source Software FLOSS (Free Libre Open Source Software) Szoftver esetében egyszerű alapok:

Részletesebben

Proxer 7 Manager szoftver felhasználói leírás

Proxer 7 Manager szoftver felhasználói leírás Proxer 7 Manager szoftver felhasználói leírás A program az induláskor elkezdi keresni az eszközöket. Ha van olyan eszköz, amely virtuális billentyűzetként van beállítva, akkor azokat is kijelzi. Azokkal

Részletesebben

Sebastián Sáez Senior Trade Economist INTERNATIONAL TRADE DEPARTMENT WORLD BANK

Sebastián Sáez Senior Trade Economist INTERNATIONAL TRADE DEPARTMENT WORLD BANK Sebastián Sáez Senior Trade Economist INTERNATIONAL TRADE DEPARTMENT WORLD BANK Despite enormous challenges many developing countries are service exporters Besides traditional activities such as tourism;

Részletesebben

TÁJÉKOZTATÓ SPECIALIZÁCIÓKRÓL: 1) BUSINESS ENGLISH 2) FORDÍTÁS ÉS TOLMÁCSOLÁS ALAPJAI. 2016. március 10.

TÁJÉKOZTATÓ SPECIALIZÁCIÓKRÓL: 1) BUSINESS ENGLISH 2) FORDÍTÁS ÉS TOLMÁCSOLÁS ALAPJAI. 2016. március 10. TÁJÉKOZTATÓ SPECIALIZÁCIÓKRÓL: 1) BUSINESS ENGLISH 2) FORDÍTÁS ÉS TOLMÁCSOLÁS ALAPJAI 2016. március 10. Jelentkezés mindkét specializációra Az elsős faliújságra kitett jelentkezési lapon lehet a felvételi

Részletesebben

7 th Iron Smelting Symposium 2010, Holland

7 th Iron Smelting Symposium 2010, Holland 7 th Iron Smelting Symposium 2010, Holland Október 13-17 között került megrendezésre a Hollandiai Alphen aan den Rijn városában található Archeon Skanzenben a 7. Vasolvasztó Szimpózium. Az öt napos rendezvényen

Részletesebben

Supplemental Information. RNase H1-Dependent Antisense Oligonucleotides. Are Robustly Active in Directing RNA Cleavage

Supplemental Information. RNase H1-Dependent Antisense Oligonucleotides. Are Robustly Active in Directing RNA Cleavage YMTHE, Volume 25 Supplemental Information RNase H1-Dependent Antisense Oligonucleotides Are Robustly Active in Directing RNA Cleavage in Both the Cytoplasm and the Nucleus Xue-Hai Liang, Hong Sun, Joshua

Részletesebben

Szövettan kérdései Ami a terápiát meghatározza és ami segíti Dr. Sápi Zoltán

Szövettan kérdései Ami a terápiát meghatározza és ami segíti Dr. Sápi Zoltán Szövettan kérdései Ami a terápiát meghatározza és ami segíti Dr. Sápi Zoltán 1.Számú Patológiai és Kísérleti Rákkutató Intézet Diagnózis (definitív): benignus, malignus, intermedier malignitás, borderline

Részletesebben

Rezgésdiagnosztika. Diagnosztika 02 --- 1

Rezgésdiagnosztika. Diagnosztika 02 --- 1 Rezgésdiagnosztika Diagnosztika 02 --- 1 Diagnosztika 02 --- 2 A rezgéskép elemzésével kimutatható gépészeti problémák Minden gép, mely tartalmaz forgó részt (pl. motor, generátor, szivattyú, ventilátor,

Részletesebben

Lecture 11: Genetic Algorithms

Lecture 11: Genetic Algorithms Lecture 11 1 Linear and Combinatorial Optimization Lecture 11: Genetic Algorithms Genetic Algorithms - idea Genetic Algorithms - implementation and examples Lecture 11 2 Genetic algorithms Algorithm is

Részletesebben

Nagy áteresztő képességű SNP mérések hasznosítása. Dr. Szalai Csaba

Nagy áteresztő képességű SNP mérések hasznosítása. Dr. Szalai Csaba Nagy áteresztő képességű SNP mérések hasznosítása Dr. Szalai Csaba 1 2 SNP-k SNP = single nucleotide polymorphism = kb. pontmutáció Általában biallélikusak, általában funkcionálisan semlegesek Több mint

Részletesebben

Dr. Ottó Szabolcs Országos Onkológiai Intézet

Dr. Ottó Szabolcs Országos Onkológiai Intézet Nemzeti Kutatási és Fejlesztési Program 1. Főirány: Életminőség javítása Nemzeti Onkológiai Kutatás-Fejlesztési Konzorcium a daganatos halálozás csökkentésére 1/48/2001. Részjelentés: 200. November 0.-2004.

Részletesebben

Manuscript Title: Identification of a thermostable fungal lytic polysaccharide monooxygenase and

Manuscript Title: Identification of a thermostable fungal lytic polysaccharide monooxygenase and 1 2 3 4 5 Journal name: Applied Microbiology and Biotechnology Manuscript Title: Identification of a thermostable fungal lytic polysaccharide monooxygenase and evaluation of its effect on lignocellulosic

Részletesebben

Gottsegen National Institute of Cardiology. Prof. A. JÁNOSI

Gottsegen National Institute of Cardiology. Prof. A. JÁNOSI Myocardial Infarction Registry Pilot Study Hungarian Myocardial Infarction Register Gottsegen National Institute of Cardiology Prof. A. JÁNOSI A https://ir.kardio.hu A Web based study with quality assurance

Részletesebben

USER MANUAL Guest user

USER MANUAL Guest user USER MANUAL Guest user 1 Welcome in Kutatótér (Researchroom) Top menu 1. Click on it and the left side menu will pop up 2. With the slider you can make left side menu visible 3. Font side: enlarging font

Részletesebben

Decision where Process Based OpRisk Management. made the difference. Norbert Kozma Head of Operational Risk Control. Erste Bank Hungary

Decision where Process Based OpRisk Management. made the difference. Norbert Kozma Head of Operational Risk Control. Erste Bank Hungary Decision where Process Based OpRisk Management made the difference Norbert Kozma Head of Operational Risk Control Erste Bank Hungary About Erste Group 2010. 09. 30. 2 Erste Bank Hungary Erste Group entered

Részletesebben

A fő egészségügyi kihívások

A fő egészségügyi kihívások A fő egészségügyi kihívások Öregedés Mentális betegségek Fertőző betegségek Elhízás, diabetes Allergia, asztma Szív- és érbetegségek Autoimmun kórképek Rák Komplex betegségek Rendszerbiológia Bioinformatika,

Részletesebben

Limitations and challenges of genetic barcode quantification

Limitations and challenges of genetic barcode quantification Limitations and challenges of genetic barcode quantification Lars hielecke, im ranyossy, ndreas Dahl, Rajiv iwari, Ingo Roeder, Hartmut eiger, Boris Fehse, Ingmar lauche and Kerstin ornils SUPPLEMENRY

Részletesebben

Create & validate a signature

Create & validate a signature IOTA TUTORIAL 7 Create & validate a signature v.0.0 KNBJDBIRYCUGVWMSKPVA9KOOGKKIRCBYHLMUTLGGAV9LIIPZSBGIENVBQ9NBQWXOXQSJRIRBHYJ9LCTJLISGGBRFRTTWD ABBYUVKPYFDJWTFLICYQQWQVDPCAKNVMSQERSYDPSSXPCZLVKWYKYZMREAEYZOSPWEJLHHFPYGSNSUYRZXANDNQTTLLZA

Részletesebben

GENERATÍV TEST (VIRÁGOS NÖVÉNYEK)

GENERATÍV TEST (VIRÁGOS NÖVÉNYEK) GENERATÍV TEST (VIRÁGOS NÖVÉNYEK) MITÓZIS IVAROS szaporító szervek hím női (antheridium) (archegonium) IVARTALAN szaporító szervek Sporangium 2n n MEIÓZIS (2n 2n) MITÓZIS IVARTALAN SZAPORÍTÓSZERVEK (2n

Részletesebben

A TARTÁS- ÉS FEJÉSTECHNOLÓGIA HATÁSA A NYERS TEHÉNTEJ MIKROBIOLÓGIAI MINŐSÉGÉRE

A TARTÁS- ÉS FEJÉSTECHNOLÓGIA HATÁSA A NYERS TEHÉNTEJ MIKROBIOLÓGIAI MINŐSÉGÉRE DEBRECENI EGYETEM AGRÁR- ÉS MŰSZAKI TUDOMÁNYOK CENTRUMA MEZŐGAZDASÁGTUDOMÁNYI KAR ÉLELMISZERTUDOMÁNYI, MINŐSÉGBIZTOSÍTÁSI ÉS MIKROBIOLÓGIAI INTÉZET ÁLLATTENYÉSZTÉSI TUDOMÁNYOK DOKTORI ISKOLA Doktori Iskola

Részletesebben

Statistical Inference

Statistical Inference Petra Petrovics Statistical Inference 1 st lecture Descriptive Statistics Inferential - it is concerned only with collecting and describing data Population - it is used when tentative conclusions about

Részletesebben

INDEXSTRUKTÚRÁK III.

INDEXSTRUKTÚRÁK III. 2MU05_Bitmap.pdf camü_ea INDEXSTRUKTÚRÁK III. Molina-Ullman-Widom: Adatbázisrendszerek megvalósítása Panem, 2001könyv 5.4. Bittérkép indexek fejezete alapján Oracle: Indexek a gyakorlatban Oracle Database

Részletesebben

PME8 QTAPAS A LABEL FREE

PME8 QTAPAS A LABEL FREE PME8 QTAPAS A LABEL FREE QUANTIFICATION APPROACH MARTA MENDES, MARÍA FERNANDÉZ AND IGNACIO CASAL CENTRO DE INVESTIGACIONES BIOLÓGICAS MADRID MARCH 2013 PME 8 QTAPAS OVERVIEW TARGETED PROTEOMICS FOR AQUA

Részletesebben

Construction of a cube given with its centre and a sideline

Construction of a cube given with its centre and a sideline Transformation of a plane of projection Construction of a cube given with its centre and a sideline Exercise. Given the center O and a sideline e of a cube, where e is a vertical line. Construct the projections

Részletesebben

A cell-based screening system for RNA Polymerase I inhibitors

A cell-based screening system for RNA Polymerase I inhibitors Electronic Supplementary Material (ESI) for MedChemComm. This journal is The Royal Society of Chemistry 2019 Supporting Information A cell-based screening system for RNA Polymerase I inhibitors Xiao Tan,

Részletesebben

Bird species status and trends reporting format for the period (Annex 2)

Bird species status and trends reporting format for the period (Annex 2) 1. Species Information 1.1 Member State Hungary 1.2.2 Natura 2000 code A634-B 1.3 Species name Ardea purpurea purpurea 1.3.1 Sub-specific population East Europe, Black Sea & Mediterranean/Sub-Saharan Africa

Részletesebben

A forrás pontos megnevezésének elmulasztása valamennyi hivatkozásban szerzői jogsértés (plágium).

A forrás pontos megnevezésének elmulasztása valamennyi hivatkozásban szerzői jogsértés (plágium). A szakirodalmi idézések és hivatkozások rendszere és megadásuk szabályai A bibliográfia legfontosabb szabályai Fogalma: Bibliográfiai hivatkozáson azoknak a pontos és kellően részletezett adatoknak az

Részletesebben

2. Local communities involved in landscape architecture in Óbuda

2. Local communities involved in landscape architecture in Óbuda Év Tájépítésze pályázat - Wallner Krisztina 2. Közösségi tervezés Óbudán Óbuda jelmondata: Közösséget építünk, ennek megfelelően a formálódó helyi közösségeket bevonva fejlesztik a közterületeket. Békásmegyer-Ófaluban

Részletesebben

Modular Optimization of Hemicellulose-utilizing Pathway in. Corynebacterium glutamicum for Consolidated Bioprocessing of

Modular Optimization of Hemicellulose-utilizing Pathway in. Corynebacterium glutamicum for Consolidated Bioprocessing of [Supplementary materials] Modular Optimization of Hemicellulose-utilizing Pathway in Corynebacterium glutamicum for Consolidated Bioprocessing of Hemicellulosic Biomass Sung Sun Yim 1, Jae Woong Choi 1,

Részletesebben

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Nonparametric Tests. Petra Petrovics.

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet. Nonparametric Tests. Petra Petrovics. Nonparametric Tests Petra Petrovics PhD Student Hypothesis Testing Parametric Tests Mean o a population Population proportion Population Standard Deviation Nonparametric Tests Test or Independence Analysis

Részletesebben

Szívkatéterek hajlékonysága, meghajlítása

Szívkatéterek hajlékonysága, meghajlítása Szívkatéterek hajlékonysága, meghajlítása Összefoglalás A szívkatéter egy olyan intravaszkuláris katéter, amelyet a szívbe vezetnek, ültetnek be diagnosztikus vagy terápiás célból. A katéterek felvezetés/eltávolítás

Részletesebben

A modern e-learning lehetőségei a tűzoltók oktatásának fejlesztésében. Dicse Jenő üzletfejlesztési igazgató

A modern e-learning lehetőségei a tűzoltók oktatásának fejlesztésében. Dicse Jenő üzletfejlesztési igazgató A modern e-learning lehetőségei a tűzoltók oktatásának fejlesztésében Dicse Jenő üzletfejlesztési igazgató How to apply modern e-learning to improve the training of firefighters Jenő Dicse Director of

Részletesebben

1. A TERMÉK ÉS A VÁLLALKOZÁS AZONOSÍTÁSA

1. A TERMÉK ÉS A VÁLLALKOZÁS AZONOSÍTÁSA Kibocsátás dátuma 22-febr.-2010 1. A TERMÉK ÉS A VÁLLALKOZÁS AZONOSÍTÁSA Felülvizsgálási szám 1 Termékazonosító Termék neve Cat No. 357400000; 357400010; 357400050; 357400250 Szinonimák Silicon dioxide

Részletesebben

Statistical Dependence

Statistical Dependence Statistical Dependence Petra Petrovics Statistical Dependence Deinition: Statistical dependence exists when the value o some variable is dependent upon or aected by the value o some other variable. Independent

Részletesebben

Angol Középfokú Nyelvvizsgázók Bibliája: Nyelvtani összefoglalás, 30 kidolgozott szóbeli tétel, esszé és minta levelek + rendhagyó igék jelentéssel

Angol Középfokú Nyelvvizsgázók Bibliája: Nyelvtani összefoglalás, 30 kidolgozott szóbeli tétel, esszé és minta levelek + rendhagyó igék jelentéssel Angol Középfokú Nyelvvizsgázók Bibliája: Nyelvtani összefoglalás, 30 kidolgozott szóbeli tétel, esszé és minta levelek + rendhagyó igék jelentéssel Timea Farkas Click here if your download doesn"t start

Részletesebben