Proteomika alapfogalmak, módszerek, példák a proteomika alkalmazására
Alapfogalmak és omikák : Genomika Teljes humán genom szekvenciájának meghatározása: 2001. február Genom: Winkler, 1920; GENes and chromosomes Egy szervezet, sejt, egy organellum vagy egy vírus teljes kromoszomális és kromoszómán kívüli génjeinek összessége, azaz a szervezet teljes DNS-állománya (IUPAC) - Genomika: Roderick, 1986 (Genomics, folyóirat) genom szekvenciájára vonatkozó adatállomány új gének felfedezése géntérképezés genomok összehasonlítása (fajok, evolúció) új, gén alapú eljárások
Alapfogalmak és omikák : Proteomika Proteom: M. Wilkins (1994) Conference on Genome and Protein Maps, Siena, Italy Protein complement expressed by a genome. Egy szervezet, egy sejt, egy organellum vagy egy vírus összes proteinje, a szervezet teljes fehérjeállománya If the genome is a list of the instruments in an orchestra, the proteome is the orchestra playing a symphony. (R. Simpson) Proteomika: 1. Proteomok kvalitatív és kvantitatív analízise, összehasonlítása különböző körülmények között (pl. beteg vs egészséges) 2. Azonosítás (szekvencia, 3D szerkezet) és fehérjemódosítások 3. Kísérleti megfigyelések összegyűjtése adatbázisban 4. A fehérjék alábbi tulajdonságainak meghatározása: - lokalizáció - módosítások (pl. poszttranszlációs módosítások) - kapcsolatok (pl. metabolikus és jelátviteli utak) - aktivitás - funkció (predikció és kísérleti eredmények alpján) 5. Betegségek megértése, diagnosztika, gyógyszerek fejlesztése
További omikák Bioinformatika Adat Adat Adat Adat Genomika Transcriptomika Proteomika Metabolomika Gének mrns Fehérjék Metabolitok
Összefoglaló Genom Proteom Genomika sejttérképezés" Funkcionális genomika Proteomika
Proteomika mint kulcsszó az irodalomban Darab közlemény 3000 2500 2000 1500 1000 500 0 2791 2484 2595 2100 1533 974 310 4 2001 2002 2003 2004 2005 2006 2007 2008 Év
Miért kell a proteomika? Az mrns expresszió nem mindig felel meg a fehérjeexpressziónak Biológiai minták (pl. szérum, vizelet stb.) nem alkalmas mrns expressziós analízisre Poszttranszlációs változások: nem lehet egyértelműen következtetni a DNS szekvencia alapján A fehérjék lokalizációjára és kölcsönhatásaira is lehet következtetni
Proteomikák Funkcionális Aktivitáson alapuló proteomika: Funkció összekapcsolása génexpressziós és/vagy fehérjefehérje interakciós adatokkal Kémia proteomika: Proteom-szintű vizsgálatok Enzimaktivitás meghatározására, sokféle kémiai könyvtár Toxikoproteomika: Specifikus fehérjék azonosítása és koncentrációváltozásuk mérése Integrált Mikrobiális proteomika Célzott proteomika: Szövetproteomika (Kezdeményezés: National Cancer Institute) Strukturális Filoproteomika: Ismeretlen bakteriális izolátumok azonosítása az adatbázisban szereplő fehérje biomarkerek hasonlósága alapján Statisztikus proteomika: High throughput 3D/4D fehérjeszerkezeti információ analízise és alkalmazása valamennyi élettudomány alapján
Az expressziótól az azonosításig és tovább... Eredet meghatározás (taxonómia) Sejtlizátum -Nukleinsav -Fehérje -Lipidek -Szénhidrátok Lízis Elválasztás Fehérje expresszió Izolált fehérje Primer szerkezet (aminosav sorrend) Alegységszerkezet Poszttranszlációs mód. Lokalizáció Térszerkezet (3D) Funkció Annotáció Rokonság más fehérjével Asszociáció betegséggel
Az expressziótól az azonosításig és tovább... Nehézségek Eredet (taxonomia) 1. Fehérje-expresszió expresszió 1. "Sokféle fehérje" : 30 000 gén - 500 000 fehérje 2. Eltérô expressziós profil : mennyiség, minôség - idô - hômérséklet - fény/részecske - kémiai szignál -- "természetes" -- "környezeti" (gyógyszer, szennyezés stb) Sejtlizátum - nukleinsavak - fehérjék - lipidek - szénhidrátok... Lízis 1. Nem teljes, molekuláris szintû dezintegráció. 2. Oldékonyság (hidrofób fehérjék). 3. Enzimaktivitás, degradáció.
Az expressziótól az azonosításig és tovább... Nehézségek Sejtlizátum - nukleinsavak - fehérjék - lipidek - szénhidrátok... Elválasztás - elekroforézis - kromatográfia - UC... Izolált fehérje 1. "Sokféle fehérje" : 500 000 fehérje; kb. 10000 fehérje/minta, de csak kb. 2000 választható el 2D gélelektroforézissel 2. Kicsi és nagy 3. Kis mennyiség ("ritka protein"). 4. Alacsony koncentráció. 5. Nagy mennyiség ("abundant protein"). 6. Magas koncentráció. 7. Membrán/hidrofób fehérje (oldékonysági problémák) Elôfrakcionálás pi 5 6 7 8 9 + _ Pl. Humán szérum : 600 folt, ebből 205 a pi 5-6 tartományban
Az expressziótól az azonosításig és tovább... Nehézségek Izolált fehérje Primer szerkezet - aminosavsorrend Szerkezetvizsgálat - kémiai, enzimatikus lebontás - MS - bioinformatika 1. Diszulfid híd - alegységszerkezet. 2. Oldallánc amidkötés. 3. Nem-kovalens komplex. 4. Poszt transzlációs változáson átesett fehérje. 5. Enzim "rezisztens" fehérje (lásd prion). 6. Adatbázisban nem szereplő fehérje Pl. Humán szérum : 600 folt, ebből 205 a pi 5-6 tartományban, ebből 105 található meg az adatbázisban.
Az expressziótól az azonosításig és tovább... Nehézségek Primer szerkezet - aminosavsorrend Annotáció Primer szerkezet - alegységek - poszttranszlációs modosulások Térszerkezet Lokalizáció Funkció(k) - Ca 2+ kötés - Zn finger - ATP kötés Rokonság más fehérjével Asszociáció betegséggel 1. Ismeretlen térszerkezet - izolálás, szintézis, X-ray/NMR - predikció. 2. Ismeretlen lokalizáció - sejtfrakcionálás, - radioaktiv izotópos bioszintézis 3. Ismeretlen funkció - kötődés - biológiai válasz mérése 4. Összehasonlító vizsgálatok - fajok, - "normál" vs "kezelt"
Proteomikai munkafolyamat Minta összegyűjtése Organellumok szétválasztása Tisztítás ellenanyag segítségével 1 és 2D gélelektroforézis RP-HPLC SCX HPLC (ioncserés) Fehérje gélek Fehérje(k) (pöttyök) kivágása minta Előkészítő lépések ESI-MS, MALDI-TOF Szerkezeti vagy tömeg információk MS peptidek Fehérje(k) Keresés adatbázisban Fehérje azonosítás SWISS-PROT TrEMBL RefSeq XPs Ensembl...
A médium összetételének hatása az E-coli fehérjeösszetételére Arg - Arg Farrell PHO (1978)
Mintaelőkészítési nehézségek Szövet, szerv, stádiumspecifikus expresszió Kis mennyiségben jelenlévő fehérjék Abundáns fehérjék Nem mindegy, hogy milyen körülményeket alkalmazunk Membránfehérjék problémája Arg - Arg A médium összetételének hatása az E-coli fehérjeösszetételére Farrell PHO (1978)
ProteoMiner (Bio-Rad) Biológiai minta ligand könyvtár Fehérjék kötődése nem kötődő fehérjék eltávolítása eluálás, analízis
Membrán fehérje oldatba vitele 2D elektroforézishez Miért reprezentálják csak 1%-t az összes azonosított fehérjének? 1. Kis mennyiségben vannak 2. Általában magas a pi értékük 3. Rosszul oldódnak vizes oldatban Megoldás 1. A lipid környezetből izolálni kell 2. Oldható formába kerüljenek 3. Oldatban maradjanak az IEF egész ideje alatt
Néhány lehetséges módszer Fehérjekeverék, amely több ezer egyedi fehérjét tartalmaz 2D-elektroforézis 2D-Kromatográfia 1. Dimenzió: IEF Emésztés 2. Dimenzió: PAGE Peptid keverék A pöttyök emésztése MS Adatok elemzése MS Adatok elemzése
Elválasztás: 2D gélelektroforézis Minta oldata Kiszárított gélcsík vájatok - passzív rehidratálás (20 C, egész éjszaka) / aktív - Izoelektromos fókuszálás (50-250 V, 20 ; 250-10000 V, 150 ; 8 óra) gélcsík Futtatás (16 ma/gel, 30 perc, utána 24 ma/gél) Ekvilibrálás (DTT, SDS, jódacetamid) Fixálás, festés, mosás Akrilamid gél
Detektálás: festékek, szoftverek A detektálás alsó határa 1 ng Teljes sejtkivonatból azonosíthatók azok a fehérjék, amelyek 10000 kópia/sejt mennyiségben vannak jelen, de a regulátor fehérjék száma <10000 kópia/sejt Coomassie G250 vagy R250 Fluoreszcens festékek DIGE-hoz (Cy3, 5) Ezüst festés Kiértékelő szoftverek: Progenesis, DeCyder, PDQuest
Differenciál gélelektroforézis (DIGE) 1. Fehérje kivonat Egyes festékkel jelölt Kétféle jelölt minta összekeverése 2. Fehérje kivonat Kettes festékkel jelölt Elválasztás: 2D PAGE Gerjesztés: 1. hullámhossz gélkép Gerjesztés: 2. hullámhossz Képanalízis: képek egymásra vetítése Differenciál analízis Képanalízis: mennyiségi különbségek
Humán plazma részleges proteintérképe 2D gélelektroforézis alapján (JC Sanchez et al. 1995). 8-200 kda méret pi = 4,0 6,0 izoelektromos pont tartományba eső fehérjekomponensek
Egészséges humán vastagbél epitélium fehérje térképe a sejtlizátum 2D gélelektroforézis alapján (MA Raymond et al. 1997).
Sejtmag fehérjék HeLa sejtekből Swiss-Prot
Sejtmag fehérjék HeLa sejtekből M w pi
Fibroblaszt lizátum fehérjéinek 2D gélelektroforézis képe A: egészséges, B: Down-kóros beteg mintája A B
Elválasztás után, tömegspektrometria előtt Gélcsík vagy gélpötty kivágása, mosás (vízzel, majd acetonitrillel) Redukálás: DTT (ha ez nem történik meg, akkor lehetséges, hogy a hasítóhelyek nem lesznek hozzáférhetőek) Alkilálás: jódacetamid, utána reagens eltávolítása, utolsó mosás: acetonitrillel, majd szárítás Emésztés gélben: enzimatikus vagy kémiai Emésztéshez használható reagensek: Tripszin: Lys, Arg mellett (fehérje:tripszin 50:1) Termolizin: Leu, Ile, Val, Phe, Met, Ala mellett BrCN: Met Extrakció (ACN, hangyasav; bepárlás után minta felvétele az eluensben)
Nem gél alapú elválasztási eljárások: kromatográfiás technikák peptidek, fehérjék analíziséhez Gélszűrés Hidrofób kölcsönhatás Ioncserés Fordított fázisú Affinitási
Multidimensional Protein Identification Technology (MudPIT) emésztés Denaturált fehérje komplex Peptidek Erős kationcserélő oszlop Fordított fázisú oszlop Peptidek 2D kromatográfiás elválasztása Peptid fragmentáció (MS/MS) Keresés adatbázisban A komplexben lévő fehérjék azonosítása
ICAT: Isotope Coded Affinity Tag 1. A fehérjék izolálása, izotóp jelzése jelzés kétféle típusú stabil izotóppal (peptidek szilárd fázisú kinyeréséhez: jelölt biotin) 2. A kétféle keverék egyesítése 3. Emésztés 4. Elválasztás 5. Tömegspektrometria 6. Azonosítás adatbázisok alapján
SILAC: Stable Isotope Labeling by Amino acids in Cell culture Alapja: aminosavak beépülése a sejt fehérjéibe Néhány osztódást várni kell a kezelés előtt
MALDI ESI LC-MS Proteomikában leggyakrabban használt Mikor melyik módszert? ESI Ioncsapda MALDI TOF-TOF Felbontás kicsi nagy Tömegpontosság 100 ppm 10 ppm Érzékenység Femto/pikomol Femtomol MS/MS + + Keverékek HPLC-vel igen nem Throughput alacsony (HPLC-vel) magas
Tömegspektrometria ionforrás analizátor detektor MALDI ESI TOF, ioncsapda, FT-ICR
Peptidek fragmentálódása
TQTXT (X = 19 aminosav) peptidkönyvtár vizsgálata ESI- FTICR tömegspektrometriával I,L [TQT Q T+ H] + 578.2759 [TQT K T+ H ] + 578.3127 M calc. (TQTQT): 578.2708 M calc. (TQTK T): 578.3071 X = [TQTX T+H ] + - Signals m /z G A S P V T N Q, K D E M F R Y W H 510 530 550 570 590 610 630 TQTQT/TQTKT Ms különbség: 0,368 m /z
Keresés adatbázisban MS alapján MS-MS alapján Tömegspektrum MS/MS spektrum Peptide Mass Fingerprint (PMF) Fehérje azonosítás peptid tömeg alapján Szekvencia specifikus információ minden peptidre Fehérje azonosítás a peptidek szekvencia információja alapján Legalább 5 peptid tömegnek egyeznie kell Az azonosításhoz Legalább 2 fragmentációs mintázatnak egyeznie kell
Mit csinálnak a keresőmotorok? MS alapján történő keresés MS-MS alapján történő keresés A fehérjék elméleti emésztése Megkeresi a legjobb egyezést a kísérleti peptid tömeg és az elméleti peptid tömeg között A fehérjék elméleti emésztése Elméleti fragmens ionok generálása minden lehetséges triptikus peptidre, amely az emésztés során keletkezett Legjobb egyezés keresése peptid azonosításhoz Peptidek szekvenciáján alapuló fehérje azonosítás MASCOT: mindkét féle keresést tudja
Mascot - MS/MS, szekvencia és tömegadatok kombinált keresése - MSDB, SwissProt és NCBI adatbázisokban keres ExPASy (Expert Protein Analysis System) www.expasy.org -2D gélelektroforézis adatbázis -Technikai információk -Keresés fehérje neve, azonosítója alapján
Protein Protein Sequence Databases: PIR, PRF, RefSeq, SwissProt, TrEMBL Protein Family Databases: InterPro, iproclass, Pfam, PIR-ALN, ProDom Protein Structure Databases: CSD, MMDB,NDH, PDB, Protein Structural Classification Databases: CATH, DSSP, FSSP, HSSP, SCOP, Post-translational Modification Databases: O-GlyBase, RESID, Protein-protein kölcsönhatás CuraGen: Portal.curagen.com DIP: Dipode-mbi.ucla.edu Interact: Bioinf.man.ac.uk/interactso.htm MIPS: mips.biochem.mpg.de ProNet: Pronet.doublewist.com
Ismert 3D szerkezettel rendelkező fehérjék száma (http://www.rcsb.org/pdb) 20000 Ismert 3D szerkezetek száma 10000 az évben megismert az addig megismert 0 1970 1980 1990 2000 Év 2010
NiceProt View of SWISS-PROT: P16070 Entry name CD44 HUMAN Primary accession number P16070 Entered in SWISS-PROT in Release 14, April 1990 Sequence was last modified in Release 35, November 1997 Annotations were last modified in Release 41, March 2002 Protein name CD44 antigen [Precursor] Synonyms Phagocytic glycoprotein I PGP-1 HUTCH-I Extracellular matrix receptor-iii ECMR-III GP90 lymphocyte homing/adhesion receptor Hermes antigen Hyaluronate receptor Heparan sulfate proteoglycan Epican CDw44 Gene name CD44 or LHR From Homo sapiens (Human) [TaxID: 9606] Taxonomy Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. References [1] SEQUENCE FROM NUCLEIC ACID (VARIOUS ISOFORMS). TISSUE=Lymphoblast; MEDLINE=93101687; PubMed=1465456; [NCBI, ExPASy, EBI, Israel, Japan] Screaton G.R., Bell M.V., Jackson D.G., Cornelis F.B., Gerth U., Bell J.I.; "Genomic structure of DNA encoding the lymphocyte homing receptor CD44 reveals at least 12 alternatively spliced exons." Proc. Natl. Acad. Sci. U.S.A. 89:12160-12164 (1992)
Apolipoprotein D: identification of fistula in perilymph Perilympha liquid Cerebrospinal liqued Human serum (clinical) Human serum (Sigma) Sun JP 1998
Apolipoprotein D: identification of fistula in perilymph - Neuraminidase + Neuraminidase
2D gelelectrophoresis map of proteins of fibroblast lysate from healthy (A) and from Down-diseased patient (B) A B
A proteomika alkalmazásai Sejt térkép Expressziós térkép Jelátvitel Proteom analízis Szerkezetmódisítás analízise Expressziós mechanizmus Gyógyszerek toxicitása Új gyógyszerek célbajuttatása Gyógyszerek mechanizmusai Proteomika (2DE, MS) Betegségek biomarkerei Az öregedés és metabolikus betegségek faktorai Ideg- és immunrendszer betegségeinek ellenőrzése Protein chip Különbségek kimutatása Nagy értékű termékek Ételek Búza, haszonállatok fehérje analízise stb. Mikrobiológia számára hasznos fehérjék felfedezése Strukturális genomika Bioinformatika
Összefoglalás Genom Proteom "Cell mapping" Genomika Proteomika Funkcionális genomika Tér és idő Interakciók