Expressziós microarray Dr. Győrffy Balázs
Áttekintő 1. A technológia 2. Feldolgozás 2.1. Minőség-ellenőrzés 2.2. Jellemző kiválasztás 2.3. Vizualizálás 2.4. Kereszt-elemzés 2.5. Online diagnosztika 3. Hátrányok és erősségek 4. Összefoglalás
1. Microarray Egydimenziós kezdet: 1 gén mérésének sokszorozása Multidimenziós jelen Útvonalak Szabályozás Diagnózis
Technológia Chipek: mrns mirns Fehérje SNP Exon Szekvenálás
Affymetrix GeneChip Legelterjedtebb technológia Sűrűség: Expressziós chip 1,300,000 DNS oligo 1 x 1 cm SNP chip 7,000,000 DNS oligo 1.3 x 1.3 cm
Gyártás: fotolitográfia Lámpa Maszk Chip
Probe set Egy gén több probe set Egy probe set több próba Próbák: tökéletes egyezés és egy nukleotid eltérés
A folyamat mrns reverz transzkripció cdns in vitro transzkripció crns crns összetörése hibridizálás leolvasás
2. Kiértékelés Alapadatok (Affymetrix CEL file-k) Minőségellenőrzés Háttérkorrekció Normalizálás Jellemző kiválasztás MAS5.0 RMA VSN Sam PAM Rank Products Annotáció Vizualizálás
2.1. Minőségellenőrzés RNS lebomlás Sikeres mérések aránya
www.celmetrix.com
2.2. Jellemző kiválasztás R statisztikai környezet www.r-project.org parancssoros kezelés Nyílt forráskód, ingyenes Bioconductor www.bioconductor.org célkönyvtárak
Jellemző kiválasztás SAM Significance Analysis of Mircoarrays Cél: minden szignifikáns gén azonosítása PAM Prediction Analysis of Microarrays Cél: minimális génlista Előrejelzés a mintázattal Rank products Kevés minta esetén gének rangsorolása
SAM
PAM Centroid plot Tanulási hiba erózió, MAS5 normalizálás erózió, RMA normalizálás, küszöb: 2.5
2.3. További kiértékelés Mintagyűjtés, normál / kontroll chipre hibridizálás Bioinformatika Komplex kiértékelés: 1. Venn diagram 2. Cluster-elemzés 3. Transzkripció-reguláció 4. Kaplan-Meier elemzés 5. Kereszt-elemzés
2.3.1. Venn diagram Gén Teljes név Csoportok CXCL13 chemokine ligand 13 chemotaxis CCL19 chemokine ligand 19 chemotaxis H.Pylori asszociált gének: MAS5: 78 15 RMA: 8 PTPRC protein tyrosine phosphatase, receptor type, C cell surface receptor linked signal transduction IL7R interleukin 7 receptor antimicrobial humoral response UBD ubiquitin D antimicrobial humoral response HLA- DMA CCR7 MHC, class II, DM alpha chemokine (C-C motif) receptor antigen presentation, exogenous antigen antimicrobial humoral response LTF lactotransferrin defense response to bacteria HLA- DQA1 KLRB1 LRAP MHC, class II, DQ alpha 1 killer cell lectin-like receptor leukocyte-derived arginine aminopeptidase antigen presentation, exogenous antigen antimicrobial humoral response proteolysis and peptidolysis
2.3.2. Klaszter elemzés Eisen et al. 1998 A legközelebbi gének egy közös ágba szereződnek, majd az átlaguk egy új pontként kerül definiálásra. Két cluster közötti távolság: átlagos kapcsoltság = átlagos távolság egyszeres kapcsoltság = legkisebb távolság teljes kapcsoltság = legnagyobb távolság
Cluster elemzés: dendrogram RMA normalizálás PAM küszöb: 2,5 Hierarchikus cluster Átlagos kapcsoltság Euclideszi távolság Ismétlődő gének
K-means clustering génaktivitás K-means idő Hasonlóan regulált gének egy csoportba!
2.3.2. Transzkripció DNS upstream promoter TSS RNS polimeráz G É N downstream 5 3 3 intron exon intron mrns Fehérje TSS: transzkripció kezdőpont
Transzkripció áttekintése DNS TF TF 5 TFBS TFBS TFBS TFBS TSS 3 intron exon intron RNS polimeráz mrns 3 Fehérje TF: transzkripciós faktor TFBS: transzkripciós faktor kötőhely 1 gén több TFBS 1 TF több gén Hossz: 4-10 bázis, nonspecificity, mátrix
Transzkripció-regulációs hálózatok Génlista DNS chipek alapján Promoterek azonositása Kötőhelyek azonosítása Felül-reprezentált kötőhelyek Multiple testing korrekció REGULÁCIÓS HÁLÓZAT FELÁLLITÁSA
Példa eredmények TFBS pozíciók Szignifikáns TF-ek TF n p Bonferroni E47 9 0.001 Yes EGR3 4 0.02 No NFY 1 0.03 No HEN1 4 0.03 No ISRE 9 0.05 No TF lista
2.4. Kereszt-elemzés Sok adat! Adatok kombinálása? - Platformok - Különböző bioinformatika - Klinikai adatok Nyers adatok teljes feldolgozása
Adatok: GEO Kereszt-elemzés www.ncbi.nlm.nih.gov/geo
Kereszt-elemzés Nyers adat n=3800 GEO Klinikai adat KMPL SEER adatok lekérdezés www.kmplot.com Génexpresszió filterezése és R input Minőség-ellenőrzés és MAS5 normalizálás Platformok kombinálása mysql adatbázis Valós idejű plottolás R-ben Grafikus visszajelzés (KM-görbe) és szignifikancia
www.kmplot.com Emlőtumor (2500 beteg) Petefészek-tumor (1300 beteg)
Túlélési elemzés Proliferáció / kemorezisztencia markerek: TK2 TOP2A Cyclin D1
2.5. online diagnosztika www.recurrenceonline.com Microarray (.CEL fájl) Array minőségkontroll Recurrence Score (kemoterápia) ER státusz (hormonterápia) HER2 státusz (célzott terápia)
3. Hátrányok Drága: Exon-szintű mérés Optimális esetben háromszoros ismétlés Sok platform Bonyolult bioinformatika
Előnyök Génexpresszió szubjektív mérése Technológia elterjedt és automatizált Jól reprodukálható MAQC I. és II., Nature Algoritmusok letisztultak (vs. szekvenálás) FDA jóváhagyta (2011 -> biormarkerek!) Sok adat kereszt-elemzéshez
4. Összefoglalás Expressziós microarray Feldolgozás: 1. Minőségellenőrzés 2. Jellemző kiválasztás 3. Génlisták feldolgozása 4. Keresztelemzés Előnyök és hátrányok Hasznos források: www.r-project.org www.bioconductor.org www.ncbi.nlm.nih.gov/geo www.celmetrix.com www.kmplot.com