Molekuláris evolúció második gyakorlat Szekvenciák illesztése (alignment készítés) Szekvenciák szerkesztése Programok: ClustalX (http://evolution.genetics.washington.edu/phylip/software.html) GeneDoc (http://www.psc.edu/biomed/genedoc/) DAMBE (http://evolution.genetics.washington.edu/phylip/software.html)
Szekvenciák illesztése (alignment készítés) az alignmentek elkészítésénél két különbözı programmal ismerkedünk meg: igen gyakran használt ClustalX DAMBE (kevésbé elterjedt, hasznos program) Elsıként nézzük a ClustalX programot: szükséges file-ok és programok: ClustalX program szekvenciák meghatározott sorrendben, megfelelı formátumban (.txt szöveges formátumban jegyzettömb) az elmúlt elıadáson már megismert módon keressük ki a szükséges szekvenciákat a hivatkozási számokat tartalmazó file segítségével (jelen esetben a Acc_HIV.txt)
változtassuk meg a Display menüpont alatt a Summary formátumot FASTA formátummá
az összes FASTA formátumú szekvenciát helyezzük át Text formátumba Send to Text
eredmény: az összes szekvenciát kijelöljük, (Szerkesztés Az összes kijelölése) majd a Ctrl+c billentyőkkel másoljuk
az így kimásolt szekvenciát a Jegyzettömbbe,.txt szöveges fileba másoljuk a Ctrl+v billentyők segítségével
az alignment elkészítéséhez nélkülözhetı információkat kitöröljük ami marad: >hivatkozási szám (pl.: >AY077388) > nagyon fontos, mivel a ClustalX program ennek a jelnek a segítségével ismeri fel a szekvenciát!!!
tehát, elértünk az alignment elkészítéséhez szükséges végleges file-hoz ez a file (Seq_HIV.txt) tartalmazza az összes használni kívánt szekvenciát a megfelelı formátumban Mentés! Kezdıdhet a szekvenciák illesztése, az alignment elkészítése!
ClustalX program használata indítsuk el a ClustalX programot (.exe) az itt látható ablak fog megjelenni a képernyın
nyissuk meg az elızıekben elkészített szöveges file-t (Seq_HIV.txt) válasszuk a Load sequences opciót a File menüpontból
válasszuk a Do complete alignment opciót az Alignment menüpontból a program automatikusan betölti a szekvenciákat, még rendezetlen, nem illesztett formában
a program, a szekvencia hosszától függıen néhány mp.-ig mőködik, majd automatikusan megjelenik az elkészült alignment a program automatikusan felajánlja az elkészült file mentési útvonalát ( Output Alignment Files ) fogadjuk el
mivel az elkészült alignmentet más programokon fogjuk szerkeszteni, (pl.: törölni belıle) ezért a File menüpontból válasszuk a Save sequences as opciót a megjelenı ablakból a Format kategóriák közül a GCG/MSF-et jelöljük ki a Save sequences as pontban automatikusan megjelenik ismét a mentési útvonal - ne változtassuk, de jegyezzük meg! (Seq_HIV.msf)
GeneDoc program használata indítsuk el a GeneDoc programot (.exe) az itt látható ablak fog megjelenni a képernyın importáljuk a ClustalX programmal elkészített illetve elmentett file-t (Seq_HIV.msf) File Import
a megjelenı Import Type ablakból válasszuk a GSG (MSF) lehetıséget, majd nyomjunk az Import opcióra a szekvencia alignment megjelenése után a Done gombbal fejezzük be a munkát a következı ablakban nyissuk meg a ClustalX által elkészített és elmentett file-t (Ezért fontos megjegyezni a ClustalX által felajánlott mentési utat!! Lásd: 13. dia) Seq_HIV.msf
a Project menüpontból válasszuk ki a Select Columns opciót ekkor egy kis pipa jelenik meg az opció elıtt ha mindent jól csináltunk ezt kell látnunk a képernyın mivel a letöltött szekvenciák nem voltak azonos hosszúságúak a következıkben törölni kell a felesleges szakaszokat az alignment elejérıl illetve végérıl
az Edit menüpontból válasszuk ki a Delete All Data opciót ekkor ismét egy kis pipa jelenik meg az opció elıtt ezzel a kijelölt szekvenciát töröljük az egér bal gombjával kattintsunk az alignment elsı pozíciójára ezzel kijelöljük az elsı oszlopot (elsı pozíciót) ugyanezt tegyük meg a kivágandó szakasz végén is ekkor a teljes kivágandó szakasz feketén fog jelölıdni
most, a már megismert módon végezzük el ugyanezt a végén is, így szépen szerkesztetté válik az alignmentünk az alignment eleje rendben
File Save As. a megjelenı ablakban lehet különbözı információkat adnia a file-hoz, de erre most nincs szükségünk Cancel File elnevezése illetve felülírása Mentés a megszerkesztett file mentése (fontos megjegyezni hova mentettük az elkészült.msf file-t!!!)
DAMBE program használata az elmúlt elıadáson már megismert módon keressük ki a szükséges szekvenciákat a hivatkozási számokat tartalmazó file segítségével (jelen esetben a Acc_Astro.txt)
az összes GenBank formátumú adatot (tartalmazza a szekvencia fontos adatait is) mentsük el Send to File változtassuk meg a Display menüpont alatt a Summary formátumot GenBank formátummá
fontos megjegyezni hova mentettük a GenBank file-t!!!) (Seq_Astro) mentés. (nem megnyitás!)
indítsuk el a DAMBE programot (.exe) az itt látható ablak fog megjelenni a képernyın
válasszuk az Open a sequence file opciót a File menüpontból nyissuk meg az elızıekben elmentett file-t, úgy, hogy a file típusánál az Unknown kategóriát válasszuk (Seq_Astro) válasszuk a CDS (Coding Sequence) lehetıséget, majd nyomjunk az OK gombra
ismételjük meg ugyanezt a mőveletsort a következı két szekvenciánál is (AF260508 - ORF2, ATVPOLY6A S) végezetül nyomjuk meg a Done gombot kattintsunk az elsı hivatkozási számra a Locus name oszlopban válasszuk a capsid precursor protein -t a This locus contains oszlopban nyomjuk meg a Splice gombot
ha mindent jól végeztünk, ezt kell látnunk válasszuk a Protein-coding Nuc. Seq. lehetıséget Go!
a program, a szekvencia hosszától függıen néhány mp.-ig mőködik, majd automatikusan megjelenik az elkészült alignment a következıkben válasszuk a Sequences menüpontból az Align Sequences Using Clustalw opciót Go!
válasszuk a Save or Convert Sequence Format opciót a File menüpontból ha mindent jól végeztünk, ezt kell látnunk
ha mindent jól végeztünk, ezt kell látnunk mentsük el a file-t a program automatikusan FASTA formátumba fog menteni (Seq_Astro.FAS)
ismét szerkesszük alignmentünket a GeneDoc program segítségével indítsuk el a GeneDoc programot (.exe) újra a már megismert módon importáljuk a DAMBE programmal elkészített illetve elmentett file-t (Seq_Astro.FAS) File Import (figyeljünk arra, hogy az Import Type itt FASTA legyen!!!)
a megszerkesztett file mentése (fontos megjegyezni hova mentettük az elkészült.msf file-t!!!) (Seq_Astro.msf) a már megismert módon (16. dia 19. dia) szerkesszük meg az illesztés végleges formáját