Gén térképezés, génizolálás Dr. Karsai Ildikó, tudományos tanácsadó karsai.ildiko@agrar.mta.hu Karsai Ildikó
Gén azonosítás tulajdonságok fenotípusos megnyilvánulásában meghatározó szerepet játszó genetikai komponensek, szabályozó mechanizmusok, biokémiai folyamatok megértése diagnosztikai markerek, módszerek kidolgozása természetes variabilitás tesztelése vad és termesztett fajtákon belül, valamint a rokon fajok csoportjában hasznos gének, gén allélek beépítése a nemesítési alapanyagokba marker szelekcióval egybekötött hagyományos keresztezések során gén transzformációs technikák alkalmazásával
Gén azonosítás főbb módszerei marker kapcsoltsági térképek és pozicionális klónozás Két szülős térképező populációk Széles genetikai bázist képviselő fajtakör jelölt gén megközelítés Genom pozíció függő stratégiák Összehasonlító genomikai stratégiák mesterséges genetikai variáció (indukált mutációs populációk) génfunkció és fenotípus közti kapcsolat Gén expressziós mintázatok elemzése
Gén térképezés főbb módszerei Két szülős térképező populációk marker kapcsoltsági térképek, QTL elemzés Széles genetikai bázist képviselő fajtakör LD térképezés, teljes genomot lefedő asszociációs elemzések
Két szülős populációk marker kapcsoltsági térképei Térképező populáció Molekuláris marker technikák Számítógépes térképező programok
Térképező populáció Keresztezési partnerek kiválasztása: távoli vagy speciális Populáció típusa: hasadó F2 populáció homozigóta populációk (DH, RIL, SSD) egyéb speciális populációk (NIL, egy kromoszómára rekombináns stb.) Populáció mérete Marker kapcsoltsági térképek DNS izolálás markeres vizsgálatok Genom szintű különbségek
Marker kapcsoltsági térképek Molekuláris marker technikák RFLP PCR alapú markerek ismeretlen kromoszómális elhelyezkedésű: RAPD, AFLP ismert kromoszómális elhelyezkedésű: SSR, STS funkcionális markerek: EST, SNP, Tillling HTP marker technikák (Illumina platform, DArT) Új generációs szekvenálás
Marker kapcsoltsági térképek Számítógépes térképező programok marker térkép készítés (MAPMAKER, GMENDEL, JOINMAP, GenStat) QTL elemző programok (MAPMAKER, WINQTL, JOINMAP, GenStat) Egyszerű intervallum térképezés (SIM) Összetett intervallum térképezés (CIM) Egy tulajdonság + egy környezet több tulajdonság + több környezet Tulajdonság komponens kölcsönhatás elemzés, QTL x környezet kölcsönhatás elemzés Fenotípusos vizsgálatok ismételhetőség, pontosság Fenomika
Marker kapcsoltsági térképek alkalmazási területei Genomot teljesen lefedő molekuláris marker térkép készítése Összehasonlító térképezés rokon fajok között, fajon belül különböző populációk között Genom szerveződés makro és mikro kolinearitás kromoszóma átrendeződések intergénikus és génklaszter szakaszok azonosítása
Marker kapcsoltsági térképek alkalmazási területei Gének azonosítása, fenotípusos hatásuk vizsgálata finom térképezés, pozicionális klónozás modell növény ismert génszekvenciája alapján Egyszerű és összetett tulajdonságok genetikai elemzése lókuszok számának és helyének azonosítása Adott lókusz szerepének elemzése; QTL dinamika, tulajdonság komponensek vizsgálata Allél gyakoriságok vizsgálata szélesebb genetikai bázison Marker szelekció
DNS markerek, mint ujjlenyomatok Markerek (M1 ) M1 M2 M3 N1 N2 N5 N10 N15 A szülő B szülő A x B keresztezés utódpopulációjának növényegyedei (N1 )
QTL elemzés marker kapcsoltsági térkép alkalmazásával Hasadó populáció Genotípusos jellemzés Fenotípusos jellemzés szülők AAABBAB ABBABABB BBBAA A B Adat mátrix *mst1011 ABAAABBBABBBABBBBBABBABBA *mst1012 ABBAABAABBAABBBBBBABBBBBB *mst102 AAABBBAABBABBBABBBBABBABB *wg4642 ABBAABAABBAABBBBBBABBBABB *bcd1752 ABBAAABBBA---ABBABBBABABAA *wg541 AA-BBBA---ABBABBABBABABAABA *v8h49 164.5 157.5 149.5 146.5 154 171 250 *uv16h49 43 128.5 138 159 163.5 143.5 49 51 38 *v16h49 40 57.5 60.5 60.5 69.5 38 44 63 38 62.5 *uv24h49 27 97.5 111.5 123.5 125 103.5 29.5 31.5
QTL elemzés marker kapcsoltsági térkép alkalmazásával Marker kapcsoltsági térkép elkészítése 8> make chrom osom e chrom 2h chrom 4h chrom5h chromosomes 1 6 > adefined: s schrom2h i g n chrom framework: 2h chrom4h chrom5h H v M 3 6 1 8 > - t a h n r c e h e o p r o l i o n c t u s o n c h r o m 2 h... c a n n o t r e - a s s i g n B m a g 1 2 5 - a n c h o r l o c u s o n c h r o m 2 h... c a n n o t r e - a s s i g n 9> seq hvm 36 bm ag125 B m a c 3 0 - Placing a n c h o r at l olog-likelihood c u s o n c h r o mthreshold 4 h... c a n3.00... n o t r e - a s s i g n sequence #1= hvm36 Markers H v M 6 7 bmag125 ' t r i p- l Start: ae nec rhr o r 9 l do 5 ce u1 t es 11 Distance c ot in 12 o n c ' h ri s o mo n 4. h... c a n n o t r e - a s s i g n Npt-2: 9 5 1 (10) 11 12 B m a g 3 3 7 7 - No a nabg358 unique c h o r placements l o c u s o20.6 n cfor h rcm o6 mremaining 5 h... c a nmarkers n o t r e - a s s i g n 10> anchor A Bchrom G 7 0 22h - a n c h o r l o c u s o n c h r o m 5 h... c a n n o t r e - a s s i g n HvM 36 A- Banchor G 8 locus - 5 Map: a s sopb162 on i g nchrom e d t o 2h c h r o m2.4 2 h cm a t L O D 2 0. 1 Markers Distance Bmag125 A - Banchor C 3 1 1 locus 4 - a shvm36 s9 on i g Bmc222a nchrom2h e d t o c h r o3.1 21.5 m 2cM h a t L O D 2 4. 4 chromosome O P Hchrom 1 2 1 2h - aanchor(s): s s5 i g nopb162 e d t o HvM c h r 36 o m8.2 Bm 2 h ag125 a t L O D 2 8. 6 O P B 1 6 2-3 a soph121 1 ABG8 s i g n e d t o c h r o0.0 10.6 m 2cM h a t L O D 2 3. 8 10 OPP102b 6.3 cm A B G 3 1 8 2 - a sabc311 s i gopa192 n e d t o c h r o2.1 10.6 m 2cM h a t L O D 2 2. 9 A B G 3 5 8 - a s12 s i gopq10 n e d t o c h ---------- r o m 2 h a t L O D 1 3. 8 A B G 4 5 9 - a s s i g n e d t o c h r o m 2 h a t L O D 2 4. 4 L i n k a g e G r o u p s a t m i n L O D 3. 0 0, m a x D i s t a n c e 3 7. 2 T r i p l e t c r i t e r i a : L O D 3. 0 0, M a x - D i s t 3 7. 2, # L i n k a g e s 2 c o u n t i n g... 2 4 6 l i n k e d t r i p l e t s i n 2 l i n k a g e g r o u p s l o g - l i k e l i h o o d d i f f e r e n c e s c o u n t m a r k e r s a - b - c b - a - c a - c - b 1 : A B G 8 A B C 3 1 1 O P H 1 2 1 0. 0 0-0. 2 0 0. 0 0 2 : A B G 8 A B C 3 1 1 H v M 3 6 0. 0 0-0. 2 0-0. 6 1 3 : A B G 8 A B C 3 1 1 O P B 1 6 2 0. 0 0-0. 1 9-1. 9 2 4 : A B G 8 A B C 3 1 1 A B G 3 1 8 0. 0 0-0. 1 8-2. 9 5 5 : A B G 8 A B C 3 1 1 A B G 3 5 8 0. 0 0-0. 0 9-1 9. 2 1 6 : A B G 8 A B C 3 1 1 A B G 4 5 9 0. 0 0-0. 0 8-1 9. 7 7 7 : A B G 8 A B C 3 1 1 57.1 B m c 2 2 26 a markers 0 log-likelihood=. 0 0-0. 0 9-1 8-98.26 1 ABG8 10.6 cm. 7 8 8 : A B G 8 A B C 3 1 1 O P P 1 0 2 b 0. 0 0 0. 0 0-5. 4 4 Markers placed relative to above map: 910 : AOPP102b B G 8 A9 B C5 3 1 16.3 1 O PcM 10 A 1 911 2 12-0. 1 6 0. 0 0-6. 4 1 1 0 : A B G 8 :-21-:--8-:-11-:--6-:-11-: A B C 3 1 1 O P Q 1 0-0. 1 1 0. 0 0-1 6. 9 8 11 OPA192 8 2.*.:.**.:...:...:...:...:... 10.6 cm 7 2.*.:.**.:...:...:...:...:... 12 OPQ10 6 2...:.**.:..*.:...:...:...:... ---------- 4 2...:..*.:.**.:...:...:...:... 3 2...:...:.**.:..*.:...:...:... 55.6 cm 9 markers 2 2...:...:.**.:..*.:...:...:... ------------------------------------------------------------------ Placing at log-likelihood threshold 2.00... Start: 9 5 1 10 11 12 log-likelihood= -101.39 Npt-4: 9 5 (2) 1 10 11 12 Npt-4: 9 5 (4) 2 1 10 11 12 Npt-4: 9 5 4 (3) 2 1 10 11 12
DK1DK2DK3DK4DK7DK8DK9 DK10 DK11 DK12 DK13 DK14 DK15 DK16 DK17 DK18 DK19 DK20 DK21 DK22 DK24 DK25 DK26 DK27 DK28 DK29 DK30 DK31 DK32 DK35 DK36 DK37 DK38 DK39 *mst102 A B A A A B B B A A B B A B B B A B B B A B B A B B A A B A A B A B *Bmac144d A B A A A B B B A B B A B B B B B B B B A B B A B B A A B A A B A B TCGA96 A B A A A B B B A B B A B B B A B B B B A B B A B B A A B A A B A B *MWG938 A B A A B B B B A B B A B B B A B B B B A B B A B B A A B A A B A B AGAT166/162 A B A A B B B B A B B A B B B A B B B B A B B A B B A A B A A B A B GCTC58 A B A A B B B B A B B A B B B A B A B B A B B A B B A A B A B B B B OPK16 A B A A B B B B A B B A B B B A B A B B A B B A B B A A B A B B B B *abc156.1 A B A A B B B B A B B A B B B A B A B B A B B A B B A A B A B B B B *BMAC213 A B A A B B B B A B B A B B B A B A B B A B B A B B A A B A B B B B GAAT76 A B A A B B B B A B B A B B B A B A B B A B B A B B A A B A B A B B *OPE171 A B A A B B B B A B B - B B B A B A B B A B B A B B B A B A B A B B GAAT414 A B A B B B B B A B B A B B B A B A B B A B B A B B B A B A B A B A *OPO18 A B A B B B B B A B B A B B B A B A B B A B B A B B B A B A B A B A *OPB16-1 A B A B B B B B A A B A B B B A B A A A A B B A B B B A B A B A B A *Bmag211 A B A B B B B B B A B A B B B A B A A A A B B A B B B A B A B A B A *OPS16 A B A B B B B B B A B A B B B A B A A A A B B A B B A A B A B A B A GCGA428 A B A B B B B B B A B A B B B A B A A A A B B A B B A A B A B A B A *Ebmac560a A B A B B B B B B A B A B B B A B A A A A B B A B B A A B A B A B A *OPB41 A B A B B B B B B A B A B B B A B A A A A B B A B B A A B A B A B A GAAT550 A B A B B B B B B A B A B B B A B A A A A B B A B B A A B A B A B A AGGT290 A B A B B B B B B A B A B B B B B A A A A B B A B B A A B A B A B A TCGA119 A B A B B B B B B A B A B B B B B A A A A B B A B B A A B A B A B A *OPT152 A B A B B B B B B A B A B B B B B A A A A B B A B B A A B A B A B A GAAT510 A B A B B B B B B A B A B B B B B A A B A B A A A A A B A A B B A A AGAT51 A B A B A A A B B A B A B B B B B B A B B B A A A A A B A A A B A B *Bmac144a A B A B A A A A B A B A B B B B B B A B B B A A A A A B A A A B A B GCGA269/270 A B A B A A A A B A B A B B B B B B A B B B A A A A A B A A A B A B *ABC152b A B A B A A A A B A B A B B B B B B A B B B A A A A A B A A A B A B *HvHVA1 A B B B A A A A B A B A B B B B B B A B B B B A A A A B A A A B B B *BCD265c A B B B A A A A B A B A B B B B B B A B B B B A A A A B A A A B B B GCGT132 A B B B A A A A B A B A B B B B B B B B B B B A A A A B A A A B B B *OPP142 A B B B A A A A B A B A B B B B B B B B B B B A A A A B A A A B B A
mst102 0 Bmac144d 4 TCGA96 6 MWG938 8 AGAT166 11 GCTC58 15 OPK16 17 abc156.1 18 Bmac213 22 GAAT76 24 OPE171 28 GAAT414 30 OPO18 31 OPB161 41 Bmag211 48 OPS16 50 GCGA428 53 Ebmac560a 54 OPB041 56 GAAT550 57 AGGT290 58 TCGA119 59 OPT152 61 GAAT510 86 AGAT51 99 Bmac144a 100 GCGA269 104 ABC152b 109 HvHVA1 125 BCD265c 126 GCGT132 130 OPP142 136 OPX031 163 1H Bmac222a 0 ABG459 1 ABG318 18 HvM36 25 ABC311 28 GAGT494 29 ABG8 31 GCGA52 37 GAGA72 39 TCTC212 40 GAAT338 41 OPA192 42 AGAT347 51 AGAT248 56 GAGA573 57 GAGT62 58 GCGT250 88 abg459a 101 Bmac216 102 Bmac144b 108 bcd175b 109 Bmag125 110 GAGT670 113 TCGT280 115 TCAT572 116 TCTC631 126 Bmag003c 127 GCAT142 128 OPG07 142 2H OPD07 0 OPS141 6 OPO072 11 GATC355 14 GCGA288 16 TCAT132 17 GAGA642 19 TCTC626 22 AGTC201 50 GAAT308 55 GCAT191 59 OPI041 60 AGAT498 72 OPS202 73 Bmag384b 75 TCTC548 76 GCGT270 87 OPK111 92 HvM60 99 AGAT175 102 AGAT598 103 GAAT182 104 AGGT472 106 GCGT164 108 OPH15 132 ABG4 152 TCAT477 155 Bmag13 159 GCAT104 172 TCTC216 175 OPS192 179 Hvm62 186 GAGA650 189 OPH122 194 Hvm70 195 GCGT68 197 TCAT228 204 GCAT227 205 GCGA205 209 TCGA205 210 ABC174 211 AGTC335 212 GAAT147 220 3H HvPhyA 0 GCAT76 8 TCAT300 TCAT77 9 AGAT142 16 HvPhyB 21 CAB 22 Bmac30 24 AGAT312 29 Bmag353 32 Bmag173a 33 Bmac310 39 OPJ15 40 TCAT452 41 OPU162 42 AGAT46 59 ABG366 62 abg54 64 AGAT148 65 GCGT161 72 GCAT312 79 AGAT406 84 HvM67 85 OPS031 86 VRN-H2 HvSnf2 92 AGGT650 93 Hdamyb 100 4H OPT151 0 GCAT50 7 Bmag136b 8 GAGA556 9 Bmag337 13 GATC565 18 AGTC122 21 AGGA575 24 GAGA220 27 AGAT42 32 GAGA58 33 Bmag113 35 abc156.5 37 AGAT676 38 TCTC502 40 Bmag223 mr 41 GATC106 47 abg459b 51 OPH123 54 GCGT406 58 GCGA434 71 TCAT332 88 abc306d 90 OPK112 92 TCTC510 95 ABG702 96 AGTC50 101 Bmag381b 112 gms061 114 HvPhyC VRN-H1 117 abc155 137 TCGT372 142 GCAT406 156 ABC310 161 5H BMAC316 0 AGGT256 2 TCTC386 9 AGAT658 13 ABC152c 23 Bmag500 26 Bmag21a 51 GAGA626 62 GCGT262 64 Bmag219 65 OPH081 68 Bmag009 69 HvCry1a HvCry2 GCGA48 71 AGGA62 72 OPI042 75 OPA203 78 abc306b 80 abc306c 81 abc303 84 AGGT336 87 Bmag003b 89 ebmac806 90 TCTC576 93 OPT14 95 GCTC258 97 GAGA170 99 AGGT484 102 TCAT216 107 GCAT212 108 AGAT298 111 wg464a GAGA622 136 GAGA596 143 TCTC528 149 TCAT232 150 GCGT382 151 6H Hvm4 0 Bmac222b 9 GCAT188 11 TCAT516 12 TCTC250 13 abg460 14 TCTC623 15 abc152a 16 GCGT69 25 AGTC400 28 TCAT123 30 Bmag21c 32 GCAT299 33 Ebmac603 36 TCGT144 42 TCGA273 48 VRN-H3 50 KSuA1a 52 abc306a 59 TCGT153 60 TCGT64 62 AGGT64 65 OPE172 73 Bmac187 75 TCGT143 78 Bmag120 81 OPR152 86 OPS032 87 mst101b 88 Bmag369 90 AGAT87 107 AGAT223 118 GCGT206 123 OPQ17 127 TCTC71 143 OPB031 145 AGGT86 147 GCTC158 157 GAAT418 172 7H B1 B3 B7 B9 B10 B12 B13 B5 B3 B3 B7 B7 B8 B15 B14 B16 B18 B19 B4 B5 B6 B10 B12 B14 B4 B5 B7 B11 B13 B18 B1 B3 B4 B8 B10 B12 B3 B6 B5 B9 B12 B10 Dicktoo Kompolti korai marker térkép (246 lókusz)
Egyedi térképek fajra jellemző konszenzus térkép Stein et al. TAG(2007)114:823
P92201D5-2/P91193D1-10 Ajana/WAWHT2074 Cadoux/Reeves EGA Blanco/Millewa 0.3 0.7 16.4 2.9 10.5 8.0 34.6 0.7 14.1 22.4 0.5 2.2 4.1 3.8 0.2 1.4 1.2 0.5 0.3 0.2 0.3 2.6 3.3 7.6 7.3 4.0 2.0 3.1 2.1 1.3 12.1 1.9 10.4 5.4 11.2 15.0 wpt-5195* wpt-0643 wpt-6575 wpt-5587 wpt-3459 wpt-5934 wpt-6627* wpt-4916* wpt-0100* wpt-8235* gwm614b* wpt-8404* wpt-1041* wmc25* gwm319* wpt-3569* wpt-1650* wpt-1068* wpt-7937* wpt-0775* wpt-8294* wpt-0395* wpt-1494* wpt-2249* wpt-2907* wpt-0434* wpt-9131* barc183* wpt-0615* wpt-1127* wpt-5440* wpt-6144* wpt-0079* gwm630* wpt-9350* cfd56* AF112966* wpt-7625* gwm47* wmc477* gwm120* wpt-3109* wpt-9336* wpt-7350* wpt-4701 wpt-2266* gwm526c* barc1147* barc92 Marker kapcsoltsági térkép kromoszóma fizikai térképe 14.6 19.6 9.6 4.3 2.9 6.2 5.6 0.6 8.9 0.7 0.6 0.7 0.6 0.6 21.1 26.6 12.2 2.5 7.7 12.0 10.1 0.6 0.6 4.6 0.6 6.1 8.2 11.0 7.5 7.2 2.3 1.2 7.6 22.0 28.3 20.9 gwm614 wpt-1663 wpt-5567 wpt-4527 cfd238 wmc25a barc318 wpt-9423 wpt-9402 wpt-1489 wpt-8072 wpt-4301 wpt-0462 wpt-3561 wpt-6932 wpt-3983 wpt-5707 wpt-2314 wpt-6199 wpt-8583 wpt-6477 wpt-4125 wpt-9644 wpt-7757 wpt-0408 wpt-0615 wpt-5672 wpt-8492 barc183b* gwm46 barc7 barc55 wmc474 cfa2278 wpt-0335 wpt-0709 wpt-7750 gwm374 gwm319 gwm630b gwm271 gdm14a gwm120a gwm191a* wpt-1140* wpt-7200 wpt-3132 wpt-0950 wpt-7404 wpt-5128* gwm120b wpt-4199 gdm61* 9.2 10.8 5.0 2.2 8.1 7.6 0.7 0.7 2.9 37.8 1.4 wpt-4527 cfd238 wpt-8004 wpt-8326 wpt-9423 wpt-9402 wpt-1489 wpt-8072 wpt-5707 wpt-3983 wpt-4997 gwm429 barc13 wpt-6477 wpt-0615 wpt-7750 wpt-2430* wpt-8569* 0.9 3.2 1.0 0.4 0.5 3.8 3.4 0.4 1.5 2.3 6.0 21.7 9.9 12.5 10.3 2.3 12.9 10.4 8.2 5.0 11.2 3.3 3.2 2.4 1.0 0.5 2.4 0.4 0.5 4.1 7.7 1.9 1.8 14.9 2.1 2.8 19.1 1.4 8.0 1.4 wpt-6575* wpt-5587* wpt-3459* wpt-5934* wpt-6970* wpt-6627* wpt-5195* wpt-0643* wpt-6805* wpt-0100* wpt-8760* wpt-2410* wpt-3565* gwm614* wpt-6223* barc35* barc297a* wpt-2106* wpt-8004* wpt-8326* wmc154 wpt-5374 wpt-3561 wpt-5707 wpt-7757 wpt-5672 wpt-5556 wpt-4125 barc55 wpt-6278 barc1114 cfa2043b gwm120 wpt-4199* wpt-2430 wpt-8569 wpt-0094 wpt-7200 wpt-3132 wpt-8460 wpt-5680 wpt-5242 wpt-0694 stm509acag wpt-4701 wpt-7004 wpt-4210 wpt-0047 barc1147 wpt-2135 wpt-3378 barc159 wpt-4559 wpt-6970 wpt-7123 wpt-9288 wpt-6311 wpt-8737 wpt-4916 wpt-9423 wpt-5587 wpt-5934 wpt-6575 wpt-9859 wpt-7995 wpt-9220 wpt-3459 wpt-3188 wpt-1549 wpt-1549 wpt-2249 wpt-2397 wpt-3807 wpt-5287 wpt-1650 wpt-8074 wpt-0408 wpt-0615 wpt-1489 wpt-1494 wpt-3188 wpt-3983 wpt-4701 wpt-4737 wpt-4997 wpt-5249 wpt-5556 wpt-5597 wpt-7348 wpt-7610 wpt-8072 wpt-8294 wpt-8460 wpt-8720 wpt-9402 wpt-6144 wpt-6053 wpt-6627 wpt-7408 wpt-7757 wpt-8070 wpt-5128 2BS-3 2BS-1 2BL-6 Chromosome 2B
QTL elemzés marker kapcsoltsági térkép alkalmazásával QTL azonosítás a teljes marker kapcsoltsági térképre kiterjedve markerek közötti intervallumok vizsgálata Valószínűségi becslések LOD= lg(qtl csúcs jelenlétének valószínűsége/annak a valószínűsége, hogy nincs QTL hatás) LOD küszöbérték: M genom méret M marker sűrűség M populáció méret
cm Weight R 2 LOD ------------------------------- OPJ15-ABG366 28.0 cm 0.0 35.24 17.7% 1.585 2.0 80 38.40 21.2% 1.758 4.0 41.51 2H25.0% 1.941 4H 5H 6.0 44.33 28.8% 2.126 * 70 8.0 46.56 32.0% 2.303 ** ============================================================= 10.0 48.44 34.9% 2.464 ** 12.060 49.63 36.7% 2.599 *** QTL-Map 14.0 for 50.31 peak 3: 37.8% 2.704 *** Confidence 16.050 50.48 Interval: 38.2% Left 2.776 Boundary= **** OPS31-Snf2 + 2.0 18.0 50.03 37.5% 2.815 **** 40 Right Boundary= Snf2-Hdamyb (off end) LOD values QTL elemzés marker kapcsoltsági térkép alkalmazásával 20.0 49.35 36.5% 2.822 **** 22.0 48.24 34.8% 2.800 **** 24.030 46.68 32.5% 2.754 **** INTERVAL 26.0 44.82 29.9% LENGTH 2.688 QTL-POS *** GENETICS WEIGHT 28.0 Snf2-Hdamyb 20 42.79 27.1% 2.609 *** 8.0 0.0 free 78.700 ------------------------------- ABG366-abg54 5.5 cm 0.0 42.79 27.1% 2.608 *** 10 2.0 45.76 30.5% 2.667 *** chi^2= 4.0 105.665 (1 D.F.) log-likelihood= 22.94 0 44.87 29.1% 2.372 ** mean= ------------------------------- 16.300 sigma^2= 102.058 variance-explained= abg54-opr195 7.993.8% cm 0.0 36.31 19.1% recombination 1.753 distance (cm) ============================================================= 2.0 37.80 20.9% 1.885 4.0 38.66 22.0% 1.992 HD16h uv HD16h vern HD24h uv HD24h vern
Kalászolási idő, mint vizsgált tulajdonság Populáció egyedei közti változékonyság DH vonalak száma 40 30 20 10 0 16h + hő ciklus X átl =77 nap Kompolti Dicktoo 20 30 40 50 60 70 80 90 100 110 120 130 140 150 Kalászolási idő
Dicktoo x Kompolti korai DH vonalak HvSnf2 ZCCTH 4H árpa kromoszóma 0 HvPhyA 8 GCAT76 9 TCAT300 TCAT77 16 AGAT142 21 HvPhyB 22 CAB 24 Bmac30 29 AGAT312 32 Bmag353 33 Bmag173a 39 Bmac310 40 OPJ15 41 TCAT452 42 OPU162 59 AGAT46 62 ABG366 64 abg54 65 AGAT148 72 GCGT161 79 GCAT312 84 AGAT406 85 HvM67 86 OPS031 92 93 100 VRN-H2 HvSnf2 AGGT650 Hdamyb QTL elemzés vernalizálatlan vernalizált kezelés
Két szülős populációk QTL térképezés Hagyományos két:szülős térképező populációk hátrányai: Előállításuk idő és munka igényes Szűkebb mértékű polimorfizmus Lókuszonként csak két allél hatásának vizsgálatára van mód A két szülő közti hasonlóság korlátozza az egyes gének azonosítási lehetőségeit QTL térképezés pontossága változó Adott populációban azonosított QTL csúcshoz szorosan kapcsolt marker nem polimorf a nemesítési anyagban Gén (allél) kölcsönhatások vizsgálata limitált Alacsony hatékonyság
Gén térképezés főbb módszerei Két szülős térképező populációk marker kapcsoltsági térképek, QTL elemzés Széles genetikai bázist képviselő fajtakör LD térképezés, teljes genomot lefedő asszociációs elemzések
Széles genetikai bázisú fajtakör asszociációs genetika Nincs szükség a genetikai populáció kifejlesztésére A tesztelt populáció képviselheti a vadfajok, tájfajták és vagy a nemesítés számára releváns fajták széles körét Diverz és nagyméretű populációk vizsgálata a gének detektálásának valószínűségét fokozza Adott gén természetes allél variációi, és azok fenotípusos hatása könnyebben azonosítható Történelmi rekombinációk hasznosítása (evolúció adott környezetben folytatott nemesítés) nagyobb felbontású géntérképezést tesz lehetővé Régebbi fenotípusos vizsgálatok eredményei is felhasználhatók
Asszociációs térképezés a növényekben Széles genetikai bázisú fajtakör kiválasztása Széles körű fenotípusos jellemzés (különböző környezet, többszöri ismétlés) Genotipizálás molekuláris markerekkel (pl AFLP, SSR, DArT, SNP) LD jellemzése a marker adatbázisra alapozva Marker tulajdonság asszociáció (megfelelő megközelítés alkalmazásával) Tulajdonsággal kapcsolt markerek azonosítása Populáció szerkezet meghatározása (struktúra és rokonsági fokok) Azonosított lókuszok klónozása, biológiai funkciójuk jellemzése
Asszociációs térképezés Valós marker tulajdonság asszociáció azonosításának esélye függ Az alkalmazott molekuláris marker típustól A populációban lévő LD kialakulásának módjától és az LD mértékétől A populáció genomi sajátosságaitól A populáció mérettől és a szerkezetétől A vizsgált tulajdonság genetikai szabályozásának komplexitásától
Asszociációs térképezés Valós marker tulajdonság asszociáció azonosításának esélye függ Az alkalmazott molekuláris marker típustól A populációban lévő LD kialakulásának módjától és az LD mértékétől A populáció genomi sajátosságaitól A populáció mérettől és a szerkezetétől Alkalmazott statisztikai modelltől A vizsgált tulajdonság genetikai szabályozásának komplexitásától
Molekuláris marker típusok Kodomináns (SNP) domináns (AFLP, DArT) markerek Bialléles (SNP, DArT) : multialléles (SSR, RFLP, AFLP) markerek
Asszociációs térképezés Valós marker tulajdonság asszociáció azonosításának esélye függ Az alkalmazott molekuláris marker típustól A populációban lévő LD kialakulásának módjától és az LD mértékétől A populáció genomi sajátosságaitól A populáció mérettől és a szerkezetétől Alkalmazott statisztikai modelltől A vizsgált tulajdonság genetikai szabályozásának komplexitásától
Különböző lókuszok allél variánsai közötti kapcsoltsági viszonyok adott populáción belül Linkage disequilibrium (LD; kapcsoltsági egyensúlytalanság) Linkage equilibrium (LE; kapcsoltsági egyensúly)
Linkage disequilibrium (LD) LD: az allélok nem véletlenszerű szétválása (kromoszómán belül és kromoszómák között) Mértékének meghatározása D= P AB :P A P B ; Megfigyelt és a várt haplotípus gyakoriságok különbsége rekombinációs különbségek összegzése r 2 ; két marker lókusz közti korreláció négyzete rekombinációs és mutációs események összegzése
LD ábrázolása Páronkénti r 2 :ben kifejezett LD értékek grafikus ábrázolása KétMszülős marker térkép Fajta populáció marker mátrix Sok fajtás LD térkép
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 LD ábrázolása LD csökkenés (LD decay) a páronkénti marker távolság függvényében y = -0.039Ln(x) + 0.3304 R 2 = 0.1299 0.0 0.9 2.4 3.8 5.6 7.4 9.2 11.4 13.8 15.7 18.2 21.1 23.9 25.7 28.6 31.3 34.1 36.6 39.2 41.4 43.7 46.1 48.5 50.9 54.0 56.9 61.6 65.1 69.9 74.5 79.4 85.0 91.5 104.2 120.3 két marker közti rekombinációs távolság (cm) két marker közti korreláció ( r 2 )
LD mértékét befolyásoló faktorok LD értékét növelő tényezők Öntermékenyülés Genetikai izoláció Strukturált populáció Rokonság Kis méretű kiinduló populáció Alacsony rekombinációs gyakoriság LD értékét csökkentő tényezők Idegen megtermékenyülés Rekombináció és mutáció nagy gyakorisága Ismétlődő mutációk
Az LD mértéke függ a populáció típusától, a rekombináció gyakoriságától (adott kromoszóma régió genetikai és fizikai távolsága közti arány), az LD blokkoktól LD mértéke árpában Cél gén Cél gén LD LD lassan szűnik meg Termesztett árpa ~5cM Rostoks et al., 2006 Kraakman et al., 2004 LD gyorsan szűnik meg Vadárpa Génen belül (~300 bp) Morrell et al., 2005 Árpa genom ~ 1250 cm
LD és az asszociációs vizsgálatok Nagy kiterjedésű LD Csökkenti az asszociációs térképezéshez szükséges marker sűrűséget Térképezés felbontóképessége csökkent (coarse mapping) Szűk LD Nagyszámú marker szükséges az asszociációs vizsgálatok kivitelezéséhez, egy adott gén markerezéséhez Térképezés felbontó képessége jelentősen megnő Független markerek közti LD Hamis marker tulajdonság kapcsolat azonosításának esélye megnő
1H Árpa genomot lefedő LD térkép 2H 3H Comadran et al. (2011) TAG 122:1363 190 Mediterrán árpafajta 2132 SNP 4H LD cm:ban kifejezve 5H 6H 7H 1H 2H 3H 4H 5H 6H 7H
ps1443 ps1515 ps1725 ps1785 ps1839 ps1843 ps2032 ps2035 ps2036 ps2230 ps2322 ps2327 ps182 ps427 ps506 ps582 ps843 ps885 ps912 ps1093 ps1267 ps1348 ps1455 ps1489 ps1576 ps1596 ps1816 ps2008 ps182 ps427 ps506 ps582 ps843 ps885 ps912 ps1093 ps1267 ps1348 ps1455 ps1489 ps1576 ps1596 ps1816 ps2008 ps1443 ps1515 ps1725 ps1785 ps1839 ps1843 ps2032 ps2035 ps2036 ps2230 ps2322 ps2327 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 >0.01 <0.01 <0.001 <0.0001 lower r 2 upper Pvalue PpdH1 2H PpdH1 HvFT 7H HvCO1 7H HvFT HvCO1 ps1443 ps1515 ps1725 ps1785 ps1839 ps1843 ps2032 ps2035 ps2036 ps2230 ps2322 ps2327 ps182 ps427 ps506 ps582 ps843 ps885 ps912 ps1093 ps1267 ps1348 ps1455 ps1489 ps1576 ps1596 ps1816 ps2008 ps182 ps427 ps506 ps582 ps843 ps885 ps912 ps1093 ps1267 ps1348 ps1455 ps1489 ps1576 ps1596 ps1816 ps2008 ps1443 ps1515 ps1725 ps1785 ps1839 ps1843 ps2032 ps2035 ps2036 ps2230 ps2322 ps2327 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 >0.01 <0.01 <0.001 <0.0001 lower r 2 upper Pvalue PpdH1 2H PpdH1 HvFT1 7H HvCO1 7H HvFT1 HvCO1 B ps1443 ps1515 ps1725 ps1785 ps1839 ps1843 ps2032 ps2035 ps2036 ps2230 ps2322 ps2327 ps182 ps427 ps506 ps582 ps843 ps885 ps912 ps1093 ps1267 ps1348 ps1455 ps1489 ps1576 ps1596 ps1816 ps2008 ps182 ps427 ps506 ps582 ps843 ps885 ps912 ps1093 ps1267 ps1348 ps1455 ps1489 ps1576 ps1596 ps1816 ps2008 ps1443 ps1515 ps1725 ps1785 ps1839 ps1843 ps2032 ps2035 ps2036 ps2230 ps2322 ps2327 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 >0.01 <0.01 <0.001 <0.0001 lower r 2 upper Pvalue PpdH1 2H PpdH1 HvFT 7H HvCO1 7H HvFT HvCO1 ps1443 ps1515 ps1725 ps1785 ps1839 ps1843 ps2032 ps2035 ps2036 ps2230 ps2322 ps2327 ps182 ps427 ps506 ps582 ps843 ps885 ps912 ps1093 ps1267 ps1348 ps1455 ps1489 ps1576 ps1596 ps1816 ps2008 ps182 ps427 ps506 ps582 ps843 ps885 ps912 ps1093 ps1267 ps1348 ps1455 ps1489 ps1576 ps1596 ps1816 ps2008 ps1443 ps1515 ps1725 ps1785 ps1839 ps1843 ps2032 ps2035 ps2036 ps2230 ps2322 ps2327 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 >0.01 <0.01 <0.001 <0.0001 lower r 2 upper Pvalue PpdH1 2H PpdH1 HvFT1 7H HvCO1 7H HvFT1 HvCO1 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 >0.01 <0.01 <0.001 <0.0001 lower r 2 upper Pvalue PpdH1 2H PpdH1 HvFT1 7H HvCO1 7H HvFT1 HvCO1 B Egyedi gének LD térképei Stracke et al. TAG(2009)118:259 LD kb:ban kifejezve
Széles genetikai bázisú fajtakör asszociációs genetika LD térképpel lehetővé válik a gén fenotípus asszociációk azonosítása a meglévő törzsgyűjteményekben Az evolúció során rögzített fenotípusos információkat, meiotikus és rekombinációs eseményeket hasznosítja Egy törzsgyűjteményben lehetőség nyílik számos fenotípusos tulajdonság párhuzamos vizsgálatára
Asszociációs térképezés Valós marker tulajdonság asszociáció azonosításának esélye függ Az alkalmazott molekuláris marker típustól A populációban lévő LD kialakulásának módjától és az LD mértékétől A populáció genomi sajátosságaitól A populáció mérettől és a szerkezetétől Alkalmazott statisztikai modelltől A vizsgált tulajdonság genetikai szabályozásának komplexitásától
4.8 7.1 7.3 5.0 1.9 1253.2 40 611 Σ 5.3 6.0 11.7 5.1 1,6 198.0 7 116 7H 2.2 3.9 2.2 1.7 1.7 159.3 5 90 6H 7.8 15.2 1.9 6.2 1.7 193.0 20 92 5H 7.5 9.7 24.8 9.7 4.8 186.4 4 35 4H 3.3 4.3 8.1 3.3 1.8 181.3 1 98 3H 1.3 3.0 5.4 2.7 1.9 197.6 2 101 2H 5.5 7.0 16.5 7.3 1.7 137.6 1 79 1H Őszi+ átmeneti őszi tavaszi 168 fajta Gén spec DArT Átlagos LD csökkenés (cm) Átl cm Össz cm Markerek LDMdecay kromoszómánkénti változásai 168 árpafajta körben
LDMdecay kromoszómánkénti változásai 168 árpafajta körben Átlagos LD csökkenés (cm) Egyedi kromoszómák és a teljes genomi markerek közti összefüggés Korreláció (r) alapján Párosított TMteszt (P érték) alapján 1H 7.3 0.74 10E:12 2H 2.7 0.75 8E:27 3H 3.3 0.79 3E:54 4H 9.7 0.60 9E:38 5H 6.2 0.76 ns 6H 1.7 0.64 3EM239 7H 5.1 0.71 9E:10 Átlag 5.0 : :
Asszociációs térképezés Valós marker tulajdonság asszociáció azonosításának esélye függ Az alkalmazott molekuláris marker típustól A populációban lévő LD kialakulásának módjától és az LD mértékétől A populáció genomi sajátosságaitól A populáció mérettől és a szerkezetétől Alkalmazott statisztikai modelltől A vizsgált tulajdonság genetikai szabályozásának komplexitásától
www.barleycap.org Rawson(ND19119-2MW US CAP Core 102 Lines 1105 P-OPA2 markers; SM distance; UPGMA cluster 0.54 0.65 0.77 0.88 1.00 Coefficient Barke Pasadena C-14 Farmington Scarlett Collins Franklin BISON5H BISON1H+5H BISON4H+5H Baronesse BISON1H BISON4H BISON7H BISON1H+4H BISON1H+4H+5H Geraldine Eslick Hays Radiant ACMetcalfe CDC-Kendall CDC-Stratus Newdale Merit Crest Klages Hockett Harrington Sublette Garnett CDCCopeland 2B96-5038 TR306 B1202 B1215 2B98-5312 Conrad Charles Rawson(ND19119-2 Bowman Conlon ND21863 Craft Haxby Orca Flagship2 Arapiles Canela BCD47 BCD12 HarunaNijo CIho4196 Shenmai3 OWBRecessive Steptoe Sussex Wysor Nomini Price Doyce Strider Kold Thoroughbred Dicktoo Kompolti WA1614-95 Hoody Belford Washford Morex 88Ab536 88Ab536-B Robust MNBrite Excel Lacey M123 6B02-3394 Legacy 6B00-1526 FEG90-31 FEG66-08 M122 6B94-7378 FEG55-14 6B94-8253 Stander B1614 Stellar Foster 6B97-2245 CDC-Sisler FEG59-09 B1602 Tradition Drummond Larker ND20448 ND20508 NDB112 OWBDominant
Strukturált populáció A populáción belül határozottan elkülönülő alcsoportok jelenléte LD kapcsolat egymástól távol, nem kapcsolt, vagy eltérő kromoszómákon levő lókuszok között Alcsoportonként változó LD blokkok
www.barleycap.org Rawson(ND19119-2MW US CAP Core 102 Lines 1105 P-OPA2 markers; SM distance; UPGMA cluster 0.54 0.65 0.77 0.88 1.00 Coefficient Barke Pasadena C-14 Farmington Scarlett Collins Franklin BISON5H BISON1H+5H BISON4H+5H Baronesse BISON1H BISON4H BISON7H BISON1H+4H BISON1H+4H+5H Geraldine Eslick Hays Radiant ACMetcalfe CDC-Kendall CDC-Stratus Newdale Merit Crest Klages Hockett Harrington Sublette Garnett CDCCopeland 2B96-5038 TR306 B1202 B1215 2B98-5312 Conrad Charles Rawson(ND19119-2 Bowman Conlon ND21863 Craft Haxby Orca Flagship2 Arapiles Canela BCD47 BCD12 HarunaNijo CIho4196 Shenmai3 OWBRecessive Steptoe Sussex Wysor Nomini Price Doyce Strider Kold Thoroughbred Dicktoo Kompolti WA1614-95 Hoody Belford Washford Morex 88Ab536 88Ab536-B Robust MNBrite Excel Lacey M123 6B02-3394 Legacy 6B00-1526 FEG90-31 FEG66-08 M122 6B94-7378 FEG55-14 6B94-8253 Stander B1614 Stellar Foster 6B97-2245 CDC-Sisler FEG59-09 B1602 Tradition Drummond Larker ND20448 ND20508 NDB112 OWBDominant
Strukturált populációk Populáció szerkezetből származó fals asszociációk Populáció struktúra mint tényező beépítése az elemzésekbe K mátrix (pairwise Kinship values) (TASSEL, PCA, GenStat) Q mátrix (a határozottan elkülönülő alcsoportok azonosítása) (STRUCTURE) K + Q mátrix együttes használata
Alcsoportok számának meghatározása STRUCTURE programmal -8000 0 2 4 6 8 10 12-9000 Goodness of fit -10000-11000 -12000-13000 k
Comadran et al. (2009) TAG 119:175 190 Mediterrán árpafajta 1130 DArT marker alapján
Alcsoportok és rokonsági kapcsolatok meghatározása főkomponens elemzéssel (PCA)
LD:decay populáció és alcsoport függő változásai 811 térképezett DArT marker alapján Comadran et al. (2009) TAG 119:175
Asszociációs térképezés Valós marker tulajdonság asszociáció azonosításának esélye függ Az alkalmazott molekuláris marker típustól A populációban lévő LD kialakulásának módjától és az LD mértékétől A populáció mérettől és a szerkezetétől Alkalmazott statisztikai modelltől A vizsgált tulajdonság genetikai szabályozásának komplexitásától
Asszociációs vizsgálatok alapstatisztikai eljárásai Egyszerű marker:tulajdonság asszociáció (naív modell) Általános lineáris modell (GLM) Kevert lineáris modell MLM+Kinship mátrix; MLMK Kevert lineáris modell + populáció struktúra MLMK + Q mátrix
1.0 0.9 0.8 MOR (naïve) 0.7 Cumulative % of p-value 0.6 0.5 0.4 0.3 0.2 ITA (naïve) MOR (Q) ITA (Q) K Naïve Q 0.1 K 0.0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Observed p-value Comadran et al. (2009) TAG 119:175
12 10 GLM naive GLM Q MLM K MLM Q_K 8 -log10p 6 4 2 0 rekombinációs távolság (cm)
Asszociációs térképezés Valós marker tulajdonság asszociáció azonosításának esélye függ Az alkalmazott molekuláris marker típustól A populációban lévő LD kialakulásának módjától és az LD mértékétől A populáció mérettől és a szerkezetétől Alkalmazott statisztikai modelltől A vizsgált tulajdonság genetikai szabályozásának komplexitásától
Lisztharmat rezisztencia asszociációs vizsgálata árpában Comadran et al. (2009) TAG 119:175
Mennyiségi tulajdonságok Termőképesség genom széles asszociációs vizsgálata árpában (Comadran et al. 2011.) Mediterrán medence körül 12 termőhelyen két évjáratban (24 egyedi adatsor) Meta:analízis során fő QTL:ek meghatározása, egyedi termőhelyeken azonosítható QTL:ek
Mennyiségi tulajdonságok Termőképesség genom széles asszociációs vizsgálata árpában (Comadran et al. 2011.)
Mennyiségi tulajdonságok Termőképesség genom széles asszociációs vizsgálata árpában (Comadran et al. 2011.) 2 7 QTL:t azonosítottak a termés különböző komponensei esetében A szignifikáns asszociációk egy része olyan SNP:k nél lokalizálódott, amelyek szorosan kapcsolódtak ismert génekhez QTL:ek együtt lokalizálódása a genomon termés meta:analíziseként 3 főhatású QTL:t azonosítottak, míg az egyedi termőhelyekre bontva ezek száma 27 volt (genotípus x környezet kölcsönhatás elemzése)
Strukturált populációk problematikája A populáció struktúra hatását számításba vevő módszerek nem minden esetben képesek a fals pozitív asszociációk kiszűrésére A populáció struktúrára szűrés megakadályozhatja az olyan biológiai jelentőséggel bíró QTL / génhatások azonosítását is, amelyek egybeesnek a populáció struktúrával A fenotípus szignifikáns korrelációja a populáció struktúrával megakadályozhatja a kisebb hatású allélok detektálását
Javasolt irodalom Abdurakhmonov et al. (2008) International Journal of Plant Genomics vol. 2008, article No:574927 Comadran et al. (2009) Theor Appl Genet, 119:175 Comadran et al (2011) Theor Appl Genet 122:1363 Rostoks et al. (2006) PNAS 103:18656 Waugh et al. (2009) Curr Opin in Plant Biol 12:218