Filogenetikai analízis. Törzsfák szerkesztése



Hasonló dokumentumok
Az evolúció az adatok mögött

Adatok statisztikai értékelésének főbb lehetőségei

Problémák és megoldások a bioinformatikában. Válogatott fejezetek a bioinformatikából. Gyimesi Gergely, február 25.

openbve járműkészítés Leírás az openbve-hez kapcsolódó extensions.cfg fájl elkészítéséhez

Willi Hennig ( )

6. Előadás. Vereb György, DE OEC BSI, október 12.

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

MOLEKULÁRIS FILOGENETIKAI ELEMZÉSEK EGY DISZKRÉT MATEMATIKAI

MOLEKULÁRIS FILOGENETIKAI ELEMZÉSEK EGY DISZKRÉT MATEMATIKAI

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A jelen megértése a múlt ismerete nélkül lehetetlen

Kladisztika. (A veszekedõsek tudománya)

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Gyakorlati bioinformatika

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

Radioaktív bomlási sor szimulációja

Elemi statisztika fizikusoknak

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Az értékelés során következtetést fogalmazhatunk meg a

Gépi tanulás. Féligellenőrzött tanulás. Pataki Béla (Bolgár Bence)

Magassági kitőzések elve és végrehajtása

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

Modern Fizika Labor Fizika BSC

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

MIKROFYN GÉPVEZÉRLÉSEK. 2D megoldások:

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Számítógépes döntéstámogatás. Genetikus algoritmusok

Felvételi tematika INFORMATIKA

ESR-spektrumok különbözı kísérleti körülmények között A számítógépes értékelés alapjai anizotróp kölcsönhatási tenzorok esetén

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Paleobiológiai módszerek és modellek 11. hét

A Markovi forgalomanalízis legújabb eredményei és ezek alkalmazása a távközlő hálózatok teljesítményvizsgálatában

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Matematikai statisztika c. tárgy oktatásának célja és tematikája

A társadalomtudományi kutatás teljes íve és alapstratégiái. áttekintés

Alapfogalmak áttekintése. Pszichológiai statisztika, 1. alkalom

A gyakorló feladatok számozása a bevezetı órát követı órán, azaz a második órán indul. Gyakorló feladatok megoldásai 1

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

[Biomatematika 2] Orvosi biometria

Látványos oktatás egyszerő multimédiás elemek programozásával Delphiben

Least Squares becslés

Páros összehasonlítás mátrixok empirikus vizsgálata. Bozóki Sándor

Radon-koncentráció relatív meghatározása Készítette: Papp Ildikó

Az Európai Parlament és a Tanács 2004/49/EK irányelve (2004. április 29.) a közösségi vasutak biztonságáról, valamint a vasúttársaságok

Biomatematika 2 Orvosi biometria

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

4. A méréses ellenırzı kártyák szerkesztése

SPC egyszerően, olcsón, eredményesen

A populáció meghatározása

[Biomatematika 2] Orvosi biometria


Jegyzıkönyv. Mutató: Határozat tárgya: Határozat száma: Old.

Adat mentés. A program segítség file-ok, mappák mentésében. Mentési csomagokat állíthatunk össze.

Radon a környezetünkben. Somlai János Pannon Egyetem Radiokémiai és Radioökológiai Intézet H-8201 Veszprém, Pf. 158.

Normális eloszlás tesztje

Evolúció. Dr. Szemethy László egyetemi docens Szent István Egyetem VadVilág Megőrzési Intézet

6. A szervezet. Az egyik legfontosabb vezetıi feladat. A szervezetek kialakítása, irányítása, mőködésük ellenırzése, hatékonyságuk növelése,

Evolúció. Dr. Szemethy László egyetemi docens Szent István Egyetem VadVilág Megőrzési Intézet

Kérdıívek, tesztek I. Kérdıívek

Másodfokú egyenletek Gyakorló feladatok. Készítette: Porkoláb Tamás. Milyen p valós paraméter esetén lesz az alábbi másodfokú egyenlet egyik gyöke 5?

Matematikai alapok és valószínőségszámítás. Normál eloszlás

CAD-CAM-CAE Példatár

BBTE Matek-Infó verseny mintatételsor Informatika írásbeli vizsga

[Biomatematika 2] Orvosi biometria

Tisztán kivehetı tendencia: kommunikációs hálózatok egyre bonyolultabbakká válnak Hálózat bonyolultsága

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

FOLYAMATLEÍRÁST SEGÍTİ GYAKORLATI ÚTMUTATÓ

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Sämling Kft. LEAN menedzsment. A veszteségek folyamatos és szisztematikus kiküszöbölése Több mint eszköztár. 18 év 5 fı terület:

A valószínűségszámítás elemei

Bevezetés a hipotézisvizsgálatokba

Mesterséges Intelligencia I.

Szépmővészeti Múzeum térszint alatti bıvítése: A projekt idıt befolyásoló kockázatok értékelése. Készítette: Kassai Eszter Rónafalvi György

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Mérési adatok illesztése, korreláció, regresszió

Ismétlı áttekintés. Statisztika II., 1. alkalom

A leíró statisztikák

Kiegészítő előadás. Vizsgabemutató VBA. Dr. Kallós Gábor, Fehérvári Arnold, Pusztai Pál Krankovits Melinda. Széchenyi István Egyetem

Az MSZ EN villámvédelmi szabványsorozat. 2. rész: Kockázatelemzés (IEC :2006)

Közösség detektálás gráfokban

Arató Miklós. A nem-életbiztosítók belsı modellezésének lehetséges problémái

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

Bánsághi Anna 2014 Bánsághi Anna 1 of 68

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

A Munkaügyi Közvetítıi és Döntıbírói Szolgálat Szervezeti, Mőködési és Eljárási Szabályzata

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Más szektorok (múltik, hazai nagyvállalatok és KKV-ék) HR trendjei és a közszolgálati emberi erıforrás menedzsment 2010

Készletgazdálkodás. TÉMAKÖR TARTALMA - Készlet - Átlagkészlet - Készletgazdálkodási mutatók - Készletváltozások - Áruforgalmi mérlegsor

Kémiai átalakulások. A kémiai reakciók körülményei. A rendszer energiaviszonyai

A BELSİ ELLENİRZÉS KIALAKÍTÁSA ÉS MŐKÖDTETÉSE A GYİR-MOSON-SOPRON MEGYEI ÖNKORMÁNYZATNÁL

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

A humán mitokondriális genom: Evolúció, mutációk, polimorfizmusok, populációs vonatkozások. Egyed Balázs ELTE Genetikai Tanszék

KISTELEPÜLÉSEK ÖNFENNTARTÓ, HATÉKONY ÉS ÉRTÉKTEREMTİ KÖZFOGLALKOZTATÁSA

A flexicurity EU-s modelljeinek gyakorlati szempontú bemutatása, és a hazai megvalósítás lehetıségei

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Átírás:

Filogenetikai analízis Törzsfák szerkesztése

Neighbor joining (szomszéd összevonó) módszer A fában egymás mellé kerülı objektumok kiválasztása a távolságmátrix értékei és az objektumoknak az összes többivel alkotott távolságai alapján. A módosított távolság annál kisebb lesz az eredetinél minél nagyobb a két objektum átlagos távolsága a többitıl, hiszen a nagy átlag (= nagy evolúciós sebesség ) megnöveli a kettejük relatív közelségét. A fa teljes felépítése során a távolságmátrix fokozatosan redukálódik. Az eljárás megfelel a minimális evolúció módszerének, végeredményben a fa éleinek összhosszúságát optimalizáljuk.

Távolság mátrix spenót rizs szúnyog majom ember spenót. 84.9 5.6 9.8 86.3 rizs 84.9. 7.8 22.4 22.6 szúnyog 5.6 7.8. 84.7 8.8 majom 9.8 22.4 84.7. 3.3 ember 86.3 22.6 8.8 3.3.

Az elsı lépés 3.3 (embermajom) a legkisebb távolság. Így összekapcsoljuk az embert és a majmot embmajként, és új távolságot számítunk. embmaj szúnyog spenót rizs ember majom

Új távolság számítása Miután összekapcsoltunk két fajt egy alfába, ki kell számolnunk minden egyes pontnak és az új subtree nek a távolságát. Ezt egy egyszerő átlag számítással kapjuk meg: Dist[spenót,embmaj] =(Dist[spenót, majom] Dist[spenót,ember])/2 =(9.8 86.3)/2= 88.55 embmaj spenót ember majom

Következı ciklus spenót rizs szúnyog embmaj spenót. 84.9 5.6 88.6 rizs 84.9. 7.8 22.5 szúnyog 5.6 7.8. 82.8 embmaj 88.6 22.5 82.8. szúny(embmaj) embmaj rizs spenót szúnyog ember majom

Utolsó elıtti ciklus spenót rizs szúnyembmaj spenót. 84.9 97. rizs 84.9. 2.2 szúnyembmaj 97. 2.2. szúny(embmaj) spenrizs embmaj rizs spenót szúnyog ember majom

Utolsó ciklus spenrizs szúnyembmaj spenrizs szúnyembmaj. 8.7 8.7. (spenrisz)(szúny(embmaj)) szúny(embmaj) spenrizs embmaj rizs spenót szúnyog ember majom

Parszimónia elv Egy jelenség magyarázatában az egyszerőbb hipotéziseket kell elfogadnunk a komplikáltabbakkal szemben. Minimális evolúciós utak elve (távolság alapú kladisztika, karakter alapon mőködı módszerek) Parsimony takarékossági elv

2 2 4 3 3 4 2 A B D E F 2 3 4 5 6 7 8 9 2 karakterek E B A D F 4 7,8 2 5 3,9 6 2 Leszármaztatott állapotok száma Apomorfiák összesített száma az egyes taxonokra OTU

Parszimónia a gyakorlatban Frog Bird amnion hair HARATERS 2 3 4 5 6 lactation placenta antorbital fenestra wings Frog Tree Bird 6 ocodile 5 Kangeroo Bat 3 2 6 4 Human T A X A rocodile Kangeroo Frog ocodile Kangeroo Bat Bird Human Bat Human TREE LENGTH 5 4 5 2 3 6 4 FIT Tree Tree 2 2 7 2 2 2 2 Tree 2 3 2 A két fa közül kisebb hosszúságú a Tree, így a parszimónia elv szerint ez lesz a megfelelı. Mindkét fa igényel néhány homopláziát (extra lépés).

Parszimónia módszerek Általánosságban a parszimónia módszerek az evolúciós fa ágainak összhosszúságát minimalizálják. Olyan fát keresünk, amely a lehetı legkisebb számú karakterállapot változást (evolúciós lépést) teszi szükségessé a leszármazási viszonyok magyarázásához. A feladat: az adott topológiához legmegfelelıbb (legkisebb hosszúságot eredményezı) állapotokat kell rendelni a belsı szögpontokhoz a fa topológiájának optimalizálása

Bootstrap Modern számitógégintenzív újramintavételezési módszer, amelyben kiindulásként feltételezzük, hogy a mintában lévı m egységre kapható gyakoriságeloszlás a lehetı legjobban képviseli az eredeti populációban levı gyakoriságot.

A mintákból melemő visszatevéses mintavételezést sokszor végrehajtva kapjuk a bootstrap mintákat. Minden egyes bootstrap mintát használhatunk valamilyen paraméter becslésére (parszimónia, ML, megismételt többváltozós analízis). Bootstrap konszenzus fát eredményez a változók bootstrap újramintavételezésével elıállított alternatív fák egyesítése. %ban fejezi ki, hogy hányszor helyezi a fában azonos helyre a mintákat. Kiküszöböli a változók kiválasztásában jelentkezı szubjektív elemeket, s alkalmas a leginkább stabil osztályok kimutatásásra.

Bootstrap egy példa SSUrDNA Ochromonas () Symbiodinium (2) Prorocentrum (3) Euplotes (8) 84 Tetrahymena (9) 96 Loxodes (4) Tracheloraphis (5) Spirostomum (6) Gruberia (7) Bootstrap konszenzus fa 23456789 Freq.**.......**.......**......****......****** 95.5...** 84.33...****.*.83...*****. 3.83.*******. 2.5.**...*...**...*.

Karakterállapotok közötti lehetséges átmenetek A G Rendezetlen: egy tulajdonság állapotai az evolúció során bármelyik másikba át ill. visszaalakulhatnak. T rendezetlen A B D rendezett és reverzibilis A B D irreverzibilis Rendezett és reverzibilis: A karakterek állapotai sorba rendezettek, az átalakulás mindkét irányban végbemehet. A állapotból csak a szomszédos állapotba juthatunk el közvetlenül. Irreverzibilis: A rendezett karakter állapotai csak egy irányban alakulhatnak át egymásba.

transzverzió Py Pu A stepmatrix meghatározza a különbözı karakterek közötti változás súlyát. PURINES (Pu) A T G PYRIMIDINES (Py) A G T A 5 5 5 5 G 5 5 T 5 5 tranzíció Py Py Pu Pu

DNS szubsztitúciós modellek

J/ Jukes & antor A G T FEL/ Felsenstein A G T K2P/ Kimura 2 paraméter A G T A G T A G T A G T

HKY/ Hasegawa, Kishino, Yano A G T A G T

Maximum likelihood módszer Konkrét evolúciós modell alkalmazását igényli. Meg kell adni, hogy miképp alakulhat át az egyik szekvencia a másikba (morfológiai karakterekre ilyen célra alkalmazható modellrıl még nem tudunk). A modell ismeretében megadja, hogy a sok lehetıség közül melyik fa kialakulása a leginkább valószínő. A számítások során a teljes szekvenciát figyelembe kell venni, nemcsak az eltéréseket okozó pozíciókat (ahogy a parszimónia esetében tesszük). Legegyszerőbb modell a J. K2P modell már bevezeti k tranzíció/tranzverzió hányadost.

Maximum likelihood módszer Kból és a gyakoriságból meghatározhatók a nukleotidcserék evolúciós idıegységre vonatkoztatott rátái. A mutációs ráták segítségével kiszámítható annak az eseménynek a valószínősége, hogy t idı elteltével A bázis helyére G bázis kerül. P AG (t) Annak az esélye (L=likelihood!), hogy adott szekvencia valamely pozíciójában az A nukleotid van, és ezt t idı elteltével G váltja fel: L AG (t)=ƒ A P AG (t) ƒ A az A nukleotid relatív gyakorisága a kezdeti szekvenciában