Az evolúció az adatok mögött
|
|
- Mátyás Vörös
- 7 évvel ezelőtt
- Látták:
Átírás
1 Filogenetika Az evolúció az adatok mögött Ortutay Csaba, PhD 2013 április 9
2 Miről lesz ma szó? Nukleotid szubsztitúciós modellek Távolság alapú módszerek UPGMA Neighbor joining Modell alapú filogenetika Maximum likelihood Bayesian inference Kiegészítő módszerek Fák gyökerének meghatározása Konszenzus fák Adat keverés (bootstrapping) 2
3 A modell fogalma a filogenetikában Parszimónia Fa-topológia Távolság alapú módszerek Nukleotid szubsztitúciós modellek (mutációs ráták + bázisfrekvenciák) Modell alapú filogenetika (ML + Bayes) Fa-topológia + ághosszak Nukleotid szubsztitúciós modellek (mutációs ráták + bázisfrekvenciák) Egyéb paraméterek (pozíciók variabilitása)
4 A mutációk telítődnek
5 Nukleotid szubsztitúciós modellek DNS szintű evolúció Szilárd matematikai alapok Egyes modellek különbözőképpen veszik figyelembe Nukleotid frekvenciákat 1/4 Adatokban mért Modellel becsült Mutációs rátákat Uniform Tranzíciók/transzverziók Időfüggetlen/függő
6 Jukes-Cantor modell JC69 modell (Jukes és Cantor, 1969) Egységes (1/4) bázisfrekvencia Egyetlen mutációs ráta: μ
7 A JC modell tulajdonságai
8 A JC modell tulajdonságai
9 További modellek K80 model (Kimura, 1980) Tranzíciók és transzverziók HKY model (Hasegawa, Kishino és Yano 1985) Egyedi bázisfrekvenciák Gyakran használt ML-hez T92 model (Tamura 1992) GC tartalom TN93 model (Tamura és Nei 1993) Több féle mutációs ráta + Egyedi bázisfrekvenciák Általános időreverzibilis model (Generalised timereversible GTR) Összes lehetséges mutációs ráta külön kezelve
10 Különféle szubsztitúciós modellek kapcsolatai
11 Szubsztitúciós modellek használata Távolság alapú módszerekben szekvenciatávolságok számolására Modell kiválasztása: kevesebb paraméter, kevesebb zaj: JC vagy K80 Modell alapú filogenetikában a szekvencia evolúció modellezésére Modellt illeszteni kell az adatokhoz A szükséges legkevesebb paramétert kell használni
12 Távolság alapú filogenetika Az alap megközelítés 1. Karakterek szelekciója/szekvenciák illesztése 2. Köztes távolság mátrix generálása 3. Fa gyártása a távolság mátrixból
13 Két szekvencia/gén/faj távolsága c a b a b c a b c
14 Egyszerű távolság mátrix létrehozása Archeop teryx Allosa urus Tricer atops A B C D E F Archeo 0 G pteryx 3 Allosaur us Plateosaurus Plateosaurus Tricerat ops Különböző karakterek száma Metrikák Nukleotid szubsztitúciós modellek Modell variánsok Aminosav szubsztitúciós mátrixok PAM vs BLOSUM Archeo pteryx Allosaur us Plateosaurus Tricerat ops
15 Aminosav szubsztitúciós mátrixok Az aminosavak kémiai (töltés, polaritás) és fizikai struktúrális tulajdonságok alapján Karlin és Ghandour (1985, PNAS 82:8597) A genetikai kód és a kémiai tulajdonságok alapján Dooloittle (Feng et al., 1985 J. Mol. Evol. 21: 112) Empirikus mátrixok PAM & BLOSUM
16 PAM vs. BLOSUM mátrixok PAM BLOSUM Explicit evolúciós modellek (valódi fák) alapján parszimónia Teljes hosszú szekvenciák illesztése résekkel Csak PAM1 számolt, a többi mátrix ennek extrapolációja Nincs mögötte evolúciós modell Szekvencia részletek résmentes illesztése Különféle mátrixok különböző mértékben hasonló fehérje csoportból számoltak
17 Hogyan lesz a távolság mátrixból fa? Számos matematikai lehetőség Clustering Leggyakoribb módszerek UPGMA Least squares (LS) Minimum evolution (ME) Neighbor Joining (NJ) Számos fejlettebb módszerhez kiindulási fa
18 UPGMA mint módszer Unweighted Pair Group Method with Arithmetic mean Átlagos kapcsoltásg modell Egyszerű klaszterező módszer Gyökeres fát ad! Tie (ütközés): Több egyforma távolság a mátrixban Maga az algoritmus nem kezeli A megoldás implementáció függő Egyelő mutációs rátát feltételez az adatokon
19 UPGMA fa Archeoptery x Ar Al Pl Tr Allosaurus Plateosaurus - 4 Triceratops - (Ar,(Pl,Al)) Tr (Ar,(Pl,Al)) Tr - Ar (Pl,Al) Tr Ar (Pl,Al) Tr - Newick formula (Tr,(Ar,(Pl,Al))) Triceratops Archeopteryx Plateosaurus Allosaurus
20 Neighbour-joining Mohó (Greedy) algoritmus A helyi optimumok megvalósításával próbálja megtalálni a globális optimumot Csillag alakú fából indul ki Lépésenként két taxont kapcsol össze Gyökértelen fát hoz létre Nem feltételez egyforma mutációs rátát Gyors és hatékony módszer Számos nagyon hasonló implementáció
21 Modell alapú filogenetika Maximum likelihood Bayesian inference Mi a valószínűsége, hogy a megfigyelt adatokat (D) látjuk, ha adott modell (T) igaz? Mekkora a valószínűsége annak, hogy adott modell igaz, ha az adatok adottak? Pr(D T) Pr(T D)
22 Maximum likelihood és filogenetika Az adatok az analízis előtt Illesztett nukleotid szekvenciák Modell az evolúciós folyamatokra Nukleotid szubsztitúciós modell Fa/fák Egyéb paraméterek Az eredmények az analízis után Fák a likelihood értékekkel (kisebb jobb) Ághosszak
23 Alapvető működés Mi a valószínűsége, hogy adott fa és modell esetén a megadott szekvenciaillesztést kapjuk meg? Heurisztikus faépítés/keresés Fa módosítása NJ fa Fa Pontozás Legjobbak kiválasztása
24 Ághosszak valószínűsége L=3x10-5 L=5.59x10-5
25 Változó és nem változó pozíciók További paraméterek a modellek bonyolításához Nem változó (konzervált) pozíciók Funkcionális helyek (enzim aktív centrumok) Arányuk becsülhető: ML Az egyes pozíciók variablilitása Genom különböző régiói különböző mértékű szelekciós kényszer alatt álnak Gamma distribution Az eloszlás paraméter (α) definiálja
26
27 Modell llesztése az adatokhoz
28 Hogyan döntsünk a modellek közöt? Csak semmi tippelés, elő a statisztikával! Iteratív likelihood ratio test Induljunk a legegyszerűbb modellel Bonyolítsuk lépésenként Az egyszerűbb és a bonyolulabb modellel számoljunk ML-t A nullhipotézisünk: nincs különbség Végezzünk χ 2 próbát ennek tesztelésére Ha szignifikáns a különbség, vessük el a nullhipotézist Ismételjük addig, amíg új paraméter már nem javítja a modell illeszkedését
29 Bayesian inference of phylogeny Bayesian inference Nagyon régi módszer a statisztikában Felsenstein 1968-ban javasolta filogenetikára Csupán 2000 körül elég erősz számítógép az implementációhoz Hatékony numerikus megoldás matematikai alapon Quick & dirty megoldás Elméleti alapja rendkívül vitatott Nagyon népszerű
30 Valószínűségek Posterior probability a posteriori Probability of a model The same as in ML! Prior probability a priori D A bemeneti adat θ A tesztelt modell: fa + evolúciós model
31 Bayes alapú filogenetika algorimikus vonatkozásai Markov chain Monte Carlo módszer MCMC A valószínűségi eloszlások okos mintavételezése Előre becsli a paraméterek eloszlását Két párhuzamos becsléssor Nincs előre meghatározott vége a futtatásnak A kutató állítja meg, amikor már elegendően konvergálnak az egyes futtatások
32 MrBayes Evolúciós modellt előre meg kell adni Nucleotide substitution model Pozíciók variabilitását meg kell becsülni ML-hez hasonló evolúciós modellt vár Bázisfrekvenciák Mutációs ráta mátrix Fa topológia Ághosszak Ha nincs a priori becslésünk, az adatokból is meg tudja becsülni
33 Mikor használjunk modell alapú filogenetikát? Nukleotid szekvencia adatok Néhány: ML Sok/hosszú szekvenciák: Bayes Ha van ismeretünk a szekvencia evolúcióról Ha szükségünk van a felhasznált paraméterekre Ha sok idő áll rendelkezésre Ha statisztikákkal kell alátámasztanunk az eredményeket
34 Miről lesz ma szó? Nukleotid szubsztitúciós modellek Távolság alapú módszerek UPGMA Neighbor joining Modell alapú filogenetika Maximum likelihood Bayesian inference Kiegészítő módszerek Fák gyökerének meghatározása Konszenzus fák Adat keverés (bootstrapping) 34
35 Fák gyökerének meghatározása a középpont módszer
36 Fák gyökerének meghatározása Outgroup módszer
37 Több fa konszenzusa Fák különböző módszerekkel ugyanarra az adatbemenetre Több azonos értékű eredményfa Többféle adatforrás ugyanazon fajokra Nukleotid/fehérje fa Zajos adatok A hangsúly a topológián Ághosszak elvesznek! Strict consensus Semistrict consensus Majority rule Választható küszöbérték: Miben közös több fa? %
38 Konszenzus módszerek
39 És ha nem ugyanazon taxonok vannak a fákon? Fák összehasonlítása különbző forrásokból Referencia fa az irodalomból Nem minden genomból van orthológ Legnagyobb közös fa Amiben az összes fa egyetért Legkisebb bennfoglaló fa Ha összerakjuk a részfákat Software: PhySIC_IST
40 Szuperfák Scornavacca C., Berry V., Lefort V., Douzery E.J.P. and Ranwez V. BMC Bioinformatics. 2008, Oct 4;9:413
41 Adat újra-mintavételezési módszeek Pszeudo-mintákat generál Nemparaméteres bootstrap véletlenszerű pozíció válogatás ismétlődéssel Jackknife az adatok véletlenszerű 50%ának kizárása Fa geerálása a pszeudo-mintákra Konszenzus fa generálása 50% majority rule Csak topológia! Az ághosszakat újra kell becsülni
42 Bootstrap értékek interpretálása A belső elágazásokhoz Megismételhetőség 1-FDR Adatok mennyire támogatják Meg kell adni: Replikációk számát A filogenetikai módszert
43 Bayesian posterior valószínűségek és a bootstrap értékek
44 Egy jól megtervezett filogenetikai analízis A szekvenciák kiválasztása Rerezentatív minta Outgroup Szekvenciák illesztése A bemeneti adatok (adatfájl) összeállítása Külső információ hozzáadása Stepmatrices Információ az egyes pozíciókról Topológiai kényszerek Nem szekvencia információk
45 Egy jól megtervezett filogenetikai analízis a filogenetikai módszer Távolság alapú módszer Maximum likelihood Parszimónia Sok szekvencia Gyors fa kell Fehérje szekvencia Sok nem szekvencia informácó Kevés (nem több, mint 20) nukleotid szekvencia Bayesian inference Sok/hosszú nukleotid szekvencia
46 Egy jól megtervezett filogenetikai analízis Fagenerálás Van a priori fánk, amit használhatunk? Generáljuk a fákat? Az összes fát kiértékeljük (kevesebb, mint 10 szekvencia) Heurisztika
47 Egy jól megtervezett filogenetikai analízis Az eredmények kiértékelése: megbízható a fám? Bootstrap/posterior értékek Konszenzus fák Megválaszolja az eredmény a biológiai kérdést?
Filogenetikai analízis. Törzsfák szerkesztése
Filogenetikai analízis Törzsfák szerkesztése Neighbor joining (szomszéd összevonó) módszer A fában egymás mellé kerülı objektumok kiválasztása a távolságmátrix értékei és az objektumoknak az összes többivel
RészletesebbenProblémák és megoldások a bioinformatikában. Válogatott fejezetek a bioinformatikából. Gyimesi Gergely, 2008. február 25.
Problémák és megoldások a bioinformatikában Válogatott fejezetek a bioinformatikából Gyimesi Gergely, 2008. február 25. Mik a fontos, megoldatlan biológiai problémák? Milyen módszereket, megoldási lehetıségeket
RészletesebbenGyakorlati bioinformatika
Gyakorlati bioinformatika Szekvenciaillesztés PhD kurzus 2. Szekvenciaillesztés Bagossi Péter Fajtái: - egyszer ill. többszörös illesztés - globális ill. lokális illesztés Alkalmazása: - adatbázisokban
RészletesebbenA tárgy címe: Bioinformatika
A tárgy címe: Bioinformatika Kötelezően választható tárgy IV. és V. évfolyamos biológus hallgatók számára; heti 2+3 óra Előkövetelmény: Biokémia főkollégium; genetika főkollégium; alapszintű számítógépes
RészletesebbenLeast Squares becslés
Least Squares becslés A négyzetes hibafüggvény: i d i ( ) φx i A négyzetes hibafüggvény mellett a minimumot biztosító megoldás W=( d LS becslés A gradiens számítása és nullává tétele eredményeképp A megoldás
RészletesebbenMatematikai statisztika c. tárgy oktatásának célja és tematikája
Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:
RészletesebbenBevezetés a hipotézisvizsgálatokba
Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -
RészletesebbenAdatok statisztikai értékelésének főbb lehetőségei
Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció
RészletesebbenKÖZELÍTŐ INFERENCIA II.
STATISZTIKAI TANULÁS AZ IDEGRENDSZERBEN KÖZELÍTŐ INFERENCIA II. MONTE CARLO MÓDSZEREK ISMÉTLÉS Egy valószínűségi modellben a következtetéseinket a látensek vagy a paraméterek fölötti poszterior írja le.
RészletesebbenÁltalánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg
LMeasurement.tex, March, 00 Mérés Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg a mérendő mennyiségben egy másik, a mérendővel egynemű, önkényesen egységnek választott
RészletesebbenSzámítógépes döntéstámogatás. Genetikus algoritmusok
BLSZM-10 p. 1/18 Számítógépes döntéstámogatás Genetikus algoritmusok Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu BLSZM-10 p. 2/18 Bevezetés 1950-60-as
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus
RészletesebbenMOLEKULÁRIS FILOGENETIKAI ELEMZÉSEK EGY DISZKRÉT MATEMATIKAI
Doktori értekezés tézisei MOLEKULÁRIS FILOGENETIKAI ELEMZÉSEK EGY DISZKRÉT MATEMATIKAI MÓDSZER, A BOOLE ANALÍZIS SEGÍTSÉGÉVEL Ari Eszter Dr. Jakó Éena, tudományos főmunkatárs témavezető Dr. Szathmáry Eörs,
RészletesebbenLoss Distribution Approach
Modeling operational risk using the Loss Distribution Approach Tartalom»Szabályozói környezet»modellezési struktúra»eseményszám eloszlás»káreloszlás»aggregált veszteségek»további problémák 2 Szabályozói
RészletesebbenVéletlenszám generátorok és tesztelésük HORVÁTH BÁLINT
Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT Mi a véletlen? Determinisztikus vs. Véletlen esemény? Véletlenszám: számok sorozata, ahol véletlenszerűen követik egymást az elemek Pszeudo-véletlenszám
RészletesebbenModellkiválasztás és struktúrák tanulása
Modellkiválasztás és struktúrák tanulása Szervezőelvek keresése Az unsupervised learning egyik fő célja Optimális reprezentációk Magyarázatok Predikciók Az emberi tanulás alapja Általános strukturális
Részletesebbenbiometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás
Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani
RészletesebbenSTATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése
4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól
RészletesebbenMOLEKULÁRIS FILOGENETIKAI ELEMZÉSEK EGY DISZKRÉT MATEMATIKAI
Doktori értekezés MOLEKULÁRIS FILOGENETIKAI ELEMZÉSEK EGY DISZKRÉT MATEMATIKAI MÓDSZER, A BOOLE ANALÍZIS SEGÍTSÉGÉVEL Ari Eszter Dr. Jakó Éena, tudományos főmunkatárs témavezető Dr. Szathmáry Eörs, egyetemi
RészletesebbenKÖZELÍTŐ INFERENCIA II.
STATISZTIKAI TANULÁS AZ IDEGRENDSZERBEN KÖZELÍTŐ INFERENCIA II. MONTE CARLO MÓDSZEREK ISMÉTLÉS Egy valószínűségi modellben a következtetéseinket a látensek vagy a paraméterek fölötti poszterior írja le.
RészletesebbenProbabilisztikus funkcionális modellek idegrendszeri adatok elemzésére
Probabilisztikus funkcionális modellek idegrendszeri adatok elemzésére Bányai Mihály! MTA Wigner FK! Computational Systems Neuroscience Lab!! KOKI-VIK szeminárium! 2014. február 11. Struktúra és funkció
RészletesebbenFunkcionális konnektivitás vizsgálata fmri adatok alapján
Funkcionális konnektivitás vizsgálata fmri adatok alapján Képalkotási technikák 4 Log Resolution (mm) 3 Brain EEG & MEG fmri TMS PET Lesions 2 Column 1 0 Lamina -1 Neuron -2 Dendrite -3 Synapse -4 Mikrolesions
RészletesebbenEvolúciós fák és szekvenciaillesztések Bayes-statisztikai Markov lánc Monte Carlo mintavételezése
Eötvös Loránd Tudományegyetem Informatikai Kar Evolúciós fák és szekvenciaillesztések Bayes-statisztikai Markov lánc Monte Carlo mintavételezése Diplomamunka Készítette: Novák Ádám prog.terv. matematikus
RészletesebbenHipotézis vizsgálatok
Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével
RészletesebbenMérés és modellezés 1
Mérés és modellezés 1 Mérés és modellezés A mérnöki tevékenység alapeleme a mérés. A mérés célja valamely jelenség megismerése, vizsgálata. A mérés tervszerűen végzett tevékenység: azaz rögzíteni kell
RészletesebbenBiometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem
Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem Előadások-gyakorlatok 2018-ban (13 alkalom) IX.12, 19, 26, X. 3, 10, 17, 24, XI. 7, 14,
RészletesebbenMonte Carlo módszerek
25 KULLANCSLÁRVA vizsgálata: Erős hideg hatására nézzük a túlélést. Eredmény: 6 elpusztult, 9 élve maradt Hipotézis: a pajzs hosszának variabilitása egy általános genetikai variabilitást tükröz, míg az
RészletesebbenDr. habil. Maróti György
infokommunikációs technológiák III.8. MÓDSZER KIDOLGOZÁSA ALGORITMUSOK ÁTÜLTETÉSÉRE KIS SZÁMÍTÁSI TELJESÍTMÉNYŰ ESZKÖZÖKBŐL ÁLLÓ NÉPES HETEROGÉN INFRASTRUKTÚRA Dr. habil. Maróti György maroti@dcs.uni-pannon.hu
RészletesebbenKutatásmódszertan és prezentációkészítés
Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I
RészletesebbenA Markovi forgalomanalízis legújabb eredményei és ezek alkalmazása a távközlő hálózatok teljesítményvizsgálatában
A Markovi forgalomanalízis legújabb eredményei és ezek alkalmazása a távközlő hálózatok teljesítményvizsgálatában Horváth Gábor ghorvath@hit.bme.hu (Horváth András, Telek Miklós) - p. 1 Motiváció, problémafelvetés
RészletesebbenA maximum likelihood becslésről
A maximum likelihood becslésről Definíció Parametrikus becsléssel foglalkozunk. Adott egy modell, mellyel elképzeléseink szerint jól leírható a meghatározni kívánt rendszer. (A modell típusának és rendszámának
RészletesebbenA humán mitokondriális genom: Evolúció, mutációk, polimorfizmusok, populációs vonatkozások. Egyed Balázs ELTE Genetikai Tanszék
A humán mitokondriális genom: Evolúció, mutációk, polimorfizmusok, populációs vonatkozások Egyed Balázs ELTE Genetikai Tanszék Endoszimbiotikus gén-transzfer (Timmis et al., 2004, Nat Rev Gen) Endoszimbiotikus
RészletesebbenA XXI. SZÁZADRA BECSÜLT KLIMATIKUS TENDENCIÁK VÁRHATÓ HATÁSA A LEFOLYÁS SZÉLSŐSÉGEIRE A FELSŐ-TISZA VÍZGYŰJTŐJÉN
44. Meteorológiai Tudományos Napok Budapest, 2018. november 22 23. A XXI. SZÁZADRA BECSÜLT KLIMATIKUS TENDENCIÁK VÁRHATÓ HATÁSA A LEFOLYÁS SZÉLSŐSÉGEIRE A FELSŐ-TISZA VÍZGYŰJTŐJÉN Kis Anna 1,2, Pongrácz
RészletesebbenProbabilisztikus modellek II: Inferencia. Nagy Dávid
Probabilisztikus modellek II: Inferencia Nagy Dávid Statisztikai tanulás az idegrendszerben, 2015 előző előadás előző előadás az agy modellt épít a világról előző előadás az agy modellt épít a világról
RészletesebbenIBNR számítási módszerek áttekintése
1/13 IBNR számítási módszerek áttekintése Prokaj Vilmos email: Prokaj.Vilmos@pszaf.hu 1. Kifutási háromszög Év 1 2 3 4 5 2/13 1 X 1,1 X 1,2 X 1,3 X 1,4 X 1,5 2 X 2,1 X 2,2 X 2,3 X 2,4 X 2,5 3 X 3,1 X 3,2
RészletesebbenMérés és modellezés Méréstechnika VM, GM, MM 1
Mérés és modellezés 2008.02.04. 1 Mérés és modellezés A mérnöki tevékenység alapeleme a mérés. A mérés célja valamely jelenség megismerése, vizsgálata. A mérés tervszerűen végzett tevékenység: azaz rögzíteni
RészletesebbenMegerősítéses tanulás 7. előadás
Megerősítéses tanulás 7. előadás 1 Ismétlés: TD becslés s t -ben stratégia szerint lépek! a t, r t, s t+1 TD becslés: tulajdonképpen ezt mintavételezzük: 2 Akcióértékelő függvény számolása TD-vel még mindig
RészletesebbenGépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés
Gépi tanulás a gyakorlatban Kiértékelés és Klaszterezés Hogyan alkalmazzuk sikeresen a gépi tanuló módszereket? Hogyan válasszuk az algoritmusokat? Hogyan hangoljuk a paramétereiket? Precízebben: Tegyük
RészletesebbenBiológiai rendszerek modellellenőrzése bayesi megközelítésben
Biológiai rendszerek modellellenőrzése bayesi megközelítésben Gál Tamás Zoltán Szoftver verifikáció és validáció kiselőadás, 2013. ősz Forrás: Sumit K. Jha et al.: A Bayesian Approach to Model Checking
RészletesebbenAdaptív dinamikus szegmentálás idősorok indexeléséhez
Adaptív dinamikus szegmentálás idősorok indexeléséhez IPM-08irAREAE kurzus cikkfeldolgozás Balassi Márton 1 Englert Péter 1 Tömösy Péter 1 1 Eötvös Loránd Tudományegyetem Informatikai Kar 2013. november
Részletesebben1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása
HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat
RészletesebbenAz éghajlati modellek eredményeinek alkalmazhatósága hatásvizsgálatokban
Az éghajlati modellek eredményeinek alkalmazhatósága hatásvizsgálatokban Szépszó Gabriella Országos Meteorológiai Szolgálat, szepszo.g@met.hu RCMTéR hatásvizsgálói konzultációs workshop 2015. június 23.
RészletesebbenRekonstrukciós eljárások. Orvosi képdiagnosztika 2017 ősz
Rekonstrukciós eljárások Orvosi képdiagnosztika 2017 ősz Pozitron emissziós tomográfia alapelve Szervezetbe pozitron kibocsátására képes radioaktív izotópot tartalmazó anyagot visznek cukoroldatban. Sejtek
RészletesebbenHipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok
STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris
RészletesebbenHipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás
STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H
RészletesebbenStatisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1
Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában
RészletesebbenIntelligens adatelemzés
Antal Péter, Antos András, Horváth Gábor, Hullám Gábor, Kocsis Imre, Marx Péter, Millinghoffer András, Pataricza András, Salánki Ágnes Intelligens adatelemzés Szerkesztette: Antal Péter A jegyzetben az
RészletesebbenMŰSZAKKIOSZTÁSI PROBLÉMÁK A KÖZÖSSÉGI KÖZLEKEDÉSBEN
infokommunikációs technológiák MŰSZAKKIOSZTÁSI PROBLÉMÁK A KÖZÖSSÉGI KÖZLEKEDÉSBEN Készítette: Árgilán Viktor, Dr. Balogh János, Dr. Békési József, Dávid Balázs, Hajdu László, Dr. Galambos Gábor, Dr. Krész
RészletesebbenEllátási lánc optimalizálás P-gráf módszertan alkalmazásával mennyiségi és min ségi paraméterek gyelembevételével
Ellátási lánc optimalizálás P-gráf módszertan alkalmazásával mennyiségi és min ségi paraméterek gyelembevételével Pekárdy Milán, Baumgartner János, Süle Zoltán Pannon Egyetem, Veszprém XXXII. Magyar Operációkutatási
RészletesebbenAlap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )
Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel: 463-6-80 Fa: 463-30-9 http://www.vizgep.bme.hu Alap-ötlet:
Részletesebben7 SAROKVÁGÁS TESZTÉRTÉK NÉLKÜL
88 7 SAROKVÁGÁS TESZTÉRTÉK NÉLKÜL 7.1 Problémafelvetés A tesztértékek segítségével történ szekvencia összehasonlító algoritmusok rendkívül praktikusak akkor, amikor adatbázisokból kell kikeresni egy adott
RészletesebbenKözösség detektálás gráfokban
Közösség detektálás gráfokban Önszervező rendszerek Hegedűs István Célkitűzés: valamilyen objektumok halmaza felett minták, csoportok detektálása csakis az egyedek közötti kapcsolatok struktúrájának a
RészletesebbenBemenet modellezése II.
Bemenet modellezése II. Vidács Attila 2005. november 3. Hálózati szimulációs technikák, 2005/11/3 1 Kiszolgálási id k modellezése Feladat: Egy bemeneti modell felállítása egy egy kiszolgálós sorbanállási
RészletesebbenMatematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása
Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból
RészletesebbenMéréselmélet MI BSc 1
Mérés és s modellezés 2008.02.15. 1 Méréselmélet - bevezetés a mérnöki problémamegoldás menete 1. A probléma kitűzése 2. A hipotézis felállítása 3. Kísérlettervezés 4. Megfigyelések elvégzése 5. Adatok
RészletesebbenGyörffyné Jahnke Gizella 1 - Smidla József 2
Györffyné Jahnke Gizella 1 - Smidla József 2 MolMarker - Molekuláris markerekkel kapott kutatási eredmények értékelését segítő felhasználóbarát szoftver MolMarker - User-friendly software to help evaluate
RészletesebbenMesterséges Intelligencia MI
Mesterséges Intelligencia MI Valószínűségi hálók - következtetés Dobrowiecki Tadeusz Eredics Péter, és mások BME I.E. 437, 463-28-99 dobrowiecki@mit.bme.hu, http://www.mit.bme.hu/general/staff/tade Következtetés
RészletesebbenBiomatematika 13. Varianciaanaĺızis (ANOVA)
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 13. Varianciaanaĺızis (ANOVA) Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date:
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,
Részletesebben6. Előadás. Vereb György, DE OEC BSI, október 12.
6. Előadás Visszatekintés: a normális eloszlás Becslés, mintavételezés Reprezentatív minta A statisztika, mint változó Paraméter és Statisztika Torzítatlan becslés A mintaközép eloszlása - centrális határeloszlás
RészletesebbenGenomátrendeződések. Miklós István. Rényi Intézet, összintézeti szeminárium, március 13.
Genomátrendeződések Miklós István Rényi Intézet, összintézeti szeminárium, 2006. március 13. A mai előadás Genomátrendeződések biológiai jelentősége Filogenetikai elemzések Genomátrendeződés rákos sejtekben
RészletesebbenNormális eloszlás tesztje
Valószínűség, pontbecslés, konfidenciaintervallum Normális eloszlás tesztje Kolmogorov-Szmirnov vagy Wilk-Shapiro próba. R-funkció: shapiro.test(vektor) balra ferde eloszlás jobbra ferde eloszlás balra
RészletesebbenModell alapú tesztelés mobil környezetben
Modell alapú tesztelés mobil környezetben Micskei Zoltán Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék A terület behatárolása Testing is an activity performed
RészletesebbenOsztott jáva programok automatikus tesztelése. Matkó Imre BBTE, Kolozsvár Informatika szak, IV. Év 2007 január
Osztott jáva programok automatikus tesztelése Matkó Imre BBTE, Kolozsvár Informatika szak, IV. Év 2007 január Osztott alkalmazások Automatikus tesztelés Tesztelés heurisztikus zaj keltés Tesztelés genetikus
RészletesebbenKabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a
Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,
RészletesebbenMinősítéses mérőrendszerek képességvizsgálata
Mnősítéses mérőrendszerek képességvzsgálata Vágó Emese, Dr. Kemény Sándor Budapest Műszak és Gazdaságtudomány Egyetem Kéma és Környezet Folyamatmérnök Tanszék Az előadás vázlata 1. Mnősítéses mérőrendszerek
Részletesebbeny ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell
Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.
RészletesebbenKísérlettervezés alapfogalmak
Kísérlettervezés alapfogalmak Rendszermodellezés Budapest University of Technology and Economics Fault Tolerant Systems Research Group Budapest University of Technology and Economics Department of Measurement
RészletesebbenHasználati alapú és modell alapú tesztelés kombinálása szolgáltatásorientált architektúrák teszteléséhez az ipari gyakorlatban
Használati alapú és modell alapú tesztelés kombinálása szolgáltatásorientált architektúrák teszteléséhez az ipari gyakorlatban Nagy Attila Mátyás 2016.12.07. Áttekintés Bevezetés Megközelítés Pilot tanulmányok
RészletesebbenEgymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?
Egymintás próbák σ s μ m Alapkérdés: A populáció egy adott megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? egymintás t-próba Wilcoxon-féle előjeles
RészletesebbenBiomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision
RészletesebbenWilli Hennig ( )
Objektív módszerek kladisztika Willi Hennig (1913-1976) Grundzüge einer Theorie der Phylogenetischen Systematik (Hennig, 1950). Phylogenetic Systematics (Hennig, 1966) Alapelvei: 1. A fajok közötti kapcsolatok
RészletesebbenAz első számjegyek Benford törvénye
Az első számjegyek Benford törvénye Frank Benford (1883-1948) A General Electric fizikusa Simon Newcomb (1835 1909) asztronómus 1. oldal 2. oldal A híres arizonai csekk sikkasztási eset http://www.aicpa.org/pubs/jofa/may1999/nigrini.htm
RészletesebbenAdatelemzési eljárások az idegrendszer kutatásban Somogyvári Zoltán
Adatelemzési eljárások az idegrendszer kutatásban Somogyvári Zoltán MTA KFKI Részecske és Magfizikai Intézet, Biofizikai osztály Az egy adatsorra (idősorra) is alkalmazható módszerek Példa: Az epileptikus
Részletesebbeny ij = µ + α i + e ij
Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,
RészletesebbenDiszkréten mintavételezett függvények
Diszkréten mintavételezett függvények A függvény (jel) értéke csak rögzített pontokban ismert, de köztes pontokban is meg akarjuk becsülni időben mintavételezett jel pixelekből álló műholdkép rácson futtatott
RészletesebbenMesterséges Intelligencia I.
Mesterséges Intelligencia I. 10. elıadás (2008. november 10.) Készítette: Romhányi Anita (ROANAAT.SZE) - 1 - Statisztikai tanulás (Megfigyelések alapján történı bizonytalan következetésnek tekintjük a
RészletesebbenParametrikus tervezés
2012.03.31. Statikus modell Dinamikus modell Parametrikus tervezés Módosítások a tervezés folyamán Konstrukciós variánsok (termékcsaládok) Parametrikus Modell Parametrikus tervezés Paraméterek (változók
Részletesebben8.3. AZ ASIC TESZTELÉSE
8.3. AZ ASIC ELÉSE Az eddigiekben a terv helyességének vizsgálatára szimulációkat javasoltunk. A VLSI eszközök (közöttük az ASIC) tesztelése egy sokrétűbb feladat. Az ASIC modellezése és a terv vizsgálata
RészletesebbenThe nontrivial extraction of implicit, previously unknown, and potentially useful information from data.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék Adatelemzés intelligens módszerekkel Hullám Gábor Adatelemzés hagyományos megközelítésben I. Megválaszolandó
RészletesebbenProbabilisztikus modellek V: Struktúra tanulás. Nagy Dávid
Probabilisztikus modellek V: Struktúra tanulás Nagy Dávid Statisztikai tanulás az idegrendszerben, 2015 volt szó a normatív megközelítésről ezen belül a probabilisztikus modellekről láttatok példákat az
RészletesebbenA NIMROD SZUPERGÉNCSALÁD EVOLÚCIÓJA
A NIMROD SZUPERGÉNCSALÁD EVOLÚCIÓJA Ph.D. értekezés tézisei Sipos Botond Témavezető: Dr. Pénzes Zsolt Konzulens: Dr. Somogyi Kálmán Szegedi Tudományegyetem Biológia Doktori Iskola MTA Szegedi Biológiai
Részletesebben[Biomatematika 2] Orvosi biometria. Visegrády Balázs
[Biomatematika 2] Orvosi biometria Visegrády Balázs 2016. 03. 27. Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés
Részletesebbennem kezelt 1.29, 1.60, 2.27, 1.31, 1.81, 2.21 kezelt 0.96, 1.14, 1.59
1. feladat Egy szer rákellenes hatását vizsgálták úgy, hogy 9 egér testébe rákos sejteket juttattak be. Közülük 3 véletlenszerűen kiválasztott egérnek kezelésként beadták a vizsgálandó szert, 6-nak pedig
RészletesebbenAz új mértékadó árvízszintek meghatározásának módszertani összegzése
Az új mértékadó árvízszintek meghatározásának módszertani összegzése Szabó János A. HYDROInform Mottó: "The purpose of computation is insight, not numbers" A számítás célja a betekintés, nem számok Richard
RészletesebbenEredmények kiértékelése
Eredmények kiértékelése Nagyméretű adathalmazok kezelése (2010/2011/2) Katus Kristóf, hallgató Budapesti Műszaki és Gazdaságtudományi Egyetem Számítástudományi és Információelméleti Tanszék 2011. március
RészletesebbenKorreláció és lineáris regresszió
Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.
Részletesebbenx, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:
Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Valószínűségi változó általános fogalma: A : R leképezést valószínűségi változónak nevezzük, ha : ( ) x, x R, x rögzített esetén esemény.
RészletesebbenKéprekonstrukció 9. előadás
Képrekonstrukció 9. előadás Balázs Péter Képfeldolgozás és Számítógépes Grafika Tanszék Szegedi Tudományegyetem hv-konvex összefüggő halmazok Mag-burok-szerű rekonstrukció: S. Brunetti, A. Del Lungo, F.
RészletesebbenModern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt
Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Galbács Gábor KIUGRÓ ADATOK KISZŰRÉSE STATISZTIKAI TESZTEKKEL Dixon Q-tesztje Gyakori feladat az analitikai kémiában, hogy kiugrónak
RészletesebbenACM Snake. Orvosi képdiagnosztika 11. előadás első fele
ACM Snake Orvosi képdiagnosztika 11. előadás első fele ACM Snake (ismétlés) A szegmentáló kontúr egy paraméteres görbe: x Zs s X s, Y s,, s A szegmentáció energia funkcionál minimalizálása: E x Eint x
RészletesebbenBAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.
BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. 1 Mérési hibák súlya és szerepe a mérési eredményben A mérési hibák csoportosítása A hiba rendűsége Mérési bizonytalanság Standard és kiterjesztett
RészletesebbenKontrollcsoport-generálási lehetőségek retrospektív egészségügyi vizsgálatokhoz
Kontrollcsoport-generálási lehetőségek retrospektív egészségügyi vizsgálatokhoz Szekér Szabolcs 1, Dr. Fogarassyné dr. Vathy Ágnes 2 1 Pannon Egyetem Rendszer- és Számítástudományi Tanszék, szekersz@gmail.com
RészletesebbenMatematikai statisztika szorgalmi feladatok
Matematikai statisztika szorgalmi feladatok 1. Feltételes várható érték és konvolúció 1. Legyen X és Y független és azonos eloszlású valószín ségi változó véges második momentummal. Mutassuk meg, hogy
Részletesebben[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs
RészletesebbenInferencia. ADOTTAK:! generatív modell: például: DAG + prior(ok) + likelihood(ok) P(X 1,X 2,,X n ) megfigyelések: D = {X i = x i, X j = x j, }
Street1931 Falk1975 Falk1975 Inferencia ADOTTAK:! generatív modell: például: DAG + prior(ok) + likelihood(ok) P(X 1,X 2,,X n ) megfigyelések: D = {X i = x i, X j = x j, }! KISZÁMOLANDÓK:! normalizáció
RészletesebbenTöbb valószínűségi változó együttes eloszlása, korreláció
Tartalomjegzék Előszó... 6 I. Valószínűségelméleti és matematikai statisztikai alapok... 8 1. A szükséges valószínűségelméleti és matematikai statisztikai alapismeretek összefoglalása... 8 1.1. Alapfogalmak...
RészletesebbenMire jó a modellalkotás? Jelenségek megmagyarázásának eszköze.
Modellalkotás Mire jó a modellalkotás? Jelenségek megmagyarázásának eszköze. ok-okozati összefüggések feltárása összefüggések, mintázatok megmagyarázása "miért?" és "hogyan?" kérdések megválaszolása predikció
RészletesebbenLineáris regressziós modellek 1
Lineáris regressziós modellek 1 Ispány Márton és Jeszenszky Péter 2016. szeptember 19. 1 Az ábrák C.M. Bishop: Pattern Recognition and Machine Learning c. könyvéből származnak. Tartalom Bevezető példák
Részletesebben