MOLEKULÁRIS FILOGENETIKAI ELEMZÉSEK EGY DISZKRÉT MATEMATIKAI

Hasonló dokumentumok
Filogenetikai analízis. Törzsfák szerkesztése

MOLEKULÁRIS FILOGENETIKAI ELEMZÉSEK EGY DISZKRÉT MATEMATIKAI

Valószínűségszámítás és statisztika

Gyakorlati bioinformatika

Bakteriális identifikáció 16S rrns gén szekvencia alapján

Az evolúció az adatok mögött

trns-ek identitásvizsgálata új, in silico módszerrel

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Willi Hennig ( )

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Várterész Magda publikációs listája

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Számítógépes döntéstámogatás. Genetikus algoritmusok

Dobzhansky: In Biology nothing makes sense except in the light of Evolution.

Adatok statisztikai értékelésének főbb lehetőségei

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Kvantitatív módszerek

Orvosi Genomtudomány 2014 Medical Genomics Április 8 Május 22 8th April 22nd May

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Miskolci Egyetem GÉPÉSZMÉRNÖKI ÉS INFORMATIKAI KAR. Osztályozási fák, durva halmazok és alkalmazásaik. PhD értekezés

Evolúcióbiológia. Biológus B.Sc tavaszi félév

Etológia Emelt A viselkedés mérése. Miklósi Ádám egyetemi tanár ELTE TTK Etológia Tanszék 2018

FELADATMEGOLDÁSI SZOKÁSAINAK VIZSGÁLATA. Baranyai Tünde

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

A genetikus algoritmus, mint a részletes modell többszempontú és többérdekű "optimálásának" általános és robosztus módszere

Alkalmazott modul: Programozás 4. előadás. Procedurális programozás: iteratív és rekurzív alprogramok. Alprogramok. Alprogramok.

A matematikai feladatok és megoldások konvenciói

A hallgató neve Minta Elemér A NEPTUN kódja αβγδεζ A tantárgy neve Fizika I. vagy Fizika II. A képzés típusa Élelmiszermérnök BSc/Szőlész-borász

R5 kutatási feladatok és várható eredmények. RFID future R Király Roland - Eger, EKF TTK MatInf

2018. február 2. Referált cikkek / Papers in referred proceedings [11], [12].

Természetes szelekció és adaptáció

Hipotézis vizsgálatok

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv

Közösség detektálás gráfokban

Publikációk. Libor Józsefné dr.

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Programozási nyelvek 6. előadás

I. A DIGITÁLIS ÁRAMKÖRÖK ELMÉLETI ALAPJAI

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

A modellellenőrzés érdekes alkalmazása: Tesztgenerálás modellellenőrzővel

Ejtési teszt modellezése a tervezés fázisában

Balogh János gépészmérnök, műszaki menedzser MSc., vezető programkoordinációs szakértő 1

Az éghajlati modellek eredményeinek alkalmazhatósága hatásvizsgálatokban

Előrenéző és paraméter tanuló algoritmusok on-line klaszterezési problémákra

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Emlékeztető az Informatika Doktori Iskola Tanácsának üléséről

Hálózati modellek alkalmazása a molekuláris biológia néhány problémájára. Doktori (PhD) értekezés tézisei. Ágoston Vilmos

Programozási nyelvek a közoktatásban alapfogalmak I. előadás

A Szolvencia II harmadik mennyiségi hatástanulmányának (QIS3) eredményei. Gaálné Kodila Diána március 20.

Modellezés és szimuláció. Szatmári József SZTE Természeti Földrajzi és Geoinformatikai Tanszék

Függetlenségvizsgálat, Illeszkedésvizsgálat

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Bevezetés a programozásba. 5. Előadás: Tömbök

A MODELLALKOTÁS ELVEI ÉS MÓDSZEREI

Mádi-Nagy Gergely * A feladat pontos leírása. Tekintsünk darab tetszõleges eseményt, jelöljük ezeket a következõképpen: ,...,

ICT ÉS BP RENDSZEREK HATÉKONY TELJESÍTMÉNY SZIMULÁCIÓJA DR. MUKA LÁSZLÓ

Genetikus algoritmusok az L- rendszereken alapuló. Werner Ágnes

Molekuláris biológiai módszerek alkalmazása a maláriát okozó paraziták elterjedésének és prevalenciájának vizsgálatában

Matematikai geodéziai számítások 6.

A programozás alapjai előadás. Amiről szólesz: A tárgy címe: A programozás alapjai

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

[Biomatematika 2] Orvosi biometria

MATEMATIKA - STATISZTIKA TANSZÉK

Matematikai geodéziai számítások 6.

Intelligens Rendszerek Elmélete. Párhuzamos keresés genetikus algoritmusokkal

Kísérlettervezés alapfogalmak

Bevezetés az informatikába

Biológiai rendszerek modellellenőrzése bayesi megközelítésben

transzláció DNS RNS Fehérje A fehérjék jelenléte nélkülözhetetlen minden sejt számára: enzimek, szerkezeti fehérjék, transzportfehérjék

Módszertani hozzájárulás a Szegénység

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT

A TANTÁRGY ADATLAPJA

TEXTÚRA ANALÍZIS VIZSGÁLATOK LEHETŐSÉGEI A RADIOLÓGIÁBAN

Matematikai geodéziai számítások 10.

Az adatok értékelése és jelentéskészítés: Az (átfogó) vizsgálati összefoglalás benyújtása

Neme nő Születési dátum 26/10/1988 Állampolgárság magyar

Útjelzések, akadályok felismerése valós időben

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

A maximum likelihood becslésről

műszaki tudomány doktora 1992 Beosztás: stratégiai tanácsadó, tudományos tanácsadó Munkahelyek: Nokia -Hungary kft Veszprémi Egyetem

Biomatematikai Tanszék

Least Squares becslés

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

A Debreceni Egyetem Intézményfejlesztési Terve

Autonóm - és hagyományos közúti járművek alkotta közlekedési rendszerek összehasonlító elemzése

Molnár Levente Farkas

Nagy Gábor compalg.inf.elte.hu/ nagy ősz

Gyalogos elütések szimulációs vizsgálata

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

KÖVETKEZTETŐ STATISZTIKA

Csoport(Cluster) analízis SPSS-el: K-alapú csoport Analízis

Biológia egészségtan Általános iskola 7. osztály

Biomatematika 13. Varianciaanaĺızis (ANOVA)

A XXI. SZÁZADRA BECSÜLT KLIMATIKUS TENDENCIÁK VÁRHATÓ HATÁSA A LEFOLYÁS SZÉLSŐSÉGEIRE A FELSŐ-TISZA VÍZGYŰJTŐJÉN

Kétdimenziós mesterséges festési eljárások. Hatások és alkalmazások

Taxonómiai kutatások jelene és jövője a bagolylepkészetben

Valószínűségi modellellenőrzés Markov döntési folyamatokkal

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

TÁVOKTATÁSI TANANYAGOK FEJLESZTÉSÉNEK MÓDSZERTANI KÉRDÉSEI

Átírás:

Doktori értekezés tézisei MOLEKULÁRIS FILOGENETIKAI ELEMZÉSEK EGY DISZKRÉT MATEMATIKAI MÓDSZER, A BOOLE ANALÍZIS SEGÍTSÉGÉVEL Ari Eszter Dr. Jakó Éena, tudományos főmunkatárs témavezető Dr. Szathmáry Eörs, egyetemi tanár a doktori program vezetője Dr. Erdei Anna, egyetemi tanár a doktori iskola vezetője 2012. Eötvös Loránd Tudományegyetem Biológiai Doktori Iskola Elméleti- és Evolúcióbiológia Doktori Program Genetikai Tanszék, Növényrendszertani, Ökológiai és Elméleti Biológiai Tanszék

BEVEZETÉS A molekuláris filogenetikai módszerek az élőlények leszármazását azok különböző molekuláris adatai, leginkább DNS, RNS és fehérje szekvenciái alapján vizsgálják. Közülük a legismertebbek a távolság alapú Neighbor-Joining (NJ), és a karakter alapú Maximális Parszimónia (MP), Maximum Likelihood (ML) és Bayes statisztikai eljárások, melyeket összefoglaló néven standard módszereknek nevezek. A standard módszerekre jellemző, hogy az evolúció menetét különböző valószínűségi és sztochasztikus modellek próbálják meg rekonstruálni, de a statisztikai alapfeltételezéseknek megfelelően szükségszerűen közös bennük, hogy a szekvenciák egyes pozícióit egymástól független entitásokként kezelik. Ez azt jelenti, hogy egyes pozíciókon található nukleotid vagy aminosav eltéréseket függetlenül elemezve számítják ki a szekvenciák vagy fajok leszármazását tükröző filogenetikai fát. Pedig, ha belegondolunk abba, hogy egy-egy szervezet felépülése és működése szempontjából éppen a nukleotidok és a belőlük átíródó aminosavak sorrendje tartalmazza a legfontosabb információkat, akkor egyetérthetünk abban, hogy a biológiai és kémiai adekvátság szempontjából a szekvencia pozíciókat csak fenntartásokkal kezelhetjük függetlenként. Mindemellett a standard filogenetikai eljárások sok esetben megbízhatóan rekonstruálják a fajok leszármazását, amennyiben a vizsgált szekvenciákban elegendő a filogenetikai jel. Ám vannak esetek, amikor különböző módszerek segítségével, vagy különböző szekvenciákat vizsgálva ellentmondásos eredményeket kapunk. Ilyenkor lehet hasznos egy olyan alternatív eljárás, amely a standard filogenetikai módszerekétől eltérő megközelítést alkalmazva, rekonstruálja a fajok leszármazását. Ez lehetőséget nyújt az eredmények objektív összevetésére és ellenőrzésére, vagyis a kongruencia analízisre. A dolgozatban bemutatott diszkrét matematikai módszer a Boole függvények Iteratív Kanonikus Formáján (ICF; Jakó, 1983) alapul és a Boole analízis vagy BOOL-AN nevet viseli, ugyanúgy, mint az azonos algoritmuson alapuló szoftver is (Jakó et al, 2009). Az algoritmus olyan szerkezeti invariánsokat állít elő a szekvenciákból, melyek alapján az osztályozás egyértelmű, és az eredmények számítástechnikai szempontból reális idő- és memória-igénnyel kiszámíthatók. 1

CÉLKITŰZÉSEK Kutatómunkám fő célja az volt, hogy a biológia területén egyelőre kevéssé ismert új diszkrét matematikai eljárás a Boole analízis molekuláris filogenetikai elemzésekre való alkalmazhatóságát teszteljem. Ahhoz, hogy az ICF alapú BOOL-AN módszert és szoftvert olyan kérdések megválaszolására alkalmazhassuk, melyek a tudomány számára új eredményekkel kecsegtetnek (például ismeretlen vagy vitatott leszármazású fajok vizsgálatára), előbb minden kétséget kizáróan bizonyítani kell, hogy alkalmasak a nukleotid szekvenciák filogenetikai elemzésére. Kutatásaim fő kérdései ezért a következők voltak: A Boole analízis ugyanolyan, vagy eltérő eredményeket szolgáltat-e, mint a standard eljárások? Mennyire megbízható eredményeket szolgáltat a Boole analízis? Milyen szekvenciák és paraméterezés esetén ad a BOOL-AN jobb vagy esetleg kevésbé elfogadható eredményeket, mint a standard filogenetikai módszerek? A fenti kérdések megválaszolásához a tesztelést úgy végeztem, hogy a BOOL-AN-nal kapott fákat egyfelől a standard molekuláris filogenetikai módszerek által produkált fákkal hasonlítottam össze, másrészt az összes eredményt összevetettem valamilyen külső, megbízható forrásól származó hiteles törzsfával. Vizsgáltam a különböző BOOL-AN beállítások és távolság formulák megbízhatóságát. A feladatokat kétféleképpen közelítettem meg: számítógépen evolvált mesterséges szekvenciák segítségével, és általánosan elfogadott, azaz ismert leszármazással rendelkező fajok szekvenciáinak vizsgálatával. 2

MÓDSZEREK A BOOL-AN módszer A BOOL-AN módszer lényeges része a szekvenciák matematikai logikai nyelven való leírása, azaz Boole-kódolása. Az egy szekvenciát leképező bináris sztringek összességét molekuláris kódnak nevezzük (Jakó, 2007; Jakó et al, 2009; 1. ábra b). Az ICF-et előállító algoritmus egy dekompozíciós átalakító eljárás, ami a Boolefüggvények kanonikus normál formában való megadását iteratív lépések sorozatával éri el. Ez a kanonikus forma lehetővé teszi a szekvenciában rejlő információ egyértelmű és viszonylag tömör leírását, ezért molekuláris deszkriptornak is tekinthető (Jakó, 2007). Az ICF kiszámításához a bemeneti Boole-függvényt rendezni kell egy n dimenziós térben. Majd az ICF olyan formába transzformálja a vizsgált szekvenciát, mely feltárja a szekvencia kulcspozícióit, amiből az eredeti szekvencia egyértelműen és információveszteség nélkül visszaállítható (1. ábra c). Az ICF algoritmus segítségével kapott molekuláris deszkriptorok ICF gráf formában is ábrázolhatóak (1. ábra e). A gráfok topológiája tükrözi az elsődleges szerkezetek jellegzetességeit és a szerkezetváltozások (mutációk) pozíciótól függő hatását. Ezért az evolúciósan (vagy funkcionálisan) rokon szekvenciákból képzett ICF gráfok topológiája hasonló, ami a köztük lévő távolságok alapján is kimutatható (Jakó et al, 2009; Ari et al, 2012). 1. ábra: A BOOL-AN eljárás fő lépései, és az eredmények megjelenítése a: Szekvenciák illesztése. b: Szekvenciák kódolása molekuláris kóddal. c: ICF számítás. d: Távolság számítás az ICF eredményekből. e: ICF gráf. f: Törzsfa készítés. g: Ponttérkép számítás. Átdolgozott ábra, eredetijének forrása: Jakó et al, 2009. 3

A kiindulási adataink ICF átalakítás utáni osztályozásának kézenfekvő módja, hogy az ICF eredmények között páronként távolságot számolunk (1. ábra d), majd a távolságok alapján Neighbor-Joining módszerrel kalkuláljuk ki az osztályozáshoz szükséges fát (f), vagy ordináció segítségével a ponttérképet (g). A távolságszámításnak többféle módja lehetséges. Segítségül hívhatunk jól ismert formulákat, mint az Euklideszi és a Jaccard távolság, illetve használhatunk olyat, amely hatékonyan alkalmazkodik az ICF tulajdonságaihoz, mint a BOOL-AN módszer- és szoftverben bevezetett egyesített ICF gráf távolság, (IGT; Jakó et al, 2009; Jakó et al, 2012). A BOOL-AN, mint filogenetikai módszer tesztelése A BOOL-AN és a standard filogenetikai módszerek megbízhatóságának vizsgálatát kétféle megközelítés szerint végeztem. Az egyik tesztpéldában mesterségesen evolváltatott, ú.n. szimulált DNS szekvenciák sokasága alapján rekonstruáltam a filogenetikai fákat (Ari et al, 2012). Majd a kapott fákat összehasonlítottam a szimuláció alapjául szolgáló vezérfák topológiájával. Kutatásaim során négy különböző szempont szerint szimuláltam a mesterséges szekvenciákat. A szimulációt minden beállítással százszor megismételtem. 1. szimuláció: A vizsgált taxonok számának a különböző filogenetikai módszerekre gyakorolt hatását kívántam vizsgálni, ezért hat különböző méretű (5, 10, 20, 50, 100 és 500 taxonnal) rendelkező vezérfát alkalmaztam. 2. szimuláció: Azt kívántam vizsgálni, hogy milyen hatással van a filogenetikai rekonstrukcióra az elemzett szekvenciák hossza, ezért 30, 50, 80, 100, 200, 500, 1000 és 5000 nukleotid hosszú szekvenciákat szimuláltam. 3. szimuláció: A vezérfák eltérő ághosszainak hatását kívántam vizsgálni, ezért hat eltérő ághossz tulajdonságokkal rendelkező, de azonos topológiájú vezérfát hoztam létre. 4. szimuláció: Azt kívántam vizsgálni, hogy milyen hatással van a filogenetikai rekonstrukcióra, ha különböző nukleotid szubsztitúciós modelleket és modell paramétereket alkalmazok, ezért összesen nyolc eltérő szimulációs beállítást alkalmaztam. A második tesztpéldában természetes, biológiai funkcióval rendelkező szekvenciákat, a nagy emberszabású majmok mitokondriális transzfer RNS (mt-trns) génjeit elemeztem. A sok erre irányuló kutatásnak köszönhetően a nagy emberszabású majmok leszármazása mára tisztázottnak tekinthető, ezért lehetségessé vált, hogy a különböző filogenetikai 4

módszerek alapján kapott fákat ehhez az ismert törzsfához hasonlítsuk (Ari et al, 2008; Ari et al, 2012). A kapott eredményeket a Robinson-Foulds fatávolság (RF) segítségével egyenként összehasonlítottam a szimulált szekvenciák vezérfáival és a nagy emberszabású majmok ismert leszármazásával. Illetve típusonként és filogenetikai módszerenként konszenzus fákat hoztam létre, és vizsgáltam azok ág-támogatottsági értékeit (Ari et al, 2012). E két mérőszám alapján megállapítható volt, hogy melyik filogenetikai módszer milyen eredményesen rekonstruálta a filogenetikai fákat. EREDMÉNYEK Az alkalmazott mérőszámok (RF és ág-támogatottsági érték) alapján az egyes filogenetikai módszerek és beállítások megbízhatósága megkülönböztethető volt. A többféle BOOL-AN beállítás és távolság formula tesztelésének eredménye alapján az egyesített ICF gráf távolsággal (IGT) készített BOOL-AN fák a legmegbízhatóbbak. 1. táblázat: A szimulációs tesztek megbízhatósági értékeinek átlag a (1) Taxon-szám (2) Szekvencia hossz Változó Megbízhatósági érték BOOL-AN MP NJ ML Átlagos RF távolság osztva a taxon-számmal Átlagos ágtámogatottsági érték 1,2429 1,2687 1,2779 2,2087 78,2325 77,165 71,6963 62,465 Átlagos RF távolság 3,0475 3,4288 3,9625 5,255 (3) Vezérfa ághossz (4) Szubsztitúciós modell Átlagos ágtámogatottsági érték 47,881 49,846 45,7381 38,119 Átlagos RF távolság 6,5733 6,6885 7,3133 8,43 Átlagos ágtámogatottsági érték 73,3393 73,4857 44,1964 53,9643 Átlagos RF távolság 3,6675 3,6519 7,71 6,37 Átlagos ág-támogatottsági érték: annál megbízhatóbb a filogenetikai módszer, minél nagyobb (max. 100) az értéke. Átlagos RF távolság: annál megbízhatóbb a filogenetikai módszer, minél kisebb az értéke. A legjobb értékek aláhúzással, a legrosszabbak dőlt betűvel vannak megjelölve. 5

A szimulációs tesztek megbízhatósági értékeinek átlagát az 1. táblázatban foglaltam össze, melyből látszik, hogy a legtöbb szimulációs esetben a BOOL-AN IGT fa bizonyult a leginkább megbízható filogenetikai módszernek. A 3. és 4. szimulációs teszt esetében viszont a Maximális Parszimónia módszer megközelítette vagy túl is szárnyalta a BOOL- AN eredményeit. Az elvégzett szimulációs tesztek alapján összességében a Maximum Likelihood eljárással kaptam a legkevésbé megbízható fákat. 2. ábra: A nagy emberszabásúak elfogadott törzsfája és a mt-trns-ek alapján számított fák a: A nagy emberszabású majmok széles körben elfogadott leszármazási viszonyai. A majmok 22 mt-trns szekvenciából különböző módszerekkel készült fák konszenzusai: b: BOOL-AN és Bayes fa; c: Maximális Parszimónia fa; d: Maximum Likelihood fa; e: távolság alapú Neighbor- Joining fa. Az ábra eredetijének forrása: Ari et al, 2012. Annak ellenére, hogy a mt-trns specificitásonként létrehozott kiindulási fák topológiája egyenként többnyire nem teljesen egyezett meg a nagy emberszabásúak elfogadott törzsfájával, a konszenzus fák az összes alkalmazott BOOL-AN beállítás mellett 6

(2. ábra) a helyes elágazásrendszert jelenítették meg, csakúgy, mint a Bayes statisztikai eljárással előállított fák konszenzusa (5.4. ábra). Ellenben a Maximális Parszimónia, a Maximum Likelihood és a távolság alapú Neighbor-Joining konszenzus fák elágazásrendszere eltért az ismert leszármazásétól. KÖVETKEZTETÉSEK A standard filogenetikai módszerekkel ellentétben, a diszkrét matematikai BOOL-AN módszer alkalmazásához nem szükséges kiindulási evolúciós hipotézis, illetve ennek megfelelő modell (szubsztitúciós modell). A BOOL-AN végeredmény szempontjából viszont lényeges, hogy egy-egy nukleotid milyen pozícióban található a vizsgált szekvenciában. Így a BOOL-AN fák számításakor azt a plusz információt is ki tudjuk használni, hogy a fajok közötti szekvencia-különbség pontosan hol található a génben, a genomban vagy a fehérjében. Ilyen formán a szekvencia elsődleges szerkezetének figyelembevételével és információveszteség nélküli formális átalakításával az osztályozás tekintetében is többlet információhoz jutunk. Ezáltal lehetővé válik az olyan viszonylag rövid és nagyon hasonló szekvenciák osztályozása, melyek a hagyományos filogenetikai módszerek számára nem tartalmaznak elegendő filogenetikai jelet (pl. trns, mt-trns, 5sRNS, stb.) A szimulált szekvenciák és természetes gének alapján végzett filogenetikai tesztelések eredményei azt mutatják, hogy a standard módszerekétől teljesen különböző, diszkrét matematikai alapokon nyugvó Boole analízis alkalmas eszköze lehet az élőlények leszármazástani vizsgálatának. A BOOL-AN módszer különösen jó megoldásokat adott a viszonylag rövid szekvenciák elemzésekor, és jól kezelte a nagy emberszabású majmok nagyon hasonló mitokondriális trns-eit is. A BOOL-AN módszer és szoftver további előnye, hogy segítségükkel a karakter alapú standard filogenetikai eljárásokhoz képest lényegesen rövidebb idő alatt kiszámíthatóak a vizsgát szekvenciák leszármazási viszonyai, ezért eredményesen alkalmazhatóak olyan, nagy számításigényű kalkulációk elvégzésére, mint pl. a Tree of Life projektek, ahol sok ezer faj leszármazását vizsgálják egyidejűleg. 7

IRODALOMJEGYZÉK Ari E, Ittzés P, Podani J, Le Thi QC & Jakó É (2012) Comparison of Boolean analysis and standard phylogenetic methods using artificially evolved and natural mt-trna sequences from great apes. Molecular Phylogenetics and Evolution 63: 193 202. Ari E, Ittzés P, Podani J & Jakó É (2008) Phylogenetic Tree Reconstruction with a New Discrete Mathematical Method. Kitaibelia 13: 209 211. (In Hungarian). Jakó É (1983) Iterative canonical decomposition of Boolean functions and its application to logical circuits design. PhD. értekezés. Műszaki Egyetem (MEI), Moszkva; Honosítása (1985) A Boole-függvények kanonikus dekompozíciója és alkalmazása logikai tervezésnél. Budapesti Műszaki Egyetem, Budapest, Magyarország. Jakó É (2007) Generalized Boolean descriptors for biological macromolecules. Proceedings of American Institute of Physics (AIP): 552 557. Jakó É, Ari E, Ittzés P, Horváth A & Podani J (2009) BOOL-AN: A method for comparative sequence analysis and phylogenetic reconstruction. Molecular Phylogenetics and Evolution 52: 887 897. Jakó É, Kézdi N & Pásztor Varga K (2012) Neighborhood principle driven ICF algorithm and graph distance calculations. 9 th Joint Conference on Mathematics and Computer Science, Siófok, Hungary, Annales Universitatis Scientiarum Budapestinensis de Rolando Eötvös Nominatae Sectio Computatorica (ISSN: 0138-9491). (Accepted). 8