Antoni Györgyi Bagoly Zsolt, Dr. Bai Katalin Boglárka Bencsik Attila Benczúr András, Dr. Baross Gábor Zsolt Burcsi Péter Csabai István, Dr. Csíkos Péter, Dr. Czakó Ferenc Czirók András, Dr. Darvas Ferenc, Dr. Derényi Imre, Dr. Dombai Balázs Erdei Anna, Dr. Ézsiás Béla Faragóné Farkas Illés, Dr. Frei Zsolt, Dr. Horváth Alexandra Szombathelyi Katalin Horváth Arnold Ittzés Péter, Dr. Jakó Éena, Dr. Jelencsics Mikolt Jelinek Balázs Jokán Anita Juhász Gábor, Dr. Kiss Péter Kolozsvári Mária Kovács Attila, Dr.
Misszió Az ELTE Regionális Egyetemi Tudásközpont egy olyan kutatásszervezési és -menedzselési egység, mely az Eötvös Loránd Tudományegyetem, mint kutatóegyetem új kutatás-fejlesztési koncepciója alapján az egész ELTE-n meglevõ tudásbázist felhasználva és kibõvítve a magas szellemi hozzáadott értéket képviselõ kutatás-fejlesztési projektek megvalósítására felállítja a szükséges teameket, megszervezi és felügyeli munkájukat. Tevékenységét változatos együttmûködési formákat kínálva, ipari partnerekkel közösen, külsõ források igénybevételével végzi, és a megszerzett tudást visszacsatolja az oktatásba, valamint segíti az új egyetemi szemléletmód kialakítását.
Tartalomjegyzék Vezetõi összefoglaló................................................... 6 Felépítés és menedzsment.............................................. 8 Ipari partnerek........................................................ 9 Kutatási programok beszámolói....................................... 12 2. PROGRAM: BIOINFORMATIKA.............................................. 13 2.1 Biomimetikus neuronális hálózatok evolúciója......................... 14 2.2 Molekuláris kölcsönhatás ujjlenyomata.............................. 15 2.3 Genom-annotáció............................................. 16 2.4 Makromolekulák összehasonlító analízise és in silico tervezése............. 17 2.5 Phylogeny-cafe és Genomatics.................................... 18 3. PROGRAM: HÁLÓZATI INFORMATIKA......................................... 19 3.1 Statisztikai módszerek........................................... 20 3.2 Szoftvergráfok................................................ 21 3.3 Hálózatok dinamikája........................................... 22 3.4 Hibaterjedés hálózatokon........................................ 23 4. PROGRAM: VIRTUÁLIS OBSZERVATÓRIUM..................................... 24 4.1 Virtuális obszervatórium......................................... 25 4.2 Virtuális obszervatórium fejlesztése.................................. 26 4.3 Vizualizációs centrum........................................... 27 6. PROGRAM: A SEJTKOMMUNIKÁCIÓ INTERPRETÁCIÓJA ÉS MEGFIGYELÉSE A KOMPLEX RENDSZEREK VIZSGÁLATÁBAN HASZNÁLT MÓDSZEREK ALKALMAZÁSÁVAL................. 28 6.1 Videomikroszkópiás berendezés, szoftver és eljárás fejlesztése.............. 29 6.2 Sejtkölcsönhatások megfigyelése videomikroszkópiával................... 30 6.4 Fehérje kölcsönhatások és szignálhálózatok bioinformatikai vizsgálata........ 31 4 7. PROGRAM: SEJTKOMMUNIKÁCIÓ KUTATÁS GYAKORI AUTOIMMUN ÉS DEPRESSZIÓS BETEGSÉGEKBEN ÚJ, RENDSZERBIOLÓGIAI MEGKÖZELÍTÉSSEL: ÚJ TERÁPIÁS CÉLPONTOK AZONOSÍTÁSA ÉS TECHNOLÓGIÁK FEJLESZTÉSE DIAGNOSZTIKAI CÉLOKRA................. 31 7.1 Jelátviteli terápiás célpontok azonosítás komplex jelátviteli rendszerekben, sejthalált moduláló molekulák tervezése.............................. 33 7.2 Diagnosztikai eljárások fejlesztése autoimmun kórképekben............... 34 7.3 A depresszió és az immunrendszer kapcsolatának immunológiai terhelések neurológiai funkciókra illetve antidepresszánsok immunsejtekre gyakorolt hatásának proteomikai vizsgálata.................................. 35 7.4 Új neuro-immun kommunikáció vizsgálatára alkalmas fehérjeszeparációs és mikroszkópiás technológiák fejlesztése............................. 36 8. PROGRAM: ÚJ TÍPUSÚ PEPTIDSZINTETIZÁLÓ MÓDSZER FEJLESZTÉSE................... 37
Oktatási és képzési program.......................................... 39 Technológiatranszfer.................................................. 40 Együttmûködés az ipari partnerekkel.................................. 41 Résztvevõk........................................................... 42 Publikációk.......................................................... 44 Nyilvános megjelenés................................................. 47 Teljesítményindikátorok............................................... 48 Finanszírozás......................................................... 49 Rövidítések.......................................................... 50 5
Vezetõi összefoglaló 6 2007-ben az Eötvös Loránd Tudományegyetem Tudásközpontja újabb Konzorciummal bõvült. Az eddigi, a 2005 óta mûködõ escience RET amelynek tagjai az ELTE-n kívül a Delta Elektronik Zrt., az econet.hu Nyrt. és a MultiRáció Kft. mellé az idén a CellKom RET is megalakult az ELTE, a Magyar Tudományos Akadémia Támogatott Kutatóhelyek Irodája, a ThalesNano ZRt., a Diagnosticum Zrt., a Bio-Science Kft., valamint a SuperTech Kft. részvételével. A két Konzorcium egymással is együttmûködik: közös Tudományos Tanácsot hoztak létre, és közös projekteket is indítottak biológiai adatok high throughput elemzésére. Az ELTE RET teljes költségkerete a teljes idõtartamra összesen 1 500 millió forint, amelybõl 1100 millió forintot az NKTH biztosít, a további 400 millió forint a konzorciumok által vállalt önrész. A Tudásközpont fõ feladata, hogy az ELTE-n meglévõ tudásbázis alapján, a gyakorlati hasznosulás figyelembevételével kutatás-fejlesztési feladatokat végezzen, akár külsõ megrendelésre, akár partneri alapon, együttes fejlesztés keretében, illetve tanulmányokat készítsen meghatározott célra, vagy tanfolyamokat tartson kompetenciája területén. Az escience RET célja, hogy összekapcsoljon jelenleg külön kutató tudományterületeket, úgymint biológiát, fizikát, matematikát, valamint informatikát, és ezáltal az említett négy tudományterület eszközeit, módszereit ötvözve új kohéziót hozzon létre. A CellKom RET célja, hogy életminõség javítását célzó, fehérje-hálózatok vizsgálatán alapuló, sejtbiológiai kutatás-fejlesztés gazdasági hasznosítását elõsegítõ kutatási-fejlesztési, illetve képzési szolgáltató centrumot állítson fel az ELTE-n. Az Eötvös Loránd Tudományegyetemen rendelkezésre áll mind a szükséges informatikai, mind a természettudományi háttértudás, amely sikeressé teheti a tervezett projekteket. Az ország egyik legnagyobb egyeteme számos, a nemzetközi élvonalba tartozó kutatóval rendelkezik, amely biztosítja a szükséges tömegû szakember összehozását egy Tudásközpontban. 2007. szeptember 30-án a Tudásközpont egyik munkatársa, Dr. Lovász László akadémikus átvehette a Bolyai-díjat. A Tudásközpont tevékenysége jelenleg 6 program köré csoportosul: a bioinformatika, a hálózati informatika, a virtuális obszervatórium, a sejtkommunikáció interpretációja, a rendszerbiológia eredményeinek alkalmazása depressziós és autoimmun betegségekben, valamint egy új típusú peptidszintetizáló kifejlesztése. A bioinformatika program meglevõ kísérleti eredmények adatbányászati értelmezését kutatja, és a fejlett statisztikai módszerek alapján olyan várható tulajdonságokat jelez elõre, melyek alkalmazásával csökkenteni lehet a gyógyszerfejlesztés költségét, kijelölni a gyógyszerkutatás ígéretes irányait. A program sikeresen halad, már létrejöttek az elemzõ szoftverek prototípusai, beindult két egyelõre publikus szolgáltatás, és szabadalmi bejelentések is születtek. A hálózati informatika program adatbányászati módszereket fejleszt és alkalmazza azokat a gazdaság számos területén. Az idén megkezdõdött a munkaügyi adatfeldolgozás adaptációja európai országokra, megvalósult a szoftverelemzés egy multinacionális vállalat eszközén, sikeresen teszteltek új predikciós módszereket DVD kölcsönzési adatbázisokon, illetve megtörtént egy árambeszerzés optimalizáló program kifejlesztése külsõ megrendelésre. A virtuális obszervatórium program a nagyméretû, komplex adatfeldolgozás technológiáját fejleszti, melynek révén terrabyte-os adathalmazok elemzése valósul meg. Az idén felépült egy neuro-immun szakirodalmi adatbázis webes interpretációja, saját hardver- és szoftverfejlesztések révén beindult a Vizualizációs Centrum, és létrejött egy olyan köztes szoftverrendszer, amely az összegyûjtött tudományos adatokon elvégzendõ intenzív adatbányászati feladatokat hatékonyan szétosztja, és végrehajtja. A sejtkommunikáció interpretációja program a sejtek közötti kommunikációt vizsgálja a komplex rendszerek módszereivel. A kutatás során kifejlesztettünk egy mikromanipulátoros eszközt az automatikus mérések elvégzéséhez, háromdimenziós gél deformációinak automatikus kiértékeléséhez optima-
lizáltunk egy saját algoritmust, és egy a gyógyszerkutatásban közvetlenül hasznosítható keresõ algoritmust, továbbá feltérképeztünk humán fehérje-fehérje pár jelátviteli kölcsönhatásokat. A rendszerbiológia eredményeinek alkalmazása depressziós és autoimmun betegségekben program a gyakori autoimmun és depressziós betegségek hatásmechanizmusának feltérképezésére, korai diagnosztizálására és hatékonyabb terápiás beavatkozások kidolgozására alakult. Az elsõ évben kidolgozásra került egy szabadalmaztatott protein-chip technológia az ellenanyagok mûködésének meghatározására. Az új típusú peptidszintetizáló kifejlesztése program az elsõ évben szilárd fázisú peptidszintézis megvalósítására két reaktort fejlesztett ki, melyek már termékként is megjelennek. Az ELTE RET fõ feladatának tekinti, hogy kutatási eredményeinek kézzelfogható gyakorlati haszna is legyen a gazdaság és a társadalom számára. Az eddig eltelt idõszakban az ELTE Regionális Egyetemi Tudásközpont a tudományos tevékenység mellett a késõbbi eredmények megalapozására és a megfelelõ kutatási feltételek megteremtésére helyezte a hangsúlyt, kialakítva a késõbbi stabil mûködést megalapozó struktúrát. Az elért eredmények hasznosítását az ELTE Tudás- és Technológiatranszfer Iroda végzi, feltérképezve a folyó kutatási projekteket, majd számukra potenciális ipari partnereket felkutatva. A Technológiatranszfer Iroda nem csak az eredmények hasznosítására koncentrál, hanem kezdeményezõleg lép fel új partnerek bevonására a kutatás-fejlesztésbe. Az Iroda végzi ezen felül a marketingkommunikációs tevékenységet is annak érdekében, hogy megismertesse az ELTE RET mûködését és eredményeit a lehetséges partnerekkel és a nagyközönséggel. A Tudásközpont céljai között szerepel tevékenységi körének kibõvítése, a különbözõ tudományterületek nagy volumenû kutatásainak menedzselése. Ezáltal a pénzügyi és adminisztratív folyamatok egyszerûbbé és átláthatóbbá válnak, a kutatók pedig kizárólag a szakmai tevékenységükre koncentrálhatnak. A Tudásközpont az idén már számos hazai és nemzetközi pályázaton vett részt. További információ: www.escience.elte.hu Dr. Papp Gábor igazgató 7
Felépítés és menedzsment FB escience KT CellKom KT TTTI Igazgató TT ELTE oktatás Elnökök Programigazgatók Irodavezetõ Ipari partnerek Projektvezetõk Dr. BENCZÚR András escience elnök Dr. ERDEI Anna CellKom elnök Dr. PAPP Gábor igazgató JELENCSICS Mikolt irodavezetõ KOLOZSVÁRI Mária pénzügyi vezetõ 8 NÉV CÉG IDÕ (%) SZEREP Dr. Papp Gábor ELTE 100% Igazgató Dr. Benczúr András ELTE 25% escience elnök Dr. Erdei Anna ELTE 10% CellKom elnök, 7. programigazgató Jelencsics Mikolt ELTE 100% Irodavezetõ Kolozsvári Mária ELTE 25% Pénzügyi vezetõ Antoni Györgyi ELTE 32% TTI vezetõ Dr. Banai Miklós MultiRáció 5% KT, TT Bencsik Attila Econet 5% KT, TT Czakó Ferenc Delta 5% KT, TT Dr. Darvas Ferenc Thales 7% KT, TT, 8. programigazgató Dr. Kéri György MTA TKI 5% KT, TT Dr. Niedetzky Csaba SuperTech 5% KT, TT Péterfy Ferenc Diagnosticum 5% KT, TT Tátrai Ágnes Bio-Science 5% KT, TT Dr. Horváth Zoltán ELTE 2% TT Dr. Szõnyi Tamás ELTE 2% TT Dr. Jánosi Imre ELTE 2% KT Dr. Gonda János ELTE 2% KT Dr. Szathmáry Eörs ELTE 5% 2. programigazgató Dr. Vattay Gábor ELTE 5% 3. programigazgató Dr. Csabai István ELTE 5% 4. programigazgató Dr. Vicsek Tamás ELTE 5% 6. programigazgató
Ipari partnerek Delta Elektronik ZRt. A Delta Elektronik Kft. 1987-ben alakult független, innovatív, magyar tulajdonban álló középvállalkozás, a hazai IT ipar meghatározó szereplõje, 2007-ben alakult ált ZRt-vé Üzletágai egyben tudáskompetencia központok is. Másfél évtized alatt folyamatosan növelve a hozzáadott értéket és az eredetiérték-teremtõ képességét 2004-ben létrehozta a Delta Research Centert (DrC, ejtsd Doktor C ). K+F tevékenységünk során a felsõoktatás és a kutatóintézetek kutatóival együttmûködve jelentõs, technikai-technológia áttörés ígéretét hordozó témákra koncentrálunk. Ezek ugyan témájuk szerint különböznek (élettudomány, anyagtudomány, környezetvédelem), azonban mind molekulák specifikus képességein, viselkedésén alapul. Kutatóinknak jelentõs kutatási tapasztalata van, tudományos fokozatuk a predoktortól a tudományok doktora fokozatig terjed. Számos publikáció és szabadalom fûzõdik nevükhöz. Mérnökeink sok éves elektronikai fejlesztõi gyakorlattal rendelkeznek adatkommunikációs és átviteltechnika, ipari automatizálás, mikroszámítógépes folyamatirányítás, mérés-automatizálás, egészségügyi diagnosztika, jármûdiagnosztika és biztonságtechnika területén. Fejlesztõink nevéhez több bejegyzett szabadalom is kötõdik a fenti területekhez kapcsolódóan. Szoftverfejlesztõink magasan képzett, felsõfokú végzettséggel és idegennyelv-ismerettel rendelkezõ szakemberek; fejlesztõink többsége OCP, JCP, MCP, MCSE és MCSD nemzetközi minõsítéssel rendelkezik. Egyedi, eredeti értéket képviselõ szoftvereket alkotunk a környezetvédelem, hírközlés, és gazdaságirányítás területén. econet.hu Nyrt. Az econet.hu Informatikai Nyrt. jogelõdjét, az Eco.Net Hungary Kft.-t 1996 végén alapította három, a gazdasági hír- és adatszolgáltatás, illetve a számítástechnikai szolgáltatások körében jártas szakember. A társaság kezdetben on-line pénzügyi információ-szolgáltatással, pénzügyi és tõzsdei adatbázisok létrehozásával, illetve harmadik féltõl származó adattartalmak forgalmazásával foglalkozott. A társaság az alapítást követõen gyors ütemben fejlõdött és a hazai internetes ipar képviselõi közül elsõként lépett a Budapesti Értéktõzsde parkettjére, 2000. december elsején.. Az adat- és tartalomszolgáltatást is magába foglaló tartalom-menedzsmenten túl valamennyi, a korszerû webes jelenléthez szükséges feladatot is ellátunk (igényfelmérés, stratégiai tervezés, rendszertervezés, design, adatbázis-tervezés és -karbantartás, egyéb webes alkalmazások - irodai és ügyviteli alkalmazások, projektmenedzsment, CRM, B2B, B2C alkalmazások -, nagy biztonságú üzemeltetés, web-, illetve szerverhosting, hirdetés menedzsment, on-line kommunikációs stratégia), így ügyfelei kulcsrakész megoldást kaphatnak. Az elmúlt évek folyamán ügyfeleink igényéket kielégítésére a klaszter technológia fejlesztését végezzük partnereinkkel közösen. MultiRáció Kft. A társaságot magánszemélyek hozták létre 1992-ben pénzügyi, gazdaságinformatikai elemzõ rendszerek adaptálására, tervezésére, fejlesztésére és üzemeltetésére. A cég az elemzõ rendszereken túl olyan feladatok, problémák megoldását is képes elvégezni, amelyek speciális ismereteket, például különleges informatikai, pénzügyi-számviteli vagy akár matematikai, statisztikai felkészültséget, ismeretet igényelnek. A társaság rugalmasan, feladatorientáltan mûködik. A kistérségi gazdasági aktivitási adatok évközi (havi, negyedéves) elõállítására társaságunk fejlesztette ki egy világbanki program keretében az un. Kisterületi Munkanélküliségi Statisztikai Rendszert (KMSR). Ez a KSH Munkaerõ Felvételének adatait külsõ információk bevonásával, modell alapú becslés és strukturált idõsor elemzõ módszer kombinált alkalmazásával pontosítja, készít megbízható adatokat. A KMSR az USAban alkalmazott módszertant valósítja meg Magyarországon, Európában is még egyedülálló módon. 9
MTA TKI Az MTA Támogatott Kutatóhelyek Irodáját a Magyar Tudományos Akadémia az 1995. évi közgyûlésén elfogadott határozattal alapította. A Magyar Tudományos Akadémia támogatásának célja a felsõfokú oktatási intézményekben, közgyûjteményekben és egyéb nem akadémiai költségvetési kutatóhelyeken kiemelkedõ kutatási eredményeket elérõ tudományos iskolák kialakításának, mûködésének és kutatói utánpótlásának elõsegítése. Az MTA további célja a kutatóintézeti hálózata és az egyetemek közötti kapcsolatok erõsítése, a kutatóintézeti hálózatban hiányzó vagy az ottani profilt kiegészítõ, és a magyar tudományosságban újdonságot jelentõ témák mûvelése, minden tudományágban, elsõsorban az alapkutatások területén. A Tudásközpontban a MTA három kutatócsoportja, az MTA-ELTE Immunológiai Kutatócsoport, az MTA-SE Peptidbiokémiai Kutatócsoport és az MTA-ELTE Biológiai Fizika Kutatócsoport vesz részt. ThalesNano Zrt. A ThalesNano Nanotechnológia Zrt. 2002-ben alakult a ComGenex Rt. (ma: AMRI Hungary Zrt.) spin-off cégeként. A vállalkozás legfõbb tevékenységei: alapkutatás, alkalmazott kutatás, termékfejlesztés a szerves kémia és a mikro-, ill. nanotechnológia határterületén. Vállalatunk innovatív mérnökei és kutatói több szabadalommal védett készüléket, eljárást fejlesztettek miniatürizált kémiai, biokémiai és biológiai folyamatok területén. A ThalesNano Nanotechnológiai Zrt. profilja a fenti technológiák valamint a nagy-áteresztõképességû biológiai szûrés és a kombinatorikus kémia kombinálásának eredményeképp illetve ezen technológiák mellett a mikroelektronika és vezérléstechnika alkalmazásával az ipari kutatásban és fejlesztésben, elsõsorban a kémiai és gyógyszeripari K+Fben új technológiákat és termékeket dolgoz ki. A ThalesNano technológia-intenzív vállalkozás, mely saját K+F tevékenységére alapozza eredményeit, amelyeket közvetlenül visszaforgatva valósítja meg céljait, újabb és újabb innovációs törekvéseit. Diagnosticum Zrt. A Diagnosticumot 1989 novemberében alapították Budapesten. Kezdettõl fogva a cég profilja az orvosi laboratóriumi diagnosztikumok fejlesztése és gyártása, a laboratóriumi reagensek, készülékek és eszközök forgalmazása és szervize. A cég 1993-ban megemelte alaptõkéjét és leányvállalatot alakított Romániában, mely a Diachem diagnosztikai készítményeket gyártja. A fõ tevékenységek közé tartozik továbbá nemzetközi gyártók készítményeinek hazai forgalmazása, készülékek, laboratóriumi eszközök és fogyóanyagok disztribúciója és szervize, valamint termékfejlesztés. A Diagnosticum a hazai vállalatok közül elõször lépte át az évi USD 20 M forgalmat az in vitro diagnosztikai készítményekben. A Diagnosticum K+F részlege fejlesztett ki számos, hazai és nemzetközi piacra bevezetett terméket: Allen-G, Allen-E allergia tesztek, ttg-test, GliaTest a cöliákia diagnózisához, MyGa Test, My-Sy Test állatgyógyászati alkalmazásra. 10 b Bio-Science Kft. A Bio-Science Kft. a molekuláris biológiai kutatómunkában, illetve a molekuláris diagnosztikában használatos mûszereket, valamint reagenseket forgalmazásával foglalkozik. Filozófiánk, hogy kereskedelmi tevékenységünket nem BIO-SCIENCE csupán egyszerû árueladásnak tekintjük, hanem az értékesítési folyamat során igyekszünk termékeinkhez kapcsolódva komplex szolgáltatást nyújtani. Kollegáink szakmai felkészültsége lehetõvé teszi a legújabb módszerek, technológiák magyarországi elterjesztését, aktív résztvevõivé válva így a tudás-technológia transzfernek.
Megalakulásunk óta (1997) támogatjuk a magyarországi tudósok eredményes munkáját.: több, fiatal, tehetséges kutatót segítettünk hozzá amerikai ösztöndíj elnyeréséhez, évente kétszer írjuk ki a, fiatal kutatók, illetve orvosok számára a Bio-Science díj -at is mutatja. 2003-tól a középiskolásoknak meghirdetett tehetséggondozó nyári programot, a BioGén tábort indítottuk útjára, melyet 2004-tõl a Semmelweis Egyetemmel karöltve közösen szervezünk. Az évente megrendezett egyhetes tudóstábor, elméleti és laborgyakorlati oktatást nyújt a molekuláris biológia iránt érdeklõdõknek. - megismerteti a diákokat a genetika rejtelmeivel, a legújabb eredményekkel, valamint azok gyógyászati, etikai és jogi konzekvenciáival. SuperTech Kft. Az 1991-ben alakult SUPERTECH Kft. német-magyar tulajdonú nemzetközi vállalkozás, magyar cégként szorosan együttmûködik a nürnbergi anyacéggel. 1996-ban nyitottuk meg svájci képviseletünket Wetzikonban (Zürich külvárosa). A SUPERTECH Kft. a gazdaság különbözõ területein fejti ki tevékenységét magas szintû technológiák használatával az európai normákban megszabott követelményeknek megfelelõen. Tevékenységeink között szerepel az Egészségközpont nevû, komplex egészségügyi ellátást nyújtó intézmény, Professzionális minõségû személyi számítógépek építése különleges specifikációkra, precíziós finommechanikai kísérleti fejlesztés, Speciális elektronikus mérõkészülékek és számítógép vezérlésû mérésadatgyûjtõ berendezések tervezése és gyártása, Intelligens, programozható, PC-alapú komplett mérésadatgyûjtõ rendszerek fejlesztése. 11
Kutatási programok beszámolói Sorszám Tervezett eredmény Készültség szintje 1 2.1 2.2 2.3 2.4 2.5 3.1 3.2 3.3 3.4 4.1 4.2 4.3 6.1 6.2 6.4 7.1 7.2 7.3 7.4 8.1 Az új, CellKom RET befogadása, a struktúra átszervezése. A folyó projektek menedzselése, hasznosítás feltérképezése. Kliens szoftver második verziója. Különbözõ analitikai szoftverek (források és futtatható fájlok). Memória jellegû feladatok és térbeli kommunikációs feladatok megoldására képes ágensek, evolvált neuronhálók. Az elsõ fehérje kölcsönhatása fingerprint adatbázis, és kezelõ program Javított gének listája, adatbázisa. Biokémiai módszerekkel validált eljárás ismert szerkezetû és hatású makromolekulák hasonló vagy eltérõ tulajdonságú variánsainak in silico módszerrel való elõtervezésére és elõállítására, nagy hatékonyságú és várhatóan minimális mellék-hatású antibiotikumok kifejlesztéséhez. Tetszõleges JVM-en futtatható bináris kódok CD-n terjesztve Területi adatbázis, adaptált feldolgozó algoritmusok és programok. Szoftverek bonyolultságát leíró metrikák tervei és megvalósításai. A szoftver-rendszerek követelményvizsgálatát támogató modellezõ eszköz. Hálózati információ fogyasztás modelljei. Nagyméretû hálózatokat kezelõ algoritmusok és azok megjelenítése. A kifejlesztett modellek alkalmazása egy konkrét példán (pl. regionális pénzügyi hálózat, vagy elektromos hálózat esetében). e-science kutatáshoz szükséges adatbázisrendszer elsõ implementációja. e-science minta adatbázis felépítése. Számítógépes labóratórium kiépítése, indexelési, keresési algoritmusok kipróbálása. 3D vizualizációs fejlesztések. Szoftver; szabadalmazott eszköz, berendezés. Sejtkommunikációt és õssejt differenciációt szabályozó tényezõk feltárása. Számítógépes adatbázis, Hálózati klaszterezõ algoritmusok összehasonlító vizsgálata. Aktivációs és sejthalál jelpályák közös pontjainak azonosítása, hatóanyagok tervezése. Optimalizált szerkezetû citrullin tartalmú peptidek, immunológia markerek kötõdésére és feltárására szolgáló eljárás. A depresszió új állat-modellje. A Beckman Coultard fehérje szeparációs technika telepítése, optimalizálása, kezelõ szakemberek kiképzése, szabadalmazott kutatási eszköz, eljárás. Szilárd fázisra kötött aktivált aminosavak. 90% 100% 100% 90% 90% 90% 100% 100% 100% 90% 100% 100% 100% 70% 90% 75% 70% 85% 100% 90% 100% 12
2. program: Bioinformatika Programigazgató: Dr. Szathmáry Eörs, egyetemi tanár E program a bioinformatikai eszközöket több szempontból is innovatívan fejleszti. Az analitikus vonulat molekulaszerkezeteket hasonlít össze, míg a szintetikus megközelítés új molekulák tervezését hivatott segíteni. A biomimetikus neuronális hálózatok evolúciós szintézise a program legkevésbé tradicionális eleme. A Phylogeny Cafe projektben felhasználóbarát szoftvereket írtunk olyan újfajta bioinformatikai adatok elemzésére, amelyekre éppen az adatok újszerû volta miatt jelenleg nem áll rendelkezésre korszerû programcsomag. A programcsomag segítségével a biológus felhasználók elemezhetnek genomátrendezõdéseket, géntartalom változásokat, és fehérjeszekvenciák beszúrás-törlésekkel történõ változásait. A StructureProjector és StructureDecoder programcsomagok fehérjék másodlagos térszerkezeteit prediktálják; piacosításuk folyamatban van. A friss Genomatics projekt keretében DNS-chip és SNP mérések kísérlettervezését és a mérési eredmények feldolgozását végezzük el. A MisPred projektben a génpredikciós módszerekkel rosszul megjósolt géneket azonosítjuk, a helyes génszerkezettel helyettesítjük, továbbá a jelenlegi génpredikciós módszereknél megbízhatóbb eljárásokat dolgozunk ki. Elkészítettük azt a programot, amely lehetõvé teszi nagy mennyiségû hiba automatizált azonosítását. A molekuláris interakciós ujjlenyomatokat (Molecular Interaction Fingerprint, MIF) olyan új, általunk kidolgozott számítógépes eljárással keressük, amely alkalmas lehet gyógyszerjelölt molekulák mellékhatásainak szerkezeti alapon történõ elõrejelzésére. A MIF-ek hasonlósága arra utal, hogy az adott kismolekulák potenciálisan hasonló kölcsönhatási partnerekkel rendelkeznek, amibõl pedig a várható hatásokra és mellékhatásokra lehet következtetni. Új diszkrét matematikai módszereken alapuló szoftverprototípust hoztunk létre, mely a molekulatervezés és gyógyszercélpontok keresése mellett molekuláris taxonómiai feladatok megoldására is alkalmas. Az optimalizált ICF algoritmus 63 változós Boole függvényekkel reprezentálható problémákat kezel néhány ismert szoftverhez képest több nagyságrenddel csökkentett átlagos futási idõ mellett. A módszerrel többek között bizonyos, jövõbeni antibiotikumok kitüntetett célpontjait azonosítjuk. A molekuláris szint fölött meghatározott funkcionalitású biomimetikus neuronális hálózatok in silico evolváltatunk. Az evolúciós neurogenetikai algoritmus (ENGA) platformja jelenleg funkcionalitása alapján készen áll a szûk körû terjesztésre. Megkezdtük a felhasználói felület nemzetközivé tételét, ami a rajta megjelenõ szövegek más nyelvre való lecserélését teszi lehetõvé. Sikeresen evolváltattunk egymással együttmûködõ, és jeleket cserélõ ágenseket. A bioinformatikai program eddig több szoftver és szolgáltató honlap prototípust hozott létre, és két szabadalmi bejelentés is születetett. A fejlesztések jelenlegi állapota immár megengedi a projektek közötti szinergizmusok azonosítását és kihasználását; így például az ICF alkalmazását az evolváltatott neuronális hálózatok analízisére vagy a MIF független elemzésére. A programnak továbbra is célja, hogy a hasznosíthatóság különbözõ fázisaiban levõ projekteket inkubálja, tesztelését és piacosítását elõsegítse, és új ígéretes projekteket vonjon be a fejlesztésbe. 13
2.1 Biomimetikus neuronális hálózatok evolúciója Projektvezetõ: Dr. Szathmáry Eörs, egyetemi tanár Áttekintés A RET 2.1 projektje meghatározott funkcionalitású biometikus neuronális hálózatok in silico evolváltatását célozza meg. Elvégzett feladatok 1.) Felhasználói felület ( kliens ) A tavaly megkezdett fejlesztést a tervek szerinti funkcionalitással bõvítettük. Ehhez a több komponensbõl álló rendszer (lásd 1. ábra) valamennyi komponensét és interfészét módosítani kellett. Szükséges volt egy új komponens, a Service daemon létrehozása, ez biztosítja ugyanis az ENGA motor XSD-XML alapú kommunikációját a JBoss alkalmazásszerverrel. A fejlesztés alatt négy köztes kibocsájtás (release) készült a programból, az utolsó már funkcionalitása alapján készen áll a szûk körû terjesztésre is. 2.) térbeli kommunikáció vizsgálata Általános konklúzió, hogy a térbeliség kedvez a kooperátorok elterjedésének az ún. börtönlakók dilemmája (prisoner s dilemma, PD) modellben. Ezzel szemben új vizsgálatok azt mutatták, hogy a térbeliség az önzõ egyedeknek kedvez az ún. hótorlasz (snowdrift, SD) modellben. Ennek az oka azonban nem világos mivel a térbeli modellek két dologban is különböznek a jól-kevert modellektõl: térbeli korrelációk, és korlátos szomszédság jön létre. A hatás megismerése érdekében ezért térben explicit PD és SD modelleket vizsgáltunk változó keverés és szomszédsági méret mellett. évi funkcionalitáshoz (projektek és kísérletek kezelése, felhasználók kezelése, autentikáció) képest: paraméterállítás vizuális úton, paraméter sablonok kezelése, futás indítása, futás monitoring, eredményfájlok lokális gépre áttöltése. 2.) térbeli kommunikáció vizsgálata Azt találtuk, hogy a keverés mindig az önzõ egyedeknek kedvez. Eredményeink azt mutatják, hogy a korlátos szomszédság és nem a térbeli korrelációk felelõsek a kooperátorok gyakoriságának a csökkenéséért térbeli modellekben jól-kevert modellekhez képest. Viszont a térbeli korrelációk megléte mindig kedvez a kooperátoroknak. 3.) komplexitásmérés evolvált neurális hálón Sem fokszám-analízissel, sem motívum-analízissel nem találtunk jellemzõ mintákat. További lépések Megkezdtük a felhasználói felület nemzetközisítését (i18n), ami a felhasználói felületen megjelenõ szövegek más nyelvre való lecserélését teszi lehetõvé. A következõ lépések között van a különbözõ, szerver- és kliensoldali analízis eszközök felhasználói felületbe integrálása, az archiválás automatizálása. Tovább szeretnénk fejleszteni a térbeli kommunikáció vizsgálatát, valamint az ágensek analízisét is. 3.) komplexitásmérés evolvált neurális hálón Gráfelméleti módszereket (pl. fokszám-analízis, motívum-analízis) alkalmaztunk annak megállapítására, hogy van-e valami közös jellemzõje a feladatokban sikeresen teljesítõ ágensek neuronális hálózatainak. 14 Eredmények 1.) Felhasználói felület ( kliens ) A fejlesztések eredményeképpen a felhasználói felület a következõ új funkciókkal bõvült az elõzõ Az ENGA rendszer UML telepítési (deployment) diagramja
2.2 Molekuláris kölcsönhatások ujjlenyomata Projektvezetõ: Dr. Málnási Csizmadia András, tudományos fõmunkatárs Áttekintés A projekt egy olyan új, általunk kidolgozott számítógépes eljáráson alapul, amely alkalmas lehet gyógyszerjelölt molekulák mellékhatásainak szerkezeti alapon történõ elõrejelzésére. Célunk egy internet alapú komplex szolgáltatás létrehozása, amely a megrendelõ számára prediktálja egy potenciális hatóanyag hatás- és mellékhatás-profilját. A projekt keretében összegyûjtöttük az FDA által elfogadott kismolekulájú gyógyszerhatóanyagok és ezek célfehérjéinek térszerkezeti és egyéb adatait, majd a kismolekulákat a fehérjeszerkezetekre dokkoltuk. A dokkolási energiákat egy mátrixba rendezve megállapítható, hogy a kismolekulák kölcsönhatási energiái minden esetben jellegzetes, egyedi mintázatot alkotnak, ez a molekuláris interakciós ujjlenyomat (Molecular Interaction Fingerprint, MIF). A MIF-ek hasonlósága arra utal, hogy az adott kismolekulák potenciálisan hasonló kölcsönhatási partnerekkel rendelkeznek, amibõl pedig a várható hatásokra és mellékhatásokra lehet következtetni. A projekt két alapvetõ adatbázisa a kölcsönhatási energiákat tartalmazó adatmátrix és a mellékhatások gyûjteménye. A fõ tudományos célkitûzés a két adattömeg közti korreláció feltárása. Elvégzett feladatok Mindkét alapvetõ adatbázis elkészült, a kölcsönhatási energiák mátrixa folyamatos feldolgozás alatt áll. A mellékhatások adattáblájának elsõ, nyers verziója több ezernyi mellékhatást tartalmazott, mely a további munkához alkalmatlan, ezért elsõ lépésként valamivel több, mint 1000-re csökkentettük a mellékhatásokat, részben a szinonimák kiszûrésével. Jelenleg egy orvos dolgozik a szám további racionális csökkentésén. A MIF-mátrix alapos vizsgálata kimutatta, hogy a célfehérjékbõl álló dokkolási diszkriminátorfelület tagjai nem függetlenek egymástól. Az egyes fehérjékre kapott kölcsönhatási értékek közötti átlagos korreláció 60%; a szélsõértékek 23% és 67%. Ez felveti a fehérjék alacsony korrelációjú dokkolási alcsoportokba való rendezésének lehetõségét a diszkrimináció magas szinten tartása érdekében. A projektben vállalt második feladatunknak megfelelõen a cyclodextrin-karotin komplexek kialakulását hasonló megközelítéssel vizsgáltuk. Az in silico dinamikus dokkolás sorozatok és in vitro kísérletek eredményeként új, vízben oldható karotin formulációkat állítottunk elõ. Eredmények Konzorciumi partnerünkkel, a Delta Elektronik Zrtvel közösen beindítottuk a webes szolgáltatás mûködõ prototípusát (1. ábra). A teszteléseket, az adatbázisok véglegesítését és az üzleti modell kidolgozását követõen a szolgáltatást várhatóan 2008 februárjában indítjuk be. A cyclodextrin formulációk révén oldható antioxidánsokkal elért eredményekre alapozva szabadalmat adtunk be. További lépések Elõzetes eredményeink felvetik a hatás- és mellékhatás predikció egy lehetséges új módját: a gyógyszerjelölt molekulát betagozzuk a hatásterület alapján kiválasztott szerek egy csoportjába (pszichoaktív, légzõrendszerre ható, onkológiai stb.), és az egyes csoportokban elfoglalt helybõl, valamint a reprezentatív vegyületektõl való távolságból lehet meghatározni a gyógyszerjelölt molekula várható hatásprofilját. A távolságok meghatározásához használt klaszterezési eljárásokat a RET 2.4 projektjével együttmûködésben fejlesztjük. 1. ábra. Az online szolgáltatás prototípusa. 15
16 2.3 Genom-annotáció Projektvezetõ: Dr. Patthy László, akadémikus Áttekintés A bioinformatikai módszerekkel azonosított gének jelentõs hányadánál a megjósolt génszerkezet téves. A génpredikciós módszerek bizonytalanságai problémát okoznak a (tévesen) megjósolt gének/fehérjék további vizsgálatában. Célunk a génpredikciós módszerekkel rosszul megjósolt gének azonosítása, a helyes génszerkezet predikciója és kísérleti ellenõrzése, továbbá a jelenlegi génpredikciós módszereknél megbízhatóbb eljárás kidolgozása. A projekten együttmûködik az MTA SZBK Enzimológiai Intézete és a Delta Elektronik Zrt. Az elsõ szakaszban öt módszert dolgoztunk ki a hibásan megjósolt gének azonosítására, melyek részletes leírását a rosszul megjósolt fehérjék annotációinak publikálására létrehozott MisPred adatbázishoz kapcsolódó weboldalon, a http://mispred. enzim.hu címen lehet elérni. Elvégzett feladatok A 2. munkaszakaszban a hibaazonosítási vizsgálatokat kiterjesztettük további adatbázisokra és fajokra. Ennek során a vártnál lényegesen több hibát találtunk: az EnsEMBL adatbázisban 11 fajt megvizsgálva több mint 9000, 4 faj GNOMON módszerrel jósolt fehérjéibõl több mint 2000 gyanús szekvenciát azonosítottunk. A gyanús szekvenciák részletes elemzése és szerkezetük kijavítása folyamatosan történik. A Delta-val együttmûködve kidolgoztuk azt a programot, amely lehetõvé teszi nagy mennyiségû hiba automatizált azonosítását. Eredmények 1. A génpredikciós módszerekkel rosszul megjósolt gének azonosítása a. A rosszul megjósolt gének azonosítására használt módszerek A 2. munkaszakaszban további hibaazonosítási módszereket dolgoztunk ki: 6. Konfliktus a nukleáris domének és a szignálpeptidek jelenléte között. Alapja: egy fehérjében nem fordulhat együtt elõ nukleáris domén és szekréciós szignál peptid, ezért a nukleáris domént és szignál peptidet is tartalmazó fehérjék gyanúsnak minõsülnek. 7. Konfliktus a szignál-peptid és az intracelluláris domének jelenléte, és a transzmembrán domének hiánya között. Alapja: szekréciós szignál peptid és intracelluláris domének csak úgy fordulhatnak elõ együtt egy fehérjében, ha egy transzmembrán szegmens választja el a két régiót. A szignál peptidet és intracelluláris doméneket is tartalmazó, de ezeket elválasztó transzmembrán szegmens nélküli fehérjék gyanúsnak minõsülnek. 8. Konfliktus a transzmembrán domének és a nukleáris domének jelenléte között. Alapja: egy fehérjében nem fordulhat együtt elõ nukleáris domén és transzmembrán domén, ezért a transzmembrán domént és nukleáris doméneket is tartalmazó fehérjék gyanúsnak minõsülnek. b. A vizsgálatok automatizálása és validálása A Delta Elektronik ZRt-vel együttmûködve folytattuk a hibaazonosítás automatizálását, ami lehetõvé tette a különbözõ génpredikciós módszerekkel jósolt fehérjeszekvenciák tömeges vizsgálatát. Az automatizált módszerek validálása a SwissProt adatbázison történt: a MisPred módszer igen alacsony hibaszázalékkal képes a predikciós módszerek tévedéseit azonosítani. 2. A génpredikciós módszerekkel rosszul predikált gének helyes szerkezetének meghatározása A hibás szekvenciákat a paralóg és ortológ fehérjék szekvenciái, valamint az adott faj genomikus és EST szekvenciái felhasználásával javítottuk ki. 3. A korrigált jóslatok kísérleti ellenõrzése A korrekciós eljárás megbízhatóságának ellenõrzése érdekében a hibás gének egy részén elvégeztük a cdns szekvenciák kísérletes ellenõrzését (esetenként a fehérjetermék vizsgálatát) is. Az egyik korrigált gén által kódolt fehérje funkcionális vizsgálata arra utal, hogy a fehérje részt vesz az izomfejlõdés szabályozásában. További lépések Annak érdekében, hogy az összes szekvenciahibát azonosítani tudjuk, folytatjuk további hibaazonosítási módszerek kidolgozását. A nagyszámú hiba kijavítása érdekében eljárást dolgozunk ki a hibásan jósolt gének helyes szerkezetének automatikus meghatározására.
2.4 Makromolekulák összehasonlító analízise és in silico tervezése Projektvezetõ: Dr. Jakó Éena Áttekintés A projekt célja új szoftver prototípus és in silico eljárás kidolgozása adott biológiai tulajdonságokkal rendelkezõ makromolekulák összehasonlító vizsgálatára és tervezésére, valamint mikrobák aminoacil trns szintetáz (aars) enzimein alapuló új antibiotikum célpontok keresésére. További jelentõs hasznosítást ígérõ kutatási témaként kezdeményeztük a ciklikus oszteoporózis és regeneráció genetikai hátterének vizsgálatát. Elvégzett feladatok Elkészült a molekulatervezést támogató ICF szoftver prototípus második verziója. A kifejlesztett in silico molekulatervezési eljárást a C. Florentz professzor által vezetett francia trns kutató csoporttal (Pasteur Egyetem, Strasbourg) együttmûködve különbözõ trns modell rendszerekben teszteltük. A megadott specifitású trns és aminoacil trns szintetáz (aars) komplexekre az ICF alapján matematikai predikcióval meghatározott identitás elemek és kötõhelyek ellenõrzését az elektronsûrûség 3D alakanalízise alapján is elvégeztük (Mezey Pál prof. kutatócsoportja, New Foundland University). A csontritkulás témában 138 egyedi gént azonosítottunk az egész humán genomot reprezentáló cdns CHIP segítségével, melyek az oszteoporózis kialakulásában vagy az oszteoporózis regenerációjában vesznek részt gímszarvasban (Orosz László professzor kutatócsoportja, ELTE Genetika tanszék). Eredmények 1. Új diszkrét matematikai módszereken alapuló szoftverprototípust hoztunk létre, mely a molekulatervezés és gyógyszercélpontok keresése mellett molekuláris taxonómiai feladatok megoldására is alkalmas. Az optimalizált ICF algoritmus 63 változós Boole függvényekkel reprezentálható problémákat kezel néhány ismert szoftverhez képest több nagyságrenddel csökkentett átlagos futási idõ mellett. 2. A trns-aars modellrendszerben való molekulatervezés eddigi legfontosabb eredménye, hogy az in silico predikciókkal meghatározott trns identitáselemek jó megfeleltetést mutattak az in vitro kísérleti eredményekkel, valamint az identitáselemek és kötõhelyek 3D modellezésével. A konkrét szabadalmi tervben szereplõ eljárás célja, hogy azonosítsa azokat az aars enzimeket is, melyek funkcionális értelemben a leginkább el kell, hogy térjenek a humán variánstól, így ezek az enzimek lehetnek a kitûntetett jövõbeni antibiotikumok célpontjai. 3. A csontritkulás genetikai hátterének felderítésében az expressziós CHIP adatok többváltozós statisztikai módszerekkel való értékelése révén fontos új eredmény, hogy két szignáltranszdukciós útvonal génjeit fedeztük fel: BMP- Hedgehog és Wingless signaling. Ez legalább kétféle csontritkulás típus elkülönítését valószínûsíti. Az általunk azonosított eddig ismeretlen gének segítségével a csontritkulás megalapozottabban diagnosztizálható és gyógyítható. További lépések 1. Ábra. A trna Arg és az ArgRS enzim 3D komplexe. Az összes Arg oldallánc sárgával kiemelve. Az in silico eljárás kiterjesztése további, gyógyszercélpontként hasznosítható trns-aars komplexek esetére. A prediktált célpontenzimek lehetséges gyógyszer mellékhatásainak elemzésére együttmûködést tervezünk a Canadian Network of Toxicology Centers (CNTC) modellezõ csoportjával, illetve a RET escience 2.2 projekt résztvevõivel.. A molekulatervezés terén elért eredményeinket a francia partnerrel közösen a mitokondriális medicina területén, míg a csontritkulás témában elért eredményeket a prognózist, diagnosztikát és terápiáját elõsegítõ szakértõi rendszer kidolgozásánál szeretnénk hasznosítani a SOTE I és II Belklinikákkal való együttmûködés alapján. Az ICF szoftver prototípus hasznosításának elõsegítésére web-portál kifejlesztését tervezzük. 17
2.5 Phylogeny-café és Genomatics Projektvezetõ: Dr. Miklós István, tudományos munkatárs Áttekintés A Phylogeny Cafe projekt célja az, hogy felhasználóbarát szoftvereket írjunk olyan újfajta bioinformatikai adatok elemzésére, amelyekre éppen az adatok újszerû volta miatt jelenleg nem áll rendelkezésre korszerû programcsomag. Az adatok elemzéséhez ahol csak lehetséges, filogenetikai információkat is figyelembe veszünk, a programcsomagot pedig Java programozási nyelven írjuk innen a projekt neve. A programcsomag segítségével a biológus felhasználók elemezhetnek genomátrendezõdéseket, géntartalomváltozásokat, fehérjeszekvenciák beszúrás-törlésekkel történõ változásait. Ilyen elemzések elõsegíthetik, például, hogy megértsük a rákos sejtekben történõ változásokat, hogy patogén baktériumok milyen géntartalomváltozásokkal alkalmazkodnak, vagy hogy megtaláljuk a fehérjék variábilis régióit, amelyekre aztán targetmolekulákat tervezhetünk. Elvégzett feladatok A projekt elsõ két évében 4 referált, nemzetközi folyóiratban megjelent cikkünk született, az erre kapott független hivatkozások száma 17, a négy cikk kumulatív impaktfaktora 15 felett van. 6 poszterünk volt nemzetközi konferenciákon, két elõadás és egy szoftverbemutató. További lépések Az új projekt neve GenoBys, amely projekt keretében DNS-chip és SNP mérések kísérlettervezését és a mérési eredmények feldolgozását végezzük el (1.ábra). A projekt három egyetem, a SOTE, a BMGE és az ELTE összefogásával készül. A projekt stratégiai és marketing tanácsadását a Convincive consulting Kft. végzi. A projektre egy 80% SOTE, 20% magánszemélyek tulajdonosi megosztású szolgáltató kft. fog létrejönni, amely jelenleg a SOTE Innováció kft-ben inkubálódik. Mind a SOTE és a BMGE, illetve a SOTE és az ELTE között kétoldalú licenciaszerzõdések fogják biztosítani a BMGE, illetve az ELTE részérõl a hozzáadott tudás értékének a megtérülését. A cég bejegyzése a piaci felmérés és a szolgáltatási profil kialakítása után elõreláthatólag október végére történik meg, a licenciaszerzõdések megkötése szintén folyamatban van. Szoftverbemutatóval részt vettünk az ISMB/ECCB 2007 konferencián. Az elmúlt évben kapcsolatba léptünk a ValDeal cégen keresztül az Inno AG-vel, amely cég átvilágította a projektünket. Az Inno AG a fejlesztett programcsomagok közül kettõt tartott piacosításra érdemesnek, a StructureProjectort és StructureDecodert. Ezek a programok fehérjék másodlagos térszerkezeteit prediktálják, és lehetõség van arra, hogy a másodlagos térszerkezetek Bayesi predikcióit felhasználjuk harmadlagos térszerkezetpredikciókra is. Mivel a programok benchmarkingja megtörtént, és a további fejlesztésekrõl dönteni csak a piac felmérése és a marketingstratégia kidolgozása után lehet, erõforrásainkat 2007 tavaszától egy új projektre allokáltuk (Az Inno AG a piacfelmérést és a marketingstratégia kialakítását októberre ígérte). 18 Eredmények 1. ábra. DNS-chip elemzés rendszerbiológiai megközelítésben.
3. program: Hálózati informatika Programigazgató: Dr. Vattay Gábor, egyetemi tanár A program alapozó idõszakasza után immár második szakaszába lépett, melyet az elsõnél sokkal konkrétabb fejlesztési célkitûzések jellemeznek. A projektek az ipari partnerek számára hasznos alkalmazások irányába fordultak. A munkaügyi adatbázisokon alapuló, területi sajátságokat is figyelembe vevõ, statisztikai számításokon nyugvó, munkaerõ-piaci trendek változásait kezelni képes szoftver fejlesztése ebben a fázisban a statisztikai eljárások és a területi adatok kibõvítésére koncentrált, annak érdekében, hogy a szoftver már ne csak Magyarországon, hanem az Európai Unióban is alkalmazható legyen. A Multirációval közösen kifejlesztett pilot rendszerbe beépítésre kerültek és tesztelõdtek az EURAREA az Unió statisztikai intézeteinek projektje által javasolt eljárások. A szoftverrendszereknek, mint adathálózatoknak a leírását modellezõ eszköznél olyan szoftver- prototípus készítése felé léptünk tovább, amely támogatást nyújt a bõvíthetõségben és karbantarthatóságban rejlõ kockázatok becsléséhez, beleértve a tesztelési erõforrások, a ráfordítás, és ütemezés becslését is. Partnerünk, az Ericsson Magyarország Kft. elérhetõséget biztosít egy nagy projektje hibaadatbázisához, így a közeljövõben lehetõségünk lesz mérni a bõvíthetõség és karbantarthatóság aktuális költségét, és validálni a prototípusunkat. A nagyméretû hálózatok klaszterezési feladatainak tervezéséhez készült szoftvertermék és prototípusa, mely rendkívüli nagyságrendû hálózatok particionálására képes. Elkészült ezen új technológia proof-of-concept-jét bizonyítandó egy a biztosítási iparágra adoptált, vizualizációval támogatott implementáció valamint egy SVD lineáris algebrai módszerén alapuló ajánló rendszer. Az ajánlórendszerek célja, hogy a felhasználóknak olyan termékeket ajánljon, amelyek valószínûleg érdeklik. A kidolgozott technológiával sikerült megnyerni a KDD 2007 adatbányászati alapkonferenciához kapcsolódó két szakmai csúcsverseny egyikét. Az energiapiaci gazdasági tervezésében a pénzügyi és elektromos hálózatok területén kifejlesztettünk egy energia beszerzést optimalizáló szoftvermegoldást, mely a piaci szabályozás, valamint az ingadozó spot árak függvényében keresi a legkisebb befektetést igénylõ eszközöket. Elvégeztük a European Energy Exchange (EEX) villamos áram rövid távú (napi) alakulásának elõrejelzését. A program második szakaszára vállalt részfeladatai teljesültek. Létrejött a területi adatbázis, az adaptált feldolgozó algoritmusok és programok, a feldolgozó eljárások tesztelésre kerültek valós adatokon. Megvizsgáltuk a komplex szoftverhálózatok csomópontjainak, mint funkcionális egységeknek a komplexitására vonatkozó bonyolultsági metrikákat, és sikeresen terveztünk olyan metrikát, amely nemcsak a szerkezeti bonyolultságot, hanem az adatbonyolultságot is méri. Elkészültek a nagyméretû hálózatokat kezelõ algoritmusok és vizualizációk, a nagyskálájú numerikus szimulációk, és a modellek kalibrálása. A kifejlesztett modellek alkalmazásra kerültek az elektromos hálózatok példáján. A második szakaszban elért eredmények jó alapot nyújtanak arra, hogy a harmadik szakaszban számos új terv megvalósuljon. A hálózatok dinamikája területén kidolgozott know-how-k legfontosabb alkalmazási területe az üzleti logika és a szociális hálózatok vizsgálata lehet és a továbbfejlesztett eszközök felhasználó elemzésére képesek. A statisztikai módszerek esetén kiemelt hangsúlyt fog kapni az eredmények térképes és idõsoros interaktív megjelenítése. A hálózati kockázat kezelésben cél lesz az energiaár elõrejelzések pontossága, a szoftver gráfoknál pedig a prototípus validálás. 19
3.1 Statisztikai módszerek Projektvezetõ: Dr. Bagoly Zsolt, egyetemi docens Áttekintés A projekt célja egy, az Állami Foglalkoztatási Szolgálatnál már mûködõ rendszer továbbfejlesztése mind a statisztikai eljárások terén, mind pedig a területi adatok kibõvítésével úgy, hogy az már nem csak Magyarországon, hanem az Európai Unióban is alkalmazható legyen. A most lezárult munkaszakasz fõ célja a rendelkezésre álló statisztikai módszereknek egy pilot rendszer keretében való tesztelése. Ez a rendszer hangsúlyosan kezeli az adatok idõsoros és térképes, interaktív megjelenítését is. Elvégzett feladatok A szezonális kiigazítás módszerei A gazdasági idõsorok hosszú távú elemzésekor meg kell azt tisztítanunk az ismétlõdõ, éven belüli, ún. szezonális ingadozásoktól. A szezonális kiigazításra ma az Európa-szerte elterjedt TRAMO/ SEATS és az X11/X12-ARIMA eljárásokat használják. Öszszegyûjtöttük az ezekre vonatkozó irodalmat, és alapos tesztelés után egy összehasonlító elemzést készítettünk. Az elemzés eredményeit bemutattuk a Foglalkoztatási Szolgálat munkatársainak, és javaslatot tettünk a TRAMO_SEATS módszer bevezetésére a hivatalos statisztikák készítésében. A kisterületi és az idõsoros becslés módszereinek tesztelése A kérdõíves felmérések általában országos szinten készülnek, így ha területi bontásban szeretnénk adatokat kapni, a mintaméret csökkenése növekvõ bizonytalansághoz vezet. Ennek korrigálására születtek a kisterületi becslési módszerek. Ezek átfogó vizsgálatát végezte el az Európai Unió több tagországára kiterjedõ EURAREA projekt. A pilot rendszerbe beépítettük és teszteljük az EURAREA által javasolt eljárásokat. A strukturált idõsoros megközelítés az idõsorok korábbi viselkedését egy statisztikai modell alapján figyelembe veszi a becslés során (Kalmanszûrõ algoritmus). Ezen módszerek hibabecslésére az irodalom több módszert is javasol, ezeket a pilot rendszeren is implementáltuk. A teszt futtatások eredményei alapján kidolgoztunk egy a jelenleginél megbízhatóbb, a modellillesztés hibáját is figyelembe vevõ hibabecslési eljárást. Eredmények A projekt eddigi eredményeit a következõ dokumentumok tartalmazzák: Szezonális kiigazító eljárások összehasonlító elemzése. A KMSR2 rendszer prototípusának fejlesztõi és felhasználói dokumentációja. Ausztriai adatok elemzése Strukturált idõsorelemzõ eljárások hibaszámítása (algoritmusok, teszt eredmények, összefoglaló jelentés) Pilot rendszer A becslések és elõrejelzések statisztikai módszereinek tesztelésére és a késõbbi európai uniós alkalmazások demonstrálására egy pilot rendszert fejlesztettünk ki. A cél a már létezõ KMSR rendszer továbbfejlesztése volt, méghozzá úgy, hogy az új rendszer már felépítése révén nyitott legyen új eljárások dinamikus beépítésére és más földrajzi területre ill. aggregációs struktúrára való adaptálásra. Elsõ lépésként hazai adatokon teszteltük az új eljárásokat. Az Európai Unió tagországai közül ausztriai adatokkal végeztünk elemzéseket. További tervek A projekt harmadik évében a rendszer 1.0 változatának elkészítését, felhasználói tesztelését és próbaüzemét tervezzük. Kiemelt hangsúlyt fog kapni az eredmények térképes és idõsoros interaktív megjelenítése. Munkanélküli ráta (%) 20