Búzanemesítési információs rendszer Kuti Csaba MTA Mezőgazdas gazdasági gi Kutatóint intézete Martonvásár 2007
Bevezetés mikro számítógépek megjelenése és elterjedése adatéhs hség - öngerjesztő folyamat elindulása gyors technológiai generáci cióváltás hatékony adatkezelés és informáci ció- feldolgozás új j szoftver- technológi giák közvetítése a felhasználók irány nyába
Új technológiák Információs Rendszer Szükség van olyan megoldásokra, amelyek: 1. Leegyszerűsítik bizonyos feladatok elvégzését 2. Felhasználónak nem kell törődnie azzal, hogy mi történik a háttérben 3. Az adott közösség kommunikációjának egy részét szabályozzuk, formalizáljuk ADAT ERŐFOR FOR- RÁSOK SZOFTVER ERŐFOR FOR- RÁSOK HARDVER ERŐFOR FOR- RÁSOK HUMÁN ERŐFOR FOR- RÁSOK KOMMUNI- KÁCIÓS ERŐFOR FOR- RÁSOK 4. Az információcsere minél nagyobb része a számítástechnikai rendszer közbeiktatásával történjen
Célkitűzések 1. 1. Egységes, ges, integrált adatstruktúra ra llétrehozása 2. 2. Input adatok automatizált gyűjtése 3. 3. Változó szerkezetű listák, outputok előállítása llítása 4. 4. Tevékenységszervező modulok llétrehozása 5. 5. Általános lekérdező funkciók k beépítése 6. 6. Teljeskörű pedigré-és s génbanki g nyilvántartás ntartás 7. 7. Alapanyagcsere (címlista) szervezése se 8. 8. Alapvető statisztikai modul llétrehozása 9. 9. Csoportmunka lehetővé tétele tele
Relációs adatmodell megtervezése és létrehozása Célja: a nemesítéssel ssel kapcsolatos összes adat egységes, ges, integrált nyilvántart ntartása döntéstámogató informáci ciók, jelentések csoportosításának és s teljes körűk megjelenítésének nek lehetővé tételetele nemesítési si adatok kapcsolatának biztosítása sa a geneológiai giai génbanki alapanyagcsere adatokkal
Rendelkezésre álló adatforrások Papír alapú adatbázisok Hagyaték adatbázisok
Adat1999 Adat1999 Adat2000 Adat2000 Adat2001 Adat2001 Adat2002 Adat2002 Adat2003 Adat2003 Adat2004 Adat2004 Adat2005 Adat2005 Adat4994 Adat4994 Adat4995 Adat4995 Adat1986 Adat1986 287 287-szer szer 239 239-szer szer 319 319-szer szer összesen: sszesen: 3652 3652 Adat2006 Adat2006 BASA/DF333 BASA/DF333-77// 77// M374/SX//2897/PRSK/ M374/SX//2897/PRSK/ E E 7 2 BASA/DF333 BASA/DF333-77// 77// M374/SX//2897/PRSK/ M374/SX//2897/PRSK/ B B 5 1 Miért kell struktúrálnunk adatainkat? Miért kell struktúrálnunk adatainkat?
Táblaszerkezetek kialakítása Adat1984 Adat2007 Adat1984 Adat2007 Pedigre
Táblák közötti kapcsolatok Adat1986 Adat4995 Adat4994 Adat1999 Adat2000 Adat2001 Adat2002 Adat2003 Adat2004 Adat2005 Adat2006 Pedigre B B 1 5 M374/SX//2897/PRSK/ BASA/DF333-77// E E 2 7 M374/SX//2897/PRSK/ BASA/DF333-77//
Speciális adatszerkezetek A x B F1 F2 F3 LR 821 SR 821 FUZ 821 LR 868 SR 868 FUZ 868 Rezisztencia kísérletek Fajtafenntartás Fagykísérletek TA 501 SZAP 231.. TA 563 SZAP 293 + + FGY 154.. FGY 216 Ev 2
Adatmennyiség I. Évről-évre létrejövő adatbázisok Adat1984 Adat2006 (28501) Adat2007 (21786) 1.800.000 (Adat2006 + Adat2007) 1.523.000 175.000 II. Állandó adatbázisok 490.000 Geneológia (102.459) Génbank (12561) MagPosta (23.980) 3.988.000
Információs Rendszer Genealógia PEDIGRÉ FELBONTÁS N e m z e t k ö z i A d a t b á z i s o k Pheno Pedigré Cross Genes Törzsek KERESZTEZŐ Ev 1 ÚJ FELVITEL KERESZTEZŐ SZELEKCIÓ Magküld ldés Címlista Mag küldés/érkezés MAGÉRKEZÉS / KÜLDÉS Ev 2 GenAnal PedParts Vetésjegyzék Felv. füzet Cimke PARCELLÁZÓ Statisztikai Csomag Génbank Koll Breeder.inf (Stnd, Auxflag) On-line adatgyűjtő eszközök Kézi adatgyűjtő eszközök Helyi Statisztika
Tevékenységszervező programmodulok Kézi adatbevitel Adatbevitel fájlbf jlból Szelekció Keresztező Statisztika Parcellázó Magküld ldés Magérkez rkezés Vonalkód d (tervező/nyomtat /nyomtató)
Keresztezés
Parcellázás
Adatgyűjtés Automata (vonalkód) Infratec 1241 Inframatic 8611 Mettler mérlegcsalm rlegcsalád Polycorder Minolta CR-300 Falling Number 1500 Szoftveres interfész közbeiktatk zbeiktatásával (vonalkód) SKCS 4100 Alveograph és s Alveolink Farinograph Manuális Glutomatic Farinograph E Texture Analyser HPLC
Vonalkódok alkalmazása a rendszerben 1. Tervezés, nyomtatás 2. Kihelyezés: parcella, zacskó 3. Felvételezés: humán olv. szánt rész 4. Aratás után: zsák szájára, zacskókra
Cél: 1. Leíró statisztika Statisztikai modul - átlag mutatósz számai: számtani átlag, középsk pső érték k (Median) mértani m (Geom( Geom), Szántóföldi kísérletek harmonikus (Harm( gyors kiértékelése Harm) ) középark parányos - változó adatainak: legnagyobb (Max), legkisebb (Min) értéke, összege (Sum) - szóródás s mutatói: szórásn snégyzet, szórás, s, átlagos hibaszórás, s, variáci ciós koeff., átlag konfidencia intervalluma Adatbázisból közvetlenül futtathatók legyenek 2. a Véletlenblokk statisztikák varianciaanalízis - egytényez nyezős Adatok - kéttt tttényezős elérhetővé tétele általánosan elfogadott formátumokban 3. Osztott parcellás (split-plot) elrendezés A 4. Lineáris kötelező regresszióanalízis statisztikai elemzésekhez ne - egyszeres legyen - többszörös szükség külön statisztikai csomag használatára 5. Korrelációs mátrix számítása Elrendezések rugalmas kezelése
Génbanki modul
Outputok 1. Kiegész szítő anyagok kísérleti k tervek gyakorlati kivitelezéséhez a. Vetéstervek rögzített formátum tumú sorok számából l blokkok súly adatokat tartalmazó rugalmas szerkezetű (előáll llítás: ált. lek.. funkciók) k) b. Felvételez telező füzetek rögzített formátum tumú (blokkosított szerkezet) 2. Általános lekérdez rdező funkciók mérési adatokkal (előáll llítás: ált. lek.. funkciók) k) speciális formátum (kéthas thasábos TA, FB típus)
Lekérdez rdezés Adatlekérdező funkciók (Outputok)
Következtetések (I.) Cél: Kutatási Program Informáci ciós Rendszer Kutatási Program Méretének növeln velése Versenyképess pesség javítása
Következtetések (II.) Nagyméret retű kutatási programhoz tervezett rendszer: - sok külsk lső és s belső tényező együttes hatása alakítja ki a végsv gső formát - nem lehet a tevékenys kenységeket a legapróbb részletekig r előre megtervezni - megkezdett tevékenys kenységek folytatásának lehetősége - csapatok egymásra épülő tevékenys kenységet folytatnak A tevékenys kenységszervező modulok alapvető szempontja a rugalmasság: g: - sok kísérlet k esetében nem tudjuk előre a végsv gső méretet - nem tudjuk előre a genotípusok sorrendjét - nem kell tudnunk hány h termőhelyen lesz elvetve (randomizáci ciót t is később k rendelünk nk hozzá) Adatgyűjt jtési szempontok: - adatokat a lehető leggyorsabban eljuttatni a központi k adatbázisba (csúcsid csidény) - kevés s hibalehetőség g a gyűjt jtés s során - a létrejl trejövő összes mért m adat rögzr gzítése Kísérletek szánt ntóföldi beüzemel zemelésének támogatt mogatása: - a lehetőségeket nem korlátozza az adatbázisba épített jelentésk skészítő - vetéstervek - felvételez telező füzetek
Pedigré és s génbanki g nyilvántart ntartás: Következtetések (III.) - új j pedigrék k szerkesztése se és s ellátása azonosítósz számmal automatikusan törtt rténik - az új j törzsazonost rzsazonosítókat úgyszintén n automatikusan generálja a rendszer - testvért rtörzsek rzsek kezelése megoldott - szoros kapcsolatban áll a párhuzamosan p működőm génbankkal Informáci ciócsere csere a rendszeren belül: l: - egy része r a számítástechnikai stechnikai és s kommunikáci ciós s (hálózat) rendszer közbeiktatk zbeiktatásával törtt rténik - tevékenys kenységek monitorizálása (mérések)
Köszönöm a megtisztelő figyelmet