Műszaki és biológiai rendszerek elmélete Benyó, Balázs Benyó, Zoltán Paláncz, Béla Szilágyi, László Ferenci, Tamás

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Műszaki és biológiai rendszerek elmélete Benyó, Balázs Benyó, Zoltán Paláncz, Béla Szilágyi, László Ferenci, Tamás"

Átírás

1 Műszaki és biológiai rendszerek elmélete Benyó, Balázs Benyó, Zoltán Paláncz, Béla Szilágyi, László Ferenci, Tamás

2 Műszaki és biológiai rendszerek elmélete: Benyó, Balázs Benyó, Zoltán Paláncz, Béla Szilágyi, László Ferenci, Tamás Szerzői jog 2014 Benyó Balázs, Benyó Zoltán, Paláncz Béla, Szilágyi László, Ferenci Tamás, Budapesti Műszaki és Gazdaságtudományi Egyetem, Semmelweis Egyetem

3 Tartalom Műszaki és biológiai rendszerek elmélete... x Előszó... xi 1. Modellalkotás, folyamatanalízis, folyamatszintézis Modellezés, modellalkotás Modellalkotással kapcsolatos fontosabb kategóriák (törvény, struktúra, paraméter, állapotváltozó) Tipikus vizsgálójelek és azok információtartalma Konklúzió Amplitúdó- és időléptékezés Léptéktényezők szükségessége Amplitúdóléptékezési eljárások Normalizált változók módszere (Relatív egységekkel való számolás) Dimenziós léptéktényezők Időléptékezés Bevezetés Időléptékezés megvalósítása A változók maximális értékeinek közelítő meghatározása Másodrendű állandó együtthatójú differenciálegyenletek változóinak maximális értéke Egyenlő együtthatók szabálya Összefoglalás Kompartment (rekesz) modellek és alkalmazástechnikájuk Bevezetés Definíciók, alapfogalmak Alkalmazott jelölésrendszer Kompartment (rekesz) modellek elmélete Kompartment (rekesz) modellek leírása állandósult állapotban levő rendszerek esetén Zárt rendszerek Nyitott rendszerek Speciális esetek Néhány gyakorlati eset vizsgálata Egy-kompartment rendszer Két-kompartment lánc rendszer Egy-kompartment rendszer, melynek bemenete állandó forrás Két-kompartment zárt rendszer Két-kompartment nyitott rendszer Kompartmentcsatolások Három-kompartment rendszerek Inhomogenitás Tranziens állapotban lévő rendszerek Tranziens rendszer fogalma Idegen anyagok kinetikája Nyomjelzővel jelölt rendszerek Nemlineáris rendszerek Általános modell Perturbációs és relaxációs módszerek Számítógépes szimuláció Lánc rendszer modellje Enterohepatikus keringés modellezése Oldott állapotú anyagok tárolása polietilén konténerekben A pajzsmirigy jódfelvételi folyamatának modellezése Többszörös dózis (Atkins kísérlete) Inverz feladat megoldása Inverz feladat megoldásának grafikus módszerei A módszerek pontossága iii

4 Műszaki és biológiai rendszerek elmélete Számítógépes paramétermeghatározás Clearance-vizsgálatok mérési adatainak számítógépes kiértékelése Au kolloiddal végzett májáramlás vizsgálatok kiértékelése Számítógépes eseményfelismerés élettani folyamatok vizsgálatára Többparaméteres kapcsolt szabályozások Problémafelvetés Kereszthatások kimutatása A keresztkapcsolatok kiküszöbölése Többparaméteres kapcsolt szabályozások matematika leírása Többparaméteres kapcsolt rendszerek stabilitásvizsgálata, kompenzálása Stabilitásvizsgálat Számítógépes optimalizálási módszerek Bevezetés Optimalizációs módszerek Folytonos gradiens módszer Diszkrét gradiens módszer Relaxációs módszer BFM (Brute Force Method) Számítógépes optimalizációs módszerek gyakorlati alkalmazása Mesterséges neurális hálózatok Alapfogalmak Fiziológiai alapok Egy általános csomópont jelátvitele A neurális hálózat felépítése A neurális hálózat tanítása A neurális hálózat szimulációja Perceptron hálózat A hálózat jellemzői és tulajdonságai Lineáris szeparábilitás A hálózat tanítása Backpropagáció hálózat A hálózat jellemzői és tulajdonságai A hálózat tanítása delta szabály A tanítás hatékonyságának növelése A radiál bázis függvény (RBF-) hálózat A hálózat jellemzői és tulajdonságai A radiál bázis függvény mint univerzális approximátor Függvényközelítés RBF-hálózattal Hopfield hálózat A hálózat jellemzői és tulajdonságai A hálózat tanítása Folytonos Hopfield hálózat Alkalmazás mintafelismerésre Nemfelügyelt tanítású hálózatok A hálózat jellemzői és tulajdonságai Versengő tanulás Módosított versengő tanulás Kohonen térkép Fuzzy rendszerek A fuzzy halmaz és a fuzzy logika A fuzzy partíció A fuzzy inferencia A fuzzy szabályozó Bevezetés a biostatisztikába A biostatisztika fejlődése és jelentősége A statisztika alapjai Néhány demonstratív kérdés A statisztika alapfogalmai és feladatai Változók és mérési skálák A biostatisztika kapcsolódó tudományai és elhatárolása A biostatisztika számítástechnikai háttere iv

5 Műszaki és biológiai rendszerek elmélete Futó példa Deskriptív statisztika A deskriptív statisztikáról általában A deskriptív statisztika módszereinek csoportosításáról Grafikus és analitikus módszerek Egy- és többváltozós módszerek A vizsgált változó(k) mérési skálája Minőségi változó egyváltozós elemzése Analitikus eszközök Grafikus eszközök Mennyiségi változó egyváltozós elemzése Analitikus eszközök Grafikus eszközök Minőségi változók kétváltozós elemzése Analitikus eszközök Grafikus eszközök Mennyiségi változók kétváltozós elemzése Analitikus eszközök Grafikus eszközök További többváltozós elemzések Induktív statisztika A mintavételi helyzet és következményei Becsléselmélet Hipotézisvizsgálat Irodalomjegyzék v

6 Az ábrák listája 1.1. A folyamatszimuláció lépései Egy bemenetű és egy kimenetű rendszer A Dirac-impulzus Egységugrás Egység sebességugrás Egység gyorsulásugrás Szinuszos vizsgálójel Példa tetszőleges vizsgálójelre Egységugrás függvény származtatása Egységugrás spektrumának közelítése Dirac-impulzus közelítése Dirac-impulzus spektrumának közelítése Véges szinuszvonulat Véges szinuszvonulat spektruma Nyquist diagram A nyomjelzős hígításos módszer elve n kompartmentből álló zárt rendszer Nyitott rendszer Lánc rendszer Egyszerű lánc rendszer Mammillary (anya) rendszer Egy-kompartment rendszer Két-kompartment lánc rendszer Egy-kompartment rendszer, melynek bemenete állandó forrás Két-kompartment zárt rendszer Két kompartmentes zárt rendszer nyomjelzőinek időbeni változása Két-kompartment nyitott rendszer Két kompartmentes nyitott rendszer nyomjelzőinek időbeni változása Előcsatolásos kompartment Visszacsatolásos kompartment Három-kompartment rendszer Inhomogén rendszer modellje Kétkompartmentes rendszer modellje Nemlineáris rendszer általános modellje Lánc rendszer modellje Lánc rendszer 4. és 5. kompartjeinek (nyomjelző és jelöletlen anyag) időbeni változása Lánc rendszer 3. és 4. kompartjeinek (nyomjelző és jelöletlen anyag) időbeni változása Lánc rendszer 2. és 4. kompartjeinek (nyomjelző és jelöletlen anyag) időbeni változása Lánc rendszer 1. és 4. kompartjeinek (nyomjelző és jelöletlen anyag) időbeni változása Enterohepatikus keringés modellezése Enterohepatikus keringés során a nyomjelző anyag időbeni változása az egyes kompartmentekben Oldott állapotú anyagok tárolásának modellezése Nyomjelző anyag időbeni változása két kompartmentes rendszerben Pajzsmirigy jódfelvételi folyamatának modellje Nyomjelző anyagok változása a pajzsmirigy jódfelvételi folyamatának modellezése során: 1. és 2. kompartment Nyomjelző anyagok változása a pajzsmirigy jódfelvételi folyamatának modellezése során: 1. és 3. kompartment Többszörös dózis modellje Nyomjelző anyagok változása többszörös dózis modellezése során Máj vémlásának modellje Kolloidok kiürülése májáramlás vizsgálata során Hétbemenetű, hétkimenetű dinamikus rendszer modellje Egy esemény (U1) bekövetkezésének modellezése hétbemenetű rendszerben vi

7 Műszaki és biológiai rendszerek elmélete 5.5. Három párhuzamosan bekövetkező esemény (U1, U3, U6) bekövetkezésének modellezése hétbemenetű rendszerben Folyadék hőmérséklet és folyadékmennyiség szabályozása Erőmű egyszerűsített blokkvázlata Erőmű hatásvázlata Keresztkapcsolatok kiküszöbölése segédváltozókkal Többparaméteres kapcsolt szabályozási rendszer Többparaméteres kapcsolt szabályozási rendszer hatásvázlata Többparaméteres kapcsolt szabályozási rendszer hatásvázlata külső, zavaró hatások figyelembevételével Kétparaméteres kapcsolt szabályozási rendszer stabilitás vizsgálata (példa) Többparaméteres kapcsolt szabályozási rendszer kompenzálása Kompenzálás ún. gyorsító elemek beiktatásával Gyorsító elemek beiktatásának eredménye (részleges invariancia) Nulltípusú szabályozás átmeneti függvénye Folytonos gradiens optimalizálási módszer Folytonos gradiens módszer megvalósítása Diszkrét gradiens módszer Relaxációs módszer Brutális beavatkozás módszere Számítógépes paraméteroptimalizáció gyakorlati alkalmazása Folyamat identifikáció Egy gyakorlati példa az identifikációra Az emberi agy Egy biológiai idegsejt szerkezeti hatásmechanizmusa Jeláthaladás az i-edik mesterséges neuronon A mesterséges neurális hálózat szokásos felépítése Egy neurális hálózat szimulációja A perceptron hálózat aktivációs függvénye A tanulóhalmaz pontjai Az osztályozást végző perceptron hálózat Aktivációs függvény eltolással A hálózat hibájának alakulása az iterációs lépések függvényében Az osztályok lineáris szeparációja perceptron hálózattal Az osztályok a validációs pontokkal A szigmoid függvény és függése az α paramétertől A tanulóhalmaz pontjai Backpropagáció hálózat rejtett réteggel és bias-szal A hálózat hibájának alakulása az iterációs lépések függvényében A hálózat lokális hibája Az előző osztályozási feladat megoldása két rejtett rétegű backpropagáció hálózattal A hiba csökkenése a tanuló halmazon és a validációs halmazon az iterációk számának függvényében A radiál bázis típusú aktivációs függvény A radiál bázis függvény típusú hálózat felépítése A Franke-féle teszt függvény A generált Halton-pontok A generált Halton-pontokon alapuló köbös spline interpoláció A hat csomópontot felhasználó RBF-hálózat konvergenciája A hat csomópontot felhasználó RBF-hálózat közelítése Az RBF-hálózat közelítésének hibája A diszkrét működésű Hopfield hálózat n = 2 csomópont esetén A folytonos Hopfield hálózat aktivációs függvénye A bemeneti vektor {0,4, 0,6} koordinátáinak konvergenciája az egyik egyensúlyi ponthoz {1, 1} A bemeneti vektor energia szintjének csökkenése a konvergencia során A különböző vonzási tartományokba eső pontok konvergenciája Az egyensúlyi pontoknak megfelelő alakzatok A házikó zajos képe mint induló vektor A trajektória egyes pontjaihoz tartozó alakzatok vii

8 Műszaki és biológiai rendszerek elmélete A kódvektor módosítása Az osztályozandó elemek Az osztályok kódvektorainak helyzete az iteráció során Hat kódvektor 2 3-as elrendezése 2D-ben kódvektor aszimmetrikus elrendezésben 2D-ben A sinc-függvény zajjal terhelt pontjai A 15 kódvektor elhelyezkedése Kvantált mérés pontfelhője Kvantált pontfelhőre illesztett spline felület Kvantált pontfelhő reprezentációja 225 kódvektorral A kódvektor pontokra illesztett spline felület Néhány gyakran alkalmazott fuzzy tagságfüggvény alak, melyek mindegyike a körülbelül öt halmazt írja le Az FCM algoritmus eredményeként kapott változatos fuzzy tagságfüggvény alakok Fent: étel minőségét leíró fuzzy tagságfüggvények. Lent: a kiszolgálás minőségét leíró fuzzy tagságfüggvények A borravaló fuzzy tagságfüggvényei A három étteremnek adott számszerű osztályzatok és azok illeszkedési mértékei a fuzzy tagságfüggvényekhez A kimenetek a három étterem esetében Szabályozó kör fuzzy szabályozóval Oszlopdiagram és kördiagram használata a rassz változó grafikus vizsgálatára Hisztogram és magfüggvényes sűrűségbecslése használata a születési tömeg változó grafikus vizsgálatára Az osztályközök számának megválasztása és a hisztogram alakja közti kapcsolat Boxplot használata a születési tömeg változó grafikus vizsgálatára Anyai és újszülött testtömeg szóródási diagramja. A függőleges és vízszintes szaggatott vonalak a két változó átlagát mutatják, a pontvonal pedig az az egyenes, melyre legjobban illeszkednek a pontok Példák különböző előjelű és abszolút értékű korrelációs együtthatójú (azaz különböző irányú és erősségű) kapcsolatokra Az Anscombe-kvartett Két példa egy próbafüggvény realizálódott értékére annak nulleloszlásán Elutasítási és elfogadási tartományok kijelölése az alsó és felső kritikus értékekkel α = 5% és α = 1%-os szignifikanciaszintekre standard normális nulleloszlásnál viii

9 A táblázatok listája 2.1. Változók maximális értékei A futó példa Low Infant Birth Weight adatbázisának változói főbb jellemzőikkel A futó példa Low Infant Birth Weight adatbázisának néhány megfigyelési egysége Gyakoriságok (peremeken a vetületi gyakoriságokkal) Relatív gyakoriságok (peremeken a vetületi megoszlásokkal) Rassz feltételes relatív gyakoriságai az irritábilis méh különböző kimenetei, mint feltétel esetén Irritábilis méh feltételes relatív gyakoriságai a rassz különböző kimenetei, mint feltétel esetén 155 ix

10 Műszaki és biológiai rendszerek elmélete Benyó Balázs, Benyó Zoltán, Paláncz Béla, Szilágyi László, Ferenci Tamás Budapesti Műszaki és Gazdaságtudományi Egyetem, Semmelweis Egyetem, 2014 Benyó Balázs, Benyó Zoltán, Paláncz Béla, Szilágyi László, Ferenci Tamás Typotex Kiadó, ISBN: Creative Commons NonCommercial-NoDerivs 3.0 (CC BY-NC-ND 3.0) A szerzők nevének feltüntetése mellett nem kereskedelmi céllal szabadon másolható, terjeszthető, megjelentethető és előadható, de nem módosítható. Készült a TÁMOP-4.1.2/A/1-11/ számú, Konzorcium a biotechnológia aktív tanulásáért című projekt keretében. x

11 Előszó A könyv interdiszciplináris jellegű ismeretanyagokat tartalmaz; egészségügyi (orvosbiológiai) mérnökhallgatók részére íródott, de hasznos ismereteket tartalmaz a téma iránt érdeklődő orvosok, biofizikusok, biokémikusok, élettanászok, bioinformatikusok számára is. Tekintettel a téma interdiszciplináris jellegére, alapvető fontosságú a közös nyelv, fogalomrendszer, szimbólumrendszer megalkotása, az azokhoz való következetes ragaszkodás. Különös gondot kell fordítani arra, hogy a téma kifejtése mind a műszakiak, mind a nem műszakiak számára egyaránt érthető legyen. A könyv feltételezi a matematikai, szabályozástechnikai, élettani alapismereteket, és az azok gyakorlati alkalmazása iránti igényt. Az ún. tipikus vizsgálójelek és azok alkalmazása, a kompartment (rekesz) modellek elmélete, a többparaméteres kapcsolt szabályozások vizsgálata (stabilitásvizsgálat, kompenzáció stb.), a folyamatoptimalizációs módszerek gyakorlati alkalmazása szükségessé teszi az időtartományban és az ún. frekvenciatartományban való jártasságot, az elvégzendő feladatok matematikai megfogalmazását és megoldását. A számítógépes szimulációs fejezet az előre specifikált kompartment rendszerek leképzésével (számítógépes modellezésével) foglalkozik. Az inverz feladat megoldása, a clearance (kiürüléses) vizsgálatok a számítógépes identifikáció egyik gyakorlati módszerét alkalmazzák. Külön kiemelendő egy új, a májáramlás vizsgálatára kidolgozott számítógépes identifikációs módszer. Az egyes témakörök jobb megértését gyakorlati példák segítik. A számítógépes optimalizációs módszerek a jövőben nagy jelentőséggel bírnak. Az ismertetett négyféle optimalizációs eljárás bemutatása segítheti azok jövőbeni alkalmazását. A könyv foglalkozik a számítógépes diagnosztika alapjainak ismertetésével is; ide tartozik az eseményfelismerés és a kóros elváltozások számítógépes diagnosztizálása. A könyv a mesterséges neurális hálózatok elméleti alapjait is tartalmazza (egyrétegű, többrétegű hálózatok, neurális hálózatok tanítása felügyelt és nemfelügyelt tanítással stb.). A könyv fontos része a fuzzy rendszerek elméleti alapjainak rövid áttekintése (fuzzy halmazok, fuzzy következtetés, fuzzy logika). Ismertetni fogjuk a szabályozási kör felépítését fuzzy szabályozóval. A könyv befejező része a biostatisztikáról szól. A biostatisztika gyakorlati tevékenység, célja tömegjelenségek egyedeire vonatkozó információk (adatok) gyűjtése, feldolgozása és elemzése, ennek alapján a vizsgált jelenség tömör, számszerű jellemzése. Az alapok ismertetése után mind az úgynevezett deskriptív (leíró), mind az induktív (következtető) statisztika alapjait bemutatjuk. xi

12

13 1. fejezet - Modellalkotás, folyamatanalízis, folyamatszintézis Modellezés, modellalkotás A különböző rendszerek, berendezések rohamos elterjedése az élet sokféle területén szükségszerű velejárója a tudomány és technika fejlődésének. Ezen berendezések megkonstruálásához, megépítéséhez egyre nehezebb feladatot kell megoldani a tervező és kivitelező mérnöknek egyaránt. A rendelkezésre álló lehetőségek közül meg kell határozni a célnak gazdaságilag és műszakilag legjobban megfelelő megoldást. A választott megoldás megtervezése után meg kell építeni a tényleges rendszert vagy berendezést. Ezen berendezés megépítése után válaszolni kell például olyan kérdésekre, hogy a rendszer egyes paramétereinek változása milyen befolyást gyakorol az egyes minőségi jellemzőkre. Előfordul, hogy ilyenkor nemcsak minőségi, hanem számszerű, mennyiségi eredményekre is szükség van. A vázolt követelmények teljesítésekor lineáris rendszereknél általában a rendszert leíró differenciálegyenlet vagy differenciálegyenlet rendszer megoldását végezzük el a különböző kiindulási feltételek figyelembevételével. Ez a klasszikus módszer még a legegyszerűbb fizikai rendszerek analízisében is igen fáradságos és sok időt vesz igénybe. A nehézségek tovább fokozódnak akkor, ha a vizsgálandó rendszer nemlineáris jelleggörbéjű, illetve változó paraméterű tagot tartalmaz. Ilyenkor a vizsgálat csak magas rendszámú, nemlineáris differenciálegyenletekkel írható le, amelyek analitikus megoldása sokszor lehetetlen. Különösen így van ez a rendszerek optimalizálásakor, ahol kevés ismeretünk van arra vonatkozóan, hogy az egyes paramétereket milyen értékűre válasszuk. Ilyen esetekben igen célravezető a hosszú, fáradságos és sokszor áttekinthetetlen számítási munka helyett a vizsgálatra szánt rendszer modelljének létrehozása, amelynek segítségével a fenti problémák viszonylag rövid idő alatt megoldhatóak. A modellalkotás lényege, hogy a vizsgálatra szánt rendszert vagy annak egy részét olyan más rendszerrel (modellel) helyettesítjük, amelynek fizikai tulajdonságai megegyeznek az eredeti rendszer fizikai tulajdonságaival. Ekkor a helyettesítő rendszerben (modellben) az eredeti rendszerben végbemenő folyamatokhoz hasonló jelenségek játszódnak le, amelyek különbözőképpen megfigyelhetők, kiértékelhetők és esetleg összehasonlíthatók az elméleti eredményekkel. Attól függően, hogy a modellezett rendszerben és a modellben a fizikai mennyiségek azonos vagy nem azonos természetűek, megkülönböztetünk fizikai és matematikai modellt. Vizsgáljuk meg, mi jellemzi e két különböző modellezési eljárást. Fizikai modell Ez tulajdonképpen nem más, mint az eredeti rendszer kicsinyített mása; például egy nagy villanymotor kicsinyített modellje, vagy egy kicsinyített repülőgép áramlástani vizsgálata szélcsatornában. Ennél a modellezési eljárásnál az analógia a két rendszer között szoros, a fizikai modellt az eredeti rendszerben lejátszódó jelenségeket jobban reprodukálja, még azokat a jelenségeket is, amelyek matematikailag esetleg le sem írhatók. Ezzel szemben nagy hátránya, hogy minden új folyamathoz új modellt kell létrehozni, ami általában költséges. Hátránya még, hogy a modellezett rendszer egyes paramétereinek változása (például villamos időállandó) igen nehezen (vagy egyáltalán nem) vihető át a modellre. Matematikai modell A matematikai modell olyan számítógép. amellyel a legkülönbözőbb fizikai rendszerek képezhetők le, illetve oldhatók meg. A matematikai modellnek a fizikai rendszereket helyettesítő létjogosultsága azon alapszik, hogy a fizikai folyamatokat leíró egyenletek (egyenletrendszerek) vagy differenciálegyenletek (differenciálegyenletrendszerek) és a matematikai modellt leíró egyenletek, illetve differenciálegyenletek megegyeznek, csak modellezési léptékkülönbség lehet köztük. Mivel a különböző mechanikai, villamos stb. rendszereket ugyanolyan jellegű egyenletek írják le, ezért a matematikai modell segítségével a különböző rendszerek leképezhetők, illetve megoldhatók. Ezzel az eljárással tehát azok a rendszerek modellezhetők jól, amelyek matematikailag leírhatók, így a matematikai modell nem lesz más, mint a vizsgált rendszer egyenleteit vagy differenciálegyenleteit megoldó szimulátor. Míg a fizikai modellben lejátszódó jelenségek általában azonos dimenziójúak a modellezett rendszerben lejátszódó jelenségekkel (tehát kis mintákról van szó), ezzel szemben a matematikai modellre (szimulátorra) ez általában nem teljesül. A modellezett fizikai rendszer különféle változóit a szimulátorban bizonyos fizikai mennyiséggel (feszültség, áramerősség stb.) képezzük le. A modern 1

14 Modellalkotás, folyamatanalízis, folyamatszintézis elektronikus számítógépek elterjedésével mindinkább a számítógép egyes pontjain mérhető feszültség tölti be a modellváltozó szerepét Modellalkotással kapcsolatos fontosabb kategóriák (törvény, struktúra, paraméter, állapotváltozó) A modellalkotás, kísérlettervezés nagy jelentőségűvé válik az élet minden területén, mivel a számítástechnika és az informatika rohamos fejlődése újabb és újabb lehetőségeket nyújt olyan feladatok megoldására, amelyekre korábban nem volt lehetőség. A technika fejlődésével egyre bonyolultabb rendszerek kerülnek megalkotásra. Ezek optimális megtervezéséhez és megépítéséhez nagyszámú bonyolult számításra van szükség. A múlt században az élő és az élettelen jelenségekkel foglalkozó tudományterületek összekapcsolódásának lehettünk szemtanúi. Ennek eredményeként új tudományterületek jöttek létre, mint a biokémia, orvosfizika, biomechanika, biotechnológia vagy a bioinformatika. Ezek az ún. interdiszciplináris tudományok ma már önálló fogalom- és eszközrendszerrel (szimbólumok, jelölésrendszer stb.) bírnak. A matematikai modellek a rendszer viselkedését írják le. Ha az összefüggések közönséges algebrai egyenlettel (egyenletrendszerrel) kifejezhetők, akkor statikus modellekről beszélünk, ha pedig differenciálegyenlettel (egyenletrendszerrel) fejezhetők ki, akkor dinamikus modellekről van szó. A modellek természetesen alkalmasak élő rendszerek, élettani folyamatok leképzésére is. Nagyszámú elemből (kompartment) álló rendszerek viselkedése általában nehezen írható le determinisztikus modellekkel, sokszor csak statisztikus összefüggésekkel jellemezhetők (biostatisztika). A biostatisztika tudománya ma már önálló tudománnyá fejlődött, és széleskörű alkalmazást nyert az élet minden területén. A számítógépes modellalkotás jelentősége az egyre nagyobb teljesítményű számítógépek elterjedésével napjainkra rohamosan megnőtt. Ez óriási mértékben elősegíti a személyre szabott diagnosztizálást, a betegségmegelőzés és a kezelés lehetőségeit. A számítógépes modellezést és szimulációt minden területen (élő és élettelen rendszerekben) sikerrel lehet alkalmazni. A számítógépes folyamatszimuláció lépéseit az 1.1. ábra mutatja be ábra - A folyamatszimuláció lépései 2

15 Modellalkotás, folyamatanalízis, folyamatszintézis Az ábrán látható két különböző eset, a folyamatanalízis és a folyamatszintézis gyakorlati megkülönböztetése a következő. Ha a rendszer már létezik, feladatanalízisről beszélünk. Egy élő vagy élettelen (például technikai) rendszert vizsgálunk, és különböző behatásoknak tesszük ki a modellt valamilyen célból (például hogy jobb hatásfokkal működjék, kevesebb energiát használjon fel). Ha a rendszer még nem létezik a valóságban, a tervezés folyamatában van, strukturális beavatkozásokra is van lehetőség. Ebben az esetben feladatszintézisről beszélünk. A gyakorlati életben mind a feladatanalízist, mind a feladatszintézist alkalmazzák. Foglaljuk össze a modellalkotással kapcsolatos főbb fogalmakat. A modellel kapcsolatos fontosabb kategóriák: Törvény: alapvető, rendszerint matematizálható összefüggések rögzített érvényességi körben. Például energiamegmaradás, Ohm törvénye, vérnyomás és életkor összefüggése. Ezek a törvények maguk is modellek, jellemzőik: matematikai formalizmus, 3

16 ismeretet, összefüggést rögzítenek, sokszor nem ok-okozati összefüggést írnak le, fejlődnek, pontosabbá válnak, érvényességi körük változik. Struktúra: részekre bonthatóság, részek egymáshoz kapcsolódása, hatásmechanizmus. Modellalkotás, folyamatanalízis, folyamatszintézis Paraméter: a részekre bontott modell elemeinek konkrét viselkedését meghatározó értékek. Állapot (Állapotváltozó): a részekre bontott modell egyes elemeinek jellemzői, melyek a rendszer egészének meghatározó viselkedését írják le. Fogalmak: Rendszer: Objektumok olyan halmaza, amelyek között valamilyen kölcsönhatás vagy függőségi viszony van. Modell: A valóságos rendszer reprezentációja. Kísérlet: A rendszer vagy modellje viselkedésének megfigyelése adott feltételhalmaz mellett. A rendszervizsgálatok fő fázisai: 1. A probléma megfogalmazása. 2. A vizsgált rendszert reprezentáló matematikai modell készítése. 3. Megoldás a modell segítségével. 4. A modell segítségével nyert megoldás vizsgálata. 5. Az eredmény befolyásolási lehetőségeinek kialakítása. 6. Az eredmény realizálása: implementálás, optimális rendszerparaméterek meghatározása Tipikus vizsgálójelek és azok információtartalma A következőkben megvizsgáljuk a gyakorlatban alkalmazott különböző vizsgálójeleket és azok információtartalmát ábra - Egy bemenetű és egy kimenetű rendszer 4

17 Modellalkotás, folyamatanalízis, folyamatszintézis Egy bemeneti jelű (x(t)) és egy kimeneti jelű (y(t)) rendszer (1.2. ábra) működését az alábbi lineáris n-edrendű általános differenciálegyenlet (1.1) írja le: (1.1) Az (1.1) egyenlet lineáris, időinvariáns n-edrendű differenciálegyenlet, ahol y (n) (t) a kimeneti változó n-edik deriváltja, x (m) (t) pedig a bemeneti jel m-edik deriváltja. A rendszer (folyamat) realizálhatóságának feltétele n m. A differenciálegyenlet általános megoldása a homogén egyenlet általános megoldásának (y h(t)) és az inhomogén egyenlet egy partikuláris megoldásának (y p(t)) szuperpozíciójaként állítható elő, vagyis: 1.3. ábra - A Dirac-impulzus (1.2) Az ideális Dirac-impulzust akkor kapjuk, ha τ-val tartunk 0-hoz. Ezt a gyakorlatban nem tudjuk megvalósítani, mert az a végtelenhez tartana, mivel a gyakorlatban nem tudunk olyan jelgenerátort alkotni, amely végtelen nagyságú jelet tudna idő alatt produkálni. Ha a bemenőjel a Dirac-impulzus, ebben az esetben az x(t) kimeneti jel a rendszer súlyfüggvénye, vagyis: (1.3) 1.4. ábra - Egységugrás 5

18 Modellalkotás, folyamatanalízis, folyamatszintézis Ha a bemenetre egységugrást kapcsolunk, akkor a kimenőjelet átmeneti függvénynek nevezzük: Ez a vizsgálójel kiemelt jelentőséggel bír, mert a gyakorlatban könnyen realizálható, vagyis a rendszer átviteli függvénye egyszerűen előállítható. A súlyfüggvény és az átmeneti függvény szoros kapcsolat van, egymásból könnyen realizálhatók, vagyis: (1.4) (1.5) Ezt nagyon gyakran kihasználjuk a gyakorlatban ábra - Egység sebességugrás 1.6. ábra - Egység gyorsulásugrás 6

19 Modellalkotás, folyamatanalízis, folyamatszintézis Az vizsgálójelek soros kapcsolatban vannak, egymásból differenciálás és integrálás műveletével származtathatók, ezért az 1.5-ös és 1.6-os vizsgálójelet ritkábban alkalmazzuk a gyakorlatban. Az 1.3-as és 1.4- es jelnek van kitüntetett szerepe a rendszervizsgálatoknál ábra - Szinuszos vizsgálójel 7

20 Modellalkotás, folyamatanalízis, folyamatszintézis Lineáris rendszerekben ha szinuszos a bemenőjel, a kimenőjel is szinuszos. A kimenőjel szinusz és a bemenőjel szinusz hányadosa a rendszer amplitúdó fázis függvényét adja, vagyis: (1.6) Az amplitúdó fázis függvény kiemelt jelentőséggel bír a rendszerek stabilitásvizsgálatánál (Nyquist stabilitásvizsgálat) ábra - Példa tetszőleges vizsgálójelre 8

21 Modellalkotás, folyamatanalízis, folyamatszintézis Ha ismerjük a bemenőjel és a kimenőjel Laplace transzformáltját (X(s) és Y(s)), akkor előállíthatjuk a rendszer átviteli függvényét (W(s)): (1.7) Az átviteli függvény nagy előnye, hogy jól lehet alkalmazni a rendszervizsgálatoknál (szimuláció, identifikáció). Segítségével a bonyolult differenciálegyenletek leegyszerűsödnek algebrai egyenletekké és egyenletrendszerekké, s a szükséges átalakítások elvégzése után az operátoros tartományból visszaléphetünk az időtartományra. Ismert, hogy tetszés szerinti T periódusidejű periodikus függvénynek létezik Fourier-sora. Legyen a jel körfrekvenciája, ekkor: (1.8) A Fourier-sor együtthatói az alábbi összefüggésekkel számíthatók ki: (1.9) A Fourier-sor komplex alakban is felírható. Ebben az esetben az alábbi összefüggést használjuk: (1.10) 9

22 Fourier-spektrumok meghatározása Modellalkotás, folyamatanalízis, folyamatszintézis Nem periodikus függvényekhez lehetőség van rendszervizsgálatokra. Nem periodikus függvény felírható az alábbi alakban: (1.11) ahol az a(ω) és b(ω) az ún. amplitúdó sűrűségfüggvény: (1.12) Egységugrás abszolút integrálja nem véges, ezért egy trükköt alkalmaztunk a spektrum meghatározásához. Ennek lényege látható az 1.9. ábrán ábra - Egységugrás függvény származtatása A fenti négyszögjelből úgy kapunk egységugrást, hogy hozzáadunk 1-et, majd zsugorítjuk felére, és T periódusidővel tartunk a végtelenbe. Mivel a kiindulási függvény páratlan, ezért a DC-komponenst, (vagyis az egyenáramú részt) leszámítva a(ω) nulla, b(ω) pedig az alábbi értékhez tart: (1.13) Ennek alapján meghatározható a b(ω), amely az ábrán látható különböző T-re vonatkozó spektrum képe. Jól látható, hogy T növelésével a spektrum sűrűsége nő, de különböző súllyal ábra - Egységugrás spektrumának közelítése 10

23 Modellalkotás, folyamatanalízis, folyamatszintézis Közelítsük a Dirac-impulzust a következő módon (1.11. ábra): (1.14) ábra - Dirac-impulzus közelítése Mivel a jel páros, ezért b(ω) mindenütt nulla, a(ω) pedig: (1.15) Az a(ω) amplitúdó először frekvencián veszi fel a nulla értéket. Ha τ-t közelítjük a nullához, a spektrum közelíteni fogja az ideális Dirac-impulzus spektrumát (1.12. ábra) ábra - Dirac-impulzus spektrumának közelítése 11

24 Modellalkotás, folyamatanalízis, folyamatszintézis Véges szinuszvonulat (hullámvonulat, ábra) spektrumát az alábbi összefüggések adják: (1.16) A spektrum τ növelése esetén az ábrán látható. Megfigyelhető, hogy közelíti a végtelen szinuszvonulat spektrumát, ha τ tart végtelenhez ábra - Véges szinuszvonulat 12

25 Modellalkotás, folyamatanalízis, folyamatszintézis ábra - Véges szinuszvonulat spektruma Konklúzió A fentiekben megvizsgáltuk a vizsgálójeleket és azok spektrumát. Megállapítottuk, hogy a Dirac-impulzusnak a spektruma végtelen, tehát az lenne a legmegfelelőbb a rendszerek modellezéséhez, identifikációjához. Ugyanis 13

26 Modellalkotás, folyamatanalízis, folyamatszintézis ω=[0, ] tartományban megmutatja a rendszer viselkedését (a teljes Nyquist diagramot nyerjük) szemben egy szinuszos vizsgálójellel, amely a Nyquist diagramnak (1.15. ábra) csak egy pontját jelöli meg ábra - Nyquist diagram Mivel a gyakorlatban a Dirac-impulzus mint vizsgálójel nem megvalósítható, helyette az egységugrást választjuk vizsgálójelként. Ennek a spektruma is folytonos, de az egyes frekvenciák különböző súllyal szerepelnek (lásd az ábrán). Ezért a vizsgálatokat egységugrásra végezzük, egységugrásra vonatkozó átmeneti függvényeket számolunk. A Nyquist diagram, amely szinuszos gerjesztésre vonatkozik, fontos szerepet tölt be a rendszerek stabilitásvizsgálatánál (Nyquist-féle stabilitási kritérium). 14

27 2. fejezet - Amplitúdó- és időléptékezés Léptéktényezők szükségessége A számítógép egyes változóinak állandó kapcsolatát a leképzett fizika rendszer megfelelő változóival a léptéktényezők biztosítják. A fizikai rendszer egyes jellemzőinek (paramétereinek) változását a modellben legtöbbször feszültségváltozások képviselik. Ezen feszültségváltozásoknak jól meghatározott értékek közé kell esniük. Ez számítógépeknél általában ±10 V. Ez azt jelenti, hogy az egyes számítógépváltozók értékei nem haladhatják meg ezen értéket ( gépi egység ). A fizikai rendszer egyes változói általában nemcsak dimenzióban különböznek a gépi számítógépváltozóktól, hanem értéktartományuk is különböző. A léptéktényezők tehát azért szükségesek, hogy a leképzett fizikai rendszer egyes változóinak állandó kapcsolatát rögzítsék a másik rendszer (számítógép) modell megfelelő változóival. Ez az amplitúdó- és időléptékezéseken keresztül valósul meg Amplitúdóléptékezési eljárások Az amplitúdó léptékezésének számos módja van, mi kétféle eljárást ismertetünk Normalizált változók módszere (Relatív egységekkel való számolás) A modellezett fizikai rendszer változói és a számítógép egyes pontjain mérhető feszültségek közötti analógiát úgy a legegyszerűbb értelmezni, hogy a számítógép kimenetét normalizált mennyiségeknek tekintjük, vagyis relatív mennyiségekkel számolunk. Ha feltételezzük, hogy U KM a számítógép kimenetén a maximális amplitúdószint, akkor valamelyik u k kimenőjel a megengedett referencia-amplitúdó (U KM) törtrészének tekinthető. Ugyanúgy bármely fizikai változó (x k) (elmozdulás, sebesség stb.) kifejezhető valamely ismert vagy feltételezett maximális érték (X KM) törtrészeként. Ha ezt elvégezzük a vizsgált rendszer változóira és a számítógépben előforduló változókra, akkor a megfelelő változók között a következő egyenlet írható fel: (2.1) A (2.1) összefüggés ennek a módszernek az alapösszefüggése. Az egyenlet két oldalán álló mennyiségek dimenziónélküli relatív mennyiségek, amelyek 1 és +1 között változhatnak. Ha például X KM = 10 cm, akkor a számítóelem (integrátor, szummátor stb.) kimenőjelét -zel jelöltük. Ez azt jelenti, hogy ha a számítás folyamán az változó értéke 0,2 (a referencia 0,2-szerese), akkor az ennek megfelelő x k értéke: Ha a számítógép feszültségtípusú, és a referenciafeszültség (U KM) értéke 10 V, akkor ez azt jelenti, hogy az elem kimenetén ebben az esetben ténylegesen 20 V feszültség mérhető. Ennek az amplitúdóléptékezési módszernek nagy előnye, hogy megszünteti annak a szükségességét, hogy a számítógépen levő feszültségeket más mértékegységekre vonatkoztassuk. Ezzel egyidejűleg úgy léptékezi a problémát, hogy a megoldás ideje alatt a gépen lévő feszültségek (vagy áramerősségek) a csaknem maximálisan használható tartományban változnak, ezáltal biztosítva a gépből nyerhető maximális pontosságot Dimenziós léptéktényezők 15

28 Amplitúdó- és időléptékezés A másik léptékezési módszer, amelyet széles körben használnak alakú amplitúdólépték-tényezőket használ. Ez azzal magyarázható, hogy a probléma valamelyik x k változóját a számítógépben egy x k-val arányos u k feszültség képviseli, vagyis: ahol a K állandót léptéktényezőnek nevezzük. Értéke: (2.2) (2.3) A (2.2) egyenlet felhasználásával léptékezett elem kimenetén mért feszültséget tehát el kell osztani a K léptéktényezővel, hogy megkapjuk a tényleges fizikai változó értékét. Például ha 30 V feszültséget mérünk a 10 x k-val jelölt erősítőn, akkor felírható: 30 V = 10 x k. Innen: x k = 3 [egység]. A (2.3) egyenletből látható, hogy K léptéktényezőt úgy határozzuk meg, hogy az kisebb vagy nagyobb legyen, mint 100 V (U KM) osztva a változó abszolút értékének maximumával. A fenti amplitudóléptékezési módszer természetesen ugyanarra az eredményre vezet, mint a normalizált változók módszere, így bármelyik módszer választható. Ügyelni kell azonban arra, hogy kezdeti feltételekre is alkalmazzuk a fenti léptékezési eljárásokat. Végezzük el az alábbi differenciálegyenlet amplitúdóléptékezését: (2.4) A kezdeti feltételek legyenek: (2.5) és Tételezzük fel, hogy a változók abszolút értékeinek maximumai: (2.6) A normalizált változók módszerét alkalmazva és az egyes differenciálhányadosokat ponttal jelölve a következőképpen írható fel a (2.4) egyenlet: (2.7) Az egyenlet elosztva 32-vel, a következőt kapjuk: 16

29 Amplitúdó- és időléptékezés (2.8) A kezdeti feltételeket is normalizált alakra kell hozni. Ezek: (2.9) és A (2.8) és (2.9) egyenletek alapján a léptékezett számítási vázlat megszerkeszthető Időléptékezés Bevezetés Az idő léptéktényező megválasztásakor ismerni kell magát a fizikai rendszert, meg kell becsülni a rendszerben lejátszódó jelenségek időtartamát, és ismerni kell magát a számítógépet, amely ezt a fizikai rendszert leképzi. Vannak igen gyorsan változó fizikai jelenségek (például magreakciók), amelyek igen nagy információátviteli sebességet jelentenek. Ahhoz, hogy ilyen jelenségeket számítógépen vizsgálni tudjunk, a folyamatot megfelelő mértékben le kell lassítani (időlépték változást kell eszközölni), úgy, hogy a rendszer információközlési sebessége közel essen a számítógép információfeldolgozási sebességéhez. Más jelenségek igen lassan játszódnak le a valóságban (például hő-kicserélő). Ilyen esetben a számítógép időléptékét úgy állapíthatjuk meg, hogy a gépben lejátszódó jelenségek gyorsabban mennek végbe, mint a tényleges rendszerben. Ez két okból előnyös: 1. Kisebb a valószínűsége annak, hogy az egyes elemek ellenőrizhetetlen változásai bekövetkeznek a számítógép különböző részein. Például az erősítők null szinteltolódása, (drift) szorzók és tápegységek referenciaszint eltolódása kisebb, valamint a hőmérséklet- és nedvességváltozások hatása az egyes passzív elemekre nem olyan jelentős. 2. Törekszünk a számítógép idejének maximális kihasználására (gazdasági szempont). Az egyes számítóelemek között nagy sebességbeli különbség van. Ezért az idő léptéktényezőt gyakran a számításhoz szükséges és rendelkezésre álló műveleti elemek határozzák meg Időléptékezés megvalósítása Időlépték változás többféleképpen érhető el. Az itt bemutatásra kerülő módszer a rendszer differenciálegyenletének az időléptékét változtatja meg. Ha t-vel jelöljük a fizikai rendszer független változóját és τ-val a számítógép független változóját, akkor a következő összefüggés írható fel a két változó között: (2.10) ahol: T M a fizikai rendszerben lejátszódó jelenség időtartama, τ M a számítógépben lejátszódó jelenség időtartama. A (2.10) egyenletből η : 17

30 Amplitúdó- és időléptékezés (2.11) ahol: (2.12) A (2.11) összefüggés az időlépték változás alapösszefüggése. Ha n > 1, például 5, ez azt jelenti, hogy a fizikai rendszermegoldás lelassult. (Ugyanígy ha n < 1, akkor felgyorsult a számítógépben lejátszódó analóg jelenség). Tehát az n megválasztásával az időlépték változtatás egyértelműen végrehajtható. Így a differenciálegyenlet időlépték változtatása végrehajtható, ha t változó helyébe differenciálhányadosokra a következő transzformációt alkalmazzuk: -t helyettesítünk és az egyes (2.13) Az így alakított egyenletek független változója a számítógép független változója viszont τ, tehát szükségszerűen a számítógépen megoldott egyenlet független változójának is τ-nak kell lennie. Vezessünk be egy új független változót, -t, amelyre igazak a következők: (2.14) Ennek differenciahányadosai a következők lesznek: (2.15) A (2.16) egyenletnek megfelelően átírt differenciaegyenletek független változója már η lesz (megegyezik a számítógép független változójával), ezért ezek az egyenletek már közvetlenül megoldhatók a számítógépen. Az ily módon bevezetett új változó (2.14) segítségével elértük azt, hogy a számítógép és a transzformált egyenlet egyes változói között 1:1-es összefüggést kapunk, vagyis ha összevetjük a (2.13) és a (2.15) egyenleteket, akkor igaz: (2.16) A (2.16) egyenletből látható, hogy a számítógép változóra (τ) való áttérés egyszerű helyettesítéssel történik. Nézzük meg a következő differenciaegyenlet léptékezését. A differenciaegyenlet: 18

31 Amplitúdó- és időléptékezés (2.17) A kezdeti feltételek legyenek: (2.18) Tegyük fel, hogy a maximális értékek: (2.19) A differenciaegyenlet időlépték változtatása véghezvihető a (2.13) egyenletek felhasználásával és helyettesítésével. Ezt elvégezve kapjuk a következőt: (2.20) A számítógép változókra áttérve a (2.15) és a (2.16) összefüggések alapján a következőt kapjuk: (2.21) Ez az egyenlet már közvetlenül megoldható a számítógépen. A kezdeti feltételeket is átírva τ változóra, a következő értékek adódnak: (2.22) A differenciálhányadosok maximális értékét is átírva kapjuk az alábbiakat: (2.23) Legyen n = 0,2 (ötszörös gyorsítás). A (2.21), (2.22), (2.23) összefüggéseket ennek megfelelően átírva és az egyes differenciálhányadosokat ponttal jelölve kapjuk: (2.24) (2.25) 19

32 Amplitúdó- és időléptékezés (2.26) Ezzel az időléptékezés készen van. Ezután az amplitúdóléptékezést végezzük el a (2.26) egyenletek felhasználásával. (Az időlépték változtatás megváltoztatja a (2.19) összefüggésekben szereplő maximális értéket!) A dimenziós léptéktényezők módszerét alkalmazva és feltételezve, hogy az üzemi jeltartomány ±100 V, az egyes léptéktényezők: (2.27) A kényelmesebb számolás kedvéért kissé nagyobb maximumokat tételezünk fel, és a következő léptéktényezőket választjuk: (2.28) A (2.24) egyenletet alakítsuk át úgy, hogy (2.28) léptéktényezők a megfelelő változók együtthatói legyenek. E célból szorozzuk meg a (2.24) egyenlet mindkét oldalát -el, és így az alábbiakat kapjuk: (2.29) A kezdeti feltételek pedig: (2.30) Ezzel mind az idő-, mind az amplitúdóléptékezés feladatát elvégeztük, s a (2.29) és (2.30) egyenleteknek megfelelő számítási vázlat elkészíthető A változók maximális értékeinek közelítő meghatározása Mind az amplitúdó-, mind az időléptékezésnél szükségünk van az egyes változók maximális értékére. (A maximális értéken most a változók abszolút értékének maximumát értjük.) Ezek rendszerint rendelkezésünkre állnak a fizikai rendszerről nyert előzetes ismereteinkből, vagy pedig közelítő értékeket veszünk fel, megbecsüljük őket a rendszer ismeretéből és matematikai leírásából. Két probléma állhat elő ilyenkor: 1. Ha valamely megbecsült érték a valóságban nagyobb, mint amennyit feltételezünk, akkor e változót képviselő elem (például erősítő) kimenete telítésbe kerül. A korszerű számítógépek védelemmel vannak ellátva, amely ilyenkor leállítja a számítást, és hibaüzenet képződik. 20

33 Amplitúdó- és időléptékezés 2. Ha a megbecsült maximális érték csak egy törtrésze a valóságos maximális értéknek, akkor a számítógépek működési tartományának (± 100 V) csak egy kis része van kihasználva, és ezzel az elérhető pontosság egy része elvész. (Sajnos olyan védelem nincs a számítógépbe beépítve, amely ezt megakadályozná.) Másodrendű állandó együtthatójú differenciálegyenletek változóinak maximális értéke Vizsgáljuk meg a (2.31) másodrendű differenciálegyenletet. Feltételezzük, hogy a kezdeti feltételek értéke és a csillapítás (A1) zérus. A (2.31) egyenlet megoldása l (t) alakú bemenőjel hatására: (2.32) ahol ω 0 a rendszer csillapítatlan sajátfrekvenciája. Értéke (2.33) x k maximális értéke, mert (cos ω 0 t) maximuma 1. Az első és második differenciálhányados maximális értékét közvetlen differenciálással határozzuk meg a (2.32) egyenletből. Ezt elvégezve kapjuk: (2.34) Innen a két amplitúdó felső határa: (2.35) A (2.35) egyenletből látható, hogy a feltételezett és a valóságos maximális értékek különbsége az ω 0 értékétől függ. Ha a kezdeti feltételek és a csillapítás nem zérus értékek, valamint a bemenőjel nem egységugrás, akkor a (2.35) egyenletek módosulnak. A fenti összefüggések (2.35) másodrendű egyenletekre érvényesek, és csak akkor jó közelítések, ha a karakterisztikus közelítések, a karakterisztikus egyenlet gyökei az imaginárius tengelyre esnek Egyenlő együtthatók szabálya Vizsgáljuk meg a következő n-edrendű differenciálegyenletet: (2.36) 21

34 Amplitúdó- és időléptékezés Egységugrás alakú gerjesztőfüggvény esetén: (2.37) Zérus kezdeti feltételek esetén, t = 0 időpontban a kimenőjel és annak differenciálhányadosai az (n 1)-edik differenciálhányadosig bezárólag zérusértékűek. Ezért a (2.36) egyenlet a t = 0 időpillanatban a következő alakban írható fel: (2.38) A legmagasabb rendű tag, az következő: a maximális értékét a t = 0 időpillanatban veszi fel. Ennek magyarázata a Valamely t = (0 + Δt) időpontban a kimenőjel és annak differenciálhányadosai felvesznek valamely értéket. Mivel a (2.36) egyenletnek minden időpontban fent kell állnia, és az egyenlet jobb oldala állandó (A) érték, ezért az egyenlet bal oldalának is állandónak kell lenni. Ha a kimenőjel és annak differenciálhányadosai nem zérusértékűek, akkor a legmagasabb rendű tagnak le kell csökkenni a t = 0 időpontban felvett értékről valamely, a t = 0-ben felvett értéknél kisebb értékre. A fentiek alapján belátható, hogy a legmagasabb rendű tag mint változó a maximális értékét a t = 0 időpillanatban veszi fel, és ennek nagysága a (2.38) egyenletből (2.39) értékű. A t = időpontban, ha beáll valamely állandósult állapot, akkor a kimenőjel összes differenciálhányadosa zérusértékű, vagyis a (2.36) egyenlet a következő alakba írható: Ha a karakterisztikus egyenlet gyökei mind valósak, akkor a kimenőjel maximális értéke (X KM) a (2.40) alapján: (2.40) (2.41) Ha van két konjugált gyök az imaginárius tengelyen, akkor az x k(t) maximális értéke: (2.42) A fentieket összegezve, a következőt mondhatjuk el: A közönséges lineáris állandó együtthatójú differenciálegyenlet együtthatóiból a legmagasabb rendű tag maximális értékét (X KM) jó közelítéssel meg tudjuk határozni, míg a nulladrendű tag, az x k(t) maximális értéke és értékek közé esik, attól függően, hogy a karakterisztikus egyenlet gyökei hol helyezkednek el a bal oldali számsíkon. Írjuk át a (2.43) egyenletet normalizált alakra, figyelembe véve a (2.43) összefüggést és feltételezve, hogy a gyökök közel esnek a képzetes tengelyhez. Így: (2.43) A (2.43) egyenlet olyan szabályhoz vezet, amelyet Jackson az egyenlő együtthatók elvének nevezett. A maximális értékek közelítő értékét úgy határozzuk meg, hogy a fenti normalizált egyenletben az összes 22

35 Amplitúdó- és időléptékezés együtthatót egyenlővé tesszük, azzal a megszorítással, hogy az így nyert maximális értékek monoton sort alkotnak. Ha minden kezdeti feltétel zérus, és x b(t) egységugrás, akkor az együtthatójának kétszerese kell legyen. együtthatója a többi kifejezés Az egyenlő együtthatók szabálya alapján az meghatározásához a következő összefüggést írhatjuk fel: (2.44) Innen: (2.45) A (2.45) összefüggésből az (n 1)-dik differenciálhányados maximális értéke meghatározható. Ugyanígy tetszőleges differenciálhányados maximális értékét meghatározhatjuk az (2.46) kifejezés segítségével. Még egyszer hangsúlyozzuk, hogy a nulladrendű tag maximális értékének az értéket, az n-edik rendű tag maximális értékének pedig az értéket vesszük. Ha a kezdeti feltételek nem zérusok, a maximális értékeket rendszerint ennek megfelelően módosítani kell. Az egyenlő együtthatók szabálya empirikus szabály, amelynek analitikus magyarázatát még nem adták meg, az esetek többségében azonban jó közelítést ad. Vizsgáljuk meg a (2.47) másodrendű differenciálegyenletet az zérus kezdeti feltételek esetén. A (2.47) egyenlet normalizált alakra hozva és az egyes differenciálhányadosokat ponttal jelölve kapjuk a következőket: (2.48) Az egyenlő együtthatók szabályát alkalmazva a másodrendű tag maximális értéke: (2.49) Az elsőrendű tag maximális értékét a következő összefüggésből határozzuk meg: (2.50) 23

36 Amplitúdó- és időléptékezés Innen értéke: (2.51) A nulladrendű tag maximális értékét az (2.52) összefüggésből meghatározva: (2.53) Az X KM-re kapott (2.53) kifejezés segítségével és -et kifejezve kapjuk: (2.54) A (2.53) kifejezésből látható, hogy míg az X KM kifejezés azonos az X KM-re levezetett korábbi (2.42) kifejezéssel, addig az -re kapott kifejezés ξ = 0,5-től eltekintve különbözik az X KM-re kapott (2.42) kifejezéstől. Nyilvánvalóan, ha 2ξ tart a zérus értékhez, az maximális értéke nem lesz végtelen, mint lenne, ha az egyenlő együtthatókhoz ragaszkodnánk. Ezért tettük a fenti szabályhoz azt a megszorítást, hogy nem minden estben ad elfogadható eredményt, de az esetek többségében alkalmazható. Nézzünk egy másik példát az alkalmazásra. Legyen a következő harmadrendű differenciálegyenlet: A kezdeti értékek: (2.55) (2.56) A (2.50) egyenletnek megfelelő normalizált egyenlet, figyelembe véve, hogy (2.57) vagy (2.58) A maximális értékék a (2.57) és a (2.58) egyenletekből leolvashatók, ezek: (2.59) 24

37 Amplitúdó- és időléptékezés A (2.55) differenciálegyenlet tényleges maximális értékei a következők: (2.60) Összehasonlítva a tényleges maximális értékeket (2.60) a becsült maximális értékekkel (2.59) látszik, hogy a feltételezett maximális értékek jól egyeznek a tényleges maximális értékekkel. Gyakorlásképpen határozzuk meg egy negyedrendű differenciálegyenlet maximális értékeit az egyenlő együtthatók szabálya segítségével. A differenciálegyenlet: A kezdeti értékek: (2.61) (2.62) A negyedrendű tag maximális értéke, az a (2.61) egyenletből: (2.63) Az értékének ismeretében írjuk át a (2.61) egyenletet normalizált egyenletté. Így a következőket kapjuk: (2.64) A (2.64) egyenlet mindkét oldalát elosztva 20-szal, az alábbiakat kapjuk: (2.65) A (2.65) egyenletből kiolvasható változók közelítő maximális értékeit és a tényleges maximális értékeket a 1. táblázatban foglaltuk össze: 2.1. táblázat - Változók maximális értékei Függő változó Közelítő maximális érték Tényleges maximális érték , ,4 X KM

38 Amplitúdó- és időléptékezés Összefoglalás A fizikai rendszereket leíró matematikai egyenletet, amelyben a függő és a független változók a legkülönbözőbb dimenziójú fizikai mennyiségek, és az értéktartományuk is tetszőleges, át kell transzformálni olyan gépi egyenletté, amely programozható és megoldható a számítógépen. A számítógépen megoldott egyenletek függő változója a feszültség, független változója az idő. Kapcsolatot kell tehát teremteni a számítógép valamely számítóelemének kimenetén egy adott időpontban mért feszültségérték és a fizikai rendszer azon jelhordozó mennyiségének ugyanezen időponthoz tartozó értéke között, amelyet ezen számítóelem feszültsége reprezentál. Ez az amplitúdó- és időléptékezéssel valósul meg. Az amplitúdóléptékezéssel a vizsgált fizikai rendszer függő változói és a számítógép függő változója (feszültség) között létesítünk kapcsolatot. Erre két módszert ismertünk meg. 1. A számítógép függő változóját (feszültség) kifejezhetjük ezen függő változó maximális értékének (X KM) törtrészeként, így a gépi változó és a fizikai rendszer változója között 1:1-es megfeleltetést tehetünk meg. Ilyenkor a megoldás regisztrátumát is relatív egységben skálázzuk, amely 1 és +1 között változhat. Nagy előnye ennek a módszernek, hogy a számítógépváltozókról a fizikai rendszer változójára minden időpillanatban könnyűszerrel, egyszerű szorzással áttérhetünk. 2. A fizikai rendszert leíró differenciálegyenlet valamely függő változójának kapcsolatát a gépi függő változóhoz biztosíthatjuk egy K i dimenziós léptéktényezővel. A fizikai rendszereket leíró differenciálegyenleteket úgy írhatjuk át gépi egyenlet -té, hogy meghatározzuk minden egyes függő változó léptéktényezőjét, és a differenciálegyenletet úgy rendezünk át, hogy az új változók az eredeti változók K i- szeresei legyenek (ahol K i a megfelelő függő változóhoz tartozó léptéktényező). Ennél az eljárásnál valamely számítóelem kimenetén ténylegesen mért feszültségértékből a feszültségeknek megfelelő fizikai változó értékét egy adott időpontban a K i léptéktényezővel való osztással tudjuk meghatározni. Az ismertetett két amplitúdóléptékezési eljárás ugyanazon problémának két különböző megfogalmazása, ami természetesen ugyanarra az eredményre vezet, így bármelyik módszer egyaránt használható. Mindkét módszernél szükségünk van a fizikai rendszer változóinak közelítő maximális értékére. Ez a fizikai rendszer ismerete alapján meghatározható vagy megbecsülhető. Ha a fizikai rendszerről a differenciálegyenleteken kívül több ismeret nem áll rendelkezésünkre, akkor az esetek többségében igen jól alkalmazható az egyenlő együtthatók ismertetett szabálya. Ha az így meghatározott maximális értékekkel elvégezve a próbaszámítást kiderülne, hogy a tényleges maximális értékek nagyon eltérnek ezektől a maximális értékektől, akkor a szükséges korrigálás (utánállítás) elvégezhető. Az időléptékezésnek számos módja van. Az ismertetett módszer a fizikai rendszert leíró differenciálegyenlet időléptékét változtatja meg úgy, hogy az a számítógépen közvetlenül megoldható legyen. Ez az időléptékezési eljárás megváltoztatja a differenciálegyenlet változóinak maximális értékét, ezért ha ezt a módszert alkalmazzuk, akkor mindig az időléptékezéssel kezdjük a differenciálegyenletek léptékezését. Ha az időléptékezést elvégeztük, akkor a léptéktényező segítségével meghatározzuk a változók új maximális értékeit, és ezek ismeretében már hozzákezdhetünk az amplitúdóléptékezéshez. A két ismertetett amplitúdóléptékezési eljárás közül azt választjuk, amelyik a gondolkodásmódunkhoz közelebb esik. Az amplitúdó léptéktényező megválasztása sokkal kevésbé kritikus, mint az időléptéktényező (n) megválasztása, mert a fizikai probléma ismerete alapján a fizikai rendszer változóinak maximális értéke meghatározható. Ismerve a számítógép függő változójának maximális értékét az amplitúdó léptéktényező megállapítása nem okoz különösebb problémát. Az idő léptéktényező megállapításához első lépésben meg kell becsülnünk azt az időt, amely alatt a fizikai jelenség lezajlik (T M). Ismerni kell a számításhoz felhasznált műveleti elemek jelátvivő tulajdonságát, illetve azokat a hibákat, amelyek akár kis, akár nagy működési sebességeknél fellépnek. Ennek alapján a megbecsült fizikai időhöz (T M) egy τ M gépi időt rendelünk. A T M-et és τ M-et ismerve a (2.19) alapján az idő léptéktényező meghatározható. A τ M számítási idő értéke a 20 milliszekundum és 100 szekundum közötti időtartományban változik. A T M fizikai idő értéke a feladat jellegétől függően lehet néhány milliszekundum, vagy esetleg néhány másodperc. Megemlítjük, hogy a helyes időléptéktényező megválasztásánál nagy segítségünkre lehet a vizsgált rendszer pólusainak, illetve zérushelyeinek az ismerete. Ezeknek a komplex számaikon való elhelyezkedését a fizikai rendszer differenciálegyenletéből vagy átviteli függvényből meg tudjuk állapítani. 26

39 Amplitúdó- és időléptékezés Bármilyen módszerrel is választjuk meg az n idő léptéktényező értékét, mindig meg kell győződnünk a választás helyességéről. Erről oly módon győződhetünk meg, hogy a választott idő léptéktényezőnek vesszük például a tízszeresét, és ezt összehasonlítjuk az eredeti léptéktényezővel kapott eredménnyel. Ha a két eredmény között nincs eltérés, akkor az időléptékezés jó, ha pedig eltérés mutatkozik, akkor az n idő léptéktényező értékét meg kell növelni. Ezen ellenőrző művelet elvégzése céljából a modernebb számítógépeken az 1:10-es időlépték változtatás automatikusan végrehajtható. A fizikai rendszert leíró differenciálegyenlet időléptékének (mint független változójának) megváltoztatásán alapuló ismertetett időléptékezési eljárásokon kívül használatos módszer az időlépték változtatást magán a számítógépen végrehajtani. Ez olyanképpen végezhető el, hogy a számítási vázlatban szereplő összes integrátor integrálási időállandóját egyidejűleg n-szeresére változtatjuk. Ha n > 1, akkor az integrátorok integrálási időállandói nőnek, vagyis a számítás lelassul, ha pedig n < 1, akkor az integrálási időállandók csökkennek, tehát a számítás felgyorsul. Ha a számítógép jobb kihasználása érdekében passzív négypólusokat alkalmazunk, és időlépték változtatást hajtunk végre, akkor a négypólusok átviteli függvényében szereplő összes időállandót ennek megfelelően n-szeresére kell változtatni. Abban az esetben, ha a számítógépen végzett számításokhoz a vizsgált fizikai rendszer valamely műveleti elemét felhasználjuk, akkor időlépték változtatást nem szabad végezni, vagyis az idő léptéktényező szükségszerűen egy (n = 1). 27

40 3. fejezet - Kompartment (rekesz) modellek és alkalmazástechnikájuk Bevezetés Az orvosi, élettani kutatásoknál és vizsgálatoknál mind gyakrabban merül fel igény valamilyen kvantitatív vizsgálati kiértékelési módszer kidolgozására, az ok-okozati összefüggések feltárására, azok matematikai megfogalmazására. Mivel az élő szervezetek és a bennük lejátszódó folyamatok általában bonyolultak, a vizsgálatukhoz a teljes rendszert részekre (alrendszerekre) kell bontanunk, majd ezen alrendszerek statikus és dinamikus tulajdonságainak megismerése után vállalkozhatunk a teljes rendszer vagy folyamat analízisére. Az életműködés során főleg a fejlettebb élőlényeknél kiemelkedő szerepet játszanak a különböző nedvkeringések (például a vérkeringés). Ezek transzport jelenségek, melyeket extenzív fizikai mennyiségek (tömeg, térfogat, energia stb.) által meghatározott szubsztancia áramlása jellemez. Ezen jelenségek vizsgálatára nyújt jó lehetőséget a különböző nyomjelző anyagok transzportjának számítógépes kompartment analízise. Tekintve, hogy az említett extenzív mennyiségek az anyaghoz kötött sajátosságok, a transzportjuk szükségképpen az anyag részecskéinek (molekuláinak, atomjainak stb.) mozgásával kapcsolatos, így a transzport jelenségek az anyag specifikus mozgásformáinak tekinthetők. Mivel a transzport eloszlásbeli egyenlőtlenségek kiegyenlítéseként jön létre, a transzportált szubsztancia árama annál intenzívebb, minél nagyobb az inhomogenitás a rendszerben. Az olyan folyamatokat, amelyek valamely extenzív mennyiség transzportjára irányulnak, transzport folyamatoknak nevezzük. A transzport folyamatok alapjelenségeit a molekuláris fizika tárgyalja. A transzport folyamatok gyakorlati számítása olyan fenomenologikus jellemzőkkel és összefüggésekkel történik, amelyek legtöbbje a hasonlóság elméleten alapszik. Az ún. fenomenologikus szemléletű leírásmód nyilván nem tükrözi az anyag molekuláris, atomos felépítését, ezért csak akkor alkalmazhatjuk, ha az ún. mikroszkopikus viselkedés nem képezi a vizsgálat tárgyát. Az élettani transzport folyamatok megismeréséhez és tanulmányozásához meg kell teremtenünk a megfelelő mérő- és kiértékelő rendszert. Ezek általában modell-referenciás intelligens mérőrendszerek. Segítségükkel egyre bonyolultabb élettani folyamatok tanulmányozhatók. A továbbiakban a tetszőleges élettani transzport folyamatot olyan rendszernek tekintjük, amely véges számú makroszkopikus alrendszerből vagy elemből épül fel. Ezeket homogén egyenletes eloszlású elemeknek, kompartmenteknek (vagy rekeszeknek) nevezzük. A kompartmentek anyagcserén keresztül kerülnek egymással (esetleg a környezettel) kölcsönhatásba. Mi a jelentősége a kompartment rendszereknek? Először is igen eredményesen használhatók a biológia, kémia stb. számos területén végzett kísérletek elemzésénél, például kvantitatív összefüggések feltárására a fiziológiában és a farmakológiában. A lineáris kompartment rendszereknek viszonylag bonyolult analitikus elmélete van, nem is szólva az ún. inverz problémáról, vagyis a rendszeridentifikáció és a paramétermeghatározás feladatáról. A kutató számára fontos, hogy a kísérleti adatokból a vizsgált rendszer plauzibilis leírásához jusson. Ehhez nagy segítséget nyújt a kompartment analízis. Még ennél is bonyolultabb feladat a nemlineáris rendszerek és az olyan rendszerek vizsgálata, melyekben a kompartmentek közti kicserélődési folyamatokra ciklikus vagy véletlen perturbációk hatnak. A kompartment (rekesz) analízis hasonló jelentőséggel bír az élettani folyamatok vizsgálatánál, mint a klasszikus szabályozástechnikában jól ismert frekvenciatartománybeli vizsgálati módszerek, vagy a modern szabályozáselméletben alkalmazott állapotegyenletes rendszerleírás. A kompartment analízis elméletét és alkalmazásait három fő részre oszthatjuk: 1. Plauzibilis modell készítése bármely biológiai rendszerhez. Ehhez szükséges a folyamat hátterének alapos ismerete, amihez rengeteg kísérletet, mérési sorozatot kell elvégezni és kiértékelni. Az így szerzett tudás és felhalmozott ismeretek birtokában kritikával viseltetnünk minden kompartment modellel szemben. A modell 28

41 Kompartment (rekesz) modellek és alkalmazástechnikájuk szerkezetének és paramétereinek meg kell egyeznie a valóságos rendszer vagy folyamat megfelelő jellemzőivel. Ellenkező esetben a kompartment rendszerrel való leírásnak nagyon kis köze lesz a valósághoz. 2. Adott egy specifikált kompartment modell, a feladat a rendszer analitikus elméletének kidolgozása. Ez a matematikailag legjobban definiálható feladat. 3. A legnehezebb feladat az ún. inverz feladat. Adott egy rendszer egy vagy több plauzibilis modellje. Milyen adatokra van szükségünk és hogyan használjuk fel azokat, hogy a modellparamétereket megkapjuk, és hogyan döntsük el, hogy melyik a legjobb modell? Az inverz feladat elméletének és megoldásának kidolgozása általában azért nehezebb, mert eleve bonyolultabb feladatról van szó, mint például egy jól specifikált kompartment rendszer analitikus megoldásakor. A téma interdiszciplinális jellegű művelői között egyaránt megtalálhatók orvosok, biofizikusok, élettanászok, programozó matematikusok és természetesen mérnökök. Tekintettel a téma határterület jellegére fontos a közös nyelv, fogalomrendszer, stb. megalkotása, az azokhoz való következetes ragaszkodás, és különös gondot kell fordítani arra, hogy a téma kifejtése mind a mérnök, mind pedig a nem műszakiak számára jól érthető legyen. A kompartment analízis elméletének kidolgozása nem újkeletű. Íme egy rövid történelmi áttekintés: Fourier (XIX. század eleje) Fick (XIX. század második fele) Hamilton (XX. század eleje) Teorell (1937) Hevesy György (1943) Shepard (1948) Anyagáramlás folytonos leírására használta ezt a technikát. Bevezeti a nyomjelzős vizsgálati módszereket. Szívműködés leírására alkalmazta ezt a technikát. Kétkompartmentes modell elméletét dolgozta ki a biológiai rendszerekben a nedvkeringés leírására. Radioaktív izotópok nyomjelzőként történő alkalmazását vezeti be. Bevezeti a kompartment analízis fogalmát. Perl (1960) Kidolgoz egy módszert a kompartment modellek paramétereinek meghatározására (identifikáció). Az elmúlt ötven évben a kompartment modell széleskörű alkalmazást nyert az élő és az élettani folyamatok vizsgálatára Definíciók, alapfogalmak A kompartment analízis elméletének megértéséhez vezessünk be néhány fontos definíciót, illetve fogalmat: Rendszer: biokémiai vagy fiziológiai elrendezés, melyben valamely anyag viselkedését tanulmányozzuk. A rendszeren kísérletek sorozatát végezzük valamilyen előre meghatározott céllal. Rendszer lehet például egy állat, növény, élő szerv, élő sejt vagy sejtek mitokondrium összetevői (mitokondrium: sejtplazma-területek, amelyekben a legfontosabb és legintenzívebb anyagcsere-folyamatok zajlanak le). A vizsgálat lehet például a 131 I kiürülése egy állat plazmájából. Ebben az esetben a megfigyelt rendszer a jód transzport folyamata a vérbe és a vérből. A rendszer lehet zárt vagy nyitott. Zárt rendszer: rendszer, amelybe nem lép be és amelyet nem is hagy el anyag. Nyitott rendszer: olyan rendszer, amely anyagcserét folytat a környezetével. Egy állat (szerv vagy sejt) anyagcseréjének alkotói (metabolic pool) olyan vegyületek összessége, melyek a szövetek építéséből vagy lebomlásából származnak, s amelyeket az állat (szerv vagy sejt) a szövet alkotóinak szintézisére használ. A kompartment kinetikailag elhatárolható, homogén, egyenletes eloszlású anyagmennyiség, melyet a transzformációjának vagy a transzportjának kinetikája jellemez. A kompartmentet meg kell különböztetni a fizikai térfogattól és a fiziológiai tértől, bár néhány vegyület fizikai térfogatváltozását is lehet kompartment modellel leírni. Egy anyagnak az egyik kompartmentből a másikba történő átvitele modellezheti az illető anyagnak az egyik fiziológiás helyről a másikra történő átvitelét, vagy az illető anyagnak ugyanazon fiziológiás határokon belül történő átalakulását. A kompartment méretét a benne lévő anyag mennyisége határozza meg, mértékegysége tömegegység (mol, gramm). 29

42 Kompartment (rekesz) modellek és alkalmazástechnikájuk Elméleti modell egy biológiai rendszer valamely anyaga kinetikájának a leírása. Matematikai modell az elméleti modellből származtatott egyenletek rendszere, mely a vizsgált anyag koncentrációjának és mennyiségének a változását írja le az idő függvényében. A kompartment analízis azon eljárások összessége, melyek lehetővé teszik, hogy egy biológiai rendszer viselkedését leírhassuk elméleti vagy matematikai modellel. A kompartment rendszerek szimbolikus jelölése háromféleképpen történhet: egymástól elválasztott dobozok, köztük nyilak, körök, köztük nyilak, hálók (gráfok) segítségével. Az anyag körforgása (turnover): Egy több vegyületből álló rendszer állandósult állapotban van, ha e vegyületek a rendszerben mozognak, egymásba átalakulnak, és a koncentrációjuk minden kompartmentben állandó a megfigyelés ideje alatt. Zárt rendszer esetén az állandósult állapot dinamikus egyensúly, de mihelyt a rendszer nyitottá válik, az egyensúly megszűnik. A dinamikus egyensúly fogalma csak zárt rendszerre használható, az állandósult állapot fogalmát pedig nyitott rendszerre szokták használni. A turnover mérésére a felezési időt használjuk. Ez azon alapszik, hogy hasonló elsőrendű differenciálegyenleteket használunk radioaktív bomlásoknál, kémiai kinetikánál és állandósult állapotú rendszerek analízisénél. Azokra a rendszerekre, melyek leírhatók a egyenlettel, a T 1/2 felezési idő kiszámítható a sebesség konstansból (k) a következőképpen: Bonyolultabb rendszereknél, ahol az exponenciális kitevőt kísérleti adatokból határozzuk meg, a nincs fiziológiai jelentése. -nak A turnover idő az az idő, amelyben kicserélődik egy kompartment anyagtartalma, ami a kompartmentben lévő anyag molekulájának átlagos élettartama. A fentiek alapján a turnover idő (T t): A turnover idő alatt nem minden molekula cserélődik ki. Minél tovább tart a megújulási folyamat, annál kevesebb régi molekula lesz az újak között, és annyival kisebb lesz a valószínűsége annak, hogy egy régi molekula átalakul vagy eltávozik a rendszerből. A turnover idő alatt a régi molekulák 63%-a pótlódik. Nyomjelzők Egy rendszer kémiai analízise csak annak statikus állapotáról ad információt. Általában a rendszer különböző részeiben lévő anyagok koncentrációját vagy pedig a rendszer által felvett vagy kiválasztott anyagok mennyiségét mérjük. Azért, hogy a rendszer kinetikáját is megvizsgálhassuk, meg kell jelölnünk az anyagát. Ezt egy nyomjelzővel vihetjük végbe. A nyomjelzőnek jól mérhetőnek kell lennie, ugyanúgy kell viselkednie, mint a megfigyelt anyagnak, és a kinetikájuknak sem szabad különbözniük. A nyomjelző lehet egy elem izotópja, lehet radioaktív vagy stabil anyag. Ma már a leggyakrabban izotópot használnak, ezért a vizsgálatainkat elsősorban az izotópikus nyomjelzős hígításra koncentráljuk. Természetesen az eredményeink más nyomjelző vizsgálatok esetén is alkalmazhatók. 30

43 Kompartment (rekesz) modellek és alkalmazástechnikájuk A nyomjelzővel szemben támasztott követelmények a következők: 1. A biológiai rendszer ne tehessen különbséget a vizsgált anyag és a nyomjelzője között, vagyis ugyanazon metabolikus változásokon menjenek keresztül. 2. A nyomjelzőt olyan kis mennyiségben adhassuk a rendszerhez, hogy annak állandósult állapotát ne zavarja meg. Ehhez megfelelően nagy koncentráció kell. 3. Kezdetben a rendszerhez adott nyomjelző nincs egyensúlyi állapotban, és a mennyiségi változásait matematikailag analizálhatjuk, az idő függvényében leírhatjuk. Ezek a változások tükrözzék a megfigyelt anyag transzfer és transzformációs sebességét. 4. Ha a nyomjelző izotóp, ne cserélődjön ki a jelzett anyag és más anyagok között. 5. Az izotóp felezési ideje olyan hosszú legyen, hogy az állandó csökkenés ellenére a mérési értékek mindig elég nagyok legyenek. 6. A nyomjelző nem okozhat a szervezetben abnormális anyagcsere reakciókat (sugáreffektus, koncentrációtartalom változás). A nyomjelző mennyiségi változásait a vizsgált anyagon belüli koncentrációjával mérjük. Festékanyagoknál és a biológiai rendszerekben elő nem forduló anyagoknál ez közvetlenül történik. Radioaktív nyomjelzők esetében a radioaktivitásukat mérjük. Egy jelzett anyag relatív specifikus aktivitása az anyag egy adott időpontban mért specifikus aktivitásának aránya ugyanazon anyag egy más időpontban mért specifikus aktivitásához vagy egy másik anyag ugyanazon időpontban mért specifikus aktivitásához. A stabil izotópok koncentrációját a nyomjelző izotóp atomjai számának és a legnagyobb többségben lévő természetes izotóp atomjai számának arányával fejezzük ki. Ezért ezt többségi aránynak nevezzük. Ha ezt százalékosan írjuk le, akkor atomszázalék a neve. Néha a nyomjelző lehet a vizsgált rendszerben eleve előforduló természetes izotóp. Ekkor a természetes koncentrációt kivonjuk a kísérleti koncentrációból, és az eredményt atomszázalék emelkedésben írjuk le. Ezen eljárás jogosságát kísérleti tények igazolják. A természetben előforduló izotópok majdnem mindig állandó többségi arányban vannak jelen, tekintet nélkül a forrásra. A legtöbb rendszerben a gyógyszerek a nyomjelzőkhöz hasonlóan a lineáris kinetikát követik, ezért a nyomjelző kinetika közvetlenül használható gyógyszerekre és bármilyen idegen anyagra Alkalmazott jelölésrendszer A hasonló témával foglalkozó nemzetközi szakirodalommal összhangban egysége jelölésrendszert alkalmazunk, s ez a következő: t n Q j q j idő (független változó) a rendszer kompartmentjeinek száma a j-edik kompartment anyagának mennyisége (tömeg) a j-edik kompartment nyomjelzőjének mennyisége (tömeg) a j-edik kompartmentben levő stabil izotópok többségi aránya, vagy a radioaktív nyomjelző specifikus aktivitása a j-edik kompartmentben lévő nyomjelző relatív specifikus aktivitása k ji R ji q j(0) a j-edik kompartmentből az i-edikbe történő mozgás sebességi állandója (idő -1 ) a jelöletlen anyag transzportjának sebessége a j-edik kompartmentből az i-edikbe (tömeg idő -1 ) a j-edik kompartment kezdeti nyomjelző mennyisége 31

44 Kompartment (rekesz) modellek és alkalmazástechnikájuk a j(0) a j-edik kompartmentben lévő nyomjelző kezdeti specifikus aktivitása. A nyomjelző többségi arányát kifejezhetjük alakban. Ha a nyomjelző radioaktív, akkor a specifikus aktivitás X i = (számlálási hatásfok) (többségi arány), az i-edik exponenciális kifejezés együtthatója λi az i-edik exponenciális kifejezés kitevője (idő -1 ) s Laplace-operátor m a mérési adatok száma K a becsült paraméterek száma t 1, t 2,... t m mintavételi időpontok (független változó) y 1, y 2,... y m mért adatok a t 1,... t m mintavételi időpontokban becsült értékek a t 1,... t m mintavételi időpontokban b 10,... b k0 a becsülni kívánt paraméterek kezdeti értékei Kompartment (rekesz) modellek elmélete Ebben a fejezetben a lineáris és nemlineáris kompartment rendszerek matematikai leírásával és azok analitikus megoldásával foglalkozunk Kompartment (rekesz) modellek leírása állandósult állapotban levő rendszerek esetén Az állandósult állapotban lévő rendszerek lineárisak, a bennük zajló mozgásokat és átalakulásokat elsőrendű lineáris differenciál egyenletek írják le. A kompartmentekben lévő anyagmennyiség és turnover (forgási) sebesség állandó, és a sebesség konstans teremt köztük lineáris kapcsolatot. Állandósult állapotú kompartment rendszerek analízisénél a következő feltételezésekkel élünk: a kinetikai folyamatok irreverzibilisek, a kompartment régi és új molekulái között nem teszünk különbséget, a kompartmentekben minden pillanatban homogén a molekulák eloszlása. Feltételezzük, hogy a keveredési idő sokkal kisebb, mint a turnover idő, a nyomjelzők ideálisak, s a rendszer viselkedésének leírásához a legkisebb számú kompartmentet használtuk fel, vagyis kevesebb kompartmenttel már nem lehet modellezni a rendszert. Ha egy rendszert nyomjelzővel vizsgálunk, akkor a következő lépéseket kell végrehajtanunk: 1. Ismert mennyiségű jelzőanyagot juttatunk a rendszer egy kompartmentjébe. 2. Megfelelő időnként mintát veszünk ebből és/vagy egy másik kompartmentből, és meghatározzuk a specifikus aktivitást. 3. A rendszer elméleti és matematikai modelljének felhasználásával a kísérleti adatokból meghatározzuk a modell paramétereit. 4. Ha a modell nem megfelelő, egy újat választunk. A nyomjelzős hígításos módszer elvét a 3.1. ábra mutatja ábra - A nyomjelzős hígításos módszer elve 32

45 Kompartment (rekesz) modellek és alkalmazástechnikájuk A 3.1. ábrán látható kompartment Q 1 jelöletlen anyagot tartalmaz. Adjunk hozzá a 1(0) specifikus aktivitású q 1 mennyiségű nyomjelzőt, és várjuk meg, amíg elkeveredik. Ezután meghatározzuk a kompartment specifikus aktivitását. A nyomjelző kezdeti aktivitásának egyenlőnek kell lennie a kompartment keveredés utáni aktivitásával: Átrendezve: (3.1) (3.2) Ha Q 1 q 1, akkor használhatjuk a következő közelítést (3.3) A (3.3) alapján a kompartment mennyisége vagy specifikus aktivitása számolható Zárt rendszerek Vizsgáljunk meg egy n kompartmentből álló, dinamikus egyensúlyban lévő zárt rendszert. Az általánosság kedvéért feltételezzük, hogy minden kompartment minden kompartmenthez kapcsolódik, és a rendszer nincs kapcsolatban a környezetével. Ezt mutatja be a 3.2. ábra ábra - n kompartmentből álló zárt rendszer A rendszert a következő matematikai modellel tudjuk leírni: 33

46 Kompartment (rekesz) modellek és alkalmazástechnikájuk (3.4) Itt k jj természetesen nincs értelmezve, mert egy kompartment önmagával nem folytat anyagátvitelt. A (3.4) egyenlet felírható a következőképpen: (3.5) Mivel a rendszer állandósult állapotban van, a kompartmentekbe belépő és kilépő anyagok egyenlők, így A nyomjelzőkre a (3.5)-höz hasonló egyenlet írható fel: (3.6) Ez a (3.1) egyenletből és a Q i állandóságából következik. A (3.6) egyenletet tovább alakítva: (3.7) Mivel nyomjelzőt csak egy kompartmentbe juttattunk, ezért a koncentrációja nincs állandósult állapotban viszont a nyomjelző mennyisége a rendszer zártsága miatt állandó, ezért (3.8) Tehát a rendszert leíró n egyenletből csak (n 1) független. Legyen A i a Laplace-transzformáltja a i-nek: A i = L(a i). Így a ( 3.7) egyenlet: (3.9) Rendezve az egyenletet: 34

47 Kompartment (rekesz) modellek és alkalmazástechnikájuk (3.10) Ezt az eredményt mátrixos alakban is leírhatjuk, ami egy sajátérték problémát eredményez. Mivel k ii diagonál elemek nincsenek definiálva, legyen mátrix aldeterminánsának (-1) i+j -szerese Tehát az ismert matematikai tétel alapján: (3.11) Így a (3.10) egyenlet felírható: és a (3.11) egyenlet felírható: 35

48 Kompartment (rekesz) modellek és alkalmazástechnikájuk (3.12) (3.11)-et behelyettesítve A egy eleme: (3.13) Bebizonyítható, hogy Δ = 0 egyenletnek n valós negatív gyöke van, és -λ 1 > -λ 2 > K > -λ sorba állíthatók, ahol -λ = 0. Így (3.13)-at felbonthatjuk (3.14) alakban. Ennek inverz Laplace-transzformáltja adja a következőt: (3.15) és, a kísérleti adatokból számítható valamelyik később ismertetendő görbeillesztő eljárással. Éppen ez az eljárás az oka, hogy többszörös gyök általában nem fordul elő, mert az eljárás ilyen gyököket nem tud szétválasztani. Ha (3.15)-öt (3.17)-be helyettesítjük, n 2 egyenletet kapunk. (3.16) ahol i = 1, 2... n. (Tulajdonképpen nem tettünk mást, mint behelyettesítettük a sajátértéket és sajátvektort a sajátérték feladatba.) A (3.16) mátrixos alakban k-ra megoldva Legyen pedig aldeterminánsának (-1) j+1 -szerese. Így egy eleme: (3.17) Mivel és a kísérletek kiértékelésénél, pedig az izotóphígításnál bemutatott (3.3) egyenletből adódik, meghatározható (3.17)-ből. 36

49 Nyitott rendszerek Kompartment (rekesz) modellek és alkalmazástechnikájuk Nyitott rendszerek esetében a rendszert a 3.3. ábrán látható modell jellemzi. Minden kompartment kapcsolatban van a külső térrel. Az anyag R i0 (i = 1, 2... n) áramlási sebességgel lép be, és nyomjelzőt nem tartalmaz. A nyomjelzőt valamelyik kompartmenthez kezdetben adtuk hozzá, és most k0i sebességi állandóval hagyja el a rendszert ábra - Nyitott rendszer A matematikai modell: (3.18) (3.6)-hoz hasonlóan: (3.19) (3.7) pedig ez alapján (3.20) Mivel a nyomjelző most elhagyhatja a rendszert, (3.8) már nem igaz: Ezután a megoldás megegyezik az előző fejezetben ismertetett megoldással, azzal a módosítással, hogy (3.21) és ezért λ 1 nem lesz nullával egyenlő. Néha előfordul, hogy csak a rendszer teljes anyagára vonatkozó méréseket tudunk végrehajtani. Ilyenkor a nyomjelző teljes anyagára a 37

50 Kompartment (rekesz) modellek és alkalmazástechnikájuk (3.22) függvényt kapjuk, melyet a rendszer kimosási függvényének nevezünk. A függvény idő szerinti deriváltja a rendszer kimeneti jelgörbéje Speciális esetek A fentiekben ismertettük, hogy miképpen határozzuk meg mátrix sokszor egyszerűbb alakú lesz. Ilyenkor a megoldás leegyszerűsödik. -t zárt és nyitott rendszer esetén. A gyakorlatban a 1. Állhat a rendszer több egymástól elkülönült alrendszerből. Ezek a modellből felismerhetők, és a kompartmentek úgy számozhatók, hogy a mátrix a főátlója menti négyzetes mátrixokból álljon. Ilyenkor a differenciálegyenlet több alrendszerre esik szét. 2. Szeparálható rendszernek nevezzük a rendszert, ha 1, 2 k alrendszerre bontható úgy, hogy 1-nek nincs bemenete 2, 3 k-ból, 2-nek 3, 4 k-ból, de 1-ből lehet bemenete, 3-nak csak 1 és 2-ból lehet bemenete és így tovább. 3. Így 1 önálló alrendszer lesz, önállóan megoldható, megoldásai a többi alrendszerre bemenetként hatnak. Így 2 is megoldható most már a többitől függetlenül és így tovább. 4. A gyűjtő rendszer olyan kompartment alrendszer, amelynek a rendszer többi részéből van bemenete, de egyetlen kompartmentjének sincs kimenete külső kompartmenthez. 5. Ez a rendszer természetesen egyetlen kompartmentből is állhat, melynek gyűjtő kompartment a neve. Ha egy rendszerben van egy gyűjtő, akkor van egy zérus sajátértéke. Az állítás fordítva is igaz. Ha van egy zérus sajátérték, akkor a rendszernek van gyűjtője, vagy az egész rendszer gyűjtő, tehát zárt. A zérus sajátérték és a gyűjtő kapcsolata szemlélet alapján is belátható. Ha egy sajátérték kicsi, az azt jelenti, hogy az alrendszer tároló jellegű, kimeneti átvitele a rendszer többi részéhez viszonyítva lassú. A továbbiakban két esettel gyakorlati jelentőségük miatt részletesebben foglalkozunk Lánc rendszer Ha egy rendszert úgy rendezünk el, hogy minden kompartmentnek csak a szomszédjával van kapcsolata, lánc rendszert kapunk. Ilyet ábrázol a 3.4. ábra ábra - Lánc rendszer A mátrix ilyenkor a következő alakú lesz: 38

51 Kompartment (rekesz) modellek és alkalmazástechnikájuk (3.23) (3.16) így alakul ebben az esetben: (3.24) Látható, hogy bár az egyenletrendszer egyszerűbb lett, az ismeretlenek meghatározása most sem könnyű feladat. Sokkal egyszerűbb a megoldás arra az esetre, amikor egy kompartment csak az őt követőnek szállít anyagot, mint a 3.5. ábrán, tehát amikor 3.5. ábra - Egyszerű lánc rendszer Ilyenkor az első kompartmentbe szokták a nyomjelzőt fecskendezni, ezért leegyszerűsödik: 39

52 Kompartment (rekesz) modellek és alkalmazástechnikájuk (3.25) Így A i a (3.13) kifejezésbe helyettesítve: (3.26) Az első kompartmentből mintát véve Q 1 és k 21 számítható. A második kompartment még ismeretlen k 32, Q 2-je ezek után szintén meghatározható, és az eljárást így folytathatjuk tovább Mammillary (anya) rendszer Ez a rendszer egy központi kompartmentet tartalmaz, melyet a többi körülvesz. Anyagcsere csak a központi és szélső kompartmentek között folyik. A 3.6. ábrán látható az n kompartmentből álló zárt mammillary rendszer elméleti modellje ábra - Mammillary (anya) rendszer 40

53 Kompartment (rekesz) modellek és alkalmazástechnikájuk Ezt a rendszert gyakran használják a csak szövetközi térbe és nem a szervek sejtterébe bejutó anyag eloszlása kinetikájának vizsgálatára. A nyomjelzőt csak a központi kompartmentbe szokták fecskendezni: Így a (3.13) egyenlet: (3.27) Ebben az esetben mind a központi, mind az őt körülvevő kompartmentek egy konstans és (n 1) exponenciális kifejezést tartalmaznak. A rendszert leíró mátrixok nem változnak, viszont egyszerűbb lesz. 41

54 Kompartment (rekesz) modellek és alkalmazástechnikájuk (3.28) Ezek után vizsgáljuk meg a gyakorlatban leginkább előforduló eseteket Néhány gyakorlati eset vizsgálata A következőkben olyan kompartment rendszereket mutatunk be, amelyek viszonylag egyszerűek, és a gyakorlati jelentőségük nagy. Ezek az egy-, két- és három-kompartment rendszerek és azok speciális esetei. Foglalkozunk továbbá az inhomogenitás kérdésével is Egy-kompartment rendszer Az elméleti modell a 3.7. ábrán látható: 3.7. ábra - Egy-kompartment rendszer A rendszer viselkedését a (3.29) differenciálegyenlet írja le. A rendszer állandósult állapotban van, ezért: (3.30) A rendszerbe t = 0-ban fecskendezett jelzőanyag viselkedését a következő egyenletek írják le: (3.31) Átrendezve és integrálva: 42

55 Kompartment (rekesz) modellek és alkalmazástechnikájuk (3.32) Vegyük ennek tízes alapú logaritmusát: Tehát ha az adatokat féllogaritmikus papíron ábrázoljuk, egyenest kapunk, melynek meredeksége: (3.33) Ezek után a keresett értékek könnyen kiszámíthatók: Az y tengellyel való metszéspontja adja a kezdeti specifikus aktivitás értéket, a 1(0))-t. Az izotóphígítás elve alapján (3.34) ahol q T a nyomjelző mennyisége és a T a specifikus aktivitása volt a befecskendezés előtt Két-kompartment lánc rendszer Az elméleti modell: 3.8. ábra - Két-kompartment lánc rendszer A rendszert leíró differenciálegyenletek: (3.35) 43

56 Kompartment (rekesz) modellek és alkalmazástechnikájuk illetve (3.36) (3.37) Az a 1(0), Q 1 és k 21 az előző fejezet eljárásával kiszámítható, a k 02 és k 21 egy később ismertetendő görbeanalizálási eljárással nyerhető. Q 2-t ezek után könnyen megkaphatjuk az a 2 kifejezéséből Egy-kompartment rendszer, melynek bemenete állandó forrás A 3.9. (a) ábrán látható az elméleti modellje az egy kompartmentből álló rendszernek, melynek állandó a bemeneti forrása ábra Egy-kompartment rendszer, melynek bemenete állandó forrás A differenciálegyenlet, mely ezt a rendszert jellemzi, leírja az állandó infúzió esetét is. Az állandó infúziót a 3.9.b. ábra mutatja. Tehát a két rendszert leírhatjuk a következő egyenletekkel: (3.38) Állandósult állapotban: R 10 = k 01Q 1. Jelzőanyagra: (3.39) Átírva: (3.40) A (3.40) egyenletet megkaphatjuk Laplace-transzformációval, de egyszerűbb, ha az előző fejezet speciális esetének tekintjük. Ekkor a rendszer olyan két-kompartment rendszer, ahol a 0. kompartment végtelen. 44

57 Kompartment (rekesz) modellek és alkalmazástechnikájuk Ez alapján: (3.41) Az első kompartment állandósult állapota miatt: k 10 Q 0 = k 01Q1. Így (3.42) Ha Q 0 és k 10 0 (3.43) Tehát ha az kifejezést ábrázoljuk féllogaritmikus papíron, akkor a paramétereket az előző módszerrel megállapíthatjuk. Egy használhatóbb módszert később ismertetünk Két-kompartment zárt rendszer A két-kompartmentből álló zárt rendszer elméleti modellje a ábrán látható ábra - Két-kompartment zárt rendszer A matematikai modell: (3.44) A nyomjelzőkre (q 1 + q 2 = állandó): 45

58 Kompartment (rekesz) modellek és alkalmazástechnikájuk (3.45) A specifikus aktivitásokra: (3.46) A megoldás például Laplace-transzformációval történhet. Ha Q 1-be fecskendezünk t = 0-ban nyomjelzőt, a (3.53) egyenletek megoldása a következő: (3.47) a 1 és a 2 képét a ábra mutatja ábra - Két kompartmentes zárt rendszer nyomjelzőinek időbeni változása Q 1, Q 2, k 12 és k 21-et többféle módon határozhatjuk meg: vagy az ún. Bleehan Fisher módszerrel, vagy X 0-t és X 1- et valamilyen görbeillesztéssel meghatározzuk, és Q 1-re felírjuk az izotóphígítás alapegyenletét. Egy harmadik módszer is létezik, mely szerint: Ezért (3.54)-et átrendezve: (3.48) A (3.55) egyenletet féllogaritmikus papíron ábrázoljuk, és a paramétereket az egyenesből meghatározzuk. Ez azonban egy hosszabb kísérletsorozatnál rendkívül bonyodalmas, fáradságos kiértékelési módszer Két-kompartment nyitott rendszer A rendszer elméleti modellje a ábrán látható. 46

59 Kompartment (rekesz) modellek és alkalmazástechnikájuk ábra - Két-kompartment nyitott rendszer A rendszer differenciálegyenlete: (3.49) A specifikus aktivitásokkal felírva: (3.50) Ha az 1. kompartmentbe juttattuk a nyomjelzőt, a fenti egyenletek megoldása a következő lesz: (3.51) Az egyenleteket leírhatjuk a következő formában is: (3.52) A specifikus aktivitás-idő függvényt a ábrán követhetjük. A paramétereket a görbeanalízis segítségével határozhatjuk meg ábra - Két kompartmentes nyitott rendszer nyomjelzőinek időbeni változása 47

60 Kompartment (rekesz) modellek és alkalmazástechnikájuk Kompartmentcsatolások Előrecsatolás Elképzelhető, hogy egy kompartmentbe nem kerül be a felé irányuló összes anyag, hanem egy része kikerüli, és a kompartment után egyesül ismét a kiáramló anyaggal. Ilyenkor előrecsatolásról beszélünk, amint azt a ábra is mutatja ábra - Előcsatolásos kompartment Vizsgáljuk meg, hogy egy előrecsatolt tag hogyan változtatja meg az őt követő például egy gyűjtő kompartment bemenetét. A bemenet legyen állandó infúzió, és ennek r-szerese jut az első kompartmentbe. (3.53) Megoldva a (3.60) egyenletet: (3.54) A másik ágon az előrecsatolás nem változtatja meg az anyag menetét. Így a következő kompartment bemenete: 48

61 Kompartment (rekesz) modellek és alkalmazástechnikájuk (3.55) (3.56) Visszacsatolás Az elméleti modellt a ábrán láthatjuk ábra - Visszacsatolásos kompartment Az első kompartmentet a következő differenciálegyenlet írja le: (3.57) (3.58) Ennek megoldása az előzőkhöz hasonlóan: (3.59) Kérdés, hogy milyen hatással van ez a következő kompartmentre? Írjuk fel ennek a differenciálegyenletét. (3.60) (3.61) A visszacsatolás tehát megváltoztatja a görbe időállandóját is. A visszacsatolás miatt az anyag jobban keveredik a kompartmentben. Lényegében úgy képzelhetjük el az egész folyamatot, mintha egy belső keverő készüléket adtunk volna a rendszerhez. Kompartmenteket párhuzamosan is csatolhatunk. Ekkor kimenetük összeadódik, és két exponenciális görbe összege lesz Három-kompartment rendszerek Vizsgáljuk meg a ábrán látható három-kompartment rendszert ábra - Három-kompartment rendszer 49

62 Kompartment (rekesz) modellek és alkalmazástechnikájuk (3.62) Illetve: (3.63) A karakterisztikus polinom: 50

63 Kompartment (rekesz) modellek és alkalmazástechnikájuk (3.64) Ennek gyökei a rendszer sajátértékei. Vizsgáljuk meg a legfontosabb speciális eseteket is Zárt rendszer Ha a (3.71) egyenlet a következő alakra egyszerűsödik: (3.65) A sajátértékek: zérus és a (3.72) megmaradó másodfokú kifejezésének gyökei Nyitott rendszer Tételezzük fel, hogy a (3.71) egyenletben minden k ij = 1. Ekkor a karakterisztikus polinom a következő: (3.66) A sajátértékek vagyis gyök multiplicitása kettő. Annak ellenére, hogy ez egy három-kompartment rendszer, csak két különböző bomlási konstans van Lánc rendszer Lánc rendszernél k 13=k 31=k 01=k 02=0. Újra megvizsgáljuk azt a speciális esetet, amikor k 12=k 21=k 23=k 32=k 13=1. A sajátértékek a következô egyenlet gyökei: Ennek az egyenletnek három különböző negatív valós gyöke van Mammillary (anya) rendszer (3.67) A három-kompartmentű mammillary rendszerben k 23=k 32=k 02=k 03=0. Ha k 12=k 21=k 13=k 31=k 01=1, a sajátértékek az alábbi karakterisztikus polinom gyökei: Újra három különböző valós gyököt kapunk Inhomogenitás (3.68) Idáig a kompartmenteket mindig homogéneknek feltételeztük. Ha egy inhomogén kompartment is jelen van, akkor azt két al-kompartmenttel helyettesítjük. Az egyik gyors anyagcserét folytat a rendszer többi részével, a másik pedig lassú forgalmat bonyolít az előzővel. Egy ilyen példa a ábrán látható: ábra - Inhomogén rendszer modellje 51

64 Kompartment (rekesz) modellek és alkalmazástechnikájuk A nyomjelző mennyisége az első kompartmentben: (3.69) A nyomjelző teljes mennyisége a második kompartmentben: (3.70) ahol kompartment specifikus aktivitásásnak átlaga. Mivel Q 1 és Q 2 között gyors a kicserélődés, a 2a majdnem egyenlő a 1-gyel: (3.71) Tételezzük fel, hogy a nyomjelzőt az első kompartmenthez adjuk, a 2b(0) = 0, így t = 0-ban: (3.72) Az al-kompartmentek nagysága tehát meghatározható. Más úton is megközelíthetjük az inhomogenitást. Feltételezhetünk az inhomogén kompartmentben egy koncentráció gradienst. Ekkor az inhomogén kompartmentet végtelen számú al-kompartmenttel helyettesítjük Tranziens állapotban lévő rendszerek A gyakorlatban sokszor merül fel a tranziens állapotú (nem egyensúlyi állapotban levő) fiziológiai folyamatok leírásának igénye Tranziens rendszer fogalma A 3.7. ábrán látható modellt leíró egyenlet: (3.73) Ha R 10 és k 01 állandó, de R 10 k 01Q 1, akkor Q 1, vagyis a kompartment mérete változik az idő függvényében. Ha nincs nyomjelző a rendszerben, akkor a (3.80) lineáris differenciálegyenletet melynek függő változója Q 1 oldjuk meg. Ha van nyomjelző a rendszerben, akkor a 52

65 Kompartment (rekesz) modellek és alkalmazástechnikájuk (3.74) illetve a (3.75) függvényt kell megoldanunk, ahol Q 1 és a 1 is változik az idő függvényében. A szerzők olyan rendszereket is tanulmányoztak, melyekben a normál körülmények között állandósult állapotban lévő anyagok egyensúlyi koncentrációja megbomlott, és/vagy új egyensúlyi állapotba került, vagy pedig visszatért az előző állandósult állapotba. Feltételezték, hogy a változás nem nagy, s a kinetika lineáris Idegen anyagok kinetikája Általában az idegen anyag kinetikájának vizsgálatánál a már ismertetett modellek közül valamelyik, nem állandósult modellt használnak. Az anyagcsere vizsgálatában már a radioaktív nyomjelzők bevezetése előtt eredményesen használták az idegen anyagokat ban Widmark acetont fecskendezett nyulak bőre alá, és mérte a vérben az aceton koncentrációját. Kimutatta, hogy az adatokra illesztett görbe exponenciális. Gehlen 1933-ban néhány olyan elméleti következtetésre jutott, amely már a két-kompartment rendszerre utal. Teorell 1937-ben megadta egy állat szervei és szövetei közti gyógyszer mozgásának (átalakulásának) kinetikai leírását. A legtöbb rendszerben a gyógyszerek kiáramlási sebessége a kompartmentből egyenesen arányos a kompartmentben lévő gyógyszer koncentrációjával. Bray, Thorpe és White olyan idegen anyagot fecskendezett a kísérleti állatba, mely részben változatlanul, részben kevésbé toxikus anyagként válik ki. A toluol kinetikáját a ábra mutatja ábra - Kétkompartmentes rendszer modellje Az 1. kompartmentben lévő toluol egy része változatlanul vált ki (k 01), más része oxidálódott (k 21). Így a 2. kompartmentben benzol keletkezett, mely elhagyta a rendszert (k 02). Ennek a kivált benzolnak mérték a teljes mennyiségét. A 2. kompartmentet gyűjtő kompartmentnek tekintették. Egyenleteik: (3.76) 53

66 Kompartment (rekesz) modellek és alkalmazástechnikájuk (3.77) Egy adott pillanatban a kivált benzol teljes mennyisége q 2(t), a végső összes kivált benzol mennyisége q 2( ). A t időpontban visszamaradó toluol q 1(t), a beadott toluol q 1(0). Így a két egyenletet elosztva egymással: (3.78) A (3.85) egyenletet megoldva: (3.79) t = 0-ban (3.80) Legyen q 2( ) q 2(t) = B. Ekkor (3.81) Ezt (3.84)-be helyettesítve: (3.82) Tehát, ha lg B-t időgrafikonon ábrázoljuk, az egyenes meredeksége (k 21 + k 01)-t adja. q 2 ( ) és q 1(0) ismeretében (3.87) felhasználásával k 21 és k 01 kiszámítható. Ez azt jelenti, hogy a nyúlból kiváló toluol sebességkonstansa felbontható a benzollá válás oxidálódásának és a változatlanul kiváló anyagnak a sebesség konstansára Nyomjelzővel jelölt rendszerek Vizsgáljuk meg azt az esetet, amikor nemcsak a nyomjelző mennyisége (q i), hanem a kompartment anyagának a mennyisége (Q i) is változik az idő függvényében. A modell az általános n-kompartment rendszer. Az i-edik kompartmentbe áramló anyag teljes mennyisége: (3.83) A kompartmentből való kiáramlás sebessége: (3.84) Az eredő sebesség, mellyel az anyag az i-edik kompartmentben felhalmozódik, e két sebesség különbsége: (3.85) 54

67 A nyomjelző mozgását leírja a következő egyenlet: Kompartment (rekesz) modellek és alkalmazástechnikájuk (3.86) (3.92)-t a i-vel megszorozva: (3.87) (3.94) egyenletet (3.93)-ba helyettesítve: (3.88) Mivel q i = a iq i, ezért: (3.89) (3.95) és (3.96) egyenletekből: (3.90) Nemlineáris rendszerek Nagyon sok, számunkra fontos rendszer nemlineáris. A következőkben a nemlineáris rendszerek általános megfogalmazásával, valamint a perturbációs és relaxációs módszerek ismertetésével foglalkozunk Általános modell Általános nemlineáris kompartment rendszerben az i-edik kompartmentből a j-edikbe történő anyagátvitel sebessége az összes Q 1, Q 2, Q n, mennyiségek és több p 1, p 2, p n paraméter függvénye. Így a sebességkonstansok Q és P vektorok függvényei. Egy ilyen rendszer i-edik kompartmentjét mutatja a ábra ábra - Nemlineáris rendszer általános modellje Sok esetben k ij a Q i, Q j és még egy vagy több paraméter függvénye. R i0(t) jelentheti a rendszerben szintetizált anyagot éppúgy, mint a környezetből belépőt. A rendszer matematikai modellje: 55

68 Kompartment (rekesz) modellek és alkalmazástechnikájuk (3.91) Legyen (3.92) Ekkor: (3.93) Általánosságban keveset mondhatunk a megoldásról az állandósult állapot kivételével. Ilyenkor Q i állandó és s minden R i0(t) bemenet állandó R i0. Így: (3.94) Perturbációs és relaxációs módszerek Csak az állandósult állapotú rendszereket vizsgáljuk. Perturbáción az állandósult állapotban lévő rendszer kis változását értjük, mely egy vagy több kompartmentbe fecskendezett kis anyagmennyiség hatására jön létre. Ezután a rendszer visszatér ugyanabba az állandósult állapotba. A relaxáció az állapotváltozók hirtelen kis megváltozása. (Ezek az állapotváltozók nem a különböző kompartmentek mennyiségei.) Ilyen állapotváltozó például a hőmérséklet és a nyomás. Az állandósult állapot megszűnik, és egy új állapot felé tart a rendszer, mely nem egyezik meg az eredetivel. 56

69 4. fejezet - Számítógépes szimuláció Az előző fejezetekben tárgyalt, elsősorban élettani folyamatok (rendszerek) leírására alkalmas matematikai modellek megoldásával sokan foglalkoztak, de még napjainkban is számos új közlemény jelenik meg, főleg egy új feladat vagy speciális alkalmazás esetén. Tény azonban, hogy kompartment analízissel leírt élettani folyamatok analitikus megoldása három kompartmentszámig áttekinthetô. Ha ennél több kompartmenttel írhatók csak le a vizsgálni kívánt folyamatok, akkor számítógépes megoldási módszereket kell alkalmazni. A fentiek figyelembevételével a Budapesti Műszaki Egyetem Folyamatszabályozási Tanszékén folyó tudományos kutatások eredményeként több számítógépes szimulációs programrendszert fejlesztettek ki, s vezettek aztán be a gyakorlatba. Ezen programrendszerek segítségével tetszőleges felépítésű élettani rendszer vagy folyamat számítógépes vizsgálata elvégezhető, a kompartmentek száma nincs korlátozva. A rendszer lehet zárt vagy nyitott. A kezdeti paraméterek megadásakor a program automatikusan dönt abban a kérdésben, hogy milyen rendszerről (lánc rendszer, mammillary rendszer stb.) van szó. A program menüvezérelt, IBM PCkompatibilis számítógépeken futtatható, az eredményeket táblázatosan és grafikusan is szolgáltatja, ezzel is segítve a gyakorlati használhatóságot. A következőkben a teljesség igénye nélkül bemutatunk néhány példát a KOMPART számítógépes szimulációs program alkalmazására Lánc rendszer modellje A lánc rendszer általános modelljét a 4.1-es ábrán láthatjuk ábra - Lánc rendszer modellje A viszonylag nagy tömegű 1. kompartmentből nagy sebességű áramlás zajlik a 2. kompartment felé. A nyomjelzőt a 4. kompartmentbe adjuk, mely a 3. és az 5. kompartment felé ürül ki. A rendszer a következő matematikai modellel írható le: (4.1) (4.2) (4.3) (4.4) 57

70 Számítógépes szimuláció (4.5) A számítógépes kiértékeléshez a következő adatokat használtuk: Q 1 = 500; Q 2 = 100; Q 3 = 100; Q 4 = 100; Q 5 = 100; k 12 = 5; k 21 = 20; k 23 = 10; k 32 = 15; k 34 = 10; k 43 = 10; k 45 = 5; k 54 = 10; q 4 = 50. Az egyes kompartmentek anyagának és nyomjelzőinek időbeli változását az ábrák szemléltetik ábra - Lánc rendszer 4. és 5. kompartjeinek (nyomjelző és jelöletlen anyag) időbeni változása 4.3. ábra - Lánc rendszer 3. és 4. kompartjeinek (nyomjelző és jelöletlen anyag) időbeni változása 58

71 Számítógépes szimuláció 4.4. ábra - Lánc rendszer 2. és 4. kompartjeinek (nyomjelző és jelöletlen anyag) időbeni változása 59

72 Számítógépes szimuláció 4.5. ábra - Lánc rendszer 1. és 4. kompartjeinek (nyomjelző és jelöletlen anyag) időbeni változása 60

73 Számítógépes szimuláció Ahogy várható volt, a nyomjelző mennyisége leggyorsabban a 3. és az 5. kompartmentben kezd változni, s csak ez után a 2. és az 1. kompartmentben. Látható tehát, hogy egy tetszőleges fiziológiai folyamat egyszerűen értékelhető, hatásmechanizmusa pontról pontra nyomon követhető Enterohepatikus keringés modellezése A máj a szervezet fontos kiválasztó szerve, amely nélkülözhetetlen szerepet játszik abban, hogy a szervezet a felesleges anyagcseretermékektől megszabaduljon. Az eliminációs működés érinthet kívülről bejutó anyagokat (például gyógyszerek, mérgek) és a szervezetben keletkező anyagcseretermékeket. Rendszerint inkább lipofil vegyületekről van szó, melyek eliminációja a vesében korlátozott. A májsejtekben lejátszódó átalakulások következtében a kérdéses molekula polárisabb, hidrofilebb természetűvé válik, és így az epébe, vérbe kiválasztódhat. Az eliminációs működés szempontjából a bélcsatorna mintegy a külvilág folytatásaként fogható fel: az epével történő kiválasztás tehát azt jelentené, hogy a szervezet az illető anyagtól megszabadult. A valóságban azonban ez a külvilág rendkívül szoros kapcsolatban van szervezettel, és a kiválasztott, a béllumenbe jutott vegyületek a hámsejtek és a baktériumok hatására átalakulhatnak, a bélhámon keresztül visszakerülhetnek a keringésbe. Számos olyan vegyületet ismerünk, amely ezen enterohepatikus körforgalom révén újból és újból visszajut a szervezetbe, és így az endogén szintézist a szervezet részben megtakaríthatja. Természetesen ennek biológiai célszerűsége csak olyan anyagok esetében van, amelyek a szervezet számára fontosak lehetnek (epesavak, koleszterin), és a körforgalom rendkívül hátrányosnak bizonyul olyan anyagok esetében, melyek károsak ebben a vonatkozásban. Az enterohepatikus keringés modellezhető a két kompartmentes holtidős taggal rendelkező modellel, mely a 4.6. ábrán látható ábra - Enterohepatikus keringés modellezése Az 1. kompartment a testet (pontosabban a májat), a 2. kompartment pedig az emésztési csatornát jelenti. A gyógyszer (nyomjelző) intravénás befecskendezés útján kerül t = 0 időpillanatban a szervezetbe az 1. kompartmentbe (D dózisban). Mind a két kompartment tömege kezdetben 0. A nyomjelző molekulák a t időpillanatban elhagyják az 1. kompartmentet, és csak (t + τ) időben érik el a 2. kompartmentet. Az áramlás nagyságát a k ij együtthatók szabják meg (k 01 a nem epével kiválasztott anyagelimináció mértékét, k 02 a belekből eltávolított anyag mennyiségét, k 21 az epével történő kiürítés nagyságát, k 12 pedig a reabszorpció mértékét jelöli). A modell leírható a következő differenciálegyenlet-rendszerrel: (4.6) (4.7) ahol 61

74 Számítógépes szimuláció (4.8) δ(t) pedig a Dirac-delta függvény. A differenciálegyenlet-rendszer megoldható valamelyik numerikus módszerrel (Euler algoritmus, Runge Kutta módszer). Az inverz Laplace-transzformációt használva ki tudjuk fejezni a q 1(t)-t az idő függvényében a holtidő (η) figyelembevételével. Például (4.9) (4.10) A fenti modell számítógépes szimulációját az alábbi három számszerű példa szemlélteti. (A k 02 értékét célszerű minél kisebbre választani, mert az enterohepatikus keringés mértéke k 02 = 0 esetén maximális.) -k 01 = 0,9; k 21 = 4; k 02 = 0,1; k 12 = 1,9; η = 1; D = ábra - Enterohepatikus keringés során a nyomjelző anyag időbeni változása az egyes kompartmentekben 62

75 Számítógépes szimuláció A 4.7 ábrán látható gyors anyagmennyiség változások világosan mutatják, hogy mind a holt idő, mind a k ij értékek erősen befolyásolják a nyomjelző (gyógyszer) időbeli eloszlásának a jellegét is. Így a kísérleti adatok alapján könnyen modellezhetővé és elemezhetővé válik a gyógyszer szétterjedése a szervezetben Oldott állapotú anyagok tárolása polietilén konténerekben Amikor valamilyen anyagot raktározunk (műanyag csomagolásban, fémdobozban, konténerben), akkor az idő múlásával az anyag kölcsönhatásba lép a doboz, illetve a konténer falával, és ezen keresztül a környezetével is. Számos kutatás folyik ezen a területen, választ keresve arra a kérdésre, hogy milyen mértékű ez a kölcsönhatás, hogyan függ a külső tényezőktől, és mely elemek hajlamosak a leginkább az áramlásra. E jelenségek vizsgálata rendkívül fontos technológiai, fizikai, vegyi és egészségügyi szempontból. Ezen folyamatok vizsgálatára, az anyagáramlások megfigyelésére az 4.8. ábrán látható két kompartmentes modell használható ábra - Oldott állapotú anyagok tárolásának modellezése Az ábrán az 1. kompartment az anyagot, a 2. pedig a konténer falát jelenti. A 0. kompartment a környezet. A modell leírható a következő egyenletrendszerrel: (4.11) 63

76 Számítógépes szimuláció (4.12) A specifikus aktivitásokra felírva: (4.13) (4.14) A megoldás például Laplace-transzformációval történhet. A k és Q paraméterek többféle módon meghatározhatók (például a görbeanalízis segítségével). A Tasmániai Egyetem Gyógyszertan Tanszékén végzett kísérletsorozat sok hasznos információt adott a polietilén konténerek szivárgásának mértékéről és a konténerekben tárolt oldott állapotú anyag áramlásáról. A kísérleteket különféle vegyületekkel és oldószerekkel végezték: nitrobenzollal, acetofenonnal, klorokrezollal, benzil alkohollal, fenil etanollal. A polietilén típusú anyagok esetében az áramlás (szivárgás) biexponenciális jellegű, míg a polietiléntől távolabb álló anyagoknál monoexponenciális. Példaként vizsgáljuk meg a KOMPART program segítségével a nitrobenzol áramlását a konténer falán keresztül ábra - Nyomjelző anyag időbeni változása két kompartmentes rendszerben A nitrobenzol polietilén típusú anyag, az áramlási görbéje erősen exponenciális jellegű. A szivárgás szintén exponenciális, s a mértéke erősen függ a külső tényezőktől (például a levegő hőmérséklete, nedvességtartalma). A szivárgás vizsgálatának jelentősége a gyakorlatban is bebizonyosodott. Így például a gyógyszergyártók felhasználva a kísérletek eredményeit a gyógyszer hatóanyagával előzetesen impregnált anyagba csomagolják a gyógyszert, és így csökkentik a gyógyszer minőségi és mennyiségi változását A pajzsmirigy jódfelvételi folyamatának modellezése A folyamat a következő három-kompartmentes modellel írható le: 64

77 Számítógépes szimuláció ábra - Pajzsmirigy jódfelvételi folyamatának modellje Az ábrán az 1. kompartment a vért, a 2. a vizeletet, míg a 3. a pajzsmirigyet jelöli. Q i a megfelelő kompartmentek jódtartalmát adja, k ij a j-edik kompartmentből az i-edik be való átmenet sebességi állandóját jelenti. A folyamat a következő differenciálegyenletekkel írható le: (4.15) (4.16) Az összes jódtartalom megmaradása miatt pedig minden időpontban: Q 1(0) = Q 1 + Q 2 + Q 3. A kezdeti feltételek: Q 2(0) = Q 3(0) = 0. A megfelelő kompartmentek (vér, vizelet és pajzsmirigy) jódtartalmának változását a és ábrák mutatják. Látható, hogy a vérbe injektált jódmennyiség végül a vizeletben halmozódik fel, míg a pajzsmirigy jódtartalma a kezdeti zérus értékről indulva egy rövid ideig növekszik, majd újra zérusra csökken ábra - Nyomjelző anyagok változása a pajzsmirigy jódfelvételi folyamatának modellezése során: 1. és 2. kompartment 65

78 Számítógépes szimuláció ábra - Nyomjelző anyagok változása a pajzsmirigy jódfelvételi folyamatának modellezése során: 1. és 3. kompartment Többszörös dózis (Atkins kísérlete) Ebben az esetben egy egyetlen kompartmentből álló rendszert vizsgálunk, melynek elméleti modellje a ábrán látható ábra - Többszörös dózis modellje A rendszer viselkedését a 66

79 Számítógépes szimuláció (4.17) differenciálegyenlet írja le. A rendszerbe t = 0-ban befecskendezett jelzőanyag viselkedését a következő egyenletek írják le: (4.18) Az egyenlet megoldása: (4.19) A rendszerbe n egyenlő dózisban t egyenlő időközönként nyomjelzőt adunk. (Atkins a kísérletében nagy mennyiségű aszkorbint adott, 13 C oxálsavval jelölte a vizsgált személy aszkorbinsavát, és több héten át figyelte a kiürülést.) A rendszerre a nyomjelzők beadása közötti időtartamban a következő differenciálegyenlet írható fel: (4.20) A t = 0 időpillanatban a 1(0) specifikus aktivitású nyomjelzőt juttatunk a rendszerbe, ekkor t 1-ben a specifikus aktivitás: Ekkor újabb dózist adunk be. Egy nagyon kis idő után, (t 1 + δt)-ben a specifikus aktivitás: (4.21) Egy újabb intervallum elteltével: (4.22) A harmadik befecskendezés után: (4.23) Az n-edik befecskendezés után: (4.24) (4.25) Az n befecskendezés után: (4.26) ábra - Nyomjelző anyagok változása többszörös dózis modellezése során 67

80 Számítógépes szimuláció 68

81 5. fejezet - 5. Inverz feladat megoldása Inverz feladatnak nevezzük a kompartment analízisben a megfelelő modell, illetve paraméterek meghatározását a rendelkezésünkre álló adatok (mérések, információk stb.) alapján. Van, amikor nehezen kaphatók meg az analitikus megoldások, ilyenkor numerikus módszereket használunk. A mérendő adatok megválasztása a kísérletező korábbi ismereteitől is függ. Előfordulhat az, hogy nagyon keveset tudunk a rendszer szerkezetéről, illetve a rendszert leíró matematikai modellről. Ilyenkor a feladatot rendszer identifikációnak, vagy specifikációnak nevezzük. A másik véglet, amikor van olyan információnk, amely specifikálja a modellt. Ekkor a modell paramétereinek meghatározása a feladat. Lehetséges, hogy e két szélső eset között van a vizsgálandó probléma, tudunk valamit a rendszer szerkezetéről, de az nem teljesen specifikált. Az inverz feladat ekkor paramétermeghatározás és rendszerspecifikáció keveréke. A fentiekből látszik, hogy az inverz feladat több szinten jelenhet meg. Az inverz feladat megoldásához kísérleti tervekre, becsléselméletre és statisztikai analízisre van szükség. A rendszeridentifikációs feladatoknál fontos az egyértékűség. Általában ritkán van lehetőség arra, hogy megmondjuk, a rendszer identifikációt is tartalmazó feladat megoldása mennyire jó, mivel nem áll rendelkezésünkre az összes lehetőség, hogy összehasonlítást tehessünk. Gyakran találhatunk egy rendszerre kompartment leírást. Hogy célszerű-e és használható-e a kompartmenttel történő leírás, az csak a rendszerről kapott más információk segítségével dönthető el Inverz feladat megoldásának grafikus módszerei Az inverz feladat megoldásának nagyon sok módszerét ismerjük. Inverz feladat grafikus módszerrel történő végrehajtásának fontos része az exponenciális kiürülési görbék paramétereinek meghatározása. A paramétereket legpontosabban számítógéppel lehet meghatározni, de más módszerek is elterjedtek. Az orvosi gyakorlatban ma még nagyon elterjedtek a grafikus eljárások. Ezek közül most két módszert említünk: Bleehan Fisher módszer, Cohn Brues módszer. Ezek részletes ismertetésétől eltekintünk, de tudományos publikációkban még előfordulnak A módszerek pontossága Az inverz feladat megoldási módszereinek pontosságát leginkább befolyásoló tényezők a következők: 1. exponenciális kitevők egymáshoz való viszonya, 2. mérési eredmények pontossága, 3. mérési adtok száma. A felsorolt tényezők más-más hatást fejtenek ki a pontosságra. Ezen tényezők részletes analízisével itt nem foglalkozunk Számítógépes paramétermeghatározás 69

82 5. Inverz feladat megoldása Élettani folyamatok dinamikus tulajdonságainak matematikai leírása időtartományban differenciálegyenlet vagy differenciálegyenletrendszer segítségével történik. A rendszert leíró differenciálegyenlet, illetve differenciálegyenlet-rendszer felírását célzó eljárást identifikációnak nevezzük. A rendszerről szerzett előzetes ismeretek alapján az identifikáció két szélsőséges esetét különböztetjük meg. Ha a matematikai modell struktúráját ismerjük, tehát tudjuk, hogy a fiziológiai rendszert hány kompartmenttel modellezhetjük, és ezek milyen kapcsolatban állnak egymással, akkor paraméterbecslésről beszélünk. Ha a vizsgált rendszer struktúrája ismeretlen, akkor a megoldandó feladatot rendszeridentifikációnak nevezzük. A gyakorlatban előforduló feladatok általában e két szélső eset közé esnek. Diagnosztikai vizsgálatok esetén például az előzetes orvosi kutatások tisztázzák a modell struktúráját, így a mérési eredmények kiértékelése paraméterbecslésre egyszerűsödik. Ez természetesen nem jelenti azt, hogy a mérési és kiértékelési módszerek fejlődése nem vonhatja maga után a modell struktúrájának finomítását. Az identifikációs feladatok megoldására többféle matematikai módszer létezik. Ezek közül az adott feladat megoldásához előnyeik, hátrányaik figyelembevételével kell kiválasztani a legmegfelelőbbet Clearance-vizsgálatok mérési adatainak számítógépes kiértékelése A clearance vizsgálatok kompartment modelljének matematikai leírása általában lineáris elsőrendű differenciálegyenletrendszer. A vizsgálat kiértékelése tulajdonképpen az ilyen differenciálegyenlet-rendszer megoldását adóegyenletben szereplő X iés λ iparaméterek meghatározásából áll. A feladat ezek után az, hogy a vizsgálati eredményeket hordozó mérési pontsorozatra egy exponenciális tagok összegéből álló görbét illesszünk, és miután az illesztés jósága (pontossága) egy adott értéket elért, kiírassuk az X iegyütthatók és λ ikitevők értékét. Legyenek adottak az alábbiak: m a mérési adatok száma, k a becsült paraméterek száma, t 1, t 2,... t m mintavételi időpontok (független változó), y 1, y 2,... y m a mért adatok a fenti időpontokban, becsült értékek a fenti időpontokban, b 0, b 1,... b k a becsülni kívánt paraméterek kezdeti értéke. Feladat: meg kell határozni azokat a b 1,... b k paraméterértékeket, melyekre teljesül, hogy a mért y i adatok és a kiszámított $y i becsült értékek különbségének négyzetösszege minimális, azaz (5.1) (5.2) minimalizálása. Az $y i becsült érték meghatározásához írjuk át a fenti egyenletet a következő alakra: (5.3) A (5.2) minimalizálásához valamilyen alkalmas stratégia szerint lépésenként változtatnunk kell a paramétervektort. 70

83 5. Inverz feladat megoldása Iterációs számítást alkalmazunk. A számítás leállításának feltételét megadhatjuk egyrészt úgy, hogy a Φ minimumra előírunk egy meghatározott értéket, és ennek elérése után állunk le, másrészt figyelhetjük a konvergencia sebességét, és ha ez egy bizonyos érték alá csökken, az eredményt elfogadjuk. Az algoritmus konvergenciájának sebessége ugyanis a kezdeti igen nagy értékről meredeken csökken. Ha a konvergencia sebessége egy bizonyos érték alá csökken, akkor a kiértékelés pontosságának a növekedése nem áll arányban a ráfordított futási idővel. Mivel a diagnosztikai vizsgálatokból származó mérési eredmények között sok a jelentős hibával terhelt (már aránylag nagy hibanégyzet összegnél erősen csökken a konvergencia sebessége), célszerűbb a konvergencia sebesség adott értékének elérésével leállítani az iterációt Au kolloiddal végzett májáramlás vizsgálatok kiértékelése Az IBM PC személyi számítógépen Turbo Pascalban írt programot többek között radioaktív 198 Au kolloiddal végzett májáramlás vizsgálatok kiértékelésére használtuk. A vizsgálat alapja, hogy a bizonyos szemcsenagyságú kolloidokat a plazmából a szervezet RES (reticuloendothelialis rendszer) sejtjei szűrik ki. Ezen sejtek legnagyobb számban a májban találhatók, de előfordulnak a lépben és a csontvelőben is. A mérés menete: A betegnek beadják a 198 Au kolloidot. A jelzett anyag elkeveredése után mérik az agy felett a plazma aktivitását (percenkénti beütésszámot). A mérési pontok elméletileg egy multiexponenciális jelleggel csökkenő görbén helyezkednek el. A vizsgálatnak megfelelő matematikai modell struktúrája 4 kompartmentből álló anya (mammillary) rendszer ábra - Máj vémlásának modellje A 198 Au kolloid oldatot (nyomjelzőt) a plazmába adjuk be intravénás injekció formájában. A kolloidok kiürülését a szervezetből az 5.2. ábra mutatja ábra - Kolloidok kiürülése májáramlás vizsgálata során 71

84 5. Inverz feladat megoldása A számítógépes identifikáció eredményeként meghatározzuk a következő egyenletben szereplő b i(i = 1...n) együtthatókat: (5.4) Egy konkrét esetben ezek az értékek a következők: Ezen identifikációs eredmények az orvos számára nem elégségesek a diagnózis meghatározásához. A diagnózis, illetve a terápia meghatározásához szükség van a különböző szervekben jellemző felezési idők meghatározására. Jelen példában ezen értékek a következők: Felezési idő a máj RES sejtjeiben: 2,16 perc. Felezési idő a lép RES sejtjeiben: 4,9 perc. Felezési idő a csontvelő RES sejtjeiben: 19,36 perc. Még ez sem elég a tényleges diagnózis felállításához, szükség van a májon időegység alatt átáramló vérmennyiségre százalékára. Jelen esetben ez az érték: V = 32,03% Ezen adatok alapján az orvos megbízható vizsgálati eredményekhez jut, melyek segítik a diagnózis felállításában. A program a mért adatok beadása után kiszámítja a matematikai modell paramétereit, majd ezekből az orvos számára sokkal informatívabb fiziológiás adatokat (májra, lépre, csontvelőre vonatkozó biológiai felezési időket és a máj véráramlását a keringő perctérfogat százalékában) Számítógépes eseményfelismerés élettani folyamatok vizsgálatára Az élettani folyamatok (élő szervezetek) rendellenes működésének felismerése kiemelkedő fontosságú feladat. Különösen fontos az élő szervezetekben bekövetkező kóros elváltozások gyors felismerése. Dinamikus 72

85 5. Inverz feladat megoldása rendszerekben ezt általában hibaelhárításnak szokás nevezni, élő szervezeteknél a rendellenességet eseménynek nevezzük. Célul tűztük ki, hogy megoldjuk a vizsgált élő rendszeren belüli változások gépi felismerését real-time és időszakos detektálással, valamint modellkísérleteket végzünk a kidolgozott módszer alkalmazhatóságának igazolására. E tématerület kidolgozásához az adta a lehetőséget, hogy az általunk kifejlesztett és az előzőekben vázolt szimulációs programok felhasználásával különböző, nehezen felismerhető eseményeket követő átmeneti élettani folyamatokat is elő tudunk állítani. Eseményfelismerési elv Többváltozós dinamikus rendszert leíró állapotegyenlet: ahol: x(t) mérhető állapoteltérés vektor A és B a rendszermátrixok u(t) esemény indikátor vektor, amelynek értéke 0 vagy 1, attól függően, hogy az illető betegség mint esemény fellép-e vagy sem. Betegségek detektálása az élettani rendszerekben A betegségek monitorozása és korai felismerése az élettani rendszerben rendkívül fontos. Eseményfelismerés inverz módszere 1. A lineáris folyamatmodell paramétereit kell indentifikálni különféle betegségek esetére. 2. Állapotváltozók monitorozása. 3. Paraméterek újraszámolása egy identifikált lineáris modell segítségével. 4. Lehetséges betegségek lokalizálása. Tanulási folyamat A tanulási folyamaton tulajdonképpen az A és B mátrixok meghatározását értjük. Az a ij, b ij értékeket az alábbi nemlineáris többváltozós függvény minimalizálásával kapjuk meg: Eseményfelismeréshez a fenti egyenletet diszkretizálni kell: (5.5) (5.6) ahol: Számunkra u k eseményindikátor vektor meghatározása szükséges. Az (5.6) kifejezést átrendezve u-ra a következőt kapjuk: (5.7) 73

86 5. Inverz feladat megoldása (5.8) Esettanulmány A módszer gyakorlati alkalmazására egy példát mutatunk be. Legyen egy 7 bemenetű, 7 kimenetű dinamikus rendszer a következő: 5.3. ábra - Hétbemenetű, hétkimenetű dinamikus rendszer modellje A keresztkapcsolatok figyelembevételével a dinamikus rendszert 7 7=49 darab átviteli függvénnyel jellemeztük ábra - Egy esemény (U1) bekövetkezésének modellezése hétbemenetű rendszerben Az 5.4. ábra mutatja a bekövetkezett U1 eseményt (U1 = 1). A be nem következett események szignifikánsan különböznek a bekövetkezett eseménytől (±0,1 tartományban). Gyakran előfordul, hogy egy betegség esetén több esemény, úgynevezett csoportos esemény következik be ábra - Három párhuzamosan bekövetkező esemény (U1, U3, U6) bekövetkezésének modellezése hétbemenetű rendszerben 74

87 5. Inverz feladat megoldása Az 5.5. ábrán látható, hogy az U1, U3, U6 úgynevezett csoportesemény bekövetkezett, míg a be nem következett események szignifikánsan különböznek a bekövetkezett eseményektől. A vázolt eseményfelismerési elv elméletileg alkalmas a betegségek korai monitorizálására, ehhez azonban sok további vizsgálatra van szükség. 75

88 6. fejezet - Többparaméteres kapcsolt szabályozások Problémafelvetés A technika fejlődésével egyre nagyobb az igény a különböző folyamatok automatikus irányítására. Vizsgáljunk meg két különböző esetet.(6.1. és 6.2. ábra) 6.1. ábra - Folyadék hőmérséklet és folyadékmennyiség szabályozása A 6.1. ábrán két tartály összekapcsolása látható. A közös kiömlő folyadék mennyiségét és hőmérsékletét kell szabályoznunk előírt módon. A kiömlő anyagmennyiséget és a hőmérsékletet mérjük és szabályozzuk az A és B tartályokba történő beavatkozással (szabályozó1 és szabályozó2). A problémát az okozza, hogy a két szabályozott mennyiség (q) és hőmérséklet (t) kölcsönhatásban vannak egymással. A kereszthatások stabilitási problémát generálnak, amit meg kell oldani ábra - Erőmű egyszerűsített blokkvázlata 76

89 Többparaméteres kapcsolt szabályozások A másik példában, a 6.2. ábrán egy egyszerűsített erőművi blokk vázlata látható. A T turbinára időegység alatt q gőzmennyiséget viszünk, ezzel szabályozzuk a turbina fordulatszámát, x s2 = n (a turbina mindenkori fordulatszáma). A turbina tengelyére egy külső gerjesztésű generátor (G) van kapcsolva, mely kimenetén a kívánt hálózati feszültség (220 V vagy 380 V) rendelkezésre áll. A való életben napszaktól függően változik a generátorra jutó fogyasztói terhelés, ezért a kapocsfeszültség nem lesz állandó. A kapocsfeszültséget szabályoznunk kell, ezért x s1 = U k (kapocsfeszültség). A feszültségszabályozást úgy valósítjuk meg, hogy az x s1 szabályozott jellemzőt összehasonlítjuk x a1 alapjellel, és beavatkozunk a generátor gerjesztésébe. A gerjesztésbe való beavatkozás nem elég, a generátor fordulatszámát is adott fordulatszámon kell tartani. Ezt az SZAB2 szabályozóval valósították meg, mely a turbina lapátjaira időegység alatt bevitt gőzmennyiséget szabályozza. Ha például hirtelen lecsökken a kapocsfeszültség, megnő a generátor nyomatékigénye, lecsökken a fordulatszám. A SZAB1 szabályozó beavatkozik a gerjesztésbe, a SZAB2 nyitja a gőzszelepet. Lehet, hogy a SZAB1 már beállította a kívánt kapocsfeszültséget, azonban a SZAB2 hatása még nem fejeződött be. Egy hatalmas tömeget, a turbinát forgatva számolni kell a lendülettel, így végül túlszabályozás történik, tehát nem független egymástól a két szabályozás, kereszthatások jönnek létre Kereszthatások kimutatása Szerkesszük meg a 6.2. ábrán bemutatott rendszer hatásvázlatát (6.3. ábra). A rendszer elemeit átviteli függvényekkel jellemezzük ábra - Erőmű hatásvázlata 77

90 Többparaméteres kapcsolt szabályozások Írjuk fel a rendszerben generálódott belső zárt hurok eredő átviteli függvényét (6.1). Egyszerűsítve a (6.1)-et, a (6.2) összefüggést kapjuk. Tételezzünk fel egy Δx m1 változást: (6.1) Egyszerűsítve: (6.2) A 6.3. ábrán szaggatott vonallal ábrázolva láthatjuk a járulékos szabályozási kört, amely stabilitási problémát okozhat A keresztkapcsolatok kiküszöbölése Megoldásként segédszabályzókat helyezünk el a rendszerben, ezek az R 12 és R 21 átviteli függvényű szabályozók (6.4. ábra) ábra - Keresztkapcsolatok kiküszöbölése segédváltozókkal 78

91 Többparaméteres kapcsolt szabályozások A keresztkapcsolatok megszüntetéséhez a következö feltételeknek kell teljesülnie: Innen: (6.3) innen: (6.4) Így tehát meghatároztuk a segédszabályzók átviteli függvényét. Megvalósíthatóság Teljes invariancia: ha lefedhető P, PI, PD vagy PID-vel az R 12 és R 21 segédszabályzók átviteli függvénye. Részleges invariancia: ha csak részben valósítható meg a segédszabályozóknál a PI, PD vagy PID-vel való lefedés Többparaméteres kapcsolt szabályozások matematika leírása Vizsgáljuk meg az n bemenetű és n kimenetű általános rendszert (6.5. ábra) ábra - Többparaméteres kapcsolt szabályozási rendszer 79

92 Többparaméteres kapcsolt szabályozások A többparaméteres kapcsolt rendszer (irányítandó folyamat, szabályozott szakasz) átviteli mátrixa: (6.5) Szabályozók (segédszabályozókkal): (6.6) Alkalmazott jelölések: Szabályozott jellemzők Alapjelek Rendelkező jelek Módosított jelek A fenti jelölések bevezetésével a 6.5. ábrán szereplő hatásvázlat a következőképpen egyszerűsödik le: Határozzuk meg a szabályozott jellemzők és a rendelkező jelek függését a külső jelektől 6.6. ábra - Többparaméteres kapcsolt szabályozási rendszer hatásvázlata 80

93 Többparaméteres kapcsolt szabályozások A fenti egyenletekből kifejezve a következő eredményt kapjuk: (6.7) (6.8) A 6.7 és 6.8 egyenletek a többparaméteres kapcsolt szabályozások matematikai leírását adják. Zavaró hatások figyelembevétele A zavaró hatások vizsgálatánál feltételezzük, hogy a zavarások közvetlenül a szabályozott jellemzőkre hatnak (6.7. ábra) ábra - Többparaméteres kapcsolt szabályozási rendszer hatásvázlata külső, zavaró hatások figyelembevételével Legyen a külső zavaró jelek, pedig a külső zavaró jelek átviteli mátrixa. 81

94 Többparaméteres kapcsolt szabályozások Írjuk fel az összefüggéseket. Eredményül kapjuk a következő kifejezéseket: (6.9) (6.10) A 6.9 és 6.10 összefüggések egy többparaméteres n bemenetű és n kimenetű kapcsolt rendszer matematikai leírását adják Többparaméteres kapcsolt rendszerek stabilitásvizsgálata, kompenzálása Stabilitásvizsgálat Általános, többparaméteres kapcsolt rendszerben feltételezzük, hogy minden mindennel összefügg, ezért tetszőleges jelcsoportra elvégezhető a stabilitásvizsgálat. Bármely jelnek véges értékhez kell tartania, különben a rendszer instabil. A stabilitás a rendszer belső tulajdonsága. Ha egy rendszer labilis, az mindegy, hogy a külső vagy a belső zavarójelektől vagy zajoktól lesz instabil. Ebből következik, hogy vizsgálhatjuk a rendszert a zajoktól függetlenül, feltételezve, hogy a rendszer külső zavarásoktól mentes. Ebben az esetben: (6.11) A stabilitásvizsgálatot a (6.12) vagy a (6.13) összefüggések alapján végezhetjük el. Mi most a stabilitásvizsgálatot a összefüggés alapján mutatjuk be. (6.12) A (6.12) összefüggés egy szorzat, melynek két tényezője van: az egyik tényező, a másik. Megállapíthatjuk, hogy nem lehet végtelen, lévén az egy konstans érték (Például: x a1 = 220 V, x a2 = 3600 ford/perc). Vizsgáljuk meg az kifejezést: Legyen a felnyitott rendszer eredő átviteli mátrixa: következőképpen alakul:. A vizsgált feltétel tehát a (6.13) 82

95 Többparaméteres kapcsolt szabályozások (6.14) Stabilitásvizsgálathoz a (6.15) összefüggést kell kifejtenünk, vagyis: (6.15) (6.16) kifejtése után a (6.17) kifejezést kapjuk, ami egy n-ed fokú kapcsolt karakterisztikus egyenlet: (6.16) A stabilitás feltétele, hogy a többparaméteres kapcsolt szabályozási rendszer karakterisztikus egyenletének összes gyöke negatív vagy negatív valós részű konjugált komplex gyök legyen. Routh Hurwitz kritérium Léteznek olyan stabilitási kritériumok, amelyek segítségével a karakterisztikus egyenlet gyökeinek meghatározása nélkül eldönthetjük, hogy a rendszer stabil avagy nem stabil. Induljunk ki a (6.17) egyenletből. A stabilitáshoz két feltételnek kell teljesülni: 1. feltétel: D 1 > 0. Ez azt jelenti, hogy a karakterisztikus egyenlet összes együtthatójának léteznie kell pozitív előjellel. Ha egyetlen együttható is hiányzik, akkor a rendszer instabil. 2. feltétel: Δ 1, Δ 2,, Δ n 1, Δ n1 > 0. A (6.18) determináns összes főátlóra támaszkodó aldeterminánsának meg kell lennie, és annak pozitívnak kell lennie. Vagyis: Δ 1 = D n 1 Δ 2 = D n 1 * D n 2 D n*d n 3 stb. Δ 1, Δ 2,, Δ n magyarázata: (6.17) Ha mindegyik feltétel teljesül, a vizsgált rendszer stabil. Ha valamelyik feltétel nem teljesül, a rendszer instabil. Nézzünk egy példát az instabilitásra: 83

96 Többparaméteres kapcsolt szabályozások 6.8. ábra - Kétparaméteres kapcsolt szabályozási rendszer stabilitás vizsgálata (példa) Mivel D 3 negatív, a rendszer instabil. Kompenzálás 6.9. ábra - Többparaméteres kapcsolt szabályozási rendszer kompenzálása Instabil rendszereket stabilizálni kell. Induljunk ki egy elvi lehetőségből. A kompenzálandó rendszert próbáljuk stabilizálni -val. Az eredő átviteli függvény: ahol az egységmátrix. 84

97 Többparaméteres kapcsolt szabályozások A teljes invariancia: (6.18) Az rendszer hasonló bonyolultságú rendszer, mint maga a, az eredeti kompenzálandó rendszer, ezért a gyakorlatban nem kivitelezhető. Másrészről az -val való kompenzálás ( ellenrendszer ) teljes függetlenséget, invarianciát jelent, amelyre a legtöbb esetben nincs szükség. Gyakorlati megoldásként a kompenzáláshoz bevezethetünk egy úgynevezett gyorsítómátrixot részleges invarianciát okoz (6.10. ábra):, ami ábra - Kompenzálás ún. gyorsító elemek beiktatásával A gyorsítómátrix bevezetésével elérhetjük, hogy a kompenzált rendszer eredménye egy háromszög mátrix lesz. Ez azt jelenti, hogy az első szabályozási kör hatással van a második, harmadik stb. szabályozási körre, de nem alakul ki járulékos szabályozási hurok. (6.19) Ezt a lehetőséget szemlélteti a ábra. Az ún. főszabályozási körök között egyirányú kölcsönhatás van, de visszahatás nincs, így járulékos hurok nem alakulhat ki ábra - Gyorsító elemek beiktatásának eredménye (részleges invariancia) 85

98 Többparaméteres kapcsolt szabályozások Összefoglalás A technika fejlődésével a komplex automatizálási problémák rohamos fejlődésben vannak. A stabilitás kérdése szinte minden élő és élettani folyamatnál létfontosságú kérdés. Példákon keresztül bemutattuk az ún. keresztkapcsolatok keletkezését, az ún. járulékos stabilitási problémák generálódását, a többparaméteres kapcsolt szabályozások stabilitásvizsgálatát, kompenzálását. A jobb áttekinthetőség kedvéért a matematikai leíráshoz a mátrixos megoldást választottuk az ún. állapotteres megoldás helyett. 86

99 7. fejezet - Számítógépes optimalizálási módszerek Bevezetés A technika rohamos fejlődése következtében létrehozott rendszerek, berendezések működtetésénél alapvető követelmény az optimális működés (minimális anyag- és energiafelhasználás stb.) megvalósítása. Ezen követelmények gyakorlati megvalósításához számítási (modellezési) feladatot kell elvégezni, és a gyakorlatba átültetni. A számítógépes optimalizálás feladata mindig valamely integrálkritériumra épül. Az integrálkritérium általános alakja: A számítógépes optimalizálásnak vannak előnyei és nehézségei (problémái), amelyek röviden a következők: Az integrálkritérium teljesítését perem- és mellékfeltételek (például a rendszerben lévő nemlinearitások) befolyásolják. A rendszer méretezése, tervezése közvetlenebb, mint a manuális beavatkozások, mert a legfontosabb követelmények egy integrálkritérium minimalizálásában, teljesülésében, integrál-funkcionál minimalizálásában, tehát tömörített formában jelentkeznek. Emiatt az elvi és gyakorlati korlátozások és azok befolyása szembetűnő. Bizonyos előrelátással megmondható, hogy miképp viselkedik a rendszer egy későbbi időpontban változó körülmények között, azaz prevencióra van lehetőség. A szabályozás adaptálódóvá, alkalmazkodóvá tehető. Nemlineáris rendszerek és változó együtthatójú rendszerek is optimalizálhatók számítógépes módszerrel. Problémát okoz, hogy különböző rendszereknél más-más kritériumot kell választani. Az optimalizálási kritérium kiválasztása nehéz feladat. A 7.1. ábrán egy úgynevezett nulltípusú szabályozás átmeneti függvénye látható ábra - Nulltípusú szabályozás átmeneti függvénye 87

100 Számítógépes optimalizálási módszerek Itt az állandósult statikus hiba értéke ahol K a körerősítés értéke. Az optimális működés feltétele a körerősítés (K) minél nagyobb értéken történő megvalósítása. A körerősítés növelése viszont erősen befolyásolja a stabilitást. Ebben az esetben a megválasztott optimális körerősítés (K opt) kompromisszum eredménye a statikus hiba és a rendszer stabilitása között. Egy optimális rendszer működését igen erősen rontják az esetlegesen hibás feltevések, illetve az optimalizált rendszer, folyamat paramétereinek változása. Az optimális rendszerek tervezése, méretezése az alábbi három fázisból áll napjainkban: optimalizálási kritérium meghatározása, optimális irányítás törvényének meghatározása, optimális irányítóberendezés ( szabályozó ) felépítésének meghatározása. Megkülönböztetünk úgynevezett statikus és dinamikus optimalizálást. Abban az esetben, ha a rendszer egyenletekkel/egyenletrendszerekkel irható le, akkor statikus optimalizációról beszélünk. Abban az esetben, ha a rendszer differenciálegyenletekkel/differenciálegyenlet-rendszerekkel van leírva, dinamikus optimalizációról van szó. Megjegyezzük, hogy a dinamikus optimalizáció sok esetben visszavezethető statikus optimalizációra. Nézzünk egy egyszerű példát! 88

101 Számítógépes optimalizálási módszerek Végértékek: Kérdés: A rendszer differenciálegyenleteivel adott, így dinamikus optimalizálást alkalmazunk. Vezessük be a következő költségfüggvényt: Ha elég gyors az aritmetikai egység, akkor az összes időbeli változóhoz folytonos költségfüggvény rendelhető. Így végül statikus optimalizálásra vezettük vissza a dinamikus optimalizálást Optimalizációs módszerek Folytonos gradiens módszer Folytonos gradiens módszernél a beavatkozó jelek (p 1, p 2) folytonos függvények ábra - Folytonos gradiens optimalizálási módszer Mindig a maximális meredekséggel juttassuk le a rendszert az optimális munkapontba. Az optimum: Az optimum a két vektor szorzata. Ezt akkor kapjuk, ha a két vektor párhuzamos. 89

102 Számítógépes optimalizálási módszerek Folytonos gradiens módszer gyakorlati megvalósítása a következő: 7.3. ábra - Folytonos gradiens módszer megvalósítása Diszkrét gradiens módszer A diszkrét gradiens módszer hasonló, mint a folytonos gradiens módszer. Különbség a két módszer között, hogy a diszkrét gradiens módszer esetén a start-cél stratégiai útvonalat diszkretizáljuk. Iterációs módszer: számítása ahol: (a j-edik komponens) 7.4. ábra - Diszkrét gradiens módszer 90

103 Számítógépes optimalizálási módszerek A K arányossági tényező megválasztása kompromisszum eredménye, kompromisszum a sebesség és a számítás pontossága között Relaxációs módszer Az egyik paramétert (például a P2-t) adott szinten tartjuk. P1-et változtatjuk. Eljutunk egy olyan pontra, ahol a költség már nem csökken. Ekkor a fix és a változtatott paramétereket felcseréljük, P1 lesz az állandó ábra - Relaxációs módszer 91

104 Számítógépes optimalizálási módszerek Az eddig említett három eljárás közös hátránya, hogy megállhatnak a rendszer lokális maximumában, vagy minimumában BFM (Brute Force Method) A paramétereket úgy változtatjuk, hogy az összes lokális maximum-helyeket végigpásztázzuk ábra - Brutális beavatkozás módszere Fontos, hogy a rendszerben ne okozzunk maradandó károsodást. 92

105 Számítógépes optimalizálási módszerek Nagyon lassú, de tényleges optimum-meghatározást megvalósító eljárás Számítógépes optimalizációs módszerek gyakorlati alkalmazása Gyakorlati alkalmazásnál két fontos esetet különböztetünk meg, a paraméteroptimalizációt (7.7. ábra) és a folyamat identifikációt (7.8. ábra). A paraméteroptimalizációnál a rendszer paramétereket folytonos, illetve diszkrét lépésekben változtatjuk, és integrál kritériumok alkalmazásával meghatározzuk az eredményeket. Folyamat identifikáció esetén cél a rendszert leíró matematikai modell megalkotása. Ennek a gyakorlati példája látható a 7.8. és a 7.9. ábrákon ábra - Számítógépes paraméteroptimalizáció gyakorlati alkalmazása 7.8. ábra - Folyamat identifikáció Példa másodfokú rendszer identifikációjára: Legyen. 93

106 Számítógépes optimalizálási módszerek Kérdés: A =? a 1 =? a 2 =? 7.9. ábra - Egy gyakorlati példa az identifikációra Adott egy valóságos rendszer, s annak matematikai modellje. A feladat a matematikai modell illesztése, állandóan változtatva az A, a 1, a 2 paramétereket ismétlődő ütemben, úgy, hogy a modell minél jobban leképezze a valóságos rendszert. A K kapcsoló T idő múlva kapcsol. A T késletetés után az első két tag zérussá vált, tehát a differenciálegyenlet leegyszerűsödik: x(t) = A*x be(t). Így csak egyetlen paramétert kell megváltoztatni, és megkapjuk a rendszer tényleges A értékét. Amikor ez megtörtént, zárjuk a kapcsolót. Ciklikusan változtatjuk az a 1, a 2 paramétereket mindaddig, amíg a két átmeneti függvény azonos lesz. A számítógépes programnak vagy úgy adjuk meg az integrálkritériumot, hogy az eltérés 1% legyen a valóságos és a közelítő érték között, vagy pedig a gradienst állítjuk be (például 10 mv/perc-re), és amikor már ilyen kicsi a változás, az iteráció leáll, nem érdemes tovább végezni. 94

107 8. fejezet - Mesterséges neurális hálózatok Az intelligens biológiai rendszerek fontos jellemzői, hogy képesek a környezetükből, ingerek formájában, információt nyerni (érzékelés), ezeket az információkat tárolni, azaz később újra életre kelteni (emlékezet), s ezek alapján ok-okozati kapcsolatokat felderíteni, azaz az érzékelt információkat általánosítani (tanulás). A számítógépek fejlődésével, az ember képes ezen ún. kognitív képességeit elsősorban technikai értelemben (mennyiség, sebesség) kiterjeszteni. Az alkalmazott algoritmusok és modellek tekintetében azonban az emberi agy képességei még sok tekintetben jóval felülmúlják a számítógépekét, különösen a tanulási fázist illetően. Gondoljuk például arra, hogy egy ember egy tömegben könnyen felismer egy korábban látott személyt, még akkor is, ha az más ruhában van. Logikusnak tűnt az emberi agy működését utánzó modelleket számítógépre alkalmazni, remélve ezáltal a számítógépek működési hatékonyságának növelését. A mesterséges neurális hálózatok modelljei e törekvés eredményeként jöttek létre. Informatikai szempontból a neurális hálózatok alkalmazási területeit három fő csoportba sorolhatjuk: Adatok analízise (például osztályozás, mintafelismerés) Adatok modellezése (például önszerveződéssel kialakítható kapcsolatok létrehozása) Adatok általánosítása (regresszió, szimuláció) A neurális hálózatok sokkal inkább modellcsaládokat jelentenek amelyek más és más feladatok megoldását teszik lehetővé, mint technikai módszerek gyűjteményét. Ezeknek a neurális hálózati modelleknek fontos jellemzője a viszonylag gyors működés (nagy számítási sebesség, hatékony algoritmusok) és a robosztusság (érzéketlen az adat-, illetve modellhibákkal szemben). A megfelelő felépítésű neurális hálózatok mint univerzális approximátorok képesek tetszőleges nemlineáris leképzések közelítésére. Bizonyos felépítésű hálózatok alkalmassá tehetők az adatokban meglévő hasonlóságok felismerésére, osztályozási problémák megoldására. Ugyanakkor a neurális hálózatok elméletében még számos megválaszolatlan kérdés van, s ezek következtében e modellek alkalmazása még sok heurisztikus, tapasztalati elemet tartalmaz, ideértve az adott probléma megoldásához megfelelő hálózati struktúra kiválasztását és a hálózat tanítási módszereinek megválasztását is. A neurális hálózat a mesterséges intelligencia egyik széles körben alkalmazott eszköze. Felhasználási területe az önálló tájékozódású robot repülőgépektől a tőzsdei részvények trendjének elemzésén keresztül az orvosi diagnosztikai alkalmazásokig igen széles. A mesterséges neurális hálózatok az emberi agy idegsejtjeinek működését szimulálják számítógép segítségével. Lényegében az idegsejtek és azok kapcsolatait, mint modell-struktúrát alkalmazzák egy adatpárokkal jellemzett bemenet-kimenet kapcsolat összefüggéseinek általánosítására. Mint említettük, a mesterséges neurális hálózatok modellje hasonlóan a polinomokhoz univerzális approximátor, így függvények közelítésére és osztályozási problémák megoldására egyaránt alkalmas. Mielőtt a számítógépes modellekre rátérnénk, tekintsünk át néhány fogalmat és jellemzőt Alapfogalmak Fiziológiai alapok Néhány adat az emberi agyról: Egy átlagos agy térfogata: 1,4 dm 3. Ennek aktív része egy 2 mm vastag réteg (cortex, szürkeállomány), amelynek térfogata 0,32 dm 3 és a felszíne kb. 0,16 m 2. Az idegsejtek sűrűsége ebben a tartományban neuron/mm 3, ami (16 billió) idegsejtet jelent ábra - Az emberi agy 95

108 Mesterséges neurális hálózatok Ezeknek a neuronoknak a milliói állnak egymással közvetlen kapcsolatban. A hálózat csomópontjaiban helyezkednek el a sejtmagok, amelyek elektromos impulzusokat képesek fogadni a dendrites és szinapszisos érzékelők által, és továbbítják azt megváltozott formában az axonokon keresztül a többi szomszédos csomópontba (8.2. ábra) ábra - Egy biológiai idegsejt szerkezeti hatásmechanizmusa A bemeneti ingerületre csak akkor történik reakció, ha az egy bizonyos küszöbértéket elér, illetve meghalad. Az információ elektromos feszültségváltozás formájában lép be az idegsejtbe a faszerű dentriteken keresztül, amelyek továbbítják azt a sejtmaghoz. A sejtmaghoz az axon csatlakozik, s a csatlakozásánál egy elektrolikus gátként működő sejtmembrán helyezkedik el. Ez, mint egy kondenzátor, feltöltődve integrálja a dentritfaágakból beérkező feszültségváltozást, majd ha az egy adott szintet elért, kisül, és a feszültségváltozás az axonon keresztül a szinapszis végződéseken át továbbhalad a következő idegsejt dentritjébe Egy általános csomópont jelátvitele A biológiai idegsejt analógiájának tekintjük a mesterséges neurális hálózat csomópontját, a biológiai folyamat informatikai modelljét. A számítógépen szimulált, illetve imitált működés a fenti biológiai modell analógiájára történik. Ha a bemeneti stimuláció egy bizonyos küszöbérték alatt marad, nincs kimeneti válasz. Egy általános i-edik csomóponton történő jelátvitelt a 8.3. ábra szemlélteti. Legyen a vizsgált csomópontba bejövő jelek erőssége x i, amelyek w 1i súlyokkal súlyozva összegződnek, és ez a jel lép be a csomópontba (net i): (8.1) Ha ennek értéke nagyobb, mint a küszöbérték, a csomópont választjelet bocsát ki, amelynek jellege és nagysága a csomópont ún. aktivációs függvényétől függ. Az aktivációs függvény realizációja legegyszerűbb esetben az ún. Heaviside- vagy egységugrás függvénnyel lehetséges, amely valójában nem függvény, hanem disztribució. 96

109 Mesterséges neurális hálózatok 8.3. ábra - Jeláthaladás az i-edik mesterséges neuronon Formálisan a net i előállítható a súlyok és a bemenetek vektorainak skalár szorzataként: (8.2) Legyen f az aktivációs függvény, ekkor a csomópontból kilépő jel: (8.3) A neurális hálózat felépítése A neuronok hálózata csomópontokból és az azokat összekötő irányított élekből áll. Ezek az élek képviselik a jelátvivő csatornákat. Az élekhez hozzárendelt súlyok nagysága a szomszédos neuronok kapcsolatának erősségére utal. Tehát a neurális hálózat tekinthető úgy, mint egy irányított, súlyozott gráf. A csomópontok ún. rétegekbe rendezettek. Egy csomópont bemeneti jele az előtte lévő rétegből jön, és a kimenete a követő réteg felé irányul (feed-forward network). Saját rétegbeli csomópontok között nincs kapcsolat. Az első réteget bemeneti rétegnek, az utolsó réteget kimeneti rétegnek nevezzük. Ezek között helyezkednek el az ún. rejtett rétegek (8.4. ábra). A hálózat a bemeneti x vektort leképezi egy kimeneti y vektorba. A kapcsolat jellegét a hálózat felépítésén kívül alapvetően az aktivációs függvény milyensége határozza meg ábra - A mesterséges neurális hálózat szokásos felépítése 97

110 Mesterséges neurális hálózatok A neurális hálózat tanítása A neurális hálózat tanításának nevezzük azt a folyamatot, amelynek során a megfelelő súlyok meghatározása történik úgy, hogy az előírt kimenet-bemenet kapcsolat teljesüljön. Ezt úgy kell elvégezni, hogy a hálózat a tanuló (minta) halmaz input-output párjainak megfeleltetését a lehető legjobban reprodukálja. Mivel a mintahalmaz elemei általában többen vannak, mint a keresett súlyok, ez lényegében egy többváltozós függvény minimumának keresését jelenti, ahol a célfüggvény mint hibafüggvény az ismert kimenetek és a hálózat által az ismert bemenetekre produkált kimenetei közötti eltérések négyzetösszege. Ez lényegében analóg avval, amikor egy regressziós algebrai polinom együtthatóit határozzuk meg az összetartozó adatok alapján a legkisebb négyzetek értelmében. A tanítás során ügyelnünk kell a hálózat általánosító képességének biztosítására, azaz arra, hogy a hálózat ne csupán a tanuló mintákon működjön helyesen, hanem a tanulásban részt nem vett bemenetekre is helyes kimenetet adjon, hiszen éppen ezért csináljuk a hálózatot. Ezt úgy biztosíthatjuk, hogy a rendelkezésre álló input-output mintákat két részre osztjuk, egy ún. tanulóhalmazra, amellyel meghatározzuk a hálózat súlyait, és egy validációs halmazra, amelynek az elemei nem vesznek részt a tanításban, hanem a már megtanított hálózat ellenőrzésére szolgálnak. A hálózat tanítása akkor tekinthető sikeresnek, ha a hálózat hibája mindkét halamazon nagyságrendben egyező mértékű. Ha a hálózat a tanuló halmazon sokkal jobban teljesít, mint a validációs halmazon akkor túltanulásról, ellenkező esetben pedig alultanulásról beszélünk. A tanításnak az input-output párokra épülő módszerét felügyelt tanításnak, míg csak az input ismeretérő épülő módszerét felügyelet nélküli tanításnak nevezzük. Az első módszer inkább függvények közelítésénél, míg a második inkább osztályozási feladatok megoldásánál szokásos A neurális hálózat szimulációja A megtanított neurális hálózat felhasználását, azaz a bemeneti jel alapján a kimeneti jel hálózat előállítását a hálózat szimulációjának nevezzük. Ez a tanítással ellentétben, amely általában iterációs folyamat, és ezért aránylag időigényes, egy véges lépésben végrehajtandó algoritmus, amely nagyon gyors. Nézzünk egy egyszerű hálózatot (8.5. ábra) ábra - Egy neurális hálózat szimulációja Általában a bemeneti csomópontokban nincs jeltranszformáció, tehát a rejtett rétegbeli csomópontokba belépő jelek: 98

111 Mesterséges neurális hálózatok (8.4) A rejtett rétegbeli csomópontokba belépő jelek transzformációja az aktivációs függvény felhasználásával megtörténik, majd az így transzformált rejtett rétegből kilépő jelek súlyozott átlaga lép be a kilépő rétegbe. (8.5) Ha a kilépő rétegben is van jeltranszformáció, a hálózatból kilépő jel: Vegyük észre, hogy a mátrix-vektor szorzások fontos szerepet játszanak, tehát az algoritmus párhuzamos végrehajtása, különösen nagyméretű hálózatok esetén, növeli az algoritmus hatékonyságát. Ezen rövid bevető után néhány alapvető mesterséges neurális hálózatot fogunk áttekinteni Perceptron hálózat A hálózat jellemzői és tulajdonságai A perceptron hálózat a legegyszerűbb hálózatok egyike, amely nem rendelkezik rejtett réteggel, és az aktivációs függvénye a signum függvény (8.6. ábra) ábra - A perceptron hálózat aktivációs függvénye (8.6) Mivel a hálózat kimenete bipoláris (+/ 1), azaz integer, elsősorban osztályozásra, illetve alakfelismerésre alkalmazzák. Gyakran kényelmesebb a bipoláris kimenet helyett bináris kimenetet alkalmazni (0,1). A bipoláris kimenet a hálózat tanításának algoritmusát teszi egyszerűbbé. A hálózat alkalmazásának fontos korlátja, hogy csak lineárisan szeparábilis osztályozási feladatokat tudunk vele megoldani. 99

112 Mesterséges neurális hálózatok Lineáris szeparábilitás Ezt a fogalmat és egyben a hálózat működését egy egyszerű példán keresztül mutatjuk be. A feladat legyen a sík pontjainak három diszjunkt osztályba sorolása. Az ezt biztosító perceptron hálózatot a 8.7. ábrán látható tanulóhalmaz segítségével határozzuk meg ábra - A tanulóhalmaz pontjai A hálózat bemeneti jele kétdimenziós vektor a síkbeli pont két koordinátája, azaz a bemeneti rétegben két csomópont szerepel. A kimenet, azaz az egyes osztályok azonosítása egy bináris számhármassal történik. Például az első osztályba sorolás esetén a kimenet {1, 0, 0}, tehát a kimeneti rétegben három csomópont szerepel. A hálózat felépítése a 8.8. ábrán látható ábra - Az osztályozást végző perceptron hálózat Újdonságként a bemeneti rétegben szerepel egy további csomópont, amelynek bemenete egységnyi (+/ 1). Ezt a virtuális csomópontot bias-nak (eltolásnak) nevezik, és azt a célt szolgálja, hogy az aktivációs függvény ingerküszöbe a zérustól eltérő értéket vehessen fel, amely így további paraméterként szerepelhet (8.9. ábra) ábra - Aktivációs függvény eltolással 100

113 Mesterséges neurális hálózatok A tanításhoz a rendelkezésre álló osztályonként pontból, szolgál tanításra és 5-5 pont validációra. A tanítási folyamat során a hálózat hibája oszcillálva tart a zérushoz (8.10. ábra) ábra - A hálózat hibájának alakulása az iterációs lépések függvényében Az egyes osztályok pontjait három egyenessel tudtuk elkülöníteni, szeparálni egymástól (8.11. ábra) ábra - Az osztályok lineáris szeparációja perceptron hálózattal 101

114 Mesterséges neurális hálózatok Általánosan: ha egy n dimenziós térben az egyes osztályok elkülönítése lehetséges egy n 1 dimenziós hipersíkkal, akkor lineárisan szeparálható problémáról van szó. Az osztályozás általánosító képességét úgy ellenőrizhetjük, ha berajzoljuk az ábrába a tanításban részt nem vett 5-5 eltérő osztályba tartozó pontot is (8.12. ábra) ábra - Az osztályok a validációs pontokkal Az ábra jól szemlélteti, hogy a hálózat a validációs pontokra is helyes eredményt ad. Az ábrából azonban egy negatívum is kiderül, nevezetesen az, hogy négy senki földje tartomány is létezik, és az ideeső síkbeli pontokról nem dönthető el, hogy melyik osztályba tartoznak A hálózat tanítása Legyen adott egy tanulóhalmaz, amely m darab {x (k),d (k) }, k = 1, 2,, m párból áll, ahol az x (k) k-adik inputhoz mint n dimenziós vektorhoz a d (k) output tartozik mint előírt érték. Feltesszük, hogy m > n, azaz a (8.7) egyenletrendszer túlhatározott, hiszen az ismeretlenek száma az n darab súly (beleértve a bias-t is) kevesebb, mint a független egyenletek száma, m. Ugyanis annyi egyenlet van, ahány elempárja van a tanulóhalmaznak. Az algoritmus, amellyel egy lehetséges megoldást (w súlyvektort) megkaphatunk a következő: 1. Felvesszük a keresett súlyok értékeit, például véletlenszerűen a [0, 1] intervallumban. 2. Kiszámítjuk a k-adik input esetén a hálózat outputját, y (k) t. 3. Ha y (k) d (k), akkor módosítjuk a súlyok vektorát: ahol δw egy n dimenziós korrekciós vektor: és η az ún. tanulási paraméter, 0 < η < 1. A y (k) = d (k) egyenlőség fennállása esetén nem módosítjuk a súlyokat. (8.8) (8.9) 102

115 Mesterséges neurális hálózatok 4. Vesszük a következő párt: x (k+1), d (k+1), és megismételjük a 2) és 3) lépéseket. Az ismétlést k = 1-től kezdve k = m-ig addig végezzük, amíg valamelyik k indexre módosítást kell végrehajtani. Novikoff tétele értelmében a szükséges módosítások száma korlátos, azaz az algoritmus véges lépésben befejezhető Backpropagáció hálózat A hálózat jellemzői és tulajdonságai Annak érdekében, hogy a neurális hálózat folytonos kimeneti értékeket is elő tudjon állítani, aktivációs függvényként most a szigmoid aktivációs függvényt alkalmazzuk, amely a korábbi egységugrás, illetve szignum függvény általánosításának is tekinthető (8.13. ábra). (8.10) Az α paraméter növelésével a szigmoid függvény egyre inkább megközelíti az egységugrás függvényt. Általában az α = 1 értéket alkalmazzuk ábra - A szigmoid függvény és függése az α paramétertől A hálózat másik fontos jellemzője, hogy eltérően a perceptron típusú hálózattól, rendelkezhet akár több rejtett réteggel is. Ez azt jelenti, hogy a hálózat nem-linearitása jelentősen fokozható. Következésképpen a hálózat nemlineáris folytonos függvények közelítésére, illetve nemlineáris osztályozásra egyaránt hatékonyan alkalmazható. Nézzünk egy példát a függvényközelítésre. Legyen a közelítendő függvény: (8.11) A közelítést a ábrán látható diszkrét pontok alapján végezzük ábra - A tanulóhalmaz pontjai 103

116 Mesterséges neurális hálózatok Legyen a hálózatnak egy rejtett rétege három csomóponttal, amelyekben az aktivációs függvények szigmoid típusúak α = 1 paraméterrel, és sem a bemeneti, sem a kimeneti csomópontban nem történik jeltranszformáció. A ábra szemlélteti ezt a hálózatot ábra - Backpropagáció hálózat rejtett réteggel és bias-szal A hálózat tanítása, azaz a súlyok meghatározása iterációval történik, amely akkor fejeződik be, ha a hálózat hibája egy előírt hibakorlát alá csökken. A hálózat hibájának csökkenését az iterációk számának függvényében a ábra szemlélteti ábra - A hálózat hibájának alakulása az iterációs lépések függvényében 104

117 Mesterséges neurális hálózatok A közelítés analitikus alakja a súlyok ismeretében: (8.12) A ábra jól szemlélteti a hálózat lokális hibáját, amelynek maximális értéke kb. 2% ábra - A hálózat lokális hibája A rejtett réteg alkalmazásának hatékonyságát jól jellemzi, hogy az előző osztályozási feladat megoldását két rejtett rétegű (3, illetve 5 csomóponttal) backpropagáció hálózattal elvégezve minőségileg lényegesen jobb osztályozási eredményt kaphatunk (8.18. ábra) ábra - Az előző osztályozási feladat megoldása két rejtett rétegű backpropagáció hálózattal 105

118 Mesterséges neurális hálózatok A hálózat tanítása delta szabály A hálózat súlyainak meghatározása a legmeredekebb csökkenés módszerén alapszik, amely hatékony megoldása a minimumkeresésnek. Ha egy F(x) minimumát keressük, akkor a szükséges feltétel alapján az F'(x * ) = 0 egyenlet megoldására alkalmazhatjuk a Newton-módszert, amelynek iterációs lépése: (8.13) Ha a második deriváltat állandónak tekintjük az iteráció induló értékénél: (8.14) Alkalmazzuk a legmeredekebb csökkenés módszerét speciálisan a szigmoid aktivációs függvényre. Tekintsük tehát a szigmoid függvényt α = 1 paraméterérték mellett. Ennek a bemenet szerinti deriváltja: (8.15) Vegyük észre, hogy a derivált magával a függvénnyel kifejezhető, nem szerepel benne a független változó. Az egyszerűség érdekében tekintsünk csupán egy be- és egy kimenetet rejtett réteg nélkül. Ekkor a hibafüggvény: (8.16) ahol x és y a a tanulóhalmazbeli összetartozó értékeknek felelnek meg, és w a keresett súly. Alkalmazzuk a legmeredekebb csökkenés módszerét, így az iterációs formula: (8.17) Alkalmazva a láncszabályt és a szigmoid függvény deriváltjára kapott kifejezést, az iterációs formula: 106

119 Mesterséges neurális hálózatok (8.18) Ezt a formulát η=2ξ választással felírhatjuk a következő formában is: (8.19) ahol (8.20) és y i az előző iterációs lépés kimenete, (8.21) A fenti iterációs formulát nevezik delta szabálynak. A delta szabályt kiterjeszthetjük olyan hálózatokra is, amelyek rejtett réteget tartalmaznak. Az erre az esetre kifejlesztett megoldási eljárást backpropagáció módszernek nevezzük. A backpropagáció módszer eredetileg a rejtett réteggel rendelkező, aktivációs függvényként szigmoid függvényt alkalmazó neurális hálózatok számára kifejlesztett, a delta szabályon alapuló iterációs módszer, amelynek célja a súlyok meghatározását biztosító nagyméretű nemlineáris optimalizációs probléma megoldása. A tanítási folyamat egy iterációs lépése minden tanulóhalmazbeli minta esetén két munkafázist igényel: 1. propagáció: a bemenőjelekből a kimeneti jelek kiszámítása az aktuális súlyokkal. 2. backpropagáció: a bemeneti jelekhez tartozó tanulóhalmazbeli kimeneti jelek előírt értékei és a valóságos kimenetek alapján a súlyok módosítása az output rétegtől az input réteg felé, azaz visszafelé haladva A tanítás hatékonyságának növelése A backpropagáció neurális hálózat alul-, illetve túltanulásának elkerülését alapvetően a megfelelően megválasztott rejtett rétegbeli csomópontok számával biztosíthatjuk. A hálózat generalizációs képességét azután a validációs halmazon tesztelhetjük. Ezt a módszert gyakran cross-validációs technikának is nevezik. Vannak azonban más, közvetlenebb módszerek is a túltanulás elkerülésére. Az egyik ilyen eljárás a regularizáció módszere. A regulációs módszer lényege, hogy a hálózat hibájának csökkentése mellett minimalizálni próbáljuk a hálózat által megvalósított függvény gradiensét is. Ez az ötlet arra tapasztalatra támaszkodik, hogy a túltanulás esetén a hálózat a mérési hibákat is megtanulva nagy lokális gradienseket produkál az adatpontokban (hullámzás). Ezért azután a minimalizálandó hibafüggvényt kiegészítjük egy, a gradiensek nagyságával arányos ún. regularizációs taggal. (8.22) Nem nehéz belátni, hogy ez a regularizációs tag arányos az adatpontokban a lokális gradiensek értékével. A regularizációs paraméter mint felhasználói paraméter δ w értékének meghatározása próbálkozással történhet. Egy másik hatékony módszer a korai leállás módszere. A korai leállás módszere abban áll, hogy egy tanuló- és egy validációs halmazt alkalmazva a tanulóhalmazon addig történik a tanítás, amíg a validációs halmazon is csökken a hiba. Ugyanis normál esetben, ha a tanulóhalmaz elemein a hálózat hibáját nagyon lecsökkentjük, akkor a validációs halmazon a hálózat hibája nagyon megnövekszik (túltanulás). A ábra jól szemlélteti, hogy a tanítás során a hálózat hibája monoton csökken az iteráció során. A validációs halmazon azonban amely nem vesz részt a tanításban a 15. iterációs lépéstől kezdve a hiba növekszik ábra - A hiba csökkenése a tanuló halmazon és a validációs halmazon az iterációk számának függvényében 107

120 Mesterséges neurális hálózatok A következő pontban egy olyan neurális hálózatot fogunk vizsgálni, amelyet elsősorban függvénykapcsolat közelítésére szokás alkalmazni A radiál bázis függvény (RBF-) hálózat A hálózat jellemzői és tulajdonságai A korábban tárgyalt hálózatok közül, mint láttuk, a perceptron típusú hálózat alapvetően lineáris osztályozásra volt alkalmas. A szigmoid aktivációs függvénnyel rendelkező backpropagáció (vagy más néven feedforward) hálózatok egyaránt alkalmasak függvények közelítésére és nemlineáris osztályozásra. Függvények közelítésére azonban hatékonyabbnak bizonyult az ún. Radial Bázis Függvény (RBF) típusú hálózat, melynek aktivációs függvénye radiál bázis függvény. A radiál bázis függvény legegyszerűbb változata a harang alakú Gaussfüggvény (8.20. ábra). (8.23) A függvény két paraméterrel (λ, c) rendelkezik. A c paraméter a középpont koordinátája, a λ pedig a harang nyílásszöge ábra - A radiál bázis típusú aktivációs függvény A hálózatnak nincs rejtett rétege. Az aktív rétegben ahol nb darab csomópont van a radiál bázis függvény mint aktivációs függvény szerint történik a jeltranszformáció. A bemenetek (n) és a aktív réteg csomópontjainak száma (nb) nem feltétlenül egyező. A csomópontok kimeneti súlyozott (w i) összege és a bias (w nb+1) lépnek be a 108

121 Mesterséges neurális hálózatok kimeneti csomópontba, ahol a backpropagáció hálózathoz hasonlóan általában nincs jeltranszformáció (de lehet). Az így kapott kimeneti jelet általában kiegészítik még egy ún. lineáris taggal (linear tail), χ ix i, ahol i = 1,, n. (8.24) A hálózat felépítését a ábra szemlélteti ábra - A radiál bázis függvény típusú hálózat felépítése Abban az esetben, ha az aktivációs függvények középponti koordinátáinak és nyílásszögének értéke ismert, a hálózat tanítása egy túlhatározott lineáris egyenletrendszer megoldását jelenti. Ellenkező esetben itt is iterációra van szükség A radiál bázis függvény mint univerzális approximátor Egy neurális hálózat függvényközelítő képessége akkor hatékony, ha az alkalmazott aktívációs függvény ún. univerzális approximátor. A klasszikus Weierstrass-tétel értelmében az algebrai polinomok halmaza az [a, b] intervallumon P [a, b] ilyen univerzális approximátor, azaz a véges lineáris kombináció: (8.25) sűrű az ezen az intervallumon definiált folytonos függvények terében, C[a, b]. Másként megfogalmazva egy adott f [a, b] függvény és egy ε > 0 esetén létezik a p polinom: (8.26) A Cybenko Hornik Funahashi-tétel értelmében a szigmoid függvények is univerzális approximátorok. Legyen ζ egy szigmoid függvény az I d, d dimenziós kockán értelmezve, [0, 1] d. Ekkor az alábbi véges lineáris kombináció: (8.27) sűrű az C[Id ] függvények terében, azaz ahol w j, vés b j a hálózat kimeneti és rejtett rétegbeli súlyai és az eltolások (bias) értékei. (8.28) 109

122 Mesterséges neurális hálózatok Hasonlóan a szigmoid függvényhez a radiál bázis típusú függvény is univerzális approximátor. Legyen G egy Gauss-féle radiál bázis függvény a d dimenziós kockán. Ekkor az alábbi véges lineáris kombináció: (8.29) sűrű az C[Id ] függvények terében Függvényközelítés RBF-hálózattal Az RBF-hálózat (Radiális Bázisfüggvény hálózat) függvényközelítő képességét jól illusztrálhatjuk a Franke-féle teszt függvényen (8.22. ábra) ábra - A Franke-féle teszt függvény A gyakorlatban gyakran előfordul, hogy egy kétváltozós függvényt szeretnénk közelíteni, azonban a független változó értékei nem szabályos, hanem véletlenszerű elrendezésben állnak rendelkezésre. Ezért generáljunk a [0, 1] 2 tartományban véletlenszerűen elhelyezkedő pontokat. Itt megjegyezzük, hogy a szokásos pszeudovéletlenszám generátoroknál jobb minőségű csomósodási helyek nélküli eloszlást ad a Halton-pontokból generált ponthalmaz. A ábrán 100 generált Halton-pontot láthatunk, amelyek az ott számított függvényértékekkel együtt adják a közelítéshez felhasznált alappontokat. Az RBF-hálózattal való közelítés minőségének jobb megítélése érdekében vizsgáljunk meg néhány szokásos közelítést. A gyakorta alkalmazott módszer a Delaunay-háromszögfelbontáson alkalmazott köbös spline interpoláció (8.24. ábra) ábra - A generált Halton-pontok 110

123 Mesterséges neurális hálózatok ábra - A generált Halton-pontokon alapuló köbös spline interpoláció Az RBF neurális hálózattal történő közelítés ezzel ellentétben ún. meshless módszer, amely nem igényli az értelmezési tartomány felbontását ábra - A hat csomópontot felhasználó RBF-hálózat konvergenciája 111

124 Mesterséges neurális hálózatok A tanítás gyors konvergenciáját a ábra szemlélteti ábra - A hat csomópontot felhasználó RBF-hálózat közelítése 112

125 Mesterséges neurális hálózatok A közelítés minőségére jellemző, hogy a maximális relatív lokális hiba a tartomány szélén fellépő 0,4% (8.27. ábra) ábra - Az RBF-hálózat közelítésének hibája Hopfield hálózat A hálózat jellemzői és tulajdonságai A Hopfield hálózat a 80-as évek elején keletkezett hálózat, amely elsősorban osztályozási feladatok megoldására született. A cél itt is, mint az RBF-hálózat esetén is, az volt, hogy a tanításhoz ne legyen szükség iterációra. A bemenetek bipoláris elemű vektorok ( 1 és 1), a hálózat egyrétegű, és minden csomópont kapcsolatban van minden más csomóponttal a kimeneteknek a bemenetre történő visszacsatolása révén. A 113

126 Mesterséges neurális hálózatok működés dinamikája szempontjából a hálózat lehet diszkrét és folytonos megvalósítású. Egy diszkrét hálózat felépítését láthatjuk a ábrán n = 2 csomópont esetén ábra - A diszkrét működésű Hopfield hálózat n = 2 csomópont esetén A Hopfield hálózat ún. asszociatív memóriát valósít meg. Az asszociativ memória egy olyan hozzárendelési kapcsolat, amely egy x elemhez hozzárendeli saját magát, azaz egy y = x elemet úgy, hogy ez a hozzárendelés még akkor is működik, ha az x bemenet egy kicsit eltér az eredeti, tanulóhalmazbeli tanított x-től (zajos, hiányos). A Hopfield hálózat autoasszociativ memóriát reprezentál, azaz egy megtanult (tárolt) x esetén egy zajos vagy hiányos x bemenetre a megtanult x-et adja outputként. A hálózat működése ütemenként történik. A bemeneti vektor most (x1, x2) értéke adja a 0-adik ütemhez tartozó (x1(0), x2(0)) vektorokat. Ekkor a súlyozott input az egyes csomópontokban: és (8.30) (8.31) Az inputok a csomópontokban a ψ aktivációs függvény szerint amely a szignum függvény transzformálódnak, és eredményként az outputokat, azaz a visszacsatolás miatt a következő ütem bemeneti x1(1) és x2(1) értékeit adják. Általánosan a t-edik ütemre, mátrixos alakban: (8.32) ahol W a súlymátrix w i,j elemekkel A hálózat tanítása A hálózat egyensúlyi pontjai vagy fixpontjai azok a vektorok, amelyeknél a bemeneti vektor egyező a kimeneti vektorral a súlymátrixtól függenek. Tehát a hálózat tanítása azt jelenti, hogy adott egyensúlyi pontokhoz (vektorokhoz) megfelelő súlymátrixot határozunk meg. Képviselje két darab a és b háromelemű vektor az egyensúlyi pontot. Tervezzük meg a súlymátrixot. A vektorok tehát: 114

127 Mesterséges neurális hálózatok (8.33) Ekkor a súlymátrix egyszerűen ezen vektorok külső szorzataként adódik, azaz (8.34) A súlymátrix jellemzői: szimmetrikus, a főátlóban azonos elemek vannak. Az outputokat megkapjuk, ha a súlymátrix segítségével kiszámítjuk a súlyozott inputot, majd alkalmazzuk az aktivációs függvényt. Például az a vektor esetén: (8.35) majd alkalmazva az aktivációs függvényt: (8.36) A bemeneti vektorokhoz szokás definiálni egy ún. energia függvényt. Egy x bemeneti vektorhoz tartozó energia függvény: (8.37) Például az a vektor energia szintje: (8.38) Az egyensúlyi vektorok energia szintje lokális minimum. Vegyünk egy, az első tanulóhalmazbeli vektortól két bitben eltérő vektort, azaz {1,1, 1} helyett a { 1, 1, 1} vektort. Ennek energia szintje magasabb, E = 1. Az 115

128 Mesterséges neurális hálózatok iteráció során a lokális minimumoknál magasabb energia szintű vektorok valamelyik lokális minimumhoz tartanak Folytonos Hopfield hálózat A diszkrét Hopfield hálózat iterációja valójában az alakú nemlineáris egyenletrendszer megoldását jelenti. Ezért helyette tekinthetjük a (8.39) (8.40) nemlineáris differenciálegyenlet-rendszert, amelynek numerikus megoldása egy adott kezdeti értékből indulva valamelyik egyensúlyi ponthoz vezető trajektória meghatározását jelenti. A folytonos Hopfield hálózat esetén aktivációs függvényként a tangens hiperbolikusz (th(x)) függvényt szokás alkalmazni (8.29. ábra) ábra - A folytonos Hopfield hálózat aktivációs függvénye Tekintsünk egy folytonos Hopfield hálózatot, amelynek egyensúlyi pontjai az a = {1, 1} és b = { 1, 1} vektorok. Legyen a hálózat bemeneti vektora c = {0,4, 0,6}. A ábra mutatja a bemeneti vektor két koordinátájának konvergenciáját az a egyensúlyi vektorhoz ábra - A bemeneti vektor {0,4, 0,6} koordinátáinak konvergenciája az egyik egyensúlyi ponthoz {1, 1} A konvergencia során a bemeneti vektor energia szintje az egyensúlyi vektor energia szintjére csökken (8.31. ábra). 116

129 Mesterséges neurális hálózatok ábra - A bemeneti vektor energia szintjének csökkenése a konvergencia során A ábra jól szemlélteti az egyes egyensúlyi pontok vonzási tartományát (attraktorait), sík véletlenszerűen felvett pontjainak mint induló vektoroknak a konvergenciáját. Egy induló pont attól függően konvergál az egyik vagy másik egyensúlyi ponthoz, hogy melyiknek a vonzási tartományában fekszik ábra - A különböző vonzási tartományokba eső pontok konvergenciája Alkalmazás mintafelismerésre A hálózat leginkább mintafelismerésre használható. Példaként legyen adva három alakzat, egy fej, egy kard és egy házikó (8.33. ábra). Az alakzatok stilizált fekete-fehér ábrája egy-egy méretű raszterkép, amelyek mátrixait egy-egy 400 elemű vektorba rendeztük sorfolytonosan ábra - Az egyensúlyi pontoknak megfelelő alakzatok 117

130 Mesterséges neurális hálózatok Tekintsük ezen alakzatok zajos ábráit mint induló vektorokat. A házikó esetén az induló zajos alakzatot a ábra szemlélteti ábra - A házikó zajos képe mint induló vektor A felismerési eljárás egyes lépéseit láthatjuk a ábrán, amelyben az egyensúlyi vektort (a házikó ideális képét) 104 iterácó után értük el. Nézzünk meg öt különböző iterációs lépéshez (az 1., 26., 52., 78. és 104. lépéshez) tartozó képet, amelyek a 400 dimenziós térben fekvő trajektória egyes pontjait reprezentálják ábra - A trajektória egyes pontjaihoz tartozó alakzatok Nemfelügyelt tanítású hálózatok A hálózat jellemzői és tulajdonságai Az eddigi hálózatok esetén a tanulóhalmazban a bemenetekhez megadtuk az előírt kimeneteket is. A hálózat súlyait igyekeztünk a tanítás során úgy meghatározni, hogy adott bemenetekhez az azokhoz megadott kimeneteket kapjuk. A nemfelügyelt hálózatoknál, melyeket önszerveződő hálózatoknak Self-Organizing Map (SOM) nevezünk, csak a bemeneteket ismerjük, és ezek alapján próbáljuk meghatározni, hogy azok milyen osztályokat (ún. klasztereket) alkotnak, valamint hogy melyek az ezeknek az osztályoknak a centrumait jellemző vektorok (ún. codebook vektorok), a továbbiakban kódvektorok Versengő tanulás 118

131 Mesterséges neurális hálózatok A legegyszerűbb algoritmus, amely alkalmas egy adathalmaz esetén a klaszterek és kódvektorok meghatározására, az ún. versengő tanulás szabályát alkalmazza. Az algoritmus lépései adott M darab, N dimenziós adatvektor esetén a következők: 1. Véletlenszerűen felveszünk K számú kódvektort, azaz klasztercentrumot reprezentáló vektort, w j, j = 1..K. 2. Véletlenszerűen választunk egy k-t, azaz egy adatvektort, k [1, M]. 3. Meghatározzuk az x k adatvektor távolságát mindegyik w j kódvektortól. 4. Az a kódvektor a nyerő, azaz x k ahhoz fog tartozni, amelyhez x k legközelebb esik. 5. Legyen ez w i. 6. Ezután a nyerő kódvektort módosítjuk az alábbi módon: (8.41) azaz a nyerő kódvektort elmozdítjuk egy kicsit az x k adatvektor irányába (8.36. ábra). A Δ(n) a lépéshossz vektora, amely az aktuális iterációs lépés számától (n) függ, és az iteráció előrehaladtával egyre csökken. Értéke a (0,1) intervallumba esik. 7. Az 1) 4) lépéseket M-szer ismételjük. Ez felel meg egy iterációs lépésnek (n = n + 1). 8. Végül az 1) 5) lépéseket addig ismételjük, amíg a kódvektorok helyzete már nem változik ábra - A kódvektor módosítása Példaként tekintsünk egy nagyon egyszerű esetet (8.37. ábra). Az osztályozandó elemek száma 6, és ezek az ábrán látható módon 3 osztályba sorolhatók ábra - Az osztályozandó elemek Vegyünk fel 3 kódvektort egy közös, a tartomány középpontjába eső középponttal. A kódvektorok trajektóriáit, a versengő tanulás során számított koordinátáit, valamint a végleges helyüket a ábra szemlélteti. 119

132 Mesterséges neurális hálózatok ábra - Az osztályok kódvektorainak helyzete az iteráció során Az osztályozás során így kialakult klaszterek olyanok, hogy az egyes klaszterelemek kódvektoruktól való távolságának összegét minden klaszterre kiszámítva és összeadva, majd ezt az összeget osztva az összes elemszámmal, a kapott átlagos távolság (mean distance), összehasonlítva azt más osztályba sorolási elrendezéssel, a lehető legkisebb érték. Azaz a koherencia mértéke maximális. Tegyük fel, hogy az osztályok számát, amelyet kezdetben megadunk, túlbecsüljük. Ekkor üres osztályok jönnek létre, mert lesznek olyan kódvektorok, amelyeket egyik elem sem választ. Ezeket halott kódvektoroknak nevezzük, és az iteráció befejezése után eltávolítjuk őket Módosított versengő tanulás Kohonen térkép Ha túl sok halott csomópontunk van, a hálózat tényleges mérete (a halott csomópontok kivonása után) nem lesz képes a kitűzött feladat, például az osztályozás megoldására. A halott csomópontok kialakulását elkerülhetjük, ha nem csak a nyerő kódvektort módosítjuk, hanem a többit is, még azokat is, amelyek a győztes környezetében vannak, persze kisebb mértékben. Ehhez először definiálni kell, hogy mit értünk ebben az esetben környezeten. Ahhoz, hogy a környezetet definiáljunk, a kódvektorokhoz valamilyen topológiai elrendezést kell megadni, például egy dimenzióban egy vektorba, két dimenzióban egy mátrixba kell rendezni őket. Ekkor beszélhetünk egy kódvektor szomszédairól, vagyis környezetéről. A környezet leírására egy környezet-mátrixot alkalmazhatunk, amely egy adott kódvektorhoz tartozó környezetet a szomszédoknak ezen kódvektortól mért távolságával írja le. A ábra egy 2D elrendezést mutat, ahol 2 3 = 6 kódvektort sorszámoztunk ábra - Hat kódvektor 2 3-as elrendezése 2D-ben A megfelelő környezet-mátrix középpontja mindig az aktuális győztes kódvektor poziciója, amelynek saját magától való távolsága 0. A mátrix elemeinek értékei pedig a győztes kódvektor környezetében elhelyezkedő kódvektorok távolságát mutatják a győztestől. Minél nagyobb ez az érték, annál kevésbé kerül módosításra az illető kódvektor. A mátrix lehet aszimmetrikus is. Az értékeket a felhasználó megadhatja a modell paraméterei között. 120

133 Mesterséges neurális hálózatok Például egy 2 3 elrendezésnek megfelelő aszimmetrikus környezet-mátrix, amelynek jobb alsó sarka felel meg a ábrán látható elrendezésnek: ábra - 12 kódvektor aszimmetrikus elrendezésben 2D-ben A győztes kódvektor szomszédjainak módosítását úgy végezzük el, hogy a kapcsolat a szomszédokkal először erős legyen (hogy ők is beinduljanak), majd az iteráció során egyre gyengüljön (hogy minden kódvektor megtalálja a saját klaszteréhez tartozó elemeket). Ezt a módosított tanulási szabályt Kohonen javasolta. A tanulás eredményeként a kódvektorok elhelyezkedése megőrzi a bemeneti elemek topológiáját. Ezért ez az algoritmus, illetve osztályozás is önszervező hálózat (térkép), melyet Kohonen térképnek (Kohonen map-nek) is neveznek. Nézzünk egy példát a módosított versengő tanulás szabályának alkalmazására. Legyen adva egy zajos mérés pontfelhője (8.41. ábra), amelyet a sinc-függvény 30%-os véletlen zajjal terhelt pontjai alkotnak ábra - A sinc-függvény zajjal terhelt pontjai Ezeket a mérési pontokat akarjuk reprezentálni egy nemfelügyelt tanítás segítségével előállított hálózat 15 kódvektorával. A standard versengő tanulás szabályát alkalmazva a kódvektorok végső helyzetét a ábra szemlélteti ábra - A 15 kódvektor elhelyezkedése 121

134 Mesterséges neurális hálózatok A Kohonen map alkalmazására példaként tekintsük egy félgömbre vonatkozó kvantált mérési pontfelhő 1440 pontját (8.43.a. ábra) ábra - Kvantált mérés pontfelhője Ha erre a pontfelhőre illesztve próbálnánk rekonstruálni a félgömböt például köbös spline segítségével, meglehetősen rossz közelítést kapnánk (8.43.b. ábra) ábra - Kvantált pontfelhőre illesztett spline felület 122

135 Mesterséges neurális hálózatok Ha azonban a kvantált adatokra alkalmazzunk egy Kohonen térképet, szimmetrikus kódvektor kiosztással sokkal jobb eredmény kaphatunk. A kapott 225 kódvektor elhelyezkedését a ábra szemlélteti ábra - Kvantált pontfelhő reprezentációja 225 kódvektorral Ezekre a kódvektor pontokra azután már egy egészen jó közelítő felület illeszthető (8.45. ábra) ábra - A kódvektor pontokra illesztett spline felület 123

136 Mesterséges neurális hálózatok 124

137 9. fejezet - Fuzzy rendszerek A fuzzy halmaz és a fuzzy logika A hagyományos kétértékű logika, melyet évezredek óta alkalmazunk a tudományban, és amelyet George Boole ( ) fogalmazott meg matematikailag, azon a feltételezésen alapszik, hogy valamely elem egy halmaznak vagy eleme, vagy sem. A kettő között átmenet nem létezik. A világ, amelyben élünk, ettől kissé eltér. Vegyük például az alábbi, mindenki által ismert összetett mondatot: Ha végre itt a nyár és meleg az idő, az ember strandra jár. Ha ez a mondat a kétértékű logika szerint lenne érvényes, akkor a strandoknak nem kellene a nyári napforduló előtt kinyitniuk, mert senki nem látogatná őket. Esős nyári napon szintén nem kellene kinyitniuk, mert nem szép az idő. A nyár van és szép az idő csak akkor igaz, ha mindkettő egyidejűleg teljesül. Pedig a valóság ettől merőben eltér. A strandok május elsejére kinyitnak, mert ugyan még nincs nyár, de ha szép idő van, akkor özönlik a tömeg a strandra. Miért is van ez? Mert a már nyár van és a még nincs nyár között átmenetek vannak. A szép idő van nem mindenkinek jelenti pontosan ugyanazt. Apuka felhős időben is szívesen megissza sörét a medence mellett, de anyuka csak akkor viszi szívesen a gyerekeket strandra május elején, ha egyetlen felhőt sem lát az égen. A strandnak tehát érdemes kinyitni akkor is, ha már eléggé nyár van, és elég esély van jó időre. Vegyük például a nyár van állítást. Magyarországon július 15-én ez teljes mértékben teljesül, és december 24- én egyáltalán nem. De vajon mennyire van nyár május 29-én? Vagy szeptember 19-én? Az ilyen mennyiségek leírására hozta létre 1965-ben Lotfi A. Zadeh a fuzzy (elmosódott) logikát. A fuzzy logika szerint egy elem egy halmaznak nulla és egy közötti mértékig eleme lehet. Az x elem A halmazhoz való tartozásának mértékét a μ A(x) fuzzy tagságfüggvény adja meg, melynek értéke a [0,1] intervallum valamely eleme. Például ha egy útikönyv azt írja, hogy Lengyelországban 5 zlotyi egy liter benzin, az nem azt jelenti, hogy mindig és mindenhol pontosan annyi. A lengyel benzin az 5 zlotyis benzinek halmazához bizonyos fuzzy tagságfüggvény által leírt mértékig tartozik hozzá. Ez a tagságfüggvény sokféle lehet. A 9.1. ábra ismertet néhány példát a leggyakrabban használt fuzzy tagságfüggvény alakokból ábra - Néhány gyakran alkalmazott fuzzy tagságfüggvény alak, melyek mindegyike a körülbelül öt halmazt írja le Most pedig hasonlítsuk össze a hagyományos kétértékű és a fuzzy logika alapfogalmait. Mindkét esetre tekintsük az A és B halmazokat, melyek az X alaphalmaz részhalmazai. A hagyományos logika szerint az A halmazt leírhatjuk a μ A:X {0.1} karakterisztikus függvénnyel, mely definíció szerint bármely x X esetén 125

138 Fuzzy rendszerek μ A(x)=1 x A és μ A(x)=0 x A. A fuzzy logikában a karakterisztikus függvény értéktartománya változik meg: μ A:X [0,1], és így bármely x X esetén az x elem A halmazhoz tartozásának mértékét a karakterisztikus függvény μ A(x) értéke fogja meghatározni, melyet az x elem A halmazhoz viszonyított fuzzy tagságfüggvényének nevezünk. A halmazokon végzett egyszerűbb műveletek összehasonlítására tekintsük meg az alábbi táblázatokat: Művelet Hagyományos kétértékű logika szerint Üres halmaz Komplemens halmaz Egyesítés Metszet Művelet Fuzzy logika szerint Üres halmaz Komplemens halmaz Egyesítés Általánosan: Mamdani szerint: Larsen szerint: Metszet Általánosan: Mamdani szerint: Larsen szerint: A fenti táblázatokban megfigyelhető, hogy vannak olyan műveletek, amelyeket nem csak egyféleképpen lehet értelmezni. A Mamdani- és Larsen-féle fuzzy logika csak kettő a sok értelmezés közül. Ezek közötti különbséget látni fogjuk a továbbiakban A fuzzy partíció A fuzzy logika tagságfüggvényei lehetővé teszik, hogy különböző elemeket különböző mértékig soroljunk bele valamely halmazba. Ezt a lehetőséget felismerve Ruspini 1969-ben bevezette a valószínűségi fuzzy partíció fogalmát, mely szerint ha az X alaphalmaz elemeit A 1,A 2,...A c halmazokba kívánjuk besorolni, akkor a μ 1(x)+μ 2(x)+μ c(x)=1 lesz. Így azt is mondhatjuk, hogy valamely A i osztályhoz tartozást leíró μ i(x) fuzzy tagságfüggvény megmutatja, hogy az x elem milyen valószínűséggel tartozik az A i osztályhoz. A Ruspini-féle valószínűségi fuzzy partíció alkalmazásaképpen 1981-ben Bezdek bevezette az ún. fuzzy c- means (FCM) klaszterező (csoportosító) algoritmust, melynek segítségével az X alaphalmaz vektoriális (vagy 126

139 Fuzzy rendszerek sajátos esetben skaláris) adatait optimálisan csoportosíthatjuk egymáshoz hasonló egyedek halmazára. Az FCM algoritmus előre eldönti, hogy hány osztályba fogja sorolni az adatokat, ezt jelöljük c-vel. Minden osztálynak lesz egy reprezentatív eleme vagy prototípusa (v i, i=1...c), amely az adott osztályba tartozó bemeneti adatok súlyozott átlaga lesz. Az x k (k=1...n) bemeneti adat v i osztály prototípushoz való hasonlóságát vagy különbségét jellemezhetjük a kettő közötti távolsággal, melyet vektoriális környezetben normaként értelmezünk:. Euklideszi távolságot használva ezt így is írhatjuk:. Az FCM algoritmus egy optimális valószínűséget számít ki egy négyzetes célfüggvény minimumának meghatározásával. A célfüggvény a következő: (9.1) ahol az egyszerűség kedvéért használtuk a μ ik=μ i(x k) jelölést az x k adat i-edik osztályhoz való tartozás fuzzy tagságfüggvényéhez. m jelöli a Bezdek-féle fuzzy kitevőt, melynek értékével (m > 1) az algoritmus fuzzy jellegét lehet szabályozni. A célfüggvény minimumának megkeresése során azt várjuk, hogy a v i osztály prototípusok olyan helyre álljanak be, ahol sok bemeneti adathoz közel lehetnek, továbbá olyan fuzzy partíciót kapjunk, melyben egy osztály prototípushoz közel eső adatok nagy valószínűséggel tartozzanak az adott osztályhoz, míg a távol eső adatok alacsony tagságfüggvény értéket kapjanak. A célfüggvény minimumát a Ruspini-féle valószínűségi megkötés megtartása mellett hajtjuk végre. Bezdek a célfüggvény parciális deriváltjainak zérus átmeneteiből Lagrange szorzók alkalmazásával határozta meg az iteratív minimumkereső eljárás ismétlődő lépéseit: (9.2) (9.3) A (9.2) és (9.3) egyenletekben leírt számításokat addig kell ismételni, amíg az osztály prototípusok konvergenciája bekövetkezik. Végül a kialakult partíciót defuzzyfikálhatjuk, azaz meghatározhatjuk, hogy melyik bemeneti adat melyik osztályhoz tartozik leginkább. Ez matematikailag így fogalmazható meg: k=1...n esetén x k vektort abba a j-edik osztályba soroljuk be, amelyre Vizsgáljuk meg a (9.2) formulát: az x k vektornak az i-edik osztályhoz való tartozását leíró fuzzy tagságfüggvény értékét egy tört formájában számítjuk ki. A tört számlálója a távolságnak egy negatív hatványa, azaz minél közelebb van az x k vektor a v i osztály prototípushoz, annál nagyobb fuzzy tagságfüggvénnyel fog az i-edik osztályhoz tartozni. Ha x k és v i egybeesik, a μ jk tagságfüggvény értéke aszimptotikusan tart az 1 érték felé, míg az összes többi μ jk nulla lesz (i j). A (9.3) formula a bemeneti vektoroknak egy-egy súlyozott átlagaként számítja ki az osztály prototípusok új értékét, ahol a súlyok a legutóbb kiszámított fuzzy tagságfüggvényeknek az m-edik hatványai. Most pedig egy konkrét példa segítségével figyeljük meg, hogy az FCM algoritmus milyen fuzzy tagságfüggvényeket számít ki különböző m fuzzy kitevők esetén. Egy tanár tesztet íratott a diákjaival, majd az elért pontszámokat FCM algoritmussal csoportosította 5 osztályba, és ezeket minősítette elégtelen, elégséges, közepes, jó és jeles osztályzattal. A 9.2. ábrán megfigyelhetjük, hogy különböző m értékek esetén hogyan néznek ki az egyes osztályok fuzzy tagságfüggvényei: m=2 esetén a Gauss-féle haranghoz, m=3 esetén háromszöghöz, míg m<2 kitevőnél trapézhoz hasonló tagságfüggvényeink lesznek. Ugyanakkor megfigyelhetjük, hogy az m 1 + fuzzy kitevőnél a hagyományos kétértékű logikát közelítjük, ahol minden elem (9.4) 127

140 Fuzzy rendszerek egyetlen osztályhoz tartozik hozzá, 1-es tagságfüggvény értékkel. Ha pedig a fuzzy kitevőt nagyon megnöveljük, minden fuzzy tagságfüggvény értéke tart 1/c felé. Ez utóbbi eset nem vezet elfogadható osztályozáshoz ábra - Az FCM algoritmus eredményeként kapott változatos fuzzy tagságfüggvény alakok A fuzzy inferencia Három fuzzy jóbarát mindig a város valamely étteremében találkozik, és egy vacsora elfogyasztása mellett megvitatják a legújabb fuzzy felfedezéseiket. Szokás szerint a vacsora után az ételt is és a kiszolgálást is egyegy 0 és 10 közé eső osztályzattal minősítik, majd ezekből a számokból fuzzy inferenciával számolják ki, hogy hány százalék borravaló jár a személyzetnek az [5,25] intervallumban. A baráti társaság fuzzy szabályrendszere a következőkből áll: 1. Az ételt négyféle fuzzy tagságfüggvénnyel kategorizálják. A besorolás szerint az étel lehet ehetetlen, ehető, finom és ízletes. 2. A kiszolgálás minőségét három fuzzy halmazba sorolják: a kiszolgálás lehet rossz, közepes és jó. A 9.3. ábrán megtekinthetjük a bemeneti adatok kategorizálását leíró fuzzy tagságfüggvényeket ábra - Fent: étel minőségét leíró fuzzy tagságfüggvények. Lent: a kiszolgálás minőségét leíró fuzzy tagságfüggvények 128

141 Fuzzy rendszerek 3. Négyféle fuzzy osztály jellemzi a borravalót (9.4. ábra), amely lehet skót, magyar, német és milliomos ábra - A borravaló fuzzy tagságfüggvényei 4. A bemeneti adatok (étel és szolgáltatás minősége) fuzzy tagságfüggvényei és a kimenő adat (borravaló) fuzzy tagságfüggvényei között fuzzy szabályokkal teremtenek kapcsolatot, az alábbi formában: HA az étel ehető ÉS a kiszolgálás jó AKKOR a borravaló magyar 5. Ha az egyik bemenő adatnak 4, a másiknak pedig 3 fuzzy osztálya van, akkor elvileg 4 3 = 12 fuzzy szabályt kell felírnunk ahhoz, hogy mindegyik lehetséges bemenetre megoldást szolgáltassunk. Jelen konkrét feladat 12 fuzzy szabályát az alábbi táblázatban foglaltuk össze. A táblázat szerint például ízletes étel és közepes kiszolgálás esetén német borravaló jár. ehetetlen ehető finom ízletes rossz skót skót magyar magyar közepes skót magyar német német jó magyar magyar német milliomos Most pedig alkalmazzuk a baráti társaság fuzzy inferenciáját három konkrét vacsorájuk esetére. A 9.5. ábrán három különböző színnel jelöltük a különböző éttermek osztályzatait. A piros étteremben az étel minőségének 2,5-es osztályzata β 1=1/4 illeszkedési mértékkel bír az ehetetlen fuzzy osztályra, valamint β 2=1/2-del az ehető osztályra nézve. A kiszolgálás minősége viszont 8,5-es osztályzatot kapott, amellyel csak a jó fuzzy osztályhoz 129

142 Fuzzy rendszerek illeszkedik, β' 1=5/6 mértékig. Hasonló módon leolvashatjuk a zöld és kék étterem osztályzatait és illeszkedési mértékeit a különböző fuzzy halmazokra vonatkozóan ábra - A három étteremnek adott számszerű osztályzatok és azok illeszkedési mértékei a fuzzy tagságfüggvényekhez Alkalmazzuk a fuzzy szabályokat mindhárom étterem esetében! A zöld étterem esete: 1. Ha az étel β 3=1/3 mértékig finom és a kiszolgálás β' 3=1/8 mértékig rossz, akkor a borravaló min{β 3,β' 3}=1/8 mértékig magyar. 2. Ha az étel β 3=1/3 mértékig finom és a kiszolgálás β' 4=1 mértékig közepes, akkor a borravaló min{β 3,β' 4}=1/3 mértékig német. 3. Ha az étel β 4=1/2 mértékig ehető és a kiszolgálás β' 3=1/8 mértékig rossz, akkor a borravaló min{β 4,β' 3}=1/8 mértékig skót. 4. Ha az étel β 4=1/2 mértékig ehető és a kiszolgálás β' 4=1 mértékig közepes, akkor a borravaló min{β 4,β' 4}=1/2 mértékig magyar. A 9.6. ábra felső részén látható a zöld étterem osztályzatának mind a négy lehetséges esete: a zöld vonalak behatárolják a kimeneti fuzzy tagságfüggvényeket a kiszámított illeszkedési mértékekig. Ez a grafikus ábrázolás a konkrét feladat fuzzy kimenete. Ha egyetlen skaláris értékkel meg akarjuk nevezni a fizetendő borravaló százalékot, defuzzyfikálni kell a kimenetet. Ehhez meg kell határoznunk, hogy a zöld vonalak alatti terület súlypontja hol helyezkedik el a vízszintes tengely mentén. A piros és kék étterem esetén kapott fuzzy kimenetet is megtaláljuk a 9.6. ábrán ábra - A kimenetek a három étterem esetében 130

143 Fuzzy rendszerek Most határozzuk meg, melyik étteremben mekkora borravalót fizetett a baráti társaság. A színes vonalak és a vízszintes tengely által közrezárt terület súlypontja a piros étterem esetében határozható meg a legkönnyebben. Egyszerű geometriai műveletekkel belátható, hogy a vízszintes tengely mentén a súlypont -nél, azaz 12,22- nél helyezkedik el. Ennek megfelelően a vacsoravendégek 12,22% borravalót fizettek a piros étteremben. A másik két esetben a fuzzy kimenetet egy sokkal összetettebb alakzat írja le, melynek súlypontját nehezebb geometriai műveletekkel meghatározni. Sokkal könnyebb ilyen esetben numerikus megközelítést alkalmazni. A defuzzyfikált eredmény azt mutatja, hogy a zöld étteremben 13,85%, míg a kék étteremben 19,01% borravalót fizettek a fuzzy vendégek. A fentiekben ismertetett teljes eljárást, ahogyan a numerikus bemenetekből a bemeneti fuzzy tagságfüggvények és a fuzzy szabályok segítségével eljutunk a fuzzy kimenethez, és azt a súlypont módszerével defuzzyfikáljuk, Mamdani-féle inferenciának nevezzük. Létezik egy nagyon hasonló, a Mamdani-féle inferenciától csupán apró részleteiben eltérő inferencia eljárás is, amelyet Larsen vezetett be. A Larsen-féle inferencia sajátossága az, hogy a fuzzy szabály alkalmazásakor a következőképpen jár el. Ha az egyik bemenet β mértékig illeszkedik egy bizonyos fuzzy tagságfüggvényhez, és a másik bemenet β' mértékig egy másik fuzzy tagságfüggvényhez, akkor a kimenet nem min{β,β'}, hanem minββ' mértékig fog az adott fuzzy szabály által előírt kimeneti fuzzy tagságfüggvényhez illeszkedni. Tehát a Larsen-féle inferenciánál a bemeneti illeszkedési mértékek összeszorzódnak. Hogy ez mekkora különbséget jelent? A piros étterem esetében a kimeneti diagramon a piros trapéz magassága 1/2 helyett 5/12 lenne, és így a borravaló analitikus pontossággal, numerikus megközelítéssel 12,19% lenne. A fuzzy rendszernek kettőnél sokkal több bemenete is lehet. Ha mindegyik bemenethez hozzárendelünk 3 4 fuzzy tagságfüggvényt, akkor hat bemenet esetén már ezres nagyságrendű fuzzy szabályra lesz szükség, és ez rendkívül körülményessé teheti mind a fuzzy kimenet kiszámítását, mind pedig a defuzzyfikálás folyamatát. Ezt a problémát kívánja leküzdeni a Takagi Sugeno Kang-féle (TSK-) inferencia. Egy TSK-rendszer ugyanúgy megvizsgálja a bemenetek illeszkedését a különböző fuzzy osztályokhoz, mint a Mamdani-féle rendszer, viszont 131

144 Fuzzy rendszerek a fuzzy szabályokat és a defuzzyfikálást egy egyszerűsített eljárással valósítja meg. A TSK-rendszer működésének megértésére vegyük megint a zöld étterem esetét. A bemeneti, számszerű minősítés az étel esetében x=5, míg a kiszolgálásé x'=4.5 volt. Most lássuk a fuzzy szabályokat: 1. Ha az étel β 3=1/3 mértékig finom és a kiszolgálás β' 3=1/8 mértékig rossz, akkor a borravaló γ 1=min{β 3,β' 3}=1/8 mértékig y 1=f magyar(x,x') lesz. 2. Ha az étel β 3=1/3 mértékig finom és a kiszolgálás β' 4=1 mértékig közepes, akkor a borravaló γ 2=min{β 3,β' 4}=1/3 mértékig y 2=f német(x,x') lesz. 3. Ha az étel β 4=1/2 mértékig ehető és a kiszolgálás β' 3=1/8 mértékig rossz, akkor a borravaló γ 3=min{β 4,β' 3}=1/8 mértékig y 3=f skót(x,x') lesz. 4. Ha az étel β 4=1/2 mértékig ehető és a kiszolgálás β' 4=1 mértékig közepes, akkor a borravaló γ 4=min{β 4,β' 4}=1/2 mértékig y 4=f magyar(x,x') lesz. Miután az összes nem nulla illeszkedési mérték esetét végigvettük, a végső kimenetet egy egyszerű átlagolással határozzuk meg: ahol i bejárja az összes fennebb tárgyalt fuzzy szabály esetét, jelen konkrét példánál i= A fuzzy szabályok alkalmazásakor felhasznált függvények (f skót, f magyar, f német, és f milliomos) előre meghatározott, legtöbbször lineáris függvények szoktak lenni. Tehát a Mamdani-féle és a TSK inferencia modell a számszerű adatok fuzzyfikálását, valamint a fuzzy szabályok alkalmazását teljesen azonos módon végzik. A különbség a fuzzy kimenet meghatározásnál és a defuzzyfikálásnál van: a TSK modell fuzzy kimenetet nem állít elő, hanem egyből számszerű kimenetet ad. Egy másik, gyakran alkalmazott megoldás a komplikált fuzzy kimenet kiszámításának és defuzzyfikálásának elkerülésére, hogy a teljes fuzzy rendszer viselkedését megtanítják egy neurális hálózatnak. A neurális hálózat tanításához tanulási adatok kellenek. Ezeket úgy hozzák létre, hogy sok különféle bemenetre megállapítják, hogy a komplikált fuzzy rendszer milyen kimenetet ad. Ezek a kimenetek lesznek az elvárt értékek a neurális hálózat tanítása során, amikor ugyanazokat a bemenetet kapja a neurális hálózat, mint előzőleg a fuzzy rendszer. Amikor a neurális hálózat képes a tanulási adatokra megfelelő, a fuzzy rendszerével megközelítőleg azonos kimenetet adni, akkor további tesztadatokra is képes lesz modellezni a fuzzy rendszer működését. A kimenet csak megközelítőleg lesz ugyanaz, mint a fuzzy rendszer esetében, de ezt a kimenetet sokkal gyorsabban ki lehet számítani. Az ilyen, neurális hálózattal modellezett fuzzy rendszereket neuro-fuzzy rendszereknek nevezzük A fuzzy szabályozó 9.7. ábra - Szabályozó kör fuzzy szabályozóval 132

145 Fuzzy rendszerek A fuzzy szabályozó funkcionálisan egy fekete doboz, melynek bemenete az elvárt referencia jel és a kimeneti jel különbsége, kimenete pedig a szabályozott szakasznak adott szabályozási parancs. Mind a bemenet, mind pedig a kimenet egy-egy nem fuzzy mennyiség. A szabályozó belsejében viszont megtalálható a nem fuzzy bemenetet fuzzyfikáló interfész, egy fuzzy inferencia gép, mely a fuzzy szabálybázis alapján előállítja a fuzzy kimenetet, és a defuzzyfikáló interfész, amelyik a fuzzy kimenetből nem fuzzy kimenetet állít elő. Az inferencia gép bármely ismertetett inferencia típust tartalmazhatja. 133

146 10. fejezet - Bevezetés a biostatisztikába Ez a fejezet a biostatisztika alapjaiba fog tömör bevezetőt adni. A biostatisztika a statisztika egyik alkalmazott ága, mely az orvosbiológiai területen felmerülő, empirikus adatokkal leírt kérdések kvantitatív vizsgálatával foglalkozik. Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást? Nagyfeszültségű vezeték közelében tartózkodás növeli a rák-kockázatot? Vane összefüggés egy gyermek táplálkozási energiabevitele és magasságának növekedése között? Ez csak pár példa olyan kérdésekre, melyek megválaszolásának egyik lehetősége az empirikus adatok alkalmazása: összegyűjtjük gyógyszert szedő és nem szedő emberek vérnyomás adatait; emberek lakhelyének távolságát a nagyfeszültségű vezetékektől, és azt, hogy kialakult-e náluk rák; gyermekek táplálási adatait és magasságuk alakulását. Ezen adatok birtokában van remény a problémák vizsgálatára, orvosilag releváns kérdések megválaszolására. Továbbmenve az is látható, hogy végeredményben mind számszerű adatra vezet (vérnyomásalakulás, rákkockázat, magasságváltozás stb.), így adhatunk kvantitatív válaszokat is a kérdésekre (pontosan mekkora vérnyomás-csökkenést okoz várhatóan a gyógyszer-jelölt, ha egyáltalán okoz, hány százalékkal változtatja a rákkockázatot adott nagyfeszültségű vezeték, ha egyáltalán változtatja, nagyobb energiabevitel mennyiben módosítja a növekedés ütemét, ha egyáltalán módosítja stb.). Ehhez természetesen megfelelő elemzéseket kell végrehajtanunk, megfelelő modelleket kell alkotnunk. Ezzel foglalkozik a biostatisztika. A fejezetben elsőként röviden összefoglaljuk a biostatisztika történelmi fejlődését, és kidomborítjuk mai jelentőségét (10.1. alfejezet). Ezt követően, a alfejezetben a statisztika alapfogalmaival és feladataival ismerkedünk meg, illetve foglalkozunk a biostatisztika pár specialitásával is. A fejezet hátralevő része már konkrét biostatisztikai módszereket és eszközöket mutat be. A alfejezetben részletesebb bevezetőt adunk az ún. deskriptív (leíró) statisztikába, a alfejezetben pedig röviden bemutatjuk az ún. induktív (következtető) statisztika alapfogalmait. Ezek során mindenhol a biostatisztikai alkalmazásokra fogjuk helyezni a hangsúlyt. Noha a biostatisztika alapja a matematikai statisztika, közérthető bevezetés adására törekedtünk, így specifikusabb matematikai (valószínűségszámítási) ismeretek egyedül az induktív statisztikával foglalkozó alfejezetben lesznek szükségesek A biostatisztika fejlődése és jelentősége Napjaink orvostudományi kutatásai a legtöbb esetben elképzelhetetlenek statisztikai módszerek (ha más nem, támogató szerepű) alkalmazása nélkül. Ez nem meglepő kijelentés, ha áttekintjük az orvoslás fejlődési tendenciáit. Ezek közül kettőt emelünk ki most. Az egyik az egyre erősebb empirikus orientáció. Noha nyomokban már régebbről is vannak ilyen emlékeink, empirikus gondolkodásról érdemben csak a XVIII. századtól kezdődően beszélhetünk. (James Lind 1747-ben hajtotta végre nevezetes klinikai kísérletét, melyben empirikusan demonstrálta, hogy a skorbut citrusfélékkel gyógyítható.) Mindez nem független attól, hogy mind az egészséges ember működéséről, mind a betegségek mechanizmusáról ekkortól kezdtek el mai szemmel nézve is tartható ismeretek összegyűlni. Ami az előbbit illeti, nyilvánvaló a boncolásos eredmények hatása. Az emberiség egész történetét tekintve ez meglehetősen későn következett be - még egy olyan abszolút alapvető jelenségnek, mint a vérkeringés is csak 1628-ban adták meg (William Harvey a De Motu Cordis-ban) az első, lényegileg helyes leírását). A betegségek kapcsán ekkor kezdték a korábbi, mai szemmel nézve megmosolyogtató teóriákat (rossz levegő, isteni bosszú, testnedvek egyensúlyának felborulása stb.) természettudományosabb alapokon álló magyarázatokkal felváltani. Az empirikus orientáció innen kezdve folyamatosan erősödött az évszázadok alatt, és talán nem túlzás azt mondani, hogy ez torkollott - a XX. század második felében - a bizonyítékokon alapuló orvoslás (Evidence Based Medicine, EBM) kialakulásába. Ennek lényege, hogy a klinikai döntéshozatalt a rendelkezésre álló legjobb tudományos bizonyítékok (azaz jórészt empirikus vizsgálatok eredményeinek) gyűjtése és kritikus értékelése alapján kell végrehajtani. 134

147 Bevezetés a biostatisztikába Külön megjegyzendő, hogy nem csak egyszerűen az empirikus eredmények szerepe nőtt, hanem ezen belül a kvantitatív eredményeké is. A XX. század (különösen a vége) ráadásul elhozta a nagy volumenű adatgyűjtés műszaki lehetőségeit is. Ennek kapcsán - szintén jellemzően XX. század második felére eső fejleményként - érdemes megemlíteni a gyógyszerengedélyezési folyamatok nagyfokú elbonyolódását és megnehezedését, ami egyre jobb empirikus bizonyítékokat (is) megkövetel a törzskönyvezéshez. A másik tényező az orvostudomány egyre erősebb átmenete modellalapú tudományba. Hogy egy klasszikus kérdéssel világítsunk erre rá: mi a lényegi különbség egy elromlott autó és egy,,elromlott'' ember diagnosztizálása között? (A kérdés helyénvaló, gépjárműveknél is sokszor használják a diagnosztika szót a hibakeresésre.) Bár vannak apróbb, inkább formai különbségek (az autót jobban szét lehet szedni mint az embert stb.), az érdemi különbség, hogy az autónál tudjuk, hogy jó állapotában elvileg hogyan kéne működnie - az embernél ezzel szemben sokszor nem tudjuk. A XX. században azonban ezt a problémát egyre több területen sikerült meghaladni: egyre több területen és egyre jobb modelljeink vannak arról is, hogy az emberi szervezetnek elvileg hogyan kéne működnie,,jó'' állapotában. Azt, hogy mindezek a fejlődési tendenciák szinte exponenciálisan gyorsuló jelleget mutatnak, talán említenünk sem kell... Ezek voltak a biostatisztika,,orvosi oldalán'' az előzmények. Van azonban az éremnek egy másik oldala is: a matematikai oldal. A valószínűségszámítás szintén a XVIII. században indult fejlődésnek (elsősorban Jacob Bernoulli és Abraham de Moivre, majd később Pierre-Simon de Laplace tevékenysége nyomán). Ezzel ellentétben a statisztika matematikai ága 1, és különösen a mai értelemben vett induktív statisztika csak a XIX. század végén, XX. század elején szökkent szárba. Érdekes, hogy már ennek a fejlődésnek is igen komoly alkalmazott tudományos motivációja volt (bár jórészt például az agrometria révén - igaz, nagyon hamar bekapcsolódott az alkalmazók közé az orvostudomány is). Az úttörők Ronald Aylmer Fisher, Jerzy Neyman és a két Pearson, Karl és Egon voltak. A két fejlődési tendencia a XX. században ért össze. Az említett matematikai statisztikai eredmények megteremtették a módszertani bázist, az orvosi fejlődés pedig az igényt azon módszerek és eljárások alkalmazására, melyeket ma már biostatisztika összefoglaló néven említünk A statisztika alapjai Ebben az alfejezetben a statisztika, illetve a biostatisztika néhány fundamentális kérdésével fogunk foglalkozni. Először, motiváció gyanánt is, mutatunk pár demonstratív kérdést, melyek megválaszolását a biostatisztikától várhatjuk (természetesen megfelelő adatok birtokában). Ezt azért is tartjuk fontosnak, mert a későbbiekben konkrétan is látni fogjuk, hogy e kérdések hogyan válnak szabatosan megválaszolhatóvá a megfelelő biostatisztikai apparátus alkalmazásával. Ezt követően megadjuk a statisztika fő feladatait, és definiáljuk a statisztika legfontosabb alapfogalmait, melyek lépten-nyomon előkerülnek a statisztikai szóhasználatban; ezen belül is külön kitérünk a változókkal kapcsolatos kérdésekre (mint amilyen a mérési skálák témája). Ezt követően - immár rátérve a biostatisztikára - foglalkozunk azzal, hogy milyen tudományágak alapozzák meg a biostatisztikát, illetve elhatároljuk a biostatisztikát pár rokon területtől. Beszélünk arról is, hogy mi a számítástechnika jelentősége a modern biostatisztikában, és röviden ismertetjük a legfontosabb (bio)statisztikai programcsomagokat. Az alfejezet zárásaként bemutatjuk azt az adatbázist, mely majd futó példaként fog szolgálni a későbbi módszertani mondanivaló illusztrálására Néhány demonstratív kérdés 1 Természetesen a,,procedurális'' része, például a népszámlálások, ókorig visszanyúló hagyományokkal bírnak. 135

148 Bevezetés a biostatisztikába Hogy motiváljuk a biostatisztikai fejezet elolvasását, összegyűjtöttünk néhány olyan, az orvostudomány területéről származó kérdést, melyek szabatos megválaszolásához elengedhetetlen a biostatisztika eszköztárának alkalmazása: 1. Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást? 2. Egy új vérnyomáscsökkentő gyógyszer-jelölt nem okoz megnövekedett epilepszia kockázatot? 3. Nagyfeszültségű vezeték közelében tartózkodás növeli a rák-kockázatot? 4. Mennyi egy adott kurzus hallgatóinak átlagos testtömege? 5. Mennyi az I. éves fiú egyetemisták átlagos testtömege? 6. Igaz-e, hogy az I. éves fiú egyetemisták átlagos testtömege 70 kg? 7. Van-e összefüggés egy gyermek táplálkozási energiabevitele és magasságának növekedése között? E kérdéseket ráadásul úgy választottuk meg, hogy a jó részük terítékre kerüljön a fejezetben, így bátorítjuk az olvasót, hogy újra és újra lapozzon ide vissza ellenőrizni, hogy egyre több kérdésre tudna-e választ adni A statisztika alapfogalmai és feladatai A statisztika a valóság, azon belül is elsősorban a tömeges jelenségek számszerűsíthető tényeinek szisztematikus összegyűjtésével és elemzésével foglalkozó tudományos módszer és gyakorlat. Már ennyiből is látszik, hogy a statisztika egyik fontos feladata bizonyos kérdések szabatos megválaszolása empirikus adatok alapján (ahogy erre az előbbi alfejezet is hozott példákat). Ennek kapcsán be kell vezetnünk néhány alapfogalmat, mely a statisztikusok beszédében lépten-nyomon előkerül. Azt a halmazt, melyre a statisztikai eszközökkel megvizsgálandó kérdésünk vonatkozik (cél)populációnak vagy sokaságnak nevezzük. A sokaság elemeit szokás megfigyelési egységnek is nevezni. Az előző alfejezet 4. kérdésének (Mennyi egy adott kurzus hallgatóinak átlagos testtömege?) a sokasága például az adott kurzus hallgatóiból álló halmaz; a megfigyelési egységek az egyes hallgatók. Azt a szempontot, amely szerint a sokaság elemeit vizsgálat alá vonjuk, ismérvnek, vagy más szóval változónak hívjuk. Az előbbi pont 7. kérdésében (Van-e összefüggés egy gyermek táplálkozási energiabevitele és magasságának növekedése között?) a sokaságot két változóval célszerű leírni: az energiabevitellel és a magasság-növekedéssel. Azt a lépést, amikor egy adott változó értékét meghatározzák egy adott sokasági elemre, általában megfigyelésnek nevezik a statisztikában. Nagyon sokszor nem tudunk a sokaság valamennyi egyedéről információt szerezni (azaz: nem tudjuk mindegyiket megfigyelni). Ilyenkor a sokaság azon részhalmazát, amelyet meg tudunk figyelni (tehát amelyről információnk van), mintának nevezzük, és ezt a helyzetet mintavételi helyzetnek hívjuk. A mintavétel szükségességének egyrészt technikai okai lehetnek: sok esetben a sokaság valamennyi egységéről való adatgyűjtés (az ún. teljes körű megfigyelés) technikai okok miatt nehézkes vagy egyenesen lehetetlen (túl költséges, túl bonyolult a megszervezése, túl időigényes stb.) A biostatisztikában azonban ennél is fontosabb egy másik ok: az, hogy sok kérdés nem egy kézzelfogható, véges nagyságú sokaságra (mint egy adott kurzus hallgatói) vonatkoznak, hanem egy elvileg végtelen elemből álló, ún. fiktív sokaságra. Jó példa erre az előző pont 1. kérdése: Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást? - Mi itt a sokaság? Nem mondhatjuk, hogy azok az emberek, akik részt vettek egy klinikai kísérletben, hiszen ezzel azt mondanánk, hogy a gyógyszernek konkrétan őket kell gyógyítania. Még csak azt se mondhatjuk, hogy a város összes magas vérnyomásos betege, hiszen ezzel azt mondanánk, hogy más város betegét nem kell gyógyítani. De azt se mondhatjuk, hogy a Földön élő összes hipertóniás alkotja az alapsokaságot, - mert ezzel azt mondanánk, hogy ha valaki holnap lesz hipertóniás, őt már nem kell gyógyítania. Tehát e kérdés nem emberek egy konkrét, összeszedhető csoportjára vonatkozik, hanem egy képzeletbeli, megfoghatóan nem létező csoportra (,,aki megfelel a gyógyszer alkalmazási feltételeinek''). Ez nem egy konkrét sokaság, hanem egy fiktív csoport, és benne nem véges számú elem van. Ebből viszont az is következik, hogy akármennyi embert is vizsgálunk meg ebből a sokaságból, az szükségképp csak része lesz annak, azaz szükségképp csak mintát fog jelenteni a sokaságból. Ilyenkor tehát mindenképp mintavételi helyzettel lesz dolgunk. Mivel ez a helyzet tipikus a biostatisztikában, így máris érthető, hogy miért mondtuk, hogy a mintavételi helyzetnek (illetve kezelésének) kiemelt jelentősége van a biostatisztikában. 136

149 Bevezetés a biostatisztikába A statisztika azon ágát, mely sokaságról szerzett adatokkal foglalkozik, vagy mintabeliekkel de úgy, hogy elhanyagolja, hogy csak mintáról van szó (mintha a minta lenne a sokaság) deskriptív (vagy leíró) statisztikának nevezik; s erről fejezetben lesz bővebben szó. A statisztika azon ága, mely figyelembe veszi a mintavételi helyzetet, azaz mintabeli adatokkal foglalkozik, de úgy, hogy szem előtt tartja, hogy a kérdések valójában a sokaságra irányulnak, induktív (vagy következtető) statisztikának nevezik. Ezzel fejezet fog foglalkozni. Az induktív statisztika tehát általánosít, a leíró statisztika pedig nem. A statisztika azonban nem csak meghatározott kérdések precíz megválaszolásával foglalkozik. A statisztika feladata ezen felül, hogy segítse az új ismeretek megszerzését, például az adatbázisok struktúrájának feltárásával és alkalmas megjelenítésével, a változók közti kapcsolatok felderítésével, információtömörítéssel, lényegkiemeléssel. Ebben hatalmas motivációt jelent, hogy a számítástechnikai (és orvosi) lehetőségek fejlődése miatt egyre nagyobb és nagyobb adatbázisok jönnek létre. Ezen felül a statisztika megtanít arra is minket, hogy hogyan kerüljünk el bizonyos gondolkodási csapdákat, és hogyan legyünk képesek empirikus kérdésekben racionálisan dönteni Változók és mérési skálák Az előbbi alfejezetben kissé nagyvonalúan csak annyit írtunk, hogy a változó (vagy ismérv) az a szempont, amelynek alapján a megfigyelési egységeket vizsgálat alá vonjuk. (Természetesen több ilyen ismérv is szerepelhet egy vizsgálatban.) Ez meglehetősen kézenfekvő akkor, ha például az emberek testtömege a vizsgálati szempont. Ekkor mondhatjuk egyszerűen, hogy lemérjük őket alkalmas módszerrel, és az e tulajdonságot leíró,,testtömeg'' változó legyen a lemért tömeg kilogrammban kifejezett értéke. Más esetekben azonban közel nem ilyen egyértelmű a változók megválasztásának a kérdése. A statisztika alapvetően számszerű információk feldolgozásával foglalkozó tudomány, így ahhoz, hogy egy szempontot statisztikai úton tudjunk vizsgálni, előbb számszerűen mérhetővé kell tenni. (Ez természetesen olyan információkkal is végrehajtható, melyek eredetileg nem számszerűek.) Ezt nevezzük operacionalizálásnak. Néha ez szinte triviális feladat (a testtömeget mérjük az adott módon lemért és kilogrammban kifejezett testtömeggel), máskor viszont egyáltalán nem az. Gondoljunk arra, hogy hogyan lehet számszerűen mérhetővé tenni egy olyan jellemzőt, mint hogy milyen súlyos egy alany depressziója - szinte külön tudományág, hogy ehhez milyen kérdőívek, egyéb vizsgálatok kellenek, amellyel,,lemérhető'' ez. A változók kapcsán a másik probléma, hogy egy sor tulajdonság nem mérhető közvetlenül akár technikai akadályok miatt, akár az operacionalizálás nehézségei miatt. Ez esetben gyakran kényszerülünk arra, hogy az eredetileg megcélzott változó helyett más, immár mérhető, és az eredetivel lehetőleg minél szorosabb kapcsolatban lévő változót vagy változókat mérjünk le. Az ilyen célból használt változót nevezzük proxy változónak. Például komoly gondban lennénk, ha az alany szocioökonómiai státuszát kéne lemérnünk egyetlen változóval. Ezt közvetlenül aligha tehetjük meg, így a gyakorlatban proxykat próbálnánk hozzá keresni, például iskolai végzettséget, jövedelmet, munkahelyi beosztást mérnénk. A következő kérdéskör, a mérési skála fogalma. Mivel a statisztika számszerű információkat dolgoz fel, így a változóinkat is tipikusan számokkal fogjuk leírni. Észre kell azonban venni, hogy vannak jellemzői a változóknak, amelyek önmagukban e számokból nem olvashatóak ki. Például tekintsük azt az adatot, hogy mi az alany neme, és azt, hogy mennyi a CRP-je (ez egy laboreredmény). Tételezzük most fel, hogy a nemet úgy számszerűsítettük, hogy a férfiakhoz 1-t, a nőkhöz 2-t rendelünk; a CRP-nél pedig a koncentrációja számértékét adjuk meg mg/l-ben. Ekkor mindkét adat (a nem és a CRP) is lehet történetesen 1 és 2 értékű - ám ettől még hatalmas különbség van köztük! A CRP felvehet az 1 és a 2 között is tetszőleges értéket (ha tized pontossággal mérjük le), a nem semmiképp. A CRP esetében van értelme annak a kijelentésnek, hogy az egyik beteg változóértéke a kétszerese a másikénak, a nem esetében nincs. Ezeket a különbségeket a mérési skála fogalma ragadja meg, mely azt írja le, hogy hogyan viselkednek, viselkedhetnek az adataink. A leghíresebb Stanley Smith Stevens mérési skála modellje, mely négy lépcsőfokot különböztet meg, melyek közül a két utolsót gyakran együtt tárgyalják. (Azért is beszélünk lépcsőfokokról, mert ez egy egymásra épülő, folyamatosan bővülő felosztás: a későbbi, magasabb rangú skálák bírnak az összes többi korábbi, alacsonyabb rangú skála tulajdonságaival, és még persze valamilyen többlettel is.) Stevens skálái a következőek: Névleges (nominális) skála Ilyen skálán mért adatok esetén az adat számértékének valójában nincs semmi jelentősége, kizárólag az számít, hogy a számérték ugyanaz-e két alanynál vagy sem: ha ugyanaz, akkor a változójuk is ugyanolyan értékű, ha nem ugyanaz, akkor nem - de ennél többet nem mondhatunk. Erre jó példa a beteg lakóhelye megye szerint; 1-től 20-ig kódolva. Ha az egyik betegnél ez 137

150 Bevezetés a biostatisztikába 3, a másiknál 6, akkor kizárólag annyit mondhatunk, hogy különböző megyékben laknak, semmi többet. Olyan kijelentéseknek, hogy a második beteg,,hárommal nagyobb megyében'',,,kétszer akkora megyében'', vagy,,nagyobb megyében lakik'' nyilvánvalóan nincs értelmük. További tipikus példa nominális ismérvre a beteg neme, rassza, szemszíne stb. Sorrendi (ordinális) skála Valódi skálán mért ismérvek Ilyen skála esetében már van valamennyi jelentősége a számértékeknek: számít ugyanis, hogy melyik a nagyobb - ám ezen kívül semmi más jelentőségük nincs. Ekkor tehát a lehetséges kimeneteket sorba rendeztük (innen a skála neve), ám egyebet nem mondhatunk. Tipikusan ide tartozik a különféle tumorok staging adata a négystádiumú rendszerben. Ha ez egyik beteg I, a másik II stádiumban van, akkor mondhatjuk azt, hogy ez utóbbi állapota súlyosabb (ha ez nominális skálán mért ismérv lenne, akkor már ennyit sem mondhatnánk, csak annyit, hogy nem ugyanaz a súlyosság), ám olyan kijelentéseknek, hogy,,eggyel súlyosabb'', vagy,,kétszer olyan súlyos'' állapotban van, nincs értelme. Vegyük észre, hogy a sorrendi skála tartalmazza a nominális skála jellemzőit (hiszen ha a kimenetek sorbarendezhetőek, akkor természetesen meg is különböztethetőek), azaz a kibővítése annak. Ide tartoznak azok az ismérvek, amelyek kimeneteivel már egyéb műveletek is (nem csak az összehasonlítás és a sorbarendezés) értelmezettek. Például ha egy beteg CRP-je 1 mg/l, egy másiké 2 mg/l, akkor nem csak azt mondhatjuk, hogy a kettő különbözik (legalább nominális skála), sőt, nem csak azt, hogy az utóbbi nagyobb (legalább ordinális skála), hanem nyugodtan tehetünk olyan kijelentést is, hogy az utóbbi eggyel nagyobb, vagy kétszer akkora, mint az előbbi. A legtöbb laboreredmény valódi skálán mért ismérv. (A statisztikai irodalomban ezen a kategórián belül két további csoportot szokás megkülönböztetni: a különbségi (vagy intervallum) skálán mért ismérveket, és az arányskálán mért ismérveket. Az eltérés a kettő között az, hogy az előbbiben csak az összeadás, míg az utóbbiban az összeadás és a szorzás is értelmezett. Például a CRP arányskálán mért ismérv, hiszen két érték vonatkozásában beszélhetünk arról, hogy az egyik mennyivel több, illetve hányszorosa a másiknak. A beteg testhőmérsékletével, ha azt Celsius-fokban mérjük, már nem ez a helyzet 2 ). A mérési skála ismerete azért (is) fontos, mert tájékoztat arról, hogy egy adott változóval milyen műveleteknek van egyáltalán értelme. Erre nekünk kell figyelni, annál is inkább, mert sok statisztikai csomag nem óv meg attól, hogy ezt figyelmen kívül hagyjuk. Az 1 és a 2 számok például minden további nélkül kiátlagolhatóak (mint valós számok), az azonban, hogy ennek van-e értelme, már attól függ, hogy mit takar a változó: nincs értelme átlagos nemről beszélni, de van értelme átlagos CRP-ről beszélni. A változókat csoportosíthatjuk aszerint is, hogy hány lehetséges kimenetet vehetnek fel. Ha véges sokat vagy legfeljebb megszámlálhatóan végtelen sokat, akkor diszkrét változóról beszélünk, különben pedig folytonosról. Folytonos változóra tipikus példa az olyan változó, melynek értékei a valós számok közül, vagy a valós számok valamilyen intervallumából (például pozitív valós számok) kerülnek ki. A gyakorlatban a korlátos mérési pontosság miatt elvileg minden változó diszkrét, de ha nagyon nagy a lehetséges kimenetek száma, és ezek egymáshoz képest sűrűn helyezkednek el, akkor általában nyugodtan alkalmazható a folytonos közelítés. A nominális és az ordinális skálán mért változót gyakran minőségi (vagy kvalitatív) változónak nevezik közös néven, míg a valódi skálán mért változókat sokszor mennyiségi (vagy kvantitatív) változónak hívják. A gyakorlatban előfordul, hogy a diszkrét változó fogalmát azonosítják a minőségi, a folytonosat pedig a mennyiségi változóval. Tisztán elméleti szempontból ez az azonosítás nem helyes (hiszen két különböző szempontról van szó), bár tény, hogy a legtöbb esetben valóban fennállnak ezek a megfeleltetések. Egy 2 Annak van értelme, hogy az egyik beteg maghőmérséklete 5 -kal több, de olyat nem mondhatunk, hogy 10%-kal magasabb. Gondoljunk csak bele, 1 és 2 között nyilván ugyanannyi a különbség mint 2 és 3 között, mégis, az első esetben 100%-kal, a másodikban csak 50%-kal nagyobb a másodikként megadott hőmérséklet. Ez nyilván abból adódik, hogy a hőmérsékletnek nincsen rögzített nulla pontja - az teljesen esetleges, hogy a Celsius-skála hova helyezte azt. Ha áttérnénk Fahrenheitre, az arányok rögtön megváltoznának, de a különbségek nem. Általában is igaz, hogy a különbségi skálából akkor lesz arányskála, ha rögzítjük a skála nulla pontját (mint ahogy az például a CRP esetén a 0 mg/l-nél rögzített). 138

151 Bevezetés a biostatisztikába nevezetes kivétel ez alól a különféle darabszámokat, események számát stb. tartalmazó adatok, melyek a 0, 1, 2, 3 stb. értékeket vehetik fel (tehát diszkrétek), mégis skálán mértek, sőt, azon belül is arányskálán (tehát a legmagasabb mérési szintű skálán), hiszen általában van értelme nemcsak a különbségükről, hanem a hányadosukról is beszélni. A változók jellege mellett az adatbázis jellege is különféle lehet; pontosabban szólva a vizsgálat jellege, aminek következtében az adatbázis jellege is eltér. Beszélhetünk kísérletekről és megfigyeléses vizsgálatokról, ez utóbbiak adatbázisain belül megkülönböztetünk keresztmetszeti adatbázis (ha több megfigyelési egység ugyanazon időpontra vonatkozó adait tartalmazza) és longitudinális adatbázis (ha több időszakot fog át). A vizsgálatok lehetséges konkrét elrendezései szerteágazóak; amivel itt nem foglalkozunk A biostatisztika kapcsolódó tudományai és elhatárolása A biostatisztika az alkalmazott statisztika egyik ága, hasonlóan a pszichometriához, agrometriához stb. A statisztika többé-kevésbé egységes tudomány, így végső soron hasonló módszereket alkalmaz az összes felsorolt ág, a különbség inkább a részletekben (a partikuláris problémákhoz testreszabott vagy kifejlesztett módszerekben) és az eljárások prezentációjában van. Mint minden alkalmazott ágnak, a biostatisztikának is a statisztika, matematikai statisztika adja az alapját. Az e fejezetben bemutatott módszerek jó részéhez nincs szükség mélyebb matematikai statisztikai ismeretekre, de a közelmúltban kifejlesztett új módszerek egyre komolyabb matematikai eszköztárat használnak. A matematikai statisztika a matematika több ágára is épít, s ezek közül a valószínűségszámítás a kiemelkedően legfontosabb. (Ezt több más terület is kiegészíti, például a lineáris algebra.) Nem túlzás azt mondani, hogy a valószínűségszámítás a statisztika mögötti,,alaptudomány'', melynek alapos ismerete elengedhetetlen a matematikai statisztika magas szintű műveléséhez. Jelen fejezetünkben azonban egyedül a alfejezet feltételez valószínűségszámítási alapismereteket, a többi rész minden speciális matematikai ismeret nélkül is követhető lesz. A valószínűségszámításon, matematikai statisztikán kívül orvosi ismeretekre is szükség van a biostatisztika műveléséhez. Ha nem is feltétlenül létkérdés, de a biostatisztikus munkáját megkönnyíti, ha legalább érti az orvosok szóhasználatát, valamint tisztában van az emberi test működésének élettani és a betegségek kórélettani alapjaival. Ezt a szakaszt azzal zárjuk, hogy kísérletet teszünk a biostatisztika elhatárolására két olyan területtől, amellyel gyakran keveredik a fogalma. Az egyik a bioinformatika: ez a manapság rendkívül népszerű terület inkább számítástechnikai, algoritmikus kérdésekkel foglalkozik (melyekkel nagy orvosbiológiai adatbázisokon is hatékonyan végezhetőek bizonyos műveletek, s így megválaszolhatóvá válnak bizonyos orvosilag releváns kérdések). A másik a biomatematika, mely jellemzően nem statisztikai, hanem más matematikai (elsősorban analízisbeli) eszközöket, például differenciálegyenleteket használ, és erősen modellorientált a megközelítése A biostatisztika számítástechnikai háttere A modern biostatisztika szinte elképzelhetetlen számítógépek, számítástechnikai támogatás nélkül. Ennek legalább három konkrét aspektusa van. Először is a számítógépek végrehajtják helyettünk a szokásos számítási műveleteket (például egy átlag meghatározását vagy egy statisztikai próba kiszámítását). Bár sok statisztika kurzuson még ma is megtanítják a hallgatókat a kézi számításra (elsősorban azért, hogy jobban rögzüljenek a számítások részletei is), valójában már minden gyakorlati alkalmazásban számítógépek végzik a mechanikus kalkulációkat. A számítógépek ennél általánosabb módon is támogatják a statisztikus munkáját. Azáltal, hogy segítik a nagy adatbázisok kezelését (szűrés, rendezés, keresés stb.), az adattranszformációkat (változók átkódolása, függvény szerint transzformálása stb.), vagy lehetővé teszik, hogy egy-két kattintással kiszámoljunk mutatókat, vizualizáljunk adatokat és így tovább, a hatékonyabb, kreatívabb munkavégzést is segítik. (Részint azáltal, hogy csökkentik vagy szinte megszüntetik a rutinfeladatok időigényét, és így a statisztikus a lényegre tud koncentrálni, részint azáltal, hogy számítógépek nélkül nem, vagy csak nagyon nehezen kivitelezhető segítséget (például háromdimenziós ábrákat) is tudnak adni a helyzet jobb megértéséhez.) 139

152 Bevezetés a biostatisztikába Végül pedig vannak bizonyos módszerek, melyek nem csak nehézkesek lennének, hanem egyenesen elképzelhetetlenek számítástechnikai támogatás nélkül. Ezek az ún. számításintenzív módszerek (például az újramintavételezésen alapuló eljárások, a különféle algoritmikus modellek) mind rendkívüli számításigénnyel bírnak, így lényegében a számítógépekkel egyidősek, hiszen nélkülük kifejlesztésük és különösen az érdemi használatuk nem volt elképzelhető. Zárásként nagyon rövid ismertetőkkel megemlítjük a talán legfontosabb programokat, melyeket a (bio)statisztikusok használnak: SAS SPSS R A SAS egy igen komplex, nagyméretű és drága programcsomag. Legfőbb előnye, hogy jól standardizált, bejáratott, és a gyógyszeriparban - épp emiatt - előszeretettel alkalmazzák. Az SPSS egy általános célú (eredetileg szociológusoknak kifejlesztett) statisztikai programcsomag, a funkcionalitása számos - egyenként megvásárolható - modullal állítható be a kívánt szintre. Grafikus kezelőfelülete rendkívül egyszerű és kényelmes, mellyel a beépített funkciók néhány kattintással végrehajthatóak. Noha van saját szkriptnyelve, a bonyolultabb statisztikai problémák nagyon nehézkesen oldhatók meg a használatával. Összességében véve az alap feladatokat könnyű végrehajtani vele, a komplexebbeket viszont nagyon nehéz. Az R a klasszikus,,akadémiai'' programcsomag. Az alapváltozatában még csak érdemi grafikus felület sincs, minden utasítást parancsként kell beírnunk; viszont óriási mennyiségű kiegészítő érhető el hozzá a legkülönfélébb alkalmazásokhoz, a legkönnyebből a legbonyolultabbig, továbbá egy sor szakterülethez célirányosan is. (E sorok írásának pillanatában csomag érhető el, s nem ritka, hogy napi 5-10 új csomag jelenik meg) Egy sor újonnan kifejlesztett statisztikai módszert elsőként R alatt implementálnak. Összességében elmondható, hogy ezzel az alap dolgokat sem könnyű megcsinálni - a komplexebbeket viszont lehet. Az R ingyenes és nyílt forráskódú, a címről indulva tölthető le. Használatához feltétlenül ajánlott az RStudio (szintén ingyenes és nyílt forráskódú) integrált fejlesztőkörnyezet ( alkalmazása Futó példa A fejezet hátralevő részében szereplő példák (különösen a alfejezetbeliek) didaktikai okokból mind ugyanarra az adatbázisra vonatkoznak; s ebben a szakaszban ezt az adatbázist mutatjuk be. Az adatbázis egy klasszikus demonstrációs adatbázis, általánosan használt neve Low Infant Birth Weight (LOWBWT vagy BIRTHWT); a Baystate Medical Center (Springfield, Massachusetts, Egyesült Államok) kórházban végrehajtott kutatásból (1986) származik. A kutatás célja annak vizsgálata volt, hogy milyen tényezők befolyásolják, hogy egy világra jövő újszülött kis születési tömegű 3 lesz-e. Az adatbázis 189, a Baystate Medical Center-ben lezajlott szülésről tartalmaz adatokat, egyrészt azt, hogy kis születési tömegű volt-e a világra jött újszülött, másrészt egy sor tényezőt, amely összefügghet a kis születési súllyal. (Vegyük észre, hogy ez egy minta egy fiktív, végtelen sokaságból.) A változók rövidítését, jelentését és mérési skáláját a táblázat mutatja táblázat - A futó példa Low Infant Birth Weight adatbázisának változói főbb jellemzőikkel Rövidítés Tartalom Mérési skála low Születési tömeg < 2,5 kg? [0:nem, 1:igen] Nominális 3 Kis születési tömegről akkor beszélünk, ha az újszülött testtömege kisebb mint gramm, akármennyi is a gesztációs kora. 140

153 Bevezetés a biostatisztikába Rövidítés Tartalom Mérési skála age Anya életkora [év] Arányskála lwt Anya testtömege [font] Arányskála race Rassz [1: kaukázusi, 2: afroamerikai, 3: egyéb] Nominális smoke Anya dohányzik? [0:nem, 1:igen] Nominális ptl Korábbi koraszülések száma [darab] Arányskála ht Anyai hipertónia? [0:nem, 1:igen] Nominális ui Irritábilis méh? [0:nem, 1:igen] Nominális ftv Vizitek száma (1. trimeszter) [darab] Arányskála bwt Születési tömeg [g] Arányskála Szemléltetésként az adatbázis néhány megfigyelési egységét a táblázat az összes felsorolt változóra megadja táblázat - A futó példa Low Infant Birth Weight adatbázisának néhány megfigyelési egysége low age lwt race smoke ptl ht ui ftv bwt Az adatbázis megtalálható az R statisztikai környezet (lásd az előző szakaszt) MASS nevű könyvtárában birthwt néven Deskriptív statisztika Ebben az alfejezetben a statisztika deskriptív ágával fogunk foglalkozni. Már utaltunk rá, hogy deskriptív statisztikáról akkor beszélünk, amikor kizárólag a mintában lévő információt igyekszünk valamilyen módon megragadni (és nem törődünk azzal, hogy a minta maga is csak a valóság egy,,szelete'', precízebben megfogalmazva: figyelmen kívül hagyjuk a mintavételi helyzetet). Először ezt a gondolatot fogjuk pontosítani, közelebbről körüljárni; majd pedig megismerkedünk a leíró statisztika legalapvetőbb módszereivel. Látni fogunk grafikus és analitikus módszereket, foglalkozunk egy- és többváltozós helyzetekkel. Az ismertetést a vizsgált változók mérési skálája szerint végezzük. (Azzal, hogy a nominális és az ordinális, illetve az intervallum- és arányskálán mért változókat nem választjuk szét, hanem minőségi és mennyiségi változókról fogunk beszélni.) Ezek után az olvasó számára ismerős lesz a mai orvostudományi cikkekben alkalmazott deskriptív eszköztár túlnyomó része; az elemi eszközöknek pedig szinte egésze. Ebben a fejezetben a Low Infant Birth Weight adatbázist fogjuk futó példaként használni a módszertani mondanivaló illusztrálására. Az ábrák és a számítások R statisztikai környezetben készültek A deskriptív statisztikáról általában Amint már említettük, a deskriptív statisztika definíciós jellemzője, hogy kizárólag a mintában lévő információval törődik, számára az az,,univerzum'', és teljes mértékben figyelmen kívül hagyja azt a kérdéskört, hogy a mintában lévő információ hogyan viszonyul a sokaságban lévő információhoz. Innen ered a módszer 141

154 Bevezetés a biostatisztikába neve is: a deskripció leírást jelent, azaz a deskriptív módszerek pusztán a minta - valamilyen szempontból,,jó'' - leírását célozzák meg (nem pedig következtetést a sokaságra). Nem véletlen, hogy ebben a kontextusban nagyon sokszor minta helyett adatbázist mondunk (tükrözve, hogy itt igazából nincs is jelentősége annak, hogy az adataink csak - a szó statisztikai értelmében - egy mintát jelentenek). A,,jó'' leíráson alatt legtöbbször azt értjük, hogy a mintában lévő információt úgy próbáljuk tömöríteni, hogy közben - valamilyen elemzési célra tekintettel - kiemeljük a lényeget. Erre azért van szükség, mert a legtöbb esetben a mintában lévő információ (még ha csak néhány változóra, és néhány tucat megfigyelési egységre is gondolunk) feldolgozhatatlan,,ránézéssel''. A számok tengeréből még a legalapvetőbb kérdésekre sem tudnánk válaszolni. Szükség van tehát olyan módszerekre, melyek,,emészthetővé teszik'' ezt a számtengert: csökkentik a bonyolultságát, hogy tudjuk értelmezni azt, fel tudjuk használni kérdések megválaszolásához, illetve új megállapítások eléréséhez. Nyilvánvaló, hogy a bonyolultság csökkentése csak úgy lehetséges, ha információt hagyunk el. Az egész művelet kritikus pontja épp ez: annak megválasztása, hogy mennyi információt hanyagoljunk el és hogyan. A,,hogyan'' szerepe triviális: ha egy adott, mennyiségi változóra vonatkozó 100 elemű mintából elhagyjuk az első 99 elemet, akkor ugyan egyetlen számmá, azaz teljesen áttekinthetővé alakítjuk az információt - csak épp semmit nem érünk el vele. Ha viszont kiszámoljuk az átlagot, akkor ugyanúgy egyetlen számot kapunk, de immár úgy, hogy annak van értelme, azaz felhasználhatjuk kérdések megválaszolásához, illetve új megállapítások eléréséhez. A meghatározó kulcskérdés az elhanyagolásban (az információtömörítésben) tehát a,,mennyit''. Látható, kompromisszumot kell kötni az áttekinthetőség és a reprodukciós hűség között: minél többet hanyagolunk el, annál inkább segítjük az áttekinthetőséget, de annál többet vesztünk az eredeti információ hűséges reprodukciójából. A deskriptív statisztika igazi sava-borsa (végeredményben a legtöbb módszer, így vagy úgy, de ebben foglal el valamilyen álláspontot) a jó kompromisszum megtalálása a kettő között. Például ha az adatbázisunkban a születési tömeg (bwt) változó megfigyelései a következők: Ezt a megadást nevezhetnénk az egyik végpontnak ebben a kompromisszumban: 100% reprodukciós hűség, de - szinte - 0% áttekinthetőség. Az áttekinthetetlenség a legalapvetőbb kérdések megválaszolását, a legalapvetőbb észrevételek elérését is lehetetlenné teszi. Másik végpontnak vehetjük azt, amikor a fenti adatoknak csak az átlagát adjuk meg: 2944,6. 142

155 Bevezetés a biostatisztikába Ez 0%-hoz közeli reprodukciós hűséget jelent (189 számból 1-et,,gyártottunk'', szinte semmit nem tudunk reprodukálni az eredeti adatbázisból), viszont remek az áttekinthetősége (például azonnal látható, hogy milyen érték körül csoportosulnak az adatok). Az igazán érdekes az, hogy - természetszerűleg - a két végpont között számos egyéb kompromisszumot köthetünk. Megadhatjuk például (az utóbbi végponttól az előbbi felé haladva) az adatok átlagát és szórását: 2944,6 ± 729,2; Vagy az adatok átlagát, mediánját, szórását és interkvartilis terjedelmét 4 : 2944,6 (2977) ± 729,2 (1073) Megadhatjuk az adatok átlagát, mediánját, szórását, interkvartilis terjedelmét, illetve minimumát és maximumát is: 2944,6 (2977) ± 729,2 (1073) [ ]. Látszik, hogy minden ilyen megadás egyfajta kompromisszum: egyre több információt őrzünk meg (egyre kevesebb az adatvesztés, hűségesebb a reprodukció), viszont közben romlik a megadás áttekinthetősége. Összefoglalva tehát megállapíthatjuk, hogy bár az információtömörítés szükségképp adatvesztést jelent, ez azonban nem feltétlenül baj, épp ellenkezőleg: ez teszi lehetővé, hogy a fontosat észrevegyük. A kulcskérdés a kettő közötti egyensúlyozás A deskriptív statisztika módszereinek csoportosításáról Azért, hogy az igen nagy számú leíró statisztikai módszert áttekinthetően tudjuk tárgyalni, érdemes megismerkednünk pár szemponttal, melyek mentén e módszerek jellegzetes, és gyakorlati szempontból fontos csoportokba sorolhatóak Grafikus és analitikus módszerek A fent bemutatott példák (átlagtól szóráson át a terjedelemig) mind ún. analitikus eszközök voltak, azaz a (számszerű) információból számszerű, csak épp tömörebb, a lényeget kiemelő információt szolgáltattak. Az analitikus módszerek tipikus példái a mutatószámok, mint amilyen az átlag vagy a szórás, bár léteznek ennél komplexebb (nem egyetlen számból álló) eredményt szolgáltató analitikus eszközök is - az azonban közös tulajdonságuk, hogy mindegyik számszerű kimenetet ad. Ezzel állnak szemben az ún. grafikus módszerek, melyek a bemenő (számszerű) információból valamilyen képi megjelenítést konstruálnak. Szokás ezért az ilyet adatvizualizációnak is nevezni, bár ezt a megnevezést gyakran csak a komplexebb módszerekre alkalmazzák. A grafikus módszerek általában kevésbé tömörek és kevésbé objektivizálhatóak (ami nehézséget okoz, ha például összehasonlításra van szükség), de cserében nagyon sokszor jobban értelmezhető benyomást adnak a vizsgált adatbázisról. Ennek hátterében az áll, hogy az emberi agy különösen alkalmas struktúrák azonosítására, vizsgálatára grafikus információkban; így ha ügyesen tudjuk vizualizálni az adatbázisunk tartalmát, azzal nagyban megkönnyíthetjük az elemzését. Nem véletlen, hogy John Wilder Tukey, a hírneves amerikai matematikus egyszer azt mondta:,,there is no excuse for failing to plot and look!'' (,,Nincs mentség arra, ha nem ábrázoljuk az adatokat és nem nézünk rá az ábrára!'') Egy- és többváltozós módszerek Szemben azzal, amit sokan elsőre gondolnának, hogy ti. az egyváltozós módszerekkel egyetlen változót vizsgálunk (míg a többváltozósakkal többet), valójában egyváltozós módszerekkel is vizsgálhatunk akárhány változót. A különbség tehát nem ez, hanem az, hogy az egyváltozós módszerekkel egy időben egyetlen változót vizsgálunk csak, míg a többváltozós módszerek egyidejűleg is több változót tekintenek. (Ha megadjuk, hogy 4 Most még nem fontos, hogy ezek a mutatók pontosan mit jelentenek (a későbbiekből úgyis ki fog derülni), csak annyi számít, hogy a minta különböző leírói. 143

156 Bevezetés a biostatisztikába pontosan hányat, akkor ezt az elnevezésben is szerepeltethetjük, például kétváltozós vizsgálat, háromváltozós vizsgálat.) Mit értünk azon, hogy egy időben? Képzeljünk el egy adatbázist, melyben emberek testmagasságának és testtömegének mért adatai szerepelnek. Okkal várjuk azt, hogy a nagyobb testmagasság tendenciájában nagyobb testtömeggel jár együtt, tehát azoknak, akiknek nagyobb a testmagasságuk, várhatóan 5 nagyobb a testtömegük is. Igen ám, de ha önmagábancsak a testmagasságot vizsgáljuk, vagy csak a testtömeget, akkor ezt az összefüggést soha nem vennénk észre. Bármilyen alapos elemzést is végeznénk (beleértve akár az összes megfigyelés tömörítés nélküli felsorolását), soha nem jönnénk rá erre a kapcsolatra - hiszen a külön-külön végzett vizsgálatokban nem tudjuk összerendelni az ugyanazon emberhez tartozó testmagasságot és testtömeget. Amit tehát elvesztünk, az a változók közötti kapcsolatok kérdésköre. Éppen ezért mondhatjuk azt, hogy egy többváltozós vizsgálat több, mint több egyváltozós vizsgálat - hiszen itt már megjelenik a változók közötti kapcsolatok kérdése is. Végezetül megemlítük, hogy a többváltozós kategóriát néha szétbontják, arra tekintettel, hogy a többváltozós elemzés klasszikus arzenálja csak egy-két tucat változóig alkalmazható hatásosan (sőt, igazán hatásosan inkább csak tíznél is kevesebb változóra). Az e fölötti tartományban néha megkülönböztetésül sokváltozós adatelemzésről beszélnek A vizsgált változó(k) mérési skálája A leíró statisztika módszerei jellegzetesen eltérnek aszerint is, hogy milyen mérési skálán mért változó elemzéséről van szó. Amint már említettük is, az ordinális és nominális változókat nem fogjuk megkülönböztetni, és egységesen minőségi változókról fogunk beszélni, hasonlóképp az intervallum- és arányskálán mért változók esetében is egységesen mennyiségi változókról lesz szó. (A különbségekre csak utalni fogunk.) Minőségi változó egyváltozós elemzése Minőségi változóra jó példa adatbázisunk rassz (race) változója, mely az alany rassz szerinti hovatartozását adja meg (és ezért nominális) Analitikus eszközök Minőségi változó elemzésének tipikus analitikus eszköze az ún. gyakorisági sor. A gyakorisági sor a változó lehetséges kimeneteit (kategóriáit) tartalmazza, együtt azzal, hogy az adott kimenetből hány fordult elő az adatbázisban. Az ilyen,,darabszámot'' a statisztikában általában is gyakoriságnak nevezik, és f-fel jelölik. (Ha utalni akarunk arra, hogy az i-edik kategória gyakoriságáról van szó, akkor f i-vel.) Nyilván A relatív gyakoriság az előbbi (abszolút) gyakoriság osztva a mintanagysággal (azaz n-nel). A relatív gyakoriság tehát azt mutatja meg, hogy egy kategóriába a megfigyelési egységek mekkora hányada esik. Például a rassz változó gyakorisági sora: Kategória f i f i Kaukázusi 96 0,508 Afroamerikai 26 0,138 Egyéb 67 0,354 Összesen 189 1,000 A teljes relatív gyakorisági sort (esetünkben tehát a 0,508--0,138--0,354 sort) a statisztikusok nagyon gyakran a változó megoszlásának hívják 6. 5 E fogalmat később pontosabban is meg fogjuk ragadni. 6 Valószínűségszámításban jártasak számára nem meglepő az elnevezés: ez az eloszlás mintabeli analógja. 144

157 Bevezetés a biostatisztikába Ebben a speciális esetben az információtömörítés igazából semmilyen információveszteséggel nem járt: ez a három szám pontosan ugyanúgy hordoz minden információt erről a változóról mint az eredeti 189 szám. Ez azonban egy abszolút speciális eset, ami kizárólag a változó minőségi mivoltának volt köszönhető. A gyakorisági soron kívül egyetlen mutatószámnak van még értelme ennél a mérési skálánál: a módusznak. A módusz (jele: Mo) a leggyakoribb 7 kimenet (tehát az a kimenet, melyhez tartozó gyakoriság a legnagyobb az adatbázisban). Formalizálva ezt írhatnánk: A példánkban tehát a rassz módusza a kaukázusi. Már most megjegyezzük, hogy a módusz ún. középérték, ezen belül is helyzeti középérték; de e fogalmaknak majd a mennyiségi változóknál lesz szemléletesebb tartalma. Érdemes megfigyelni, hogy itt már érvényesül a kompromisszum a hűség és az áttekinthetőség között. Még áttekinthetőbb, ha a fenti három szám megadása helyett annyit mondunk, hogy,,a módusz a kaukázusi'', de ebben a kijelentésben már lesz információveszteség: nem tudhatjuk, hogy a 189-ből 189 kaukázusi vagy 64 (vagy épp 96), és semmit nem tudunk a többi kategória gyakoriságáról. Végezetül megjegyezzük, hogy az ordinalitás csak annyit módosít a fentieken, hogy a gyakorisági sorban a kategóriák felsorolási sorrendje kötött lesz (nominális esetben, mint amilyen a mostani példánk is volt, nyilván érdektelen, hogy milyen sorrendben adjuk meg a kategóriákat, tetszőlegesen felcserélhettük volna a sorokat anélkül, hogy az érdemi változást okozott volna). Ebből a kötöttségből még egy dolog következik: lesz értelme beszélni arról is, hogy mennyi a gyakoriság egy adott kategóriáig. (Nem csak adott kategóriában.) Ez nyilván értelmetlen fogalom mindaddig, amíg a kategóriák között nem értelmeztünk sorrendet. Éppen ezért ekkor bevezethető a kumulált gyakoriság fogalma (jele f'), mely adott kategóriára egyenlő a gyakoriságok összegével az adott a kategóriáig. (A szokásos definíció szerint azt a kategóriát is beleértve.) Tehát formálisan: Hasonlóképp beszélhetünk kumulált relatív gyakoriságról (jele g'), mint a relatív gyakoriságok összege adott kategóriáig (azt is beleértve), tehát formálisan Grafikus eszközök A minőségi változók grafikus elemzése lényegében a gyakorisági sor vizualizálását jelenti. Ennek két, a gyakorlatban legtipikusabb eszköze az oszlopdiagram és a kördiagram. Az előbbi oszlopok magasságával, az utóbbi körcikkek területével szemlélteti a gyakoriságokat. (Bár ez utóbbi, jellegéből adódóan, csak relatív gyakoriságokat tud szemléltetni. Oszlopdiagrammal gyakoriság és relatív gyakoriság is szemléltethető; sőt, a kettő lényegében ekvivalens, csak a függőleges tengely skálázása lesz más.) Erre mutat példát a rassz változó kapcsán a ábra ábra - Oszlopdiagram és kördiagram használata a rassz változó grafikus vizsgálatára 7 Vö. mode (angol), die Mode (német) a.m. divat; a szó egyébként a hasonló értelmű francia kifejezésből jön. 145

158 Bevezetés a biostatisztikába Az oszlop- és kördiagramok használata kapcsán megjegyzendő, hogy tudományos munkákban általában az oszlopdiagram a preferált. Pszichológiai vizsgálatok szerint ugyanis az emberi szem jobban tud lineáris mértékeket kezelni és értelmezni, mint területet. Az egyetlen megfontolás, ami néha mégis az oszlopdiagram ellen szólhat, hogy az oszlopok kirajzolási sorrendje implikál egyfajta sorbarendezést (a mi kultúránkban megszokott balról-jobbra olvasás miatt), ami adott esetben nem következik a változó tartalmából. Az ordinalitás e téren nem sok változást okoz: az oszlopok sorrendje kötött lesz, illetve ábrázolhatóvá válik a kumulált gyakoriság is (természetesen csak oszlopdiagrammal) Mennyiségi változó egyváltozós elemzése Mennyiségi változóra jó példa adatbázisunk születési tömeg (bwt) változója, mely az alany születési tömegét adja meg (és így arányskálán mért) Analitikus eszközök Az analitikus eszközök közül először most is a gyakorisági sort, majd a különböző mutatószámokat tárgyaljuk meg. Gyakorisági sor - Gyakorisági sor természetesen mennyiségi változóra is készíthető, de csak módosításokkal. Annak ugyanis, hogy felsoroljuk, hogy az egyes előforduló kimenetekből mennyi van, nincs sok értelme (hogy egy példával illusztráljuk: az itt tipikus folytonos változóknál könnyen lehet, hogy minden egyes előforduló kimenetből csak egyetlen egy lesz). A problémát nyilván a folytonosság jelenti, ami ellen úgy védekezhetünk, hogy nem adott értéket felvevő megfigyelési egységek számát adjuk meg, hanem adott intervallumba esőek számát. Így kapjuk az ún. osztályközös gyakorisági sort. (Az elnevezés arra utal, hogy osztályközöket hozunk létre - így fogjuk hívni az előbb említett intervallumokat.) A gyakoriság, relatív gyakoriság, kumulált gyakoriság és kumulált relatív gyakoriság 8 értelmezése változatlan. A születési tömeg változó osztályközös gyakorisági sora (precízebben szólva: egy lehetséges osztályközös gyakorisági sora; hiszen ez függ az osztályközök megválasztásától is), a következő: C i0 C i1 f i g i f' i g' i , , , , , , , , , ,513 8 Emlékezzünk vissza, hogy a magasabb mérési skála minden alacsonyabb tulajdonságával bír, így természetesen az összes, alacsonyabb mérési skálán értelmezett módszer a magasabb mérési skálák esetében is alkalmazható. 146

159 Bevezetés a biostatisztikába C i0 C i1 f i g i f' i g' i , , , , , , , ,000 Összesen 189 1, Itt C i0 és C i1 rendre az i-edik osztályköz alsó és felső határát jelöli. Az megállapodás kérdése, hogy a határon lévő megfigyelési egységeket (például egy pont 2000 grammos újszülöttet) hová sorolunk, ennek természetesen csak a kerekítésből adódó diszkrétség miatt van egyáltalán jelentősége. Elöljáróban jegyezzük meg, hogy itt a gyakorisági sor - szemben a minőségi esettel - igenis információvesztéssel jár: például lehet a harmadik osztályközben szereplő 14 újszülött mindegyike 1501 grammos, és lehet mind a 14 újszülött 1999 grammos, mindkét esetben ugyanúgy a fenti osztályközös gyakorisági sort kapjuk. Az információvesztés mértékét az osztályközök hossza (a felosztás,,finomsága'') fogja meghatározni. Az osztályközös gyakorisági sorok használatának legnagyobb kihívása: az osztályközök helyes megválasztása. Az információveszteség minimalizálása szempontjából nyilván a minél szűkebb osztályközök a jobbak, viszont túlzásba ezt sem lehet vinni, különben értelmét veszti az egész eszköz, azáltal, hogy megszűnik a lényegkiemelő jelleg. (Ha egyre jobban és jobban szűkítjük az osztályközöket, akkor egy idő után visszajutunk oda, hogy az intervallumok túlnyomó részében 0 lesz a gyakoriság, a többiben pedig azaz lényegében visszakapjuk a minta,,felsorolását''.) Az egyetlen dolog, ami univerzálisn segít ezen, az a mintanagyság növelése (hiszen lehetővé teszi az osztályközök szűkítését úgy, hogy közben várhatóan nem csökken az egy osztályközbe eső megfigyelési egységek száma). Ráadásul az osztópontok megválasztása nem csak az információveszteség szempontjából fontos. Az, hogy a gyakorisági sor milyen képest sugall számunkra a vizsgált változóról nagyban változhat az osztópontok nem túl lényeges áthelyezésének hatására is, különösen kis mintanagyságnál. Éppen ezért jelent a gyakorlatban komoly kihívást az osztályközök határainak jó megválasztása. Alapvetően két módszerünk van arra, hogy ezt hogyan tegyük meg. Az egyik módszer az, hogy tárgyterületi információkat használunk fel, azaz megpróbálunk - az adott változó jelentését is figyelembe véve - szakmailag értelmes, tartalommal bíró osztópontokat találni. (A fenti gyakorisági sor példa erre, hiszen az emberi szem számára kényelmesen értelmezhető kerek számokat jelöltünk ki osztópontként.) A másik lehetőség, hogy tisztán statisztikai alapon (tehát a változó tárgyterületi jelentésének felhasználása nélkül) döntünk. Vannak módszerek, melyek pusztán a megfigyelések statisztikai jellemzői (nagyság, szóródás stb.) alapján igyekeznek,,kitalálni'', hogy hová érdemes rakni az osztópontokat ahhoz, hogy a lehető leginformatívabb gyakorisági sort kapjuk. Például az egyik ilyen ismert analitikus szabály a Sturges-szabály, amely azt javasolja, hogy log 2n + 1 darab azonos szélességű osztályközt vegyünk fel a mintaminimum és -maximum között. Mutatószámok - A mutatószámok a megfigyelések valamilyen jellemzőjét próbálják meg egy-egy számba tömörítve megragadni. A következőkben aszerint csoportosítva mutatjuk be őket, hogy mi ez a megragadott jellemző. Centrális tendencia - Centrális tendencia alatt azt értéket értjük, amely körül csoportosulnak a megfigyelések. Függően a konkrét mutatótól, olyanokra gondolhatunk itt, mint,,közepes'',,,tipikus'' vagy,,átlagos'' érték. A legtöbb statisztikai alkalmazás szempontjából ez a legfontosabb jellemzője a változónak, ezért ha csak egyetlen számmal jellemezhetjük a változót, az tipikusan a centrális tendencia valamilyen leírója lesz. Ezeket a mutatószámokat általában középértéknek vagy helyzetmutatónak nevezik. A centrális tendencia leghíresebb mutatója a (számtani) átlag, jele. Definíció szerint az a szám, amellyel helyettesítve minden megfigyelési egység értékét, az ún. értékösszeg (a változó megfigyeléseinek összege) változatlan marad: 147

160 Bevezetés a biostatisztikába Ennek akkor van értelme, ha a különböző megfigyelések számtani összege valamilyen értelmes tartalommal bír. (Van például értelme beszélni egy osztály átlagos testtömegéről, hiszen a testtömegek összege értelmes kifejezés, megadja például, hogy mennyit mutatna egy mérleg, ha mindenki ráállna.) Ha azonban a változó olyan, hogy nem az megfigyelések összegének van értelme, akkor a számtani átlag használata félrevezető lehet, és azt mással kell helyettesíteni. Például, ha a megfigyelések összege helyett azok szorzata értelmes a tárgyterületen, akkor az ún. mértani átlagot használjuk. (Tipikus példa erre az, ha a változó valamilyen növekedési ütemet jelent időben. Ha egy alany testtömege egy évben 1,2-szeresére nőtt, a rákövetkező évben pedig 1,3-szeresére, akkor az össznövekedés nem a növekedések összege (1,2 + 1,2 = 2,4), hanem azok szorzata (1,2 1,2 = 1,44) lesz.) A születési tömegek átlaga 2944,6 gramm, ami azt jelenti, hogy az adatbázisban szereplő újszülöttek össztesttömege akkor maradna változatlan, ha mindegyikük egységesen 2944,6 gramm lenne. Az átlag ún. számított középérték, mivel valamilyen számszerű összefüggésben van a megfigyelések értékeivel. Az átlag előnye, hogy rendkívül közismert, mindenki számára kényelmesen kezelhető, a szokásos gondolkodásunkhoz közel álló mutató. (Ez olyannyira erős tényező, hogy nagyon sok orvosi publikáció még akkor is erőlteti az átlag használatát, amikor az - a mindjárt részletezendő okokból - nem célszerű.) Az átlag legnagyobb hátránya, hogy nem robusztus. Egy statisztikai mutatószám robusztussága azt méri, hogy mennyire érzékeny arra, ha a mintában a többi értéktől, a csoportosulás alaptendenciájától jelentősen eltérő érték vagy értékek vannak. Az ilyen megfigyeléseket egyébként nagyon gyakran outliernek is nevezik. (,,Érzékenységen'' azt értjük, hogy a mutatót mennyire tudja befolyásolni, a valódi értékétől eltéríteni az ilyen outlierek jelenléte.) Az átlag ilyen szempontból extrém rossz mutató: bármelyik megfigyelés bármilyen megváltozása módosítja az értékét, s ami még nagyobb baj, ha egyetlen megfigyelés is tart a végtelenhez, akkor az átlag is tart a végtelenhez, függetlenül az összes többi megfigyeléstől, és függetlenül a minta nagyságától. Ha csak egyetlen outlier is van a mintában, már az is képes arra, hogy teljesen értelmetlenné tegye az átlagot, hiszen ha van egy ilyen outlier a mintában, akkor az átlag nem a minta,,közepes'' értékét fogja mutatni, hanem - minél jobban kilóg az outlier - egyre inkább az outlierét. Megjegyezzük, hogy pontosan emiatt az átlag használata a centrális tendencia jellemzésére nem csak gyakorlati szempontból lehet problémás (adatrögzítési hibákból, adatbázis-sérülésekből eredő outlierek), hanem elméletileg is ellenjavallt, ha a változó olyan, hogy fel kell készülni kis számú, de a többinél lényegesen nagyobb vagy kisebb megfigyelés jelenlétére. (Ez fordulhat elő - mindenféle adatrögzítési és egyéb hiba nélkül is - például ún. aszimmetrikus eloszlásoknál, melyekről később fogunk részletesebben szólni.) Épp ezen a robusztussági problémán igyekszik javítani a trimmelt (vagy nyesett) átlag: ezt úgy kapjuk, hogy elhagyjuk a legkisebb és legnagyobb adott számú elemet, és csak a maradékot átlagoljuk. Az elhagyott megfigyelések száma tipikusan - a gyakorisági sor alján és tetején is - a mintanagyság 2,5%-a; s ebben az esetben 5%-os trimmelt átlagról beszélünk. (Számos pontozásos sportágban épp ezen az elven alakítják ki a zsűri,,átlagos'' pontszámát.) A születési tömegek 5%-os trimmelt átlaga a például vett adatbázisban 2957,4 gramm, ami egyúttal azt is mutatja (mivel közel van a számtani átlaghoz), hogy a születési tömegek aránylag szimmetrikus eloszlásúak, komoly outlier nélkül. A centrális tendencia megragadásának alapvetően más megközelítése a medián használata. A medián a nagyság szerint sorbarendezett megfigyelések közül a középső, jele Me. (Ha a mintanagyság páros, akkor két,,középső'' érték is van. Ez esetben megállapodás kérdése, hogy mit nevezünk mediánnak; vehetjük például a kettő átlagát.) Úgy is szoktak fogalmazni, hogy a medián az az érték, amely alatt és felett is egyaránt ugyanannyi mintaelem (az összes elem fele-fele) található. A medián szintén a centrális tendenciát jellemzi, csak épp kevésbé megszokott módon, mint az átlag. Ez egyúttal a használatának egyik fő gátja is: sok ember számára a medián tartalma (és egyáltalán, értelme) kevésbé ismert, így e mutató kevésbé elterjedt. Előnye viszont a robusztusság, ilyen szempontból az átlaggal szemben a másik végpontot képviseli: míg az átlag extrém érzékeny, addig a medián extrém robusztus. A minta minden medián feletti értéke (az egyszerűség kedvéért most gondoljunk páratlan mintanagyságra) tetszőlegesen megnövelhető (akár az összes egyszerre is), vagy a medián alatti értékek tetszőlegesen lecsökkenthetőek (akár az összes egyszerre is), vagy akár a kettő megtörténhet együtt is, a medián értéke nem változik. Hátránya, hogy a jó robusztusságért cserében kevesebb információt használ fel a mintából 9 ; ezt épp a mintaértékek meglehetősen 9 A trimmelt átlag kompromisszumnak tekinthető a robusztusság és a mintaértékek mind teljesebb kihasználása között. A 0%-os trimmelt átlag épp a,,hagyományos'' átlag, a 100%-os trimmelt átlag pedig épp a medián. 148

161 Bevezetés a biostatisztikába szabad,,állítgathatósága'' mutatja. (Hogy a medián miért kevésbé hatásos becslő, mint az átlag, azzal a alfejezetben foglalkozunk precízebben.) A tanulság az, hogy ha feltehető, hogy a háttéreloszlás szimmetrikusközeli, akkor érdemes átlagot használni, ha nem szimmetrikus-közeli, vagy outlierek jelenlétére is fel kell készülni (azaz indokolt robusztus statisztika használata), akkor ilyen szempontból jobb a medián. A születési tömegek mediánja 2977 gramm a példának vett adatbázisban, azaz a 2977 gramm az a testtömeg, amelynél az újszülöttek felének kisebb, másik felének nagyobb a tömege. A medián a minta,,felezőpontja''. Ugyanúgy definiálhatók általános osztópontok; ezeket kvantiliseknek nevezzük. A p-kvantilis (0<p<1) az az érték, amelynél a megfigyelések p-ed része kisebb, (1-p)-ed része pedig nagyobb. (Tehát a medián az 1/2-kvantilis.) Gyakorlati szempontból nagy jelentősége van még a negyedelőpontoknak, melyek neve kvartilis. Ilyenből nyilván három van: a p = 1/4, 2/4 = 1/2 és a 3/4-kvantilis, ezek közül a középső ugyanaz mint a medián. A másik kettőt alsó és felső kvartilisnek szokták nevezni, és Q 1- gyel, illetve Q 3-mal jelölik. Tehát például Q 1 az a szám, amelyre igaz, hogy a minta egynegyede (darabszámban) nála kisebb értékű, háromnegyede pedig nála nagyobb. Ezek valójában már nem is a centrális tendenciát, hanem általában az eloszlás alakját mutatják, mégpedig robusztus módon (ugyanazon okból, mint amit a mediánnál is láttunk). Ritkábban, de szokták használni ugyanerre a célra a tizedelőpontokat, a nevük decilis (D 1,D 2,...,D 9) és a századolópontokat, a nevük percentilis (P 1,P 2,...,P 99). A módusz használatának a folytonosság miatt általában nincs értelme mennyiségi változó esetén, ahogy azt már említettük is. Móduszról csak akkor van értelme beszélni, ha diszkretizáljuk (csoportosítjuk) az adatokat, ahogy az a gyakorisági sorral történt. Szokás ezt modális osztályköznek is nevezni. Például a születési tömegek fent közölt osztályközös gyakorisági sorában (ne feledjük, itt már az is számít, hogy melyik osztályközös gyakorisági sorra vonatkozóan adjuk meg a móduszt) a modális osztályköz a gramm. A módusz és a medián ún. helyzeti középérték, mivel nem számítás eredményeként adódnak, hanem a többi megfigyeléshez képest elfoglalt helyzetük tünteti ki őket. Ennek kapcsán azt is megjegyezzük, hogy átlagot, mediánt (és általában minden egyéb mutatószámot is) lehetséges osztályközös gyakorisági sorból is (a nyers mintaelemek ismerete nélkül) számolni, persze ez esetben csak közelítő jelleggel. Szóródás - Szóródásnak nevezzük azt, hogy a megfigyelések milyen szorosan csoportosulnak a centrális tendencia körül, más szóval mennyire ingadoznak a megfigyelések, mekkora változékonyság van bennük. A gyakorlatban ez a második legfontosabb kérdés: ha csak egy jellemzőt adhatunk meg, akkor az a centrális tendencia lesz, de ha kettőt, akkor megadjuk azt is, hogy mekkora a szóródás. A minta szóródásának legegyszerűbb mérőszáma a legkisebb (Min) és a legnagyobb (Max) mintaelem értéke, a mintaminimum és mintamaximum, illetve kettejük különbsége, melyet terjedelemnek (range) nevezünk és R-rel jelölünk: R= Max - Min. Ezek mutatók előnye, hogy teljesen egyértelmű a tartalmuk, hátrányuk, hogy rendkívül érzékenyek arra, hogy konkrétan milyen mintát vettünk a sokaságból, ezért következtetési célokra nem is szokták alkalmazni őket. A születési tömegek mintaminimuma 709 gramm, mintamaximuma 4990 gramm, így e változó terjedelme 4281 gramm. A szóródás leggyakoribb általános célú mutatója a szórás, jele általában s x vagy σ x. (A két fogalom neve nem keverendő: a szóródás a jellemző, a szórás egy lehetséges mutatószáma a szóródásnak.) A szórás a megfigyelések átlagtól való átlagos eltérése. Ez utóbbi átlag alatt négyzetes átlagot értünk, mivel egyszerű számtani átlag nem lenne megfelelő, hiszen abban a pozitív és negatív irányú eltérések csökkentenék (sőt kioltanák) egymás hatását. Azaz precízen: A szórás négyzetét szokás szórásnégyzetnek vagy varianciának nevezni. Deskriptív esetben néha inkább mintaszórást illetve mintavarianciát mondanak (hogy a megfelelő valószínűségszámítási fogalomtól megkülönböztessék). A fent definiált mutatót szokás precízen korrigálatlan mintaszórásnak nevezni, ezzel szemben a korrigált (empirikus, tapasztalati) mintaszórás: 149

162 Bevezetés a biostatisztikába A különbségük oka csak a következtető statisztikában válik világossá (a korrigálatlan mintavariancia, első ránézésre talán meglepő módon, nem torzítatlan becslője a sokasági varianciának). A példabeli adatbázisban a születési tömegek korrigált mintaszórása 729,2 gramm, tehát az újszülöttek testtömeg-ingadozása átlaguk körül átlagosan 729,2 gramm. A szórás hátránya, hogy - az átlaghoz hasonlóan - nem robusztus mutató. (Egyrészt azért, mert maga is az eltérések négyzetét használja, amely érzékeny a kilógó értékekre, másrészt azért, mert a eltéréseket a nemrobusztus átlagtól veszi.) Egyik lehetséges megoldás az interkvartilis terjedelem (jele IQR) használata. Ez a felső és az alsó kvartilis különbsége: IQR = Q 3 - Q 1. Az interkvartilis terjedelem a robusztus kvartiliseken alapul, így robusztus mutató. Tartalmilag a szóródást jellemzi, hiszen minél jobban szóródott az eloszlás, annál távolabb lesz egymástól az alsó és a felső negyedelőpontja. A születési tömegek interkvartilis terjedelme 1073 gramm, tehát az a tömeg, amely fölött az újszülöttek egynegyede (és alatta háromnegyede) van, 1073 grammal nagyobb annál a tömegnél, amely fölött az újszülöttek háromnegyede (és alatta egynegyede) van. A másik lehetőség a szórás korrigálása oly módon, hogy az eltéréseknek nem a négyzetét, hanem az abszolút értékét vesszük. Ezzel a kapott mennyiség matematikai kezelhetőségét rontjuk (hiszen a négyzetreemelés jobban kezelhető matematikai művelet), de a robusztusságot növeljük. További javítási lehetőség, ha az eltéréseket nem az átlagtól hanem a mediántól vesszük, és nem is átlagoljuk őket, hanem a mediánjukat képezzük. A mutató neve, amely mindhárom,,trükköt'' (interkvartilis terjedelem, abszolút érték, átlag helyett medián) beveti, medián abszolút eltérés, jele MAD 10 : A születési tömegek medián abszolút eltérése a példabeli adatbázisban 563 gramm, tehát az újszülöttek testtömegeinek a mediánjuk körül vett (abszolút) ingadozásának mediánja 563 gramm. Alakmutatók - A centrális tendencián és a szóródáson kívül néha egyéb, még inkább részletekbe menő jellemzőket is használnak egy változó leírására. Tipikus példa erre a szimmetria: egy eloszlás szimmetrikus, ha a centrális tendencia helyétől mindkét irányban nagyjából hasonló az eloszlási görbe lefutása. (Ha két változónak meg is egyezik a centrális tendenciája, és ugyanaz a szóródása, ettől még az egyik lehet szimmetrikus, míg a másik nem szimmetrikus.) A nem szimmetrikus eloszlásokat szokás ferde eloszlásoknak is nevezni; ezen belül is megkülönböztetünk balra ferde (jobbra hosszan elnyúló) és jobbra ferde (balra hosszan elnyúló) eloszlásokat, attól függően, hogy melyik irányban nagyobb a szóródás. További mutatók is léteznek, mint például a csúcsosság, a multimodalitás, de ezekkel itt nem foglalkozunk Grafikus eszközök A grafikus eszközök közül először a hisztogramot, utána röviden a magfüggvényes sűrűségbecslőt, végül a boxplotot tárgyaljuk. Hisztogram - A hisztogram leegyszerűsítve az osztályközös gyakorisági sor ábrázolása oszlopdiagramon, annyi specialitással, hogy az oszlopokat közvetlenül egymás mellé rajzoljuk, hely kihagyása nélkül (10.2. ábra bal oldala) ábra - Hisztogram és magfüggvényes sűrűségbecslése használata a születési tömeg változó grafikus vizsgálatára 10 A szakirodalom itt nem teljesen egyértelmű: néha MAD-nak nevezik azt a mutatót is, ahol csak az első javítást csinálják meg, tehát abszolútértéket vesznek, de azokat továbbra is csak átlagolják, és az eltéréseket is az átlagtól veszik. 150

163 Bevezetés a biostatisztikába Az ábrán látható, hogy az oszlopok határai kijelölik az osztályközöket (ezek természetesen nem feltétlenül azonos szélességűek); adott osztályköz fölé pedig magasságú oszlopokat rajzolunk, ahol h i az adott osztályköz szélessége. A bal oldali ábra x tengelyén feltüntettük (apró tüskéknek látszanak) magukat a nyers megfigyeléseket is (,,rugplot''). A hisztogram a legnépszerűbb adatvizualizációs módszer mennyiségi változókra. Ahogy már utaltunk rá, hatalmas előnye, hogy a vizuálisan közölt információ rendkívül jól feldolgozható az emberi agy számára: a fenti hisztogram alapján szinte,,ránézésre'', egyetlen pillantással jó képünk alakul ki a centrális tendenciáról, a szóródásról, sőt, az eloszlás alakjának finomabb jellemzőiről is. Egy átlagot még el sem olvastunk, amikorra a hisztogram alapján már olyan finom jellemzőkről is, mint az eloszlás szimmetriája, képünk van. Hátránya, hogy kevésbé objektív (ahogy a grafikus módszerek általában), mint a mutatószámok. Ha például két változót össze kell hasonlítanunk, akkor az két átlaggal (azaz két számmal) könnyebben megtehető mint két hisztogrammal. A legnagyobb kihívás azonban az osztályközök helyes megválasztása. Ez a probléma teljesen ugyanaz, mint amit az osztályközös gyakorisági sornál kifejtettünk. A probléma itt még jobban szemléltethető: a ábrán ugyanazt az adatsort ábrázoltuk háromféleképpen, az optimális módon és az optimálisnál lényegesen több, illetve lényegesen kevesebb osztályközt használva ábra - Az osztályközök számának megválasztása és a hisztogram alakja közti kapcsolat 151

164 Bevezetés a biostatisztikába Miért probléma az is, ha túl finom, és az is, ha túl durva felosztást választunk (adott, rögzített mintanagyság mellett.)? Ha az osztályközök száma túl kevés, akkor sok információt vesztünk: az eloszlásról kapott kép összemossa a finomabb részleteket (10.3. ábra, jobb oldal). Ha viszont túl sok osztályközt választunk, akkor rendkívül esetlegessé válik, hogy egy osztályközbe hány mintaelem esik, így nem a valóságos eloszlási hatást tükröző ingadozások lesznek az egyes oszlopok magasságában (10.3. ábra, bal oldal). Valamiféle optimumot kell találnunk a kettő között. Ennek módszereiről az osztályközös gyakorisági sornál már írtunk. Magfüggvényes sűrűségbecslő - A hisztogrammal kapcsolatos egyik probléma az előbb említett érzékenység az osztályközök megválasztására. Emellett felvethető problémaként az is, hogy a hisztogram szakaszonként konstans becslést ad, ami zavaró lehet (különösen, ha kicsi a mintanagyság, és emiatt nem tudunk sok osztályközt felvenni). Ez utóbbit kiküszöböli (és sok gyakorlati esetben az előbbit is enyhíti) az ún. magfüggvényes sűrűségbecslő (1.2. ábra, jobb oldal) alkalmazása. Ennek matematikai részleteivel nem foglalkozunk, megelégszünk annyival, hogy a hisztogramhoz hasonlóan az eloszlás alakját becsli, ám a hisztogramtól eltérően nem szakaszonként konstans görbével. Sajnos az osztályközök megválasztásának problémája teljesen nem oldódik meg, a magfüggvényes sűrűségbecslőnek is van ugyanis állítható paramétere (a magfüggvény és különösen az ún. sávszélesség). Ennek optimális megválasztása szintén probléma lehet (különösen, ha nagyon egyenetlen a mintaelemek eloszlása). (Tukey-féle) boxplot - Végül egy egész más elven felépülő, de szellemes, és a gyakorlatban is nagyon hasznos vizualizációs módszerrel ismerkedünk meg, a (Tukey-féle) boxplottal (vagy ritkán használt magyar nevén: dobozábrával). A boxplot (10.4. ábra) egy számegyenes fölé rajzolt téglalap, mely egy adott változót reprezentál úgy, hogy a téglalap alsó széle az alsó kvartilisnél (Q 1-nél), a felső széle pedig a felső kvartilisnél (Q 3-nál) van. A téglalapon belül egy vastagabb függőleges vonal is látható: ez a mediánnál található ábra - Boxplot használata a születési tömeg változó grafikus vizsgálatára 152

165 Bevezetés a biostatisztikába A boxplotból két,,antenna'' nyúlik ki felfelé és lefelé. A boxplot alapváltozatában ezek a mintaminimumig és mintamaximumig nyúlnak ki, de a némileg haladóbb megvalósításban (mint amit a ábra is mutat) az alsó antenna nem a minimumig terjed, hanem a legkisebb elemig, ami nem kisebb, mint Me - α IQR. Hasonlóképpen a felső antenna nem a maximumig terjed, hanem a legnagyobb elemig, ami nem nagyobb mint Me + α IQR. (α egy előre megadott konstans, tipikusan α = 1,5.) Azokat az elemeket melyek ezen kívül helyezkednek el, külön szimbólum (például kis karika) jelöli. E mögött az a megfontolás, hogy így a boxplot egyszerű outlier-szűrést is lehetővé tesz: azok az elemek minősülnek outliernek, melyek az antennákon kívül helyezkednek el. A boxplot jóval nagyobb információtömörítést hajt végre mint akár a hisztogram, akár a magfüggvényes becslő. Ez részint hátránya, bár gyakorlott szem számára ennek ellenére is meglehetősen sok információt hordoz az eloszlás alakjáról. Azonban ugyanez az előnye is, hiszen kompakt (ami különösen jól jön akkor, ha például több csoportot kell összehasonlítani). További nagy előnye, hogy - szemben mind a hisztogrammal, mind a magfüggvényes becslővel - semmilyen paraméter hangolását nem igényli, így a kinézete teljesen egyértelműen meghatározott Minőségi változók kétváltozós elemzése Minőségi változók kapcsolatát asszociációnak szokás nevezni a statisztikában. Erre jó példák adatbázisunk rassz (race) és irritábilis méh (ui) változói, melyek az alany rassz szerinti hovatartozását és az irritábilis méh szindróma fennállását adják meg Analitikus eszközök Ahogy már említettük, a kétváltozós vizsgálatok célszerűsége abban rejlik, hogy segítségükkel a változók kapcsolatáról is képesek leszünk megállapításokat tenni. Ahhoz, hogy precízen definiáljuk, mit értünk kapcsolaton, először bemutatjuk az ún. kontingenciatáblát (más néven kombinációs táblát vagy kereszttáblát), mely egyúttal az egyik legfontosabb analitikus eszköz is két minőségi változó kapcsolatának vizsgálatában. Ezt követően röviden beszélünk a kapcsolat jellemzésére használható mutatószámokról is. Kontingenciatábla - A kontingenciatábla egy olyan táblázat, melynek soraiban és oszlopaiban a két változó lehetséges kimenetelei vannak, az egyes cellákban pedig azon megfigyelési egységek darabszáma (tehát gyakorisága), melyek a cella sora és oszlopa szerinti kimenetűek a sorhoz illetve az oszlophoz rendelt változó szerint. A rassz és az irritábilis méh kontingenciatáblája a például vett adatbázis alapján a következő: Irritábilis méh Rassz Nem Igen Összesen Kaukázusi Afroamerikai Egyéb Összesen

166 Bevezetés a biostatisztikába Tehát 83 olyan megfigyelési egység van az adatbázisban, amelynél az anya rassza kaukázusi és nincs irritábilis méh szindrómája 12 egyéb rasszú, és irritábilis méh szindrómában szenvedő alany van, és így tovább. A kontingenciatábla szigorúan véve csak a 3 2 darab gyakoriságot jelenti; a mellé írt összegző sorban és oszlopban lévő gyakoriságok neve: perem- vagy vetületi gyakoriság. (Mindkét elnevezés logikus: perem, hiszen a kontingenciatábla peremére kell ezeket ráírni, és vetületi, hiszen úgy kaphatjuk, hogy a kontingenciatáblát levetítjük vízszintesen vagy függőlegesen,,levetítjük'', vetítésen itt azt értve, hogy az egymásra,,vetülő'' elemeket összeadjuk.) A 189 a mintanagyság. A fenti abszolút gyakoriságokon kívül természetesen relatív gyakoriságokról is beszélhetünk. A relatív gyakoriság definícióját közvetlenül alkalmazva mindegyik cellát elosztjuk a mintanagysággal. így például a bal felső cella értéke 83/189=43,9% lesz. Ez az irritábilis méh szindrómában szenvedő kaukázusiak aránya a teljes mintán belül. A relatív gyakoriságokkal kitöltött kontingenciatábla peremei a relatív peremgyakoriságok (vagy relatív vetületi gyakoriságok). Szokás ezt peremmegoszlásnak vagy vetületi megoszlásnak is nevezni. Kontingenciatábla esetén azonban van egy másik - logikus - mód arra, hogy relatív gyakoriságot értelmezzünk. A 43,9% megadja, hogy az összes alany mekkora hányada kaukázusi és irritábilis méh szindrómában nem szenvedő, de minket érdekelhet az is, hogy az irritábilis méh szindrómában nem szenvedők mekkora hányada kaukázusi. Ekkor a 83-at nem a 189-cel, hanem a 161-gyel osztjuk el: 83/161=51,6%. Ezt az értéket nevezzük feltételes relatív gyakoriságnak. Azért feltételes, mert ez a relatív gyakoriság azon feltétel mellett igaz, hogy valaki nem szenved irritábilis méh szindrómában. (Más szóval: ha feltesszük, hogy az alanyaink nem szenvednek irritábilis méh szindrómában akkor közöttük 51,6% a kaukázusiak aránya.) Ez természetesen kiszámolható a rassz változó másik két kimenetére is. így egy teljes (feltételes) relatív gyakorisági sort kapunk: 51,6%-14,3%-34,2%, melynek összege 100%. Szokás ezt a sorváltozó (esetünkben a rassz) feltételes megoszlásának is nevezni, az a oszlopváltozó (esetünkben az irritábilis méh) adott értéke (esetünkben:,,igen'') mint feltétel mellett. Természetesen ugyanezek kiszámolhatóak a jobb oldali oszlopra is, ami magyarul azt jelenti, hogy az irritábilis méh 'nem' kimenetére feltételezünk. Az eljárás ugyanez, azzal a különbséggel, hogy a jobb oldali számokat 28-cal kell elosztani. A feltételes relatív gyakoriság a gyakoriság adott peremgyakorisággal osztva. Természetesen nem csak az oszlopváltozóra feltételezhetünk. Pontosan ugyanígy van értelme beszélni az oszlopváltozó feltételes eloszlásáról a sorváltozó adott értéke, mint feltétel mellett. Például kijelenthetjük, hogy annak feltételes relatív gyakorisága, hogy egy alany nem szenved irritábilis méh szindrómában 83/96=86,5% azon feltétel mellett, hogy kaukázusi a rassza. Hasonlóan továbbmenve azt is mondhatjuk, hogy az irritábilis méh fennállásának feltételes megoszlása azon feltétel mellett, hogy az alany kaukázusi, 86,5% 13,5%. Összefoglalva az eddig elmondottakat: Egy cellához négyféle számot is rendelhetünk, a bal felső cella példáján: 83 (gyakoriság), 43,9% (relatív gyakoriság), 51,6% (feltételes relatív gyakoriság azon feltétel mellett, hogy nem áll fenn irritábilis méh szindróma) és 86,5% (feltételes relatív gyakoriság azon feltétel mellett, hogy a rassz kaukázusi). Mindezeket szemléltetik a táblázatok. Természetesen nem arról van szó, hogy bármelyik jobb lenne, mint a többi - egyszerűen más elemzési célra alkalmasak. A feltételes megoszlásokra gondolva, az is érdekes kérdés lehet, hogy a kaukázusiak mekkora hányada szenved irritábilis méh szindrómában, és az is érdekes (de más tartalmú) kérdés, hogy az irritábilis méh szindrómában szenvedők mekkora hányada kaukázusi rasszú. E gyakoriságok között egyszerű algebrai összefüggések állnak fenn, melyeket most nem részletezünk táblázat - Gyakoriságok (peremeken a vetületi gyakoriságokkal) Irritábilis méh Rassz Nem Igen Összesen Kaukázusi Afroamerikai Egyéb Összesen táblázat - Relatív gyakoriságok (peremeken a vetületi megoszlásokkal) Irritábilis méh Összesen 154

167 Bevezetés a biostatisztikába Rassz Nem Igen Kaukázusi 43,9% 6,9% 50,8% Afroamerikai 12,2% 1,6% 13,8% Egyéb 29,1% 6,3% 35,4% Összesen 85,2% 14,8% 100% táblázat - Rassz feltételes relatív gyakoriságai az irritábilis méh különböző kimenetei, mint feltétel esetén Irritábilis méh Rassz Nem Igen Összesen Kaukázusi 51,6% 46,4% - Afroamerikai 14,3% 10,7% - Egyéb 34,2% 42,9% - Összesen 100% 100% táblázat - Irritábilis méh feltételes relatív gyakoriságai a rassz különböző kimenetei, mint feltétel esetén Irritábilis méh Rassz Nem Igen Összesen Kaukázusi 86,5% 13,5% 100% Afroamerikai 88,5% 11,6% 100% Egyéb 82,1% 17,9% 100% Összesen Két dolgot érdemes ennek kapcsán megjegyezni. Az egyik, hogy az előzőek fényében a vetületi megoszlásokat joggal nevezhetjük (precízebben) a változó feltétel nélküli vetületi megoszlásának. A másik, hogy jobban belegondolva észrevehető, hogy az elsőként definiált,,szokásos'' relatív gyakoriság is,,gyakoriság / peremgyakoriság'' alakú (tehát megoszlás), csak éppen a peremgyakoriság nem a fenti,,egyszerű'' (egydimenziós) peremgyakoriság, hanem a peremgyakoriságok peremgyakorisága (nulladimenziós peremgyakoriság). Ezt szokás együttes megoszlásnak nevezni (szemben az eddig definiált feltételes megoszlással, és a feltétel nélküli, de vetületi megoszlással). A táblázatokból látható, hogy miért mondtuk, hogy a többváltozós elemzés az egyváltozós elemzések kiterjesztése. A fenti kétdimenziós kontingenciatáblákban minden információ benne van, amit a két változót külön-külön elemezve látnánk: ha levetítjük a kontingenciatáblát a megfelelő dimenziós mentén, a kapott vetületi gyakoriságok a vetítési irány változójának gyakorisági sorát alkotják, amiben minden információ benne van. Az tehát egyértelmű, hogy a kontingenciatábla tartalmazza mindazt az információt, amit a két változó különkülön végzett vizsgálata - csakhogy mi azt állítottuk, hogy többet is. Ez vezet el a változók kapcsolatának kérdéséhez. Minőségi változók esetében (kontingenciatáblán) akkor mondjuk, hogy két változó kapcsolatban van egymással, ha a sorváltozó feltételes megoszlásai ugyanazok, az oszlopváltozó bármely értékére is feltételezünk. Vagy - ami ezzel egyenértékű --: az oszlopváltozó feltételes megoszlásai ugyanazok, a sorváltozó bármely értékére is feltételezünk. (Belátható matematikailag, hogy a kettő valóban egyenértékű: ha az oszlopváltozó feltételes megoszlásai ugyanazok minden sorban, akkor a sorváltozó feltételes megoszlásai is ugyanazok minden oszlopban, és fordítva is, ha az oszlopváltozó feltételes megoszlásai nem ugyanazok minden sorban, akkor a sorváltozó feltételes megoszlásai sem ugyanazok minden oszlopban.) Általánosságban véve is, az, hogy két változó között nincs kapcsolat, azt jelenti statisztikai nyelven, hogy az egyikre vonatkozó információból nem nyerünk információt a másikra vonatkozóan. Így már érthető ez a kontingenciatáblákra alkalmazott definíció: ha nincs kapcsolat, akkor hiába mondjak meg valaki, hogy mi - 155

168 Bevezetés a biostatisztikába például - a sorváltozó értéke, ebből semmit nem tudunk meg az oszlopváltozó feltételes megoszlásáról (hiszen az minden sorban ugyanaz!). Ha van kapcsolat, akkor nyerünk plusz-információt (hiszen más lesz a feltételes megoszlása). Látható, hogy ebben az esetben csak nagyon gyenge kapcsolatról beszélhetünk: a sorváltozó feltételes megoszlása mindkét oszlopban (precízen: az oszlopváltozó mindkét kimenetére feltételezve) nagyjából ugyanaz (kb. 50%, kb. 10%, kb. 40%), és az oszlopváltozó feltételes megoszlása is nagyjából ugyanaz mindhárom sorban (kb. 85% és kb. 15%). Ahogy már elmondtuk, az előbbi mondat bármelyik feléből automatikusan következik a másik fele. Itt tehát szemléletesen is látható a kapcsolat hiányának tartalma: hiába is mondja meg valaki, hogy az alany rassza kaukázusi, afroamerikai vagy egyéb, szinte ugyanúgy csak azt tudjuk mondani, hogy akkor 85%- -15% a megoszlás az irritábilis méh szindróma előfordulása szerint. A rasszra vonatkozó információ nem adott szinte semmilyen információt a másik változóról. Képzeljünk el ezzel szemben - másik végletként - egy olyan esetet, melyben a 189 alany közül 100 kaukázusi irritábilis méh szindróma nélkül, és 89 egyéb rasszú irritábilis méh szindrómával. Ebben az esetben az egyik változóra vonatkozó információ nemcsak elárul valamit a másik változóról, hanem egyenesen determinálja azt: ha valaki elárulja, hogy egy alany kaukázusi rasszú, akkor biztosan tudjuk, hogy nem szenved irritábilis méh szindrómában, ha pedig azt mondja, hogy egyéb rasszú, akkor rögtön tudjuk, hogy szenved ebben. (Természetesen itt is igaz, hogy a dolog fordítva is működik: ha tudjuk, hogy egy alany nem szenved irritábilis méh szindrómában, akkor azonnal tudjuk, hogy kaukázusi, ha pedig nem szenved ebben, akkor biztos, hogy egyéb rasszú.) Ez a kapcsolat fennállásának másik szélsőséges esete. Zárásként megjegyezzük, hogy a statisztikában valójában nem így szokták bevezetni a kapcsolat fogalmát, hanem úgy, mint azt az esetet, amikor a két változó nem független egymástól; függetlenségen pedig azt értik, hogy az együttes megoszlás a vetületi megoszlások szorzataként áll elő. Érdemes végiggondolni, hogy ez valóban egybeesik a hétköznapi,,függetlenség'' fogalommal. Szintén érdemes végiggondolni, hogy ebből valóban következik a fenti definíció, de ezzel részletesebben nem foglalkozunk most. Mutatószámok - A kapcsolat erősségének mérésére több mutatót is definiáltak a statisztikusok. Ha a változók nominálisak, akkor csak a kapcsolat erősségének mérésére van lehetőség. Ha azonban a változók ordinálisak, akkor értelmet nyer a kapcsolat irányának fogalma is. Ordinális változók esetén ugyanis a sorok és oszlopok sorrendje nem tetszőleges, van értelme mindkét változó szerint,,nagyobb'' és,,kisebb'' kimenetről beszélni. Ez esetben nemcsak azt mondhatjuk, hogy van kapcsolat, ha más oszlopban más a feltételes megoszlás, hanem azt is, hogy nagyobb oszlopban a feltételes megoszlás úgy más, hogy inkább nagyobb sorbeli érték szerepelnek benne, vagy épp úgy, hogy inkább kisebbek. (Itt is egyenértékű, ha ugyanezt a sorok és oszlopok fordított szerepével mondjuk el.) Ezt ragadja meg a kapcsolat irányának fogalma: ha van kapcsolat (nem 0 az erőssége), akkor az pozitív, ha az oszlopváltozó szerinti nagyobb érték tendenciájában a sorváltozó szerinti nagyobb értékkel jár együtt (és fordítva), és negatív a kapcsolat, ha az oszlopváltozó szerinti nagyobb érték tendenciájában a sorváltozó szerint kisebb értékkel jár együtt (és fordítva). Ordinális változónál erről is lehet mutatókat képezni, de a konkrét mutatószámokkal itt nem foglalkozunk Grafikus eszközök Kontingenciatáblát vizualizálni ún. mozaikábrával és asszociációs ábrával lehet, ezek azonban nem túl látványos, és emiatt nem is túl gyakran használt módszerek, így most mi sem részletezzük ezeket. Bevettebb a vetületi megoszlások (vagy nevezetes feltételes megoszlások) ábrázolása egyszerű oszlopdiagramon (vagy kördiagramon). Ez ugyanaz a feladat, mint amit a minőségi változók egyváltozós elemzésénél már megbeszéltünk Mennyiségi változók kétváltozós elemzése Mennyiségi változók kapcsolatát korrelációnak szokás nevezni a statisztikában. Erre jó példák adatbázisunk anyai testtömeg (lwt) és újszülött születési tömege (bwt) változói, melyek az anya illetve az újszülött testtömegét tartalmazzák Analitikus eszközök A kapcsolat fogalmát mennyiségi változókra is ugyanazon gondolatot követve értelmezzük, mint amit minőségi változóknál már láttunk. Két változó pozitív kapcsolatban van egymással, ha az egyik változó átlag feletti 156

169 Bevezetés a biostatisztikába értékei tendenciájukban a másik változó átlag feletti értékeivel járnak együtt (és fordítva is: az egyik változó átlag alatti értékei tendenciájukban a másik változó átlag alatti értékeivel járnak együtt). Azaz: ha egy megfigyelési egység értéke az egyik változó szerint átlag feletti, akkor várhatóan a másik változó szerint is átlag feletti 11 lesz. Negatív kapcsolat esetén az egyik változó átlag feletti értékei tendenciájukban a másik átlag alatti értékeivel járnak együtt, és fordítva. A,,tendenciájukban'' kifejezés azért indokolt, mert a kapcsolat sztochasztikus: nem arról van szó, hogy ha a megfigyelési egység egyik változója átlag feletti értékű, akkor biztos, hogy a másik is az, de az esetek többségében érvényesül ez a tendencia. Két mennyiségi változó fent definiált kapcsolatát klasszikusan a kovarianciával szokás mérni. Ennek definíciója: A számítás logikája vegytisztán tükrözi a definíciót: az tükrözi az egyik, az a másik változó szerint azt, hogy az adott megfigyelési egység átlag alatti vagy átlag feletti értékű. A két tag szorzata akkor lesz pozitív, ha vagy mindkét változó szerint átlag feletti a megfigyelési egység, vagy mindkét változó szerint átlag alatti - azaz ha az adott megfigyelési egység a pozitív kapcsolatot erősíti meg. Ha a szorzat negatív, akkor az adott megfigyelési egység a negatív kapcsolatot erősíti. A szorzat nagysága azt fejezi ki, hogy mennyire erősít meg bennünket az adott megfigyelési egység a kapcsolat fennállásában. Ha a megfigyelési egység az egyik (és főleg, ha mindkét) változó szerint közel van az átlaghoz, akkor az csak gyenge,,bizonyíték'' a kapcsolat létezése mellett (lehet, hogy kis módosulással az ellenkező irányú kapcsolatot erősítené), viszont ha mindkét változó szerint távol van az átlagtól, az erős érv a kapcsolat fennállása mellett. A szummázás ezeket a hatásokat adja össze megfigyelési egységről megfigyelési egységre, így az előjele a kapcsolat irányát mutatja, az abszolút értéke pedig annak erősségét. (Az n-nel való osztás nélkül a kétszer megismételt adatbázison kétszer akkora lenne a kovariancia, holott az információ ugyanaz; tehát ezeket a szorzatokat átlagolni kell.) A példaként használt adatbázisban az anyai és az újszülött testtömeg közti kovariancia 4141,7. Tehát az anyai és az újszülött testtömeg között van kapcsolat, mégpedig pozitív irányú (nagyobb anyai tömeg nagyobb újszülött tömeggel jár együtt, és fordítva), hiszen az előjel pozitív. Amiről viszont lényegében semmit nem tudunk meg, az a kapcsolat erőssége. (Annál is inkább, mert a kovariancia mértékegység-függő: más értéket kapunk, ha az újszülött testtömegét nem grammban, hanem kilogrammban rögzítjük. Tekintetbe véve, hogy az információ ettől még ugyanaz marad, ez nyilván nem szerencsés.) A probléma tehát az, hogy honnan tudhatnánk, hogy a 4141,7 sok vagy kevés? Ebben segít minket az a matematikai észrevétel, hogy mindenképp fennáll a összefüggés, tehát a kovariancia abszolút értéke nem lehet nagyobb, mint a két változó szórásának szorzata. Így már van mihez viszonyítani a kovariancia nagyságát. Ez tehát a következő mutató definiáláshoz vezet, melynek neve korreláció (vagy a statisztikában inkább korrelációs együttható): Ez az előjel értelmezésén semmit nem változtat, hiszen a kovariancia előjelét meghagyja (a nevezőben szórások szerepelnek, így mindkét szórás szükségképp pozitív), viszont az abszolút értéket értelmezhetővé teszi, hiszen a korrelációra már teljesül, hogy a két változó közötti kapcsolat. A korreláció tehát minél közelebb van ± 1-hez, annál erősebb Adatbázisunkban az anyai testtömeg és az újszülött születési tömege közti korrelációs együttható értéke 0,186. Ez alapján nemcsak azt tudjuk mondani, hogy van kapcsolat és az pozitív irányú (a 0,186 előjele pozitív), hanem azt is, hogy ez a kapcsolat igen gyenge (ha elhelyezzük a 0,186-ot a 0 és az 1 között). 11 Az átlag itt minden esetben a szóban forgó változó átlagát jelenti. A használatára azért van szükség (és azért nem mondhatjuk egyszerűen azt, hogy,,a változó nagy értékei''), mert hozzáadva valamilyen nagy konstanst a változóhoz, annak összes értéke nagy lesz, tehát mindenképp valamilyen viszonyításra van szükség. 157

170 Bevezetés a biostatisztikába Az így definiált korrelációs együttható a lineáris kapcsolat erősségét méri (szokás emiatt lineáris korrelációs együtthatónak is nevezni). Ha a korreláció abszolút érték 1, az azt jelenti, hogy y = ax + b függvényszerű kapcsolat van a két változó között. általában véve is a korreláció erősségét úgy kell érteni, hogy mennyire szorosan valósul meg az egyenesre illeszkedés. Fontos megjegyezni, hogy másféle kapcsolat erősségét nem méri ez az együttható, tehát lehet nemlineáris kapcsolat lehet a két változó között (extrém esetben akár függvényszerű is), úgy, hogy közben a lineáris korrelációs együttható értéke nulla. Erre tekintettel szokás más korrelációs együtthatókat is definiálni. Ezek közül megemlítjük a Spearman-ρ és a Kendall-η mutatókat, melyek ún. rangkorrelációs mutatók, s amelyek nem konkrétan lineáris, hanem általános monoton kapcsolat erősségét mérik. (Cserébe ezeknek is (hasonlóan az átlag - medián helyzethez) némileg rosszabbak a mintavételi tulajdonságaik, pontosabban szólva kevésbé hatásosak, ami ezúttal is csak induktív statisztikai keretben (lásd a alfejezetet) érthető meg pontosan.) Itt is igaz, hogy a kapcsolat erőssége azzal van összefüggésben, hogy az egyik változó ismerete mennyi információt árul el a másik változóról (természetesen sztochasztikus értelemben). Végül egy figyelmeztetés. Mint általában, itt is igaz, hogy a mutatószám használata nagyon nagy információtömörítést jelent. Éppen ezért ne támaszkodjunk önmagában egy korrelációs együtthatóra (és különösen ne önmagában egy lineáris korrelációs együtthatóra) két változó kapcsolatának megítéléséhez, hiszen ez elfedi az esetleges nemlineáris kapcsolatokat, az outliereket stb. Erre egy nevezetes példa az ún. Anscombekvartett, amelyet hamarosan bemutatunk Grafikus eszközök Két mennyiségi változó kapcsolatának legfontosabb ábrázolási eszköze az ún. szóródási diagram. A szóródási diagramot úgy kapjuk, hogy minden megfigyelési egységnek egy pontot feleltetünk meg a síkban, úgy, hogy a pont egyik koordinátája a megfigyelési egység egyik, a másik koordinátája a másik változó szerinti értéke. (Tehát lényegében a megfigyelési egységhez tartozó változókat koordinátáknak tekintjük, és ezeket mérjük fel egy kétdimenziós koordináta--rendszer két tengelyére.) Az anyai és újszülött testtömeg szóródási diagramját a ábra mutatja. Az ábrán bejelöltük (szaggatott vonallal, a két tengellyel párhuzamosan) a két változó átlagát is ábra - Anyai és újszülött testtömeg szóródási diagramja. A függőleges és vízszintes szaggatott vonalak a két változó átlagát mutatják, a pontvonal pedig az az egyenes, melyre legjobban illeszkednek a pontok. 158

171 Bevezetés a biostatisztikába Immár grafikusan is látható, hogy mit értünk a két változó közötti kapcsolat fogalmán: a pontok tendenciájukban a szaggatott vonalak által kijelölt koordináta-rendszer jobb felső és bal alsó kvadránsában találhatóak (átlag feletti - átlag feletti és átlag alatti - átlag alatti zónák). Látszik az is, hogy a kapcsolat sztochasztikus, azaz van pont a több kvadránsban is (itt különösen sok van, hiszen a kapcsolat nem túl erős). Ne feledjük, hogy nemcsak a pontok darabszáma számít, hanem a konkrét helyzetük is (mennyire erősíti meg a kapcsolat fennállását). Az ábrán berajzoltuk a pontokra legjobban illeszkedő egyenest is. Ahogy említettük, a kapcsolat erőssége azt jelenti, hogy a megfigyelési egységeket reprezentáló pontok mennyire szorosan illeszkednek a rájuk legjobban illeszkedő egyenesre (látható, hogy itt nem túl szorosan). A ábra különböző korrelációs együtthatójú (azaz kq" ulönböző irányú és erősségű) kapcsolatokra mutat be példákat (különböző előjelekkel és abszolút értékekkel) ábra - Példák különböző előjelű és abszolút értékű korrelációs együtthatójú (azaz különböző irányú és erősségű) kapcsolatokra A grafikus ábrázolás előnye, hogy (szemben a korrelációs együtthatóval) nem okoz gondot semmilyen outlier vagy nemlineáris kapcsolat - ezek mind láthatóak lesznek az ábrán. A grafikus ábrázolás jelentőségére mutat példát a nevezetes Anscombe-kvartett (10.7. ábra). Az ábrák négy kétváltozós adatsor szóródási diagramját mutatják. Mindegyiknek hajszálpontosan ugyanaz a korrelációs együtthatója (sőt, az átlaguk és a szórásuk is megegyezik - így ugyanaz a rájuk legjobban illeszkedő egyenes is), pedig az adatsorok drámaian különböznek. Outlierek, nemlineáris kapcsolatok vannak jelen. Ez azonban csak az ábrázolás után derül ki, a korrelációs együttható használata mindezt teljesen elfedné ábra - Az Anscombe-kvartett 159

A könyv. meglétét. sgálat

A könyv. meglétét. sgálat Benyó Balázs Benyó Zoltán Paláncz Béla Szilágyi László Ferenci Tamás Műszaki és biológiai rendszerek elmélete A könyv interdiszciplináris jellegű, műszaki és biológiai rendszerek működésének modellezésére

Részletesebben

Számítógépes gyakorlat MATLAB, Control System Toolbox

Számítógépes gyakorlat MATLAB, Control System Toolbox Számítógépes gyakorlat MATLAB, Control System Toolbox Bevezetés A gyakorlatok célja az irányítási rendszerek korszerű számítógépes vizsgálati és tervezési módszereinek bemutatása, az alkalmazáshoz szükséges

Részletesebben

ÁRAMKÖRÖK SZIMULÁCIÓJA

ÁRAMKÖRÖK SZIMULÁCIÓJA ÁRAMKÖRÖK SZIMULÁCIÓJA Az áramkörök szimulációja révén betekintést nyerünk azok működésébe. Meg tudjuk határozni az áramkörök válaszát különböző gerjesztésekre, különböző üzemmódokra. Végezhetők analóg

Részletesebben

Irányítástechnika 2. előadás

Irányítástechnika 2. előadás Irányítástechnika 2. előadás Dr. Kovács Levente 2013. 03. 19. 2013.03.19. Tartalom Tipikus vizsgálójelek és azok információtartalma Laplace transzformáció, állapotegyenlet, átviteli függvény Alaptagok

Részletesebben

Gépészeti rendszertechnika (NGB_KV002_1)

Gépészeti rendszertechnika (NGB_KV002_1) Gépészeti rendszertechnika (NGB_KV002_1) 3. Óra Kőrös Péter Közúti és Vasúti Járművek Tanszék Tanszéki mérnök (IS201 vagy a tanszéken) E-mail: korosp@ga.sze.hu Web: http://www.sze.hu/~korosp http://www.sze.hu/~korosp/gepeszeti_rendszertechnika/

Részletesebben

Márkus Zsolt Tulajdonságok, jelleggörbék, stb BMF -

Márkus Zsolt Tulajdonságok, jelleggörbék, stb BMF - Márkus Zsolt markus.zsolt@qos.hu Tulajdonságok, jelleggörbék, stb. 1 A hatáslánc részegységekből épül fel, melyek megvalósítják a jelátvitelt. A jelátviteli sajátosságok jellemzésére (leírására) létrehozott

Részletesebben

FOLYAMATIRÁNYÍTÁSI RENDSZEREK

FOLYAMATIRÁNYÍTÁSI RENDSZEREK Budapesti Műszaki és Gazdaságtudományi Egyetem Vegyészmérnöki és Biomérnöki Kar Kémiai és Környezeti Folyamatmérnöki Tanszék Írta: MIZSEY PÉTER Lektorálta: BÉKÁSSYNÉ MOLNÁR ERIKA FOLYAMATIRÁNYÍTÁSI RENDSZEREK

Részletesebben

Bevezetés az állapottér-elméletbe Dinamikus rendszerek állapottér reprezentációi

Bevezetés az állapottér-elméletbe Dinamikus rendszerek állapottér reprezentációi Tartalom Bevezetés az állapottér-elméletbe Irányítható alak Megfigyelhetőségi alak Diagonális alak Állapottér transzformáció 2018 1 A szabályozáselmélet klasszikus, BODE, NICHOLS, NYQUIST nevéhez kötődő,

Részletesebben

DIFFERENCIÁLEGYENLETEK. BSc. Matematika II. BGRMA2HNND, BGRMA2HNNC

DIFFERENCIÁLEGYENLETEK. BSc. Matematika II. BGRMA2HNND, BGRMA2HNNC BSC MATEMATIKA II. MÁSODRENDŰ LINEÁRIS DIFFERENCIÁLEGYENLETEK BSc. Matematika II. BGRMAHNND, BGRMAHNNC MÁSODRENDŰ DIFFERENCIÁLEGYENLETEK Egy explicit közönséges másodrendű differenciálegyenlet általános

Részletesebben

Jelek és rendszerek 1. 10/9/2011 Dr. Buchman Attila Informatikai Rendszerek és Hálózatok Tanszék

Jelek és rendszerek 1. 10/9/2011 Dr. Buchman Attila Informatikai Rendszerek és Hálózatok Tanszék Jelek és rendszerek 1 10/9/2011 Dr. Buchman Attila Informatikai Rendszerek és Hálózatok Tanszék 1 Ajánlott irodalom: FODOR GYÖRGY : JELEK ÉS RENDSZEREK EGYETEMI TANKÖNYV Műegyetemi Kiadó, Budapest, 2006

Részletesebben

Segédlet a gyakorlati tananyaghoz GEVAU141B, GEVAU188B c. tantárgyakból

Segédlet a gyakorlati tananyaghoz GEVAU141B, GEVAU188B c. tantárgyakból Segédlet a gyakorlati tananyaghoz GEVAU141B, GEVAU188B c. tantárgyakból 1 Átviteli tényező számítása: Lineáris rendszer: Pl1.: Egy villanymotor 100V-os bemenő jelre 1000 fordulat/perc kimenő jelet ad.

Részletesebben

Történeti Áttekintés

Történeti Áttekintés Történeti Áttekintés Történeti Áttekintés Értesülés, Információ Érzékelő Ítéletalkotó Értesülés, Információ Anyag, Energia BE Jelformáló Módosító Termelőeszköz Folyamat Rendelkezés Beavatkozás Anyag,

Részletesebben

Ellenőrző kérdések a Jelanalízis és Jelfeldolgozás témakörökhöz

Ellenőrző kérdések a Jelanalízis és Jelfeldolgozás témakörökhöz Ellenőrző kérdések a Jelanalízis és Jelfeldolgozás témakörökhöz 1. Hogyan lehet osztályozni a jeleket időfüggvényük időtartama szerint? 2. Mi a periodikus jelek definiciója? (szöveg, képlet, 3. Milyen

Részletesebben

Tartalom. 1. Állapotegyenletek megoldása 2. Állapot visszacsatolás (pólusallokáció)

Tartalom. 1. Állapotegyenletek megoldása 2. Állapot visszacsatolás (pólusallokáció) Tartalom 1. Állapotegyenletek megoldása 2. Állapot visszacsatolás (pólusallokáció) 2015 1 Állapotgyenletek megoldása Tekintsük az ẋ(t) = ax(t), x(0) = 1 differenciálegyenletet. Ismert, hogy a megoldás

Részletesebben

DINAMIKAI VIZSGÁLAT OPERÁTOROS TARTOMÁNYBAN. 2003.10.30. Dr. Aradi Petra, Dr. Niedermayer Péter: Rendszertechnika segédlet 1

DINAMIKAI VIZSGÁLAT OPERÁTOROS TARTOMÁNYBAN. 2003.10.30. Dr. Aradi Petra, Dr. Niedermayer Péter: Rendszertechnika segédlet 1 DINAMIKAI VIZSGÁLAT OPERÁTOROS TARTOMÁNYBAN 2003.10.30. Dr. Aradi Petra, Dr. Niedermayer Péter: Rendszertechnika segédlet 1 Differenciálegyenlet megoldása u(t) diff. egyenlet v(t) a n d n v m dt a dv n

Részletesebben

Villamosságtan szigorlati tételek

Villamosságtan szigorlati tételek Villamosságtan szigorlati tételek 1.1. Egyenáramú hálózatok alaptörvényei 1.2. Lineáris egyenáramú hálózatok elemi számítása 1.3. Nemlineáris egyenáramú hálózatok elemi számítása 1.4. Egyenáramú hálózatok

Részletesebben

PTE PMMFK Levelező-távoktatás, villamosmérnök szak

PTE PMMFK Levelező-távoktatás, villamosmérnök szak PTE PMMFK Levelező-távoktatás, villamosmérnök szak MATEMATIKA (A tantárgy tartalma és a tananyag elsajátításának időterve.) Összeállította: Kis Miklós adjunktus Tankönyvek Megegyeznek az 1. és 2. félévben

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,

Részletesebben

L-transzformáltja: G(s) = L{g(t)}.

L-transzformáltja: G(s) = L{g(t)}. Tartalom 1. Stabilitáselmélet stabilitás feltételei inverz inga egyszerűsített modellje 2. Zárt, visszacsatolt rendszerek stabilitása Nyquist stabilitási kritérium Bode stabilitási kritérium 2018 1 Stabilitáselmélet

Részletesebben

Mechatronika alapjai órai jegyzet

Mechatronika alapjai órai jegyzet - 1969-ben alakult ki a szó - Rendszerek és folyamatok, rendszertechnika - Automatika, szabályozás - számítástechnika Cd olvasó: Dia Mechatronika alapjai órai jegyzet Minden mechatronikai rendszer alapstruktúrája

Részletesebben

Folytonos rendszeregyenletek megoldása. 1. Folytonos idejű (FI) rendszeregyenlet általános alakja

Folytonos rendszeregyenletek megoldása. 1. Folytonos idejű (FI) rendszeregyenlet általános alakja Folytonos rendszeregyenletek megoldása 1. Folytonos idejű (FI) rendszeregyenlet általános alakja A folytonos rendszeregyenletek megoldásakor olyan rendszerekkel foglalkozunk, amelyeknek egyetlen u = u(t)

Részletesebben

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31. Regresszió Csorba János Nagyméretű adathalmazok kezelése 2010. március 31. A feladat X magyarázó attribútumok halmaza Y magyarázandó attribútumok) Kérdés: f : X -> Y a kapcsolat pár tanítópontban ismert

Részletesebben

Hangfrekvenciás mechanikai rezgések vizsgálata

Hangfrekvenciás mechanikai rezgések vizsgálata Hangfrekvenciás mechanikai rezgések vizsgálata (Mérési jegyzőkönyv) Hagymási Imre 2007. május 7. (hétfő délelőtti csoport) 1. Bevezetés Ebben a mérésben a szilárdtestek rugalmas tulajdonságait vizsgáljuk

Részletesebben

Mérés és modellezés Méréstechnika VM, GM, MM 1

Mérés és modellezés Méréstechnika VM, GM, MM 1 Mérés és modellezés 2008.02.04. 1 Mérés és modellezés A mérnöki tevékenység alapeleme a mérés. A mérés célja valamely jelenség megismerése, vizsgálata. A mérés tervszerűen végzett tevékenység: azaz rögzíteni

Részletesebben

Gibbs-jelenség viselkedésének vizsgálata egyszer négyszögjel esetén

Gibbs-jelenség viselkedésének vizsgálata egyszer négyszögjel esetén Matematikai modellek, I. kisprojekt Gibbs-jelenség viselkedésének vizsgálata egyszer négyszögjel esetén Unger amás István B.Sc. szakos matematikus hallgató ungert@maxwell.sze.hu, http://maxwell.sze.hu/~ungert

Részletesebben

RENDSZERTECHNIKA 8. GYAKORLAT

RENDSZERTECHNIKA 8. GYAKORLAT RENDSZERTECHNIKA 8. GYAKORLAT ÜTEMTERV VÁLTOZÁS Gyakorlat Hét Dátum Témakör Házi feladat Egyéb 1 1. hét 02.09 Ismétlés, bevezetés Differenciálegyenletek mérnöki 2 2. hét 02.16 szemmel 1. Hf kiadás 3 3.

Részletesebben

Méréselmélet MI BSc 1

Méréselmélet MI BSc 1 Mérés és s modellezés 2008.02.15. 1 Méréselmélet - bevezetés a mérnöki problémamegoldás menete 1. A probléma kitűzése 2. A hipotézis felállítása 3. Kísérlettervezés 4. Megfigyelések elvégzése 5. Adatok

Részletesebben

Irányítástechnika II. előadásvázlat

Irányítástechnika II. előadásvázlat Irányítástechnika II. előadásvázlat Dr. Bokor József egyetemi tanár, az MTA rendes tagja BME Közlekedés- és Járműirányítási Tanszék 2018 1 Tartalom Irányítástechnika II. féléves tárgytematika Az irányításelmélet

Részletesebben

Négypólusok tárgyalása Laplace transzformációval

Négypólusok tárgyalása Laplace transzformációval Négypólusok tárgyalása Laplace transzformációval Segédlet az Elektrotechnika II. c. tantárgyhoz Összeállította: Dr. Kurutz Károly egyetemi tanár Szászi István egyetemi tanársegéd . Laplace transzformáció

Részletesebben

Mechanika I-II. Példatár

Mechanika I-II. Példatár Budapesti Műszaki és Gazdaságtudományi Egyetem Műszaki Mechanika Tanszék Mechanika I-II. Példatár 2012. május 24. Előszó A példatár célja, hogy támogassa a mechanika I. és mechanika II. tárgy oktatását

Részletesebben

MECHATRONIKA Mechatronika alapképzési szak (BSc) záróvizsga kérdései. (Javítás dátuma: )

MECHATRONIKA Mechatronika alapképzési szak (BSc) záróvizsga kérdései. (Javítás dátuma: ) MECHATRONIKA 2010 Mechatronika alapképzési szak (BSc) záróvizsga kérdései (Javítás dátuma: 2016.12.20.) A FELKÉSZÜLÉS TÉMAKÖREI A számozott vizsgakérdések a rendezett felkészülés érdekében vastag betűkkel

Részletesebben

Mérés és modellezés 1

Mérés és modellezés 1 Mérés és modellezés 1 Mérés és modellezés A mérnöki tevékenység alapeleme a mérés. A mérés célja valamely jelenség megismerése, vizsgálata. A mérés tervszerűen végzett tevékenység: azaz rögzíteni kell

Részletesebben

Matematikai háttér. 3. Fejezet. A matematika hozzászoktatja a szemünket ahhoz, hogy tisztán és világosan lássa az igazságot.

Matematikai háttér. 3. Fejezet. A matematika hozzászoktatja a szemünket ahhoz, hogy tisztán és világosan lássa az igazságot. 3. Fejezet Matematikai háttér A matematika hozzászoktatja a szemünket ahhoz, hogy tisztán és világosan lássa az igazságot René Descartes Számtalan kiváló szakirodalom foglalkozik a különféle differenciálegyenletek

Részletesebben

Differenciálegyenletek. Vajda István március 4.

Differenciálegyenletek. Vajda István március 4. Analízis előadások Vajda István 2009. március 4. Függvényegyenletek Definíció: Az olyan egyenleteket, amelyekben a meghatározandó ismeretlen függvény, függvényegyenletnek nevezzük. Függvényegyenletek Definíció:

Részletesebben

2. REZGÉSEK Harmonikus rezgések: 2.2. Csillapított rezgések

2. REZGÉSEK Harmonikus rezgések: 2.2. Csillapított rezgések . REZGÉSEK.1. Harmonikus rezgések: Harmonikus erő: F = D x D m ẍ= D x (ezt a mechanikai rendszert lineáris harmonikus oszcillátornak nevezik) (Oszcillátor körfrekvenciája) ẍ x= Másodrendű konstansegyütthatós

Részletesebben

Biomatematika 2 Orvosi biometria

Biomatematika 2 Orvosi biometria Biomatematika 2 Orvosi biometria 2017.02.05. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)

Részletesebben

ÉRZÉKELŐK ÉS BEAVATKOZÓK II. 5. DC MOTOROK SZABÁLYOZÁS FORDULATSZÁM- SZABÁLYOZÁS

ÉRZÉKELŐK ÉS BEAVATKOZÓK II. 5. DC MOTOROK SZABÁLYOZÁS FORDULATSZÁM- SZABÁLYOZÁS ÉRZÉKELŐK ÉS BEAVATKOZÓK II. 5. DC MOTOROK SZABÁLYOZÁS FORDULATSZÁM- SZABÁLYOZÁS Dr. Soumelidis Alexandros 2019.03.13. BME KÖZLEKEDÉSMÉRNÖKI ÉS JÁRMŰMÉRNÖKI KAR 32708-2/2017/INTFIN SZÁMÚ EMMI ÁLTAL TÁMOGATOTT

Részletesebben

25/1. Stacionárius és tranziens megoldás. Kezdeti és végérték tétel.

25/1. Stacionárius és tranziens megoldás. Kezdeti és végérték tétel. 25/1. Stacionárius és tranziens megoldás. Kezdeti és végérték tétel. A gerjesztı jelek hálózatba történı be- vagy kikapcsolása után átmeneti (tranziens) jelenség játszódik le. Az állandósult (stacionárius)

Részletesebben

Gépi tanulás és Mintafelismerés

Gépi tanulás és Mintafelismerés Gépi tanulás és Mintafelismerés jegyzet Csató Lehel Matematika-Informatika Tanszék BabesBolyai Tudományegyetem, Kolozsvár 2007 Aug. 20 2 1. fejezet Bevezet A mesterséges intelligencia azon módszereit,

Részletesebben

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis 1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb

Részletesebben

Mérés és adatgyűjtés

Mérés és adatgyűjtés Mérés és adatgyűjtés 4. óra Mingesz Róbert Szegedi Tudományegyetem 2012. február 27. MA - 4. óra Verzió: 2.1 Utolsó frissítés: 2012. március 12. 1/41 Tartalom I 1 Jelek 2 Mintavételezés 3 A/D konverterek

Részletesebben

x 2 e x dx c) (3x 2 2x)e 2x dx x sin x dx f) x cosxdx (1 x 2 )(sin 2x 2 cos 3x) dx e 2x cos x dx k) e x sin x cosxdx x ln x dx n) (2x + 1) ln 2 x dx

x 2 e x dx c) (3x 2 2x)e 2x dx x sin x dx f) x cosxdx (1 x 2 )(sin 2x 2 cos 3x) dx e 2x cos x dx k) e x sin x cosxdx x ln x dx n) (2x + 1) ln 2 x dx Integrálszámítás II. Parciális integrálás. g) i) l) o) e ( + )(e e ) cos h) e sin j) (sin 3 cos) m) arctg p) arcsin e (3 )e sin f) cos ( )(sin cos 3) e cos k) e sin cos ln n) ( + ) ln. e 3 e cos 3 3 cos

Részletesebben

Elhangzott tananyag óránkénti bontásban

Elhangzott tananyag óránkénti bontásban TTK, Matematikus alapszak Differenciálegyenletek (Előadás BMETE93AM03; Gyakorlat BME TE93AM04) Elhangzott tananyag óránkénti bontásban 2016. február 15. 1. előadás. Közönséges differenciálegyenlet fogalma.

Részletesebben

Mérési struktúrák

Mérési struktúrák Mérési struktúrák 2007.02.19. 1 Mérési struktúrák A mérés művelete: a mérendő jellemző és a szimbólum halmaz közötti leképezés megvalósítása jel- és rendszerelméleti aspektus mérési folyamat: a leképezést

Részletesebben

2. (b) Hővezetési problémák. Utolsó módosítás: február25. Dr. Márkus Ferenc BME Fizika Tanszék

2. (b) Hővezetési problémák. Utolsó módosítás: február25. Dr. Márkus Ferenc BME Fizika Tanszék 2. (b) Hővezetési problémák Utolsó módosítás: 2013. február25. A változók szétválasztásának módszere (5) 1 Az Y(t)-re vonakozó megoldás: Így: A probléma megoldása n-re összegzés után: A peremfeltételeknek

Részletesebben

Méréstechnika. Rezgésmérés. Készítette: Ángyán Béla. Iszak Gábor. Seidl Áron. Veszprém. [Ide írhatja a szöveget] oldal 1

Méréstechnika. Rezgésmérés. Készítette: Ángyán Béla. Iszak Gábor. Seidl Áron. Veszprém. [Ide írhatja a szöveget] oldal 1 Méréstechnika Rezgésmérés Készítette: Ángyán Béla Iszak Gábor Seidl Áron Veszprém 2014 [Ide írhatja a szöveget] oldal 1 A rezgésekkel kapcsolatos alapfogalmak A rezgés a Magyar Értelmező Szótár megfogalmazása

Részletesebben

3. Lineáris differenciálegyenletek

3. Lineáris differenciálegyenletek 3. Lineáris differenciálegyenletek A közönséges differenciálegyenletek két nagy csoportba oszthatók lineáris és nemlineáris egyenletek csoportjába. Ez a felbontás kicsit önkényesnek tűnhet, a megoldásra

Részletesebben

Hurokegyenlet alakja, ha az áram irányával megegyező feszültségeséseket tekintjük pozitívnak:

Hurokegyenlet alakja, ha az áram irányával megegyező feszültségeséseket tekintjük pozitívnak: Első gyakorlat A gyakorlat célja, hogy megismerkedjünk Matlab-SIMULINK szoftverrel és annak segítségével sajátítsuk el az Automatika c. tantárgy gyakorlati tananyagát. Ezen a gyakorlaton ismertetésre kerül

Részletesebben

Jelek és rendszerek MEMO_03. Pletl. Belépő jelek. Jelek deriváltja MEMO_03

Jelek és rendszerek MEMO_03. Pletl. Belépő jelek. Jelek deriváltja MEMO_03 Jelek és rendszerek MEMO_03 Belépő jelek Jelek deriváltja MEMO_03 1 Jelek és rendszerek MEMO_03 8.ábra. MEMO_03 2 Jelek és rendszerek MEMO_03 9.ábra. MEMO_03 3 Ha a jelet méréssel kapjuk, akkor a jel következő

Részletesebben

Átmeneti jelenségek egyenergiatárolós áramkörökben

Átmeneti jelenségek egyenergiatárolós áramkörökben TARTALOM JEGYZÉK 1. Egyenergiatárolós áramkörök átmeneti függvényeinek meghatározása Példák az egyenergiatárolós áramkörök átmeneti függvényeinek meghatározására 1.1 feladat 1.2 feladat 1.3 feladat 1.4

Részletesebben

ÉRZÉKELŐK ÉS BEAVATKOZÓK I. 3. MÉRÉSFELDOLGOZÁS

ÉRZÉKELŐK ÉS BEAVATKOZÓK I. 3. MÉRÉSFELDOLGOZÁS ÉRZÉKELŐK ÉS BEAVATKOZÓK I. 3. MÉRÉSFELDOLGOZÁS Dr. Soumelidis Alexandros 2018.10.04. BME KÖZLEKEDÉSMÉRNÖKI ÉS JÁRMŰMÉRNÖKI KAR 32708-2/2017/INTFIN SZÁMÚ EMMI ÁLTAL TÁMOGATOTT TANANYAG Mérés-feldolgozás

Részletesebben

Irányítástechnika GÁSPÁR PÉTER. Prof. BOKOR JÓZSEF útmutatásai alapján

Irányítástechnika GÁSPÁR PÉTER. Prof. BOKOR JÓZSEF útmutatásai alapján Irányítástechnika GÁSPÁR PÉTER Prof. BOKOR JÓZSEF útmutatásai alapján Rendszer és irányításelmélet Rendszerek idő és frekvencia tartományi vizsgálata Irányítástechnika Budapest, 29 2 Az előadás felépítése

Részletesebben

ELLENŐRZŐ KÉRDÉSEK. Váltakozóáramú hálózatok

ELLENŐRZŐ KÉRDÉSEK. Váltakozóáramú hálózatok ELLENŐRZŐ KÉRDÉSEK Váltakozóáramú hálózatok Háromfázisú hálózatok Miért használunk többfázisú hálózatot? Mutassa meg a háromfázisú rendszer fontosabb jellemzőit és előnyeit az egyfázisú rendszerrel szemben!

Részletesebben

Tartalom. Állapottér reprezentációk tulajdonságai stabilitás irányíthatóság megfigyelhetőség minimalitás

Tartalom. Állapottér reprezentációk tulajdonságai stabilitás irányíthatóság megfigyelhetőség minimalitás Tartalom Állapottér reprezentációk tulajdonságai stabilitás irányíthatóság megfigyelhetőség minimalitás 2018 1 Állapottér reprezentációk tulajdonságai Általánosan egy lineáris, SISO dinamikus rendszer

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.08. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)

Részletesebben

Irányítástechnika GÁSPÁR PÉTER. Prof. BOKOR JÓZSEF útmutatásai alapján

Irányítástechnika GÁSPÁR PÉTER. Prof. BOKOR JÓZSEF útmutatásai alapján Irányítástechnika GÁSPÁR PÉTER Prof. BOKOR JÓZSEF útmutatásai alapján Irányítástechnika a Alapfogalmak, modellezési elvek. Irányítástechnika Budapest, 2009 2 Az előadás szerkezete a 1. 2. módszerei 3.

Részletesebben

11. modul: LINEÁRIS FÜGGVÉNYEK

11. modul: LINEÁRIS FÜGGVÉNYEK MATEMATIK A 9. évfolyam 11. modul: LINEÁRIS FÜGGVÉNYEK KÉSZÍTETTE: CSÁKVÁRI ÁGNES Matematika A 9. évfolyam. 11. modul: LINEÁRIS FÜGGVÉNYEK Tanári útmutató 2 A modul célja Időkeret Ajánlott korosztály Modulkapcsolódási

Részletesebben

Gépészeti rendszertechnika (NGB_KV002_1)

Gépészeti rendszertechnika (NGB_KV002_1) Gépészeti rendszertechnika (NGB_KV002_1) 5. Óra Kőrös Péter Közúti és Vasúti Járművek Tanszék Tanszéki mérnök (IS201 vagy a tanszéken) E-mail: korosp@ga.sze.hu Web: http://www.sze.hu/~korosp http://www.sze.hu/~korosp/gepeszeti_rendszertechnika/

Részletesebben

HÁZI FELADATOK. 2. félév. 1. konferencia Komplex számok

HÁZI FELADATOK. 2. félév. 1. konferencia Komplex számok Figyelem! A feladatok megoldása legyen áttekinthet és részletes, de férjen el az arra szánt helyen! Ha valamelyik HÁZI FELADATOK. félév. konferencia Komple számok Értékelés:. egység: önálló feladatmegoldás

Részletesebben

Differenciaegyenletek

Differenciaegyenletek Differenciaegyenletek Losonczi László Debreceni Egyetem, Közgazdaság- és Gazdaságtudományi Kar Debrecen, 2009/10 tanév, I. félév Losonczi László (DE) Differenciaegyenletek 2009/10 tanév, I. félév 1 / 11

Részletesebben

DIFFERENCIÁLEGYENLETEK. BSc. Matematika II. BGRMA2HNND, BGRMA2HNNC

DIFFERENCIÁLEGYENLETEK. BSc. Matematika II. BGRMA2HNND, BGRMA2HNNC 016.03.1. BSC MATEMATIKA II. ELSŐ ÉS MÁSODRENDŰ LINEÁRIS DIFFERENCIÁLEGYENLETEK BSc. Matematika II. BGRMAHNND, BGRMAHNNC AZ ELSŐRENDŰ LINEÁRIS DIFFERENCIÁLEGYENLET FOGALMA Az elsőrendű közönséges differenciálegyenletet

Részletesebben

Irányítástechnika GÁSPÁR PÉTER. Prof. BOKOR JÓZSEF útmutatásai alapján

Irányítástechnika GÁSPÁR PÉTER. Prof. BOKOR JÓZSEF útmutatásai alapján Irányítástechnika GÁSPÁR PÉTER Prof. BOKOR JÓZSEF útmutatásai alapján Irányítástechnika rendszerek Irányítástechnika Budapest, 2008 2 Az előadás felépítése 1. 2. 3. 4. Irányítástechnika Budapest, 2008

Részletesebben

Differenciálegyenlet rendszerek

Differenciálegyenlet rendszerek Differenciálegyenlet rendszerek (A kezdeti érték probléma. Lineáris differenciálegyenlet rendszerek, magasabb rendű lineáris egyenletek.) Szili László: Modellek és algoritmusok ea+gyak jegyzet alapján

Részletesebben

Mérési hibák 2006.10.04. 1

Mérési hibák 2006.10.04. 1 Mérési hibák 2006.10.04. 1 Mérés jel- és rendszerelméleti modellje Mérési hibák_labor/2 Mérési hibák mérési hiba: a meghatározandó értékre a mérés során kapott eredmény és ideális értéke közötti különbség

Részletesebben

Fourier-sorfejtés vizsgálata Négyszögjel sorfejtése, átviteli vizsgálata

Fourier-sorfejtés vizsgálata Négyszögjel sorfejtése, átviteli vizsgálata Fourier-sorfejtés vizsgálata Négyszögjel sorfejtése, átviteli vizsgálata Reichardt, András 27. szeptember 2. 2 / 5 NDSM Komplex alak U C k = T (T ) ahol ω = 2π T, k módusindex. Időfüggvény előállítása

Részletesebben

1. Egy lineáris hálózatot mikor nevezhetünk rezisztív hálózatnak és mikor dinamikus hálózatnak?

1. Egy lineáris hálózatot mikor nevezhetünk rezisztív hálózatnak és mikor dinamikus hálózatnak? Ellenörző kérdések: 1. előadás 1/5 1. előadás 1. Egy lineáris hálózatot mikor nevezhetünk rezisztív hálózatnak és mikor dinamikus hálózatnak? 2. Mit jelent a föld csomópont, egy áramkörben hány lehet belőle,

Részletesebben

Számítógépes gyakorlat Irányítási rendszerek szintézise

Számítógépes gyakorlat Irányítási rendszerek szintézise Számítógépes gyakorlat Irányítási rendszerek szintézise Bevezetés A gyakorlatok célja az irányítási rendszerek korszerű számítógépes vizsgálati és tervezési módszereinek bemutatása, az alkalmazáshoz szükséges

Részletesebben

Az egységugrás függvény a 0 időpillanatot követően 10 nagyságú jelet ad, valamint K=2. Vizsgáljuk meg a kimenetet:

Az egységugrás függvény a 0 időpillanatot követően 10 nagyságú jelet ad, valamint K=2. Vizsgáljuk meg a kimenetet: II Gyakorlat A gyakorlat célja, hogy megismerkedjük az egyszerű szabályozási kör stabilitásának vizsgálati módszerét, valamint a PID szabályzó beállításának egy lehetséges módját. Tekintsük az alábbi háromtárolós

Részletesebben

TARTALOMJEGYZÉK. TARTALOMJEGYZÉK...vii ELŐSZÓ... xiii BEVEZETÉS A lágy számításról A könyv célkitűzése és felépítése...

TARTALOMJEGYZÉK. TARTALOMJEGYZÉK...vii ELŐSZÓ... xiii BEVEZETÉS A lágy számításról A könyv célkitűzése és felépítése... TARTALOMJEGYZÉK TARTALOMJEGYZÉK...vii ELŐSZÓ... xiii BEVEZETÉS...1 1. A lágy számításról...2 2. A könyv célkitűzése és felépítése...6 AZ ÖSSZETEVŐ LÁGY RENDSZEREK...9 I. BEVEZETÉS...10 3. Az összetevő

Részletesebben

Hatványsorok, Fourier sorok

Hatványsorok, Fourier sorok a Matematika mérnököknek II. című tárgyhoz Hatványsorok, Fourier sorok Hatványsorok, Taylor sorok Közismert, hogy ha 1 < x < 1 akkor 1 + x + x 2 + x 3 + = n=0 x n = 1 1 x. Az egyenlet baloldalán álló kifejezés

Részletesebben

A mérési eredmény megadása

A mérési eredmény megadása A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk meg: a determinisztikus és a véletlenszerű

Részletesebben

Akusztikai tervezés a geometriai akusztika módszereivel

Akusztikai tervezés a geometriai akusztika módszereivel Akusztikai tervezés a geometriai akusztika módszereivel Fürjes Andor Tamás BME Híradástechnikai Tanszék Kép- és Hangtechnikai Laborcsoport, Rezgésakusztika Laboratórium 1 Tartalom A geometriai akusztika

Részletesebben

Számítógépes gyakorlat MATLAB, Control System Toolbox

Számítógépes gyakorlat MATLAB, Control System Toolbox Számítógépes gyakorlat MATLAB, Control System Toolbox Bevezetés A gyakorlatok célja az irányítási rendszerek korszerű számítógépes vizsgálati és tervezési módszereinek bemutatása, az alkalmazáshoz szükséges

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

2. Hangfrekvenciás mechanikai rezgések vizsgálata jegyzőkönyv. Zsigmond Anna Fizika Bsc II. Mérés dátuma: Leadás dátuma:

2. Hangfrekvenciás mechanikai rezgések vizsgálata jegyzőkönyv. Zsigmond Anna Fizika Bsc II. Mérés dátuma: Leadás dátuma: 2. Hangfrekvenciás mechanikai rezgések vizsgálata jegyzőkönyv Zsigmond Anna Fizika Bsc II. Mérés dátuma: 2008. 09. 24. Leadás dátuma: 2008. 10. 01. 1 1. Mérések ismertetése Az 1. ábrán látható összeállításban

Részletesebben

Intelligens adatelemzés

Intelligens adatelemzés Antal Péter, Antos András, Horváth Gábor, Hullám Gábor, Kocsis Imre, Marx Péter, Millinghoffer András, Pataricza András, Salánki Ágnes Intelligens adatelemzés Szerkesztette: Antal Péter A jegyzetben az

Részletesebben

BIOMATEMATIKA ELŐADÁS

BIOMATEMATIKA ELŐADÁS BIOMATEMATIKA ELŐADÁS 6. Differenciálegyenletekről röviden Debreceni Egyetem, 2015 Dr. Bérczes Attila, Bertók Csanád A diasor tartalma 1 Bevezetés 2 Elsőrendű differenciálegyenletek Definíciók Kezdetiérték-probléma

Részletesebben

Neurális hálózatok bemutató

Neurális hálózatok bemutató Neurális hálózatok bemutató Füvesi Viktor Miskolci Egyetem Alkalmazott Földtudományi Kutatóintézet Miért? Vannak feladatok amelyeket az agy gyorsabban hajt végre mint a konvencionális számítógépek. Pl.:

Részletesebben

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv Mérések, mérési eredmények, mérési bizonytalanság A mérések általános és alapvető metrológiai fogalmai és definíciói mérés Műveletek összessége, amelyek célja egy mennyiség értékének meghatározása. mérési

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció:

Részletesebben

Ejtési teszt modellezése a tervezés fázisában

Ejtési teszt modellezése a tervezés fázisában Antal Dániel, doktorandusz, Miskolci Egyetem Robert Bosch Mechatronikai Tanszék Szabó Tamás, egyetemi docens, Ph.D., Miskolci Egyetem Robert Bosch Mechatronikai Tanszék Szilágyi Attila, egyetemi adjunktus,

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben

1. témakör. A hírközlés célja, általános modellje A jelek osztályozása Periodikus jelek leírása időtartományban

1. témakör. A hírközlés célja, általános modellje A jelek osztályozása Periodikus jelek leírása időtartományban 1. témakör A hírközlés célja, általános modellje A jelek osztályozása Periodikus jelek leírása időtartományban A hírközlés célja, általános modellje Üzenet: Hír: Jel: Zaj: Továbbításra szánt adathalmaz

Részletesebben

Bevezetés az állapottér elméletbe: Állapottér reprezentációk

Bevezetés az állapottér elméletbe: Állapottér reprezentációk Tartalom Bevezetés az állapottér elméletbe: Állapottér reprezentációk vizsgálata 1. Példa az állapottér reprezentációk megválasztására 2. Átviteli függvény és állapottér reprezentációk közötti kapcsolatok

Részletesebben

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. 1 Mérési hibák súlya és szerepe a mérési eredményben A mérési hibák csoportosítása A hiba rendűsége Mérési bizonytalanság Standard és kiterjesztett

Részletesebben

Megoldások MATEMATIKA II. VIZSGA (VK) NBT. NG. NMH. SZAKOS HALLGATÓK RÉSZÉRE (Kérjük, hogy a megfelelő szakot jelölje be!

Megoldások MATEMATIKA II. VIZSGA (VK) NBT. NG. NMH. SZAKOS HALLGATÓK RÉSZÉRE (Kérjük, hogy a megfelelő szakot jelölje be! MATEMATIKA II. VIZSGA (VK) NBT. NG. NMH. SZAKOS HALLGATÓK RÉSZÉRE (Kérjük, hogy a megfelelő szakot jelölje be!) 2016. JANUÁR 21. Elérhető pontszám: 50 pont Megoldások 1. 6. 2. 7. 3. 8. 4. 9. 5. Össz.:

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

Differenciálegyenletek numerikus integrálása április 9.

Differenciálegyenletek numerikus integrálása április 9. Differenciálegyenletek numerikus integrálása 2018. április 9. Differenciálegyenletek Olyan egyenletek, ahol a megoldást függvény alakjában keressük az egyenletben a függvény és deriváltjai szerepelnek

Részletesebben

I. LABOR -Mesterséges neuron

I. LABOR -Mesterséges neuron I. LABOR -Mesterséges neuron A GYAKORLAT CÉLJA: A mesterséges neuron struktúrájának az ismertetése, neuronhálókkal kapcsolatos elemek, alapfogalmak bemutatása, aktivációs függvénytípusok szemléltetése,

Részletesebben

Modellezés és szimuláció. Szatmári József SZTE Természeti Földrajzi és Geoinformatikai Tanszék

Modellezés és szimuláció. Szatmári József SZTE Természeti Földrajzi és Geoinformatikai Tanszék Modellezés és szimuláció Szatmári József SZTE Természeti Földrajzi és Geoinformatikai Tanszék Kvantitatív forradalmak a földtudományban - geográfiában 1960- as évek eleje: statisztika 1970- as évek eleje:

Részletesebben

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének 6. Függvények I. Elméleti összefoglaló A függvény fogalma, értelmezési tartomány, képhalmaz, értékkészlet Legyen az A és B halmaz egyike sem üreshalmaz. Ha az A halmaz minden egyes eleméhez hozzárendeljük

Részletesebben

Elhangzott gyakorlati tananyag óránkénti bontásban. Mindkét csoport. Rövidítve.

Elhangzott gyakorlati tananyag óránkénti bontásban. Mindkét csoport. Rövidítve. TTK, Matematikus alapszak Differenciálegyenletek 1 (BMETE93AM15) Elhangzott gyakorlati tananyag óránkénti bontásban Mindkét csoport Rövidítve 1 gyakorlat 017 szeptember 7 T01 csoport Elsőrendű közönséges

Részletesebben

MÉSZÁROS JÓZSEFNÉ, NUMERIKUS MÓDSZEREK

MÉSZÁROS JÓZSEFNÉ, NUMERIKUS MÓDSZEREK MÉSZÁROS JÓZSEFNÉ, NUmERIKUS módszerek 9 FÜGGVÉNYKÖZELÍTÉSEK IX. SPLINE INTERPOLÁCIÓ 1. SPLINE FÜGGVÉNYEK A Lagrange interpolációnál említettük, hogy az ún. globális interpoláció helyett gyakran célszerű

Részletesebben

Fourier térbeli analízis, inverz probléma. Orvosi képdiagnosztika 5-7. ea ősz

Fourier térbeli analízis, inverz probléma. Orvosi képdiagnosztika 5-7. ea ősz Fourier térbeli analízis, inverz probléma Orvosi képdiagnosztika 5-7. ea. 2017 ősz 5. Előadás témái Fourier transzformációk és kapcsolataik: FS, FT, DTFT, DFT, DFS Mintavételezés, interpoláció Folytonos

Részletesebben

Jelek és rendszerek - 4.előadás

Jelek és rendszerek - 4.előadás Jelek és rendszerek - 4.előadás Rendszervizsgálat a komplex frekvenciatartományban Mérnök informatika BSc (lev.) Pécsi Tudományegyetem, Pollack Mihály Műszaki Kar Műszaki Informatika és Villamos Intézet

Részletesebben

sin x = cos x =? sin x = dx =? dx = cos x =? g) Adja meg a helyettesítéses integrálás szabályát határozott integrálokra vonatkozóan!

sin x = cos x =? sin x = dx =? dx = cos x =? g) Adja meg a helyettesítéses integrálás szabályát határozott integrálokra vonatkozóan! Matematika előadás elméleti kérdéseinél kérdezhető képletek Analízis II Határozatlan integrálszámítás g) t = tg x 2 helyettesítés esetén mivel egyenlő sin x = cos x =? g) t = tg x 2 helyettesítés esetén

Részletesebben

1.9. B - SPLINEOK B - SPLINEOK EGZISZTENCIÁJA. numerikus analízis ii. 34. [ a, b] - n legfeljebb n darab gyöke lehet. = r (m 1) n = r m + n 1

1.9. B - SPLINEOK B - SPLINEOK EGZISZTENCIÁJA. numerikus analízis ii. 34. [ a, b] - n legfeljebb n darab gyöke lehet. = r (m 1) n = r m + n 1 numerikus analízis ii 34 Ezért [ a, b] - n legfeljebb n darab gyöke lehet = r (m 1) n = r m + n 1 19 B - SPLINEOK VOLT: Ω n véges felosztás S n (Ω n ) véges dimenziós altér A bázis az úgynevezett egyoldalú

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben