Máté László A matematikai modellalkotás folyamatáról 1. A felsőoktatás tömegessé válása olyan problémákat vet fel a matematika oktatásában amelyek a matematikai ismeretszerzés folyamatának az átgondolására inspirálja a felsőoktatásban résztvevő matematikust. Az egyik probléma az, hogy a hallgatóság növekedésével nem tart lépést azok száma akiknek kellő érzékük van a matematikához, a másik pedig, ami nem ujkeletű probléma, hogy a matematikai modellalkotás háttérbe szorul az oktatásban. A matematikai modellalkotás keretében, a lényeges információk szóban, képben majd formulákban történő regisztrálásától eljutunk a matematikai elméletig és eközben a megismerésnek különböző szintjeit és tipusait járjuk be. Matematikai modellalkotáskor szabályosságokat kell észrevenni, a szabályokat szokásos grafikonokban vagy más vizuális formában ábrázolni és végül a matematika nyelvén kell kifejezni. Ez a folyamat különböző megismerési képességeket mozgósit és gazdagabb információt ad a modellről mint a modell pusztán matematikai vizsgálata. Igy többen és jobban értik meg a matematikai elméletet a hallgatóság köréből mint a modellalkotás ismerete nélkül. A matematikai modellalkotást és a matematikai megismerés különböző szintjeit egy egyszerű, a DNS láncok feltérképezésével kapcsolatos modell keretében tárgyaljuk. A probléma igy szól, adott négy jelnek egy sokmilliós hosszúságú láncolata és keresendő ennek egy olyan ábrázolása, amelyből gyors áttekintéssel megállapitható, hogy milyen szavak (jelcsoportok) hiányoznak, vagy szignifikánsan alulreprezentáltak a láncban. Vagyis egy nagyon hosszú jelsorozatot, a DNS lánc szekvenciális modelljét, egyetlen pillantással áttekinthető képpé óhajtunk átalakitani. Ennek egyik megoldását adja a kódok vezérelte káoszjáték, amit Jeffrey-Hao modellnek fogunk nevezni. A következőkben a Jeffrey-Hao modell legegyszerübb változatát épitjük fel, amely csupán az alulreprezentált szavakat mutatja meg. 2. Ebben a modellalkotásban a DNS láncot az a, g, t, c betűkből (a DNS 1
láncot alkotó négyféle aminósav nevének kezdőbetűjéből) alkotott nagyon hosszú jelsorozatnak tekintjük. Ezeket a betűket a 0, 1, 2, 3 jelekkel, a négyes számrendszer alapjeleiként fogjuk jelölni. Mivel ekkor a DNS lánc négy külónböző jelnek több milliós láncolata, ezért ezt végtelen jelsorozatnak tekintjük és kódnak nevezzük. Egy véges hosszú jelsorozatot szónak és a kód első n jeléből álló szót a kód n hosszú prefixének nevezzük. A modellalkotás folyamatát a következő lépésekben fogjuk leirni, amelyek egyben megfelelnek a folyamat egyre absztraktabb, matematikusabb szintjeinek. 1. Megadjuk azt az algoritmust, amely a DNS lánc fenti szekvenciális alakját képpé alakitja. 2. Megadjuk adott alulreprezentált szavakhoz tartozó mintahalmaznak a konstrukcióját. Abból tudjuk meg azt, hogy vannak-e és melyek a hiányzó ill. alulreprezentált szavak a DNS láncban, hogy az 1. szerkesztésből nyert halmazt összevetjük a 2. konstrukciójával. 3. 3. Megvizsgáljuk a 2.-ben szerkesztett halmazok matematikai tulajdonságait. 4. Megadjuk az eljárás néhany lehetséges általánositását arra az esetre, amikor a különböző jelek száma négynél több. A négyjelű kód képi megjelenitése az egységnégyzetben történik. Az egységnégyzet csúcsai reprezentálják a 0, 1, 2, 3 jeleket és a kódot a következőképpen szerkesztett {P n ; n = 1, 2,...} pontsorozat jeleniti meg (1. ábra). A négyzet θ középpontját összekötjük a kód első jelét reprezentáló k (k {0, 1, 2, 3}) csúcspontjával. Az [θ, k] egyenesszakasz P 1 középpontja lesz a kód első jelének (egyelemű prefix) a képe. Ezután a kód első két jeléből álló prefix képét úgy kapjuk meg, hogy a P 1 pontot összekötjük a kód második jelét reprezentáló k (k {0, 1, 2, 3}) csúcsponttal. A [P 1, k] egyenesszakasz P 2 középpontja lesz a kód első két jeléből álló prefix képe. 2
Ha már a kód n 1 hosszú prefixének a P n 1 képét megkaptuk, akkor P n, az n hosszúságú prefix képe, a [P n 1, k] egyenesszakasz középpontja lesz. Összegezve: a kód vezérelte káoszjáték a (*) P n+1 = [P n, k] középpontja szerkesztés ismétlése az aktuális k értékekkel (2. ábra). A káoszjáték végeredménye akkor érdekes, ha majdnem üres foltok maradnak a négyzetben (3. ábra). Ezek a (majdnem) üres foltok jelzik, hogy bizonyos szavak nem (alig) fordulnak elő a kódban. Annak felderitésére, hogy melyek ezek a szavak egy másik, ezzel a káoszjátékkal rokon konstrukció szolgál, amely megadja a szavakhoz tartozó mintahalmazokat és amelyeket a szavak portréjának nevezünk. 4. Egy szó portréjának a megrajzolása azzal kezdődik, hogy megszerkesztünk egy négyzetlapot, amely majd meghatározza a szó portréját. Ez a konstrukció is abból áll, hogy a (*) szerkesztést ismételjük ujra meg ujra az aktuális k értékekre de egy négyzetlap minden pontjára. Részletezve: Az egységnégyzet minden P pontját összekötjük a négyzetnek a szó első jelét reprezentáló k csúcspontjával. (Most és a továbbiakban, nyilván elegendő a négyzet negy sarkára elvégezni a szerkesztést.) A kapott négyzetlap a szó első jelének (egyelemű prefix) a képe. Ha már a szó n 1 hosszú prefixének az N n 1 képét megkaptuk, akkor az n hosszú prefix N n képe az a négyzetlap, amelyet úgy kapunk, hogy az N n 1 négyzetlap minden P pontját összekötjük a szó n-edik jelét reprezentáló k csúcsponttal. A szerkesztés eredménye egy 2 l oldalú T 0 négyzetlap, ahol l a szó hosszúsága. T 0 meghatározza a szó portréját (4. ábra). Ismétljük meg a (*) szerkesztést a T 0 pontjaira a k = 0, 1, 2, 3 értékekre. Az igy kapott négy négyzetlap a T 0 -al együtt alkotják a szó 1-portréját (5. ábra). Megismételve m-szer ezt a konstrukciót, az igy kapott négyzetlapok és a T 0 uniója adja a szó m-portréját (6-7 ábra). 3
Több szó m-portréja az egyes szavak m-portréinak az uniója (8. ábra). Ha m nagy, akkor a négyzetlapokból kialakult mintázat jellemzi a szó hiányát. Ha a kód képében a fehér foltok mintázata megegyezik (nagymértékben hasonlit) bizonyos szavak m-portréjával nagy m esetén, akkor ezek a hiányzó (alulreprrezentált) szavak a kódban. Ilyen például a human immunoglobulin kódja és a 20 m-portréja, ha m > 6 (c=0, g=2 3, 7. ábra). 5. Milyen az m-portrék struktúrája? Úgy látszik, hogy az m-portrék fejlesztése során egymáshoz hasonló, egyre kisebb foltok bukkannak fel, amit határtalan nagyithatóságnak nevezünk és m > 6 értékre az m-portrék már nem változnak. Igy beszélhetünk egy szó, vagy szavak (m-től független) portréjáról (9. ábra). Eddig elemi geometriai eszközöket használtunk. A felsorolt és további tulajdonságok pontos leirására és a portrék részletesebb, pontosabb vizsgálatára szükségünk van egy absztraktabb matematikára, többek között a függvénytan fogalomkörére is. Legyen F k az a függvény, amely az R 2 sik P pontjához a [P, k] egyenesszakasz középpontját rendeli hozzá és ha B az R 2 egy részhalmaza, akkor legyen F k (B) = {F k (P ); P B}. legyen továbbá 3 W (B) = F k (B) k=0 és jelentse a kompoziciót. Ekkor az ω 1... ω n szó portréjában T 0 = F ω1... F ωn ( ), W (T 0 ) a szó 1-portréja és a szó m-portréja m W [k] (T 0 ) k=0 ahol W [k] a W halmazfüggvény k-szoros alkalmazását jelenti. (W [0] (T 0 ) = T 0.) 4
Ezzel tömören, a függvénytan nyelvén irtuk le az m-portré szerkesztését. Figyelembe véve, hogy m > 6 értékre az m-portrék szemmel láthatóan már nem változnak és hogy végtelen sok halmaz uniója jól meghatározott fogalom a matematikában, egy szó portréját ( ) S = W [k] (T 0 ) k=0 módon értelmezzük. Közvetlen számolással belátható, hogy (**) a következő rekurziv sorozattal is előáll P 0 = P n = W (P n 1 ) T 0 n = 1, 2,... és ezzel magyarázható a határtalan nagyithatóság. Ugyancsak közvetlen számolással W (S) = W (S) T 0 ami azt magyarázza, hogy a portrék nagy m-re már nem változnak szemmel láthatóan. A kapott formulákat, a Jeffrey-Hao modell függvénytani leirását elemezve a portrék olyan fontos tulajdonságait fedezhetjük fel, amelyek elemi geometriai eszközökkel nem is észlelhetők. Ezek közül megemlitjük, hogy az S az egységnégyzet sűrű részhalmaza és az S az egységnégyzettől csupán egy nullamértékű halmazban különbözik és ezeknek a látszatra meglepő tulajdonságoknak is megvan a praktikus vonzatuk. Azt még meg szeretném emliteni, hogy olyan absztrakt tulajdonság, mint a határtalan nagyithatóság, számitógépes grafikai eszközökkel jól szemléltethető, mégpedig úgy hogy m > 6-ra az iterációt és a képernyő ZOOM operációját párhuzamosan működtetjük. 6. Az eljárásnak két féle természetes általánositása van arra az esetre, amikor négynél több különböző jelből álló kóddal van dolgunk. Az egyik általánositás arra épül, hogy a szerkesztés helyett egyszerű aritmetikával is előállithatjuk a kód vezérelte káoszjátékot. Ugyanis ha az n 1 hosszú prefixet reprezentáló P n 1 X-koordinátája (bináris törtben) 0.c 1... c n..., akkor a P n X-koordinátája 5
0.0c 1... c n..., ha k = 0, 1 0.1c 1... c n... ha k = 2, 3. Ezt figyelembe véve akárhány dimenzióban (ill. 2 k ) végrehajthatók a szerkesztések abban az értelemben, hogy a pontok koordinátáit állitjuk elő. Ebben az általánositásban különösen érdekes az, amikor a kód nyolc különböző jelet tartalmaz. Ekkor három dimenzióban, az egységkockában történik a káoszjáték és az eredmény a 3D grafika ismert módszereivel tehető egyetlen pillantással áttekinthető képpé. Praktikus szempontból érdekesebb általánositás az amikor nem lépünk ki az R 2 sikból. A jeleket 4-es számrendszerbe irjuk. Legyen a jelek száma 4 m. Ekkor a megfelelő szerkesztésben csak minden m-edik pontot jelöljük be (a szerkesztés m 1 lépese után), mivel ekkor csak minden m-edik pont értelmezhető. Hátránya ennek az általánositásnak, hogy ekkor a k-portré nagyon pici részekből áll és ezért a képernyő ZOOM operációja is szükségeltetik. MEGJEGYZÉS. Érdekes lenne leirt matematikai modellalkotási folyamatot didaktikai szempontból is megvizsgálni. Az elemi geometriától kezdve a halmazfüggvényeken át az n-dimenziós Euklideszi térig különböző absztrakciós szintek szerepelnek. Ezen kivül geometriai, globális jellegű gondolatmenet éppúgy szerepet kap a tárgyalásban, mint algoritmikus konstrukciók és hagyományos levezetések, igy ez a munka más és más kognitiv képességeket és gondolkodási stilust igényel és mozgósit a tanulókban. LINKEK 1. www.itp.ac.cn/ hao/haoleechaos.pdf 2. www.math.yale.edu/ frame/ima Fractals 3. www.math.bme.hu/ mate 6