Szent István Egyetem Gazdaság- és Társadalomtudományi Kár Gazdaságelemzési és Módszertani Intézet Gazdasági Informatika Tanszék A mesterséges neuronális hálózatok alkalmazása az értékpapír piaci elırejelzések során Oroszországban, "ЕЭС" és "Аэрофлот" Rt. Példáján Belsı konzulens: Dr. Pitlik László, tanszékvezetı Készítette: Tyemirova Jelena Gödöllı 2004
Tartalomjegyzék 1 BEVEZETÉS...3 1.1 CÉLOK... 5 1.2 FELADATOK... 5 1.3 CÉLCSOPORTOK... 5 1.4 HASZNOSSÁG... 5 2 IRODALMI ÁTTEKINTÉS...6 2.1 AZ ELİREJELZÉS... 6 2.1.1 Az elırejelzés szerepe a tervezésben és a döntéshozatalban... 6 2.1.2 Tervezés és elırejelzés... 6 2.1.3 Az elırejelzés használatának céljai... 7 2.1.4 Az értékpapírok árfolyam elırejelzése a tızsdén... 9 2.1.5 Az elırejelzés során felhasználható módszerek... 14 2.2 A NEURONÁLIS HÁLÓK FOGALMA ÉS FELÉPÍTÉSE ALGORITMUSOK, TANULÁS, MEGÁLLAPÍTÁSOK ÉS ÁTFOGÓ SZABÁLYOK... 22 2.2.1 A neuronális hálók struktúrája... 22 2.2.2 A neuronális hálók fogalma... 22 2.2.3 A háló mőködése és tanulása... 22 2.2.4 A neuronális hálók módszerei... 25 2.2.5 A neuronális rendszerek tulajdonságai... 25 2.2.6 A neuronális hálók a gyakorlatban... 25 2.2.7 A neuronális hálók segítségével történı elırejelzés általános eljárása... 26 2.2.8 A neuronális hálókon történı elırejelzés elınyei és hátrányai... 27 2.3 A NEURONÁLIS HÁLÓK ALKALMAZÁSÁNAK GYAKORLATA A PÉNZÜGYI TEVÉKENYSÉGEKBEN... 32 2.3.1 A neuronszámítógépek segítségével megoldható alapfeladatok a pénzügyi szférában... 32 2.3.2 A bróker tevékenységének specialitásai(a munkaköre a részvény adás-vetél az orosz tızsdén)... 32 2.3.3 A neuronális háló csomagi piacának áttekintése.... 35 2.3.4 A SZIE Gazdasági Informatika tanszékének MI alapú kutatásai... 37 2.3.5 Az oroszországi helyzet... 38 2.4 A NEURONÁLIS HÁLÓK ÉS A STATISZTIKA... 39 2.4.1 Leíró nyelv-e a neuronális háló... 39 2.4.2 Miben rejlik a statisztika és a neuronális hálók különbsége... 40 2.4.3 Mi a jobb, a statisztikai módszerek vagy a neuronális hálók... 42 2.4.4 Gyakorlati következtetések... 44 3 ANYAG ÉS MÓDSZER...45 3.1 A RÉSZVÉNYÁRFOLYAM ELİREJELZÉSE... 45 3.1.1 RAO Egyesített Villamosenergia-Rendszer... 45 3.1.2 AO Aeroflot az orosz nemzetközi légitársaság... 56 4 ÖSSZEGZÉS...63 5 IRODALOMJEGYZÉK...65 6 MELLÉKLETEK....69 6.1 ÁBRÁK,TÁBLÁZATOK, RÖVIDÍTÉSEK JEGYZÉKEI... 69 6.1.1 Ábrák jegyzéke... 69 6.1.2 Táblázat jegyzéke... 70 6.1.3 Rövidítések jegyzéke... 70 6.2 AZ MNH TESZT ELİREJELZÉSEINEK EREDMÉNYEI... 72 6.3 A HÁLÓK KONSTRUKTİRE( STATISTICA NEURAL NETWORKS)... 72 6.4 A FELADAT FOLYAMATA ÉS A C++ PROGRAM NYELVŐ RÉSZEI... 72 6.5 A RAO PRIVILEGIZÁLT RÉSZVÉNYEI SÚLYOZOTT ÁRFOLYAM INDEXEI 2000. JÚNIUS 1. ÉS 2002. NOVEMBER 23... 72 6.6 AZ AO AEROFLOT AZ OROSZ NEMZETKÖZI LÉGITÁRSASÁG KÖZÉPKATEGÓRIÁJÚ RÉSZVÉNYJEGYZÉSE 2000. JÚNIUS 1. ÉS 2002. NOVEMBER 23... 72
Bevezetés És a jövıt, természetesen nem ismerik sem Isten angyalai, sem az ördögök, mindenesetre, ık jósolják meg. Szent Johann Damaszkin, A pravoszláv hit pontos magyarázata. Reagálok a piac eseményeire, amint az állatok reagálnak arra, ami a dzsungelben történik. Soros György. A pénzügyek alkímiája. 1 Bevezetés A pénzügyi idısorok megjóslása minden befektetési folyamat elválaszthatatlan része. Maga az invesztíció fogalma - pénzbefektetés a jelenben a jövıbeni bevételhez jutás céljával a jövı elırejelzésének elképzelésén alapul. A piaci üzletek 99%-a spekulatív, azaz egyetlen céllal köttetnek a vétel-eladás árkülönbségébıl fakadó nyereség megszerzése érdekében. Mivel az értékpapírpiac valamennyi szereplıjét egy cél vezérli és egymás ellen játszanak, az nyer, aki nagyobb pontossággal jósolja meg a piac jövıbeni állását. Ennek megfelelıen a pénzügyi idısorok elırejelzése valamennyi invesztálási tevékenység - tızsde és tızsdén kívüli értékpapír-kereskedési rendszer - mőködésének alapjául szolgál. A pénzügyek elméletében az egyik alapvetı álláspontnak számít az effektív piac hipotézis. Ennek a lényege az, hogy minden elérhetı információ rögtön tükrözıdik a pénzügyi aktívák árain. Érthetıbb megfogalmazásban ez azt jelenti, hogy a befektetı nem kaphat többletbevételt a kereskedés korábbi adatokon alapuló szabályszerőségeinek felhasználásával innen ered az a széles körben elterjedt vélemény, hogy ezen a területen az elırejelzés reménytelen dolog. És Lui de Baselje alapján az effektív piac elmélete értelmében a befektetı csak a piac közepes jövedelmezıségében reménykedhet, melyet olyan indexek segítségével értékelnek mint a Dow Jones, S&P500 vagy a BUX [4]. Minden spekulatív bevétel jellemzıje, hogy véletlenszerő. Az elıre meg nem jósolhatóság oka abban áll, hogy túl sokan törekednek arra, hogy ilyen módon jövedelemhez jussanak. Azonban maguk a piac szereplıi is úgy gondolják, hogy annak mozgásai rejtett törvényszerőségekkel teli, azaz legalábbis részben, megjósolhatóak. Így, például, Elliot vélte, a technikai analízis(tovább TA) alapítója[15]. A nyolcvanas években megjelent egy elmélet, mely sokban alátámasztja a piac szereplıinek elképzeléseit, a dinamikus káosz elmélete. Lényege abban áll, hogy a kaotikus sorok csak kinézetre véletlenszerőek, de mint determinált dinamikus folyamatok, (rövidtávú) prognózisuk lehetséges. Ily 3
Bevezetés módon a befektetı, akinek a legjobb matematikai módszere van a rejtett káosz törvényszerőségeinek felfedésére, nagy nyereségben reménykedhet. A piac közössége viselkedésének pszichológiája sokban hasonlít a tömeg pszichológiájához, és egészében véve jóval primitívebb, mint individuális. A piac kollektív tudata az árra fókuszál, és ez lehetıvé teszi a piaci mozgások részbeni megjósolhatóságát. Ily módon ahhoz, hogy a piaci görbéket megjósoljuk, a tömeg hatalmától feltétlenül meg kell szabadulnunk, magasabbnak és okosabbnak kell lennünk nála. Ehhez ki kell dolgozni a játék rendszerét, melyet majd alátámaszt az idısor korábbi viselkedése, és pontosan követni kell ezt a rendszert, emocionális hatásokra és a körülöttünk cirkuláló hangokra nem reagálni. Mivel egy meghatározott algoritmusról és a döntéshozatal hidegvérőségérıl van szó, ezért leginkább az logikus, ha ezt a feladatot számítógépre bízzuk. Az emberre csak ennek az algoritmusnak a megalkotása marad, melyhez rengeteg program áll rendelkezésére, melyek megkönnyítik a feldolgozást, és a technikai analízis eszközkészletére alapozott számítógépes eljárások további nyomon követését, de sajnos a végsı modellválasztást nem! Továbbá maga a játék stratégiájának feldolgozása is levezethetı számítógép segítségével, az optimális indikátorok meglelésére és a meglelt indikátorokhoz való optimális stratégiák megtalálására azonban a céltalanság tétele értelmében [39] úgy tőnik nincs mód. Az ilyen eljárás a neuronális hálók technológiájának bevezetésével a kilencvenes évek elejétıl kezdve mégis egyre több hívet szerez magának, mivel egy sor vitathatatlan elınnyel rendelkezik. Elıször is, általában a neuronális hálós analízis a technikaitól eltérıen nem feltételez semmiféle korlátozást a beviteli adatok jellemzıinek tekintetében. Ezek lehetnek akár az adott idısor indikátorai, akár más piaci eszköz viselkedésének a mutatói/tanúi. Nemhiába a neuronális hálókat éppen az intézményi befektetık (például hatalmas nyugdíjpénztárak) használják, akik nagy pénzügyi portfolióval dolgoznak, akik számára különösen fontos a különbözı piacok közötti korreláció. Másodsorban a TA-tól eltérıen, mely általános ajánlásokon alapul, a neuronális hálók képesek arra, hogy jobban közelítsék az adott eszköz számára optimális indikátorokat, és hogy azok alapján az adott sornak optimálisnak tőnı jóslási stratégiát találjanak. Továbbá ezek a stratégiák lehetnek adaptívak, a piaccal együtt változhatnak, ami különösen fontos a fejlıdı fiatal piacok, részben az orosz piac számára is. Ily módon a neuronális hálós modellezés kizárólag adatokon alapul, nem használ semmilyen apriori meggondolást. Azonban éppen ez a hátránya is. 4
1.1 Célok Bevezetés Szakdolgozatom célja annak bemutatása, hogy a Mesterséges neuronális hálók (tovább MNH) alkalmazásával megvalósítható a pénzügyi piacok elırejelzése. És milyen eredményeket lehet elérni a neuronális hálókkal (háromrétegő és négyrétegő neuronális háló (Multi-Layer Perceptron); Feedforward Network with Back Propagation Training Algorithm), a részvényjegyzések elırejelzésében hagyományos statisztikai módszerekkel szemben. Hagyományos statisztikai módszereknél az exponenciális simítás módszere használatainak eredményeit mutatom be. Az elemzéseket két különbözı témakörben, két különbözı módszerrel készítettem. Az elsı prognózis a RAO «Egyesített Villamosenergia-rendszer» részvények súlyozott árfolyam indexeinek alapján épült fel (neuronális hálózati modellel és idısorok analízisének statisztikai módszerén alapuló prognózis segítségével). A második prognózis az Aeroflot orosz nemzetközi légitársaság Rt. középkategóriájú részvényjegyzése alapján épült fel (neuronális hálózati modellel és idısorok analízisének statisztikai módszerén alapuló prognózis segítségével). 1.2 Feladatok A célok meghatározása és a rendszer általános bemutatása után feladat a prognózisok elkészítése. További feladat MNH-vál készített elırejelzés a összehasonlítása a statisztikai megoldásokkal. 1.3 Célcsoportok Mindenki (pl. tervezési osztály vezetık, döntéshozók), aki a tızsdén bejegyzett cégek és MI-alapú befektetési folyamatát tervezi. 1.4 Hasznosság Az elırejelzések haszna magától értetıdı: minél pontosabb a jövıkép, annál kevesebb a hibás döntés, ill. az elmaradó haszon. Az elırejelzéseknek azonban számos költségtényezıje van (alapadatok biztosítása, kommunikáció, szoftverfejlesztés, alkalmazás, stb.), melyek figyelembe vételével adott tızsdei helyzetben nem biztos, hogy a magasabb abszolút pontosságot produkáló, de drága megoldás a hasznosabb. 5
Irodalmi áttekintés 2 Irodalmi áttekintés 2.1 Az elırejelzés 2.1.1 Az elırejelzés szerepe a tervezésben és a döntéshozatalban Az elırejelzés - mint a döntés maga - mindennapos tevékenységeink egyike. Az ember akarva-akaratlanul döntések - és ezzel együtt elırejelzések - sokaságát hozza meg idırıl idıre. Ez a folyamat már annyira természetessé vált, hogy szinte "öntudatlanul", rutinszerően végezhetı. Ezt a típusú intuitív hozzáállást a módszerességgel szemben az jellemzi, hogy sem az alkalmazott elırejelzı összefüggések, sem ezek beválási mutatói nem konkretizálódnak. A módszeres elırejelzés az intuícióval ellentétben arra törekszik, hogy olyan matematikailag kezelhetı összefüggéseket találjon, melyek alkalmazása segítségével a döntések helyességének gyakorisága kalkulálhatóvá, növelhetıvé válik. [39] Az elırejelzés kapcsán a gazdasági élet változásait, mozgásjelenségeit lehetıleg számszerően kell megfigyelni. A jelenségek között összefüggések vannak, melyeket felderítve és különbözı módszerekkel kiértékelve, a gazdasági élet jelenlegi állapotának meghatározása mellett jövıbeli alakulására is megpróbálhatunk következtetni. Az elırejelzés a gazdasági döntések meghozatalához szolgáltathat információt döntéselıkészítı jelleggel. Az elırejelzés egyik funkciója az orientációs funkció, ami azt jelenti, hogy elısegíti a fejlıdési folyamatok törvényszerőségeinek feltárása révén -, a fejlıdés lehetıségeinek, valamint ezek feltételeinek és eszközrendszereinek kidolgozását, így növelve a tervek megbízhatóságát, ami csökkenti a kockázatot. A másik legfontosabb funkciója a kommunikációs funkció, hiszen információk segítségével összehangolja a különbözı területek tevékenységét, a tervezési és az elırejelzési folyamatot. [18] Az elırejelzés tehát a döntés-elıkészítést segíti elı, de maga a döntés közgazdasági (vezetési) funkció.[47] 2.1.2 Tervezés és elırejelzés Itt érdemel említést az a nézet, miszerint a tervezés és az elırejelzés két egymástól elkülönült funkció. Az elırejelzést általában arra használják, hogy elıre leírja mi fog történni adott feltételek mellett (elıfeltételek). Másrészrıl viszont a tervezés magába foglalja olyan elırejelzések használatát, amelyek jó döntések meghozatalát segítik elı a szervezet számára vonzóbb alternatívák kiválasztásakor. Így tehát az elırejelzés célja annak leírása, mi fog történni, míg a terv azon az elképzelésen alapszik, hogy bizonyos lépések megtételével a döntéshozó befolyásolni tudja az ezt követı eseményeket egy adott szituációban, 6
Irodalmi áttekintés és így a kívánt irányba tudja befolyásolni a végeredményt. Pl. ha az elırejelzés azt mutatja, hogy a kereslet csökkenni fog a következı évben, a vezetés szükségesnek tarthatja egy akcióterv készítését (pl. a termék reklámozása), amely képes kompenzálni, vagy akár meg is fordítani a várható kereslet esését. Általánosságban az elırejelzések a tervezési folyamat beviteli adatai. [36] 2.1.3 Az elırejelzés használatának céljai Az elırejelzés az irányításban való döntéshozatal kulcsfontosságú eleme. Bármely döntés végsı effektivitása a döntéshozatal utáni események következetességétıl függ. Ezen események nem irányítható aspektusai megjóslásának lehetısége a döntéshozatal elıtt lehetıvé teszi hogy a legjobb kiválasztást tegyük meg, mely ellenkezı esetben nem lenne szerencsés. Ezért az irányítási és tervezési rendszerek általában megvalósítják a prognózis függvényét. A továbbiakban példákat sorolunk fel olyan szituációkra, melyekben hasznos az elırejelzés. 2.1.3.1 Anyagi-termelési készletek irányítása A repülıgép-javító vállalat tartalék alkatrész készleteinek irányításában mindenképpen elengedhetetlen annak felmérése, milyen mértékben használják az egyes alkatrészeket. Ezen információ alapján határozzák meg a tartalék alkatrészek szükséges mennyiségét. Mindezeken felül nem elhagyható a hiba elırejelzés értékelése. A hiba számítása történhet például a raktárból hiányzó alkatrészek beszerzéséhez felhasznált idı adatai alapján. 2.1.3.2 A termelés tervezése Ahhoz, hogy egy termékcsalád termelését megtervezzük, lehetséges, hogy minden egyes terméknév eladását prognosztizálni kell, tekintettel a több hónapra elıre való beszerzés idejére. Ezen végtermékekhez készült prognózisok késıbb a félkész termékek, összetevık, anyagok, dolgozók stb. követelményévé válhatnak. Ily módon a prognózis alapján egész vállalatcsoportok munkájának grafikonja épülhet fel. 2.1.3.3 Pénzügyi tervezés A pénzügyi menedzsert az érdekli, az idı múlásával hogyan fog változni a társaság pénzforgalma. 2.1.3.4 A személyzet beosztásának kidolgozása Egy postatársaság menedzserének ismernie kell a feldolgozandó levelek mennyiségének prognózisát ahhoz, hogy a feldolgozás a személyzet beosztásának és a berendezések termelékenységének megfelelıen történjen. 7
Irodalmi áttekintés 2.1.3.5 Új termék tervezése Az új termék kidolgozásáról szóló döntés általában hosszú távú prognózist követel arról, milyen keresletnek örvend majd az áru. Ez a prognózis nem kevésbé fontos, mint az elıállításához szükséges befektetések meghatározása. 2.1.3.6 Technológiai folyamat irányítása A elırejelzés technológiai folyamatok irányítási rendszereinek is fontos része lehet. Ha megfigyeljük a kulcsfontosságú átmeneti folyamatokat és felhasználjuk ıket arra, hogy a folyamat jövıbeni viselkedését megjósoljuk, akkor meg lehet határozni az irányító ráhatás hosszát és optimális idejét. Például némely ráhatás egy óra alatt megemelheti egy kémiai folyamat effektivitását, azután azonban csökkentheti a folyamat effektivitását. A folyamat termelékenységének elırejelzése hasznos lehet a folyamat befejezıdésének ideje és a termelés átfogó beosztása tervezésénél. A fentiekben fejezetekben kifejtettek alapján elmondható, hogy a elırejelzés jövıbeni események megjóslását jelenti. A elırejelzés célja a döntéshozatal kockázatának csökkentése. A prognózis általában hibásra sikerül, de a hiba a használt prognosztizáló rendszertıl függ. Ha a prognózist több forrással látjuk el, megnövelhetjük annak pontosságát és csökkenthetjük a veszteséget, mely a döntéshozatal során fellépı határozatlansággal kapcsolatos. A prognózis költsége annak mértékében növekszik, ahogy csökken a határozatlanságból fakadó veszteség. A elırejelzési hibák bizonyos szintjén a elırejelzésre fordított költségek minimálisak. Minden egyes terven felüli dollár, amit elırejelzésre költünk, a veszteség rizikója csökkenését jobban elısegíti, mint az elızı. Bizonyos pont után elıfordulhat, hogy a elırejelzésre költött terven felüli költségek egyáltalán nem vezetnek a veszteségek csökkenéséhez. Ez azzal áll összefüggésben, hogy lehetetlen a elırejelzés közepes hibáját egy meghatározott szintnél lejjebb csökkenteni, függetlenül attól, mennyire bonyolult az alkalmazott elırejelzési módszer. Mivel a elırejelzés soha nem képes a döntéshozatal kockázatát megsemmisíteni, a prognózis pontatlanságának világos meghatározására. Általában a meghozandó döntést a prognózis eredményei határozzák meg (feltételezzük, hogy a prognózis helyes), figyelembe véve a elırejelzés lehetséges hibáit. Az elızıekben kifejtettek feltételezik, hogy a prognosztizáló rendszer gondoskodjon a elırejelzési hibák meghatározásáról, úgy mint magáról a elırejelzésrıl. Az ilyen eljárás jelentısen csökkenti az objektívan a döntéshozatal folyamatával kapcsolatos kockázatot. Szükséges megjegyeznünk, hogy a elırejelzés nem végcél. A elırejelzési rendszer a menedzsment nagy rendszerének része, és mint alrendszer, a rendszer 8
Irodalmi áttekintés más összetevıivel kölcsönhatásban van, miközben nem kis szerepet játszik az elért eredményben. 2.1.4 Az értékpapírok árfolyam elırejelzése a tızsdén A részvények és egyéb értékpapírok (pl. kárpótlási jegy) árfolyama mindenkor a piacon felbukkanó információk okozta kereslet-kínálat ingadozásnak van kitéve. A lényeg tehát az, hogy a világ történései alapján a befektetık értékelik az értékpapírokat (részvények, kötvények, devizák, egyéb értékpapírok), és ennek tükrében alakulnak ki az árfolyamok. Hogy az egyes befektetık milyen információkat tartanak lényegesnek és hogy ebbıl milyen következtetéseket vonnak le - nos, ezeknek megfelelıen eltérı elemzési iskolákról beszélhetünk. Több fontos irányzat alakult ki, melyek különbözı módon építették fel elméletüket, s ehhez kapcsolódóan elméletüket. [14] Az értékpapír- és árupiacok árainak elırejelzésére és analízisére három alapvetı módszer létezik: fundamentális analízis, technikai analízis és intuitív módszer. Vagy magyar szakirodalom szerint a részvényárfolyamok meghatározásának és elırejelzésének alapvetıen két módszere ismert: a chartista és fundamentális elemzés.[23] 2.1.4.1 Az fundamentális analízis Az fundamentális analízis a makrogazdasági faktorok árra gyakorolt hatását vizsgálja, melyek analízise alapján a regresszió többfaktorú modelljei épülnek fel.[3] A befektetık, akik a piac megegyezı szektorában hosszú távú befektetést valósítanak meg, a legtöbb figyelmet éppen az fundamentális analízisre fordítják. Az alapvetı faktorokhoz, melyek analízisével az fundamentális analízis foglalkozik, a következık tartoznak: az orosz GDP mozgása, százalékdíjak, infláció, kereskedési és fizetési egyensúly deficitje, pénztömeg mozgása, munkanélküliség, fogyasztói és nagykereskedelmi árak indexei stb. Az fundamentális analízis alkalmas lehet az ártrend meghatározására. Meghatározza a kockázat és a várt bevétel szintjét, úgy mint egymástól különbözı pénzaktívák, és úgy is mint pénzaktívák egész csoportjai szintjét. Az eredmény a befektetı pénzeszközeinek optimális felosztása a részvénypiac és a kötvénypiac között. Az alapfaktorokon kívül a piaci árakra hatással vannak véletlenszerő, váratlan faktorok is, melyekhez tartoznak a természeti jelenségek (földrengés, árvíz stb.) és a politikai hírek. Mindezen faktor árra gyakorolt hatásának az eredményei az információs társaságok naponta közreadott híreiben jelen vannak, például a gazdasági hírekben: részvények kereskedési indexe, mint a DJI, S&P500, NASDAQ, RTSz stb., államkötvények árfolyamának mozgása, valuta középárfolyamok, letéti díjak, tızsdei áruk árai stb. [10] 9
Irodalmi áttekintés A modern befektetı a piacon történı sikeres munkához a nyereség maximalizálása céljából nemcsak az fundamentális analízis eredményeit veszi figyelembe, hanem a technikai analitikus prognózisait is. Az alapanalitikus prognózisainak alátámasztására a tızsdei információkhoz indexek és árak mozgásához fordul, az árak grafikonját tanulmányozza, hogy meggyızıdjön arról, hogy az alapfaktorok milyen hatással vannak a piacra. Másrészrıl a technikai analitikus prognózisaiban nem tudja nem figyelembe venni az alapfaktorokat, mivel az általa megfigyelt rövidtávú árfolyamváltozások lehetséges, hogy csak korrekciók. Az árak prognózisa arra a kérdésre válaszol, hogy mit kell tenni? venni vagy eladni, a technikai analízis pedig (a késıbbiekben TA) arra a kérdésre válaszol, hogy mikor kell eladni vagy venni. Valóban, a bróker tevékenységében a piac mozgásának elırejelzése olyan fontos elemekkel egészül ki mint a kereskedési taktika és a tıkeirányítás. Amint J. Murphy, a technikai analízis egyik legelsı és legelterjedtebb könyvének írója véli, egyetlen egy kereskedési program sem számít teljesnek és effektívnek, ha nem vesznek figyelembe három komponenst: a piac mozgásának elırejelzését, kereskedési taktikát, tıkeirányítást. [35] A piac mozgásának elırejelzése azt mutatja, milyen irányba mozog a piac. Ez az elsı lépés, mely megelızi a döntést. A bróker ez arra az alapvetı kérdésre enged válaszolni, hogy melyik oldalról kell belépnie a piacra: hosszú (az árak emelkedésévek számolva) vagy rövid (az árak esésével számolva). A kereskedési taktika meghatározza a piacra való belépés és kilépés konkrét pillanatát. Hatalmas a szerepe az áru határidıüzletek piacán, mivel ott a garantált kifizetés elég alacsony és ezért magas az emelı effektus, és ez a brókernek nem enged jogot hibázni.[12] Gyakran elıfordul, hogy az árak mozgásának irányára vonatkozó helyes döntés meghozatala mellett helytelen a piacra való belépés pillanatának meghatározása, azaz üzlet nem megfelelı idıben történı megkötése veszteséget hoz. Ezért megállapítható, hogy a kereskedési taktika technikai jellegő, azaz szükség van a technikai analízis módszereinek alkalmazására. A tıkeirányítás azon kérdések összességét jelenti, melyek a bróker eszközbefektetésével kapcsolatosak. Ide tartozik a tárca optimális összetételének problémája, a diverzifikáció, a konkrét piacra történı befektetés nagyságának értékelése a kockázat figyelembevétele mellett. A stopparancsok használata, a nyereség és veszteség lehetıségei összefüggésének helyes meghatározása, a siker és kudarc periódusok utáni cselekvési taktika kiválasztása, valamint a konzervatív és agresszív kereskedés konkrét stílusa. Az alapanalitikus arra törekszik, hogy a piac mozgásának okait felfedje, a 10
Irodalmi áttekintés technikai analitikust csak az árak mozgásának ténye érdekli. Különbözı filozófia szerint járnak el a piaci tendenciák magyarázása során. Eltérı oldalról és eltérı céllal tanulmányozzák a piacot. Azonban a számítógépes technológiák elterjedésével a technikai és az fundamentális analízis módszereiben sok közös vonásra derült fény. Például az átcsúszó középsık módszere. Így az árgrafikon, mely a technikai analízis tárgya idısor. Ezen kívül a technikai analízis lényeges alkotórésze a gazdasági ciklusok teóriája, a rotáció teóriája, Elliot hullámteóriája, Fibonacci számsorrendjének használata. 2.1.4.2 A technikai analízis A technikai analízis az árak mozgása elırejelzésének módszere a piac megelızı idıperiódusa alatt történt mozgásai grafikonjainak tanulása segítségével.[12] A piac mozgásainak analízise alatt nemcsak az ár ingadozásának analízisét kell érteni, hanem olyan alkotó tızsdei információk kutatását is, mint a kereskedések terjedelme és a nyílt érdekek. Ezt a módszert a bevételek kivonására hozták létre az értékpapírok piacán folyó játékban, majd a határidıüzletek piacán. A TA alapelveit a nyolcvanas évek közepén John Murphy[35] bróker és analitikus fogalmazta meg. A modern világgazdaságban a tızsde hatása az áruk árára ás azok mozgására rendkívül különféle. A tızsdék lényeges szerepet játszanak a piaci árak kialakításában. A spekulatív tıkének köszönhetı tızsdei fordulatok megnövekedése eredményeképp a tızsdei operációk árra gyakorolt hatása erısödik. A technikai analízis axiómái: az ár figyelembe vesz minden eseményt, az árak mozgása tendenciákra hajlamos, a történelem ismétli önmagát. [12] A piacra való belépés és onnan való kilépés pillanatának kiválasztására a technikai analízis napjainkra a legelterjedtebbé vált, és lényegében véve, ez az egyetlen, melyet alkalmaznak a gyakorlatban. A neuronális hálók és a genetikai algoritmusok még nem használatosak olyan széles körben mint a TA. Monográfiák egész sorában vizsgálják a fraktál és káoszelmélet alkalmazásának lehetıségeit a kereskedésben és a gazdaságban történı befektetések stratégiájában, hogy maximális nyereség váljon elérhetıvé. Ezek az elméletek az elektromos kereskedési rendszerek elterjedésével, azok elérhetısége és a rövid idıintervallumú spekulatív kereskedés bıvülésével keletkeztek. A TA tárgya a tızsdei információ tanulása, mely az árgrafikon, az üzletek terjedelme, a nyílt érdek és más tızsdei információk formájában jut kifejezésre, melyek idıben különbözı idıintervallumokban (évek, hónapok, hetek, napok, órák, ) kerültek felosztásra. A TA célja az alapárfolyam meghatározása és változása valószínőségének értékelése, a nyereség maximalizálása céljából történı piacra való belépés és onnan való kilépés pillanata meghatározására irányuló 11
Irodalmi áttekintés döntéshozatal szabályainak feldolgozása. A rövidtávú árfolyamokban tızsdei spekulánsok mőködnek. A hosszú távú árfolyamok rend szerint a befektetıket érdeklik. A TA mint az ármozgás analízisének grafikai módszere jelent meg, és mindmáig meglehetısen egzotikusnak tőnik azok számára, akik elıször találkoznak vele. A TA a tızsdei információk grafikonjai elemzésére két módszert igényel: grafikus számszerő (számítógépes) [12] A TA módszerei által felépített modellek empirikusak. Empirikus modellek akkor épülnek, amikor lehetetlen a szigorú teoretikus modell felépítése. Az empirikus modellek kísérleti adatok analízise (fizika, kémia, biológia stb.) vagy történeti adatok analízise (pénzügy, gazdaság) alapján épülnek fel. Az empirikus modell nem magyarázza meg a tanult jelenség okait, de segítségével megjósolható és kiszámolható a tanult jelenség eredménye. Az empirikus modellezés során a megfigyelt események közötti minıségi kapcsolatoknak csak a statisztikai megbízhatóságát ellenırzik. Az empirikus modellek az orvostudományban a kardiogram, a mágneses encefalogram stb. grafikai analízise alapján épülnek fel. Ezek tanulásához az alakzatok felismerésére irányuló algoritmusokat hoznak létre. Az empirikus modell a TA-ban az árgrafikonok grafikai és számszerő analízise alapján történı döntéshozatal szabályainak készlete. Azonban a TA néhány szabálya nem elég pontosan meghatározott, ezért a grafikai analízisen alapuló empirikus modell, mint minden modellezés, elınyökkel és hátrányokkal bír. Továbbá az a modell, melyet elég nagy idıintervallumban ellenıriztek statisztikailag megbízható és hitelt érdemlı. A számszerő módszerek megjelenéséig - melyek hanyatlása a számítógépes technológiák meghonosodásával kezdıdött -, a grafikai analízis volt a TA alapvetı eszköze. A döntéshozatal fontos tényezıje a bróker intuíciója. Ezért a TA inkább mővészetnek számított, mint tudománynak.[12] Mára már a TA módszerei széles körben elterjedtek és minden információs társasággal együtt olyan csomagba tartoznak, melyek piacról szóló információt közölnek, legyen az árupiac (olaj, gabona, fém stb.), valutapiac, értékpiac. Hosszasan és alapvetıen lehetne a TA módszertanát kritizálni, de egyelıre a rövidtávú prognózis és a kereskedési taktika kiválasztására szemléletesebb módszer nincsen, mindenki hálás lesz annak, aki azt kitalálja. 12
Irodalmi áttekintés 2.1.4.3 Chartisták A chartisták az árfolyamok múltbeli alakulásának statisztikai elemzésével, az árok változására jellemzı visszatérı minták és prognózis alapján határozzák meg a vizsgált papírok árfolyamát.[23] A chartisták speciális tulajdonsága, hogy a befektetık közeli jövıben várható reakcióit a múltbeli eseményeket feldolgozó grafikonok (chartok) vizsgálatával próbálják meghatározni. Ebbıl következıen, szerintük a részvényárfolyamok determinisztikusán változnak, egy korábbi azonos árfolyam alakulás alapján, meghatározható a jövıben várható. Nem érdekli ıket a konkrét részvény tulajdonsága, a vállalat, vagy az iparág pozíciója, sıt az erre vonatkozó információkat egyenesen zavaró körülménynek tartják. Felsorolni is nehéz lenne, az általuk naponta használt sok száz alakzat nevét információt almát. Az ábráik készítése miatt mondják róluk, hogy rajzolnak. Mindenesetre álljon itt egy ábra az általuk keresett egyik alakzatról. [20] 1 ábra chart: Az árfolyam alakulása 2.1.4.4 Az intuitív módszer Forrás: Farkasné, 1999 Az intuitív módszerekhóz tartornak a Mesterséges Intelligencia alapú módszerek, melyik között a Mesterséges neuronális hálók, amelyikrıl részletesén lesz szó tovább. De ebben a fejezetben megmutatom a piaci idısorok elırejelzésének metodikája MNH segítségével intuitív módszerek során. 13
Irodalmi áttekintés A piaci idısorok elırejelzése technológiai ciklusának vázlata 2 ábra 2.1.5 Az elırejelzés során felhasználható módszerek Forrás: Jezsov és Sumskij,1998 Az elırejelzés során különbözı módszerek alkalmazása áll a kutató rendelkezése, amelyiket 200 oldalon keresztül sorolhatja. De próbálhatom fıcsoportok szerint megmutatni az áttekintést. Elsı fıcsoport ez a matematikai-statisztikai módszerek, melyik között a leggyakrabban felhasználható a következık: az analitikus trendszámítás a 3 pontos mozgóátlag módszer az exponenciális simítás módszere a Markov láncok a Box-Jenkins modell Második fıcsoport Mesterséges intelligencia, hozza tartoznak a következık: a Mesterséges neuronális hálók a Genetikus algoritmusok A függvénygenerátor a Trianguláris WAM (Weight-Activity-Modell) módszer. A CBR és AAA A dolgozatomban nem mindent használtam, de ebben a fejezetben megmutatom a rövid áttekintést ezekrıl a felett felsorolt módszerekrıl. 14
Irodalmi áttekintés 2.1.5.1 Analitikus trendszámítás A módszer lényege Manczel [29] alapján, hogy az idısor értékeihez a legkisebb négyzetek elvének megfelelı Analitikus vonalat, illetve függvényt illesztjük. A leggyakrabban alkalmazott függvénytípusok: egyenes vagy lineáris exponenciális hiperbolikus másodfokú vagy magasabb fokú parabola telítıdési görbék (pl.: logisztikus)[47] Lineáris esetben, teljes számításnál az egyenletben szereplı "a" és "b" értékeket a következı normálegyenletek segítségével közvetlenül számolhatók: y = na + b x xy = a x + b x 2 Ha x = 0, akkor a fenti egyenletek a követezıek lesznek: y = na xy = b x 2 Ebbıl az "a" az idı függvényében változó jelenség átlaga, "b" pedig az idıegység alatti változás átlagos értékét adja: a = y/ n b = xy / x 2 2.1.5.2 Mozgóátlag módszer A trendtényezı hatásának kimutatására illetve kiküszöbölésére a legegyszerőbb eszköz a mozgóátlagok számítása. E vizsgálati módszer során az utolsó megfigyelt értékekbıl átlagot számolnak, ami elısegíti a várt érték elırejelzését. Az eljárás elnevezése arra vezethetı vissza, hogy mielıtt újabb megfigyelésértékek állnak rendelkezésre, az elırejelzett adat kerül az elsı helyre. Ezért a megmaradt idıértékek egy egységgel hátrébb csúsznak, és a legrégebbi kiesik a számításból. [47] A trendet az idısor dinamikus átlagaként állítjuk elı úgy, hogy a véletlen ingadozások kiküszöbölését az átlagolás mővelete a periodikus ingadozás kiküszöbölését pedig az biztosítja, hogy a mozgóátlag tagszámát a periódus részidıszakainak számában vagy annak többszörösében állapítjuk meg. Mozgóátlagolással történı elırejelzés algoritmusa: 15
k k y = y t+ 1 t k + y t y t k+ 1 k ahol; y t+ 1 t+1 idıszakra történı becslés, ahol k a mozgó átlag tagszáma 16 Irodalmi áttekintés y t t-edik idıszak megfigyelt értéke (illetve ha az már nem áll rendelkezésre a mozgó átlag értéke y (t-k+1)-edik idıszak megfigyelt (vagy ha már nem áll rendelkezésre t-k+1 becsült értéke) [18] A 3 pontos mozgóátlag képlete: x x t-1 + x t-2 + x t-3 t = 3 x t :prognózis érték x t-1,x t-2,x t-3 :elızı idıszak megfigyelt értékei Az elırejelzés elkészítése ezek után úgy történik, hogy a lineáris regresszió adott idıpontra számított értékét módosítani kell az átlag értékével. [36] 2.1.5.3 Exponenciális simítás módszere E technika a mozgóátlagolás továbbfejlesztésének számít, ennél az eljárásnál is megállapítható, hogy a legaktuálisabb értéknek magasabb a prognosztikai jelentısége, s így nagyobb súllyal számítanak, mint a régebbi értékek. [32] e módszer alapján miután az idısort a trendhatástól mentesítésre került-, a következı képletek alkalmazásával kell az adatok simítását elvégezni: xˆ t = x ˆ t 1 + (1 α ) x t 1 α [1,1/a] [36], vagy S t = α x t + (1-α)S t-1 [1,1/b] [48] ahol xˆ t = prognózisérték(s t ), x t 1 = az elızı idıszak megfigyelt értékei(x t ), x ˆ t 1 = az elızı idıszak becsült értékei(s t-1 ), α = simító tényezı, értéke [0;1]. A képletbıl α meghatározása úgy történik, hogy a becsült adatok valóságtól való eltéréseinek négyzetösszegének minimumát kell megkeresni, s az ehhez tartozó α (opt) értékhez tartozó simított értékkel kell a lineáris regresszió értékeit
Irodalmi áttekintés módosítani, ez az érték adja az elırejelzést. A módszer elnevezése onnan származik, hogy a fenti képletbe behelyettesítve xˆ t 1-t, a következı összetett képletet kapjuk: xˆ = α x x, t 2 n+ 1 t 1 + α (1 α ) xt 2 + α (1 α) xt 3 + + α (1 α ) ahol az adatok exponenciálisan növekvı súlyt kapnak, minél régebbi az adat, annál magasabb fokút. [28] Az eljárás elınye, hogy megtartja a mozgó átlag módszer egyszerőségét, rugalmasságát, könnyen kezelhetıségét, de kibıvíti azt. A kívánalomnak és a célkitőzésnek megfelelı nagyobb súlyt kapnak azok az adatok, amelyek fokozottabb jelentıséggel bírnak az adott esemény várható, jövıbeli alakulása szempontjából. Ez azt jelenti, hogy idıben visszafelé haladva egyre kisebb jelentıséget tulajdonítunk a régebbi múlt adatainak, és nagyobb szerepet a frissebb információknak. Elıny még hogy számítógépes feldolgozásra alkalmas ez a módszer. Hátrányként említhetı, hogy az alkalmazás feltétele a megfelelıen hosszú idısor, mely a simításhoz szükséges és általában nehéz feladatot jelent, másik jelentıs feltétel, hogy az idısorban gyenge legyen a trendhatás, tehát megközelítıen stacionárius idısor szükséges, amelyben nincs számottevı periodikus hullámzás. 2.1.5.4 Markov láncok Azokat a sztochasztikus folyamatokat, melyeknél a folyamat egymást követı állapotai mindig csak a közvetlen megelızı állapotoktól függenek Markov folyamatnak, a diszkrét paraméterő Markov folyamatokat Markov láncnak nevezik.[33] Ismert eloszlások és a Markov egyenlet segítségével lineáris programozással optimalizálva elı lehet állítani a megoszlásokhoz tartozó átmeneti valószínőségi mátrixot.[50] t n r k jt = k it 1 p ij + i = 1 v jt p ij = i r = 1 0 1 p ij 1 i=1, 2, 3,..., r j=1, 2, 3,..., r jt r + = ( k it 1 p ij + v jt + v jt i = 1 k ) 17
Irodalmi áttekintés + v jt 0 v 0 jt r T + ( v jt + v jt ) = MIN j = 1 t = 1 A kezdeti állapotból és az M átmeneti valószínőségi mátrix hatványaiból kiszámítjuk a késıbbi állapotok bekövetkezésének valószínőségét. 2.1.5.5 Box-Jenkins modell A sztochasztikus idısor elemzésben központi szerepet játszanak az ARMA modellek. Az eljárás lépéseit Hunyadi [27] alapján ismertetem: Elsı lépés annak eldöntése, hogy a megfigyelt idısor stacionárius-e, illetve stacionáriussá tehetı-e. Második lépés az azonosítás (identifikáció), azaz a modell jellegének meghatározása. Ez nem csupán a folyamat jellegét, de rendparaméterét is meghatározza. A modellválasztást követi a paraméterek becslése (maximum likelihood módszerrel). Negyedik lépésben a becsléseket kell tesztelni, hogy értékeik szignifikánsan eltérnek-e a 0-tól. Ötödik lépésben, ha a választott és becsült modell a teszt alapján jól alkalmazható az idısorra, elırejelzések készíthetık a modellel. [27] Az alábbi ábra a fenti modellezés folyamatát mutatja be. A Box-Jenkins modellezés sémája START 3 ábra STACIONÁRIUS-E TRANSZFORMÁCIÓK AZ IDÔSOR NEM (differencia, logaritmus) IGEN IDENTIFIKÁCIÓ (p, q) PARAMÉTERBECSLÉS (φ és θ) φ és θ SZIGNIFIKÁSAK-E NEM IGEN ELEMZÉS, ELÔREJELZÉS KÖZLÉS IDENTIFIKÁCIÓ MÓDOSÍTÁSA STOP Forrás:Hunyadi,1992 18
Irodalmi áttekintés 2.1.5.6 A Mesterséges neuron hálók A mesterséges intelligencia kutatás végsı feladata egyfajta megközelítésben a környezetük bonyolultságával megbirkózni képes, intelligens rendszerek építése. Ez az ambiciózus feladat igen sok részfeladatot tartalmaz és ezért igen fontosak az olyan általános eszközök, amelyek a lehetı legtöbb feladat megoldására alkalmasak. A mesterséges neurális háló: egy feldolgozó eszköz, egy algoritmus vagy egy hardware, amely abból a célból kerül kialakításra, hogy úgy tervezzen és mőködjön, mint az emberi agy és annak komponensei (összetevıi, alkotóelemei). A legtöbb mesterséges neurális hálónak szüksége van egy rövid tanuló szakaszra, amelynek alapján a kapcsolatok zömét hozzáigazítja a - tanuló szakaszban - bemutatott mintához. Más szavakkal, a mesterséges neurális háló tanul a példából, mint a kisgyermek, aki megtanulja felismerni a kutyát sok különbözı kutya alapján, és mutat néhány szerkezeti általánosító képességet. A mesterséges neurális hálóban természetesen nagy jelentısége van a párhuzamok felismerésének, mivel ezek elemeinek számítása egymástól független.[41] Késıbb a MNH-rıl mutatom be részletes leírást. 2.1.5.7 Genetikus algoritmusok A genetikai algoritmusok valószínőleg a mesterséges élet legérettebb módszerei, melyeket alkalmaztak már gyakorlati problémák sokaságának a megoldásához (pl. matematikai optimalizálási problémák, mőszaki fejlesztés, alakfelismerés, a pénzpiacok elırejelzései, ökológiai modellezés és a szociális kooperációk keletkezésének magyarázatához. A genetikai algoritmusok alapvetı komponensei: az individuumok egy populációja a szelekció, a reprodukció, a Cross-over és a mutáció A genetikai algoritmusok olyan keresési rendszerek, melyek képesek jó megoldásokat találni a sok csúccsal, völggyel vagy szakadékkal teli nehéz megoldási térben.[42] A genetikai algoritmusoknak is vannak gyengéi. A genetikus algoritmusok alkalmazásával akkor érdemes kísérletezni: ha a probléma keresési tere kezelhetetlenül nagy, nem ismert a struktúrája, nem áll rendelkezésre terület specifikus tudás, nem ismert egzakt, gyors algoritmus, nincs szükség a pontos globális optimumra, csak egy stabil, jó közelizés kell.[24] 19
Irodalmi áttekintés 2.1.5.8 A függvénygenerátor A mesterséges idegi hálók egyik speciális fajtája a függvénygenerátor, melynek legfontosabb eltérése az egyéb MNH-tól, hogy nem parametrizált függvénykapcsolatot keres az alapadatok között, hanem véletlenszerően választott (RND=random) mőveletekkel állítja elı a függvényt.[40] Mőködési sémája az következı ábrán látható. 4 ábra A függvénygenerátor mőködése INPUT OBJEKTUM-ATTRIBUTUM -MÁTRIX primer és szekunder adatokkal TRANSZFORMÁCIÓK FÜGGVÉNY(hipotézis)= =FÜGGVÉNY(eddigi legjobb)rnd(mûvelet)rnd(változó) NEM MINÔSÍTÔRENDSZER Jobb-e FÜGGVÉNY(hipotézis), mint FÜGGVÉNY(eddigi legjobb)? IGEN GÉPI OUTPUTOK hibacsökkenést kiváltó kiegészítô mûveletek kódjai HIBASZINT AKTUALIZÁLÁS HIBASZINT(eddigi legjobb)=hibaszint(hipotézis) STOP FELTÉTEL ÁTLAGHIBA(munkaadatok)-ÁTLAGHIBA(tesztadatok)< ε NEM GRAFIKUS ELLENÖRZÉS ok-okozati összefüggések grafikus ellenörzése ALTERNATÍV MEGOLDÁSOK részösszefüggések korrekciója szakértôi beavatkozással a hibaszintek egyidejû ellenôrzése mellett SZAKÉRTÔI OUTPUTOK részösszefüggéseket módosító transzformációk listája Forrás:Pitlik,1994/c Az automatizált probléma specifikus függvénygenerálással a tanulás során elérhetı egy olyan optimalizált pontossági érték (meghatározott hibaarány), mely alapján elvárható a jövıre vonatkoztatott találati arány transzfer. A teszt folyamatban ez csak megerısítésre kerül. 20
Irodalmi áttekintés 2.1.5.9 WAM (Weight-Activity-Modell) módszer A magyar szakirodalomban lehet megtalálni az MNH alternatívát - ez a WAM. A WAM (Weight Activity Modell) az új generációs eljárásokon belül a generátor-modellek közé sorolt módszer, amely az elırejelzési feladatok megoldásában az elérhetı maximális pontosságot közelíti. A mesterséges intelligenciák csoportjába tartozó program, amely a Gödöllıi Agrártudományi Egyetem Gazdasági Informatika Tanszékének kutatásai során egy 10 éves projekt eredményeként jött létre az 1996-os évben.[43] A Trianguláris WAM módszer: Az eljárás lényegében egy újonnan kifejlesztett kombinatorikai és mesterséges intelligencia alapú módszer. A trianguláris WAM (Weight-Activity-Modell = Súlyok és aktivitások) módszer lényege, hogy az alapadatok transzformációjával létrehozunk egy olyan idısorosan oszloponként egy helyi értékkel elcsúsztatott mátrixot, amely az egymás után idıben következı adatok egymáshoz viszonyított növekedését (1), illetve csökkenését (0) tükrözi. Ezekhez véletlenszerően generálunk egy számot, és egy mőveleti jelet, majd e három érték (0/1, a hozzá tartozó szám és mőveleti jel) összefőzésével újabb mátrixot kapunk. Ennek a mátrixnak a visszanyúlási mélységnek megfelelı sor és oszlopértékeinek összegzésével kapjuk a változás irányát jelzı értéket, ha összehasonlítjuk a véletlenszerően generált küszöbértékkel, mely a mátrix minimum és maximumeleme között helyezkedik el (0/1), ha az elsı mátrixban található értékkel megegyezik az adat, akkor jó az elırejelzés.[43] 2.1.5.10 Hasonlósági függvények (CBR és AAA) Az eset alapú következtetés (CBR = Case Based Reasoning) az emberi gondolkodás algoritmikus közelítésével mőködik, a múltbéli események (esetgyőjtemény) között keres olyan jelenséget, amely hasonlít a jelenbeliekhez, és a múltban hasonló után következı eseménye(k) a hasonlóság alapján megfelelıen transzformálva képezi(k) az elırejelzési értéke(ke)t. Az adaptív autonóm ágensek (adaptív döntési automaták, AAA) a hasonlóság gondolatvilágából kiindulva mőködnek, de futás közben a jelen események folyamatos feldolgozásra kerülnek (bıvítve az esetgyőjteményt), és a hasonlóság dinamikus újraértelmezésre kerül. Így a jelenben zajló események folyamatosan befolyásolják az elırejelzést.[36] 21
Irodalmi áttekintés 2.2 A neuronális hálók fogalma és felépítése algoritmusok, tanulás, megállapítások és átfogó szabályok 2.2.1 A neuronális hálók struktúrája A neuronális hálók matematikai struktúrát jelentenek, mely az emberi agy mőködésének néhány aspektusát imitálja és olyan lehetıségeit demonstrálja mint az informális tanulás képessége, a nem osztályozott információk klaszterizációjának és általánossá tételének képessége, a már megadott idısorok alapján prognózis önálló felépítésének a képessége. Legfıképpen abban különbözik más, például a szakértıi módszerektıl, hogy elméletileg a neuronális hálóknak nincs szükségük egy korábbi ismert modellre, hanem maguk építik azt kizárólag a megadott információk alapján. Pontosan ezért a neuronális hálók és a genetikai algoritmusok vonultak be a gyakorlatba mindenhol, ahol elırejelzés, osztályozás, irányítás feladatait kell megoldani, más szóval, az emberi tevékenység azon területére, ahol rosszul algoritmizálható feladatok vannak, melyek megoldására vagy képzett szakértık csoportja folyamatos munkájára vagy az automatizálás adaptív szisztémáira - ilyenek a neuronális hálók is - van szükség.[6] 2.2.2 A neuronális hálók fogalma A mesterséges neuronális háló (MNH, neuronális háló) egymással egyesült neuronok készlete. Rendszerint minden neuronális átadó függvénye a hálóban fixált, és a háló paramétereit a súlyok adják, melyek változhatnak is. Némely neuronális bemenet mint a háló külsı bemenete került megjelölésre, némely kimenet pedig mint a háló külsı kimenete. Ha a háló bementére bármilyen számot adunk, akkor számok valamilyen készletét kapjuk a háló kimenetein. Ily módon a neuronális háló munkája a bemeneti vektor átalakítása kimeneti vektorrá, mellesleg ez az átalakítás a háló súlyai szabják meg. A neuronális hálók a negyvenes években jelentek meg, a pénzemberek azonban csak a nyolcvanas évek végén kezdték használni, amikor a neuronális hálók alapvetı osztályainak összetartását bebizonyították és lényegesen javítottak a felismerés pontosságán.[1],[6],[22] 2.2.3 A háló mőködése és tanulása A neuronális hálók mőüdése abban áll, hogy valamilyen valós illetve feltételezett függvénykapcsolatot a küszöbértékek és a súlyok célirányos változtatásával képesek megtanulni és azt következetesen alkalmazni. A jelentségük abból fakad, hogy az emberi agyhoz hasonlóan kapcsolatokat keresnek, s egy önmagának nem ellentmondó bemenı és kimenı értékeket tartalmazó feltételrendszer esetén képesek is függvénykapcsolatot találni. Ez 22
Irodalmi áttekintés azért jogosíthat fel nagy reményekkel, mert egy olyan feltételrendszert tekintve, mint egy értékpapír árfolyam alakulása (feltéve, hogy ellentmondásmentes), ahol függvénykapcsolat humán intelligenciával nemigen fedezhetı fel egykönnyen, ott elég sok futtatás után képes azt úgy megtanulni, hogy a tesztidıszakban is biztos elırejelzést produkáljon A háló felépítésének folyamata a háló típusának (felépítésének) kiválasztása a háló súlyainak kiválasztása, a háló tanulása Az elsı lépésben a következıket kell kiválasztani: milyen neuronkat szeretnénk használni (bemenetek száma, átadó függvények), milyen módon kell egyesíteni egymással ezeket, mit vegyünk a háló bemenetéül és kimenetéül. És a második lépésben kellene megtanulni a kiválasztott hálót.[6] 5 ábra A háló tanítása A háló tanításának folyamatban követkızı letéznek: fokozatosan jön a MNH súlyainak hozzáigazítása Forrás: Kruglov, Borisov,2001 Például a back propagation training algoritmus szerint. Eredetileg minden súlyegyütthatók megállapíthatnak véletlen egyenletesen elosztva számokkal 0- tól 1-ig. Melyiket utána hozzáigazítjuk minden következı lépésben szabály k k k k 1 szerint: w ( t + 1) = w ( t) + h δ x, ahol k rétegszám(0 réteg ez bemenet vektor, elsı réteg ez rejtett réteg, második réteg ez kimenet réteg a háromrétegő neuronális háló eseten); t tanulás lépese, h tanulás sebessége; x bemeneti réteg érteke(0 rétegben ez háló bemenet, elsıben ez rejtett réteg k kimeneték); δ a súlyértékek korrelációja.[6] 23
példák ismétlése: 10 2 10 6 felmutatások. tanulás ideje percek órák. Irodalmi áttekintés A neuronháló tanulásához nem elegendı megalkotni a bemenetek-kimenetek tanuló készletét. Ugyanúgy szükséges a háló elırejelzésének hibáját meghatározni. A hibák függvénye (a célhiba, hibafüggvény) célfüggvény, célhiba, mely megköveteli a minimalizációt a neuronháló irányított tanulásának folyamatában. A hibafüggvény lehetıvé teszi, hogy a tanulás során a neuronháló munkájának minıségét értékeljük. E n 1 kívánt valódi ( w) = ( y i yi ) 2 i= 1 2 1 2 ( y j. p d j. p ) ( N ) vagy E( w) = j. p A hiba visszafelé történı kiterjesztésének módszere (Back propogation, backprop) vagy a háló tanulásának hibájának hozzáigazítása - a többrétegő perceptronok tanulásának algoritmusa, mely a hibafüggvény gradiensének 2 E [4] ( n) kiszámolásán(gradient descent) alapul. ωij = η [16] ω Mindenegyes neuronháló rétegében található neuron súlyainak tanulása során javításra kerül sor azon jelzések figyelembe vételével, melyek az elızı rétegbıl lépnek elı, és minden réteg csatlakozási hibája, mely rekurzív módon kerül kiszámításra a legutolsó rétegtıl kezdve (ahol az a háló kimenetei szerint kerül meghatározásra) visszafelé az elsıig Amikor a háló megtanult, ez azt jelent, hogy abban az esetben a háló abbahagyta a tanulást, ha újratanulás effektusa lépett fel, vagy ha a hiba nem csökkent a kontrolhalmaz következı ellenırzésével az egész tanuló halmaz tízszeri átfutása során, ezután következı lépesként lehet alkalmazni a háló az új eddig hálónak ismeretlen adatokra. 6 ábra A háló alkalmazása ij Forrás: Kruglov, Borisov,2001 24
2.2.4 A neuronális hálók módszerei Irodalmi áttekintés A neuronális hálók módszerei önálloán is használhatóak, vagy a statisztikai analízis hagyományos módszereinek kitőnı kiegészítıiül is szolgálhatnak, mely hagyományos módszerek többsége olyan modellek felépítésével kapcsolatos, melyek ilyen vagy olyan feltételezéseken és teoretikus következtetéseken alapulnak (például, hogy az ismeretlen függı lineáris vagy hogy némelyik változó normális elosztással rendelkezik). A neuronális hálós szemlélet nem áll kapcsolatban ilyen jóslásokkal, egyedül a lineáris és a bonyolult nem lineáris függıségekre alkalmas, és különösen effektív az adatok felderítı analízisében, amikor az a cél, hogy a kiderítsük, az adott változók között állnak-e fenn függıségek. Mindezek mellett az adatok lehetnek nem teljesek, egymásnak ellentmondóak sıt eredendıen torzítottak is. Ha a bemeneti és kimeneti adatok között kapcsolat áll fenn - ha az nem is tárható fel a hagyományos korrelációs módszerekkel -, akkor a neuronális háló képes automatikusan beállni arra a megadott pontossági fokkal.[18] Mindezeken kívül a modern neuronális hálók rendelkeznek kiegészítı lehetıségekkel: lehetıvé teszik a különbözıféle bemeneti adatok hasonlító fontosságának értékelését, térfogatának/terjedelmének csökkentését anélkül, hogy lényeges adatokat elveszítenénk, kritikus szituációk közeledtekor a szimptómák felismerését stb. Részletesén a módszerekrıl lesz szó tovább. 2.2.5 A neuronális rendszerek tulajdonságai A neuronális rendszerek más rendszerektıl eltérı tulajdonságai a követezıek: bármely folyamatot le lehet írni több-kevesebb, jobb-rosszabb stb. kategóriákban; nem pontosan megadott változókon is lehet számításokat végezni és a megadott pontossági fokkal kapni a eredményt; a hagyományos eszközökkel összehasonlítva jelentısen csökkenti a közbensı számítások mennyiségét, ami lényeges, amikor a döntéshozatal szigorú idıkeretekkel határolt; a folyamat nem pontos leírása esetén lehetıség nyílik az adatok nemcsak mennyiségi, de minıségi analízisére is.[16] 2.2.6 A neuronális hálók a gyakorlatban A gyakorlatban a neuronális hálók két formában használatosak mint programok, melyeket átlagos számítógépeken végeznek, és mint specializálódott készülék-program együttesek. A neuronális számítógépek alapfeladata a tanuláson alapuló jelek feldolgozása - ugyanaz, mint a biológiai neuronális rendszeré. 25