Technológiai-üzemeltetési stratégiák csoportosítása hisztorikus idsorok szimbolikus epizód reprezentációján alapulva Balaskó B., Németh S., Abonyi J. Pannon Egyetem Folyamatmérnöki Tanszék
Tartalom QTA: Kvalitatív Trend Analízis Elméleti háttér Szegmentálás (háromszög epizódok) Szekvenciaillesztés Demonstratív példa szintetikus adatsoron Alkalmazási példa valós adatsorokon 2
QTA: miért? Statisztikai értékelések támogatása Hibás következtetések kiszrése Információtartalom Emberközelibb értékelés Érthetség A priori ismeretek alkalmazhatósága Konkrét cél: többtermékes technológia termékváltásainak minsítése 3
QTA lépései 1. Nagy mennyiség adat kezelése Dimenziócsökkentés: Sammon, PCA Adatkompresszió: Mintavételezés (pl. Shannon technika) Illesztés függvényekkel vagy spline-okkal Szegmentálás 4
QTA lépései 2. Idsorok összehasonlítása Távolság értelmezése: technikánként eltér, pl. Normák alkalmazása, pl. Euklédeszi Transzformációs távolság Illesztés Megfelelségi fok alapján (Sundarraman) Legrövidebb út alapján (DTW) 5
Új technika 1. Adatkompresszió: - Fkomponens analízis (PCA) - Szegmentálás háromszög epizódok szekv. 2. Illesztés: bioinformatikai szekvenciaillesztés DABCDABCDADABC : GABCDA--DADAB- 6 Pl. szakirodalomból
Az algoritmus mködése Fkomponens elemzés Fkomponens elemzés Adatszrés Adatszrés Szegmentálás Szegmentálás 7 Epizódok fuzzifikálása Szekvenciaillesztés Epizódok fuzzifikálása
Fkomponens elemzés (PCA) Dimenzionalitás csökkentése (normalizált, nulla várható érték adatok): 2-D 1-D X 2 Y 2 * * * * 1 * * * * * * * * * * * * * * * * * * * * 8 X 1 Id
Adatelkészítés: szrés Gauss szr alkalmazása Egyparaméteres szr egyenlet (σ): F ( σ, t) f ( t) g( σ, t) = f ( u) σ növelésével a trend nagyfrekvenciás jellege eltnik, inflexiós pont párok (ezzel epizód párok) tnnek el, a trend domináns jellege megmarad ( t u) + 1 = exp 2 σ 2π σ 2 du 9
Szegmentálás: alapok Adott függvényérték és deriváltak esetén Folytonos Állapotok definiálhatósága: FÁ(x,t) = { x(t), x (t), x (t) } Trend: folytonos állapotok szekvenciája Kvalitatív állapot: nemdefiniált,ha x nemfolyt.t -ben KÁ( x, t) = [ x( t), ] [ x (' t), ] [ x (' t) ], egyébként ahol [x(t)], [x (t)] és [x (t)] értéke {-, 0, +} lehet. 10 Epizód: az a maximális idintervallum, ahol a függvény kvalitatív állapota konstans
Szegmentálás: grafikus reprezentáció Primitív epizódok + Fuzzifikálás változás és idtartam szerint + 11
Szegmentálás: grafikus reprezentáció 7 féle epizód csoport {A,B,C,D,E,F,G} 9 féle Fuzzy alcsoport {s,m,l} {s,m,l} kivéve {G}, ahol csak idtartam szerint 57 féle leíró szimbólum {ssa,,lsc,lmc,,lg} 12
Távolságok definiálása Távolság metrika követelményei: w(xx) = 0; w(xy) = w(yx); w(xy) + w(yz) w(xz); Ezek helyett hasonlósági metrika: pontértékek ( score ) s(xx) = 10; s(xg) = s(gx) = 2; s({a,d,e}{b,c,f}) = s({b,c,f}{a,d,e}) = 0; Nem teljesíti a háromszög egyenltlenséget Analóg hasonlósági mátrix a fuzzifikációhoz 13
Szekvenciaillesztés Bioinformatikából: aminosav-szekvenciák összehasonlítására +1 szimbólum: gap, beszúrás / törlés; Elre definiált szimbólumtávolságok ill. ezek reciproka a scoring matrix -ban; Dinamikus programozási mátrix, elemei transzformációs súlyok helyett hasonlósági pontértékek; A legkisebb súlyú / legmagasabb pontérték út az optimális illesztés; 14
Demonstratív példa: szegmentálás Sin(x)/x függvény, beszúrt G epizód, eltér x-tartomány; Fuzzifikálás határértékei: H m =[0.1, 0.3], H i =[10, 30] 15
Demonstratív példa: illesztés Primitív epizódok optimális illesztése: ( : mutációt, illeszkedést jelöl) 8/11 = 73 % 72 pont (max. 110) Fuzzy epizódok optimális illesztése: ( / legalább egy attribútum szerinti mutációt jelöl) 2/11 = 18.2 %, 55,2 pont 16
Alkalmazási példa: TVK Rt. PP-4 üzem Többtermékes technológia, polipropilén gyártás: Homopolimerek (H1-H6) Kopolimerek (C1-C11) Elpolim. Reaktor + Két, sorban kötött hurokreaktor Gyakori termékváltás más tulajdonságú polimerre Ciklikus termékváltások (MFI le- majd fellépcszés): H1 H6 C1 C11 H1 a termékváltások menedzselése az üzem szempontjából kritikus! 17
Alkalmazási példa: minsítés Termékváltások összehasonlítása Figyelembe vett változók (5-D): Hidrogén betáplálási koncentrációk (két reaktorba); Katalizátor betáplálás (els reaktorba); Reaktor hmérsékletek (két reaktorban); 2 órás vizsgálat/váltás, 15 mp adatgyakoriság; H5 H6 C1 H3 H4 Fuzzifikálás határértékei: H m =[0.005 0.05], H i =[10 30] 18
Alkalmazási példa: eredmény 19 kg/h kg/h kg/h kg/h g/h g/h Y o C o C Y o C o C 0.02 0.2 6 10 x 10-3 smc.smb.slb.slc.sld.smd.sla.slb.smc.ssb.smb.slc.smd.sma.smb.slc..sg. 26 C9C10 0 29 0.1 H1H2 25 C8C9-0.02 22 05 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2C5C6 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 28 4 C11H1 0.01 18 0.2 H6C1 17 H5H6 0.150 C4C5 6 0 Optimális illesztés 15 0.1 H3H4-0.01 24 2 C7C8 0.05 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 0 smb. Identities 0.2 slc. 0.4 0.6 smd. = 0.8 16/20 1 slb. (80%) 1.2 ssb 1.4 slc. smc. slb. sld. sla. smc. ṡmb. smd. 1.6 sma. 1.8slC. C6C7 8 smb..sg. 2 C3C4 5 0.05 950-5 13 H1H2 0 C---BBCDDABCBBCDABCG 50 100 150 200 250 300 350 400 450 500 9000 Adatpont C2C3 4 C1C2 3 8500 27 C10C11-0.05 8000 0.2 smc.sld.sla.ssa.ssb.smb.smc.smd.ssd.sla.smb.smc.slb.slc.ssd.sma.smb.smc..mg. 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2C5C6 7 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 0.3 70.25 x 19 CDAABBCDDABC-BCDABCG C1C2 10-3 C7C8 9 0.25 11 C10C11 70-20 0.2 C8C10 69.8 30 H2H3 0.15-5 69.60 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 H5H6 1 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 20 70.55 x C2C3 0.1 10-3 12 C11H1 0.05-4 23 C6C7 0 smb. slc. smd. slb. ssb. slc. sma. slc. 16 H4H5 700 smc. slb. sld. sla. smc. smb. smd. smb..sg. 21 C3C5-0.05-5 14 sld. ssa. 69.50 smc. 0.2 sla. 0.4 ssb ṣmb. smd. sla. smc. slc. 0.6 smc. ssd. 0.8 1smB. 1.2slB. 1.4 ssd ṣma. H2H3 smc. 1.6 smb. 1.8.mG. 22 0 0.2 0.4 0.6 0.8 Id 1(óra) 1.2 1.4 1.6 1.8 2 H6C1-0.1-6 0.2 0.4 0.6 0.8 Id (óra) 0 0.12 8 50 100 0.1 10 150 0.08 13 200 250 1 0.06 17 300 1.2 0.04 350 1.4 25 400 1.6 0.02 50 450 1.8 500 2 Adatpont Id (óra) Y Y
Lehetséges alkalmazások Gyakori szekvenciák keresése Minsítés, pl. termékváltások Szabályozott jellemzk idsorának összehasonlítása, Reaktorokban Eltér idpontbeli mveletek esetén Eltér katalizátorrendszer esetén Osztályozás, csoportosítás 20
A módszer problémái A PCA nem tartalmazza az idt, mint változót; Egy PCA modell alkalmazása az összes típusú termékváltáshoz nem kielégít; A σ szrési paramétertl való nagyfokú függés; Megközelítleg azonos hosszúságú szekvenciák esetén talál kielégíten jó megoldást; Az epizódok nem rangsoroltak az illesztés során; 21
Jövbeli tervek Dinamikus PCA alkalmazása; Probléma-specifikus σ meghatározása; gap büntetés eltörlése; Súlyozott epizód pontszámok a varianca és a hossz tekintetében; 22
Köszönöm a figyelmet! 23