Blind Source Separation Kiváltott agyi jelek informatikai feldolgozása 1
Bevezetés Az EEG jelek elemzése során egyik fő nehézség a különböző források szuperponálásából kapott többcsatornás jelből az egyes források megállapítása Neuronális források, Artefact-ek BSS Kevert jelből bizonyos tulajdonságok alapján eltérő források elkülönítése Statisztikai függetlenség, Ritka jelek, Időben, frekvenciában, vagy idő-frekvencia térben való elkülönülés, Időbeli megjósolhatóság, Simaság. 2
BSS Modell 3
Lineáris modell A legtöbb lineáris BSS modell mátrix faktorizációként írható le Egy mátrix több mátrix szorzataként való felírása (dekompozíció). Legyen X a megfigyelési mátrixunk (a mért EEG többcsatornás jel): X = HS + V X = x 1, x 2,, x N szenzor jelek S = s 1, s 2,, s N ismeretlen források V = v 1, v 2,, v N ismeretlen zaj Y = WX Y = y 1, y 2,, y N ismeretlen források 4
BSS változók Változó Leírás Mátrix dimenziója S Ismeretlen forrás n x N X Megfigyelés(szenzor jelek) m x N (m >= n) Y Becsült források vagy független komponensek n x N H Ismeretlen keverési (mixing) mátrix m x m or n x m W Szétválasztó mátrix (demixing) m x n or n x n G=WH Globális (mixing-demixing) mátrix m x n or n x n Abban az esetben, ha n > m, a W mátrix nem szükségszerűen létezik. Ilyenkor cél a H meghatározása, ezután pedig valamilyen a priori tudás alapján (ritka, nem-negatív, sima, korrelálatlanság, statisztikai függetlenség) a források meghatározása. 5
Források-szenzorok száma Az esetek döntő többségében a források száma nem ismert. Attól függően, hogy a források száma és a mért jelek száma hogyan aránylik egymáshoz, a következő esetek lehetségesek: A teljesen meghatározott esetben a források száma megegyezik a mért jelek számával. A túlhatározott esetben a keverékek száma több, mint a forrásoké. Az alulhatározott esetben a források száma több, mint a keverékeké. Ilyenkor a fenti BSS sémák önmagukban nem alkalmazhatók. A problémán segíthet a ritka jelek előfordulása. 6
ICA Independent Component Analysis Az ICA feladata a mért jelekből megállapítani, hogy azokat milyen források generálták. Az egyes forrásokról feltesszük, hogy azok függetlenek egymástól. A függetlenség mértékét könnyen leírhatjuk komponensek függetlenségével: Tekintsük az x(n) többcsatornás jelet, és annak x i (n) komponenseit. A komponensek függetlenek, ha p X p n m = p x x i n, i=1 ahol p(y) az együttes eloszlása a p y x i n marginális eloszlásoknak, m a független komponensek száma. 7
Késleltetés A korábbi egyenlet a BSS legalapvetőbb eljárása, amikor a forrásaink terjedési sebessége nem befolyásolja a mért jelet, valamint egy úton terjednek, visszaverődés nélkül. Abban az esetben, amikor az egyes források és az elektródák között késleltetés lép fel, konvolúciós modellről beszélhetünk. Megkülönböztetünk visszhangos és visszhang nélküli esetet. Az visszhang nélküli esetben a probléma a következőképpen módosul: m x i n = h ij s j n δ ij j=1 + v i n, i = 1,..., n e h ij és δ ij a j. forrás és az i. szenzor közötti csillapítás, illetve késleltetés. A szétválasztó folyamat ebben az esetben: n e y i m = w jix i m δ ji, j = 1,..., m 8 j=1
Visszhang Visszhangos esetben a fenti egyenlet a következő formájú lesz: m x i n = K j=1 k=1 h k ij s j n δ k ij + v i n, i = 1,..., n e A BSS feladata a W mátrix meghatározása a Y=WX formulában úgy, hogy az Y becsült források minél jobban közelítsék az eredeti S forrásokat. 9
W meghatározása A rendszer akkor valósít meg sikeres blind source separation-t, ha a G=WH globális mátrix permutációs mátrix: Négyzetes mátrix, aminek minden sorában és oszlopában pontosan egy helyen van 1-es, mindenhol máshol 0-s. Statisztikailag független források esetén ez azt jelenti, hogy a kovariancia mátrix R f y k = E f y k y T k diagonális mátrix. f y egy a források eloszlásától függő nem-lineáris transzformáció. A legtöbb ICA a következő adaptív eljárást alkalmazza a W meghatározására: W k = W k + 1 W k = μ k I R f y W k ahol μ k a tanulási tényező. 10
Zajos jelek Általános esetben a szenzoros jelek zajjal terheltek Interferencia, zaj Külön szenzorral (elektródával) mérhetünk referencia zajt (jelet), amelyet felhasználva azt kiszűrhetjük a többi mért jelből 11
BSS alapvető elvek, megközelítések Számos BSS eljárás van, amelyek különböző kritériumok szerint eltérnek Jelek reprezentációja Időbeli, Frekvenciabeli, Idő-frekvenciabeli Jelek statisztikai jellege Ritka (Sparse Component Analysis, SCA) Független (Independent Component Analysis, ICA) Simaság (Smooth Component Analysis, SmoCA) Nem-negatív értékek (nonnegative matrix factorization, NMF) Ezek kombinációja is lehetséges 12
Frekvenciában ritka tulajdonsággal rendelkező jel 13
Idő-frekvencia térben ritka jel 14
BSS alapvető elvek, megközelítések Ezek a BSS eljárások a felügyelet-nélküli tanuló eljárások osztályába tartoznak Cél: adathalmazok struktúrájának feltárása ICA: statisztikailag független komponensek feltárása PCA (principal component analysis): az adathalmaz minél alacsonyabb dimenzióban való leírása SCA: valamilyen térben ritka komponensek feltárása Az eljárások tiszta matematikai modellek és algoritmusok A kapott adatok értelmezéséről nem mondanak semmit A felhasználó feladata értelmezni azokat, és a saját tudása alapján a megfelelő eljárást kiválasztani 15
Többdimenziós jelek szűrése, rekonstrukciója (deflation) BSS végrehajtása után megtehetjük, hogy újra összerakjuk a jelet úgy, hogy egyes komponenseket kihagyunk/módosítunk Artefact-ek kiszűrése Zaj eliminálása Csupán adott források megtartása Lépések: Komponensek meghatározása Y = WX Komponensek eliminálása és a megfigyelésekbe (szenzor jelekbe) történő visszatöltése X r = W + Y r W + = H estim a keverési mátrix pszeudo inverze, Y r pedig a megfelelő komponensek eliminálása (pl. kinullázás) után kapott források jelei 16
Defláció megoldási lehetőségek (a) Szakértői döntés hard switch (b) Külső nemlineáris adaptív szűrők alkalmazása a komponensek szűrésére és a hard switch-ekhez (c) Alternatív puha döntés (soft decision) nemlineáris transzformációval 17
Lehetséges párhuzamos Deflation megvalósítás 18
Second-order BSS eljárások: AMUSE és SOBI 19
Algorithm for Multiple Unknown Signals Extraction AMUSE Időben eltolt korrelációs mátrixok alkalmazása Az AMUSE feltevései: A keverő A mátrix teljes rangú A komponensek térben dekorreláltak és alacsonyabb komplexitásúak A jelek időben korrelált sztohasztikus jelek nulla átlagértékkel A komponenseket sorba rendezi az időben eltolt kovariancia mátrixuk sajátértékei szerint Minden futásra ugyanazt az eredményt adja Két egymás utáni PCA eljárásként tekinthető Bemenő adatok fehérítése PCA elvégzése az előző fázis kimenetének idő-késleltetett kovariancia mátrixán 20
AMUSE Első lépés: kovariancia mátrix kiszámítása 0 időeltolással R X = E x t x T t = R x 0 = 1 N x k xt k Második lépés: sajátérték-sajátvektor felbontás (SVD, singular value decomposition) R X 0 = UΣV T = V x Λ x V x T = V s Λ s V s T + V N Λ N V N T ahol Σ diagonális mátrix a sajátérékekkel, V pedig a sajátvektorok mátrixa Fehérítsünk 12 z k = Λ s V T s x k = Qx k Becsüljük meg a kovariancia mátrixot egy 0-tól eltérő p időeltolásra N R z p = 1 N k=1 z k z T k p = U z Σ z V z T A szétválasztó mátrix becslése: 1 W = H 1 = U T Q = V s Λ 2 s U z H = Q T U y k = sƹ k = U T z z k 21
Second-order Blind Identification (SOBI) Az AMUSE-al ellentétben, amely SVD-t alkalmaz diagonizálásra, a SOBI joint diagonalization eljárást használ Több mátrix egyszerre diagonizálása Eljárások: Jacobi mátrix diagonizálás, Alternating Least Squares, Parallel Factor Analysis Kovarianciamátrixokat állítunk elő több időeltolással és ezeket egyszerre diagonizáljuk R z p i = 1 N z k zt k p = QR z p i Q T Joint approximate diagonalization (JAD) technika alkalmazása az R z p i mátrixokon T R z p i = UD i U 22
Alzheimer-kór korai felismerése BSS alkalmazásával 23
Alzheimer-kór Az Alzheimer-kór gyógyszeres kezelése korai stádiumban hatékony, ám ennek diagnózisa nehéz Kutatások kimutatták, hogy a kórnak van korai tüneti időszaka, amely évekig tart, neuronális tüneteket produkál, ám a klinikai tünetek nem, vagy csak kis mértékben megfigyelhetőek Általános tünet, hogy az EEG-ben mért energia a mélyebb frekvenciák felé tolódik el Alkalmas mérés lehet az EEG jelek vizsgálata 24
Eredmények Az AMUSE után az első 5-7 komponenst használták a kimenetek újra előállításához EEG frekvencia-sávok szerint szűrték az EEG jelet (egyszerűség kedvéért minden mért sávonkénti energiát minden elektródára átlagolták). Kék: AD betegek Piros: korai stádiumú AD Zöld: egészséges kontroll populáció 25