Adaptív csatornakiegyenlítő algoritmusok vezetéknélküli hálózatok teljesítőképességének növelésére Kovács Lóránt PhD értekezés témavezető: Dr. Levendovszky János egyetemi tanár, MTA Dr Budapesti Műszaki és Gazdaságtudományi Egyetem Híradástechnikai Tanszék 2007
Nyilatkozat Alulírott, Kovács Lóránt kijelentem, hogy ezt a doktori értekezést magam készítettem és abban csak a megadott forrásokat használtam fel. Minden olyan részt, amelyet szó szerint, vagy azonos tartalomban, de átfogalmazva más forrásból átvettem, egyértelműen, a forrás megadásával megjelöltem. Budapest, 2007. máj. 30. Kovács Lóránt A bírálatok és a védésről készült jegyzőkönyv a későbbiekben a Dékáni Hivatalban érhetőek el. i
Köszönetnyilvánítás Köszönöm témavezetőmnek, Dr. Levendovszky Jánosnak azt a sok segítséget, ami nélkül nem jöhetett volna létre ez a dolgozat. Továbbá köszönöm a Híradástechnikai Tanszéknek, hogy minden segítséget megadott a munkához. Tanáraimnak is hálával tartozom, hogy megalapozták az elméleti hátteremet a kutatómunkához. Végül köszönetet mondok tanszéki doktorandusz társaimnak, különösképpen Jeney Gábornak, Fancsali Alpárnak és Oláh Andrásnak folyamatos segítőkészségükért.
Kivonat Napjainkban, az e-világ (e-szolgáltatások, e-adminisztráció) térhódítása következtében, robbanásszerűen megnőtt a hálózati kommunikáció iránti igény. Az új szolgáltatásokat egyre többen mobil hozzáférésen keresztül kívánják igénybe venni, amely viszont ellentmondásban van a nagy adatátviteli sebesség igényének, hiszen a rendelkezésre álló megfelelő terjedési tulajdonságokkal rendelkező rádióspektrum véges. Ezek alapján a kommunikációs technológiák fő kihívása a keskenysávú, ugyanakkor nagy adatátviteli sebességű hozzáférés biztosítása. A nagy adatátviteli sebességű mobil szolgáltatások jövője tehát azon múlik, hogy a rendszerek spektrális hatékonyságát sikerül-e az egyre olcsóbbá és hatékonyabbá váló jelfeldolgozási hátteret kihasználva algoritmikus eszközökkel javítani (ahol a spektrális hatékonyság intuitív definíciója az 1 Hz-es fajlagos sávszélességen megvalósított adatátviteli sebesség). A dolgozat a spektrális hatékonyság növelését a detekció területén új csatornakiegyenlítő eljárások bevezetésével oldja meg. Ennek megvalósítása az alábbi algoritmikus megoldásokkal érhető el: a jelzési sávszélesség csökkenthető a tanulósorozat elhagyásával, ami tanár nélküli (más szóval "vak", "blind", "unsupervised learning") tanuló algoritmusok alkalmazásával biztosítható; a tradícionális négyzetes hibát minimalizáló módszereknél hatékonyabb, minimális bithibavalószínűséget eredményező kiegyenlítő algoritmusok bevezetésével; pontos és optimális számítási erőforrás-kihasználást biztosító csatornaidentifikáció megvalósításával. A fentiek alapján a disszertáció az algoritmikus fejlesztésre összpontosít, két kérdést tisztázva: (i) a kiegyenlítő stacionér állapotában való optimális működésének a megmutatása adott kritérium szerint, (ii) a sztochasztikus értelemben vett konvergencia bizonyítása és a konvergenciasebesség-, valamint a teljesítőképesség analízise szimulációk segítségével. Így a dolgozat olyan algoritmusokat szolgáltat, amelyek teljesítőképessége diszciplináris eszközökkel bizonyított, illetve direkt módon alkalmazhatóak valódi kommunikációs rendszerekben. A tézisekben a fentebb megfogalmazott motivációk alapján a következő eredményeket ismertettem: Vak adaptív algoritmust (ADM) konstruáltam, amely képes gyengén stacionér sztochasztikus sorozatok dekorrelálására. Megmutattam ezen algoritmus alkalmasságát többfelhasználós kódosztásos rendszerek Zero-Forcing-típusú kiegyenlítésére. A Kushner-Clark tétel segítségével bizonyítottam az algoritmus 1-valószínűségű konvergenciáját a csatornamátrix inverzéhez. i
ii Megadtam az ADM algoritmus kiterjesztéseit: (i) amely az additív Gauss-zaj hatását is figyelembe véve pontosabban képes megtalálni a csatornamátrix inverzét, (ii) amely Polyak és Juditsky eredményeinek alapján átlagolással képes a konvergencia sebességének a növelésére. Megadtam a döntésvezérelt LMS algoritmus konvergenciájának bizonyítását a Kushner- Clark-tétel segítségével. Megmutattam, hogy az optimális, a bithibavalószínűséget közvetlen minimalizáló kiegyenlítő algoritmus exponenciális komplexitása miatt valós időbejű kiegyenlítésre nem alkalmazható, ugyanakkor a bithibavalószínűség statisztikus mintavételezésen alapuló, jó teljesítőképességű, real-time algoritmusokat vezettem be. A csatornaidentifikáció feladata kapcsán új, a modell fokszámot adaptívan becslő algoritmust javasoltam, amely segítségével az egyetlen DSP-n párhuzamosan futó identifikációs feladatok között optimális erőforrás-allokáció, és ezáltal optimális erőforráskihasználás valósítható meg. A tézisekben bemutatott új algoritmikus eszközökkel a mobil rádióátvitel bithibaaránya jelentősen javítható a sávszélesség növelése nélkül, miáltal az egész rendszer spektrális hatékonysága jelentősen javul.
Novel adaptive channel equalization algorithms for increasing the efficiency of wireless communication systems Executive summary Wireless communication and networking tend to have a deep penetration into present-day society. Services and trends such as e-business, e-administration... etc., and the ever-present requirement for mobile access pose huge challenges to wireless communication technologies, where available frequency bands have become scarce and hard-to-come-by. The key concept to accommodate these needs is spectral efficiency which summarizes the performance of given technology into a measure indicating what is the nominal dataspeed achieved over 1 Hz of radiospectrum. Hence, wireless development is driven by the motivation of increasing spectral efficiency in order to pave the way towards low cost broadband services. This objective implies that broadband services are to be implemented over narrowband radio channels which makes them susceptible to selective fading due to multipath propagation resulting in severe performance degradation. This prompts the development of novel algorithms being able to facilitate very high speed information transmission and sophisticated services but adhering to the present limits of technology and spectral resources at the same time. As a result, the thesis focusing on developing novel channel equalization algorithms for communication networks which achieve low bit error rate and therefore increase the spectral efficiency. These algorithms prove to be instrumental to combat both InterSymbol Interference (ISI) and Multi Access Interference (MUI) in order to avoid large scale drops in system performance and increasing the real data speed. New development took place in the following domains 1. Novel blind equalization algorithms have been introduced in order to increase the real data speed by eliminating the training sequence. In this way, the spectral efficiency can be increased by omitting the overhead related to the training sequence in the GSM packet header. 2. New algorithms have been proposed which can directly minimize the Probability of Error (instead of minimizing the mean square error (MSE) or the peak distortion (PD)). Hence, the new equalization supports better QoS communication by significantly decreasing the bit error probability. 3. A new channel identifier algorithm have been developed where not only the filter parameters but also the model degree is under adaptation, which helps to avoid both over- and undermodelling. Hence, multiple simultaneous identification problems are carried out with optimal resource management (i.e. multichannel identification can be performed by a single DSP). This problem is receives a great interest in identifying several channels simultaneously on the BS. iii
iv The convergence of the algorithms introduced by the thesis is established by analytical tools relying on the theory and tools of stochastic approximation. The speed of convergence and the performance are analyzed by extensive simulations on several practical channel models. As a result, the novel algorithms can be directly applied in high-data-rate wireless communication networks.
Tartalomjegyzék 1. Bevezetés 1 1.1. Technológiai motivációk és célok........................... 1 1.1.1. Irodalmi előzmények és nyitott kérdések................... 1 1.2. A kutatás módszerei.................................. 4 1.3. A dolgozat által elért eredmények áttekintése.................... 4 1.4. A dolgozat felépítése.................................. 4 2. Rendszermodell 6 2.1. Jelölések......................................... 6 2.2. Rendszer-blokkvázlat.................................. 6 2.3. A dolgozatban használt feltételezések összefoglalása................. 8 2.4. A vevőszűrő....................................... 9 2.4.1. Általános vevőszűrő.............................. 9 2.4.2. Illesztett szűrős vevő.............................. 11 2.4.3. A Detektor................................... 14 2.5. A csatornakiegynelítés................................. 15 2.6. Wiener-szűrés...................................... 16 2.6.1. Az ortogonalitás elve.............................. 17 2.6.2. A Wiener-Hopf egyenlet megoldása a legmeredekebb lejtő algoritmussal. 18 2.6.3. Az LMS algoritmus............................... 18 2.7. Egyfelhasználós rendszerek modellezése........................ 19 2.7.1. Az átvitel késleltetésének modellezése.................... 20 3. Tanár nélküli csatornakiegyenlítés 21 3.1. Adaptív dekorreláló algoritmus............................ 21 3.1.1. Az ADM algoritmus.............................. 22 3.1.2. Az ADM algoritmus általánosítása a zaj figyelembevételével........ 24 3.1.3. A konvergencia gyorsítása átlagolással.................... 25 3.1.4. Szimulációs eredmények............................ 26 3.2. Döntés-vezérelt tanár nélküli (vak) kiegyenlítő.................... 31 3.2.1. A rendszermodell................................ 33 3.2.2. Bevezetés.................................... 33 3.2.3. Szűrőegyüttható-optimalizálás a DDLMS algoritmussal........... 34 3.2.4. A DDLMS vizsgálata általánosabb feltételek között............. 36 3.2.5. A konvergencia gyorsítása átlagolással.................... 38 3.2.6. Szimulációs eredmények............................ 38 3.3. Összefoglalás...................................... 42 v
vi TARTALOMJEGYZÉK 4. Minimális bithibaarány-stratégián alapuló kiegyenlítés 43 4.1. A rendszermodell.................................... 43 4.2. A bithiba, mint a kiegyenlítőegyütthatók függvénye................. 44 4.3. A bithiba minimalizálása egzakt gradiens-algoritmussal............... 45 4.4. Kis komplexitású kiegyenlítés a bithibavalószínűség új korlátjai alapján...... 46 4.4.1. A bithibavalószínűség hagyományos korlátjai................ 48 4.4.2. A bithibára adott korlátok minimalizálása.................. 49 4.5. A bithibavalószínűség minimalizálása statisztikus mintavételi módszerekkel.... 52 4.5.1. A bithibavalószínűség közelítése a Li-Silvester módszerrel......... 52 4.5.2. A bithibavalószínűség minimalizálása sztochasztikus mintavételi módszerekkel...................................... 55 4.6. Csatorna-identifikáció................................. 57 4.7. Szimulációs eredmények................................ 57 4.7.1. Rövidítések................................... 57 4.7.2. Bithibavalószínűség a kiegyenlítőegyütthatók függvényében lokális minimumok problémája............................... 58 4.7.3. A bithiba a jel-zaj-viszony függvényében................... 61 4.7.4. Konvergenciaidő................................ 64 4.7.5. Az approximáció minősége........................... 66 4.8. Összefoglalás...................................... 68 5. Csatornaidentifikáció adaptív modell-fokszám becsléssel 69 5.1. A rendszermodell.................................... 69 5.2. A Wiener-szűrés alkalmazása a rendszeridentifikáció feladatára........... 71 5.3. Az adaptív fokszámbecslő (AFDA) algoritmus.................... 71 5.4. A maradék hiba a szűrőfokszám függvényében.................... 73 5.4.1. Alkalmazás a csatornaidentifikációra..................... 77 5.5. Az AFDA konvergenciasebesség-vizsgálata...................... 77 5.5.1. A levezetésben használt feltételezések..................... 77 5.5.2. Az MMSE várhatóértékben vett konvergenciaideje............. 77 5.5.3. A csatornaidentifikáció konvergenciaideje................... 79 5.5.4. Az AFDA konvergenciaideje csatornaidentifikáció esetében......... 79 5.6. Optimális erőforrás kihasználás az AFDA algoritmussal............... 80 5.7. Szimulációs eredmények................................ 82 5.7.1. Az AFDA konvergenciája........................... 82 5.7.2. A modellezés pontosságának hatása a bithibára............... 86 5.8. Összefoglalás...................................... 87 6. Összefoglalás 88 6.1. Az eredmények hasznosítása és implementációja................... 88 6.1.1. Vak kiegyenlítés: DDLMS algoritmus..................... 88 6.1.2. Vak kiegyenlítés: ADM algoritmus...................... 88 6.1.3. A bithibaarány szerinti kiegyenlítés...................... 88 6.1.4. Adaptív szűrőfokszám-becslő algoritmus................... 89 6.2. További kutatás, nyitott kérdések........................... 90 6.3. Összefoglalás...................................... 90
TARTALOMJEGYZÉK vii 7. Függelék 91 7.1. Kushner-Clark tétele.................................. 91 7.2. A 4.3. tétel bizonyítása................................ 92 7.3. Kiegészítések a rendszer-blokkvázlathoz....................... 94 7.3.1. A szimbólumokról............................... 94 7.3.2. A moduláció.................................. 95 7.3.3. A rádiócsatorna................................. 97
viii TARTALOMJEGYZÉK
1. fejezet Bevezetés 1.1. Technológiai motivációk és célok Napjainkban, az élet minden területére betörő hálózati kommunikáció (e-buisness, az e- közigazgatás) térhódítása folytán robbanásszerűen megnőtt a nagysebességű, szélessávú digitális szolgáltatások iránti igény. A modern telekommunikáció alapvető kihívása ennek az igénynek a gazdaságos kiszolgálása. A helyzetet bonyolítja, hogy a megnövekedett sávszélesség-igény elsősorban mobil típusú, hiszen a felhasználók nagyrésze szélessávú, olcsó, helyhezkötöttség nélküli szolgáltatást szeretne. A szolgáltatói és műszaki oldalról nézve a kérdést, a legnagyobb problémának a mobilitás megvalósítása tűnik, hiszen a rendelkezésre álló és megfelelő terjedési tulajdonságokkal rendelkező rádióspektrum véges. (A véges erőforrásokra olyan nagy az igény, hogy a napjainkban lezajló frekvencia-aukciókon már-már csillagászatinak nevezhető összegeket fizetnek még fel nem használt sávokért.) Ennek megfelelően a nagy sávszélességű mobil szolgáltatások jövője azon múlik, hogy a rendszerek spektrális hatékonyságát sikerül-e az egyre olcsóbbá és hatékonyabbá váló számítástechnikai hátteret kihasználva algoritmikus eszközökkel javítani 1. Ezért a dolgozat célja: a spektrális kihasználtság algoritmikus eszközökkel történő javítása. Nyilvánvaló, hogy a hírközlő rendszer egészének a spektrális hatékonyságra történő együttes optimalizálása túl nagy komplexitású probléma. (A kódolás, moduláció és detekció együttesét kellene optimalizálni, amely feladatok külön-külön is rendkívül bonyolultak, és sokszor a legjobb megoldások is intuitív ötleteken alapulnak.) A disszertáció a spektrális hatékonyság növelését a detekció területén vizsgálja, a következő algoritmikus kihívásokat felvetve: a jelzési sávszélesség csökkentése; ennek lehetősége elsősorban az átvitelhez használt tanulósorozatok kiküszöbölésében rejlik ún. tanár nélküli (illetve "vak", angol irodalomban "blind") algoritmusok alkalmazásával. a tradícionálisnál hatékonyabb (kisebb bithibavalószínűséget eredményező) kiegyenlítő algoritmusok bevezetése; többcsatornás kiegyenlítés megvalósítása egy erőforráson (DSP-n) a modellfokszám adaptív állítása alapján; 1.1.1. Irodalmi előzmények és nyitott kérdések Az első digitális kommunikációs rendszerekben alkalmazott csatornakiegyenlítési megoldást 1965- ban Lucky, Weldon és Saltz vezette be [13], a kiegyenlítő szabad súlyait a csúcstorzítás (Peak 1 A spektrális hatékonyság megadja az 1 Hz-es fajlagos sávszélességen megvalósított adatátviteli sebességet 1
2 1. BEVEZETÉS Distortion PD) kritérium szerint minimalizálták. A Négyzetes középhibára (Mean Square Error MSE) alapozott kiegyenlítés bevezetése Widrow [14] nevéhez fűződik. Ezen klasszikusnak számító megoldások kiegyenlítőként lineáris FIR-szűrőt alkalmaznak, amit előjeldetektor követ és szimbólumról-szimbólumra történő detekciót tesznek lehetővé; számítástechnikai szempontból egyszerű, ugyanakkor szuboptimális megoldások. A PD és MSE célfüggvényeket optimalizáló adaptív algoritmusok (az előbbire vonatkozót Zero-forcing ZF, míg az utóbbira vonatkozó adaptív megoldást MMSE (Minimum Mean Square Error) vagy LMS (Least Mean Square) névvel illetik) egyidősek a nem adaptív (off-line) változataikkal, s szintén Lucky ill. Widrow nevéhez fűződnek. Az adaptív módszerek a célfüggvény gradiensének a pillanatnyi becslésén alapulnak. Az ilyen, sztochasztikus approximációs algoritmusok matematikai hátterét Robbins, Monroe, Kushner és Clark [15, 16] dolgozta ki. A klasszikus módszereket öt alapvető irányban kezdték fejleszteni. A kutatás 1. a kiegyenlítő architektúrájára, 2. a konvergencia sebességének növelésére, 3. a kiegyenlítés stratégiájára (célfüggvényére), 4. a tanulási metódusra, 5. valamint a komplex, többfelhasználós rendszerekben jelentkező újabb problémák megoldására fókuszál. 1. 1967-ben Austin ([17]) vezette be a kiegyenlítőszűrő kimenetéről súlyozott visszacsatolást alkalmazó, ún. döntés-visszacsatolt (Decision-feedback DF) kiegyenlítő architektúrát, ill. adott adaptív algoritmust a kiegyenlítősúlyok optimalizálására az MMSE stratégia alapján. Teljesen más megközelítésnek tekinthető az eddig tárgyalt kiegyenlítőt követő előjeldetektor struktúra helyett alkalmazott komplex detektor. Ebben az esetben a detektor feladata megadni a vett jel alapján az elküldött üzenetre vonatkozó Bayes- vagy maximum-likelihood döntést. A csatornatorzítás által okozott szimbólumközti áthallást mint nem kívánatos konvolúciós kódolást értelmezve a Viterbi-algoritmus alkalmazásával megkapjuk a csatornába beadott információs sorozat maximum-likelihood becslését. Ez a megoldás feltételezi, hogy a csatornaállapot-információ rendelkezésünkre áll. Ebben a témában az első publikációk Forney [18] és Ungerböck [19] nevéhez fűződnek. Nemparametrikus optimális Bayes-döntést valósított meg Levendovszky, van der Meulen és Elek [20] előrecsatolt neurális hálózatokkal 2000-ben. A turbo-kódok dekódolására használt iteratív maximum a posteriori (MAP) módszer csatornakiegyenlítésre történő használatát Hagenauer javasolta, 1999-ben [21]. 2. A rendkívül egyszerű, de lassan konvergáló LMS konvergenciasebességét az RLS technikával (Recursive Least Squares) sikerült megnövelni a számítási igény jelentős növekedése árán. Az úttörő munka Godard nevéhez fűződik [22]. Az algoritmus teljesítményanalízisével illetve számítási igényének redukálásával számtalan munka foglalkozik, átfogó bemutatást Haykin [23] könyvében találunk. 3. A digitális összeköttetések legfontosabb minőségi jellemzője a bithibaarány (Bit Error Rate BER). A PD és MSE kiegyenlítési stratégiák helyett ezért kézenfekvőbb megoldás magát a bithibát a kiegyenlítés célfüggvényének választani. Az első ilyen kísérlet Shimbo és Shamas [24, 25] nevéhez fűződik, bár ők a kiegyenlítő optimalizálására nem adtak algoritmust, csak a célfüggvényt vezették le. Valós szituációkban alkalmazható adaptív algoritmusok az elmúlt néhány évben születtek e témában: 2000-ben Yeh és Barry [26] közölt kis komplexitású, közel optimális minimum-ber (MinBER) stratégián alapuló kiegyenlítőt, amely ugyanakkor nagyon lassan konvergál. MinBER stratégián alapuló, Radiális bázisfüggvényes neurális hálózatokon
1. BEVEZETÉS 3 alapuló nemlineáris kiegyenlítőt javasolt Kumar 2000-ben illetve Chen 2003-ban [27, 28]. 2001-2005 között több nagy komplexitású DS-CDMA környezetben működő kiegyenlítő algoritmust tettek közzé a [29, 30, 31] cikkekben. 4. A fentebb ismertetett megoldások közös jellemzője, hogy a kiegyenlítéshez vagy csatornainformációra vagy tanulósorozatra van szükség. Az alább ismertetett tanár nélküli vagy ún. "vak" (unsupervised-, self-recovering-, blind algorithms) algoritmusok a tanulósorozat (és ezáltal a csak technológiai célból átvitt bitek) kiküszöbölését célozzák. A kiegyenlítő szabad paramétereinek az optimalizálása ebben az esetben kizárólag a vett jel ill. a priori statisztikai ismeretek fölhasználásán alapul. Az idevágó algoritmusok három fő csoportra oszthatók: (i) nemlineáris sztochasztikus approximációs algoritmusok, melyek lényege az, hogy az LMS algoritmus adaptálásához szükséges hibajelet a kiegyenlítő kimenetének nemlineáris függvényeként állítják elő. Az algoritmusok közötti különbség elsősorban a nemlinearitás megválasztásában van. Az első publikáció 1975-ben jelent meg, Sato nevéhez fűződik [32], és csak PAM-rendszerekkel foglalkozott. A módszer továbbfejlesztésével általánosított konstellációs helyzetekre születtek megoldások: Godard [33] (az általa javasolt algoritmus a CMA Constant Modulus Algorithm néven terjedt el), Picchi és Prati [34], Shalvi és Weinstein [35], CDMA rendszerekre kiterjesztett algoritmus 2000-2001-ben lett publikálva először: Li és Fan [36] valamint Tugnait nad Li [37]. (ii) Magasabbrendű (többnyire negyedrendű) statisztikai módszereken alapuló megoldások: Giannakis és Mendel 1989 [38], Hatzinakos és Nikias [39], valamint Tong et al. [40], Chi és Chen (2001) [41] valamint Xu és Liu (2004) [42] munkáiban találhatók. (iii) A leadott információs sorozat és a csatornaállapot együttes maximum-likelihood becslésével Sato [43] és Seshadri [44] kezdett foglalkozni 1994-ben. 5. A 70-es évektől kezdték katonai célokra fejleszteni a szórt-spektrumú modulációs rendszereket. Az átvitel megbízhatóságát, illetve a lehallgatás megnehezítését szolgálta a jel kisebb teljesítményének szétterítése a szükségesnél jóval nagyobb sávszélességre. Ennek az elvnek a legjelentősebb polgári alkalmazása a kódosztásos többszörös hozzáférési technika lett (CDMA, Code Division Multiple Access). Ebben az esetben több felhasználó egyidejűleg használ egy nagyobb sávszélességű csatornát úgy, hogy jeleiket szórt spektrumú modulációval továbbítják. Ekkor a csatornakiegyenlítés (vagy detekció) feladata nem csupán a szimbólumközti áthallás (Intersymbol Interference ISI), hanem a felhasználók közötti áthallás (Multiple Access Interference MAI) hatásának a kiküszöbölése is. A szórt spektrumú hírközlés egyik legrészletesebb összefoglalását Viterbi [45] találhatjuk. Az optimális többfelhasználós detektort (multiuser detector) Verdu [46] vezette le, amely exponenciális komplexitású algoritmus a felhasználók számát tekintve. Iteratív megoldást, amely az interferencia-kioltás elvén alapszik, Varanasi és Aazhang [47] adott. Az iteratív megoldást Jeney és Levendovszky fejlesztette tovább sztochasztikus Hopfield-hálózat felhasználásával [48]. A vett sorozat korrelációs mátrixának spektrális dekompozícióján nyugvó "altér-módszer" (subspace method) Wang és Poor [49] ötlete, továbbfejlesztett algoritmusok találhatók [50, 51, 52, 53] cikkekben. A fentiek alapján a disszertáció a következő nyitott kérdésekre keresi a választ: Létezik-e CDMA-környezetben működő, kis komplexitású, valós időben működő, ugyanakkor jó teljesítőképességű és tanár nélkül tanuló kiegyenlítő algoritmus? Adható-e analitikus igazolás a széleskörben használt, hagyományos LMS algoritmus döntésvezérelt (decision directed) változatának a konvergenciája? Kostruálhatók-e az optimális bithibaarány stratégiára alapozva valós idejű rendszerekben alkalmazható kiegyenlítő algoritmusok? Megoldható-e a több párhuzamos rendszer-identifikáció parallel futtatása egyetlen processzoron, biztosítva az optimális erőforrás allokációt?
4 1. BEVEZETÉS 1.2. A kutatás módszerei A bevezetésben megfogalmazottak szerint a disszertáció az algoritmikus fejlesztésre összpontosít, két kérdést tisztázva: (i) a kiegyenlítő stacionér állapotában való optimális működésének a megmutatása adott kritérium szerint, (ii) a sztochasztikus értelemben vett konvergencia bizonyítása és a konvergenciasebesség-, valamint a teljesítőképesség analízise szimulációk segítségével. Így a dolgozat olyan algoritmusokat szolgáltat, amelyek teljesítőképessége diszciplináris eszközökkel bizonyított, illetve direkt módon alkalmazhatóak valódi kommunikációs rendszerekben. 1.3. A dolgozat által elért eredmények áttekintése Az eredményeket motiváló technológiai célkitűzések és az ezekből származó előnyök összefüggésrendszerét a 1.1. ábra szemlélteti. MOTIVÁCIÓK ÚJ EREDMÉNYEK KÖZÖS ELÕNYÖK fizikai sávszélesség hiánya növekvõ és egyre olcsóbbá váló számítási kapacitás rendelkezésre állása jelzési sebesség csökkentésének igénye A bithiba minimalizálásán alapuló kiegyenlítési stratégia adaptív modell-fokszám identifikáló algoritmus vak kiegyenlítõ algoritmusok optimális erõforrás kihasználtság; megnövekedett spektrális kihasználtság; polinomiális komplexitású valós idejû algoritmusok; nagyobb adatátviteli sebesség; 1.1. ábra. A technológiai motivációk, eredmények és az ezekből következő előnyök összefüggései 1.4. A dolgozat felépítése A disszertáció az alábbi négy fő fejezetből áll: 1. A 2. fejezet a dolgozatban használt digitális kommunikációs modellt mutatja be. A fejezet konklúziója az, hogy hagyományos egyfelhasználós és az újabb többfelhasználós rendszerek matematikailag egységes formában történő kezelése megoldható. Nevezetesen a tárgyalt rendszerek okozta torzítás (származzon bár többutas terjedésből vagy felhasználók közötti áthallásból) egységesen lineáris operátorral (konkrétan mátrix-szorzással és additív zajjal) írható le. A disszertációban megadott új algoritmusok ezen modell alapján kerülnek bemutatásra. 2. A 3. fejezet tanár nélküli (vak) algoritmusokkal foglalkozik. Ezen algoritmusok jelentősége abban áll, hogy a tanulósorozatok kiküszöbölése esetén javul a hasznos illetve a technológiai célból átvitt bitek aránya, tehát lehetségessé válik a jelzési sávszélesség csökkentése. A 3. fejezetben két új algoritmus szerepel. Ezek közül az első azon alapszik, hogy tanárnélkülivé legegyszerűbben úgy tehető egy algoritmus, ha a tanulósorozat elemeit lecseréljük a döntött szimbólumokkal (melyek esetleg hibásak lehetnek). A disszertációban az MMSE algoritmus döntésvezérelt (decision directed) változatának (továbbiakban DDMMSE) a stabilitásvizsgálatát adjuk meg. A DDMMSE algoritmus matematikailag nemlineáris sztochasztikus
1. BEVEZETÉS 5 differencia-egyenlet. A konvergencia ténye egy valószínűséggel a Kushner-Clark tétel eredményeit használva bizonyítható. A másik tanárnélküli algoritmus vektor-valószínűségi változók dekorrelálására alkalmas. Ennek a témába vágó alkalmazása a mobil-kommunikáció jövőjét jelentő több-felhasználós rendszerek (Multiuser Communication) kiegyenlítésében van. Ezen rendszerek esetében a szimbólumközti áthalláson és az additív zajon kívül újabb probléma kerül előtérbe: a felhasználók közötti áthallás, amely a közös átviteli médium használatából fakad. A feladat megoldásra adott általános maximum-likelihood detektor sajnos a felhasználók számára nézve exponenciális komplexitású, így gyakorlatilag nem alkalmazható. Az adaptív dekorrelációs algoritmus alkalmas a többfelhasználós rendszerek kiegyenlítésére: kis komplexitású, szuboptimális, de jó teljesítőképességű eljárás. Az 1 valószínűségű konvergencia bizonyítása a Kushner-Clark tétel segítségével adható meg. 3. A 4. fejezet olyan új csatornakiegyenlítési algoritmusokkal foglalkozik, amelyek közvetlenül a digitális átvitel legfontosabb minőségjellemzőjét, a bithibavalószínűséget alkalmazzák célfüggvényként. (Korábban, technológiai okokból fakadóan olyan kiegyenlítési stratégiákat alkalmaztak (négyzetes hiba, csúcs-torzítás), amelyek optimalizálása lineáris egyenletrendszer megoldásával elvégezhető.) A dolgozat legfontosabb idevágó eredménye az, hogy a közvetlenül a bithibát minimalizáló exponenciális komplexitású algoritmus hogyan helyettesíthető olyan szuboptimális megoldásokkal, amelyek jobb teljesítőképességgel rendelkeznek, mint a hagyományos megoldások. 4. A 4. fejezetben megadott bithiba-valószínűséget minimalizáló kiegyenlítő-algoritmusok feltételezik a csatornaállapotra vonatkozó információt. Ezért az 5. fejezet a csatornaidentifikáció kérdésével foglalkozik. A korábbi off-line jellegű modell-fokszám becslésre vonatkozó ([54, 55]) eredményekkel szemben az itt bemutatott adaptív fokszám-becslés segítségével megvalósítható egyetlen erőforráson (DSP-n) többcsatornás kiegyenlítés, méghozzá optimális erőforrás-felhasználást biztosítva. Ennek garanciája a modellfokszám alulbecslése által okozott pontatlanság illetve felülbecslése által okozott erőforrás-pazarlás együttes kiküszöbölésében rejlik.
2. fejezet Rendszermodell Ebben a fejezetben a disszertációban alkalmazott digitális kommunikációs csatornamodellről esik szó: milyen gyakorlati rendszerekre milyen megszorítással érvényes az alkalmazott matematikai modell. A fejezet jórészt a témába vágó általános ismereteket tartalmaz, ezért a tájékozott olvasó az ismerős szakaszokat átugorhatja. A dolgozat tárgyához legszorosabban kötődő alapismereteket (vevőszűrő, detekció, kiegyenlítés) ez a fejezet, míg a lazábban kapcsolódóakat(moduláció, csatornahozzáférés, rádiócsatorna) a függelék tartalmazza. A modell kidolgozása a [56, 57] műveken alapszik. 2.1. Jelölések A dolgozatban használt jelölések a 2.1 táblázatban láthatóak. x i x k i x X I x k (t) x(t) y(t) = x x(τ)y(t τ)dτ x(t), y(t) = x(t)y (t)dt { 1 ha i = j δ ij = 0 ha i j δ(t) E {ξ} P {ξ = A} ξ N(0, σ 2 ) diszkrét idejű sorozat a k-dik felhasználóhoz tartozó jelérték az i-dik időrésben vektor (félkövér kisbetű) mátrix (félkövér nagybetű) egységmátrix a k-dik felhasználóhoz tartozó folytonos idejű jel két folytonos idejű jel konvolúciója x komplex konjugáltja skaláris szorzat az L 2 térben Kronecker-delta Dirac-delta a ξ valószínűségi változó várható értéke az A esemény valószínűsége ξ normális eloszlású, 0 várhatóértékkel, σ szórással 2.1. táblázat. A dolgozatban használt jelölések 2.2. Rendszer-blokkvázlat A dolgozatban vizsgált digitális vezetéknélküli (és mobil) kommunikációs rendszerek blokkvázlata a 2.1. ábrán látható. Ebben a modellben többszörös hozzáférésű csatorna használatát feltéte- 6
2. RENDSZERMODELL 7 lezzük. A hagyományos egyszeres hozzáférésű rendszerek ennek aleseteként tárgyalhatók (l. 2.7. fejezet). 2.1. ábra. A többszörös hozzáférésű csatorna blokkvázlata Feltételezés szerint rendelkezésre áll egy bináris jelfolyam. Ebből forráskódolással (amely lehet veszteséges és veszteségmentes eljárás) előáll az adott jelfolyam optimálisan tömör bináris ábrázolása. Az optimális forráskódolás kimenetén megfigyelhető bitfolyammal kapcsolatban feltételezzük, hogy a bitek egymástól függetlenek és egyenletes eloszlásúak, azaz P {b i = 1} = P {b i = +1}. A következő lépésben a csatornakódolási művelettel mesterségesen redundanciát visznek az adatfolyamba, hogy az átvitel során esetlegesen bekövetkező hibák detektálhatóak, illetve kijavíthatóak legyenek a vételi oldalon. Az ún. interleaver fokozat a bitek megkeverését végzi a blokkos hibák kivédésének az érdekében. A csatornakódoló kimenete nem feltétlenül bináris értékkészletű, hanem az alkalmazott modulációs eljáráshoz alkalmazkodik. A szimbólumokat (yj k a k-dik felhasználó j-dik szimbóluma) komplex számokkal jellemezhetjük, megfelelően a modulációs rendszerekben alkalmazott ún. in-phase és kvadratúra irányú vivőmodulációnak. A modulátor végzi a diszkrét idejű szimbólumsorozat folytonossá alakítását, hogy az a folytonos természetű csatornán átvihető legyen. Ez általában a következő lépéseket jelenti. 1.) A kisugárzandó szimbólumot megszorozzák a szóban forgó felhasználóhoz rendelt aláírás-sorozattal (ami a felhasználók jelének vevő oldali szétválasztását célozza). 2.) A folytonos impulzusválaszú adószűrő feladata előállítani az elemi jelalakot, amely a (folytonos természetű) csatornára küldhető. 3.) Az így kapott jelet vivőfrekvenciára ültetik. Ez a jel kerül az adóantennára. A komplex alapsávi ekvivalens modell segítségével tetszőleges vivőfrekvenciás modulációs rendszer az alapsávi PAM modulációhoz hasonlóan tárgyalható, a vivőfrekvencia hatását ezzel a módszerrel ki lehet küszöbölni a modellben [58]. A dolgozatban szereplő folytonos jelek mindig az adott jel komplex alapsávi ekvivalensét jelentik. A rendszerben levő felhasználók ugyanazt a fizikai rádiócsatornát használva küldik el a jeleiket. A felhasználók térbeli elhelyezkedése különböző, ezért az adók és a vevő (bázisállomás) közötti átviteli jellemzők felhasználóról felhasználóra különbözők lehetnek. A rádióátvitel minőségét a többutas terjedés és a reflexiót okozó tárgyak mozgásából (valamint a mobilitásból) következő statisztikai ingadozás, azaz a fading határozza meg. Ezen hatások matematikai jellemzésére (többek között) az impulzusválasz függvény alkalmas, amely legáltalánosabb esetben idővariáns. A vevőben érzékelt jel ezek szerint a felhasználók különböző képpen torzult jelének összegéből áll elő, továbbá a vevőerősítőben ehhez additív fehér-gauss zaj adódik. Ebből az összetett jelből a demodulátor diszkrét döntési változókat képez. Ezek felhasználásával kell meghatározni, hogy mik lehettek az egyes felhasználók által küldött szimbólumok. Ezt a döntési feladatot az érdeklődésünk homlokterében álló detektor fokozat végzi. A detektort úgy kell megválasz-
8 2. RENDSZERMODELL tani, hogy a téves döntés valószínűsége minimális legyen, azaz minimalizálni kell a P { ŷk i } yi k valószínűséget. Végül a csatornakódolás, interleaving és forráskódolás inverz műveletét végrehajtva megkapjuk a forrás által küldött bitsorozat becsült értékét. Ebben a tanulmányban azt föltételezzük, hogy a szimbólumtévesztés valószínűségének minimalizálásával a bithibavalószínűség is minimális lesz. A dolgozat témája szempontjából leglényegesebb vevőszűrő és detektor blokkokra vonatkozó feltételezések kifejtése az alábbi fejezetekben kerül bemutatásra, míg a modell érvényességi körét értelmező részek a szimbólumkészletről, a modulációról, a többszörös hozzáférési technikákról és a rádiócsatornáról a függelékben olvashatók (l. 7.3.1.-7.3.3. fejezetek). 2.3. A dolgozatban használt feltételezések összefoglalása Ebben a szakaszban a fizikai rendszerre vonatkozó legfontosabb feltételezések szerepelnek fölsorolásszerűen, utalva az egyes föltételezésekhez kapcsolódó magyarázat helyére. Egyszerre K aktív felhasználó veszi igénybe a többfelhasználós rendszert; FDMA ill. TDMA többszörös hozzáférés esetén a felhasználók jelei ortogonálisak (megfelelő védősávokat feltételezve) ezért ezek a rendszerek nem tartalmaznak felhasználók közötti áthallást, így egyfelhasználósként modellezhetőek (l. 7.3.2 fejezet); CDMA többszörös hozzáférés esetén K aktív felhasználót, direkt szekvenciális, aszinkron rendszert feltételezünk (l. 7.3.2 fejezet); A felhasználók üzenetei binárisak, optimálisan forráskódoltak, következésképpen a bitek időrésenként függetlennek és egyenletes eloszlásúnak tételezhetőek 1 ; A modulátor kétállapotú, így a szimbólumok valós számmal leírhatóak; a vivős modulációk esetén az alapsávi ekvivalens jelmodellezést alkalmazzuk (l. 7.3.1 fejezet); DS-CDMA esetben a felhasználókra jellemző aláírás-jelek nem ortogonálisak az átlagos minimális keresztkorreláció biztosítása végett (l. 7.3.2 fejezet); A rádiócsatorna többutas terjedéssel rendelkezik, Rayleigh-fadinggel terhelt (l. 7.3.3 fejezet); A bonyolultabb uplink szituációval foglalkozunk, következésképpen a bázis és az egyes mobilok közötti átvitel felhasználóról felhasználóra eltérő (l. 7.3.3 fejezet); A vevőszűrőbe érkező jel az elküldött szimbólumszekvenciák lineáris torzítottjainak összege, amelyet additív Gauss zaj is terhel (l. 2.4 fejezet); A vevőszűrő ideálisan működő illesztett szűrőkből és szimbólumidejű mintavételezőből áll; következésképpen a vevőszűrő kimenetén megfigyelhető diszkrét döntési változó a szimbólumok lineáris és zajos függvénye (l. 2.4, 2.4.2, 2.4.2 fejezet): x = Hy + n, (2.1) ahol H a csatornamátrix, y az elküldött szimbólumsorozat, n pedig a zaj. definíciója tekintetében l. 2.12-2.17. A változók 1 A vezetéknélküli kommunikációs rendszerekben gyakran alkalmaznak konvolúciós csatornakódokat, amelyek kimeneti szimbólumaira nem igaz a függetlenség; ebben az esetben álvéletlen sorozatok hozzáadásával (ún. zagyvásító scrambler) segítségével biztosíthatók a kívánt tulajdonságok.
2. RENDSZERMODELL 9 A detektor a valós idejű működés biztosítása végett a lehető legegyszerűbb küszöbdetektor. A hibavalószínűség csökkentése céljából egy lineáris kiegyenlítőt feltételezünk (l. 2.4.3, 2.5 fejezet); 2.4. A vevőszűrő A vevőbe érkező jel a 7.3.3 fejezet értelmében, K aktív felhasználót feltételezve az r(t) = = K h k (t) g k (t) + ν(t) = k=1 K yi k (h k (t) s k (t it )) + ν(t) (2.2) k=1 i egyenlettel írható le. Vezessük be a c k (t) = h k (t) s k (t) jelölést. Ennek segítségével a (2.2) egyenlet az alábbi alakra egyszerűsödik: r(t) = K yi k c k (t it ) + ν(t) (2.3) k=1 i A vevőben az első feladat, hogy a folytonos vett jelből véges számú döntési változót képezzünk. Ezt a feladatot végzi el a vevőszűrő. Az alábbiakban ennek a felépítéséről lesz szó. 2.4.1. Általános vevőszűrő Legyen adott egy G számosságú, komplex értékű ortogonális függvény-sereg: {ψ 1 (t), ψ 2 (t),..., ψ G (t)} C(, ). A döntési változókat úgy képezzük, hogy a vett jel (r(t)) projekcióját kiszámoljuk minden időrésben minden ψ i (t) bázisfüggvényre nézve: x k i = r(t), ψ k (t it ) = r(t)ψk (t it )dt (2.4) A bázisfüggvények megválasztásának egyik gyakori módja a mintavételezés, amit matematikailag a ( ψ k (t) = Ts /G t (k 1) T ) k = 1,..., G G képlettel írhatunk le. Léteznek természetesen más megoldások is. Pl. az OFDM rendszerben diszkrét Fourier-transzformációt alkalmaznak, ebben az esetben az ortogonális bázisfüggvények alakja ψ k (t) = e jk( ω)t. A legelterjedtebb választás az illesztett szűrőbank alkalmazása, erről a következő alfejezetben lesz bővebben szó. Figyelembe véve, hogy az adó diszkrét idejű szimbólumokat küld, valamint azt, hogy a vevőszűrő kimenetén is diszkrét idejű jelet figyelhetünk meg, a köztes rendszer helyettesíthető egy diszkrét idejű modellel. A következőkben ennek a modellnek a tulajdonságait mutatjuk be. A döntési változókra vonatkozó (2.4) egyenlet a (2.3) segítségével az alábbi alakban írható föl: K x m j = r(t), ψ m (t jt ) = yi k c k (t it ) + ν(t), ψ m (t jt ) k=1 i
10 2. RENDSZERMODELL ahol illetve = = K yi k c k (t it ), ψ m (t jt ) + ν(t), ψ m (t jt ) k=1 k=1 i K yi k h km j i + n m j (2.5) i h km j = c k (t), ψ m (t jt ) (2.6) n m j = ν(t), ψ m (t jt ) (2.7) Tehát minden időrésben G megfigyelés adódik a K felhasználó 1-1 szimbólumára. Ha létezik h kk i 0 az i 0 esetben, akkor a rendszerben szimbólumközti áthallás (ISI InterSymbol Interference) van, azaz az aktuális döntési változó értéke nem csak az éppen elküldött, hanem az azt megelőző szimbólumoktól is függ. Ha a h km i 0 ha k m, akkor pedig az egyes felhasználók közötti áthallásról (MAI Multiple Access Interference) beszélnek. A (2.5) egyenlet tovább egyszerűsíthető, ha mátrix-vektor jelölésrendszert vezetünk be az alábbiak szerint: y i = [y 1 i, y 2 i,..., y K i ] T (2.8) x i = [x 1 i, x 2 i,..., x G i ] T (2.9) n i = [n 1 i, n 2 i,..., n G i ] T (2.10) h 11 i h 12 i h 1K i h 21 i h 22 i h 2K i H i =....... (2.11) h G1 i h G2 i h GK i Ezeknek a jelöléseknek a segítségével a vevőszűrő kimenetén levő döntési változó az alábbi alakot ölti: x i = j H i j y i + n i (2.12) Amennyiben az átvitel blokkokban történik, hipermátrix és hipervektor jelöléseket bevezetve: x = [x 1 1, x 2 1,..., x K 1, x 1 2, x 2 2,..., x K N ] T, (2.13) y = [y1, 1 y1, 2..., y1 K, y2, 1 y2, 2..., yn K ] T, (2.14) n = [n 1 1, n 2 1,..., n K 1, n 1 2, n 2 2,..., n K N ] T, (2.15) a (2.12)-ban szereplő konvolúció mátrix-szorzás formájába írható: x = Hy + n, (2.16) ahol a H csatornamátrix (K N) (K N)-s blokk-töplitz típusú, továbbá hermitikus (H k = H H k ): H o H 1... H N+1 H 1 H o... H N+2 H =..... (2.17) H N 1... H 1 H o A (2.16) egyenletben szereplő H mátrixot nevezzük diszkrét csatornamátrixnak.
2. RENDSZERMODELL 11 Megjegyzés: Általában nem szükségszerű, hogy K és G megegyezzen, emiatt a H csatornamátrix általános esetben nem kvadratikus. A továbbiak szempontjából hangsúlyozzuk, hogy (2.16) szerint függetlenül a választott csatornamodelltől ill. a választott vevőszűrő típustól, a döntési változó az elküldött szimbólumoknak zajjal terhelt lineáris függvénye. 2.4.2. Illesztett szűrős vevő Az általános vevőszűrő egy a gyakorlat szempontjából nagyon fontos speciális esete, amikor a bázisfüggvényeket a ψ i (t) = c i (t) szabály szerint választják meg. Ez a művelet nem más, mint korreláció számítás (l. (2.18)), emiatt ezt a megoldást korrelációs vevőnek is nevezik. Az illesztett szűrős vevő elnevezés viszont onnan származik, hogy a korreláció számítás elvégezhető illesztett szűrővel történő szűrésként is. (Az illesztett szűrő c k ( t) impulzusválasza nem kauzális rendszert ír le, ez a gyakorlatban kellő nagyságú késleltetés bevezetésével kauzálissá tehető). Ezek szerint illesztett szűrős vevő megoldás esetén G = K, mivel minden felhasználóhoz tartozik egy illesztett szűrő, vagyis a csatornamátrix kvadratikus. Továbbá feltételezzük, hogy a felhasználók száma a kommunikációs protokollból ismert. Illesztett szűrős vevő alkalmazásakor a (2.5)-(2.7) egyenletek a következő alakot öltik: Viszont (2.7)-tel ellentétben most x m j = K yi k h km j i + n m j (2.18) k=1 i h km j = c k (t), c m (t jt ) (2.19) illetve n m j = ν(t), c m (t jt ) (2.20) A zaj kovarianciamátrixa is egyszerűen meghatározható, felhasználva, hogy ν(t) fehér, N o spektrális sűrűséggel: { } { } E n k i n l j = E ν(t)ν (τ)c k (t it )c l(τ jt )dtdτ = = E {ν(t)ν (τ)} c k (t it )c l(τ jt )dtdτ = = N o c k (t it )c l(t jt )dt = amiből (2.15) miatt = N o h kl j i E { nn H} = N o H (2.21) Az illesztett szűrős vevő esetében a bázisfüggvények speciális megválasztása miatt a diszkrét csatornamátrixnak speciális tulajdonságai lesznek: 2.1. Tulajdonság. A csatornamátrix illesztett szűrős vevő esetén kvadratikus. Ez a tulajdonság a bázisfüggvények számából következik, miszerint a felhasználók számának megfelelő számosságú illesztett szűrőt alkalmazunk a vevőben, vagyis G = K (2.11)-ben, emiatt (2.17) is kvadratikus.
12 2. RENDSZERMODELL 2.2. Tulajdonság. A csatornamátrix H i blokkjaira igaz, hogy H i = H H i Ez a tulajdonság a (2.18) definicióból következik. 2.3. Tulajdonság. A H csatornamátrix hermitikus, vagyis H H = H. Az előző tulajdonságból egyértelműen következik. 2.4. Tulajdonság. A H csatornamátrix pozitív szemidefinit, a gyakorlatban majdnem mindig pozitív definit. Bizonyítás. Legyen a C KN KN elemű tetszőleges komplex vektor. Képezzük az α = a H n szorzatot, ahol n a (2.20)-ben definiált zajvektor. Szorozzuk meg α-t a komplex konjugáltjával: αα H = α 2 = a H nn H a (2.22) Képezve az (2.22) egyenlet mindkét oldalának várható értékét, ekkor (2.21) miatt vagyis Ha H nem szinguláris, akkor α 2 = N o a H Ha (2.23) a H Ha 0 (2.24) a H Ha > 0 (2.25) vagyis H pozitív definit. A gyakorlatban a H nemszingularitására tett feltétel majdnem mindig teljesül, hiszen (2.18)- ben a c k (t) függvények felhasználóról felhasználóra különbözőek, így annak a valószínűsége, hogy H-nak lineárisan összefüggő oszlopvektorai legyenek, nagyon kicsi. A zajfehérítő szűrő A (2.16) egyenletben definiált diszkrét csatornamodell fontos tulajdonsága, hogy a benne szereplő n zajvektor nem fehér (kovarianciamátrixa illesztett szűrős vevő esetében N o H, amely általában nem diagonális). A detektor algoritmusok hibavalószínűségének kiértékelése azonban legtöbbször csak fehér zaj esetén végezhető el, ezért a szakirodalomban elterjedten használnak egy másik, az előbbiből származtatható diszkrét csatornamodellt is. Ennek a modellnek az ismertetése előtt egy segédtételre lesz szükség. 2.5. Lemma. Ha x komplex valószínűségi vektorváltozó C kovarianciamátrixszal, akkor x bármely hermitikus A-val való szorzás útján dekorrelálható (fehéríthető), amely eleget tesz a egyenlőségnek. AA H = C 1 (2.26) Bizonyítás. Legyen z = Ax korrelálatlan valószínűségi változó. Ekkor E { zz H} = E { Axx H A H} = ACA H. Mivel A-ról feltettük, hogy hermitikus, azaz A = A H, így (2.26) átírható a A H A = C 1 alakba, amelyet jobbról A 1 -gyel szorozva A H = C 1 A 1 adódik, amiből CA H = A 1, innen pedig ACA H = I, amely igazolja az állítást.
2. RENDSZERMODELL 13 A 2.5. lemma állítása szerint találhatóak olyan hermitikus mátrixok, amelyekkel n-t megszorozva fehér zajt kapunk. Jelöljön A egy ilyen mátrixot! Ekkor a (2.16) egyenletben a döntési változók az x = AHy + An (2.27) alakot öltik. Mivel A hermitikus, ezért (2.26) átírható az A 2 = N o H 1 alakba (l. (2.21)). Ez a faktorizáció azonban nem egyértelmű. Válasszuk azon A-t, amely pozitív definit, az alábbiak szerint. H hermitikus, ezért unitér transzformációval diagonalizálható [59], azaz Q H HQ = Λ = diag λ 1,..., λ NK (2.28) ahol Q a H sajátvektoraiból alkotott modálmátrix, λ i pedig H sajátértékeit jelöli. H inverze szintén fölírható diagonalizált alakban: H 1 = QΛ 1 Q H = A 2 (2.29) ahol az utóbbi egyenlőség a (2.26) állításból következik. Ezek szerint 1 1 A = Qdiag ±,..., ± Q H (2.30) λ 1 Ez A-ra 2 NK megoldást jelent, amelyek közül egyetlen pozitív definit található: 1 1 A = Qdiag +,..., + Q H (2.31) λ 1 λ NK λ NK mivel λ i > 0 i, hiszen H pozitív definit. Így végül is az alábbi modellhez jutunk: ahol szintén pozitív definit, illetve fehér Gauss-zaj. x = Hy + ñ (2.32) H = AH = Qdiag λ1,..., λ NK Q H ñ = An Az illesztett szűrő megvalósítása: a "gereblye" vevő (Rake-receiver) Az illesztett szűrők realizálása többutas, fading-es csatornában az ún. "gereblye" vevővel valósítható meg. A (7.16) egyenlettel definiált csatornamodell feltételezésével L k c k (t) = h k (t) s k (t) = a kl s k (t τ kl ) adódik. Ha a vevőben ismertek az s k (t) aláírás-jelek, továbbá teljesül az s k (t τ kl, s k (t τkm 0 feltétel, akkor a τ kl késleltetés és a kl csillapításértékek, továbbá az L k terjedési utak száma megbecsülhető korrelációszámítás és várhatóértékszámítás segítségével a következők szerint: ˆτ kl = l=1 max r(t), s k(t τ o ) τ o [0,T ) â kl = E { r(t), s k (t ˆτ kl ) } A "gereblye" vevő a megtalált késleltetés és csillapítás-értékeket adaptívan frissíti, így idővariáns rendszerek esetében is használható, amennyiben elég gyors a működése a csatornaállapot változáshoz képest. A "gereblye" vevő részletes leírása megtalálható [57]-ban.
14 2. RENDSZERMODELL 2.4.3. A Detektor A detektor szerepe nem más, mint előállítani a vevőszűrő kimenetén kapott diszkrét döntési változók alapján a döntést, hogy vajon mi lehetett a csatorna bemenetére adott szimbólum(sorozat). Ezt kétféle képpen végezhetjük: vagy szimbólumról szimbólumra, vagy egy átviteli blokk egészére egyszerre döntünk. A digitális átvitel minőségének jellemzője a bithiba-valószínűség, amely azt mutatja meg, hogy mekkora a hibásan átvitt bitek arányának várható értéke az összes átvitt bitek számához viszonyítva. Az optimális döntés tehát azt jelenti, hogy minimalizálni kell a téves detekció valószínűségét: { } P ŷi k yi k. (2.33) Ezen kifejezés minimalizálását elvégző detektort optimális Bayes-döntőnek nevezzük. A Bayes-döntés többfelhasználós esetben A (2.16) képletből látható, hogy a döntési változók az elküldött szimbólumok lineáris függvényei: x = Hy + n (2.34) Az optimális Bayes-döntés kritériuma a minimális hibavalószínűség. Ezt úgy is megfogalmazhatjuk, hogy arra az y-ra kell dönteni, amelyikből az éppen vett x a legnagyobb valószínűséggel származik. Vagyis az optimális döntés végrehajtásához maximalizálni kell a P {y x} valószínűséget: ŷ opt = arg max P {y x}. (2.35) y A (2.35)-ban kijelölt valószínűség kiszámítása helyett a Bayes-féle azonosságok használatával könnyebben számolható eredményre lehet jutni, hiszen P {y x} = P {x y} P {x} = P {x y} P {x} P {y} A P {y} értéke konstans, mivel a forráskódolás kimenetén egyenletes valószínűséggel jelennek meg az egyes szimbólumok. A maximalizálás szempontjából a P {x} elhagyható, hiszen y-tól nem függ. Ezek szerint (2.35) maximalizálása az alábbi feladatra vezet: ŷ opt = arg max P {x y} (2.36) y A (2.34) egyenletből látszik, hogy ha y értéke rögzített, akkor x egy normális valószínűségi változó, hiszen az egyetlen véletlen változó az n vektor. Ennek várható értéke zérus, kovarianciamátrixa általános esetben N o C. Ebből az következik, hogy x szórása is N o C, várható értéke viszont Hy. A vett vektor tehát az alábbi sűrűségfüggvénnyel jellemezhető: f(y x) = 1 2π KN No det Cexp ( 1 2N o (x Hy) H C 1 (x Hy) ) (2.37) Ahol ezen sűrűségfüggvény maximális, ott lesz maximális a feltételes valószínűség. A maximalizálás szempontjából érdektelen kifejezések elhagyásával, a következő kifejezés adódik: ( ŷ opt = arg max P {x y} = arg min (x Hy) H C 1 (x Hy) ) (2.38) y y amely a zárójelek felbontásával ( ŷ opt = arg min x H Cx y H H H C 1 x x H C 1 Hy + y H H H C 1 Hy ) (2.39) y
2. RENDSZERMODELL 15 Mivel a x H Cx kifejezés elhagyható az y szerinti maximalizálás szempontjából, továbbá felhasználva, hogy C kovarianciamátrix, tehát hermitikus [23]: ( { ŷ opt = arg min 2Re x H C 1 Hy } + y H H H C 1 y ) (2.40) y Illesztett szűrős vevő esetében, mivel C = H = H H, ezért (2.40) még egyszerűbb alakra hozható: ( { ŷ opt = arg min 2Re x H y } + y H Hy ) (2.41) y A (2.40) és (2.41) szerint az optimális Bayes-döntés egy diszkrét argumentumú kvadratikus alak minimalizálásával kapható meg. A kimerítő kereséssel adódó megoldás O(2 KN exponenciális komplexitású az y KN hosszára nézve. Bár léteznek polinomidejű megoldások, amelyek az optimális blokk detekció approximálására képesek (l. pl. [60, 48, 20, 61]), ezeknek a megoldásoknak a közös hátránya, hogy a globális optimumot csak erős megszorító föltevések között érik el. Ezért a dolgozat az optimális Bayes-döntés approximálása helyett a struktúrájában szuboptimális, de nagyon gyors működésre képes, a szimbólumról szimbólumra döntés miatt kis késleltetésű kiegyenlítési-koncepción alapuló detekció optimalizálására fókuszál. 2.5. A csatornakiegynelítés Mivel a (2.40) és (2.41) szerinti optimális Bayes-döntés exponenciális számítási komplexitású művelet, ezért a gyakorlatban szuboptimális döntő-algoritmusokat valósítanak meg. Az egyik egyszerűségénél fogva gyakran alkalmazott, és ezért valós időben is realizálható megoldás az, hogy a detektort a lehető legegyszerűbb küszöbdetektornak választjuk, ugyanakkor a csatorna által okozott torzítást egy megfelelő struktúra segítségével kompenzáljuk. Ezt a koncepciót nevezzük csatornakiegyenlítésnek. A kiegyenlítő lehet lineáris illetve nemlineáris struktúrájú. A dolgozatban lineáris kiegyenlítőkkel foglalkozunk. A kiegyenlítő szabad paramétereit adott célfüggvény szerint optimalizálni kell, ezt a célfüggvényt nevezzük kiegyenlítési stratégiának. A kiegyenlítési stratégia kitűzésén túl konkrét optimalizáló algoritmusokat is meg kell adni, amelyekkel az adott célfüggvényt minimalizálni lehet. (Az irodalomban föllelhető módszerekről részletesen a 1.1.1 fejeztben lehet olvasni). 2.2. ábra. A csatornakiegyenlítés blokkvázlata A dolgozatban lineáris, véges impulzusválaszú kiegyenlítőkkel foglalkozunk. A vizsgált struktúra diszkrét modellje a 2.2. ábrán látható. A kiegyenlítő bemenetét az x döntési változó képezi, míg kimenetét a J ỹ i = W j x i j. (2.42) j= J