Universitas Eotvos Nominata 74 203-4 - II Problémás regressziók A közönséges (OLS) és a súlyozott (WLS) legkisebb négyzetes lineáris regresszió egy p- változós lineáris egyenletrendszer megoldása. Az egyenletrendszer együtthatómátrixa (X T X) - illetve (X T WX) -
Universitas Eotvos Nominata 75 203-4 - II Ismeretes, hogy ha egy Ax = y lineáris egyenletrendszer A együtthatója szinguláris, (det(a) = 0), akkor az egyenletrendszer nem oldható meg. Az ok: az A mátrix nem tartalmaz annyi független információt, amennyi x értékeket meghatározná.
Universitas Eotvos Nominata 76 203-4 - II Vannak mátrixok, amelyek determinánsa ugyan nem 0, de majdnem szingulárisok, determinánsuk nagyon kicsi szám. Az ilyen mátrixok vektorai nagyon kis szöget zárnak be, majdnem párhuzamosok. Az ilyen mátrixok rossz kondíciójúak.
Universitas Eotvos Nominata 77 203-4 - II Tekintsük a következő egyenletrendszert: / 5 / 6 / 7 / 8 / 6 / 7 / 8 / 9 / 7 / 8 / 9 /0 / 8 x / 9 x /0x / x 2 3 4 =
Universitas Eotvos Nominata 78 203-4 - II Más számformátumban: 0.200000x + 0.66666x + 0.42857x 0.66666x 0.42857x 0.25000x + 0.42857x + 0.25000x + 0.x 2 2 2 2 + 0.25000x + 0.x + 0.00000x 3 3 3 3 + 0.25000x + 0.x + 0.00000x + 0.090909x 4 4 4 4 = = = =
Universitas Eotvos Nominata 79 203-4 - II Ennek a rendszernek együtthatómátrixa nem szinguláris. Az egyenletrendszer megoldható. Gyökei: x = 280 x2= 52 x3 = 2520 x4 = 320.
Universitas Eotvos Nominata 80 203-4 - II Ha az egyenletrendszer jobboldalán az elsõ elemet %-kal, 0.99-re csökkentjük miközben a többi marad, az ismeretlenek rendre: x = 280 438.6 x2 = 52 227.6 x3 = 2520 3528 x4 = 320 782
Universitas Eotvos Nominata 8 203-4 - II Ha a második elemet %-kal, 0.99-re csökkentjük miközben a többi marad, az ismeretlenek: x = 280 438.6 425.6 x2 = 52 227.6 753.2 x3 = 2520 3528 2242.8 x4 = 320. 782 897.6
Universitas Eotvos Nominata 82 203-4 - II Ha az egyenletrendszer jobboldalán a harmadik elemet %-kal, 0.99-re csökkentjük miközben a többi marad, az ismeretlenek: 280 438.6 425.6 28.8 52 227.6 753.2 6274.8 2520 3528 2242.8 9576 320 782 897.6 4646.4
Universitas Eotvos Nominata 83 203-4 - II Ha a negyedik elem %-ot csökken, 0.99-re (miközben a többi marad), az egyenlet gyökei: 280 438.6 425.6 28.8 82 52 227.6 753.2 6274.8 705 2520 3528 2242.8 9576 806 320 782 897.6 4646.4 264
Universitas Eotvos Nominata 84 203-4 - II Ezek a teljesen eltérő ismeretlenek ugyanakkor az egyenleteket tökéletesen kielégítik. Ebből látszik, hogy rossz kondíció esetén a paraméterek értéktelenek, annak ellenére, hogy képesek az aktuális y-ok reprodukálására (és csak erre).
Universitas Eotvos Nominata 85 203-4 - II A mátrixkondíció mérése Kvadratikus mátrixok kondíciójának jellemzésére a determináns nem alkalmas, mert értéke az elemek számértékétől is függ. A kondíciót többféle módon definiált, cond(a) jelű skaláris számmal mérik, amelyet mátrixnormákból vagy mátrix sajátértékekből vezetnek le.
Universitas Eotvos Nominata 86 203-4 - II Kvadratikus A mátrix normája lehet az A = max j n i= maximális abszolut oszlopösszeg,az A = max n j= maximális abszolut sorösszeg, továbbá i a a ij ij
Universitas Eotvos Nominata 87 203-4 - II A 2 = max k λ k ( ) A T A az A T A mátrix maximális sajátértéke.
Universitas Eotvos Nominata 88 203-4 - II A kondíciószám a mátrix és inverze valamely normájának szorzata: cond( A) = A. A
Universitas Eotvos Nominata 89 203-4 - II Fennáll: cond(a) < A kondíciószám merőleges vektorokat tartalmazó mátrixok esetén. Minél kisebb szöget zárnak be egymással a mátrix vektorai, annál nagyobb cond(a), annál rosszabb kondíciójú A.
Universitas Eotvos Nominata 90 203-4 - II A kondíciószám tájékoztat arról, hogy egy y = X.a (meghatározott) egyenletrendszer esetén y vektor δ y megváltozása maximálisan mekkora változást idézhet elő a vektor normájában a 0 pontos értékéhez képest: δa = X a 0. X δy y
Universitas Eotvos Nominata 9 203-4 - II Elterjedt kondíciószám a mátrix A 2 normájának A és inverze 2 ahol... normájának szorzata: cond( A) = A 2. A 2
Universitas Eotvos Nominata 92 203-4 - II és A A 2 = max 2 k λ k ( ) A T A ( ) T = max A A k λ k
Universitas Eotvos Nominata 93 203-4 - II A kondíciószám nem kvadratikus S mátrixra is értelmezve van, olymódon, hogyj cond ( S) ( ) ( T ) ( T ) S S * max S / S = maxλ λ
Universitas Eotvos Nominata 94 203-4 - II Példa kondíció számítására: A egy véletlen mátrix: >> A = 4 8 8 8 9 5 0 5 5 2 7 7 4 7 4 4 A kondíció száma, MATLAB programmal: >> cond(a) = 28.567
Universitas Eotvos Nominata 95 203-4 - II A számítás egy módja: >> G=A'*A >> lambdamax_g =max(eig(g))= 489.4295 >> lambdamax_invg =max(eig(ig)).698 >>cond= sqrt(lambdamax_g*lambdamax_invg)= 28.567
Universitas Eotvos Nominata 96 203-4 - II Többkomponensű elegyek összetételének számítása. Tegyük fel, hogy egy elegy k-adik komponense koncentrációjával (pl. móltörtjével) arányos jelet ad: h k = s k *x k Tegyük fel, hogy a jelek additívak, egy elegy jele a komponensek jeleinek összege. K h = s elegy k= k x k
Universitas Eotvos Nominata 97 203-4 - II Itt s k a k-adik komponens érzékenysége, a h = f k (x) egyenes meredeksége, a h k / x k derivált. Tegyük fel, hogy a h i jel valamilyen spektrális érték, pl. tömegspektrometriás csúcsmagasság, valamilyen i-edik helyen. pl. tömegszámnál. A k-adik komponens érzékenysége az i helyen: s ik.
Universitas Eotvos Nominata 98 203-4 - II Ha K komponensű elegyet I helyen (tömegszámnál) elemeznek, akkor I x K darab érzékenység S érzékenység mátrixot alkot, és az elemzést a h = S*x összefüggés írja le. Részletesebben:
Universitas Eotvos Nominata 99 203-4 - II = K IK I ik i K I i x x s s s s s s h h h M L L L....
Universitas Eotvos Nominata 200 203-4 - II Vegyük észre, hogy S mátrix k-adik s (k) oszlopa nem más, mint a k-adik komponens tiszta spektruma: = = Ik ik k IK I ik i K Ik ik k s s s s s s s s s h h h.. 0.. 0.... L L L
Universitas Eotvos Nominata 20 203-4 - II Az elemzés sikerét pusztán matematikai szempontból S mátrix kondíciószáma jellemzi. Ha van olyan spektrumjel, amelyik csak egyetlen komponenst jelez, az elemzés szelektív, az S mátrix kvadratikus és diagonális. Az eredmény k egyváltozós egyenlet megoldásával adódik. S kondíciószáma ebben az esetben.
Universitas Eotvos Nominata 202 203-4 - II K komponens koncentrációjának meghatározásához elvben elég K spekrumhelyen mérni. A K spektrumjel optimális kiválasztása S kondíciójának figyelésével (is) célszerű. Az eredmények kiszámítására a legkisebb négyzetes regresszió algoritmusa (is) használható.
Universitas Eotvos Nominata 203 203-4 - II Kísérleti okokból általában párhuzamos spektrumokat vesznek fel, esetleg spektrumhelyek számát szaporítják. (I > K) A feladat ilyenkor már legkisebb négyzetes regressziót igényel, ahol a prediktor változók az érzékenységek, a válasz (response) változók a spektrumjelek, (csücsmagasságok). a kapott paraméterek a keresett koncentrációk..
Universitas Eotvos Nominata 204 203-4 - II Példa: Aromás szénhidrogének tömegspektruma.. Elektron ütközéses ionforrásban gázfázisú szénhidrogén molekulák darabokra törnek és ionizálódnak. A töltött ionokat mágneses és elektromos tér elválasztja és azok alkalmas detektorban parciális nyomásukkal arányos mérhető ionáramot keltenek.
Universitas Eotvos Nominata 205 203-4 - II A vizsgált aromás szénhidrogének: Vegyület jel képlet tömegszám toluol to C 7 H 8 92 ortoxilol ox C 8 H 0 06 metaxilol mx C 8 H 0 06 paraxilol px C 8 H 0 06 etilbenzol eb C 8 H 0 06
Universitas Eotvos Nominata 206 203-4 - II A szénhidrogének tömegsprektrumai m/e Ox mx px eb to 65 8.04 7.9 6.78 2.89 9.93 77 3.38 2.85 3.08 2.42 0.80 78 7.8 7.38 7.27 0.68 0.2 9 9.0 83.30 8.35 09.47 6.30 92 7.04 6.57 6.39 9.40 45.2 05 8.80 20.3 2.47 7.37 0.00 06 47.60 47.60 48.80 35.60 0.00
Universitas Eotvos Nominata 207 203-4 - II Column Profiles Column Profiles 00 Column ox mx px eb to 50 0 2 3 4 5 6 7 65 77 78 9 92 05 06 rows
Universitas Eotvos Nominata 208 203-4 - II Matrix Condition Condition Number = Largest Eigval / Smallest Eigval Infinitely large = 4.32394 /0.00000 Variables are highly collinear! ox is highly correlated with other variables
Universitas Eotvos Nominata 209 203-4 - II Ugyanez látszik a spektrumok korreláció mátrixából is. Correlation Matrix ox mx px eb mx 0.998 px 0.987 0.992 eb 0.967 0.95 0.932 to 0.570 0.536 0.532 0.696
Universitas Eotvos Nominata 20 203-4 - II A példában 3 elegy összetételének meghatározását kiséreljük meg, 2-2 párhuzamos méréssel. A hat elegy (szimulált) spektrumait a következő táblázat mutatja..elegy.2elegy 2.elegy 2.2elegy 3.elegy 3.2elegy 9.0375 8.8262 8.457 7.724 9.0626 8.8437 8.9052 8.799 5.389 5.0468 5.0370 4.589 7.4880 6.9239 4.6264 3.9420 3.7255 3.899 85.7204 85.473 74.647 74.0733 73.2993 72.949 5.96 5.699 22.2945 22.082 28.9577 29.484 3.9036 3.522 2.845 2.0998 6.8279 6.7866 35.9806 36.4597 29.3065 29.8729 7.7024 7.43
Universitas Eotvos Nominata 2 203-4 - II A táblázat egy-egy oszlopa az S.x = y összefüggés egy-egy jobboldala, amiból az x összetételt az OLS (X T X) - X T y elóírásával kivánjuk megkapni. A SCAN program a megoldást megtagadja. OLS ERROR* Predictors are highly collinear
Universitas Eotvos Nominata 22 203-4 - II