1 GÖRBE ILLESZTÉS A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL 1. Görbe illesztés a legkisebb négyzetek módszerével Az el z gyakorlaton megismerkedtünk a korrelációs együttható fogalmával és számítási módjával. A korrelációs együttható számszer információt ad arra, hogy két változó közötti kapcsolat mennyire lineáris. Viszont pusztán a korrelációs együttható ismerete nem ad választ arra a kérdésre, hogyan húzzuk be a közelít egyenest a pontjaink közé. Csupán arra ad információt, hogy ez az egyenes mennyire jól írja le a kapcsolatot. A megoldás a regresszió, vagyis görbeillesztés. A görbe illesztésére több módszer is létezi pl: Kiválasztott pontok módszere, Közepek módszere, Legkisebb négyzetek (LN) módszere, Wald módszer. Most egyenl re a legkisebb négyzetek módszerével foglalkozunk, de a gyakorlat végén a Wald módszerre is csinálunk példát. A LN módszere nem csak lineáris illesztésre jó, de el ször csak erre csináljuk meg mert így lesz kerek egész a korrelációs együtthatóval. Egy Y = ax +b alakú egyenest szeretnénk illeszteni az (X i, Y i ) mérési eredményeinkre. Cél az a és b paraméterek meghatározása. A módszer lényege az illesztett egyenes és a pontok közötti távolságok összegének minimalizálása. El ször nézzük meg, hogy egy adott X i helyen mi a mért Y i értéke és az illesztett egyenes X i helyen felvett ax i + b értéke közötti távolság: e i = Y i ax i b. e i az elemi hiba. Ezeket a hibákat minden pontban négyzetre emelve és összegezve kapjuk az összes négyzetes hibát, amit F -el jelölünk: F (a, b) = (Y i ax i b). Vegyük észre, hogy F csak a-nak és b-nek a függvénye. Az összes hiba összege akkor lesz minimális, ha F minimális. Ezt a minimumhelyet a és b szerinti parciális deriválással kaphatjuk meg: a = (Y i ax i b)( X i ) = 0, b = (Y i ax i b)( 1) = 0. Egyszer sítünk -vel és a negatív el jelekkel, és felbontjuk a zárójelet: Yi X i a X i b X i = 0, Yi a X i b 1 = 0. Ez egy egyenletb l álló lineáris egyenletrendszer. Ezt kell megoldani a-ra és b-re. 1
1.1 Els Feladat 1 GÖRBE ILLESZTÉS A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL A második egyenletb l a b konstans kifejezhet, a 1-re gyeljünk: bn = Y i a X i, Yi a X i b =, N b = Y ax. Ez az eredmény jelzi, hogy az egyenes átmegy a súlyponton. Ezt helyettesítsük be a fels egyenletbe: Yi X i a Xi Y X i + ax X i = 0, ( a X X i ) Xi = Y X i Y i X i, a = Y X i Y i X i X X i. Xi Ezek után illesszünk az el z gyakorlaton megadott Sz rések száma-tüd asztmások száma feladat pontjaira egy egyenest. 1.1. Els Feladat Az el z gyakorlaton a Tüd asztma (X) - Sz rések száma(y ) adatoknak a korrelációs együtthatóját számítottuk ki. Illesszük rá a pontokra a közelít egyenest. Számoljuk ki az egyes átalgértékeket X és Y. Ezeket célszer az egyes oszlopok alján elhelyezni. Majd minden összegnek hozzunk létre új oszlopot: X i (már létezik), Y i X i és X i Számoljuk ki a szummákat az egyes oszlopk aljára. értékeket. Végül a képleteket felhasználva számoljuk ki az egyenes paramétereit. Értelemszer en az a paramétert tudjuk el ször kiszámolni és utána a b-t. Az eredményt könnyen tudjuk ellen rizni az Excel segítségével. Ehhez el ször ábrázoljuk a pontjainkat egy diagrammban. A szokásos PontXY típust használjuk. Ha ez kész van akkor jelöljük ki a pontokat majd: Jobb gomb, Trendvonal felvétele, Típus fülön: Lineáris (ez alapértelmezett). Egyebek fülön: Egyenlet látszik a diagrammon kipipálni, R-négyzet értéke látszik a diagrammon kipipálni. Görbe illesztéshez az Excel-ben jelöljük ki azt a ponthalmazt amire illeszteni szeretnénk, majd a jobb gomb hatására lenyíló menüben válasszuk a Trendvonal felvétele menüpontot. A Töd asztma-dohányfogyasztás részt mindenki próbálja meg saját maga megcsinálni.
1. Második Feladat (Determinációs 1 GÖRBE ILLESZTÉS együttható) A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL 1.1.1. Az Excel görbe illesztési lehet ségei Az el z példa kapcsán megtanultuk, hogyan lehet Excel-ben ponthalmazra görbét illeszteni. Most röviden nézzük át milyen lehet ségeink vannak: Lineáris = y = a x + b, Logaritmikus = y = a ln(x) + b, Polinomiális = y = a x n + b x n 1 +..., (A fokszám maximuma 6) Hatvány = y = a x b, Exponenciális = y = a e bx, 1.. Második Feladat (Determinációs együttható) Most vizsgáljunk meg egy olyan esetet, ahol a függvényillesztést nem lehet excel segítségével elvégezni. Ebben az esetben az illesztés "jóságát" nem tudjuk excel determinációs együtthatójával és/vagy a korrelációs együtthatóval megvizsgálni, hanem a determinációs együtthatót magunknak kell számolni: R = E 1 E E 1, E 1 = (y i y), E = (y i ŷ i ), ahol ŷ i = f(x i ) a illesztett függvény helyettesítési értéke az x i helyen. Az illesztés akkor "jó", ha R értéke közel van 1-hez. A második feladatban adott pontokra egy y a = ax és egy y b = bx alakú függvényt kell illeszteni és a determinációs együttható segítségével eldönteni, hogy melyik illesztés a jobb. Els lépésként ábrázoljuk a pontjainkat diagramban. Most is a PontXY típust használjuk. Így ránézésre már lesz képünk az eredményr l. Vezessük le az a és b képletét a LN módszerével. A levezetést mell zve a képletek: xi y i x a = x, b = i y i i x 4. i Hozzunk létre külön oszlopokat az összes szummának, azaz, az x i y i, x i, x i y i és x 4 i -nek. Az oszlopok végére számoljuk ki az összegeket. Számoljuk ki az a és b együtthatókat tetsz leges helyekre. Miel tt továbbmegyünk a determinációs együttható számítására, számoljuk ki a ŷ értékeket két újabb oszlopba (ŷ a, ŷ b ). Az így kapott függvény értékeket is ábrázoljuk a diagramban. Gyakoroljuk az újabb görbék hozzáadását már meglév diagramhoz (Adatok kijelölése, Hozzáadás,...). A kapott görbéket formázzuk meg, kijelölés után: adatsor formázása. A jelöl ket tüntessük el (Jelöl beállításai), a vonal legyen folytonos és különböz szín (Vonal színe). 3
1.3 Harmadik feladat (Polinomok 1 GÖRBEillesztése) ILLESZTÉS A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL Most már ránézésre is biztosan el tudjuk dönteni, hogy melyik illesztés a jobb, de hogy számszer sítsük a dolgot számoljuk most már ki a determinációs együtthatót. Ehhez számoljuk ki az E 1 a, E a, E 1 b és E b értékeket további négy oszlopba. (Az E 1 a és E 1 b gyakorlatilag ugyanaz!) Számoljuk ki és hasonlítsuk össze a determinációs együtthatókat, R a és R b értékeket. A feladatot az a esetben le is tudjuk ellen rizni. Illesszünk trendvonalat a mérési pontokra (Jobb gomb, Trendvonal felvétele, Metszéspont: 0, 0, Egyenlet látszik, R látszik.) 1.3. Harmadik feladat (Polinomok illesztése) El adáson szó volt arról, hogy a gyakorlatban legtöbbször valamilyen polinomot illesztünk a pontjainkra. Ha ilyen feladatot szeretnénk megcsinálni az egyik legkézenfekv bb kérdés, hogy milyen fokszámú polinomot illesszünk a pontjainkra. Lássunk most egy olyan példát ahol a pontokra tipikusan valamilyen polinom illeszthet. Els lépésként ábrázoljuk a pontjainkat diagramban. Most is a PontXY típust használjuk. Fontos, hogy a Bruttó hazai termék függvényében ábrázoljuk az Elítéltek számát. Ezután tetsz leges helyre hozzunk létere egy táblázatot az alábbi formában: N R 1 3 4 5 6 Az N jelenti az illeszteni kívánt polinom fokszámát, R pedig az Excel által kiszámolt determinációs együtthatót. Megjegyzés: Az egyes fokszám az egyenest jelenti, tehát el ször nem polinomot, hanem egyenest kell illeszteni, és ennek az R -ét kell az N=1-hez beírni!! Az el z feladatban ismertetett módon illesszünk különböz fokszámú polinomokat a pontjainkra, és töltsük ki a táblázatunkat. A maximálisan illeszthet polinom fokszám 6. Végül ábrázoljuk az R -et a polinom fokszám (N) függvényében. És döntsük el melyik fokszámot érdemes alkalmazni. 1.4. Negyedik feladat (Wald módszer) Ebben a feladatban a Wald módszert fogjuk alkalmazni egy olyan adatsorra, ahol az adatok valamelyik változó szerint határozottan szétválnak és két különálló csoportot alkotnak. Az adatsor Ausztráliában él nyúl (X) és róka Y populációt mutatja. Nézzük meg, hogy van-e lineáris kapcsolat 4
1.5 Ötödik feladat - LNM 1 GÖRBE ILLESZTÉS A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL az állatok mennyisége között. Ha van akkor a Wald módszer segítségével illesszünk egyenest az adatokra. Számoljuk ki a korrelációs együttható négyzetét a beépített KORREL függvénnyel. Látható, hogy az adatok között van lineáris kapcsolat. (A8:="R"; B8:=KORREL...) Mivel a Wald módszernél két különálló halmazra kell bontanunk az adatsor, el ször ábrázoljuk az adatokat pontxy diagramban. Látható, hogy az adatok az X változó szerint válnak szét természetszer leg. A határt vehetjük a kb 00000-es értéknél. Ami ennél kisebb az az 1-es, ami nagyobb az a -es csoportba fog tartozni. (A8:="Elválaszt"; B8:=00000) Csináljuk meg a szétválasztást. Hozzunk létre plusz négy oszlopot a két halmaz adatainak ( X1, Y 1, X és Y ). A szétválasztást a HA függvény segítségével végezzük el úgy, hogy mind az X és az Y változóra alkalmazható legyen. 1-es blokk: C:=HA($A<$B$9;A;"") végighúzni a C:D5-ös tartományon. -es blokk: E:=HA($A>$B$9;A;"") végighúzni a E:F5-ös tartományon. Számoljuk ki az oszlopok aljára az átlagokat. Az átlagok segítségével az Y = ax + b alakú egyenes együtthatói: a = Ȳ Ȳ1 X X 1, b = Ȳ1 a X 1 vagy b = Ȳ a X. Az illesztett függvény ábrázolásához egy új oszlopban számoljuk az illesztett függvény értékeket az X i helyeken, azaz, F i = ax i + b. A meglév diagramhoz adjuk hozzá az F i X i függvényt. A jelöl ket tüntessük el, a vonal legyen folytonos és mondjuk piros. Illesszünk a pontokra lineáris trendvonalat és hasonlítsuk össze a kapott eredményekkel. Az egyenlet és az R látszódjon a diagramon. Látható, hogy a két egyenes kissé eltér egymástól. 1.5. Ötödik feladat - LNM A letöltött táblázat utolsó munkalapján megtaláljuk a kiindulási adatokat. A pontok egy dugattyús szivattyú dugattyújának pozícióját mutatják. A pozíció id beli változását általánosan a következ függvény írja le: x (t) = a sin (ωt + φ) + b A hajtó motor fordulatszáma ismert (n = 10 fordulat/perc), amib l az ω szögsebesség számolható (ω = πn/60 = 10.68 rad/s). Továbbá azt is tudjuk, hogy a mintavétel kezdetén az alsó holtponton állt a dugattyú, így φ = 0 is feltételezhet. Ezekkel a leíró függvény: x (t) = a sin (10,68 t) + b Feladat: Határozzuk meg a lökethosszt (a) illetve a pozíció középértékét (b). Els lépésként ábrázoljuk a pontjainkat diagramban (Id -Pozíció). Majd ezután alkalmazzuk a legkisebb négyzetek módszerét: x i = a sin (10,68 t i ) + b, 5
1.5 Ötödik feladat - LNM 1 GÖRBE ILLESZTÉS A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL e i = a sin (10,68 t i ) + b x i, F = (a sin (10,68 t i ) + b x i ), Elvégezve az egyszer sítéseket: a = (a sin (10,68 t i ) + b x i )(sin (10,68 t i )) = 0 b = (a sin (10,68 t i ) + b x i )(1) = 0, a sin (10,68 t i ) + b sin (10,68 t i ) = x i sin (10,68 t i ) a sin (10,68 t i ) + b n = x i Az egyenletrendszer megoldására a manuális út: 1. második egyenletb l kifejezzük b-t,. azt visszahelyettesítjük az els egyenletbe, 3. azt megoldjuk a-ra, 4. a kapott a értéket visszahelyettesítjük b-be Vagy, használhatjuk az Excel-t is az egyenletrendszer megoldására: 1. összerakjuk a lineáris egyenletrendszer mátrixát és jobboldali vektorát: [ ] ( ) ( ) c1 c a d1 = c 3 c 4 b d Most c 1 = sin (10,68 t i ), c = c 3 = sin (10,68 t i ), c 4 = n, d 1 = x i sin (10,68 t i ) és d = x i. Tegyük pl a C mátrix értékeit K11:L1 cellákba és a d vektor értékeit a P11:P1 cellákba; ehhez pár új oszlopot ki kell számolni (sin (10,68 t i ), sin (10,68 t i ), x i sin (10,68 t i )). excel-el invertáljuk a mátrixot jelöljük ki a K15:L16 cellákat írjuk be: =INVERZ.MÁTRIX(K11:L1) nyomjunk CTRL+SHIFT+ENTER-t (tömbképlet) 3. számoljuk ki a megoldást: ( a b jelöljük ki P15:P16 a cellákat írjuk be: =MSZORZAT(K15:L16;P11:P1) ) = C 1 d nyomjunk CTRL+SHIFT+ENTER-t (tömbképlet) 6
1.5 Ötödik feladat - LNM 1 GÖRBE ILLESZTÉS A LEGKISEBB NÉGYZETEK MÓDSZERÉVEL címkézzük a cellákat. Ellen rzés végett számoljuk ki pár helyen a függvényértékünket és ábrázoljuk ugyanabban a diagramban ahol a mérési pontokat: Hozzunk létre valahol két oszlopot az alábbi formában: t x 0 0,0 0,04 0,06... Írjunk az t oszlop els két sorbába 0-át és 0, 0-ot, majd húzzuk le egészen -ig. Ezekben a pontokban szeretnénk kiszámolni az illesztett görbe értékeit. Az x oszlop els sorába számoljuk ki az a sin (10,68 t) + b értéket. Az a és b értékeit tartalmazó cellákat xáljuk le. Ezután a cellát húzzuk le az oszlop aljáig. Ábrázoljuk az összetartozó t-x értékpárokat a mérési pontok diagramjában: Jelöljük ki a mérési pontokat, Jobb gomb, Forrásadat, Adatsorok fülön Hozzáadás Adjuk meg az ábrázolni kívánt pontokat. Formázzuk meg a pontsorunkat: Jelöljük ki az új pontokat, Jobb gomb, Adatsorok formázása, A Mintázat fülön állítsuk be jelölöket összeköt vonalat feketére, és kapcsoljuk ki a jelöl ket. A vonalvastagság tetsz leges lehet. Látható hogy a saját magunk által illesztett görbe viszonylag jól közelíti a mérési pontokat. 7