GÖRBE ILLESZTÉS A LEGKISSEBB ÉGYZETEK MÓDSZERÉVEL. Görbe illesztés a legkissebb négyzetek módszerével Az előző gyakorlaton megismerkedtünk a korrelációs együttható fogalmával és számítási módjával. A korrelációs együttható számszerű információt ad arra, hogy két változó közötti kapcsolat mennyire lineáris. Viszont pusztán a korrelációs együttható ismerete nem ad választ arra a kérdésre, hogyan húzzuk be a közelítő egyenest a pontjaink közé. Csupán arra ad információt, hogy ez az egyenes mennyire jól írja le a kapcsolatot. A megoldás a regresszió, vagyis görbeillesztés. A görbe illesztésére több módszer is létezi pl: Kiválasztott pontok módszere, Közepek módszere, Legkisebb négyzetek (L) módszere, Wald módszer. Most egyenlőre a legkisebb négyzetek módszerével foglalkozunk, de a gyakorlat végén a Wald módszerre is csinálunk példát. A L módszere nem csak lineáris illesztésre jó, de először csak erre csináljuk meg mert így lesz kerek egész a korrelációs együtthatóval. Egy Y = ax +b alakú egyenest szeretnénk illeszteni az (X i,y i ) mérési eredményeinkre. Cél az a és b paraméterek meghatározása. Először illesszünk X és Y hoz egy-egy indexet: Y i = ax i +b. Mindent pakoljunk át a baloldara. Mivel az egyenes valószínüleg nem megy át minden ponton így megkajuk az elemi e i eltéréseket az egyenestől: e i = Y i ax i b. Ezeket a hibákat emeljük négyzetre, majd összegezzük, ez lesz az összes négyzetes hiba F: F = (Y i ax i b). Ennek a hibának a minimumát kell megkeresni a és b szerinti deriválással: a = (Y i ax i b)( ) = 0, b = (Y i ax i b)( ) = 0. Egyszerűsítünk -vel és a negatív előjelekkel, és felbontjuk a zárójelet: Yi X i a X i b X i = 0, Yi a X i b = 0. Ez egy egyenletből álló egyenletrendszer. Ezt kell megoldani a-ra és b-re.
. Első Feladat GÖRBE ILLESZTÉS A LEGKISSEBB ÉGYZETEK MÓDSZERÉVEL A második egyenletből a b konstans kifejezhető, a -re figyeljünk: b = Y i a X i, Yi a X i b =, b = Y ax. Ez az eredmény jelzi, hogy az egyenes átmegy a súlyponton. Ezt helyettesítsük be a felső egyenletbe: Yi X i a Xi Y X i +ax X i = 0, ( a X X i ) Xi = Y X i Y i X i, a = Y X i Y i X i X X i. Xi Ezek után illeszünk az előző gyakorlaton megadott Szűrések száma-tüdőasztmások száma feladat pontjaira egy egyenest... Első Feladat Az előző gyakorlaton a Tüdőasztma (X) - Szűrések száma(y ) adatoknak a korrelációs együtthatóját számítottuk ki. Illesszük rá a pontokra a közelítő egyenest. Számoljuk ki az egyes átalgértékeket X és Y. Ezeket célszerű az egyes oszlopok alján elhelyezni. Majd minden összegnek hozzunk létre új oszlopot: X i (már létezik), Y i X i és X i értékeket. Számoljuk ki a szummákat az egyes oszlopk aljára. Végül a képleteket felhasználva számoljuk ki az egyenes paramétereit. Értelemszerűen az a paramétert tudjuk először kiszámolni és utána a b-t. Az eredményt könnyen tudjuk ellenőrizni az Excel segítségével. Ehhez először ábrázoljuk a pontjainkat egy diagrammban. A szokásos PontXY típust használjuk. Ha ez kész van akkor jelöljük ki a pontokat majd: Jobb gomb, Trendvonal felvétele, Típus fülön: Lineáris (ez alapértelmezett). Egyebek fülön: Egyenlet látszik a diagrammon kipipálni, R-négyzet értéke látszik a diagrammon kipipálni. Görbe illesztéshez az Excel-ben jelöljük ki azt a ponthalmazt amire illeszteni szeretnénk, majd a jobb gomb hatására lenyíló menüben válasszuk a Trendvonal felvétele menüpontot. A Tödőasztma-Dohányfogyasztás részt mindenki próbálja meg saját maga megcsinálni.
. Második Feladat (Determinációs GÖRBE ILLESZTÉS együttható) A LEGKISSEBB ÉGYZETEK MÓDSZERÉVEL... Az Excel görbe illesztési lehetőségei Az előző példa kapcsán megtanultuk, hogyan lehet Excel-ben ponthalmazra görbét illeszteni. Most röviden nézzük át milyen lehetőségeink vannak: Lineáris = y = a x+b, Logaritmikus = y = a ln(x)+b, Polinomiális = y = a x n +b x n +...,(A fokszám maximuma 6) Hatvány = y = a x b, Exponenciális = y = a e bx,.. Második Feladat (Determinációs együttható) Most vizsgáljunk meg egy olyan esetet, ahol a függvényillesztést nem lehet excel segítségével elvégezni. Ebben az esetben az illesztés "jóságát" nem tudjuk excel determinációs együtthatójával és/vagy a korrelációs együtthatóval megvizsgálni, hanem a determinációs együtthatót magunknak kell számolni: R = E E E, E = (y i y), E = (y i ŷ i ), ahol ŷ i = f(x i ) a illesztett függvény helyettesítési értéke az x i helyen. A második feladatban adott pontokra egy y a = ax és egy y b = bx alakú függvényt kell illeszteni és a determinációs együttható segítségével eldönteni, hogy melyik illesztés a jobb. Első lépésként ábrázoljuk a pontjainkat diagrammban. Most is a PontXY típust használjuk. Így ránézésre már lesz képünk az eredményről. Vezessük le az a és b képletét a L módszerével. A levezetést mellőzve a képletek: xi y i x a = x, b = i y i i x 4. i Hozzunk létre külön oszlopokat az összes szummának, azaz, az x i y i, x i, x i y i és x 4 i-nek. Az oszlopok végére számoljuk ki az összegeket. Számoljuk ki az a és b eggyüthatókat tetszőleges helyekre. Mielött továbbmegyünk a determinációs együttható számítására, számoljuk ki a ŷ értékeket két újabb oszlopba (ŷ a, ŷ b ). Az így kapott függvény értékeket is ábrázoljuk a diagrammban. Gyakoroljuk az újabb görbék hozzáadását már meglévő diagrammhoz (Adatok kijelölése, Hozzáadás,...). A kapott görbéket formázzuk meg, kijelölés után: adatsor formázása. A jelölőket tüntessük el (Jelölő beállításai), a vonal legyen folytonos és különböző színű (Vonal színe). 3
.3 Harmadik feladat (Polinomok GÖRBE ILLESZTÉS illesztése) A LEGKISSEBB ÉGYZETEK MÓDSZERÉVEL Most már ránézésre is biztosan el tudjuk dönteni, hogy melyik illesztés a jobb, de hogy számszerűsítsük a dolgot számoljuk most már ki a determinációs együtthatót. Ehhez számoljuk ki az E a, E a, E b és E b értékekt további négy oszlopba. (Az E a és E b gyakorlatilag ugyanaz!) Számoljuk ki és hasonlítsuk össze a determinációs együtthatókat, R a és R b értékeket. A feladatot az a esetben le is tudjuk ellenőrizni. Illesszünk trendvonalat a mérési pontokra (Jobb gomb, Trendvonal felvétele, Metszéspont: 0,0, Egyenlet látszik, R látszik.).3. Harmadik feladat (Polinomok illesztése) Előadáson szó volt arról, hogy a gyakorlatban legtöbbször valamilyen polinomot illesztünk a pontjainkra. Ha ilyen feladatot szertnénk megcsinálni az egyik legkézenfekvőbb kérdés, hogy milyen fokszámú polinomot illesszünk a pontjainkra. Lássunk most egy olyan példát ahol a pontokra tipikusan valamilyen polinom illeszthető. Első lépésként ábrázoljuk a pontjainkat diagrammban. Most is a PontXY típust használjuk. Fontos, hogy a Bruttó hazai termék függvényében ábrázoljuk az Elítéltek számát. Ezután tetszőleges helyre hozzunk létere egy táblázatot az alábbi formában: R 3 4 5 6 Az jelenti az illeszteni kívánt polinom fokszámát, R pedig az Excel által kiszámolt determinációs együtthatót. Megjegyzés: Az egyes fokszám az egyenest jelenti, tehát először nem polinomot, hanem egyenest kell illeszteni, és ennek az R -ét kell az =-hez beírni!! Az előző feladatban ismertetett módon illesszünk különböző fokszámú polinomokat a pontjainkra, és töltsük ki a táblázatunkat. A maximálisan illeszthető polinom fokszám 6. Végül ábrázoljuk azr -et a polinom fokszám () függvényében. És döntsük el melyik fokszámot érdemes alkalmazni..4. egyedik feladat (Wald módszer) Ebben a feladatban a Wald módszert fogjuk alkalmazni egy olyan adatsorra, ahol az adatok valamelyik változó szerint határozottan szétválnak és két különálló csoportot alkotnak. Az adatsor 4
.5 Ötödik feladat (Csak GÖRBE ha van idő) ILLESZTÉS A LEGKISSEBB ÉGYZETEK MÓDSZERÉVEL Ausztráliában élő nyúl (X) és róka Y populációt mutatja. ézzük meg, hogy van-e lineáris kapcsolat az állatok mennyisége között. Ha van akkor a Wald módszer segítségével illeszünk egyenes az adatokra. Számoljuk ki a korrelációs együttható négyzetét a beépített KORREL függvénnyel. Látható, hogy az adatok között van lineáris kapcsolat. (A8:="R"; B8:=KORREL...) Mivel a Wald módszernél két különálló halamzra kell bontanunk az adatsor, először ábrázojuk az adatokat pontxy diagrammban. Látható, hogy az adatok az X változó szerint válnak szét természetszerüleg. A határt vehetjük a kb 00000-es értéknél. Ami ennél kissebb az az -es, ami nagyobb az a -es csoportba fog tartozni. (A8:="Elválaszt"; B8:=00000) Csináljuk meg a szétválasztást. Hozzunk létre plusz négy oszlopot a két halmaz adatainak (X, Y, X és Y). A szétválasztást a HA függvény segítségével végezzük el úgy, hogy mind az X és az Y változóra alkalmazható legyen. -es blokk: C:=HA($A<$B$9;A;"") végighúzni a C:D5-ös tartományon. -es blokk: E:=HA($A>$B$9;A;"") végighúzni a E:F5-ös tartományon. Számoljuk ki az oszlopok aljára az átlagokat. Az átlagok segítségével az Y = ax + b alakú egyenes együtthatói: a = Ȳ Ȳ X X, b = Ȳ a X vagy b = Ȳ a X. Az illesztett függvény ábrázolásához egy új oszlopban számoljuk az illeszett függvény értékekt az X i helyeken, azaz, F i = ax i +b. A meglévő diagrammhoz adjuk hozzá az F i függvényt. A jelölőket tüntessük el, a vonal legyen folytonos és mondjuk piros. Illeszünk a pontokra lineáris trendvonalat és hasonlítsuk össze a kapott eredményekkel. Az egyenlet és az R látszódjon a diagrammon. Látható, hogy a két egyenes kissé eltér egymástól..5. Ötödik feladat (Csak ha van idő) A letöltött táblázat utolsó munkalapján megtaláljuk a kiindulási adatokat. A pontok egy vizzel töltött tartály felmelegedésnek pontjait tartalmazza. Első lépésként ábrázoljuk a pontjainkat diagrammban (Idő-Hőmérséklet). Előzetes számítások alapján tudjuk, hogy a folyamat exponenciális felfutású. Tehát első lépésként illesszünk a pontjainkra exponenciális trendvonalat. Látható, hogy az illesztés nagyon rosz. Ez abból adódik, hogy az Excel csak y = ae bx típusú függvényt tud illeszteni. ekünk viszont y = ae x +b típusú közelítő függvényre van szükségünk. Tehát kénytelenek vagyunk magunk meghatározni a paramétereket: Y i = a e Xi +b, e i = Y i a e Xi +b, 5
.5 Ötödik feladat (Csak GÖRBE ha van idő) ILLESZTÉS A LEGKISSEBB ÉGYZETEK MÓDSZERÉVEL F = (Y i a e Xi +b), Elvégezve az egyszerűsíteseket: a = (Y i a e Xi +b)( e Xi ) = 0 b = (Y i a e Xi +b)( ) = 0, Yi e Xi a e Xi e Xi b e Xi = 0 Yi a e Xi b = 0, A második egyenletből a b konstans: b = Y i a e Xi Yi a e Xi b =, Ezt helyettesítsük be a felső egyenletbe: e e = 0, Yi e Xi a e Xi Yi e +a ( a e e ) e Xi = Yi e Y i e Xi, Yi e Y i e Xi a =. e e e X i A paraméterek kiszámolásához számoljunk ki részeredméyneket: Először számoljuk ki az Y i összegét az oszlop aljára. Ezután külön oszlopokban számoljuk ki az egyes e Xi,e Xi és Y i e Xi értékeket. Excel-ben az exponenciális függvényt a KITEVŐ() paracs jelenti. A függvény a zárójelben lévő számnak az exponensét adja vissza. Ügyeljünk arra, hogy a KITEVŐ() parancsba ne felejtsük el a negatív előjelet beírni!! Számoljuk ki az oszlopok aljára az összegeket. Végül a képletek segítségével számoljuk ki a paramétereket. Ellenőrzés végett számoljuk ki pár helyen a függvényértékünket és ábrázoljuk ugyanabban a diagrammban ahol a mérési pontokat: 6
.5 Ötödik feladat (Csak GÖRBE ha van idő) ILLESZTÉS A LEGKISSEBB ÉGYZETEK MÓDSZERÉVEL Hozzunk létre valahol két oszlopot az alábbi formában: X Y 0,5 0,6 0,7 0,8... 3,5 Irjunk az X oszlop első két sorbába 0,5-öt és 0,6-ot, majd húzzuk le egészen 3,5 ig. ezekben a pontokban szeretnénk kiszámolni az illesztett görbe értékeit. Az Y oszlop első sorába számoljuk ki az a e x +b értéket. Az a és b értékeit tartalmazó cellákat fixáljuk le. Ezután a cellát húzzuk le az oszlop aljáig. Ábrázoljuk az összetartozó X-Y értékőárokat a mérési pontok diagrammjában: Jelöljük ki a mérési pontokat, Jobb gomb, Forrásadat, Adatsorok fülön Hozzáadás Adjuk meg az ábrázolni kívánt pontokat. Formázzuk meg a pontsorunkat: Jelöljük ki az új pontokat, Jobb gomb, Adatsorok formázása, A Mintázat fülön állítsuk be jelölöket összekötő vonalat feketére, és kapcsoljuk ki a jelölőket. A vonalvastagság tetszőleges lehet. Látható hogy a saját magunk által illesztett görbe viszonylag jól közelíti a mérési pontokat. 7