Alkalmazott statisztika



Hasonló dokumentumok
SEGÉDLET A kutatási eredmények számítógépes kiértékelése c. PhD. tárgyhoz

Időjárási légnyomásváltozás regressziós analízise

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Erdészeti adathalmazok elemzése új függvénnyel

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Korreláció és lineáris regresszió

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

Mérési adatok illesztése, korreláció, regresszió

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Matematika gyógyszerészhallgatók számára. A kollokvium főtételei tanév

Matematikai geodéziai számítások 6.

Korrelációs kapcsolatok elemzése

PTE PMMFK Levelező-távoktatás, villamosmérnök szak

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Matematikai geodéziai számítások 6.

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének

[Biomatematika 2] Orvosi biometria

Többváltozós, valós értékű függvények

10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A mérési eredmény megadása

A leíró statisztikák

Regresszió számítás. Tartalomjegyzék: GeoEasy V2.05+ Geodéziai Kommunikációs Program

Adatok statisztikai értékelésének főbb lehetőségei

Al-Mg-Si háromalkotós egyensúlyi fázisdiagram közelítő számítása

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Regressziós vizsgálatok

Mérési hibák

Több valószínűségi változó együttes eloszlása, korreláció

Bevezetés a Korreláció &

Matematikai statisztika c. tárgy oktatásának célja és tematikája

A statisztika oktatásáról konkrétan

y ij = µ + α i + e ij

Függvények Megoldások

6. Folytonosság. pontbeli folytonosság, intervallumon való folytonosság, folytonos függvények

Lengyelné Dr. Szilágyi Szilvia április 7.

13. modul: MÁSODFOKÚ FÜGGVÉNYEK

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika elméleti összefoglaló

Számítógépes döntéstámogatás. Statisztikai elemzés

Kétváltozós függvények differenciálszámítása

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Matematika. 4. konzultáció: Kétváltozós függvények szélsőértéke. Parciális függvény, parciális derivált

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉPSZINT Függvények

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Rugalmas állandók mérése

Problémás regressziók

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Tanmenet a évf. fakultációs csoport MATEMATIKA tantárgyának tanításához

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet

11. modul: LINEÁRIS FÜGGVÉNYEK

1. Görbe illesztés a legkissebb négyzetek módszerével

BIOMATEMATIKA ELŐADÁS

Segítség az outputok értelmezéséhez

Rácsvonalak parancsot. Válasszuk az Elsődleges függőleges rácsvonalak parancs Segédrácsok parancsát!

FÜGGVÉNYTANI ALAPOK A) ÉRTELMEZÉSI TARTOMÁNY

Osztályozóvizsga követelményei

2010. október 12. Dr. Vincze Szilvia

GEOSTATISZTIKA II. Geográfus MSc szak. 2019/2020 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

Matematikai statisztikai elemzések 6.

Többváltozós, valós értékű függvények

HÁZI FELADATOK. 1. félév. 1. konferencia A lineáris algebra alapjai

Osztályozóvizsga és javítóvizsga témakörei Matematika 9. évfolyam

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉP SZINT Függvények

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

EGYENES ILLESZTÉSE (OFFICE

Biomatematika 2 Orvosi biometria

Sorozatok határértéke SOROZAT FOGALMA, MEGADÁSA, ÁBRÁZOLÁSA; KORLÁTOS ÉS MONOTON SOROZATOK

Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com

Konjugált gradiens módszer

Függvények vizsgálata

MATEMATIKA EMELT SZINTŰ SZÓBELI VIZSGA TÉMAKÖREI (TÉTELEK) 2005

MATEMATIKA A KÖZGAZDASÁGI ALAPKÉPZÉS SZÁMÁRA SZENTELEKINÉ DR. PÁLES ILONA ANALÍZIS PÉLDATÁR

Matematikai geodéziai számítások 10.

A fák növekedésének egy modelljéről

[Biomatematika 2] Orvosi biometria

2) Írja fel az alábbi lineáris függvény grafikonjának egyenletét! (3pont)

A Föld középpontja felé szabadon eső test sebessége növekszik, azaz, a

Faktoranalízis az SPSS-ben

Matematika 8. osztály

E-tananyag Matematika 9. évfolyam Függvények

Gauss-Seidel iteráció

Követelmény a 7. évfolyamon félévkor matematikából

Descartes-féle, derékszögű koordináta-rendszer

GEOSTATISZTIKA. Földtudományi mérnöki MSc, geofizikus-mérnöki szakirány. 2018/2019 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.


Sorozatok I. Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma)

DIFFERENCIÁLEGYENLETEK. BSc. Matematika II. BGRMA2HNND, BGRMA2HNNC

A HŐMÉRSÉKLET ÉS A CSAPADÉK HATÁSA A BÜKK NÖVEKEDÉSÉRE

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Méréselmélet és mérőrendszerek 2. ELŐADÁS (1. RÉSZ)

Differenciálegyenletek. Vajda István március 4.

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Átírás:

Alkalmazott statisztika Csanády Viktória Horváth-Szováti Erika Szalay László Nyugat-magyarországi Egyetem Sopron, 2013 TALENTUM TÁMOP 4. 2. 2/B 10/1 2010-0018 cím: 9400 Sopron, Erzsébet u. 9. telefon: 99 518-491 e-mail: talentum@ktk.nyme.hu

Felelős kiadó: Prof. Dr. Németh Róbert tudományos és külügyi rektorhelyettes Szerkesztők: Dr. Németh László Dr. Szalay László Lektorálta: Prof. Dr. Závoti József Szerzők: 1. Fejezet: Dr. Csanády Viktória 2. Fejezet: Dr. Horváth-Szováti Erika 3. Fejezet: Dr. Horváth-Szováti Erika 4. Fejezet: Dr. Szalay László Nyugat-magyarországi Egyetem Erdőmérnöki Kar Matematikai Intézet 9400 Sopron, Ady Endre út 5. Kiadó: Nyugat-magyarországi Egyetem Kiadó 9400 Sopron Bajcsy-Zsilinszky utca 4. ISBN 978-963-334-243-5 Sopron 2013

Tartalomjegyzék Bevezetés... 5 Alkalmazott programcsomag... 7 1. Regresszió számítás és korreláció... 9 1.1. Egyváltozós lineáris és nem lineáris regresszió, korreláció... 9 1.2. Nem lineáris regressziók alkalmazása gyakorlati példákban... 10 1.2.1. Növekedési függvények... 11 1.2.2. Rönkleltár... 21 1.2.3. Faanyagszárítás... 22 1.2.4. Anyaglehűlés... 24 1.2.5. Hangerő ingerérték... 26 1.2.6. Lövedékpálya... 28 1.2.7. Lázgörbe... 30 1.2.8. Napi levegő hőmérséklet... 32 1.2.9. Ötvözet vezetőképesség... 34 1.2.10. Huzalfeszítés... 36 1.2.11. Radioaktív sugárintenzitás... 38 1.2.12. Toboztömeg változás... 40 1.2.13. I. és IV. fatermési osztály vizsgálata akác esetén... 42 1.2.14. Hat fatermési osztály összefoglaló vizsgálata akác esetén... 55 1.3. Összefoglaló az alkalmazott modellekből... 61 1.4. Összefüggéseket leíró függvények keresése adathalmazok vonatkozásában... 65 1.4.1. Elvi alapok... 65 1.4.2. Adathalmaz választás... 66

2 1.4.3. Regressziós kísérletsorozat és elemzés... 68 1.5. Értékelés és összefoglalás... 81 1.6. Statisztikai melléklet a korrelációs vizsgálathoz... 81 1.7. Többváltozós lineáris és nem lineáris regresszió... 82 1.8. Biometriai többváltozós kísérletek elemzése... 83 1.8.1. Első kísérlet (gabonafélék növekedése)... 84 1.8.2. Második kísérlet (gyomirtó szer hatása)... 87 1.8.3. Harmadik kísérlet (nyomószilárdság vizsgálat)... 89 2. Főkomponens-analízis... 93 2.1. Bevezetés... 93 2.2. A főkomponens-analízis matematikai alapja... 94 2.3. A főkomponens analízis lépései... 97 2.4. Főkomponens-analízis STATISTICA 11 programcsomag segítségével... 98 2.5. A főkomponens-analízis alkalmazhatóságának vizsgálata... 113 3. Faktoranalízis... 115 3.1. A faktoranalízis matematikai modellje... 115 3.2. A faktoranalízis menete... 117 3.2.1. A faktorok számának meghatározása... 119 3.2.2. A faktorsúlyok kiszámítása... 121 3.2.3. A faktor-rotáció... 122 3.2.4. A faktoranalízis megbízhatóságának vizsgálata... 126 3.2.5. A faktorértékek kiszámítása... 127 3.3. Egy további példa a faktoranalízis alkalmazására... 128 3.4. A faktoranalízis alkalmazhatóságának feltételei és a tapasztalatok összegzése... 135 3.4.1. Alkalmazhatósági feltételek... 135 3.4.2. A faktoranalízissel kapcsolatos tapasztalataink összegzése. 137 3.5. A főkomponens-analízis és faktoranalízis összehasonlítása... 137

4. Klaszteranalízis... 149 4.1. Alapfogalmak... 152 4.2. Partíciós módszer: a k-közép eljárás... 154 4.2.1. Első klaszterezés... 155 4.2.2. Második klaszterezés... 157 4.3. Hierarchikus módszer... 160 4.4. A Statistica programcsomag Cluster modulja... 162 4.4.1. Joining (tree clustering)... 165 4.4.2. K-means clustering... 168 Felhasznált irodalom... 173

Bevezetés Ez az egyetemi jegyzet a statisztika négy területét elemzi, elsősorban gyakorlati szempontból. A regressziószámítás, a főkomponens-analízis, a faktoranalízis és a klaszteranalízis alkalmazási lehetőségeit vizsgáljuk valós életből vett példák alapján, nagy hangsúlyt fektetve a számítások Statistica programcsomaggal történő elvégzésére. Ahol szükségesnek láttuk, röviden az elméleti hátteret is áttekintettük. Elsősorban a Nyugat-magyarországi Egyetem PhD és master hallgatóinak figyelmébe ajánljuk, de Tudományos Diákköri Konferenciára készülők is haszonnal forgathatják. Alapvető számítástechnikai ismeretek birtokában bárki elsajátíthatja az algoritmusok számítógéppel történő használatát. Köszönetünket fejezzük ki az Erdőmérnöki Kar vezetésének, amiért támogatta és lehetővé tette a jegyzet létrejöttét, megjelenését. 2013. szeptember 15. A szerzők

Alkalmazott programcsomag Az alábbiakban tárgyalásra és bemutatásra kerülő statisztikai alkalmazások minden esetben a STATISTICA 11. programcsomag [10] felhasználásával készültek. A STATSOFT weblapja a következő tömör jellemzést adja termékéről: A STATISTICA összetett programrendszer, mely integrált adatelemző, megjelenítő, adatbáziskezelő és alkalmazásfejlesztő eszközeivel az egyszerűtől a legmagasabb szintig az analitikai módszerek széles skáláját biztosítja az üzleti, tudományos, adatbányász vagy mérnöki alkalmazásokhoz. A STATISTICA az általános célú statisztikai, grafikai és adatkezelő eljárásokon túlmenően számos speciális adatelemző eljárást is tartalmaz (például adatbányászati, üzleti, társadalomtudományi, orvosi kutatási, mérnöki alkalmazásokhoz). A STATISTICA termékcsalád analitikai eszközeit integrált csomag formájában nyújtja. Az eszközök használatához alternatív felületek állnak rendelkezésre, valamint az ipari szabványnak tekinthető, Visual Basic alapú programnyelv. Az interaktív felhasználói felület könnyen konfigurálható, a programnyelv (STATISTICA Visual Basic) segítségével pedig bármilyen bonyolultságú feladat automatizálható, legyen szó egyszerű makrórögzítésről, vagy összetett, nagy léptékű fejlesztési feladatról (például egyedi kiegészítés, mely más alkalmazásokkal köti össze, vagy vállalati szintű, intranet/internet alapú rendszerbe integrálja a STATISTICA programot). A fenti összefoglalóból kitűnik a programcsomag széleskörű alkalmazhatósága. A felkínált lehetőségek közül itt csak néhány került felhasználásra, elsősorban a mérnöki gyakorlatban gyakran előforduló vizsgálatok. Röviden összefoglalva, a programcsomag segítségével tetszőleges igény szerint megkaphatjuk a szükséges leíró statisztikai jellemzőket megfelelő igény szerint választható ábrákkal, melyek a gyors adatismereti eligazodásban segítenek. Elvégezhetők a különböző próbák, paraméteres, nem paraméteres esetben, természetesen szabadon választható szignifikancia szintek mellett. Lehetőség van a variancia analízis körében egyszeres, többszörös osztályozásra, a kritérium próbák vizsgálata mellett, továbbá adott regressziós modellek használatára. Mindez azonban, ami felsorolásra került, valójában egy végzett mérnök tanulmányaiban már szerepet kapott, és nagyon csekély része csupán a statisztikai lehetőségeknek. Emiatt itt a későbbiekben néhány gyakran használt statisztikai vizsgálat kerül bemutatásra, a fejezetek sorrendjében, a regresszió és korreláció számítás, egy és többváltozós esete, a többváltozós statisztikai vizsgálatok közül a főkomponens analízis, a faktoranalízis és végül a klaszteranalízis. Rövid elméleti bevezetést követően, minden esetben gyakorlati példák bemutatására kerül sor, a program felhasználásával. A program használata könnyen elsajátítható, menü rendszere áttekinthető. Az adatbevitelt követően választási lehetőség nyílik a különböző vizsgálatokra, a kiválasztott modul paraméterei választhatók, valamint lehetőség van a vizsgálati módszer típusá-

8 nak kiválasztására is, példaként mód van arra, hogy milyen matematikai módszert kíván a felhasználó alkalmaztatni az algoritmusban. A felsorolt tárgyalásra kerülő vizsgálati módszereken kívül, ahogy azt az idézett összefoglaló is tartalmazta, számos más vizsgálatra is lehetőség nyílik. Itt feltétlenül megemlítendő az idősorok vizsgálata, a trendszámítás, az elméleti kutatások mellett gyakorlatban előforduló teljesítmény elemzés, valamint a különböző ipari minőség ellenőrzési vizsgálatok, ipari folyamat vizsgálatok. Mindezek részletes bemutatása többszörös terjedelmet igényelne, nem ez a célja a szerzőknek. Jelen kiadvány segítséget kíván adni azon végzett mérnökök számára, akik kutatásaik során szembesülnek az itt általuk bemutatott vizsgálati módszerek valamelyikével.

1. Regressziószámítás és korreláció A regresszió számítás során valószínűségi változók esetünkben kísérleti adatok tendenciáját regressziós függvénnyel jellemezhetjük. Csoportosítva ezeket a következő osztályozás lehetséges: egy független változós lineáris és nem lineáris regresszió, több független változós lineáris és nem lineáris regresszió. A korrelációs együttható lineáris modell esetén jellemzi a két változó lineáris kapcsolatának szorosságát, ezért is nevezzük helyesen lineáris korrelációs együtthatónak (r). Számítása itt nem kerül bemutatásra, a hallgató a Statisztika tárgy keretében már találkozott vele. Nem lineáris modell esetén az úgynevezett korrelációs vizsgálatot alkalmazzák, ami egy F-próbára vezet, általa van lehetőség a kapcsolat szorosságának vizsgálatára. 1.1. Egy független változós lineáris és nem lineáris regresszió, korreláció Az egyváltozós lineáris regresszió célja azon egyenes meredekségének és tengelymetszetének a meghatározása, amely a lehető legjobban közelíti a ponthalmaz feltételezett lineáris sztochasztikus kapcsolatát. A ponthalmaz ismeretében a regressziós egyenes meghatározásának egyik módszere a Gauss-féle legkisebb négyzetek módszerének elve. Ennek során meghatározásra kerül a ponthalmaz pontjainak a lineáris modelltől vett y irányú távolságainak négyzetösszege. A négyzetösszeg a meredekség és tengelymetszet vonatkozásában egy két független változós függvényt eredményez, mely függvénynek, az említett módszer a minimumát keresi. Ennek részletes matematikai levezetését a hallgatók Matematika I. tárgy keretéből ismerhetik. A módszer lényege a kétváltozós függvény szélsőérték problémájából adott, szükséges feltételként meghatározásra kerülnek a változók szerinti parciális deriváltak, majd zérusra rendezve adott a lineáris regresszió normál egyenletrendszere, ennek megoldása pedig megadja a keresett meredekség és tengelymetszet értékét. Ugyanezen elv alapján határozhatók meg a nem lineáris regressziós modell paraméterei. A legkisebb négyzetek elve ebben az esetben is alkalmazható. A minimalizálandó többváltozós függvény előállítható, a parciális deriváltak számíthatók. A fő problémát azonban legtöbb esetben az okozza, hogy a parciális deriváltakból képzett egyenletrendszer hagyományos kézi módszerekkel nem megoldható. Ezért korábban, a számítógép adta lehetőségek hiányában különböző matematikai módszerek bevetésével próbálkoztak, így például a modell sorbafejtésével. Egy másik ismeretes módszer az úgynevezett linearizálás volt, ami bizonyos egyszerűbb modellek esetén szóba jöhetett, így

10 egy közönséges exponenciális függvény függőleges eltolási paraméter nélkül logaritmizálva lineáris alakot adott. Más esetben egyszerűen átjelöléssel próbálkoztak. Ezek a módszerek azonban lényegesen leszűkítették az alkalmazható modellek számát. A számítógép adta lehetőség, a számítások többszörös és rendkívül gyors ciklikus elvégzése nem igényel már efféle beavatkozást. Természetesen a megfelelő modellt a felhasználónak kell megadnia, ezt követően választhat a számításhoz felhasznált matematikai módszerek közül, viszont ismernie kell a kiválasztott modell matematikai tulajdonságait. A program lefuttatása azonban okozhat nehézséget, így például bonyolultabb modell esetén, mivel az algoritmus kezdőértékeket igényel a meghatározandó paraméterekre. Ezen kezdőértékek megadása viszont a modell ismeretére és a ponthalmaz viselkedésére épül. Fontos tehát az, hogy a megfelelően választott kezdőértékek a számítást jó irányba tereljék, ehhez esetleg további lépésköz finomításra is szükség lehet. Optimális esetben a program megadja a számunkra legkedvezőbb paraméterértékeket, valamint a kapcsolat szorosságát, azaz az R értékét. A R értéke nem egyezik meg az úgynevezett r lineáris korrelációs együttható értékével, és így persze annak számítása is eltér attól. A R értékét a korreláció számítás varianciáinak felhasználásával adják meg, a kapcsolat annál szorosabb minél közelebb van az R értéke az egyhez, akár a lineáris korrelációs együttható esetében. A két érték azonban nem lineáris modell illesztése esetén eltér, nem ugyanaz, nyilván nem lineáris modell esetén a lineáris korrelációs együttható nem használható, hamis kapcsolatot jellemez. A R nagysága azonban ne ösztönözzön arra, hogy modell változtatással, az értékét az egyhez közelítsük. Előfordulhat, hogy egy folyamatot jól leíró modell R értéke kisebb, mint a folyamatot csak interpoláló görbe R értéke. Modell választás esetén törekedni kell arra, hogy a regressziós függvény lehető legjobban kövesse a ponthalmaz tendenciáját, paraméterei fizikailag értelmezhetők legyenek, vegye figyelembe a ponthalmaz korlátosságát, esetleges aszimptotikusságát, vagy egyéb matematikai tulajdonságait. 1.2. Nem lineáris regressziók alkalmazása gyakorlati példákban A természetben előforduló különböző folyamatok vizsgálata során nyert egy független és egy függőváltozós adatsorokra regressziós eljárással matematikai függvények illeszthetők, melyek meghatározzák a folyamatok törvényszerűségét. Az adatsorok által meghatározott pontok grafikus szemlélete alapján mód van megfelelő illesztendő függvény vagy függvények kiválasztására. A helyes döntést alapvetően a számítógépes regressziós eljárás végrehajtása során nyert 1-hez legközelebb álló korrelációs együttható (R) indokolhatja amellett, hogy a kiválasztott függvény nyert paraméterei a valóságnak megfelelően értelmezhetők legyenek.

A bemutatásra és elemzésre kerülő adatsorok a természetben előforduló folyamatok adatsorait modellezik a gyorsabb és egyszerűbb regressziós eljárások alkalmazása és értékelése érdekében. 1.2.1. Növekedési függvények 1.2.1.1. Telítési függvény (Awrami) Az első adatsor az idő függvényében a fanövekedés értékeit tartalmazza [2]. Az adatsor előzetes áttekintése vagy grafikus ábrázolása alapján könnyen megállapítható, hogy a függvény illesztéséhez telítési függvény alkalmazása a célszerű. A matematikai alak: = 1 + (Awrami-görbe). A számítógépes alak: 2 = 3 1 1 2 1 1 + 0. A változók: 1 = évek száma (év), 2 = famagasság (m). Az adatsort, a regressziós eljáráshoz szükséges kezdőértékeket, a nyert paraméter értékeket, a korrelációs együtthatót és az értelmezést az alábbi táblázatok tartalmazzák. 1.1. Példa Adatok 1 2 1 0 0,19 2 2 0,46 3 6 1,91 4 10 4,12 5 14 6,81 6 18 9,72 7 22 13,61 8 26 16,82 9 30 18,31 10 36 21,62 11 42 23,02 12 48 24,01 13 54 24,72 14 62 25,05 15 70 25,09 1.1. táblázat

12 Kezdőértékek: b3=b2=b1=b0=0,1 (a programban alapbeállításként szereplő értékek, módosítást nem igényelnek). Kapott értékek: Model: var2=b3*(1-exp(-1*((b2*var1)^b1)))+b0 (pelda1) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,929228643 R=,99965 Variance explained: 99,929% N=15 b3 b2 b1 b0 Estimate 24,78002 0,039166 1,922410 0,265289 Értelmezés: b3+b0 = az elért legnagyobb (végső) famagasság (m), b0 = a kezdő famagasság (m). Megadható az a 1 érték (x), melynél a határértéktől való eltérés 1%-os a 2-re nézve. Ez az alábbi képlettel számítható:! = "! #! "$$ )!2. " "% &' &( Az illesztés grafikus reprezentációját a 1.1. ábra mutatja. 1.1. ábra Az előző függvény illesztése módosított kezdőértékekkel az alábbi. Kezdőértékek: b3=b2=b1=b0=1. A kapott értékek: Model: var2=b3*(1-exp(-1*((b2*var1)^b1)))+b0 (pelda1) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,929228644 R=,99965 Variance explained: 99,929% N=15 b3 b2 b1 b0 Estimate 24,78002 0,039166 1,922409 0,265285

1.2. ábra Mint ahogy az az eredményekből is látható az Awrami függvény illesztése a kezdőértékekre kevésbé érzékeny. Megismételve a kísérletet az alábbi kezdőértékekre: b3=10, b2=0,5, b1=0,1, b0=1. Az eredmények az alábbiak: Model: var2=b3*(1-exp(-1*((b2*var1)^b1)))+b0 (pelda1) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,929228643 R=,99965 Variance explained: 99,929% N=15 b3 b2 b1 b0 Estimate 24,78003 0,039166 1,922409 0,265284

14 1.3. ábra Az eredmény azt mutatja, hogy a függvény kezdőértékek beállítása a felhasználó számára nem okoz jelentős gondot. Nem ezt tapasztaljuk más típusú növekedési görbék estén. Ezen kívül a már fentiekben történő paraméter értelmezés minden esetben megállja a helyét. Az Awrami féle telítési függvényen kívül még számos hasonló növekedési görbe létezik. Az egyszerűbb nem rendelkezik inflexiós ponttal, az összetettebbek igen. Az alábbiakban a felhasznált példasor alkalmazásával megadásra kerül illesztési eredményük, a paraméterek, a korrelációs együttható értéke, valamint illesztési ábráik, végül, de nem utolsó sorban a futtatásnál módosított kezdőértékek melyek módosítása nélkül nem kapunk eredményt, vagy ha igen csak gyenge korrelációval. A paraméterek kezdőértékeinek kiokoskodása a függvény matematikai jellemzőinek ismeretében történhet, figyelembe véve az adatsort. Minden egyes illesztésnél a 2 mint függő változó a famagasságot jelöli, 1 a független változó, az idő függvényében. 1.2.1.2. Bertalanffy növekedési függvénye Nem adunk példát a kezdőértékek módosítására, mivel alapvetően látható, hogy a függvény nem rendelkezik inflexiós ponttal, ami a példa esetében nem ad kedvező eredményt, bár az R értéke magas.

Bertalanffy növekedési függvény matematikai alakja: = 1 *. Számítógépes alak: 2 = 2 1 1 1 0 1. Kezdőértékek: b2=b1=b0=0,1. Az illesztés eredménye és ábrája: Model: var2=b2*(1-b1*exp(-1*(b0*var1))) (pelda1) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss: 34,694807684 R=,98669 Variance explained: 97,356% N=15 b2 b1 b0 Estimate 31,56415 1,069303 0,028769 1.4. ábra 1.2.1.3. Mitscherlich növekedési függvénye Mitscherlich növekedési függvény matematikai alakja: = 1 *. Számítógépes alak: 2 = 2 1 1 1 1 0. Első esetben hagyjuk meg az Awraminál alkalmazott 0,1 kezdőértéket minden paraméter esetén. Az eredmények nem különböznek az alábbiakban adott kezdőértékeknél kapott eredménytől. Kezdőértékek: b2=b1=b0=1.

16 Az illesztés eredménye és ábrája: Model: var2=b2*(1-exp(-1*b1*var1))^b0 (pelda1) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss: 2,393042626 R=,99909 Variance explained: 99,818% N=15 b2 b1 b0 Estimate 25,85456 0,077052 3,136495 1.5. ábra A következő függvény esetében azonban már látható, hogy jelentős eltérések adódnak az illesztés eredményében a kezdőérték változtatás miatt. 1.2.1.4. Richards növekedési függvénye Richards növekedési függvény matematikai alakja: = 1 * +. Számítógépes alak: 2 = 3 1 2 1 1 1 0. Kezdőértékek: b3=b2=b1=b0=0,1.

Az eredmények: Model: var2=b3*(1-b2*exp(-1*b1*var1))^b0 (pelda1) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss: 1312,3993467 R= -- Variance explained: -- % N=15 b3 b2 b1 b0 Estimate 11,17133 0,999978 0,979367 1,009495 1.6. ábra Az eredmény értékelhetetlen. Ismételve a kísérlet módosított kezdőértékekkel. Kezdőértékek: b3=10, b2= 1, b1=0,5, b0=0,1. Az illesztés eredménye és ábrája: Model: var2=b3*(1-b2*exp(-1*b1*var1))^b0 (pelda1) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,822595191 R=,99969 Variance explained: 99,937% N=15 b3 b2 b1 b0 Estimate 25,37320-0,554243 0,095852-9,73876

18 1.7. ábra Hasonló eredményeket produkálhatunk a helyes kezdőértékek megválasztása nélkül az alább megadott függvények esetén, gondolva, hogy az illesztett függvény nem alkalmazható. A példák is azt mutatják, hogy a helyes kezdőérték megválasztása kulcskérdés, ami viszont matematikailag sem egyszerű, nem beszélve a paraméterek értelmezhetőségéről, ami az utóbb felsorolt illetve az alább bemutatott függvények esetében sem egyértelműen magyarázható. Bár a korrelációs együtthatók a jól megválasztott (nem egyszerű kiválasztás révén) megadott kezdőértékek esetére magas értéket mutatnak, a paraméterek többségében leginkább nehezen vagy egyáltalán nem értelmezhetők. 1.2.1.5. Chapman-Richard függvény Chapman-Richards növekedési függvény Gál János [17] által módosítva. Matematikai alak: = 1 *. Számítógépes alak: 2 = 2 1 1 1 0. Kezdőértékek: b2=10, b1= 1, b0=0,5. Az illesztés eredménye és ábrája:

Model: var2=b2*(1-exp(b1*var1))^b0 (pelda1) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss: 2,393042626 R=,99909 Variance explained: 99,818% N=15 b2 b1 b0 Estimate 25,85457-0,077052 3,136496 1.8. ábra 1.2.1.6. Colin-Fokasz függvény Colin-Fokasz növekedési függvényénak matematikai alakja: = + - 3 "%*. /0 1/2 Számítógépes alak:. 2 = 0 + 1 0/1 + 2 1 3 1 4 1/2. Kezdőértékek: b0=10, b1= 1, b2=0,5, b3=0,1, b4=1. Az illesztés eredménye és ábrája:

20 Model: var2=b0+(b1-b0)/(1+b2*exp(-1*b3*(var1-b4)))^(1/b2) (pelda1) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,717894104 R=,99973 Variance explained: 99,945% N=15 b0 b1 b2 b3 b4 Estimate 25,39397-1,28865 1,733523-0,155553 18,46158 1.9. ábra A fenti példák azt illusztrálják, hogy bár számos telítési, nevezzük inkább növekedési folyamatot részében vagy teljességében (negatív értékekre is értelmezett) leíró függvényt ismerünk (4), ezek alkalmazása a gyakorlatban a számítógépes statisztikai programok használata esetén is gondot okoz. Az alkalmazott modell megválasztás esetén szem előtt tartandók az igények a paraméterek értelmezhetőségére, valamint a kezdőértékek megválasztásának illetve kiválasztásának egyszerűségére, nem beszélve a modell alkalmazhatóságáról (az Awrami féle függvény akkor is alkalmazható, ha nincs inflexiós pont). Ezen kívül a modell értelmezési tartományának vizsgálata sem elhanyagolható, a már említett negatív független változók (példákban az idő) vonatkozásában, hiszen ez nem értelmezhető.

1.2.2. Rönkleltár A második adatsor a faraktárban található válogatással nyert rönkök leltárát elemzi az átmérő függvényében található darabszám szerint. Az adatsor egyszerű áttekintése alapján rögtön megállapítható, hogy megfelelően transzformált Gauss-görbe illesztése a célszerű. - A matematikai alak: = +.. & 1/6 A számítógépi alak: 2 = 3/exp 2 1 1 1 2 + 0. A változók: 1= fatörzsátmérő (cm), 2= darabszám (db). Az adatsort, a regressziós eljáráshoz szükséges kezdőértékeket, a nyert paraméter-értékeket, a korrelációs együtthatót és az értelmezést az alábbi táblázatok tartalmazzák. 1.2. Példa Adatok 1 2 1 26 1 2 28 3 3 30 8 4 32 21 5 34 35 6 36 45 7 38 54 8 40 60 9 42 55 10 44 43 11 46 37 12 48 24 13 50 10 14 52 5 15 54 2 1.2. táblázat Kezdőértékek: b3=b2=b0=1, b1=40 (a programban alapbeállításként szereplő értékek, módosítást igényelnek)

22 A számított illesztési értékek: Model: var2=b3/exp((b2*(var1-1*b1))^2)+b0 (példa2) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss: 47,132016006 R=,99631 Variance explained: 99,264% N=15 b3 b2 b1 b0 Estimate 62,00369 0,119303 40,13033-3,50099 Értelmezés: b3+b0 = a legnagyobb darabszám, b1= a legnagyobb darabszámhoz tartozó törzsátmérő. 1.10. ábra. A rönkleltár illesztés grafikus reprezentációja 1.2.3. Faanyagszárítás A harmadik adatsor a faanyag szárítási folyamata során nyert értékeket tartalmazza az idő függvényében. Az adatsor áttekintése vagy grafikus ábrázolása alapján eldönthető, hogy megfelelően transzformált tangens hiperbolikus görbe illesztése vezet helyes eredményre és értelmezhető paraméterekhez. A matematikai alak: = tanh > +.

A számítógépi alak: 2 = 3 tanh2 1 1 1 + 0. A változók: 1 = az eltelt idő (óra), 2 = a nedvességtartalom (%). Az adatsort, a regressziós eljáráshoz szükséges kezdőértékeket, a nyert paraméter-értékeket, a korrelációs együtthatót és az értelmezést az alábbi táblázatok tartalmazzák. 1.3. Példa Adatok 1 2 1 0 26,9 2 2 26,6 3 4 26,1 4 6 25,4 5 8 24,7 6 10 22,1 7 12 19,4 8 14 15,3 9 16 10,4 10 18 7,3 11 20 5,6 12 22 4,1 13 24 3,8 14 26 3,4 15 28 3,1 16 30 3 1.3. táblázat Kezdőértékek: b3=b2=b0=1, b1=15 (a programban alapbeállításként szereplő értékek, módosítást igényelnek) A számított értékek: Model: var2=b3*tanh(b2*(var1-1*b1))+b0 (példa3) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,718110358 R=,99976 Variance explained: 99,952% N=16 b3 b2 b1 b0 Estimate -11,8755 0,185932 14,02402 14,92063

24 Értelmezés: b0 b3 = a kezdeti nedvességtartalom (%), b0+b3= a végső nedvességtartalom (%). 1.11. ábra. A faanyagszárítás illesztés grafikus reprezentációja 1.2.4. Anyaglehűlés A negyedik adatsor az idő függvényében történő anyag lehűlés értékeit tartalmazza. Az adatsor egyszerű áttekintése vagy esetleges grafikus ábrázolása alapján ebben az esetben megállapítható, hogy a függvényillesztéshez egy megfelelően transzformált exponenciális ( negatív exponenciális ) görbe alkalmazása lehet a legmegfelelőbb. A matematikai alak: = - +..& 1/ A számítógépi alak: 2 = 3/2 1 1 1 + 0. A változók: 1 = idő (min), 2 = hőmérséklet (C o ). Az adatsort, a regressziós eljáráshoz szükséges kezdőértékeket, a nyert paraméter értékeket, a korrelációs együtthatót és az értelmezést az alábbi táblázatok tartalmazzák:

1.4. Példa Adatok 1 2 1 0 50 2 2 38,1 3 4 29,1 4 6 23,4 5 8 18,1 6 10 14,4 7 12 12,6 8 14 10,1 9 15 9,7 10 16 8,9 11 18 8,2 12 20 7,2 13 25 6 14 27 5,6 15 30 5,5 1.4. táblázat Kezdőértékek: b3=b2=b1=b0=1 (ebben az esetben is szükséges az alapértékek módosítása). A számított paraméterek és a korrelációs együttható: Model: var2=b3/exp(b2*(var1-1*b1))+b0 (Spreadsheet4) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,765464092 R=,99984 Variance explained: 99,969% N=15 b3 b2 b1 b0 Estimate 14,92291 0,153119 7,191448 5,063373 Értelmezés: b0 = a mért legalacsonyabb hőmérséklet (véghőmérséklet), 3?" + 0 = a mért legmagasabb hőmérséklet (kezdőhőmérséklet).

26 1.12. ábra. Az anyaglehűlés illesztés grafikus reprezentációja 1.2.5. Hangerő ingerérték Az ötödik adatsor a hangerő függvényében észlelhető ingerértékek elméleti adatait mutatja. A pontsor grafikus ábrázolása alapján logaritmikus függvény illesztése látszik legmegfelelőbbnek, ha az alkalmazott függvényt előzetesen megfelelően transzformáljuk, lehetővé téve az origóból való kiindulást a kezdő adatpár miatt. A matematikai alak: =! > +. A számítógépi alak: 2 = 3 @A2 1 1 1 + 0. A változók: 1 = hangerő (db), 2 = ingerérték (i). Az adatsort, a regressziós eljáráshoz szükséges kezdőértékeket, a nyert paraméterértékeket, a korrelációs együtthatót és az értelmezéseket az alábbi táblázatok tartalmazzák:

1.5. Példa Adatok 1 2 1 0 0 2 1 0,7 3 2,1 1,24 4 3,2 1,66 5 4,3 2 6 5 2,18 7 7,2 2,66 8 9,1 2,97 9 11,3 3,29 10 15,3 3,75 11 21,2 4,26 12 30,3 4,83 13 45 5,48 14 60 6 15 80,2 6,45 16 100 6,83 1.5. táblázat Kezdőértékek: b3=b2=b0=1, b1= 1 (módosított értékek). A számított paraméterek és a korrelációs együttható: Model: var2=b3*log(b2*(var1-1*b1))+b0 (Spreadsheet8) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,001401137 R=,99999 Variance explained: 99,998% N=16 b3 b2 b1 b0 Estimate 1,738903 1,539166-1,99920-1,95678 Értelmezés: b0 = a mért legalacsonyabb ingerérték, 3!2 100 + 1 0 = a legmagasabb mért ingerérték.

28 1.13. ábra. A hangerő ingerérték illesztés grafikus reprezentációja 1.2.6. Lövedékpálya A hatodik adatsor egy kilőtt lövedék útjának adatait mutatja. A pontsor értékeinek áttekintése és a gyakorlati ismeretek és elemzés alapján könnyen megállapítható, hogy a görbeillesztésre parabola - másodfokú hatvány függvény - a megfelelő a szükséges transzformálással. A matematikai alak: =? + >. A számítógépi alak: 2 = 2 1 1 1 2 + 0. A változók: 1 = a vízszintesen mért távolság (m), 2 = a lövedék magassága. Az adatsort, a regressziós eljáráshoz szükséges kezdőértékeket, a nyert paraméterek értékeit, a korrelációs együtthatót és az értelmezést az alábbi táblázatok tartalmazzák:

1.6. Példa Adatok 1 2 1 0 0 2 6,5 1,01 3 12,9 1,94 4 23 3,25 5 33 4,41 6 43,1 5,41 7 49,5 5,96 8 56 6,45 9 71 7,32 10 91,1 7,94 11 109 7,93 12 120,4 7,68 13 134 7,07 14 149,8 6,01 15 177,1 3,21 1.6. táblázat (a kezdőértékek módosí- Kezdőértékek: b2= 0,001, b1= 80, b0= 0,1 tása szükséges). A számított eredmények: Model: var2=b2*(var1-1*b1)^2+b0 (Spreadsheet12) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,000808408 R= 1,0000 Variance explained: 99,999% N=15 b2 b1 b0 Estimate -0,000802 99,89942 7,999709 Értelmezés: b0= a lövedék legnagyobb magassága, b1= az a távolság ahol a lövedék legmagasabban van, b0 b2*b1 2 = a lövedék kiindulási magassága.

30 1.14. ábra. A lövedékpálya illesztés grafikus reprezentációja 1.2.7. Lázgörbe A hetedik adatsor egy betegséggel együtt járó időbeli lázváltozás adatait mutatja (lázgörbe). Az adatsor elsődleges elemzése alapján transzformált Gauss-görbe alkalmazása látszik célszerűnek. A grafikus ábrázolás azonban mutatja, hogy a görbe aszimmetrikus, hirtelen emelkedő és lassan csökkenő kellene, hogy legyen. Ezért a függvényillesztéshez egy speciálisan kialakított matematikai formulát szükséges alkalmazni. A matematikai alak: = - % * 0. A számítógépi alak: 2 = 3 1/ 2 + 1 1 0. A változók: 1 = az idő (nap), 2 = hőmérséklet 36 C o felett. Az adatsort, a regressziós eljáráshoz szükséges kezdőértékeket, a nyert paraméter értékeket, a korrelációs együtthatót és az értelmezést az alábbi táblázatok tartalmazzák:

1.7. Példa Adatok 1 2 1 0 0,1 2 0,5 1,8 3 1 3,5 4 1,5 4,6 5 2 4 6 2,5 2,6 7 3 1,4 8 3,5 0,8 9 4 0,5 10 4,5 0,3 11 5 0,2 12 5,5 0,1 13 6 0,1 14 7 0 1.7. táblázat Kezdőértékek: b3=b2=b1=b0=1 (módosított kezdőérték). Az illesztésnél kapott paraméterek és a korrelációs együttható: Model: var2=b3*var1/(b2+(b1*var1)^b0) (lázgörbe4p) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,018167923 R=,99973 Variance explained: 99,946% N=14 b3 b2 b1 b0 Estimate 6,263286 1,746860 0,530529 5,226167 Értelmezés: b3/b2= a kezdő meredekség azaz, az egy nap alatti induló hőemelkedés értéke (betegség jellemző adat).

32 1.15. ábra. A lázgörbe illesztés grafikus reprezentációja 1.2.8. Napi levegő hőmérséklet A nyolcadik adatsor egy 24 órás levegőhőmérséklet változás értékeit mutatja, éjféltől-éjfélig. Az értékpárok elemzése és grafikus áttekintése jól mutatja, hogy megfelelően transzformált szinusz függvény alkalmazása a célszerű, ami a gyakorlati ismeretek alapján kézenfekvő. A matematikai alak: = sin > +. A számítógépi alak: 2 = 3 sin2 1 1 1 + 0. A változók: 1 = idő (óra), 2 = a hőmérséklet (C o ). Az adatsort, a regressziós eljáráshoz szükséges kezdőértékeket, a nyert paraméter értékeket, a korrelációs együtthatót és az értelmezéseket az alábbi táblázatok tartalmazzák:

1.8. Példa Adatok 1 2 1 0 6,3 2 2 5 3 4 5 4 6 6,3 5 8 8,6 6 10 11,4 7 12 13,7 8 14 15 9 16 15 10 18 13,7 11 20 11,3 12 22 8,7 13 24 6,3 1.8. táblázat Kezdőértékek: b3=b2=b1=1, b0=5 (módosított kezdőértékek). A kapott számítási eredmények: Model: var2=b3*sin(b2*(var1-1*b1))+b0 (napihőingadozás) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,014721151 R=,99996 Variance explained: 99,992% N=13 b3 b2 b1 b0 Estimate 5,199216-0,261772-3,00344 9,997983 Értelmezés: b0 b3= a legalacsonyabb hőmérséklet (C o ), b0+b3= a legmagasabb hőmérséklet (C o ), b1+6= a legalacsonyabb hőmérséklet időpontja (óra), b1+6+12= a legmagasabb hőmérséklet időpontja (óra). Az illesztés grafikus reprezentációja:

34 1.16. ábra. A napi levegő hőmérséklet illesztés grafikus reprezentációja 1.2.9. Ötvözet vezetőképesség A kilencedik adatsor egy olyan modellkísérlet adatait tartalmazza, ahol két fémből készült ötvözet vezetőképességének vizsgálata történt a százalékos összetétel függvényében. Az adatsor áttanulmányozása és grafikus elemzése alapján látható, hogy két határérték mutatkozik, azonban az ezek által meghatározott tartományon kívüli értékek is köztesen jelen vannak. Ez azt jelenti, hogy egyszerű klasszikus transzformált matematikai függvénnyel az illesztés nem látszik megoldhatónak. Ebből kiindulva, valamint a határértékek jelenléte miatt két különböző tangens hiperbolikusz függvény megfelelően transzformált összege adhatja a jó regressziót. A matematikai alak: = tanh > + tanhd A + E. A számítógépi alak: 2 = 6 tanh5 1 1 4 + 3 tanh2 1 1 1 + 0. A változók: 1 = a százalékos összetétel (%), 2 = vezetőképesség (s/m 10 6 ).

Az adatsort, a regressziós eljáráshoz szükséges kezdőértékeket, a nyert paraméter értékeket, a korrelációs együtthatót és az értelmezéseket az alábbi táblázatok tartalmazzák: 1.9. Példa Adatok 1 2 1 0 2,58 2 0,25 2,58 3 5,5 2,57 4 10,75 2,55 5 16 2,51 6 21,25 2,45 7 26,5 2,32 8 31,75 2,08 9 37 1,75 10 42,25 1,42 11 47,5 1,2 12 52,75 1,11 13 58 1,11 14 63,25 1,19 15 68,5 1,31 16 73,75 1,44 17 79 1,54 18 84,25 1,59 19 89,5 1,61 20 94,75 1,61 21 100 1,6 1.9. táblázat Kezdőértékek: b6=b5=b4=b3=b2=b1=b0=1 (módosított kezdőértékek). A paraméter értékek és a korrelációs együttható: Model: var2=b6*tanh(b5*(var1-1*b4))+b3*tanh(b2*(var1-1*b1)... (vezetőképesség) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,000998882 R=,99992 Variance explained: 99,984% N=21 b6 b5 b4 b3 b2 b1 b0 Estimate 0,334742 0,084865 67,62294-0,814370 0,081759 36,68642 2,097139

36 Értelmezés: Ha b4hb1 akkor IJ%?" =legkisebb vezetőképességhez tartozó %-os összetétel értéke. I%? 1=0 helyettesítéssel kiszámítható a 0%-hoz tartozó vezetőképesség értéke. 1=100 helyettesítéssel kiszámítható a 100%-hoz tartozó vezetőképesség értéke. Az illesztés grafikus reprezentációja: 1.17. ábra. Az ötvözet vezetőképesség illesztés grafikus reprezentációja 1.2.10. Huzalfeszítés A tízedik adatsor a huzal megnyújtás függvényében jelentkező feszítőerő adatpár sorát tartalmazza, azaz a huzalszakadás folyamatát jellemzi a mért értékekkel. Az adatsor elemzése és grafikus áttanulmányozása alapján látható, hogy a kezdő és végső határérték egyforma (0), de a változás hírtelen mértékben aszimmetrikus. Ez azt jelenti, hogy klasszikus egyszerű transzformált matematikai függvénnyel az illesztés nem tűnik megoldhatónak. Így várható, hogy bonyolultabb függvény kombináció használandó, jelen esetben is a két megfelelően transzformált tangens hiperbolikusz függvény összege adhat

megbízható regressziót, azaz 1-hez közeli korrelációs együtthatót, jól értelmezhető és értékelhető paramétereket. A matematikai alak: = tanh > + tanhd A + E. A számítógépi alak: 2 = 6 tanh5 1 1 4 + 3 tanh2 1 1 1 + 0. A változók: 1 = a megnyújtás (mm), 2 = a feszítő erő (N 10 4 ). Az adatsort, a regressziós eljáráshoz szükséges kezdőértékeket, a nyert paraméter értékeket, a korrelációs együtthatót és az értelmezéseket az alábbi táblázatok tartalmazzák: 1.10. Példa Adatok 1 2 1 0 0 2 0,31 0 3 1,62 0,03 4 2,92 0,13 5 4,2 0,58 6 5,54 1,97 7 6,85 3,96 8 8,15 5,02 9 9,46 5,32 10 10,77 5,3 11 12,08 0 12 13,38 0 1.10. táblázat Kezdőértékek: b6=b5=b3=b2=b0=1, b4=5, b1=10 (módosított értékek). Az illesztés számítási eredményei: Model: var2=b6*tanh(b5*(var1-1*b4))+b3*tanh(b2*(var1-1*b1)... (feszítőerő) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,000261920 R= 1,0000 Variance explained: 100,00% N=12 b6 b5 b4 b3 b2 b1 b0 Estimate 2,707871 0,591957 6,005157-2,70603 4,378056 11,23117-0,000973

38 Értelmezés: Ha b4hb1 akkor z= IJ%?" =a legnagyobb feszítő erőhöz I%? tartozó megnyújtás (mm) értéke. 2 K = 6 tanh5 K 1 4 + 3 tanh2 K 1 1 + 0 = a legnagyobb feszítő erő (a szakadást létrehozó erő). 1.18. ábra. A huzalfeszítés illesztés grafikus reprezentációja 1.2.11. Radioaktív sugárintenzitás A tizenegyedik adatsor radioaktív anyag idő függvényében észlelhető sugárintenzitásának értékeit tartalmazza. Az adott értékpár sorozat áttekintése alapján könnyen megállapítható, hogy egy negatív exponenciális függvény illesztése lehet a megfelelő. Mivel az ilyen jellegű vizsgálatoknál a felezési idő meghatározása is elemi követelmény, ezért a matematikai alak megfelelő transzformálása szükséges. A matematikai alak: = - (vagy: = - ). 1? 1 A számítógépi alak: 2 = 2/1 1/0 (vagy 2 = 2/ 2 1/0 ). A változók: 1 = az idő (hónap), 2 = a sugárintenzitás (10 6 Bq).

Az adatsort, a regressziós eljáráshoz szükséges kezdőértékeket, a nyert paraméter értékeket, a korrelációs együtthatót és az értelmezéseket az alábbi táblázatok tartalmazzák: 1.11. Példa Adatok 1 2 1 0 8 2 1 6,3 3 2 4,92 4 3 3,88 5 4 3,09 6 5 2,42 7 6 1,89 8 7 1,5 9 8 1,18 10 9 0,92 11 10 0,73 1.11. táblázat Kezdőértékek: b2=1, b1=b0=2, (módosított értékek). Az illesztés számított paraméterei és a korrelációs együttható: Model: var2=b2/b1^(var1/b0) (felezésiidő) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,002096773 R=,99998 Variance explained: 99,996% N=11 b2 b1 b0 Estimate 7,993744 2,018864 2,931419 Értelmezések: A megoldás akkor érvényes, ha 1,98<b1<2,02. Ekkor a felezési idő: b0, a kezdeti intenzitás b2.

40 1.19. ábra. A radioaktív sugárintenzitás illesztés grafikus reprezentációja 1.2.12. Toboztömeg változás A tizenkettedik adatsor modellkísérletként a fenyőtoboz időbeli tömegváltozásának adatait mutatja. Az adatsor áttekintése az értékváltozásokkal kapcsolatban nem látszik elegendőnek a megfelelő függvény megkereséséhez. Mindenképpen célszerű az adatpárokból nyert pontok grafikus ábrázolása. Látható, hogy a folyamatot ábrázoló és illesztendő függvény egy kezdeti értékből indul, két inflexiós pontot is tartalmaz, maximumot is elér, majd egy határérték felé tart. A használható függvény az eddigiekben nem alkalmazott és nem ismert matematikai formulájú, és az előbbiekben felsorolt feltételeknek eleget tesz. A matematikai alak: = sin 1 *0 + D. A számítógépi alak: 2 = 4 sin 3 1 1 2 1 1 + 0. A változók: 1 = az idő (hónap), 2 = a fenyőtoboz tömege (g).

Az adatsort, a regressziós eljáráshoz szükséges kezdőértékeket, a nyert paraméter értékeket, a korrelációs együtthatót és az értelmezéseket az alábbi táblázatok tartalmazzák: 1.12. Példa Adatok 1 2 1 1 0,25 2 2 1,32 3 3 3,14 4 4 5,77 5 5 9,49 6 6 13,27 7 7 17,06 8 8 20,77 9 9 23,23 10 10 24,74 11 11 24,96 12 12 24,31 13 13 22,86 14 14 21,25 15 15 19,58 16 16 17,87 17 17 16,57 18 18 15,41 19 19 14,63 20 20 14,05 21 21 13,6 22 22 13,34 23 23 13,16 24 24 13,04 25 25 12,93 1.12. táblázat Kezdőértékek: b4=b3=b2=b1=b0=2. A paraméter értékek és a korrelációs együttható: Model: var2=b4*sin(b3*(1-exp(-1*(b2*var1)^b1)))+b0 (fenyőtoboztömegváltozás) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,084630943 R=,99996 Variance explained: 99,993% N=25 b4 b3 b2 b1 b0 Estimate 24,97139 2,601332 0,089950 2,301996 0,032162 Értelmezések: b4+b0 = a legnagyobb tömeg (g) akkor, ha b3>π/2, 1/b2 = a legnagyobb tömeghez tartozó időpont (hónap) közelítő értéke, 0 + 4 sin 3 = a végső tömeg (g), b1= a változás sebességét befolyásoló tényező. Általánosságban: b4+b0 = az elért legnagyobb 2 érték (lokális maximum) akkor, ha b3>π/2,

42 0 + 4 sin 3 = a végső 2 érték (határérték),! = "!!?L!2, ahol x az a 1 érték, amelyhez a legnagyobb (b4+b0) 2 érték "?LM tartozik. PQ PQ$,$$" A következő! O =!2 formula x v értéke a végső 2 " értéktől (a határértéktől) 1 %-nál kisebb értékkel való eltérés tartományának kezdete. Az illesztés grafikus reprezentációja: 1.20. ábra. A toboztömeg változás illesztés grafikus reprezentációja 1.2.13. I. és IV. fatermési osztály vizsgálata akác esetén Az alábbiakban néhány olyan példa kerül bemutatásra, melyek esetében az adatsor nem modellezett. Az Erdészettudományi Közlemények 2011.1. évfolyam 1. számából [9] származnak. Rédei K., Csiha I. et al.: Nyírségi akácosok táji fatermési táblája című cikkből. A fatermési táblából az I. és IV-es fatermési osztály adatait vizsgáljuk. Minkét fatermési osztály esetében a változók az alábbiakat jelölik: 1 = az idő (év), 2 = átlagos magasság (m),

3 =átlagos mellmagassági átmérő (cm), 4 = fatérfogat (m 3 ), 5= átlagnövedék (m 3 /év), 6 = folyónövedék (m 3 /év). A 2, 3 és 4 értékek az egész állományra vonatkoztatottak, 5 és a 6 pedig az összes fatermésre. Az alábbi táblázatok tartalmazzák a felhasznált adatsorokat. I. fatermési osztály 1 2 3 4 5 6 1 5,000 7,200 5,200 41,000 8,300 0,000 2 10,000 13,100 10,200 121,000 12,900 17,500 3 15,000 17,600 15,300 169,000 14,300 17,000 4 20,000 20,800 19,400 217,000 14,500 15,400 5 25,000 23,100 22,800 259,000 14,200 13,000 6 30,000 24,700 25,600 294,000 13,600 10,600 7 35,000 25,800 28,000 323,000 12,900 8,700 8 40,000 26,600 30,100 350,000 12,300 7,600 9 45,000 27,300 32,100 378,000 11,700 7,500 1.13. táblázat IV. fatermési osztály 1 2 3 4 5 6 1 5,000 4,900 3,400 22,000 4,300 0,000 2 10,000 8,900 6,700 62,000 6,400 8,500 3 15,000 11,900 10,300 89,000 7,100 8,400 4 20,000 14,200 13,200 114,000 7,200 7,600 5 25,000 15,700 15,600 136,000 7,100 6,500 6 30,000 16,800 17,500 154,000 6,800 5,300 7 35,000 17,600 19,100 169,000 6,400 4,300 8 40,000 18,100 20,600 183,000 6,100 3,800 9 45,000 18,600 22,000 198,000 5,800 3,800 1.14. táblázat Az alkalmazott regressziós függvény 2, v 3 és 4 mint függő változó 1 (idő) mint független változó esetén az alábbi:

44 A matematikai alak: = 1 + (Awrami-görbe). A számítógépes alak: R = 3 1 1 2 1 1 + 0. A 5 és 6 mint függő változó 1 (idő) függvényében az alkalmazott modell a következő: A matematikai alak: = sin 1 *0 + D. A számítógépi alak: R = 4 sin 3 1 1 2 1 1 + 0. A kezdőértékek mind a két fatermési osztály esetében 2 = D 1), 3 = D 1) illetve 4 = D 1) illesztéseinél b3=b2=b1=b0=1. A 5 = D(1) illetve 6 = D(1) regressziójánál az I. fatermési osztálynál b4=b0=4, míg b3=b2=b1=1, a IV. fatermési osztály adatsorának használatakor b4=b3=b2=b1=1, b0=2. Az alábbi táblázatok az illesztés során kapott paraméter értékeket és a korrelációs együtthatókat tartalmazzák, az ábrák grafikusan reprezentálják az eredményeket.

1.2.13.1.. Az I. fatermési osztály eredményei Model: var2=b3*(1-exp(-1*((b2*var1)^b1)))+b0 (akác1) Dep. var: VAR2 Loss: (OBS-PRED)**2 Final loss:,017115114 R=,99998 Variance explained: 99,995% N=9 b3 b2 b1 b0 Estimate 28,75369 0,064726 1,066644-0,271147 1.21. ábra. Az átlagos magasság az idő függvényében

46 Model: var3=b3*(1-exp(-1*((b2*var1)^b1)))+b0 (akác1) Dep. var: VAR3 Loss: (OBS-PRED)**2 Final loss:,179175448 R=,99987 Variance explained: 99,974% N=9 b3 b2 b1 b0 Estimate 40,70542 0,034279 1,080118-0,519347 1.22. ábra. Az átlagos mellmagassági átmérő az idő függvényében

Model: var4=b3*(1-exp(-1*((b2*var1)^b1)))+b0 (akác1) Dep. var: VAR4 Loss: (OBS-PRED)**2 Final loss: 43,033109170 R=,99979 Variance explained: 99,957% N=9 b3 b2 b1 b0 Estimate 1106,402 0,009367 0,607590-117,179 1.23. ábra. A fatérfogat az idő függvényében

48 Model: var5=b4*sin(b3*(1-exp(-1*(b2*var1)^b1)))+b0 (akác1) Dep. var: VAR5 Loss: ( OBS-PRED)**2 Final loss:,004766127 R=,99992 Variance explained: 99,984% N=9 b4 b3 b2 b1 b0 Estimate 25,39779 2,405090 0,058460 0,668569-10,8660 1.24. ábra. Az átlagnövedék az idő függvényében

Model: var6=b4*sin(b3*(1-exp(-1*(b2*var1)^b1)))+b0 (akác1) Dep. var: VAR6 Loss: (OBS-PRED)**2 Final loss:,989349265 R=,99803 Variance explained: 99,607% N=9 b4 b3 b2 b1 b0 Estimate 359,1401 1,854744 0,245237 0,573772-341,041 1.25. ábra. A folyónövedék az idő függvényében

50 1.2.13.2. A IV. fatermési osztály eredményei Model: var2=b3*(1-exp(-1*((b2*var1)^b1)))+b0 (akác4) Dep. var: VAR2 Loss: (OBS-PRED)**2 Final loss:,014024950 R=,99996 Variance explained: 99,992% N=9 b3 b2 b1 b0 Estimate 19,37206 0,063955 1,083445 0,004885 1.26. ábra. Az átlagos magasság az idő függvényében.

Model: var3=b3*(1-exp(-1*((b2*var1)^b1)))+b0 (akác4) Dep. var: VAR3 Loss: (OBS-PRED)**2 Final loss:,159954759 R=,99976 Variance explained: 99,951% N=9 b3 b2 b1 b0 Estimate 26,98114 0,035530 1,136324-0,220820 1.27. ábra. Az átlagos mellmagassági átmérő az idő függvényében

52 Model: var4=b3*(1-exp(-1*((b2*var1)^b1)))+b0 (akác4) Dep. var: VAR4 Loss: (OBS-PRED)**2 Final loss: 6,158399609 R=,99989 Variance explained: 99,978% N=9 b3 b2 b1 b0 Estimate 501,3869 0,012803 0,651582-54,7448 1.28. ábra. A fatérfogat az idő függvényében

Model: var5=b4*sin(b3*(1-exp(-1*(b2*var1)^b1)))+b0 (akác4) Dep. var: VAR5 Loss: (OBS-PRED)**2 Final loss:,005122316 R=,99961 Variance explained: 99,923% N=9 b4 b3 b2 b1 b0 Estimate 9,945573 2,534462 0,050328 0,721575-2,71371 1.29. ábra. Az átlagnövedék az idő függvényében

54 Model: var6=b4*sin(b3*(1-exp(-1*(b2*var1)^b1)))+b0 (akác4) Dep. var: VAR6 Loss: (OBS-PRED)**2 Final loss:,274827459 R=,99771 Variance explained: 99,543% N=9 b4 b3 b2 b1 b0 Estimate 121,3812 1,906048 0,191752 0,633423-112,506 1.30. ábra. A folyónövedék az idő függvényében A fenti eredmények jól igazolják, hogy az alkalmazott regressziós modellek a szakirodalomból származó adatsorokra jól illeszthetők (r >0,9977). A kezdőértékek meghatározása lényegesen egyszerűbb mint a korábban felsorolt növekedési függvények esetén, a paraméterek a már említettek szerint értelmezhetők.

1.2.14. Hat fatermési osztály összefoglaló vizsgálata akác esetén Az alábbi példában a hat fatermési osztály teljes állományra vonatkozó átlagos famagasság adatait elemezzük az idő függvényében. A telítési függvény kerül felhasználásra, 1= az idő (év), R, k=2,3,4,5,6,7 a hat fatermési osztály átlagos famagassági adatsorai (m). Összesített táblázat a hat fatermési osztály átlagos famagasságára: Átlagos famagasság az idő függvényében 1 2 3 4 5 6 7 1 5 7,2 6,5 5,7 4,9 4,1 3,3 2 10 13,1 11,7 10,3 8,9 7,5 6,1 3 15 17,6 15,7 13,8 11,9 10,1 8,2 4 20 20,8 18,6 16,4 14,2 12 9,7 5 25 23,1 20,7 18,2 15,7 13,3 10,8 6 30 24,7 22,1 19,4 16,8 14,2 11,6 7 35 25,8 23 20,3 17,6 14,8 12,1 8 40 26,6 23,7 20,9 18,1 15,3 12,5 9 45 27,3 24,4 21,5 18,6 15,7 12,8 1.15. táblázat A kezdőértékek b3=b2=b1=b0=1. Az illesztés eredményei: Model: var2=b3*(1-exp(-1*((b2*var1)^b1)))+b0 (akac1-6magassag) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,017115114 R=,99998 Variance explained: 99,995% N=9 b3 b2 b1 b0 Estimate 28,75366 0,064726 1,066646-0,271132 Model: var3=b3*(1-exp(-1*((b2*var1)^b1)))+b0 (akac1-6magassag) Dep. var: Var3 Loss: (OBS-PRED)**2 Final loss:,040582999 R=,99993 Variance explained: 99,986% N=9 b3 b2 b1 b0 Estimate 25,03914 0,064240 1,100209 0,244968

56 Model: var4=b3*(1-exp(-1*((b2*var1)^b1)))+b0 (akac1-6magassag) Dep. var: Var4 Loss: (OBS-PRED)**2 Final loss:,023664841 R=,99995 Variance explained: 99,990% N=9 b3 b2 b1 b0 Estimate 22,34267 0,064221 1,082361 0,021598 Model: var5=b3*(1-exp(-1*((b2*var1)^b1)))+b0 (akac1-6magassag) Dep. var: Var5 Loss: (OBS-PRED)**2 Final loss:,014024950 R=,99996 Variance explained: 99,992% N=9 b3 b2 b1 b0 Estimate 19,37206 0,063955 1,083445 0,004885 Model: var6=b3*(1-exp(-1*((b2*var1)^b1)))+b0 (akac1-6magassag) Dep. var: Var6 Loss: (OBS-PRED)**2 Final loss:,013042198 R=,99995 Variance explained: 99,990% N=9 b3 b2 b1 b0 Estimate 16,49070 0,065040 1,077159-0,164301 Model: var7=b3*(1-exp(-1*((b2*var1)^b1)))+b0 (akac1-6magassag) Dep. var: Var7 Loss: (OBS-PRED)**2 Final loss:,001835970 R=,99999 Variance explained: 99,998% N=9 b3 b2 b1 b0 Estimate 13,61890 0,064198 1,063971-0,216105 Az adatokból jól látható, b3+b0-ból pedig számítható a magasság határértéke, melyet jelentősen nem lép már túl az átlagmagasság. Az értékek csökkenése jól jellemzi az egyes fatermési osztályokat. Az alábbi összesített ábra is ezt támasztja alá. Az átlagos famagassághoz hasonlóan az összes fatermés átlagnövedéke is vizsgálható, az illesztésnél itt a már korábban bemutatott összetett függvény alkalmazása célszerű, nevezetesen az = sin 1 *0 + D függvényé.

1.31. ábra A hat fatermési osztály adatait az alábbi táblázat tartalmazza, 1= az idő (év) R, k=2,3,4,5,6,7 a hat osztály átlagnövedéki adatsora: Összes fatermés átlagnövedéke 1 2 3 4 5 6 7 1 5 8,3 6,8 5,5 4,3 3,3 2,4 2 10 12,9 10,5 8,3 6,4 4,7 3,3 3 15 14,3 11,6 9,2 7,1 5,2 3,6 4 20 14,5 11,8 9,4 7,2 5,3 3,7 5 25 14,2 11,6 9,2 7,1 5,2 3,6 6 30 13,6 11,1 8,8 6,8 5 3,5 7 35 12,9 10,5 8,4 6,4 4,7 3,3 8 40 12,3 10 7,9 6,1 4,4 3,1 9 45 11,7 9,5 7,6 5,8 4,3 3 1.16. táblázat

58 A kezdőértékeket az alábbi táblázat mutatja: Fatermési osztály b4 b3 b2 b1 b0 I. 4 1 1 1 4 II. 3 1 1 1 3 III. 4 1 1 1 4 IV. 4 1 1 1 4 V. 1 1 1 1 4 VI. 1 1 1 1 3,5 1.17. táblázat Az illesztés eredményei, a paraméterek és korrelációs együtthatók: Model: var2=b4*sin(b3*(1-exp(-1*(b2*var1)^b1)))+b0 (átlagnövedék1-6) Dep. var: Var2 Loss: (OBS-PRED)**2 Final loss:,004766129 R=,99992 Variance explained: 99,984% N=9 b4 b3 b2 b1 b0 Estimate 25,39714 2,405062 0,058462 0,668588-10,8654 Model: var3=b4*sin(b3*(1-exp(-1*(b2*var1)^b1)))+b0 (átlagnövedék1-6) Dep. var: Var3 Loss: (OBS-PRED)**2 Final loss:,009135621 R=,99976 Variance explained: 99,953% N=9 b4 b3 b2 b1 b0 Estimate 22,13627 2,471521 0,053887 0,621435-10,3145 Model: var4=b4*sin(b3*(1-exp(-1*(b2*var1)^b1)))+b0 (átlagnövedék1-6) Dep. var: Var4 Loss: (OBS-PRED)**2 Final loss:,007986960 R=,99965 Variance explained: 99,931% N=9 b4 b3 b2 b1 b0 Estimate 12,77281 2,474232 0,053316 0,748105-3,37498

Model: var5=b4*sin(b3*(1-exp(-1*(b2*var1)^b1)))+b0 (átlagnövedék1-6) Dep. var: Var5 Loss: (OBS-PRED)**2 Final loss:,005122316 R=,99961 Variance explained: 99,923% N=9 b4 b3 b2 b1 b0 Estimate 9,945070 2,534462 0,050328 0,721599-2,71321 Model: var6=b4*sin(b3*(1-exp(-1*(b2*var1)^b1)))+b0 (átlagnövedék1-6) Dep. var: Var6 Loss: (OBS-PRED)**2 Final loss:,010341200 R=,99836 Variance explained: 99,672% N=9 b4 b3 b2 b1 b0 Estimate 4,950765 2,555106 0,050117 0,905325 0,366913 Model: var7=b4*sin(b3*(1-exp(-1*(b2*var1)^b1)))+b0 (átlagnövedék1-6) Dep. var: Var7 Loss: (OBS-PRED)**2 Final loss:,003941657 R=,99850 Variance explained: 99,700% N=9 b4 b3 b2 b1 b0 Estimate 3,597826 2,673953 0,044811 0,799428 0,090074 A korrelációs együtthatók itt is meghaladják a 0,998 értékét, ami szoros illeszkedésre utal. A b4+b0 paraméterekből megkapjuk a maximális R, átlagnövedék értéket. Számítható továbbá az a határ 1-re, az időre, ami a végső R értéktől (a határértéktől) 1 %-nál kisebb értékkel való eltérés tartományának kezdete. Az alábbi összesített ábra az átlagos famagasság esetén is jól mutatja (föntről lefelé, egytől hatig) az egyes fatermési osztályok közötti eltérést az átlagnövedékre. A bemutatott példák alapján látható, hogy a két alkalmazott modell felhasználásával az összehasonlítás lehetősége adott, mind számszerűsített formában, mind pedig vizuálisan.

60 1.32. ábra

1.3. Összefoglaló az alkalmazott modellekből Az alábbi ábrák az egyes függvények lehetséges görbealakjait mutatják. 1.33. ábra. = 1 + (Awrami-görbe) - 1.34. ábra. = + (Gauss-görbe). & 1/6

62 1.35. ábra. = tanh > + 1.36. ábra. = -. & 1/ + és =! > + függvények

1.37. ábra. =? + > 1.38. ábra. = - % *0 (d pozitív nem egész érték)

64 1.39. ábra. = sin > + és = - 1 függvények 1.40. ábra. = tanh > + tanhd A + E

1.41. ábra. = sin 1 *0 + D A fenti összefoglalóban nyilván nincs lehetőség arra, hogy a paraméterek összes lehetséges változtatása révén keletkező ábra bemutatásra kerüljön, inkább néhány jellegzetes eset került kiválasztásra. 1.4. Összefüggéseket leíró függvények keresése adathalmazok vonatkozásában 1.4.1. Elvi alapok Tekintettel arra, hogy a számítástechnika és az alkalmazott különféle új programok ma már rendkívül sok lehetőséget adnak regressziós eljárások végrehajtására és elemzésére célszerű ezen lehetőségek kihasználása, mert módot biztosítanak a gyors ismétlésre és esetleges módosításra, különösebb időigény nélkül. Vizuálisan felhőszerű adathalmazok esetében éppen ezen okok miatt van lehetőség arra, hogy többféle függvény regressziós alkalmazását hajtsuk