Matematka statsztka elıadás III. éves elemzı szakosokak Zemplé Adrás 9. elıadásból részlet
Y közelítése függvéyével Gyakor eset, hogy em smerjük a számukra érdekes meység Y potos értékét pl. holap részvéy-árfolyam, vízállás, dıjárás. Va vszot formácók hozzá kapcsolódó meységrıl, ma értékek. Feladat: olya f 0 megtalálása, amelyre f 0 a lehetı legjobb 0 0 közelítése Y-ak. Matematkalag: f 0 a megoldása a m Y f szélsıérték-problémáak legksebb égyzetes becslés. Ha az együttes eloszlás smert em teljese reáls, de a megfgyelések alapjá közelíthetı, akkor megoldható a feladat. gyébkét közelítés: például Nadarajah módszerével hasoló a Parze-Roseblatt becsléshez. f
A várható érték optmumtulajdosága Állítás. A m a Y a feladat megoldása ay. Bzoyítás. Y-a Y -ay+a a szert derválva adódk, hogy valóba Y a mmumhely. A mmum értéke D Y. Ugyaígy: tetszıleges értéke eseté Y adja a mmumot, azaz általáosa Y a megoldás.
Közelítés Nadarajah módszerével h Yk r ˆ h k A Parze-Roseblatt tétel feltétele eseté ez kozsztes becslése az Y regresszóak.
Példa F Ay érmével dobtuk újra, amey fejet kaptuk érmével dobva. Csak azt tudjuk, hogy háy fejet kaptuk a másodk dobásál. Közelítsük eek segítségével az elsı dobás eredméyét. Például F0 esetre: P 0 0 0 P F, F 0 0 0 Az eredméyek: F, F4/3, F0/3. P F P F 0 0 P P
Optmum a leárs függvéyek körébe m a, b Y [ a + b] gyszerőbbe megoldható Nem kell az együttes eloszlás A megoldás derválással: Y [ a + b] Y + b + a + a Y b Y ab +
0 ] [ + + Y b a b a Y a 0 ] [ + + Y a b b a Y b a Y b b Y a a Y b b Y a a Y Y a Y Y a Y Y Y b
Az a+b egyees tulajdosága z a legksebb égyzetes eltérést adó a leárs függvéyek között a fet megoldás valóba mmum levezés: regresszós egyees Átmegy az,y poto Példa: Kockával dobuk, majd ha k az eredméy, az,,k cédulák közül húzuk egyet. Nem tudjuk a húzás eredméyét, csak a kockadobásét. Hogya tppeljük a húzott számra a legksebb égyzetes eltérést adó becslést keressük? h Kkk+/ az uverzálsa legjobb közelítés, tehát a legjobb leárs közelítés s.
eltér 54.93 - - 0 eltér 8.5 - - 0 z -3 - - 0 3 z - - 0 3 eltér.58-3 - - 0 eltér 0.47 - - 0 z - - 0 3 z - - 0
Leárs modell Y a +b+ε a magyarázó változó értéke, ε függetle, azoos eloszlású hba. ε 0, Dε σ, általába feltesszük, hogy ormáls eloszlású. a,b a becsüledı együtthatók ΣY -a +b m Megoldás: a y y, bˆ y ˆ a ˆ
Leárs modell Y a +b+ε a magyarázó változó értéke, ε függetle, azoos eloszlású hba. ε 0, Dε σ, általába feltesszük, hogy ormáls eloszlású. a,b a becsüledı együtthatók ΣY -a +b m Megoldás: a y y, bˆ y ˆ a ˆ
A becslések szórása σ D aˆ σ, Db ˆ + Az * potba elırejelzett érték aˆ * + bˆ és eek szórása σ + * A szórásbecslésél σ helyett aak becsült értékét haszáljuk: ˆ σ y a ˆ bˆ
Hpotézsvzsgálat/ H 0 :a0 tesztelése t-próbával: a t ˆ bbıl kofdeca tervallum s kapható a-ra b a y t ˆ
Hpotézsvzsgálat/ H 0 :b0 tesztelése t-próbával: b t ˆ bbıl kofdeca tervallum s kapható b-re b a y t ˆ
Szóródások Teljes gadozás: Rezduáls égyzetösszeg: y y y y y y b a y ˆ ˆ A megmagyarázott varabltás részaráya: y y b a y ˆ ˆ y y y y R éppe a tapasztalat korrelácós együttható égyzete
R0.56 R0.73 cpõméret 38 40 4 44 46 cpõméret 38 40 4 44 46 65 70 75 80 85 90 magasság R0.83 65 70 75 80 85 90 magasság R0.9 A regresszó vzsgálata cpõméret 38 40 4 44 46 cpõméret 38 40 4 44 46 65 70 75 80 85 90 magasság 65 70 75 80 85 90 magasság
R0.03 65 70 75 80 85 90 magasság R0.33 40 50 60 70 80 90 magasság cpõméret 3 34 36 38 40 4 44 46 cpõméret 35 40 45 50 55 60 R0.80 00 0 40 60 80 magasság R0.87 00 0 40 60 80 00 0 40 magasság cpõméret 30 40 50 60 70 80 90 cpõméret 0 40 60 80
z -0-5 0 5 0 korr 0.67-0 -5 0 5 0 z -0-8 -6-4 - 0 korr 0.4-0 -8-6 -4-0 A tapasztalat korrelácó vzsgálata z - - 0 3 korr -0.8 z 0 5 0 korr 0.94 Ige érzékey a kugró értékekre - 0 0 5 0
Általáosított leárs modell Több magyarázó változót s bevohatuk a modellbe: Y β +ε ahol Y,ε hosszú vektorok, k-as mátr smert értékekbıl, β pedg k hosszú smeretle paramétervektor. Y β. A legksebb égyzetek módszere A megoldás: ε β ' ' Yβ ' Yβ ' ˆ ' ' Y '
A becslés tulajdosága Torzítatla Kovaracamátr: ' ' ˆ ˆ σ β β β β Ha ε ormáls eloszlású, akkor a legksebb égyzetes becslés egyúttal ML becslés s. Példák: leárs regresszó, szórásaalízs. ' ˆ ˆ σ β β β β
Hpotézsvzsgálat a leárs modellbe A vzsgált hpotézs: H 0 : βh ' 0 ahol H rk-as mátr r<k, raghr. A valószíőségháyados próba statsztka: F Y ˆ ' β ' Y ˆ β ' Y ˆ β ' Y ˆ ˆ ' Yβ ' Yβ ' ˆ β ' -k/r F a H 0 eseté F eloszlású r,-k szabadság fokkal. Akkor utasítjuk el H 0 t, ha F agy. '
Vegyes kapcsolat Nomálskálá és aráyskálá értelmezett smérv kapcsolata. Példák: Mukahely vs. fzetés Tursták emzetség vs. ap költésük Nem vs. magasság stb. Ábrázolás: potok osztályokét
Példa Moatsgehalt der Frma SY -tegely: aráyskálá mért smérv y-tegely: omáls skálá mért változó Az adatok eft-ba Ksegítı: 70,80,00,0,30,40 Adm. 0,50,60, 00,50,30,360,380 Vezetı: 80,300,450,50,600,750 Arbetstyp Hlfskraft Leter Adm. 00 00 300 400 500 600 700 TFt 006.Ja.
Vegyes kapcsolat szorosságáak mérıszáma: H Részátlag az -edk osztályra: : megfgyelések száma az -edk osztályba,...,k Vezetı: 466,67 TFt +,+ Adm.: 4,5 TFt Ksegítı: 06,67 TFt Fıátlag: 69 TFt. Négyzetösszegek az osztályokba: Vezetı: 33 Adm.: 70950 Sw, +, Ksegítı: 3933 Négyzetösszeg az osztályok között: S b 39863 H S b /S b + S w 0,58 S H0,763 b +,...+,, +... +, +... + k k
Szóráselemzés gy vagy több faktor külöbözı sztje mérük eredméyeket pl. termésátlagokat A kérdés: mely faktorok hatak z s leárs modell: Y β +ε, ahol 0- mátr.
gyszeres osztályozás gy faktor külöbözı sztje mérük. Y j a j +ε j a j a faktor j-edk sztjéek a hatása, j,...,k,,...,. ε j függetle, azoos, N0,σ eloszlású, N +...+ k. z s Y β +ε alakú. A ullhpotézs: a sztek cseek hatással, azaz a a... a k z s H 0 : βh ' 0 alakú, tehát F-próba végezhetı.
Az F-próba A H 0 mellett a csk csoportok között és csb csoporto belül szóráségyzetek háyadosa em túl agy és az eloszlása smert: MS csk MS csb -kss csk k-ss csb eloszlása F df dfcsk,df csb
Az F-eloszlás.500 A 0 és 5 szabadság fokokhoz tartozó F eloszlás sûrûségfüggvéye.5 0.750 0.375 0.000 0 3 4
Példa. csoport. csoport ---------- ----------. megfgyelés 6. megfgyelés 3 7 3. megfgyelés 5 ---------------------------------------------- Átlag 6 Négyzetösszeg ---------------------------------------------- Teljes átlag 4 Teljes égyzetösszeg 8
A szóráselemzés táblázata +----------+--------------------------------+ Forrás Szórások elemzése +------+----+------+------+------+ SS df MS F p +----------+------+----+------+------+------+ Hatáscsk 4.0 4.0 4.0.008 Hba csb 4.0 4.0 +----------+------+----+------+------+------+
Mult-Faktor ANOVA gy tpkus kísérletbe em csak egyetle haem több faktort s fgyelembe kell ve. ze faktorok hatását kell elleırzés alatt tarta. Példa: két faktor esete. Y jm a j +ε jm a j az elsı faktor -edk és a másodk faktor j-edk sztjéek a hatása,,...,k, j,...,l, m,...,. ε jm függetle, azoos, N0,σ eloszlású. z s Y β +ε alakú.
Hpotézsek Va-e kölcsöhatás? kkor H 0 : cs kölcsöhatás, azaz a j a,...,k, j,...,l. a. j+ a.. Ha elfogadható, hogy cs kölcsöhatás, akkor vzsgálható, hogy az egyes faktorok hatak-e. Például az elsı faktorra:,...,k a. a.. zek s F-próbával vzsgálhatóak. 0 0
rıs kölcsöhatás hatás alacsoy szt közép szt magas szt.faktor
Gyege kölcsöhatás hatás alacsoy szt közép szt magas szt.faktor
Ncs kölcsöhatás hatás alacsoy szt közép szt magas szt.faktor