Least Squares becslés

Hasonló dokumentumok
Lineáris regressziós modellek 1

A maximum likelihood becslésről

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Likelihood, deviancia, Akaike-féle információs kritérium

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Mesterséges Intelligencia I.

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2010/2011 1/363

Funkcionális konnektivitás vizsgálata fmri adatok alapján

Inferencia valószínűségi modellekben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai módszerek a skálafüggetlen hálózatok

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biológiai rendszerek modellellenőrzése bayesi megközelítésben

Optimalizálás alapfeladata Legmeredekebb lejtő Lagrange függvény Log-barrier módszer Büntetőfüggvény módszer 2017/

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Regressziós vizsgálatok

Feladatok és megoldások a 13. hétre

Probabilisztikus funkcionális modellek idegrendszeri adatok elemzésére

Logisztikus regresszió

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Loss Distribution Approach

Gazdasági matematika II. vizsgadolgozat megoldása, június 10

Több valószínűségi változó együttes eloszlása, korreláció

Függvények december 6. Határozza meg a következő határértékeket! 1. Feladat: x 0 7x 15 x ) = lim. Megoldás: lim. 2. Feladat: lim.

A leíró statisztikák

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

2. (b) Hővezetési problémák. Utolsó módosítás: február25. Dr. Márkus Ferenc BME Fizika Tanszék

Kauzális modellek. Randall Munroe

Diagnosztika, statisztikai döntések, hipotézisvizsgálat, osztályozás

Kutatásmódszertan és prezentációkészítés

Függvények július 13. Határozza meg a következ határértékeket! 1. Feladat: x 0 7x 15 x ) = lim. x 7 x 15 x ) = (2 + 0) = lim.

(Independence, dependence, random variables)

STATISZTIKAI PROBLÉMÁK A

Bayesi tanulás. Kooperáció és gépi tanulás laboratórium (VIMIMB02) március 12. Elméleti alapok. Bayesi lineáris regresszió

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

[Biomatematika 2] Orvosi biometria

Modellkiválasztás és struktúrák tanulása

Bizonytalan tudás kezelése

Segítség az outputok értelmezéséhez

Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei

Kettőnél több csoport vizsgálata. Makara B. Gábor

Bevezeto Least-squares es variansai Globalis modszerek Lokalis modszerek. Implicit Fitting. Vaitkus Márton. 3D Számítógépes Geometria 2 (2016)

3. Egy szabályos dobókockával háromszor dobunk egymás után. Legyen A az az esemény, hogy

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

egyetemi jegyzet Meskó Balázs

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Ökonometria. Logisztikus regresszió. Ferenci Tamás 1 tamas.ferenci@medstat.hu. Nyolcadik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék

A mérési eredmény megadása

STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

A valószínűségszámítás elemei

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Pontműveletek. Sergyán Szabolcs Óbudai Egyetem Neumann János Informatikai Kar február 20.

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Valószínűségszámítás összefoglaló

Irányításelmélet és technika II.

Probabilisztikus modellek II: Inferencia. Nagy Dávid

BIOMATEMATIKA ELŐADÁS

Lineáris regressziószámítás 1. - kétváltozós eset

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

[Biomatematika 2] Orvosi biometria

Gyakorló feladatok I.

Gépi tanulás a gyakorlatban. Lineáris regresszió

7. Előadás tartalma. Lineáris szűrők: Inverz probléma dekonvolúció: Klasszikus szűrők súly és átviteli függvénye Gibbs jelenség

Többváltozós lineáris regresszió 3.

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Statisztikai becslés

Egyenletek, egyenlőtlenségek V.

Villamosmérnök A4 11. hét Kétdimenziós normális eloszlás, cht - Megoldások

January 16, ψ( r, t) ψ( r, t) = 1 (1) ( ψ ( r,

Matematika A2 vizsga mgeoldása június 4.

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Osztályozóvizsga követelményei

Helymeghatározási alapelvek és módszerek

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

A valószínűségszámítás elemei

5. előadás - Regressziószámítás

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

Valószín ségi döntéstámogató rendszerek

Osztályozás, regresszió. Nagyméretű adathalmazok kezelése Tatai Márton

Hajlított tartó elmozdulásmez jének meghatározása Ritz-módszerrel

Ökonometria. Logisztikus regresszió. Ferenci Tamás 1 Nyolcadik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Adatok statisztikai értékelésének főbb lehetőségei

Valószínűségi változók. Várható érték és szórás

Logisztikus regresszió október 27.

Matematikai statisztikai elemzések 6.

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Bizonytalanság. Mesterséges intelligencia április 4.

Átírás:

Least Squares becslés A négyzetes hibafüggvény: i d i ( ) φx i A négyzetes hibafüggvény mellett a minimumot biztosító megoldás W=( d

LS becslés A gradiens számítása és nullává tétele eredményeképp A megoldás 1 * LS T T w Φ Φ Φ d A Moore-enrose pseudo-inverse,.

Regularizált Least Squares A hibafüggvény: Adatoktól függő + Regularizációs tag A négyzetes hibafüggvény és a négyzetes regularizációs összefüggés mellett Ennek minimumát biztosító megoldás + i d i ( ) φx i : regularizációs együttható

Maximum Likelihood becslés Feltesszük, hogy a megfigyelések egy determinisztikus függvényből származnak Gauss additív zajjal terhelve d y( xw, ) n Amit írhatunk így is: 1 p( n ) N( n 0, ) 1 p( d x, w, ) N ( d y( x, w), ) T Adott X x 1, x 2,..., x bemenetek és d d 1, d 2,..., d kívánt válasz megfigyeléseknél a likelihood függvény a következő T 1 p( d X, w, ) N( di y( w φx ( i), ) i T

Maximum likelihood becslés Vegyük a logaritmusát: Vagyis az egyes megfigyeléseknél az eltérések négyzetének összegét nézzük 1 ln p( d X, w, ) ln N( d y( w φx ( ), ) i i T 1 T ln ln(2 ) ( di w φx ( i)) 2 2 2 i i 2

ML becslés A gradiens számítása és nullává tétele eredményeképp A megoldás Ahol 1 * ML T T w Φ Φ Φ d -1 ML ( T T w Φ d Φ Φ) Φ d wls A Moore-enrose pseudo-inverse,.

Maximum likelihood becslés is meghatározható ha e szerint keressük a szélsőértéket: i ( ) φx i Ami a jól ismert tapasztalati szórásnégyzet összefüggés d i

Regularizált Least Squares Egyéb szokásos regularizációs lehetőségek + i d i ( ) φx i Lasso Négyzetes

A tozítás-variancia dekompozíció Egy példa: 25 adatkészlet, a regularizációs együttható függvényében.

A tozítás-variancia dekompozíció Egy példa: 25 adatkészlet, a regularizációs együttható függvényében

A tozítás-variancia dekompozíció Egy példa: 25 adatkészlet, a regularizációs együttható függvényében

A tozítás-variancia dekompozíció Egy túlregularizált modell (nagy ) erősen torzított lesz, míg egy alulregularizált modell (kis ) nagy variancivával fog rendelkezni.

Bayes lineáris regresszió A Bayes megközelítésnél feltételezzük, hogy w valószínűségi változó, ismert a priori sűrűségfüggvénnyel A megfigyelések birtokában meghatározható az a poszteriori sűrűségfüggvény. Ehhez a Bayes tételt alkalmazzuk: posterior likelihood prior p( w d) Mivel itt minden Gauss a posterior is Gauss lesz ahol p( w d) N( w m, S ) p( d w) p( w) p( d w) p( w) pd ( ) p( d w) p( w) dw d)

Bayes lineáris regresszió Gyakori választás a priorra Ekkor

Gauss eloszlás

artitionált Gauss eloszlás

artitionált feltételes eloszlás és marginális

artitionált feltételes eloszlás és marginális

Bayes tétel Gauss változókra Adott ebből ahol

Bayes következtetés Gauss esetben Tételezzük fel, hogy ¾ 2 ismert. Adott i.i.d. adat, a likelihood függvény ¹ -re ez is Gauss.

Bayes következtetés Gauss esetben Gauss prior ¹felett, Ebből a posterior Teljes négyzetté alakítással

Bayes következtetés Gauss esetben ahol Megjegyzés:

Bayes következtetés Gauss esetben élda: for = 0, 1, 2 and 10.

Bayes lineáris regresszió Gyakori választás a priorra Ekkor

Bayes lineáris regresszió Gyakori választás a priorra Ekkor

Bayes lineáris regresszió Gyakori választás a priorra Ekkor

Bayes lineáris regresszió Megfigyelések előtt w feltételezett eloszlása, és az ilyen w-kkel generált adatok rior Adatok tere

Bayes lineáris regresszió 1 megfigyelés érkezett Likelihood oszterior Adatok tere

Bayes lineáris regresszió 2 megfigyelés után Likelihood oszterior Adatok tere

Bayes lineáris regresszió 20 megfigyelt adat után Likelihood oszterior Adatok tere

rediktív eloszlás Jósoljuk a d választ egy új x értékre úgy hogy w felett integráljuk a posteriort: d d d d d φ φ φ ahol

rediktív eloszlás Színusz regresszió, 9 Gauss bázisfüggvény,és 1 adatpont esetén

rediktív eloszlás Színusz regresszió, 9 Gauss bázisfüggvény és 2 adatpont esetén

rediktív eloszlás Színusz regresszió, 9 Gauss bázisfüggvény és 4 adatpont esetén

rediktív eloszlás Színusz regresszió, 9 Gauss bázisfüggvény és 25 adatpont esetén

Bayes modell összehasonlítás Hogyan választhatjuk a megfelelő modellt? Tételezzük fel, hogy van több modellünk: M i, i=1,,l, és D adatkészletünk; a modell posterior valószínűségét szeretnénk meghatározni osterior rior Model evidencia vagy marginális likelihood Bayes faktor: a modell evidenciák hányadosa

Bayes modell összehasonlítás Ha ismerjük p(m i jd)-ket, kiszámítható a prediktív eloszlást meghatározható, hogy az adatokból eredőben milyen jóslás adható. Most a modellek felett átlagolunk, tehát azt nézzük meg, hogy ha az adatokból többféle modell is konstruálható valamilyen poszteriorral, akkor a jósolható adat milyen eloszlású d d E helyett célszerűbb azt a modellt kiválasztani, melynek az evidenciája a legnagyobb.

Bayes modell összehasonlítás A w paraméterű modellnél a model evidenciát a w feletti integrálással kaphatjuk (marginalizálás) Megjegyezzük, hogy

Bayes modell összehasonlítás Ha van egy adott modellünk egy skalár w paraméterrel az alábbi közelítés tehető Feltételezve, hogy a posterior kis szórású (csúcsos).

Bayes model összehasonlítás Véve a logaritmusát Negatív Ha nem egy, hanem M paraméterünk van, és mindegyiknél azonos arányt tételezünk fel Negatív és M-mel lineárisan nő a számérték.

Bayes modell összehasonlítás Az adat és a megfelelő komplexitású modell illesztése

A prior eloszlások paramétereinek meghatározása Meg kell határoznunk az optimális és paramétereket. Keressük d maximumát és szerint. Ahol i d i φ i mind -tól, mind -tól függ. A regularizációs együttható származtatása