Fő cél: jóslás Történhet: Regresszó 1 változó több változó segítségével Lépések: Létezk-e valamlyen kapcsolat a 2 változó között? Kapcsolat természetének leírása (mat. egy.) A regresszós egyenlet alapján történt jóslás pontosságának meghatározása. Több változós esetben: magyarázó változók relatív fontosságának meghatározása.
Függetlenség vzsgálat Ch négyzet teszt Korrelácós együttható: r ( x ( n x)( y 1) s x s y y)
Lneárs regresszó Regresszós egyenes y = a + b*x, ahol y jelöl a függő változó jósolt értékét a független változó egy adott értéke mellett.
Regresszós egyenes A legjobban lleszkedő regresszós egyenes a legksebb négyzetek módszerén alapszk, ahol ( y y ' ) 2 mnmalzálva van. Megoldás: b ( x ( x x)( y x) 2 y) a y bx
Regresszós modell feltételezése A magyarázó változó (x) mnden értékéhez létezk a cél változónak (y) egy valószínűség eloszlása, ahol az értékek ebből az eloszlásból véletlenszerűen jönnek. Az y ezen eloszlásanak szórása mnden valószínűség eloszlás esetében azonos. Lneárs esetben +1 feltétel: y eloszlások várható értéke: y x
Lneárs regresszós modell Ezen feltételezések alapján a célváltozó megfgyelése: y x e e az y értékek természetes szóródása a regresszós egyenes körül (véletlen rész)
Jóslás pontossága Alfa, béta a populácó regresszós egyeneséhez tartozk. a, b: mnta regresszós egyeneséhez tartozk (b pl. az bétát becsl) A jósolt y és a megfgyelt y értékek eltéréséből adódó szórás: Becslés standard hbája: s y x ( y n 2 y ' ) 2
Hbák 3 forrása 3 forrásból adódhat eltérés: a) az gaz regresszós egyenes körül ngadozásból: s y*x b) alfa paraméter becslésének hbájából c) béta paraméter (meredekség) becslésének hbájából
Magyarázott varanca aránya s s 2 y ' 2 y r 2 r 2 determnácós együttható mér a magyarázott varanca arányát
Többváltozós regresszó számítás 1 cél változó és sok bemenet változó. Többváltozós lneárs regresszós egyenlet: y = a+b 1 x 1 +b 2 x 2 + +b k x k mnta megfgyelésére támaszkodó egyenlet y jósolt érték a, b regresszós együtthatók
Többszörös korrelácós együttható R megmutatja a korrelácót célváltozó és a súlyozott magyarázó változók között. R 2 (többszörös determnácós együttható) megmutatja a varanca arányát a magyarázó változók és a célváltozó között.
Magyarázó változók kválasztása Néhány esetben szükségünk lehet olyan regresszóra, ahol csak néhány magyarázó változó szerepel. Feladat: Regresszós függvény legyen alkalmas becslés célokra. Lehető legkevesebb magyarázó változó segítségével oldja meg adott megbízhatóság sznten belül.
Backward elmnácós eljárás (Backward Elmnaton Procedure) Összes magyarázó változóból ndul k. F vagy t próba segítségével a regresszós együtthatókat szeparált módon tesztel. Az előre megadott szgnfkanca-sznt matt lesznek szgnfkáns és nem szgn. paraméterekkel rendelkező változók. Nem szgn. változók közül a legalacsonyabb F vagy t értékű változót elhagyjuk. Regresszó függvényt újra számoljuk.
Forward szelekcós eljárás (Forward Selecton Procedure) Üres halmazból ndul k. F vagy t próba segítségével a regresszós együtthatókat szeparált módon tesztel. Legnagyobb F vagy t értékű paraméterrel rendelkező szgnfkáns változót berakja a regresszós egyenletbe. Regresszó függvényt újra számolja.
Stepwse (regresszós) eljárás Előző kettő kombnácója. Lépésenként be- és kvesz. Lehet üres halmazból ndulva egyesével növeln a változók számát VAGY összes változóból egyenként kvenn. Pl. üres halmazból ndulva: legnagyobb F vagy t értékű bekerül. Mnden tovább beválasztás után megvzsgáljuk, hogy a bent levők közül lehet-e valamelyket kszórn (F vagy t próba). Eljárás üres halmazból addg folytatódk, míg R 2 szgnfkáns nem lesz. VAGY: Összes változóból a következő elhagyásával az R 2 már nem lenne szgnfkáns.
Multkollneartás (kollneartás) problémája Két vagy több magyarázó változó lneárs korrelácós kapcsolatát értjük. Teljes vagy extrém multkollneartás: egy változó kfejezhető a több lneárs kombnácójaként. Problémák: Egyk változó változása együtt jár a másk változó értékének megváltozásával. Ezért a szeparált vzsgálat nehezen végezhető. Y érték ks változására érzékenyek a regresszós függvény paramétere
Logsztkus regresszó Logsztkus függvény 0 és 1 között értéket vesz fel. Pl: válaszadás valószínűség ügyfelek
Logsztkus regresszó képlete Csak 2 értékű célváltozónál használható p 1 e Z e Z Z B 0 B X 1 B 2 X 2... B N X N