Matematikai statisztika. elıadás, 009.04.7. Kísérlettervezés A legfotosabb off-lie módszer a mőködés hatékoyabbá tételére. Cél: az otimális beállítások megtalálása. Szemotok egyértelmő eredméyek miimális költség elegedı iformatívitás lehetıleg kis méret világos cél meghatározott érvéyességi terület valós viszoyok (labor - termelés) kísérlet Hatások száma faktor - fıhatás árokéti, többszörös kölcsöhatás. 4-8 3 3 6 4 6 5 3 5 0 6 64 6 5 4 8 7 99 56 8 8 9 5 9 36 466 04 0 45 968 Az extra iformáció felhaszálása Ha vaak elhayagolható kölcsöhatások, akkor a redszer túlhatározottsága azt is jeleti, hogy mid a kísérlet lefolytatása fölösleges iformációt is szolgáltat. Az extra iformációt felhaszálhatjuk: Újabb faktorok hatásáak becslésére A szórás jobb becslésére Részleges kétszitő tervezés Ha vaak magasabb szitő elhayagolható kölcsöhatások mód va a kísérletszám csökketésére. Ha l. a háromszoros kölcsöhatás elhayagolható, akkor az az iformációszerzés is elhagyható, ami eek a hatásak a kiszámításához kell. Pl. csak olya kísérleteket folytatuk le amelybe a hármas hatás kódolása kostas = fele ayi kísérlet. Sajos így túl sokat redukáluk: Aliasokat is bevezetük. BC aliasa A-ak, AC B-ek, AB C-ek. Így csak eze hatások együttesérıl yerük iformációt. Alias hatások Ha a kísérletek számát csökketjük, akkor viszot elıfordulhat, hogy em teljese meghatározottá válik a redszer, azaz bizoyos hatások em leszek elkülöíthetıek. A em elkülöíthetı (kölcsö)hatások beállításai a kísérletekbe midig azoosak (vagy midig elletettek). Az ilye hatásokat egymás alias-aiak aiak hívjuk. A kísérletek eredméyei alajá em lehet eldötei, hogy az aliasok egyike vagy másika okozta-e a változásokat.
Alias hatások 4- terv eseté Az eredméyek kiértékelése A B C D AB AC AD A*B*C*D=+ BCD ACD ABD ABC CD BD BC Szóráselemzéssel: kiszőrhetıek a szigifikás hatások A fotos faktorokra újabb kísérletek: a beállítások otosítása A véglegesek szát beállítások tesztelése valós körülméyek között, kellıe robusztus-e e az eredméy? Táblázatok elemzése A számokat legjobba osztással tudjuk összehasolítai. (Figyelem: külöbség-, illetve összegkézés csak akkor értelmes, ha ez a halmazokra is értelmes). Mérıszámok tíusai (százalékba csak a hasoló ismérvekbıl számított háyadosokat értelmes kifejezi): 00*Részhalmaz/teljes halmaz (ık aráya, havi bevétel részaráya) Hasoló ismérvekre: 00*(ismérv A)/(ismérv B) Példák: társasutazáso résztvevık/ egyéi utazók, adózás utái eredméy/adó. Táblázatelemzés/ Külöbözı ismérvek háyadosa: egy fıre esı gékocsik száma, GDP/fı stb. Mérıszám-sorozatok: Bázisidex: idısor számait ugyaahhoz a bázisidıothoz hasolítjuk (egyszerő súlyozatla idex) Bi 00 = Lácidex: idısor egymás utái számait hasolítjuk egymáshoz Li = 00 0 Mérıszám-sorozatok, élda A táblázat harmadik oszloa az éves áremelkedést mutatja. Ez egy lácidex, mert a bázis midig más. A. oszlo a bázisidex, ahol midig 995 a viszoyítási ala. Év Bázisidex Lácidex 995 00.0 8. 996 8. 3.6 997 58.5 8.3 998 87.5 4.3 999 4.3 0 000 35.7 09.8 00 58.8 09. 00 8.6 05.3 003 97.6 04.7 004 3.6 06.8 Bi = 00 0 = 00 j= ( Li /00) = 00 j j= j j Egy kokrét táblázat Magyarországi adatok Adjuk éldát külöbözı aráyszámokra! 970 980 990 000 Néesség (Millió) 0,35 0,70 0,37 0,7 Születésszám (ezer) 5 49 6 97 Autók száma (Millió) 0,03 0,30,96
Egy aradoxo Megoldás: Stadardizálás vállalkozás adatai Hol keresek jobba az alkalmazottak? Adjuk meg midkét cégél az átlagkereseteket! Tehát óvatosak kell leük a kevert oulációkál. B Bak G Gyár Nık Férfiak Nık Férfiak Havi fizetés 50 350 00 300 Szám 90 0 0 90 A hatásokat el kell külöítei: A részhalmazok adatai közötti eltérés hatása: B s : stadardsúlya (gyakorisága) az osztályokak V: megfigyelt értéke osztályokét A részhalmazok megoszlásáak eltérésébıl adódó hatás: B: eloszlás osztályokét, V s : stadard értékek osztályokét. BsjVj V = B sj B sj j0 V=(90*50+0*350)/00- -(90*00+0*300)/00= =50 ezer Ft BjVsj Bj0Vsj V = Bj Bj0 V=(90*50+0*350)/00- -(0*50+90*350)/00= =-80 ezer Ft B V sj dexszámok dexszámok: Két hasoló ismérv adatát osztjuk el egymással. Egyszerő idexek A kacsolódó számok közvetleül a táblázatból származak, valódi meyiségekrıl szólak. (Összetett) idexszámok A hasolítadó értékek számok, amiket súlyozott átlagkét kauk meg. Összetett idexek Összetett iacok idıbei változását jellemzik (átlagos ár- és meyiségváltozás) A súlyok léyegesek, mert a termékek eltérı részt kéviselek a forgalomba. Két lehetıség:. Laseyres idex : súlyok a bázisévbıl. Paasche idex : súlyok a beszámolási idıszakból Példa a saját taasztalatukból Heti kiadás, 006: mozijegy, 4 zsemle, 3 hamburger. Összár (érték): 800+4*50+3*300=400 Ft Heti kiadás, 007: 0,5 mozijegy, 0 zsemle, 7 hamburger. Összár (érték): 0,5*00+0*60+7*300=3300 Ft, tehát egy 37,5%(=00*3300/400)-os emelkedés. Ez egy értékidex, az ár- és meyiségi változásokat em külöítettük el. Folytatás: árösszehasolítás Egy idexet keresük, emcsak egyszerő összehasolításokat akaruk (50%,0%,0% az árukéti árváltozás). A vásárlói kosár valódi összetételét kell figyelembe vei. A 006-os meyiségek alajá: 00*(*00+4*60+3*300)/ (*800+4*50+3*300)=00*940/400=,5%, tehát,5%-os áremelkedés. A 007-es meyiségek alajá: 00*(0,5*00+0*60+7*300)/ (0,5*800+0*50+7*300)=00*3300/3000=0l%, tehát 0%-os volt az áremelkedés ebbe az esetbe. Alacsoyabb, mert kevesebbet fogyasztottuk a drágábbá vált áruféleségekbıl. 3
Folytatás: meyiségek összehasolítása Figyelembe kell vei a fogyasztói kosár elemeiek árait. A 006-os árak alajá: 00*(0,5*800+0*50+7*300)/ (*800+4*50+3*300)=00*3000/400=0%, tehát 0%-kal ıtt a meyiség ebbe az esetbe. A 007-es árak alajá : 00*(0,5*00+0*60+7*300)/ (*00+4*60+3*300)=00*3300/940=%, tehát %-kal ıtt a meyiség ebbe az esetbe. Alacsoyabb, mert kevesebbet fogyasztottuk a megdrágult árukból. Példa Belföldi csoortos utak Külföldi csoortos utak Utazási iroda adatai 004-bıl és 005-bıl. Év Meyyiség 004 00 3 Meyyiség i, 005 3 8 Átlagár ( ezer Ft) 004 5 08 Átlagár ( ezer Ft) i, 005 5 40 Egyéi utak (meetjegyek) 88 9 74 80 Laseyres-féle áridex L 0, = 00 i, =00(500+403+8088)/(500+083+7488)= =570/5768=0,3 Tehát 0,3%-os áremelkedés volt eze a iaco 005-be 004-hez kéest, ha a súlyok a bázisévbıl (004) származak. Laseyres-féle meyiségi idex M, L 0, = 00 i, =00(5 3+08 8+74 9)/(5 00+08 3+74 88)= =548/5768=0,3 Tehát,3%-os meyiségi övekedés volt eze a iaco 005-be 004-hez kéest, ha a súlyok a bázisévbıl (004) származak. Paasche féle áridex P 0, = 00 i, i, i, =00(53+408+809)/(5 3+08 8+74 9)= =57676/548=0,0 Paasche-féle meyiségi idex M, P 0, = 00 i, i, i, =00(53+408+809)/(500+403+8088)= =57676/570=0,0 Tehát 0%-os áremelkedés volt eze a iaco 005-be 004-hez kéest, ha a súlyok a beszámolási évbıl (005) származak. Tehát %-os meyiségi övekedés volt eze a iaco 005-be 004-hez kéest, ha a súlyok a beszámolási évbıl (005) származak. 4
Tulajdoságok Midkét idex a miimális és maximális (ár, illetve meyiségi) változás-aráy között helyezkedik el. Emelkedés dex > 00% Ha mide ár/meyiség ugyaúgy változik, akkor az idex is ezt a háyadost adja. dıbei változást em tudjuk az idexek szorzatával megkai, haem csak idexsorokat tuduk kiértékeli. (egyszerőbb a Laseyres-idexre). Tulajdoságok Laseyres idex Egyszerőbb számoli Alkalmas idexsorok elıállítására Hajlamos a túlbecslésre Paasche idex Ár/meyiség-aktuális Hajlamos alulbecslésre Komromisszum: Fischer-féle ideális idex: geometriai közé a Paasche és a Laseyres idexbıl. M, F 0, = M, P M, L 0, 0, F 0, = P L 0, 0, Értékidex 0, = 00 i, i, =00(53+408+809)/(5 00+08 3+74 88)= =57676/5768=,4 Azt jeleti, hogy a iaco,4%-os övekedés volt megfigyelhetı 005-be 004-hez kéest. dısor-elemzés Adatok: X t a t idıotba megfigyelt érték; ezek tiikusa em függetleek egymástól Stacioaritást feltételezzük Erıs stacioaritás: az együttes eloszlások em függek az idıtıl Gyege stacioaritás: a kovariacia-struktúra álladó Ha em stacioárius: l. szezoalitás, tred figyelhetı meg, akkor azokat elızetese, regressziós módszerekkel eltávolítjuk. Példák Lieáris tred illesztése (géjármő-adatok) Gékocsi-értékesítés az egyes évekbe 35 y t 34 33 3 3 30 9 8 7 6 5 0 3 4 5 6 7 8 9 0 dı (év) Személyekéti átlagjövedelem egyedévekét y 60 t 50 40 30 0 0 00 3 4 3 4 3 4 3 4 3 4 986 987 988 989 990 Quartale yˆ t = 608,4+ 86, t dısor az illesztett lieáris treddel y t, 35 34 33 3 3 30 9 8 7 6 5 0 3 4 5 6 7 8 9 0 dı (év) 5
Periodikus komoes a fizetési adatokál Emirikus autokorrelációs együttható Elıször leválasztjuk a tredet, majd az egyes egyedévekre kiszámoljuk a reziduálisok átlagát. Ezt kivova az eredeti idısorból, eriódusmetes adatokat kauk. 5 0 5 0-5 -0 S j Szezoális áltagok egyedévekét 0 3 4 Quartale 60 50 40 30 0 0 00 A megtisztított idısor 3 4 3 4 3 4 3 4 3 4 986 987 988 989 990 Quartale dısor (x, x,, x ). redő autokorrelációs együttható : Korreláció az alábbi - ár között (x, x ), (x 3, x ),, (x, x - ) (x t x)(x t x) r = (x x) t. redő autokorrelációs együttható : Korreláció az alábbi - ár között: (x 3, x ), (x 4, x ),, (x, x - ) (x t x)(x t x) r = 3 (x t x) k. redő autokorrelációs együttható Általába: k. redő autokorrelációs együttható : Korreláció az alábbi -k ár között (x k+, x ), (x k+, x ),, (x, x -k ) (x t x)(x t k x) r = k+ k (x t x). redő autokorrelációs együttható a reziduálisokra A korrelációt most az (u, u ), (u 3, u ),..., (u, u - ). árok között számoljuk. Az = u - u t u = u t jelölésekkel (ut u)(ut u) r = (ut u) (ut u) Nagy -re E(u t )=0 közelítıleg maga utá voja az alábbiakat: u u u u= ut 0 ut u t-. r = ut Grafikus megjeleítés: korrelogramm Továbbléés X tegely: red, y tegely: autokorrelációk ACF -0. 0.0 0. 0.4 0.6 0.8.0 Függetle, azoos eloszlású változók =00, kofidecia sáv az r=0 teszteléséhez a ormális határeloszlásból: [-.96 /,.96 /] Ha em fogadható el a reziduálisok korrelálatlasága: Lehetek fel em tárt eriódusok De más kacsolat is femaradhat az egymáshoz közeli megfigyelések között (l. idıjárási adatok, eltérés a sokévi átlagtól). ACF -0. 0.0 0. 0.4 0.6 0.8.0 Kacsolat va x_t és x_(t+4) között 0 5 0 5 0 Lag 0 5 0 5 0 Lag 6