Matematikai statisztika elıadás. éves elemzı szakosoknak 11. elıadás Kísérlettervezés A legfontosabb off-line módszer a mőködés hatékonyabbá tételére. Cél: az otimális beállítások megtalálása. Szemontok egyértelmő eredmények minimális költség elegendı informatívitás lehetıleg kis méret világos cél meghatározott érvényességi terület valós viszonyok (labor - termelés) A kísérletek ismétlése A válasz változékony azonos faktorbeállítás mellett is. Ez a kísérleti hiba.. A hiba forrása a zaj-faktorok jelenléte.. A végsı eredmények és konklúziók ontosságának növelésére a kísérleteket ismételjük. Az ismétlés segít meghatározni a kísérleti hibát a hatások ontosabb becslését adja növeli a költségeket Randomizálás = Véletlenítés Szisztematikus hibák is elıfordulhatnak a kísérletek során, úgy, hogy a kísérletezı ennek nincs tudatában. Felléhetnek fel nem ismert faktorok. A nem ( vagy költségesen) befolyásolható faktorok is hatnak a kísérletben Ezen nem kívánt hatások kiküszöbölésére randomizáljuk A kísérletek sorrendjét A kísérletek allokációját A kísérletben felhasznált anyagot A faktoriális tervezés Az ellenırzött faktorok kívánt és meghatározott szintjét a kísérlethez beállítjuk majd lefolytatjuk a kísérletet. Ennek kimeneteleként kajuk, ill. mérjük a faktorbeállításra adott választ. Ha a faktorszintbeállítások összes lehetséges kombinációjára végrehajtjuk a kísérleteket akkor teljes faktoriális, míg ha csak bizonyos szintbeállitásokat vizsgálunk, akkor részleges faktoriális kísérletekrıl beszélünk. Ha sok faktorunk van, akkor célszerő ezek csökkenteni, és csak a fontosabbakat megtartani. számát A nem fontos,, a nehezen vagy csak nagy költséggel beállítható faktorokat a zaj-faktorok közé soroljuk, és hatásukat lehetıleg limitáljuk a kísérletek során. A tervezés kezdeti léései A faktorok meghatározása A válaszok meghatározása A szintek számának meghatározása A szintek nagyságának meghatározása A szintkombinációk beállítása Véletlen sorrendbeállítás 1
Szintek és hatások 2 szint - lineáris hatás vizsgálatára 3 szint - kvadratikus hatás vizsgálatára k+1 szint - k-adfokú hatás vizsgálatára A szintek számának növelésével hatványozottan nı az elvégzendı kísérletek száma Sok esetben 2 szint is elegendı ( esetleg némi kiegészítéssel) nemlineáris hatások figyelembevételére vagy közelítésére. Néha a lineáris közelítés nagyon félrevezetı is lehet, ezért jogos voltát ellenırizni kell. Kétszintő kísérleteknél a közéont beiktatása elegendı lehet a linearitás ellenırzésére. Kétszintő kísérletek Minden faktornak csak két (magas és alacsony) értéke lehet. Használhatjuk: Líneáris hatás kimutatására Bilineáris kölcsönhatások vizsgálatára Standard gyártásbeállítás megváltoztatására A standard beállítás a közéontba kerül Szokás: : a standard ± 10% A beállítások kódolása szintek kódolása: magas: : +1 alacsony: -1 beállítások kódolása: Négyzet, kocka, hierkocka csúcsontjai Gyakran az origót (minden faktorra ra az átlag) hozzávesszük A kocka minden belsı ontja egy-egy (meg nem valósított) faktorbeállításnak felel meg. nteroláció Nem csuán a csúcsontokban kívánunk információt kani a válaszról A kocka teljes belsejére interolálunk Az interoláció hibája ne legyen túl nagy: linearitás jó közelítéssel teljesüljön a csúcsontok nem túl távoliak Az extraoláció veszélyes Nemlinearitás A közéontot használjuk fel a linearitás ellenırzésére. A közéontban ismételjük a kísérleteket Csúcsbeli válaszok átlaga = közéonti válaszok átlaga Szignifikáns eltérés esetén nemlinearitás Nemlinearitás esetén további kísérletek Kölcsönhatások A faktorok a legritkább esetben hatnak egymástól függetlenül. Az egyik hatás beállításának megváltoztatása után a másik hatás teljesen megváltozhat. Ezért kell együtt változtatni az összes faktort és nem egyesével keresni az otimumot. Pl. A, B, C hatások esetén AB, BC, CA és ABC együttes hatását is figyelembe kell venni. A magasabb rendő kölcsönhatások gyakran elhanyagolhatóak, csak a áronkéntit vizsgáljuk. Kétszintő kísérlettel csak a bilineáris kölcsönhatásokat tudjuk figyelembe venni (a bilinearitást nem szokás tesztelni), kvadratikus ill. magasabb rendőt nem. 2
Blokkolás Ha l. az ABC együttes hatás elhanyagolható, de a kísérletet l. 2 na alatt végezzük akkor célszerő ezt úgy tennünk, hogy az elsı na azokat a kísérleteket végezzük, amelyben ABC +1 kódot ka, míg a második na végezzük a -1 kódúakat. Ezzel a naok hatását is elemezhetjük. Hasonláan járhatunk el, ha valamelyik faktort nehéz átállítani, ekkor sem véletlen sorrendben (eszerint a faktor szerint) futtatjuk le a kísérleteket, hanem blokkokban. Két faktor esete Két faktor esetén a következı négy hatást tudjuk a 4 kísérletbıl figyelembe venni. Átlagos szint Az elsı faktor hatása A második faktor hatása A két faktor kölcsönhatása Ezek segítségével, ezek függvényeként adjuk meg az u.n. válaszfüggvényt. Több faktor esete Több faktor esetén a következı tíusú kölcsönhatások léhetnek fel: Átlagos hatás Fıhatások Páronkénti kölcsönhatások Magasabb rendő kölcsönhatások Ezek összes száma: n n n = 2 k k= 0 kísérlet Hatások száma faktor - fıhatás áronkénti, többszörös kölcsönhatás. 4 2 1-8 3 3 1 16 4 6 5 32 5 10 16 64 6 15 42 128 7 21 99 256 8 28 219 512 9 36 466 1024 10 45 968 Táblázatok elemzése A számokat legjobban osztással tudjuk összehasonlítani. (Figyelem: különbség-, illetve összegkézés csak akkor értelmes, ha ez a halmazokra is értelmes). Mérıszámok tíusai (százalékban csak a hasonló ismérvekbıl számított hányadosokat értelmes kifejezni): 100*Részhalmaz/teljes halmaz (nık aránya, havi bevétel részaránya) Hasonló ismérvekre: 100*(ismérv A)/(ismérv B) Példák: társasutazáson résztvevık/ egyéni utazók, adózás utáni eredmény/adó. Táblázatelemzés/2 Különbözı ismérvek hányadosa: egy fıre esı gékocsik száma, GDP/fı stb. Mérıszám-sorozatok: Bázisindex: idısor számait ugyanahhoz a bázisidıonthoz hasonlítjuk (egyszerő súlyozatlan index) n Bi 100 n = Láncindex: idısor egymás utáni számait hasonlítjuk egymáshoz Lin n n 1 0 3
Mérıszám-sorozatok, élda Év Bázisindex Láncindex A táblázat harmadik oszloa az éves áremelkedést mutatja. Ez egy láncindex, mert a bázis mindig más. A 2. oszlo a bázisindex, ahol mindig 1995 a viszonyítási ala. 1995 100.0 128.2 1996 128.2 123.6 1997 158.5 118.3 1998 187.5 114.3 1999 214.3 110 2000 235.7 109.8 2001 258.8 109.2 2002 282.6 105.3 2003 297.6 104.7 2004 311.6 106.8 n Bin 0 n 1 j= 1 ( Li /100) j n j= 1 j 1 j Egy konkrét táblázat Magyarországi adatok Adjunk éldát különbözı arányszámokra! 1970 1980 1990 2000 Néesség (Millió) 10,35 10,70 10,37 10,17 Születésszám (ezer) 152 149 126 97 Autók száma (Millió) 0,031 0,230 1 1,96 Egy aradoxon Megoldás: Standardizálás 2 vállalkozás adatai Hol keresnek jobban az alkalmazottak? Adjuk meg mindkét cégnél az átlagkereseteket! Tehát óvatosnak kell lennünk a kevert oulációknál. B Bank G Gyár Nık Férfiak Nık Férfiak Havi fizetés 250 350 200 300 Szám 90 10 10 90 A hatásokat el kell különíteni: A részhalmazok adatai közötti eltérés hatása: B s : standardsúlya (gyakorisága) az osztályoknak V: megfigyelt értéke osztályonként A részhalmazok megoszlásának eltérésébıl adódó hatás: B: eloszlás osztályonként, V s : standard értékek osztályonként. BsjVj1 V = B sj B sj j0 V=(90*250+10*350)/100- -(90*200+10*300)/100= =50 ezer Ft Bj1Vsj Bj0Vsj V = Bj1 Bj0 V=(90*250+10*350)/100- -(10*250+90*350)/100= =-80 ezer Ft B V sj ndexszámok ndexszámok: Két hasonló ismérv adatát osztjuk el egymással. Egyszerő indexek A kacsolódó számok közvetlenül a táblázatból származnak, valódi mennyiségekrıl szólnak. (Összetett) indexszámok A hasonlítandó értékek számok, amiket súlyozott átlagként kaunk meg. Összetett indexek Összetett iacok idıbeni változását jellemzik (átlagos ár- és mennyiségváltozás) A súlyok lényegesek, mert a termékek eltérı részt kéviselnek a forgalomban. Két lehetıség: 1. Laseyres index : súlyok a bázisévbıl 2. Paasche index : súlyok a beszámolási idıszakból 4
Példa a saját taasztalatunkból Heti kiadás, 2006: 1 mozijegy, 14 zsemle, 3 hamburger. Összár (érték): 800+14*50+3*300=2400 Ft Heti kiadás, 2007: 0,5 mozijegy, 10 zsemle, 7 hamburger. Összár (érték): 0,5*1200+10*60+7*300=3300 Ft, tehát egy 37,5%(=100*3300/2400)-os emelkedés. Ez egy értékindex, az ár- és mennyiségi változásokat nem különítettük el. Folytatás: árösszehasonlítás Egy indexet keresünk, nemcsak egyszerő összehasonlításokat akarunk (50%,20%,0% az árunkénti árváltozás). A vásárlói kosár valódi összetételét kell figyelembe venni. A 2006-os mennyiségek alaján: 100*(1*1200+14*60+3*300)/ (1*800+14*50+3*300)=100*2940/2400=122,5%, tehát 22,5%-os áremelkedés. A 2007-es mennyiségek alaján: 100*(0,5*1200+10*60+7*300)/ (0,5*800+10*50+7*300)=100*3300/3000=110l%, tehát 10%-os volt az áremelkedés ebben az esetben. Alacsonyabb, mert kevesebbet fogyasztottunk a drágábbá vált áruféleségekbıl. Folytatás: mennyiségek összehasonlítása Figyelembe kell venni a fogyasztói kosár elemeinek árait. A 2006-os árak alaján: 100*(0,5*800+10*50+7*300)/ (1*800+14*50+3*300)=100*3000/2400=120%, tehát 20%-kal nıtt a mennyiség ebben az esetben. A 2007-es árak alaján : 100*(0,5*1200+10*60+7*300)/ (1*1200+14*60+3*300)=100*3300/2940=112%, tehát 12%-kal nıtt a mennyiség ebben az esetben. Alacsonyabb, mert kevesebbet fogyasztottunk a megdrágult árukból. Példa Belföldi csoortos utak Külföldi csoortos utak Utazási iroda adatai 2004-bıl és 2005-bıl. Év Menynyiség 2004 200 132 Menynyiség 2005 223 128 Átlagár ( ezer Ft) 2004 52 208 Átlagár ( ezer Ft) 2005 52 240 Egyéni utak (menetjegyek) 188 192 74 80 Laseyres-féle árindex L =100(52200+240132+80188)/(52200+208132+74188)= =57120/51768=110,3 Tehát 10,3%-os áremelkedés volt ezen a iacon 2005-ben 2004-hez kéest, ha a súlyok a bázisévbıl (2004) származnak. Laseyres-féle mennyiségi index M, L =100(52 223+208 128+74 192)/(52 200+208 132+74 188)= =52428/51768=101,3 Tehát 1,3%-os mennyiségi növekedés volt ezen a iacon 2005-ben 2004-hez kéest, ha a súlyok a bázisévbıl (2004) származnak. 5
Paasche féle árindex P =100(52223+240128+80192)/(52 223+208 128+74 192)= =57676/52428=110,0 Paasche-féle mennyiségi index M, P =100(52223+240128+80192)/(52200+240132+80188)= =57676/57120=101,0 Tehát 10%-os áremelkedés volt ezen a iacon 2005-ben 2004-hez kéest, ha a súlyok a beszámolási évbıl (2005) származnak. Tehát 1%-os mennyiségi növekedés volt ezen a iacon 2005-ben 2004-hez kéest, ha a súlyok a beszámolási évbıl (2005) származnak. Tulajdonságok Mindkét index a minimális és maximális (ár, illetve mennyiségi) változás-arány között helyezkedik el. Emelkedés ndex > 100% Ha minden ár/mennyiség ugyanúgy változik, akkor az index is ezt a hányadost adja. dıbeni változást nem tudjuk az indexek szorzatával megkani, hanem csak indexsorokat tudunk kiértékelni. (egyszerőbb a Laseyres-indexre). Tulajdonságok Laseyres index Egyszerőbb számolni Alkalmas indexsorok elıállítására Hajlamos a túlbecslésre Paasche index Ár/mennyiség-aktuális Hajlamos alulbecslésre Komromisszum: Fischer-féle ideális index: geometriai közé a Paasche és a Laseyres indexbıl. M, F 0,1 = M, P M, L 0,1 F 0,1 = P L 0,1 Értékindex =100(52223+240128+80192)/(52 200+208 132+74 188)= =57676/51768=111,4 Azt jelenti, hogy a iacon 11,4%-os növekedés volt megfigyelhetı 2005-ben 2004-hez kéest. 6