MINTAVÉTEL A MARKETINGKUTATÁSBAN, KÜLÖNÖS TEKINTETTEL A DIVIZÍV ÉS AZ AGGLOMERATÍV RÉTEGZÉSRE Molár László egyetem taársegéd
1. BEVEZETÉS A statsztkusok a mtaagyság meghatározására számos módszert dolgoztak k az elmúlt évszázadba, a marketgkutatás gyakorlatába mégs csak egy módszer terjedt el gazá. Eek legfıbb oka az, hogy a sokaság aráy tervallumbecslésé alapuló megközelítés még akkor s alkalmazható, amkor a több módszer már csıdöt mod. Az aráybecslése alapuló eljárás ugyas kküszöböl a több módszer legagyobb hbáját, vagys cs szükség az alapsokasággal kapcsolatos elızetes smeretekre. Az eljáráshoz elég smer az alapsokaság agyságát [N] és meg kell ad a kívát megbízhatóság [π], valamt a potosság sztet [ ]. Amt rögzítésre kerülek a keretfeltételek, csak be kell helyettesíte a végtele és a véges alapsokaság képletekbe és felfelé kerekítést követıe már redelkezésre s áll a kívát mtaagyság []. Jele taulmáyak három célja va. Egyrészt összefoglalását kíváom ad a mtaagyság meghatározása statsztka módszereek [Berste-egyelıtleség segítségével, Hoeffdg-egyelıtleség segítségével, átlagbecslése alapuló, aráybecslése alapuló megközelítések] egyszerő mtavétel eseté - rávlágítva azok erıs és gyege potjara és alkalmazásuk legfotosabb tudvalóak rétegzett, csoportos és többlépcsıs mtavétel eseté. Másrészt bemutatom a mtaagyság meghatározásáak egy új kocepcóját, az ú. agglomeratív rétegzés elméletét és gyakorlatát. Harmadrészt smertetem egy BC [hulladékkezelés közszolgáltatás] és egy BB [levélposta szolgáltatás] kutatás mtavétel tervét, amely példák kváló esettaulmáya a külöbözı kutatás problémákra adott módszerta javaslatokak. 1
. A MINTANAGYSÁG MEGHATÁROZÁSA EGYSZERŐ VÉLETLEN [EV] MINTA ESETÉN.1. A mtaagyság meghatározása a Bersteegyelıtleség segítségével 1 Ameybe egy változó értéke az [a,b] tervallumba esek, az 1 [ X ] mtaátlag és az [m] várhatóérték abszolút eltérésére = 1 smertek tektett szórás [σ ] eseté Berste az alább egyelıtleséget bzoyította be: 1 ε Prob X > ( ) m ε exp [1. képlet] = 1 ε b a σ + 3 Az egyelıtleség függetle a változó eloszlásától, vagys lehetıségük va az [] mtaagyság meghatározására. A kérdésük tehát az, hogy mlye mtaagyság eseté teljesül az alább egyelıtleség: 1 Prob X > ε m α [. képlet] = 1 A Berste-egyelıtleség alapjá bebzoyítható, hogy: α b a l σ + ε 3 [3. képlet] ε Ha elıírjuk, hogy maxmum mekkora eltérést [ε ] egedük meg, bzoytalaságot [α ] vselük el és megadjuk a változó értéket lefedı tervallumot [a,b], akkor a szükséges mtaagyság [] alulról becsülhetı. A módszer legagyobb hátráya, hogy elızetes formácóra [Pl.: a szórás smeretére] va szükség az alkalmazásához. 1 Készült Berste [1946] alapjá
.. A mtaagyság meghatározása a Hoeffdgegyelıtleség segítségével Ameybe egy változó értéke az [a,b] tervallumba esek, az 1 [ X ] mtaátlag és az [m] várhatóérték abszolút eltérésére = 1 smeretle szórás eseté Hoeffdg az alább egyelıtleséget gazolta: 1 ε Prob X > m ε exp ( ) [4. képlet] = 1 b a Az egyelıtleség szté függetle a változó eloszlásától, vagys lehetıségük va az [] mtaagyság meghatározására. A kérdésük tehát smételte az, hogy mtaagyság eseté teljesül az alább egyelıtleség: 1 Prob X > ε m α [5. képlet] = 1 A Hoeffdg-egyelıtleség alapjá gazolható, hogy: ( b a) α l [6. képlet] ε Ha elıírjuk, hogy maxmum mekkora eltérést [ε ] egedük meg, bzoytalaságot [α ] vselük el és megadjuk a változó értéket lefedı tervallumot [a,b], akkor a szükséges mtaagyság [] ugyacsak alulról becsülhetı. A módszer legagyobb elıye elletétbe a Berste egyelıtleség segítségével törtéı mtaagyság meghatározással, hogy cs szükség elızetes formácóra [Pl.: a szórás smeretére] az alkalmazásához. Készült Hoeffdg [1963] alapjá 3
.3. Átlagbecslése alapuló megközelítés.3.1. Átlagbecslés A magyar és külföld statsztka szakrodalom bıvelkedk az átlagbecslést részletese tárgyaló fejezetekbe, amelyek smertetése természetese em képez jele taulmáy célját. Az átlagbecslés meetét azoba bemutatom a mtaagyság meghatározásáak köyebb megértése érdekébe. Az átlagbecslés célja, hogy a mtabel átlagból [ x ] következtetéseket lehesse levo az alapsokaságra voatkozóa, mközbe a mta és az alapsokaság agyságát smertek tektjük. A módszer egy képlet segítségével határozza aak az tervallumak [kofdeca tervallum], az alsó [c a ] és felsı [c f ] határát, amelyek egy általuk választott megbízhatóság szt mellett közre fogják az alapsokaság paramétert. c = x ± z s vsk [7. képlet] a, f π x A kofdeca tervallum alsó és felsı határáak mtabel átlagtól [ x ] vett távolságát egy háromtagú szorzat eredméye adja. A szorzat elsı téyezıje z π, amelyek értéke az általuk választott megbízhatóság szt függvéyébe változk. A legevezetesebb megbízhatóság szthez, π=95% tartozó érték z π =1,96. A külöbözı megbízhatóság sztekhez tartozó z π értékeket a Mcrosoft Excel táblázatkezelı segítségével lehet a legköyebbe meghatároz. A következı függvéy pllaatok alatt kszámolja a szükséges értékeket. z = verz.storm ((1+ π)/) [8. képlet] π Az átlagbecslés képletébe szereplı szorzat másodk téyezıje s x, amely az alapsokaság átlag becslıfüggvéyéek szórása, más éve stadard hba. Értéke kzárólag a mtaelemszámtól és a korrgált tapasztalat szórástól [s] függ, meghatározására a következı képlet szolgál. s s x = [9. képlet] 4
Az átlagbecslés képletét lletıe egy téyezırıl még em esett szó, a véges sokaság korrekcós téyezırıl [vsk], amelyet abba az esetbe kell alkalmaz, amkor az alapsokaság véges számú elembıl áll. A marketgkutatás gyakorlatába többségbe vaak azok a kutatások, amelyek véges alapsokasággal dolgozak, tehát e feledkezzük meg a korrekcó haszálatáról. Igazá agy hbát persze csak akkor követük el az elhayagolásával, ha a mta és az alapsokaság háyadosa [kválasztás aráy] meghaladja a 0,1-et. vsk = 1 [10. képlet] N A mtaagyság meghatározásáak köyebb megértése érdekébe fel kell eleveíteük még egy fogalmat, a potosság sztet. A statsztka rodalom a kofdeca tervallum alsó és felsı határát kjelölı értéket evez a potosság sztek [ ]. A marketgkutatással foglalkozó szakköyvekbe sokszor találkozhatuk a mtavétel hba elevezéssel, amely tartalmlag megegyezk a potosság szt kfejezéssel. s = z 1 [11. képlet] N π.3.. A mtaagyság átlagbecslése alapuló meghatározása Az átlagbecsléssel kapcsolatos legfotosabb smeretek agyléptékő áttektése utá következze a mtaagyság meghatározásáak smertetése. Melıtt azoba a kokrét összefüggések bemutatására rátérék, meg kell külöböztet két alapesetet. Az egyk a végtele a másk pedg a véges alapsokaság eseté törtéı mtaagyság meghatározás..3..1. Végtele alapsokaság eseté Ha a mtaagyságot végtele alapsokaság eseté kívájuk meghatároz, akkor mdössze két paramétert kell rögzíteük: megbízhatóság szt, potosság szt. 5
A feladat tehát az, hogy határozzuk meg azt a mtaagyságot, amely eleget tesz az elıbb paraméterek elıre rögzített értékeek. A kérdést természetese úgys megfogalmazhattuk vola, hogy mlye mtaagyság mellett lesz a potosság szt egy elıre rögzített érték. A mtaagyság meghatározása eze a poto kapcsolódk az átlagbecsléshez, hsze ha kfejezzük a potosság szt képletébıl a mtaelemszámot [végtele alapsokaság lévé szó természetese eltektve a vsk-tól], már választ s kaptuk a kérdésükre. ~ zπ s = [1. képlet] A képletbe törtéı behelyettesítéshez valamey paraméter adott, kvéve a korrgált tapasztalat szórás égyzete. Ez az formácó a mtaagyság meghatározásakor, vagys a kutatás tervezés fázsába ylvávalóa em áll redelkezésre, legfeljebb becslésre hagyatkozhatuk..3... Véges alapsokaság eseté A mtaagyság meghatározásáak ebbe a potba még cs vége, ameybe em végtele, haem véges az alapsokaságot képezı elemek száma. A megbízhatóság és potosság szt mellett rögzíte kell az alább paraméter értékét: az alapsokaság elemszáma. Ezt követıe írjuk fel a következı összefüggést, amely felhaszálja a végtele alapsokaság eseté meghatározott mtaagyságot, vagys korrgálja azt véges alapsokaság esetre. Akkor jutuk erre a megoldásra, ha a potosság szt képletébıl [beleértve a vsk-t] kfejezzük a mtaelemszámot. ~ = ~ [13. képlet] 1 + N Ahogy azt korábba már említettem, a marketgkutatás gyakorlatába többségébe véges alapsokasággal találkozhatuk, ezért az elıbbekbe leírtakat tartsuk szem elıtt a mtavétel terv készítéséek folyamatába. 6
.4. Aráybecslése alapuló megközelítés.4.1. Aráybecslés A statsztka szakrodalom az aráybecslést részletese tárgyaló fejezetekbe szté bıvelkedk, amelyek smertetése természetese em képez jele taulmáy célját. Az aráybecslés meetét azoba ugyacsak bemutatom a mtaagyság meghatározásáak köyebb megértése érdekébe. Az aráybecslés célja, hogy a mtabel aráyból [p] következtetéseket lehesse levo az alapsokaságra voatkozóa, mközbe a mta és az alapsokaság agyságát smertek tektjük. A módszer egy képlet segítségével határozza meg a kofdeca tervallum alsó [ca] és felsı [cf] határát, amelyek egy általuk választott megbízhatóság szt mellett közre fogják az alapsokaság paramétert [P]. c = p ± z s vsk [14. képlet] a, f π p A kofdeca tervallum alsó és felsı határáak mtabel aráytól [p] vett távolságát szté egy háromtagú szorzat eredméye adja. A szorzat elsı téyezıje z π, amelyek értéke az általuk választott megbízhatóság szt függvéyébe változk. A külöbözı megbízhatóság sztekhez tartozó z π értékeket a Mcrosoft Excel táblázatkezelı segítségével lehet a legköyebbe meghatároz. A korábba smertetett függvéy pllaatok alatt kszámolja a szükséges értékeket. z = verz.storm ((1+ π)/) [15. képlet] π Az aráybecslés képletébe szereplı szorzat másodk téyezıje s p, amely az alapsokaság aráy becslıfüggvéyéek szórása, más éve stadard hba. Értéke kzárólag a mtaelemszámtól és a mtabel aráytól függ, meghatározására a következı képlet szolgál. s p p (1 p) = [16. képlet] Az aráybecslés képletét lletıe egy téyezırıl még em esett szó, a véges sokaság korrekcós téyezırıl [vsk], amelyet abba az esetbe kell alkalmaz, amkor az alapsokaság véges számú elembıl áll. A 7
marketgkutatás gyakorlatába többségbe vaak azok a kutatások, amelyek véges alapsokasággal dolgozak, tehát e feledkezzük meg a korrekcó haszálatáról. Igazá agy hbát persze csak akkor követük el a mellızésével, ha a kválasztás aráy meghaladja a 10%-ot. vsk = 1 [17. képlet] N A mtaagyság meghatározásáak köyebb megértése érdekébe újra kell értelmezük egy fogalmat, a potosság sztet. A statsztka rodalom a kofdeca tervallum alsó és felsı határát kjelölı értéket evez a potosság sztek [ ]. A marketgkutatással foglalkozó szakköyvekbe sokszor találkozhatuk a mtavétel hba elevezéssel, amely tartalmlag az aráybecslés eseté s megegyezk a potosság szt kfejezéssel. p (1 p) = z 1 [18. képlet] N π Példa aráybecslésre Tételezzük fel, hogy egy formatka eszközöket gyártó és forgalmazó cég meedzsmetje termékfejlesztés dötés elıtt áll és arra az formácóra va szüksége, hogy Magyarországo háya smerk a GPS-t [Global Postog System], azaz a Globáls Helymeghatározó Redszert. Mvel szekuder forrásból ez az adat em áll redelkezésre, ezért megbízzák az egyk packutató céget egy olya országos prmer kutatás leboyolítására, amely választ ad többek között a fet kérdésre s. Egy hóappal késıbb a packutató cég a következı adatokat szolgáltatja a megbízóak: Az alapsokaság elemszáma, N=10 000 000 A mta elemszáma, =1 000 A GPS-t smerık aráya a mtába, p=33% Az aráybecsléssel kapcsolatos alapvetı tudvalókat felhaszálva, végezzük el a számítást a szóba forgó példafeladat fktív értékevel. 0,33 (1 0,33) 1000 a, = 0,33 ± 1,96 1 = 0,33 ± 0,091 1000 10000000 c f 8
A számítás eredméyét lletıe elmodhatjuk, hogy 95%-os megbízhatóság szt mellett a magyar lakosság körébe 30,09% és 35,91% között va a GPS-t smerık aráya. Továbbá azt s kjelethetjük, hogy a becslésük ±,91 százalékpot potosságú, amely jóval a statsztkába elfogadott potosság szte [±5,00 százalékpot] belül va..4.. A mtaagyság aráybecslése alapuló meghatározása Az aráybecsléssel kapcsolatos legfotosabb smeretek agyléptékő áttektése utá következze a mtaagyság meghatározásáak smertetése. Melıtt azoba a kokrét összefüggések bemutatására rátérék, meg kell külöböztet két alapesetet. Az egyk a végtele a másk pedg a véges alapsokaság eseté törtéı mtaagyság meghatározás..4..1. Végtele alapsokaság eseté Ha a mtaagyságot végtele alapsokaság eseté kívájuk meghatároz, akkor mdössze két paramétert kell rögzíteük: Megbízhatóság szt. Potosság szt. A feladat tehát az, hogy határozzuk meg azt a mtaagyságot, amely eleget tesz az elıbb paraméterek elıre rögzített értékeek. A kérdést természetese úgys megfogalmazhattuk vola, hogy mlye mtaagyság mellett lesz a potosság szt egy elıre rögzített érték. A mtaagyság meghatározása eze a poto kapcsolódk az aráybecsléshez, hsze ha kfejezzük a potosság szt képletébıl a mtaelemszámot [végtele alapsokaság lévé szó természetese eltektve a vsk-tól], már választ s kaptuk a kérdésükre. ~ zπ p (1 p) = [19. képlet] A képletbe törtéı behelyettesítéshez valamey paraméter adott, kvéve a mtabel aráy. Ez az formácó a mtaagyság meghatározásakor, vagys a kutatás tervezés fázsába ylvávalóa em áll redelkezésre. Értékét úgy kell megválaszta, hogy azt a mtaelemszámot adja eredméyül, amely mellett egy tetszıleges aráy tervallumbecslése legfeljebb az elıre rögzített potosság 9
sztet eredméyez. Más szóval, keressük azt a mtabel aráyt, amely mellett a mtaelemszám maxmáls. A részfeladat megoldásához a függvéyta smeretekre kell támaszkoduk, ahoa tudjuk, hogy az f ( p) = p (1 p) függvéy maxmuma ott va, ahol az elsıredő dervált f ( p) = 0, a másodredő dervált pedg f ( p) < 0. A számítások elvégzése utá p = 0,5 eredméyt kell, hogy kapjuk. A mtabel aráy megfejtése utá az alábbak szert egyszerősíthetjük a végtele alapsokaság eseté alkalmazott mtaelem számítás képletet. ~ 0,5 zπ = [0. képlet] Példa mtaagyság meghatározására végtele alapsokaság eseté A következıkbe határozzuk meg azt a mtaagyságot, amely eleget tesz a megbízhatóság és a potosság szt legkább elfogadott értékeek. Megbízhatóság szt, π=95% Potosság szt, =±5,00 százalékpot Ameybe a példába meghatározott értékeket behelyettesítjük a 0. képletbe, akkor megkapjuk a keresett mtaelemszámot. 0,5 1,96 ~ = 0,05 = 384,15 384 Véletle alapsokaságot feltételezve, 95%-os megbízhatóság és ±5,00 százalékpotos potosság szte 384 elemő mtát kell ve. Más szavakkal, ha veszük egy 384 elemő mtát, akkor 95%-os megbízhatóság szt mellett legfeljebb ±5,00 százalékpot lesz a hozzá tartozó potosság szt, vagys a mtavétel hba..4... Véges alapsokaság eseté A mtaagyság meghatározásáak ebbe a potba még cs vége, ameybe em végtele, haem véges az alapsokaságot képezı 10
elemek száma. A megbízhatóság és potosság szt mellett rögzíte kell az alább paraméter értékét: Az alapsokaság elemszáma. Ezt követıe írjuk fel a következı összefüggést, amely felhaszálja a végtele alapsokaság eseté meghatározott mtaagyságot, vagys korrgálja azt véges alapsokaság esetre. Akkor jutuk erre a megoldásra, ha a potosság szt képletébıl [beleértve a vsk-t] kfejezzük a mtaelemszámot. ~ = ~ [1. képlet] 1 + N Ahogy azt korábba már említettem, a marketgkutatás gyakorlatába többségébe véges alapsokasággal találkozhatuk, ezért az elıbbekbe leírtakat tartsuk szem elıtt a mtavétel terv készítéséek folyamatába. Példa mtaagyság meghatározására véges alapsokaság eseté Határozzuk meg a mtaelemszámot változatla megbízhatóság és potosság szt, és a következı alapsokaság méret mellett. Az alapsokaság elemszáma, N=10 000 000 A példafeladat megoldásáak egyetle lépése a végtele alapsokaság eseté számított mtaelemszámak és az alapsokaság elemszámáak behelyettesítése a 1. képletbe. 384,15 = 384,15 1 + 10000000 = 384,13 384 Véges alapsokaság eseté, 95%-os megbízhatóság és 5,00 százalékpotos potosság szt mellett továbbra s 384 elemő mtát kell ve. Az eredméy csak századokba külöbözk a végtele alapsokaság eseté számított mtaelemszámtól, hsze a kválasztás aráy [0,0000384] agyságredekkel elmarad attól az értéktıl [0,1], amely jeletıs külöbségeket eredméyez a végtele és a véges alapsokaság eseté meghatározott mtaagyságok között. Ettıl függetleül a statsztka egzaktság megkövetel a potos számítást, 11
külööse akkor, amkor a mtaelemszámot tovább számításokhoz haszáljuk fel, lye esetekbe még a kerekítés sem megegedett. A mtaagyság meghatározásával kapcsolatos elmélet és gyakorlat tudvalók zárásakét elkészítettem egy táblázatot, amely külöbözı megbízhatóság [90,0-99,0 százalék] és potosság sztek [±1,00-10,00 százalékpot] függvéyébe tartalmazza a mtaelemszámokat végtele alapsokaságot feltételezve. Mtaagyság megbízhatóság és potosság szt függvéyébe Potosság szt [százalékpot] Megbízhatóság szt [%] 90,0 91,0 9,0 93,0 94,0 95,0 96,0 97,0 98,0 99,0 ±1,00 6 764 7 186 7 66 8 08 8 843 9 604 10 545 11 773 13 530 16 587 ±,00 1 691 1 796 1 916 05 11 401 636 943 3 38 4 147 ±3,00 75 798 851 91 983 1067 1 17 1 308 1 503 1 843 ±4,00 43 449 479 513 553 600 659 736 846 1 037 ±5,00 71 87 306 38 354 384 4 471 541 663 ±6,00 188 00 13 8 46 67 93 37 376 461 ±7,00 138 147 156 168 180 196 15 40 76 339 ±8,00 106 11 10 18 138 150 165 184 11 59 ±9,00 84 89 95 101 109 119 130 145 167 05 ±10,00 68 7 77 8 88 96 105 118 135 166 1. táblázat: Mtaagyság megbízhatóság és potosság szt függvéyébe A megbízhatóság szt oszlopáak és a potosság szt soráak metszete adja azt a mtaelemszámot, amelyet az alapsokaság agyságáak smeretébe behelyettesítve a. képletbe megkapjuk a keresett mtaelemszámot véges alapsokaság eseté. 1
3. A MINTANAGYSÁG MEGHATÁROZÁSA RÉTEGZETT [R] MINTA ESETÉN A rétegzett [R] mtavétel a véletle mtavétel eljárások közé tartozó kétlépcsıs folyamat, amely sorá elıször a sokaságot osztjuk részsokaságokra, azaz rétegekre. A rétegekek egymást kölcsööse kzáróak és együttese teljesek kell lee, amelybe mde sokaság elemet be lehet sorol egy, és csaks egy rétegbe, ugyaakkor egyetle elem sem marad k. Ezt követıe mde egyes rétegbıl egyszerő véletle [EV] mtavétel segítségével részmtákat veszük, amelyek együttese alkotják a teljes mtát. Azokat a változókat, amelyek segítségével az alapsokaságot egymást kölcsööse kzáró részekre osztjuk rétegképzı smérvekek evezzük. A rétegképzı smérveket úgy kell megválaszta, hogy a rétegeke belül az elemekek homogéek, a sokaságo belül a rétegek pedg heterogéek legyeek. A legelterjedtebb rétegképzı smérvek lakosság [BC] kutatások eseté a demográfa változók [pl.: földrajz terület, em, életkor], üzlet [BB] kutatások eseté pedg az általáos cégadatok [pl.: földrajz terület, létszám, árbevétel]. 3.1. Dvzív rétegzés [DVR] A rétegzett mtavétel gyakorlat kérdése a részmták és az általuk együttese alkotott teljes mta agyságáak meghatározása. Ha smertek feltételezzük a teljes mta elemszámát, akkor több megoldása létezk a mta rétegek között elosztás tervéek. Nevezzük ezeket a módszereket összefoglalóa az osztályozás eljárások aalógájára felosztó [dvzív] rétegzések. A dvzív rétegzés meetét a következı 6 lépés alkotja: 1. defáljuk a teljes sokaságot,. válasszuk k a rétegképzı smérveket és alakítsuk k a részsokaságokat, 3. rögzítsük a teljes mta megbízhatóság és potosság sztjét, 4. határozzuk meg a teljes mta agyságát, 5. válasszuk k az elosztás tervet, 6. a teljes mta felosztása megadja a részmták elemszámát. 13
3.1.1. Egyeletes elosztás [DVR-ER] Az egyeletes elosztás esetébe úgy jutuk a részmták elemszámához, hogy a teljes mta elemszámát vszoyítjuk a rétegek tervezett számához, azaz mde egyes rétegbıl azoos agyságú mtát veszük. = [. képlet] m Az egyeletes elosztás egyszerő, em géyel komolyabb tervezésszervezés elıkészítést, kéyelmese végrehajtható, és bzoyos feltételek mellett az egyes rétegek mtavétel hbáak összege mmáls. Ha kívácsak vagyuk az egyes rétegek statsztka mutatóra elfogadható megbízhatóság és potosság szt mellett, akkor az egyeletes elosztás jó megoldásak tekthetı. Az egyeletes rétegzéssel kapcsolatos tudvalók áttektése utá egy fktív példá keresztül mutatom be a módszer gyakorlat alkalmazását. Egy haza agyvállalat elégedettség kutatást kívá végez jeleleg ügyfélkörébe, ahol három [egymást kölcsööse kzáró és együtt teljes] szegmest külöböztet meg. Az 1. szegmesbe N 1 =1 000, a. szegmesbe N = 000, a 3. szegmesbe pedg N 3 =6 000 ügyfél tartozk. Mutá defáltuk a teljes sokaságot, kválasztottuk egy rétegképzı smérvet és kalakítottuk a részsokaságokat, rögzítsük a teljes mta megbízhatóság sztjét π=95%-ba, a potosság sztjét pedg =±5,00 százalékpotba. Néháy egyszerő számítás elvégzése utá tudjuk, hogy =369 elemő mtát kell veük a teljes sokaságból. A felosztó [dvzív] rétegzés következı lépésébe a teljes mtát részmtákra osztjuk fel az egyeletes elosztás szabályaak megfelelıe. A felosztás eredméyét az alább. táblázatba foglaltam össze. Egyeletes rétegzés [DVR-ER] Sokaság Mta [N] [%] [] [%] Réteg1 1 000 11 13 33 Réteg 000 13 33 Réteg3 6 000 67 13 33 Összese 9 000 100 369 100. táblázat: Egyeletes rétegzés [DVR-ER] 14
Az egyeletes elosztásak megfelelıe valamey rétegbıl j =13 elemő mtát kell veük, am egyúttal azt s jelet, hogy jeletıse torzultak a mta belsı aráya, ezért reprezetatívak utólagos súlyozás élkül semm esetre sem evezhetı ez az elosztás terv. A rétegek potosság sztje π=95%-os megbízhatóság szt mellett közel azoos [ 1=±8,7, = ±8,7, és 3= ±8,7] értéket vesz fel. Mdez azt jelet, hogy az egyes rétegek statsztka mutató, ha em s elfogadható, de agyságredleg megegyezı potossággal becsülhetık. 3.1.. Aráyos elosztás [DVR-AR] Az aráyos elosztás léyege az, hogy a részmták úgy aráylaak a teljes mtához, mt a részsokaságok a teljes sokasághoz. Eek megfelelıe egy agyobb rétegbıl agyobb mtát veszük. N = [3. képlet] N Az aráyos elosztás szté egyszerő, elıkészítése em géyel komolyabb erıfeszítést, köye végrehajtható, és a mtába ugyaazok az aráyok érvéyesülek, mt a sokaságba. A mta a rétegképzı smérvre ézve reprezetatívak tekthetı, ezért ösúlyozó mtáak s evezk. Az aráyos rétegzés gyakorlat alkalmazását az összehasolíthatóság kedvéért a korábba smertetett példá keresztül mutatom be. Aráyos rétegzés [DVR-AR] Sokaság Mta [N] [%] [] [%] Réteg1 1 000 11 41 11 Réteg 000 8 Réteg3 6 000 67 46 67 Összese 9 000 100 369 100 3. táblázat: Aráyos rétegzés [DVR-AR] Az aráyos rétegzés értelmébe a részmták [ 1 =41, =8, és 3 =46] úgy aráylaak a teljes mtához, mt a részsokaságok a teljes sokasághoz, Ncs szükség utólagos súlyozásra, a mta reprezetatívak tekthetı a rétegképzı smérv szert. Az egyes 15
rétegek potosság sztje [ 1=±14,99, = ±10,66, és 3= ±6,1] változatla megbízhatóság szt π=95% mellett egy kvételével tovább romlott, amek következtébe a statsztka mutatók becslése széles tervallumokat, vagys agy potatlaságot eredméyez. 3.1.3. Neyma-féle optmáls elosztás [DVR-NOR] A Neyma-féle optmáls elosztás esetébe a részmták elemszáma em csak a részsokaság aráyától, haem aak elıre smert vagy legalább becsült szórásától [σ ] s függ. Nagyobb szóródású rétegekbıl agyobb, ksebb szóródásúakból ksebb mtát veszük feltéve, hogy a részsokaságok egyforma agyságúak. N σ = [4. képlet] m N σ = 1 Az elosztás elıyös tulajdosága, hogy a fıátlagot lye mtából számítva mmáls mtavétel hbához jutuk, végrehajtása azoba em egyszerő, hsze ehéz megbízható formácókat yer a rétegekét szórásokra. Ezért ez az elosztás a kzárólag az elmélet számára fotos. Azoos rétegekét szórások eseté a Neyma-féle optmáls elosztás megegyezk az aráyos elosztással. Neyma-féle optmáls rétegzés [DVR-NOR] Sokaság Mta [N] [%] [σ] [] [%] Réteg1 3 000 33 10 41 11% Réteg 3 000 33 0 8 % Réteg3 3 000 33 60 46 67% Összese 9 000 100 30 369 100% 4. táblázat: Neyma-féle optmáls rétegzés [DVR-NOR] A Neyma-féle optmáls elosztás esetébe a részmták elemszáma [ 1 =41, =8, és 3 =46] egyeese aráyos a rétegek elıre smert szórásával, feltéve, hogy a rétegek agyságába cs külöbség. Ebbıl kfolyólag a mta belsı aráya jeletıse torzulak az alapsokaság belsı aráyahoz képest, vagys a mta em tekthetı reprezetatívak a rétegképzı smérv szert. A részmták potosság 16
sztje [ 1=±15,0, =±10,67, és 3=±5,99] az elfogadható megbízhatóság szt π=95% mellett az aráyos elosztáshoz hasolóa alakul, vagys a statsztka mutatók becslése széles tervallumokat, vagys agy potatlaságot eredméyez. 3.1.4. Költségoptmáls elosztás [DVR-KOR] A Neyma-féle optmáls elosztás továbbfejlesztett változata a költségoptmáls elosztás, amely a rétegek agysága és szórása mellett a részsokaságok megfgyelés egységköltséget [π ] s fgyelembe vesz. A mtavétel teljes költsége [C] az alább képlet segítségével kalkulálható. m C = π [5. képlet] = 1 Rögzített költségkeret eseté a fıátlag mtavétel hbáját mmalzáló elosztás a következı formulába törtéı helyettesítéssel kapható meg. π = [6. képlet] m N σ N = 1 σ π A részsokaságok egyforma agysága és szórása eseté abból a rétegbıl vesszük a agyobb mtát, amél ksebb a megfgyelés egységköltség. Azoos egységköltségek eseté a költség optmáls elosztás megegyezk a Neyma-féle optmáls elosztással és redelkezk aak elıyös és hátráyos tulajdoságaval. Költségoptmáls rétegzés [DVR-KOR] Sokaság Mta [N] [%] [σ] [π] [] [%] Réteg1 3 000 33 30 1 174 47 Réteg 3 000 33 30 13 33 Réteg3 3 000 33 30 6 71 19 Összese 9 000 100 30 3 369 100 5. táblázat: Költségoptmáls rétegzés [DVR-KOR] 17
A költségoptmáls elosztás esetébe a részmták elemszáma [ 1 =174, =13, és 3 =71] fordította aráyos a rétegek megfgyelés egységköltségével, feltéve, hogy a rétegek agyságába és elıre smert szórásába cs külöbség. Ebbıl kfolyólag a mta belsı aráya jeletıse torzulak az alapsokaság belsı aráyahoz képest, vagys a mta em tekthetı reprezetatívak a rétegképzı smérv szert. A részmták potosság sztje [ 1=±7,1, =±8,65, és 3=±11,49] az elfogadható megbízhatóság szt π=95% mellett az aráyos elosztáshoz hasolóa alakul, vagys a statsztka mutatók becslése széles tervallumokat, vagys agy potatlaságot eredméyez. Az smertek feltételezett teljes mta rétegek között elosztás terveek elmélet és gyakorlat aspektusból vett elıyös és hátráyos tulajdoságat az alább táblázat tartalmazza. Az elosztás tervek elıye és hátráya Egyeletes Aráyos Neyma-féle optmáls Költségoptmáls Elıye Egyszerő, köye végrehajtható; Alacsoy a rétegek mtavétel hbája Egyszerő, köye végrehajtható; Reprezetatív Fgyelembe vesz a rétegek szórását Fgyelembe vesz a rétegek megfgyelés egységköltségét 6. táblázat: Az elosztás tervek elıye és hátráya Hátráya Nem reprezetatív Magas a rétegek mtavétel hbája Boyolult, eheze végrehajtható Boyolult, eheze végrehajtható A gyakorlat számára a legfotosabb elosztások az egyeletes és az aráyos, amelyek egyszerőek, köye végrehajthatók és kedvezı statsztka tulajdoságokkal redelkezek. A Neyma-féle optmáls és a költség optmáls elosztások feltételezk a rétegekét szórás smeretét, amelyre a legrtkább esetbe áll redelkezésre, vagy érhetı el megbízható és potos formácó. 3.. Agglomeratív rétegzés [AVR] A részmták és az általuk együttese alkotott teljes mta elemszámáak meghatározása törtéhet összevoó [agglomeratív] rétegzéssel, amelyek az a léyege, hogy em a teljes mta agyságát rögzítjük elıre, haem a részmták agyságát. Mdezt aak érdekébe tesszük, hogy a rétegek ömagukba s elemezhetık legyeek elfogadható megbízhatóság és potosság szt mellett. Az agglomeratív rétegzés meetét a következı 5 lépés alkotja: 1. defáljuk a teljes sokaságot, 18
. válasszuk k a rétegképzı smérveket és alakítsuk k a részsokaságokat, 3. rögzítsük mde egyes részmta megbízhatóság és potosság sztjét, 4. határozzuk meg a részmták agyságát, 5. a részmták összevoása megadja a teljes mta elemszámát. Az agglomeratív rétegzés gyakorlat alkalmazását szté az elégedettség kutatás példájá keresztül mutatom be. Összevoó [agglomeratív] rétegzés Sokaság Mta [N] [%] [] [%] Réteg1 1 000 11 78 9 Réteg 000 3 34 Réteg3 6 000 67 360 38 Összese 9 000 100 960 100 7. táblázat: Összevoó [agglomeratív] rétegzés Az agglomeratív rétegzéssel meghatározott teljes mta belsı aráya a részmták elemszámaak következtébe [ 1 =78, =3, és 3 =360] jeletıse torzultak, vagys ez a rétegzés techka em tekthetı reprezetatívak, hacsak em végzük utólagos súlyozást. Az egyes rétegek potosság sztje π =95%-os megbízhatóság szt mellett azoba elfogadható értéket vesz fel [ j= ±5,00], akárcsak a teljes mta potosság sztje [ = ±,99]. Az agglomeratív rétegzéssel meghatározott teljes mta agysága felfogható az alább leárs programozás feladat em egatív megoldásáak, vagys keressük azt a legksebb mtaelemszámot, amelyre adott megbízhatóság szt, rétegekét elemszámok, és potosság sztek mellett gazak a következı összefüggések. m, ahol = m j j= 1, ~ =, és ~ 0,5 z j j 1+ N j j ~ j j π = [7. képlet] A dvzív és az agglomeratív rétegzés módok elıyös és hátráyos tulajdoságat a következı táblázat tartalmazza. A vzsgálat 19
szempotjat a mta agysága és költsége, valamt a teljes sokaság és a rétegek megbízhatóság és potosság sztje jeletették. Az rétegzés módok elıye és hátráya Felosztó [dvzív] rétegzés Összevoó [agglomeratív] rétegzés Elıye Elfogadható megbízhatóság és potosság szt a teljes sokaságra ézve; Ksebb mta s elegedı hozzá; Kevésbé költséges Kváló megbízhatóság és potosság szt a teljes sokaságra ézve; A rétegek általába ömagukba s elemezhetık 8. táblázat: Az rétegzés módok elıye és hátráya Hátráya A rétegek általába em elemezhetık ömagukba Nagyobb mta szükséges hozzá; Költségesebb Összefoglalva az eddgeket elmodható, hogy a dvzív rétegzés módokat akkor célszerő alkalmaz, amkor a kutatás költségvetés kerete relatíve ksebb [em több mt 400] mta vételét tesz lehetıvé, eze belül pedg az aráyos rétegzés bztosítja a mta súlyozás élkül reprezetatvtását. A dvzív rétegzést alkalmazva akkor jutuk ömagukba s elfogadható megbízhatóság és potosság szt mellett elemezhetı részmtákhoz, ha relatíve agyobb [mtegy 800-1 600] mta áll a redelkezésükre és az egyeletes rétegzést választjuk. Abba az esetbe, amkor kutatás költségvetés kerete agyobb mta választását s lehetıvé tesz, célszerő agglomeratív rétegzést alkalmaz. Ezzel az eljárással ömagukba s elemezhetı részmtákhoz jutuk, em beszélve a teljes mta kváló megbízhatóság és potosság sztjérıl. 0
4. CSOPORTOS [CS] MINTAVÉTEL 3 A mtavétel techkák harmadk módszere a csoportos mtavétel, amely sorá az alapsokaságot egymást kölcsööse kzáró, de együtt az alapsokaságot egészébe lefedı részsokaságokra, ú. csoportokra osztjuk. Ezt követıe a csoportok halmazából választuk egyszerő véletle [EV] mtát, majd az így kválasztott csoportokat teljes körőe megkérdezzük. A csoportos mtavételt olya esetekbe haszáluk, amkor a sokaság elemek teljes lstája em áll redelkezésre, de agyobb csoportokra redelkezésre áll a lsta és amkor a agyobb csoportok kocetráltságuk következtébe olcsóbba fgyelhetık meg, mt a hasoló számosságú, de em kocetrálta elıforduló sokaság elemek. A csoportos mtavétel meetét a következı lépések alkotják: 1. defáljuk a teljes sokaságot,. válasszuk k a csoportképzı smérvet és alakítsuk k a csoportokat, 3. rögzítsük a teljes mta megbízhatóság és potosság sztjét, 4. határozzuk meg a teljes mta agyságát, 5. egyszerő véletle mtavétellel vegyük mtát a csoportokból, 6. mde egyes kválasztott csoportot teljes körőe kérdezzük le. A csoportos mtavétel elıyet és hátráyat az alább táblázat tartalmazza. A csoportos mtavétel elıye és hátráya Csoportos mta Elıye Olcsóbb, ha em áll redelkezésre a sokaság elemek teljes lstája vagy ha kocetrálta fordulak elı; Köyő alkalmaz; Hatékoy, ha a csoportok heterogéek 9. táblázat: A csoportos mtavétel elıye és hátráya Hátráya Potatlaabb, korlátozott az eredméyek értelmezése; Nem hatékoy, ha a csoportok homogéek Összefoglalva a csoportos mtavétel legfotosabb tudvalót, elmodható, hogy egy olya techkára va szó, amely bzoyos feltételek teljesülése eseté [em áll redelkezésre a sokaság elemek mtavétel kerete, csak azok csoportjat smerjük, amelyekek ráadásul 3 A csoportos mtavétel techka agol megfelelıje a cluster samplg. 1
heterogéekek kell leük] olcsó, egyszerő és hatékoy terepmukát tesz lehetıvé. Ugyaakkor potatlaabb, mt az egyszerő véltetle mta, az eredméyek értelmezése korlátozott és em javasolt az alkalmazása, ameybe a csoportok homogéek. Összehasolítva a rétegzett és csoportos mtavétel techkákat, Huyad-Vta [00] szert a rétegzett mta eseté a rétege belül homogetás, míg a csoportos mta eseté a csoportoko belül heterogetás a kedvezı tulajdoság. A rétegzett mta azoos elemszám eseté az egyszerő véletle mtáál ksebb hbát eredméyez, általába agyobb költséggel, míg a csoportos mta agyobb hbához vezet, ksebb költséggel.
5. TÖBBLÉPCSİS [TL] MINTAVÉTEL 4 A mtavétel techkák egyedk módszere a két- vagy többlépcsıs mtavétel, amely sorá az alapsokaságot egymást kölcsööse kzáró, de együtt az alapsokaságot egészébe lefedı részsokaságokra, ú. csoportokra osztjuk. Ezt követıe a csoportok halmazából választuk egyszerő véletle [EV] mtát, majd az így kválasztott csoportok elemebıl s többyre egyszerő véletle [EV] mtát veszük [kétlépcsıs] vagy a csoportokat tovább alcsoportokra osztjuk és az alcsoportok halmazából választuk egyszerő véletle mtát ezt a lépést többször megsmételhetjük majd az így kválasztott alcsoportok elemebıl s többyre egyszerő véletle mtát veszük [többlépcsıs]. A többlépcsıs mtavételt hasoló esetekbe haszáljuk, mt a csoportos mtavételt [a csoportos mtavételt szokták egylépcsısek s evez], a külöbség mdössze ay, hogy a többlépcsıs mtavétel esetébe több lépésbe jutuk el a sokaság elemekhez. A két- vagy többlépcsıs mtavétel meetét a következı lépések alkotják: 1. defáljuk a teljes sokaságot,. válasszuk k a csoportképzı smérvet és alakítsuk k a csoportokat, 3. rögzítsük a teljes mta megbízhatóság és potosság sztjét, 4. határozzuk meg a teljes mta agyságát, 5. egyszerő véletle mtavétellel vegyük mtát a csoportokból, 6. mde egyes kválasztott csoport elemebıl válasszuk egyszerő véletle mtát [kétlépcsıs]. 7. válasszuk az alcsoportképzı smérveket és alakítsuk k az alcsoportokat, 8. egyszerő véletle mtavétellel vegyük mtát az alcsoportokból, 9. smételjük a 7. és a 8. lépést egésze addg, amíg el em jutuk a sokaság elemekhez, 10. mde egyes kválasztott alcsoport elemebıl válasszuk egyszerő véletle mtát [többlépcsıs]. 4 A többlépcsıs mtavétel techka agol megfelelıje a mult-stage samplg. 3
A többlépcsıs mtavétel elıyet és hátráyat az alább táblázat tartalmazza. A többlépcsıs mtavétel elıye és hátráya Többlépcsıs mta Elıye Olcsóbb, ha em áll redelkezésre a sokaság elemek teljes lstája vagy ha kocetrálta fordulak elı; Akkor s hatékoy, ha a csoportok homogéek 10. táblázat: A többlépcsıs mtavétel elıye és hátráya Hátráya Potatlaabb, korlátozott az eredméyek értelmezése; Nehéz alkalmaz Összefoglalva a többlépcsıs mtavétel legfotosabb tudvalót, elmodható, hogy egy olya techkára va szó, amely bzoyos feltételek teljesülése eseté [em áll redelkezésre a sokaság elemek mtavétel kerete, csak azok csoportjat smerjük] olcsó és hatékoy terepmukát tesz lehetıvé. Ugyaakkor potatlaabb, mt az egyszerő véltetle mta, az eredméyek értelmezése korlátozott és léyegese boyolultabb a végrehajtása. Összehasolítva a csoportos és a többlépcsıs mtavétel techkákat megállapítható, hogy mdkét módszer megfelelı választás, ameybe em áll redelkezésre a sokaság elemek mtavétel kerete, de potatla eredméyeket adak, amelyek értelmezése korlátokba ütközk. A csoportos mta akkor célravezetı, ha az elsı lépésbe kalakított csoportok heterogéek és ezért egyszerő az alkalmazása elletétbe a többlépcsıs mtavétellel, amely végrehajtása boyolult, de akkor s alkalmazható, ameybe a kduló csoportok homogéek. 4
IRODALOMJEGYZÉK [1] BERCZINÉ J. J. [1996]: Packutatás a gyakorlatba, Co-ex Trag, Budapest [] BERECZKINÉ F. E. HAVRILÓ A. MARIEN A, - MOLNÁR L. PISKÓTI I. SCHUPLER H. [007]: Marketgkutatás a levélposta szolgáltatásról, Mskolc [3] BERNÁTH A. JUHÁSZ A. MOLNÁR L. SZIVÓS J. [007]: Packutatás a hulladékkezelés közszolgáltatásról, Mskolc [4] BERNSTEIN, N. S. [1946]: Theory of Probabltes [5] FREEDMAN, D. PISANI, R. PURVES, R. [005]: Statsztka Statsztka módszerek a társadalomkutatásba, Typotex Kadó, Budapest [6] HOEFFDING, W. [1963]: Probablty Iequaltes for Sums of Bouded Radom Varables, Joural of the Amerca Statstcal Assocato, Alexadra [7] HUNYADI L. MUNDRUCZÓ GY. VITA L. [1997]: Statsztka, Aula Kadó, Budapest [8] HUNYADI L. VITA L. [00]: Statsztka közgazdászokak, Közpot Statsztka Hvatal, Budapest [9] KERÉKGYÁRTÓ GY.-NÉ MUNDRUCZÓ GY. SUGÁR A. [001]: Statsztka módszerek és alkalmazásuk a gazdaság, üzlet elemzésekbe, Aula Kadó, Budapest [10] KETSKEMÉTY L. IZSÓ L. [005]: Bevezetés az SPSS programredszerbe, ELTE Eötvös Kadó, Budapest [11] KORPÁS A. [1996]: Általáos statsztka I-II., Nemzet Taköyvkadó, Budapest [1] KOTLER, P. [00]: Marketg meedzsmet, KJK-KERSZÖV Jog és Üzlet Kadó, Budapest [13] KÖVES P. PÁRNICZKY G. [1975]: Általáos statsztka. Közgazdaság és Jog Köyvkadó, Budapest. [14] LEHOTA J. [001]: Marketgkutatás az agrárgazdaságba, Mezıgazda Kadó, Budapest [15] LUKÁCS O. [00]: Matematka statsztka. Mőszak Köyvkadó, Budapest. [16] MALHOTRA, N. K. [00]: Marketgkutatás, KJK-KERSZÖV Jog és Üzlet Kadó, Budapest [17] MOLNÁR L. [007]: A dvzív és agglomeratív rétegzés elmélete és gyakorlata, mcrocad 007 Iteratoal Scetfc Coferece, Koferecakadváy, Mskolc [18] MOLNÁR L. [006]: Az optmáls mtaagyság a kapcsolódó költségek és bevételek relácójába, Koferecakadváy, Mskolc [19] SÁNDORNÉ SZ. J. [1989]: A packutatás elmélete és módszertaa, Taköyvkadó, Budapest [0] SÁNDORNÉ SZ. J. [1978]: A packutatás kézköyve, Közgazdaság és Jog Köyvkadó, Budapest [1] SCIPIONE, P. A. [1994]: Packutatás, Sprger Verlag, Budapest [] SZABÓ L. [001]: A vállalat packutatás gyakorlata, Perfekt Kadó, Budapest [3] VERES Z. HOFFMANN M. KOZÁK Á. [006]: Bevezetés a packutatásba, Akadéma Kadó, Budapest, Budapest [4] VERES Z. [005]: Szolgáltatásmarketg, KJK-KERSZÖV Kadó, Budapest 5