A válaszadó-vezérelt mintavétel megbízhatóságának vizsgálata szimulációs módszerekkel 1



Hasonló dokumentumok
Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

BIOMATEMATIKA ELŐADÁS

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Statisztika 1. zárthelyi dolgozat március 21.

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

Statisztikai hipotézisvizsgálatok

A matematikai statisztika elemei

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Rudas Tamás: A hibahatár a becsült mennyiség függvényében a mért pártpreferenciák téves értelmezésének egyik forrása

Az új építőipari termelőiár-index részletes módszertani leírása

I. Függelék. A valószínűségszámítás alapjai. I.1. Alapfogalamak: A valószínűség fogalma: I.2. Valószínűségi változó.

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Az iparosodás és az infrastrukturális fejlődés típusai

Matematikai statisztika

A brexit-szavazás és a nagy számok törvénye

Cserjésné Sutyák Ágnes *, Szilágyiné Biró Andrea ** ismerete mellett több kísérleti és empirikus képletet fel-

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk;

VÉLETLENÍTETT ALGORITMUSOK. 1.ea.

A figurális számokról (IV.)

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

Statisztika 1. zárthelyi dolgozat március 18.

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

Kutatói pályára felkészítı modul

NUMERIKUS SOROK II. Ebben a részben kizárólag a konvergencia vizsgálatával foglalkozunk.

Statisztika. Eloszlásjellemzők

IKT eszközök használata az oktatásban

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

1. A radioaktivitás statisztikus jellege

KÍSÉRLETTERVEZÉS ÉS ÉRTÉKELÉS A MIKROBIOLÓGIAI GYAKORLATBAN

Módszertani kísérlet az életpálya fogalmának formalizálására Előtanulmány a fiatal biológusok életpályakutatását célzó támogatott projekthez

AZ ÖSSZETÉTEL OPTIMALIZÁLÁSA A VOLUMETRIKUS ASZFALTKEVERÉK- ELLENÕRZÉS MÓDSZERÉVEL

Területi koncentráció és bolyongás Lengyel Imre publikációs tevékenységében

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

3.1. A Poisson-eloszlás

A statisztika részei. Példa:

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

Feladatok és megoldások a 11. heti gyakorlathoz

kritikus érték(ek) (critical value).

Kidolgozott feladatok a nemparaméteres statisztika témaköréből

kismintás esetekben vagy olyanokban, melyeknél a tanulóalgoritmust tesztadatokon szeretnénk

Villamos gépek tantárgy tételei

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

ezek alapján kívánunk dönteni. Ez formálisan azt jelenti, hogy ellenőrizni akarjuk,

Rádiókommunikációs hálózatok

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

Hiba! Nincs ilyen stílusú szöveg a dokumentumban.-86. ábra: A példa-feladat kódolási változatai

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya

VII. A határozatlan esetek kiküszöbölése

1. ALGORITMUSOK MŰVELETIGÉNYE

A FUNDAMENTÁLIS EGYENLET KÉT REPREZENTÁCIÓBAN. A függvény teljes differenciálja, a differenciális fundamentális egyenlet: U V S U + dn 1

EGYENLETEK ÉS EGYENLETRENDSZEREK MEGOLDÁSA A Z n HALMAZON. egyenletrendszer megoldása a

Matematika B4 I. gyakorlat

Reálbérek és kereseti egyenlõtlenségek,

MÉRÉSMETODIKAI ALAPISMERETEK FIZIKA. kétszintű érettségire felkészítő. tanfolyamhoz

? közgazdasági statisztika

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő.

Elektrokémiai fémleválasztás. Felületi érdesség: definíciók, mérési módszerek és érdesség-változás a fémleválasztás során

6. Elsőbbségi (prioritásos) sor

A paramétereket kísérletileg meghatározott yi értékekre támaszkodva becsülik. Ha n darab kisérletet (megfigyelést, mérést) végeznek, n darab

VII.Valószínűségszámítási, statisztikai, gráfelméleti alapfogalmak

Lineáris regresszió vizsgálata resampling eljárással

Kalkulus II., második házi feladat

Méréstani összefoglaló

Populáció nagyságának felmérése, becslése

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.

Elsőbbségi (prioritásos) sor

7. el adás Becslések és minta elemszámok fejezet Áttekintés

Tartalom. Kezdeti szimulációs technikák. Tipikus kérdések. A bootstrap módszer. Bevezetés A független, azonos eloszlású eset:

KÖVETKEZTETŐ STATISZTIKA

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

2. Az együttműködő villamosenergia-rendszer teljesítmény-egyensúlya

Matematikai játékok. Svetoslav Bilchev, Emiliya Velikova

NAGYVADÁLLOMÁNY JELLEMZŐ ADATAINAK MEGHATÁROZÁSA KÖZVETETT ÚTON

Ingatlanfinanszírozás és befektetés

A NEMZETI CIVIL ALAPPROGRAM, ÚTKERESÉS

Statisztika elméleti összefoglaló

V. Deriválható függvények

FOLYADÉKSZÁLLÍTÓ RENDSZER LINEÁRIS PARAMÉTER-ÉRZÉKENYSÉG ELEMZÉSE 2 1. BEVEZETÉS

Tartalomjegyzék. 2. Probléma megfogalmazása Informatikai módszer Alkalmazás bemutatása Eredmények További célok...

MATEMATIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Statisztika

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

6. feladatsor. Statisztika december 6. és 8.

Valószínűségszámítás

Kétoldali hibás Monte Carlo algoritmus: mindkét válasz esetén hibázhat az algoritmus, de adott alsó korlát a hibázás valószínűségére.

KAOTIKUS VAGY CSAK ÖSSZETETT? Labdák pattogása lépcsôn

SZÁMELMÉLET. Vasile Berinde, Filippo Spagnolo

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

EGYENLETEK ÉS EGYENLETRENDSZEREK MEGOLDÁSA A Z n HALMAZON. egyenletrendszer megoldása a Z

Sorozatok A.: Sorozatok általában

Eseme nyalgebra e s kombinatorika feladatok, megolda sok

I. FEJEZET BICIKLIHIÁNYBAN

ÖSSZEFÜGGÉSVIZSGÁLAT, PARAMÉTERBECSLÉS

Nemzetközi részvény befektetési lehetõségek Közép- és Kelet-Európa új európai uniós tagállamainak szemszögébõl

Gyakorló feladatok II.

CIVILEK A NYOMTATOTT SAJTÓBAN ÉRDEKÉRVÉNYESÍTÉS A MÉDIÁBAN 1

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Átírás:

Szociológiai Szemle 23(2): 72 88. válaszadó-vezérelt mitavétel megbízhatóságáak vizsgálata szimulációs módszerekkel 1 Kmetty Zoltá Simo Dávid zkmetty@yahoo.com; dr.david.simo@gmail.com Beérkezés: 2013. 02. 21. Végső átdolgozott változat beérkezése: 2013. 05. 23. Elfogadás: 2013. 05. 25. összefoglaló: Cikkükbe az Egyesült Államokba és Nyugat-Európába már széles körbe alkalmazott válaszadó-vezérelt mitavétellel (RDS) kapcsolatba végzett szimulációs kutatás eredméyeit foglaljuk össze. szimuláció célja a módszer megbízhatóságával kapcsolatba a kurres kutatások kapcsá felmerült problémák vizsgálata. Elemzésük eredméyekét kimutatjuk, hogy a becslések megbízhatóságát elsősorba az alacsoyabb heterofília, másodsorba a magasabb fokszám csökketik. Cikkükbe eredméykét bemutatjuk, hogy a várhatóérték-becslések szórásáak mekkora háyada magyarázható a fokszámbecslés hibájával. szimuláció mellett rövide ismertetjük a módszerrel kapcsolatos kurres módszertai fejleméyeket és a felhaszálás lehetőségeit. kulcsszavak: szimuláció, válaszadó-vezérelt mitavétel (RDS) z empirikus szociológiai kutatások redszerese foglalkozak olya célcsoportokkal, amelyek eseté em áll redelkezésre a csoportra voatkozó teljes körű lista, a csoport mérete a teljes épességhez viszoyítva relatíve kicsiy (ilye csoportok lehetek egyes életmódcsoportok, szubkultúracsoportok, emzeti és etikai kisebbségek, az elit). z ilye csoportok vizsgálata sorá a véletle mitavétele alapuló módszerek (többlépcsős, aráyos vagy aráytala rétegzett mitavételek) em lehetek költséghatékoyak. E csoportok eseté külöféle alteratív mitavételi eszközök állak redelkezésre, amelyek közül egy lehetőség a hálózati mitavételek közé tartozó, a hólabda-mitavétel logikáját követő (Goodma 1961) válaszadó-vezérelt mitavétel. Cikkükbe a Statisztikai Szemlébe megjelet irodalmi összefoglalót (Simo 2012) követőe e Magyarországo is terjedőbe lévő módszer kapcsá végzük szimulációs vizsgálatot, amelyek célja a módszer megbízhatóságáak és érvéyességéek tesztelése. 1 Ezúto moduk köszöetet Dr. Bozsoyi Károlyak, aki a közös együttgodolkodásuk sorá több ötlettel segítette mukákat.

Kmetty Zoltá Simo Dávid: válaszadó-vezérelt mitavétel... 73 válaszadó-vezérelt mitavételt emzetközi elismertség mellett Magyarországo is övekvő érdeklődés övezi. válaszadó-vezérelt mitavétel a em hagyomáyos mitavételi módszerek hálózati mitavételek evezett csoportjába tartozik, alapvetőe a hólabda-mitavételek egy továbbfejlesztett változata. lekérdezés sorá a kérdezett ajál további olya személyeket, akik tagjai a vizsgált célcsoportak. módszer megalkotói és a felhaszálók elsősorba a ritka és rejtett populációk (például itravéás droghaszálók, homoszexuális férfiak, etikai kisebbségek stb.) vizsgálatára ajálják, illetve haszálták fel. Bár elsősorba merikába és Nyugat- Európába haszálják ezt a techikát, egyre több magyar piac- és társadalomkutatás esetébe is alkalmazak válaszadó-vezérelt mitavételt. Ilye volt többek között a Bozsoyi Károly által iráyított baki ügyököket vizsgáló kutatás (Bozsoyi Jelefi Kmetty 2008), az MT kutatása a külföldö dolgozó magyar diplomásokról (Csaády et al. 2008), a Kopit lapítváy ausztriai mukavállalókat célzó kutatása (Hárs 2009; Hárs Simo 2009), illetve a Tárki roma migrációs poteciál kutatása (Simo 2005; Berát 2006). Bár jeleleg a módszert elsősorba eheze elérhető, rejtett, illetve kis célcsoportok vizsgálatára haszálják, a hagyomáyos survey felvételekbe egyre ikább övekvő válaszmegtagadási aráyok miatt, létjogosultságot yerhetek azok a kutatási megközelítések, melyek öveli tudják a válaszadási aráyokat. z ajálásoko keresztül a kutatásba meghívott szereplők agyobb valószíűséggel veszek részt egy felvételbe, mit egy előzméy élküli megkeresés esetébe. módszer szité fotos eszköze lehet az olya olie közösségek vizsgálatáak (pl. Facebook), amelyek esetébe redelkezük valamiféle ismerettel a kapcsolatok megoszlásáról és sűrűségéről. módszer sajátossága, hogy ismeretle mitavételi keret mellett bizoyos feltételek teljesülése eseté a mita alapjá lehetővé teszi a torzítatla becslést viszoylag kis költségek mellett. módszerrel kapcsolatba magyar yelve is megjeletek szakirodalmi összefoglaló írások (Kapitáy 2010; Simo 2012), melyek közül az utóbbi részletese foglalkozik a módszer kritikájával, illetve a korábbi kutatások tapasztalataival is. módszerrel kapcsolatba legfrissebbe felmerült problémák közül kiemelkedik, hogy bár a mitavételi eljárás alapjá képzett mitákból adható becslések torzítatlaságát továbbra sem kritizálják, a becslések szórása meghaladja a korábbi részbe szimulációs eredméyeke, részbe módosított szórásbecslése alapuló becsléseket (elsősorba Goela Salgaik [2010]). Ezek az újabb eredméyek külööse kis mitaméret eseté megkérdőjelezik a módszer haszálhatóságát, ugyaakkor övelik a becslés tulajdoságaiak jobb megértését célzó kutatások jeletőségét. Kutatásukba külöböző paraméterekkel redelkező szimulált hálózatok, majd a hálózatoko a válaszadó-vezérelt mitavételi eljárás szimulálásá keresztül azt igyekszük vizsgáli, milye potossággal lehet becsüli bizoyos sokasági paramétereket külöböző elméleti populáció esetébe. Ezefelül azt is vizsgáljuk, hogy a becslés egyes elemei milye módo járulak hozzá a becslések szórásához. Cik

74 Szociológiai Szemle, 2013/2 kük célja, hogy potosítsuk a módszer felhaszálási feltételeit, és alapot teremtsük a további, itt bemutatott problémák kiküszöböléséhez válaszadó-vezérelt mitavétel alapjai válaszadó-vezérelt mitavétel (respodet drive samplig, RDS) első leírása Douglas D. Heckathor cikkébe jelet meg 1997-be (Heckathor 1997). szerző a mitavételi eljárást a következő lépésekbe összegzi (Simo [2012] alapjá rövidítve). Első lépésbe kiválasztják a mita kezdőpotjait úgy, hogy már az első válaszadókak is jutalmat ígérek a részvételért. z első lépcsőbe bekerült személyekkel lefolytatják az iterjúkat, és megkérik őket a kutatás végé, hogy segítseek további alayokat beszervezi a vizsgált célcsoportból. beszervezésért a kérdezettek szité jutalmat kapak, de csak abba az esetbe, ha az általuk ajálott személlyel megvalósul a lekérdezés. Mide kutatásba szereplő személy jutalmat kap a részvételért, és azért is, ha sikerese beszervezett valakit. Eredetileg ezt a kutatási felépítést még további két pottal egészítették ki. Egyrészről a bevoható további személyek száma válaszadókét korlátozott számú általába két fő, másrészről az iterjúkat egy olya helye készítették, ahova a válaszadóak kellett elmeie. szerzők által leírt lépések természetese csak iráyadóak, az elmúlt évtized sorá az RDS módszert alkalmazó kutatások a feti leírástól sok esetbe eltértek. z RDS módszer agy ígérete az egyszerűbb hólabda-adatfelvétellel szembe, hogy az egyes populációs paraméterekre torzítatla becslést lehet adi. Ez praktikusa azt jeleti, hogy egy ilye jellegű adatfelvételből is lehet érvéyes megállapításokat tei a sokaságra. torzítatla becsléshez azoba több feltételek is meg kell hogy felelje a mita (Salgaik Heckathor 2004, idézi Simo 2012). z egyik alapfeltétel az, hogy a válaszadókak és ajálottakak kölcsöös (reciprok) kapcsolatba kell álliuk egymással. Tehát ha személy ismeri B személyt, akkor B személyek is ismerie kell személyt. Ez az előfeltétel a mitavétel techikai leboyolítása miatt gyakorlatilag midig feáll. második fotos előfeltevés az, hogy a hálózatak egy kompoesből kell állia. Tehát a hálózatba bármely személytől el lehesse juti bármely másik személyig. Ez az előfeltétel eheze tesztelhető, bár kidolgozhatók olya idikátorok, melyek részbe jelzik eek teljesülését. További előfeltevés az, hogy a mitavétel visszatevéssel törtéje. Tehát elviekbe egy személy többször is bekerülhet a mitába. Ez az előfeltevés a gyakorlatba em realisztikus, mivel egy személyt csak egyszer kérdezük le a kutatásba, ebből következőe tehát valamekkora torzítás jeletkezi fog. torzítás aál kisebb, miél agyobb a célcsoportuk és miél kevésbé klaszterezett. Továbbá a válaszadóak teljes potossággal meg kell tudia határozia azt is, hogy háy kapcsolata va a célcsoportba (ezt evezzük fokszámak). fokszámak szerepe va a becslésekbe, ezért va rá kifejezette szükség. Salgaikék által kidolgozott módszer diszkrét változókra (pl. em, iskolai végzettség, településtípus) lett kidolgozva, ami egyértelműe szű

Kmetty Zoltá Simo Dávid: válaszadó-vezérelt mitavétel... 75 kíti a módszer hatókörét, bár eek kapcsá mideképp megjegyezhetjük, hogy bármely folytoos változó átalakítható diszkrétté (például a jövedelemből jövedelmi kategóriákat képezhetük). feti feltételek teljesülése eseté a hálózat egyes paramétereiek becslése alapjá megbecsülhető a vizsgált diszkrét változó populációs eloszlása (dichotóm, kétértékű változóra Salgaik Heckathor [2004] alapjá). z alábbiakba egy kétértékű és B értékeket felvevő változó esetébe írjuk le, hogya lehet sokaság megoszlását (populációs valószíűségét) megbecsüli. köyebb érthetőség kedvéért a eme változót haszáljuk fel példakét a képletekbe: Pˆ Dˆ Cˆ,B Dˆ BC ˆ B, = Dˆ Cˆ + Dˆ Cˆ = = j= 1 f,b 1 d,b j ; ; Cˆ Dˆ B B, B = = B, B j= 1 f B, B B 1 d B j (1) (2) (3) ahol: ; B D ; D B C B ; C B P B d j ; d j ƒ B ; ƒ B esetszámok: a változó, illetve B értéket választó személyek száma a mitába (pl. : férfi, B: ő) fokszámok (degree): a változó, illetve B értéket választó személyek átlagos fokszám becslése a mitából (a férfiakak és a őkek átlagosa háy kapcsolata va a mita alapjá) összekötöttség (coectio): az és B, illetve B és értéket választó személyek közötti kapcsolat valószíűségéek becslése a mitából (egy férfiak milye valószíűséggel va ői ismerőse, és egy őek milye valószíűséggel va férfi ismerőse) valószíűség (probability): az értéket választó személyek aráyára adott becslés (a férfiak aráyára adott becslés) az, illetve B értéket választók közül a j. válaszadó fokszáma (a j-ig válaszadó férfi-, illetve őismerőseiek száma) azo válaszadók száma, akik az, illetve B értéket választották, és az általuk ajálott személy a B, illetve értéket választotta (azo férfiak száma, akik őt választottak, és azo ők száma, akik férfit választottak). számítás logikája alapvetőe az, hogy első lépésbe két-két hálózati paramétert becslük meg, majd ez alapjá teszük becslést a vizsgált változó populációs eloszlá

76 Szociológiai Szemle, 2013/2 sára. Vizsgált változókét a emet feltételezve a mita alapjá először megbecsüljük a férfiak és ők átlagos kapcsolatszámát, illetve a férfiak őismerőseiek és a ők férfiismerőseiek átlagos számát, majd ezek alapjá teszük becslést a férfiak és ők aráyára a vizsgált épességbe. Ezt a becslést a továbbiakba RDS I becslések evezzük. Volz és Heckathor (2008) egy másik elterjedtté vált becslésre adtak javaslatot a Hase Hurwitzbecslés módosítása yomá (a továbbiakba RDS II becslés): (5) (6) Pˆ = D ˆ = i= 1 Dˆ Dˆ 1 d i ahol: D az átlagos fokszám becslése a mitából (a mitából becsült kapcsolatszám) mide egyéb jelölés a korábba megadottal megegyezik. Utóbbi becslés előye elsősorba abba áll, hogy esetébe a becslés szórására, azaz a megbízhatóságra voatkozóa is redelkezésre áll igaz, csak közelítő módo zárt képlettel kiszámítható becslés, míg az RDS I becslés szórására csupá idő- és számításigéyes em paraméteres iteráció alapuló becslést adhatuk. válaszadó-vezérelt mitavételhez kapcsolódó korábbi módszertai kutatások válaszadó-vezérelt mitavétel megbízhatóságáak és érvéyességéek vizsgálatával számos korábbi kutatás foglalkozott, melyeket a korábba már idézett taulmáyuk (lásd Simo 2012) részletese is taglal, itt azokat az elsősorba szimulációs kutatásokat idézzük, amelyek jele kutatásuk szorosabb előzméyét jeletik. Salgaik és Heckathor (2004) szimulációs vizsgálatáak részletes bemutatását azért tartjuk fotosak, mivel saját szimulációk is eze alapul, de rövide kitérük más kutatási kérdésükkel foglalkozó elemzésekre is, melyek ismertetése sorá elsősorba az eredméyekre kocetráluk, amelyeket cikkük utolsó részébe öszszevetük saját eredméyeikkel. Salgaik és Heckathor (2004) a fet már idézett becslés mellett az általuk javasolt (RDS I) becslés tulajdoságait elsősorba torzítatlaságát szimuláció segítségével is vizsgálták. Vizsgálatukba első lépéskét létrehozták a szimulációba a célpopuláció szerepét betöltő alappopulációt. z alappopulációt két részre osztották:, illetve B tulajdosággal redelkező alappopulációra (ez megfeleltethető egy

Kmetty Zoltá Simo Dávid: válaszadó-vezérelt mitavétel... 77 változó két értékéek). Defiiálták egy meghatározott eloszlás alapjá, hogy mekkora legye az egyes populációtagok kapcsolatszáma. Defiiálták, mekkora legye a kapcsolatok aráya a két csoport tagjai között a kisebb összkapcsolatszámmal redelkező csoport összes kapcsolatához képest, ezt evezzük a továbbiakba heterofíliáak. Tehát a heterofília az és B tulajdoságú csoportok összekötöttségét méri. Értéke 0, ha ics kapcsolat a két csoport között, és 1, ha a kisebb összkapcsolatszámmal redelkező csoport összes kapcsolata a agyobb csoport felé iráyul. z alappopuláció mérete Salgaikék szimulációjába 10 000 volt. Mid a két csoport eseté a kapcsolatszám expoeciális eloszlású volt, az csoport eseté 10, a B csoport eseté 20-as fokszámátlaggal. heterofiliát pedig 0,6-ra állították be, tehát a kisebb kapcsolatszámú csoport kapcsolataiak 60 százaléka iráyult a agyobb csoport iráyába. hálózat kialakítása utá 5 kezdőpotból kiidulva szimulációs módszerrel vizsgálták az RDS mitavételt. Mide lépésél a már mitába kerültekhez a velük kapcsolatba állók közül két-két további populációtagot választottak ki véletleszerűe, akikkel bővítették a mitát. z eljárást addig folytatták, amíg el em érték a kívát mitaméretet. z eljárás sorá visszatevéses mitavételt alkalmaztak, azaz egy-egy populációtag többször is a mitába kerülhetett. mitavételt 1000-szer ismételték meg mide beállítás mellett. szimulációk sorá elsősorba a torzítás mértékét (azaz a populációs és a mitából becsült aráy külöbségét) vizsgálták egyrészt a mitaméret, másrészt a populációs aráyok, harmadrészt a kezdőpotkiválasztás szempotjai alapjá. szerzők azt találták, hogy a torzítás mértéke már 500 elemű mita eseté bármely populációs aráyra 0,1%-ál kisebb. kezdőpotok kiválasztása eseté pedig azt, hogy 500 elemű mitára egyszerű véletle kezdőpotkiválasztás, kapcsolatszám-aráyos valószíűséggel törtét kezdőpot-kiválasztás, illetve a kapcsolatszám égyzetével aráyos valószíűségű kezdőpot-kiválasztás eseté is a becslések torzítása 0,1% alatt marad. cikk ábrái a becslések szórását is tartalmazzák, azoba ezeket sajálatos módo a szerzők em számszerűsítik. továbbiakba még égy taulmáyt ismertetük, amelyek eltérő adatoko vizsgálják a válaszadó-vezérelt mitavétel tulajdoságait. taulmáyok ismertetése sorá három téyező szerepére kocetráluk a becslések szórására és a torzításra voatkozóa: a heterofília hatására, a hálózati tulajdoságokra és a mitavétel sajátosságaira. Gile és Hadcock (2009) 1000 modellezett hálózatot vizsgáltak, amelyek egyekét 1000 fős populációt szimuláltak (a em vizsgált hálózati paramétereket egy korábbi kutatás valós hálózati adatai alapjá állították be, a szimulált hálózatok a fet leírthoz hasoló módo kerültek előállításra expoeciális fokszámeloszlással és változó heterofília-mértékkel). z 1000 darab 1000 elemű hálózatból 500 elemű mitákat vettek. Szimulációjuk sorá azt találták, hogy agyo alacsoy heterofília eseté (tehát ha a kapcsolatok agy része csoporto belülre mutat) az RDS II becslések szórása jeletőse megő. Ugyaakkor azt is kimutatták, hogy torz (a populáci

78 Szociológiai Szemle, 2013/2 ós eloszlástól jeletőse eltérő) kiiduló mita eseté a hosszabb lácok (kevesebb kezdőpot) kisebb torzításhoz vezetek, összességébe a torz kiiduló mita ics jeletős hatással az RDS II becslés szórására. Emellett a szerzők azt is vizsgálták, hogy milye hatása va aak, ha a vizsgált változó egyes értékei által kijelölt csoportok átlagos kapcsolatszáma eltér egymástól (például ha emek szeriti megoszlásra vagyuk kívácsiak, és a ők átlagos kapcsolatszáma jeletőse eltér a férfiakétól). szerzők azt találták, hogy az átlagos kapcsolatszámba mutatkozó külöbségek a agyobb átlagos kapcsolatszámmal jellemezhető csoport értéke gyakoriságáak alulbecsléséhez vezetek. Ez a hatás még jeletősebb, ha a gyakoriságok agymértékbe eltérek az egyeletestől. zt tapasztalták továbbá, hogy ameyibe a mita mérete közelít a populáció méretéhez, a vizsgált változó egyes értékeihez tartozó eltérő átlagos kapcsolatszám torzító hatása jeletős mértékbe megő. szerzők végül azt is megállapították, hogy a visszatevés élküli mitavétel csökketi a becslések (mid az RDS I, mid az RDS II) szórását (valamit a kiiduló mita torzító hatását). Goela és Salgaik (2010) egy valós agymitás kutatás hálózatáak 4430 fős részhálóját haszálták (eze belül 85 külöálló kompoest), amelye az RDS I becslés feltételeiek megfelelő 500 fős mitákat szimuláltak, a mitavételt 10 ezer alkalommal ismételték meg. Eredméyeik azt mutatták, hogy a becslések szórása számottevőe meghaladta a várt értéket, mértéke egy egyszerű véletle mitával összevetve 5 10-szeres is lehet. Ez azt jeleti, hogy egy 1000 fős RDS mitához számolt becslési hiba akár olya agy is lehet, mit egy 100 fős véletle mita esetébe. Tomas és Gile (2010) 1000 fős szimulált hálózattal modelleztek egy populációt (a hálózat tulajdoságait úgy paraméterezték, hogy az egy korábbi kutatás valós paramétereiek, például átlagos fokszámáak felelje meg). Vizsgálatuk szerit a célcsoporthoz viszoyítva kis mita és alacsoy heterofília eseté az RDS I becslés kisebb torzítást eredméyez a becslések agyobb szórása mellett, míg agyobb heterofília mellett az RDS II becslések szórása kisebb. Verdery és Mouw (2011) a Facebook 100, egyetemalapú ismeretségi hálójá modellezett mitavétellel vizsgálták a válaszadó-vezérelt mitavétel tulajdoságait. kutatás sorá 100 ezer mitavételt modelleztek. Elemzésük sorá kimutatták, hogy azo változók eseté, amelyek jeletős klaszterezettséghez vezetek (azaz a hálózato belül olya alcsoportok vaak, amelyekre jellemző a agyszámú alcsoporto belüli és kevés az azo kívüli kapcsolat, valamit eze alcsoportok eseté a vizsgált változó szóródása kisebb), a becslések szórása jeletőse megövekedett. Ez gyakorlatilag megegyezik azzal a korábbi eredméyel, miszerit az alacsoy heterofília megöveli a becsléseikhez tartozó kofidecia-itervallumot. Összefoglalva a leírtak fotosabb megállapításait a korábbi kutatások azt állapították meg, hogy a heterofília mértéke fordított összefüggést mutat a becslések szórásával (azaz a megbízhatósággal), az egyes csoportok átlagos kapcsolatszáma közötti külöbség ugyacsak öveli a becslések szórását, midezek mellett a kii

Kmetty Zoltá Simo Dávid: válaszadó-vezérelt mitavétel... 79 duló mita agysága (amely adott mitaagyság mellett a lácok hosszát is megszabja) a becslések szórását em befolyásolta jeletőse. Kutatási kérdés voatkozó kutatásokat áttekitve em találtuk olyat, amely szisztematikusa vizsgálta vola a fotosabb téyezők együttes hatását. Ezért úgy dötöttük, hogy kutatásuk sorá a válaszadó-vezérelt mitavétel két szakirodalomba haszált becsléséek (RDS I és RDS II) szóródását és torzítását vizsgáljuk külöféle hálózati és populációs paraméterek kombiációja eseté. Emellett egy a korábbi irodalomba egyáltalá em szereplő téyezőt is vizsgáluk, azt, hogy a változók populációs eloszlására adott becslések szórásáak mekkora háyadát adják a becslés egyes téyezői, remélve, hogy így jobba megérthetjük, mekkora mértékbe hatak az egyes paraméterek a becslések megbízhatóságára. hálózati és mitavételi téyezők közül vizsgáltuk az átlagos fokszámot, a heterofília agyságáak hatását, valamit a kiidulópotok számát. Mid a három paraméter esetébe további három-három paraméterbeállítást teszteltük. z eredméyek kiértékeléséél elsősorba az RDS I és RDS II becslések megbízhatóságára kocetráltuk, de vizsgáltuk az és B tulajdoságú populációs tagok fokszámbecslését, a teljes sokaságra adott fokszámbecslést, valamit az és B, illetve B és csoportok közötti összekötöttség (heterofília) becslését is. Midezek alapjá kutatási kérdéseiket a következő módo fogalmaztuk meg: hogya befolyásolják a hálózati és mitavételi téyezők a becslések torzítását és szórását, milye mértékbe határozzák meg a becslések szórását a becslés egyes téyezői, valamit hatással vaak-e egyéb hálózati téyezők a becslések szórására, illetve torzítására? Módszerta kutatási kérdések megválaszolásához a szakirodalmi előzméyekre támaszkodva egy hálózati szimulációs módszert választottuk. hálózatok szimulálásához Salgaik és Heckathor (2004) módszeréek módosított változatát alkalmaztuk. szimulációk sorá fix paraméterkét kezeltük a vizsgált változó eloszlását (dichotóm, 0,3 0,7 eloszlású, a továbbiakba értékű és B értékű), a populáció méretét (10 000), valamit a mita méretét (1000). Ezek a paraméterek az összes futtatásba álladóak voltak. szimulációk sorá a két hálózati és egy mitavételi paraméter eseté (átlagos fokszám, heterofília, illetve kiidulópotok száma) három-három értéket határoztuk meg. külöböző paramétertéyezők esetébe több mitavételi szituációt lefuttattuk, és megvizsgáltuk mide esetbe a kapott becslés érvéyességét és megbízhatóságát, valamit azt, hogy az egyes téyezőkek mekkora a hatása a becslések torzítására és szórására. fokszám eseté a kisebbik csoport agyobb átlagos fokszámát feltételeztük (ezzel Salgaik és Heckathor modelljéek feleltük meg). kisebbik csoport eseté ( értékkel jellemezhető)

80 Szociológiai Szemle, 2013/2 a fokszámok elméleti várható értéke: 7,66; 12,11 és 21. 2 agyobb csoport eseté (B értékkel jellemezhető) a fokszámok elméleti várható értéke: 4,33; 6,55 és 11. heterofília tekitetébe azt határoztuk meg, hogy a kisebbik csoport ( értékkel jellemezhető) tagjaiak összes kapcsolata milye aráyba iráyul a agyobbik csoport (B értékkel jellemezhető) felé. z értékek a következők voltak: 15%; 30%; 60%. 3 Végül a mita kiidulópotjaiak száma tekitetébe 20, 40 és 80 értékek mellett dötöttük. Ez utóbbi egyúttal befolyásolta a mitavétel sorá a mitamérethez szükséges egymást követő lépések számát is (láchossz): 20 kiidulópot eseté a várható átlagos láchossz 5,6, 40 kiidulópot eseté 4,6, míg 80 kiidulópot eseté 3,6. Mivel a mitavétel szimulálása sorá az idézett szerzőktől eltérőe a gyakorlatba alkalmazott visszatevés élküli modellt alkalmaztuk, az itt megadott átlagos láchosszok kismértékbe eltérek a tapasztalttól. szimuláció sorá mide paraméter-beállítással 10 hálózatot geeráltuk és mide hálózat eseté 1000 mitavételt szimuláltuk, összese 270 hálózato 270 000, 1000 elemű mitavétel törtét. z eredméyeket paraméterkombiációkét hasolítottuk össze egymással, illetve egy azoos paraméterű egyszerű véletle mita (EVM) várható adataival. Mide mita eseté kiszámítottuk az RDS I és RDS II becslést, a becslések hibájáak szórását, valamit kiszámítottuk az RDS I becslést a valós heterofília-értékekkel és a becsült fokszámokkal, illetve a becsült heterofília-értékekkel és a valós fokszámokkal. z így kapott becslések segítségével paraméterkombiációkét meghatároztuk, hogy milye mértékbe járul hozzá a becslések szórásához a fokszám, illetve a heterofília. z eltérő hálózatszimulációk hatását azoos paraméterek mellett a becslések populációs értéktől való eltérésére voatkozóa NOV elemzéssel vizsgáltuk. Eredméyek Foglaljuk össze a szimulációk eredméyeit 4 a kutatási kérdéseket követve: Elsőkét az RDS I és RDS II becslések torzítását vizsgáljuk a külöböző paraméterek meté. z egyes paraméterek függetle (kotrollált) hatásáak vizsgálata érdekébe egy általáos lieáris modellt (GLM) illesztettük a szimulált adatokra. 5 Modellükbe a paraméterváltozók alacsoy mérési szitűkét szerepeltek, így az elemzés tulajdoképpe több utas, többszitű NOV elemzések feleltethető meg. modell alapjá elmodható, hogy midhárom paraméter és a hálózatszimuláció is szigifikás hatással volt midkét becslés eseté. hatáserősségek értékelése érdekébe megvizsgáltuk a modell alapjá becsülhető margiálisokat az egyes para 2 fokszámokat expoeciális eloszlásúak feltételeztük, techikai okokból a hálózat összefüggését garatáladó mide populációtag eseté eggyel megöveltük, így ulla fokszám em fordulhatott elő. 3 Tekitettel arra, hogy a agyobb csoport a populáció 70%-át teszi ki, átlagos fokszámuk viszot a kisebb csoport valamivel több mit fele (52 56%-a), a 15%-os aráy viszoylag erőteljes homofíliát, a 30%-os aráy véletlehez közeli kapcsolatválasztást, míg a 60%-os aráy kifejezett heterofíliát jelet. 4 hálózatok mérete a szimuláció sajátosságai miatt esetekét émileg kisebb az eredeti méretél. fokszámátlagok jól követik az előre rögzített értékeket. 5 Radomfaktorkét figyelembe vettük azt is, hogy az egyes paraméterbeállítások meté 10 10 hálózatot geeráltuk, tehát összese 270 szimulált hálózatból vettük a hálózatokéti 1000 darab mitát.

Kmetty Zoltá Simo Dávid: válaszadó-vezérelt mitavétel... 81 méterek eseté (1. táblázat), amely megmutatja, hogy az egyes paraméterek, tehát a he te ro fí lia, a fokszám és a kiiduló mita mérete külö-külö milye hatást gyakorolak a becslések eltérésére a téyleges populációs értékektől. 1. táblázat: heterofília, a fokszám és a kiiduló mitaagyság becsült hatása (a modell alapjá kiszámított margiálisátlagok és stadard hibájuk) Heterofília RDS I RDS II Átlag Std. hiba Átlag Std. hiba 15% 0,018 <0,001 0,007 <0,001 30% 0,014 <0,001 0,003 <0,001 60% 0,006 <0,001 0,007 <0,001 Fokszám RDS I RDS II Átlag Std. hiba Átlag Std. hiba 21 0,014 <0,001 0,004 <0,001 12,11 0,013 <0,001 0,002 <0,001 7,66 0,012 <0,001 0,003 <0,001 Kiiduló mita RDS I RDS II Átlag Std. hiba Átlag Std. hiba 20 0,013 <0,001 <0,001 <0,001 40 0,013 <0,001 0,001 <0,001 80 0,013 <0,001 0,002 <0,001 tábla adatai alapjá látható, hogy midkét becslés elsősorba a csoportok összekötöttségére, a heterofíliára érzékey. Míg azoba az RDS I becslés a heterofília övekedésével szite lieárisa egyre kisebb torzítású becslést ad, az RDS II becslés a közepes (véletlehez közel álló) heterofília eseté adja a legpotosabb becslést. Kisebb mértékbe, de midkét becslésre hatással va a fokszám várható értéke (a táblázatba a kisebb csoport fokszámáak beállított várható értékeit közöljük). Ebbe az esetbe is hasoló jeleséget tapasztalhatuk, mit a heterofília eseté: az RDS I becslés az egyre kisebb fokszám-várhatóértékű hálózatok eseté egyre potosabb becslést ad, az RDS II viszot valahol a közepes tartomáyba adja a legpotosabb becslést. Végül a kiiduló mita agyságáak hatása bár statisztikai értelembe szigifikás gyakorlati szempotból em tekithető jeletősek. hálózathatás hasoló módo em értékelhető, hisze itt radom hatásról va szó. z 1. tábla eltérés-égyzetösszegeket tartalmazó oszlopa alapjá kiszámítható parciális magyarázóerőt mutató parciális éta-égyzet értéke RDS I becslés eseté 0,002, míg RDS II becslés eseté 0,008, ami a hálózatok struktúrájáak szigifikás, de agyo kis mértékű hatását mutatja. Végül em hagyható figyelme kívül az a téy (lásd 1. táblázat), hogy az RDS I becslés torzítása kedvezőtle paraméterezés eseté közel egy agyságreddel agyobb, mit az RDS II becslésé. Összefoglalva: az RDS I becslés külööse kedvezőtle paraméterek eseté jeletősebb torzítással bír, egyértelműe csökke a torzítása a heterofília

82 Szociológiai Szemle, 2013/2 övekedésével és kisebb mértékbe a fokszám csökkeésével, ezzel szembe az RDS II becslés általába kisebb torzítással bír, de mid a fokszám, mid a heterofília tekitetébe az általuk közepesek tekitett értékektől való eltérés a torzítást öveli. következő lépésbe a becslések megbízhatóságát vizsgáljuk meg. Sajos ebbe az esetbe ics lehetőségük komplex modell alkalmazására, így egyszerű szórásegyelőség-vizsgálatokra, illetve a paraméterkombiációk alkalmazása mellett a becs lések szórásadataira hagyatkozhatuk. három vizsgált paraméter hatását a becslések szórására variaciahomogeitás-vizsgálattal teszteltük (2. táblázat). 2. táblázat: heterofília (H), a fokszám-várhatóérték [E(D)] és a kiiduló mita méretéek (NK) hatása az RDS I és RDS II becslés szórására (a Levee-teszt eredméyei alapjá midhárom téyező midkét becslési módszer eseté szigifikás eltérést hozott létre a becslések szórásába) H E(D) NK 15% 21 12,11 becslések szórása RDS I RDS II 20 0,0352 0,0442 40 0,0353 0,0391 80 0,0367 0,0344 20 0,0349 0,0436 40 0,0350 0,0385 80 0,0359 0,0337 20 0,0345 0,0433 7,66 40 0,0354 0,0381 80 0,0362 0,0334 20 0,0256 0,0269 21 40 0,0259 0,0266 30% 60% 12,11 7,66 21 12,11 7,66 80 0,0263 0,0257 20 0,0246 0,0261 40 0,0250 0,0253 80 0,0257 0,0248 20 0,0241 0,0255 40 0,0243 0,0247 80 0,0251 0,0238 20 0,0201 0,0200 40 0,0201 0,0200 80 0,0201 0,0199 20 0,0184 0,0183 40 0,0185 0,0184 80 0,0187 0,0184 20 0,0171 0,0170 40 0,0175 0,0173 80 0,0176 0,0173

Kmetty Zoltá Simo Dávid: válaszadó-vezérelt mitavétel... 83 Levee-tesztek adatai alapjá midhárom vizsgált paraméter szigifikása befolyásolta midkét becslés szórását. z RDS I becslés szórására a legjeletősebb hatást a heterofília gyakorolta, a agyobb heterofília erőse csökketette a becslések szórását (15% eseté 0,0345 0,0367 között, míg 60% eseté 0,0171 és 0,0201 között). fokszám és a kiiduló mita méretéek hatása eél jóval gyegébb volt: az alacsoyabb fokszám-várhatóérték és az alacsoyabb kiiduló mitaméret egy agyságreddel kisebb mértékbe csökketette az RDS I becslés szórását. z RDS II becslés eseté is a heterofília hatása volt a legerősebb a becslés megbízhatóságára: a agyobb heterofília kisebb szórással járt (15% eseté 0,0334 0,0442 között, 60% eseté 0,0173 0,0200 között). Ebbe az esetbe azoba a kiiduló mita mérete valamivel agyobb hatást gyakorolt a szórásra: agyobb kiiduló mita kisebb szórást eredméyezett. Emellett csak gyege hatása volt a fokszám várhatóértékéek: azoos körülméyek között a kisebb fokszám-várhatóérték az RDS II becslés valamivel kisebb szórását eredméyezte. két becslés szórását összevetve azt láthatjuk, hogy az optimálistól eltérő körülméyek eseté az RDS I becslés szórása alacsoyabb. Érdemes a tapasztalt szórásértékeket összeveti egy egyszerű véletle mita eseté hasoló populációs eloszlású változóra adott becslés szórásával. Ez az érték 1000 elemű egyszerű véletle mita és 0,3 0,7 eloszlású változó eseté 0,0145, amely értéket a legkedvezőbb paraméterértékek eseté (agy összekötöttség, alacsoy várható fokszám) midkét becslés szórása megközelíti. Ugyaakkor a legkedvezőtleebb vizsgált paraméterbeállítás eseté az RDS I becslés szórása 2,5-szerese, míg az RDS II becslés szórása valamivel több mit 3-szorosa az azoos méretű EVM mitából származó becsléséek. Tehát egy ugyaakkora EVM és RDS mita esetébe utóbbiál akár háromszor szélesebb kofideciaitervallum tartozhat egy változó várhatóértékek a becsléséhez. hálózati szimuláció hatásáak tesztelése érdekébe a szóráshomogeitás-vizsgálatot mide egyes paraméterbeállítás mellett elvégeztük a 10-10 hálózatra, az eredméyek azt mutatták, hogy az eltérő hálózatok általába em okoztak szigifikás eltérést a becslések szórásába. 6 Végül a több hálózati paraméter (fokszám és heterofília) alapjá becslő RDS I eseté megvizsgáltuk, hogy a becslés eltérései milye mértékbe függek össze az egyes hálózati paraméterbecslések eltéréseivel. Eek érdekébe az RDS I becslést úgy is kiszámítottuk, hogy ahhoz az egyik esetbe a populációs heterofíliaadatokat és a fokszámbecsléseket (a megmaradt eltérések a fokszámbecslések hatását tükrözik), a másik esetbe a populációs fokszámadatokat és a heterofíliára voatkozó becsléseket haszáltuk (a megmaradó hiba az összekötöttség becsléséből származik). becslések hibájáak átlagát tekitve megállapítható, hogy a heterofíliára voatkozó becslések hibája okozza az RDS I becslések kozisztes pozitív torzítását: a populációs fokszámátlag haszálatával a becslések átlagos eltérése mide paraméterbeállítás 6 27-féle paraméterkombiációból az RDS I becslés szórása 4 esetbe, míg az RDS II becslés szórása 5 esetbe volt szigifikása külöböző (5%-os elsőfajú hiba mellett) hálózatokét.

84 Szociológiai Szemle, 2013/2 mellett övekedett, míg a populációs heterofíliaadatok haszálatával egatívvá vált, abszolút értéke pedig általába léyegese csökket. becslések szórása eseté az egyes paraméterbeállításokra kiszámítottuk a populációs fokszámátlaggal, illetve populációs heterofíliaadattal adott becslések szóráségyzeteiek összegét, amelyek jól közelítették az eredeti becslések szóráségyzetét. Ezt az összefüggést haszálva a továbbiakba az egyes hálózati paraméterbecslések által hordozott hibaháyadot a szóráségyzet háyadával írjuk le. szóráségyzetháyadok és az egyes vizsgált paraméterek (fokszám, heterofília, kiiduló mita mérete) hatását vizsgálva azt találtuk, hogy a kiiduló mita mérete em gyakorolt jeletős hatást, így e paraméter meté átlagoltuk a szóráségyzetháyadokat. 3. táblázat a heterofília és a fokszám-várhatóérték meté mutatja meg a fokszámbecslés részesedését az RDS I becslések hibájából. 3. táblázat: heterofília és a fokszám-várhatóérték hatása a fokszámbecslés-hiba részesedésére az RDS I becslés variaciája eseté (a kezdőpotok számáak hatását átlagolva) Heterofília Fokszám-várhatóérték 21 12,11 7,66 15% 0,120 0,167 0,224 30% 0,260 0,331 0,424 60% 0,515 0,604 0,678 táblázat alapjá elmodható, hogy mid a heterofília, mid a fokszám-várhatóérték befolyásolta a fokszámbecslés hibája által magyarázható hiba aráyát az RDS I becslés variaciájá belül. Látható, hogy a heterofília hatása ebbe az esetbe is agyobb a vizsgált paraméter-összeállítás meté. Nagyobb heterofília és kisebb fokszám-várhatóérték eseté a fokszámbecslés hibája kevesebbet magyaráz az RDS I becslés variaciájából, eek megfelelőe ezekbe az esetekbe a heterofíliára voatkozó becslés hibája magyaráz jóval agyobb aráyt a becslések szóráségyzetéből. Ha ehhez az eredméyhez figyelembe vesszük az RDS I becslés szórásáak paraméterfüggéséél leírtakat is, akkor elmodható, hogy azokba az esetekbe, amikor az RDS I becslés szórása agy (elsősorba alacsoy heterofília, másodsorba, de kisebb mértékbe magas fokszám eseté), a becslés szórásáért jeletős részbe a heterofília becsléséek a hibája felelős. Koklúzió és további kutatási lehetőségek következőkbe igyekszük összefoglali szimulációs kutatásuk eredméyeit, azokat összeveti az ismertetett irodalom eredméyeivel, valamit midezek alapjá egyrészt praktikus javaslatokat megfogalmazi a módszert alkalmazi kíváó kutatók számára, illetve eredméyeik alapjá javaslatot aduk a további kutatás lehetséges iráyára.

Kmetty Zoltá Simo Dávid: válaszadó-vezérelt mitavétel... 85 Vizsgálatuk első része az RDS I és RDS II becslés összehasolítására voatkozott külöféle paraméterek mellett. 4. táblázatba összefoglaltuk a korábba részletese leírt eredméyeket. 4. táblázat: z összekötöttség, a fokszám, kiiduló mita és egyéb hálózati hatások befolyása az RDS I és RDS II becslés torzítására és szórására z RDS I és RDS II egymáshoz viszoyítva Nagyobb heterofília Nagyobb átlagos fokszám Nagyobb kiiduló mita Egyéb hálózati hatás RDS I becslés RDS II becslés Torzítás Szórás Torzítás Szórás Nagyobb (főleg kedvezőtle esetbe) Jeletőse csökketi Kismértékbe öveli Léyegébe em befolyásolja Szigifikás, de kicsi Legtöbbször kisebb Jeletőse csökketi Kismértékbe öveli Kismértékbe öveli Nem szigifikás Legtöbbször kisebb heterofília közepes értékél megszűik heterofília közepes értékél megszűik Léyegébe em befolyásolja Szigifikás, de kicsi Nagyobb (főleg kedvezőtle esetbe) Jeletőse csökketi Kismértékbe öveli Csökketi Nem szigifikás Összevetve a két becslésre voatkozó szimulációs eredméyeket, azt modhatjuk, hogy midkét becslés erőse érzékey a heterofília hatásra, azaz arra, hogy a vizsgált változó értékei szerit létrehozható csoportok között milye gyakoriságúak a kapcsolatok. meyibe a változó értékei meté a kapcsolathálózat agyo szegmetált, midkét becslés szórása magas lesz, azoba míg az RDS I becslés torzítása is megő, a megbízhatósága valamivel alacsoyabb marad, mit a kisebb torzítású, de agyobb szórású RDS II becslésé. vizsgált célcsoport átlagos fokszáma midkét becslést csak kismértékbe befolyásolja (mid torzítás, mid szórás tekitetébe). agyobb kiiduló mita közepes mértékbe képes csökketei az RDS II mita szórását, míg az RDS I becslésre alig va hatással meg kell azoba jegyezi, hogy szimulációk sorá fokszámaráyos véletle kiidulópotokat haszáltuk, amit a gyakorlatba em lehet potosa reprodukáli (bár az idézett szerzők, elsősorba Heckathor érvelek amellett, hogy a kezdőpotkeresésél a agyobb fokszámú célcsoporttagok köyebbe fellelhetők, így kvázi megvalósulhat a fokszámaráyos kezdőpot-kiválasztás). Végül úgy tűik, hogy legalábbis a jele hálózati szimulációs modellbe a em kotrollált hálózati paraméterek em játszottak jeletős szerepet a becslésekbe erre utalt az azoos paraméterekkel szimulált hálózatok közötti külöbség alacsoy (bár szigifikás) magyarázóereje a becslésekre ézve. z első kutatási kérdésük arra iráyult, hogya befolyásolják a hálózati és mitavételi téyezők a becslések torzítását és szórását, illetve mely paraméterkombiációk mellett melyik becslés (RDS I, RDS II) tekithető hatékoyabbak.

86 Szociológiai Szemle, 2013/2 heterofília, azaz a vizsgált változó meté eltérő értéket választók közötti kapcsolatok aráya gyakorolja a legjeletősebb hatást mid a becslések szórására, mid torzítására, oly módo, hogy a kisebb heterofília agyobb torzítással és a becslés agyobb szórásával jár együtt. Ez az eredméyük megfelel az idézett korábbi kutatásokak, azzal a potosítással, hogy elemzéseik sorá a fokszám-várhatóértéket és a kiiduló mita elemszámát is kotrolláltuk (azaz az összefüggések a két vizsgált paraméter mide értéke mellett igazak). heterofília mellett a fokszám is szigifikása befolyásolta mid a becslések torzítását, mid szórásukat, azoba a hatás erőssége a heterofília hatásáál gyegébb volt, általába az alacsoyabb fokszám-várhatóérték (kisebb sűrűségű hálózat) eseté a becslések valamivel kisebb torzításúak és szórásúak voltak (ez külööse az RDS II becslés eseté volt igaz). E paraméter hatására voatkozó korábbi kutatási adatot em találtuk. kiiduló mita agysága és ezzel párhuzamosa az átlagos láchossz em gyakorolt jeletős és kozisztes befolyást sem a torzításra, sem a becslések szórására. Ez az eredméyük ismét megfelel a korábbi kutatások eredméyeiek azzal a kiegészítéssel, hogy ebbe az esetbe is kotrollálta törtét a vizsgálat a többi paraméterre ézve. második kutatási kérdésük a becslések megbízhatóságára voatkozott, illetve ezzel összefüggésbe arra, hogy az egyes paraméterek ezt meyibe befolyásolják. Kutatásuk igazi újdosága, hogy az RDS I becslés eseté amely az átlagos fokszám és a heterofília becslésé alapul kimutattuk, hogy e két becslés hibája külöféle paraméterbeállítások mellett milye mértékbe járul hozzá a teljes becslés hibájához. Ezzel kapcsolatba azt állapítottuk meg, hogy elsősorba a heterofília változása határozza meg, melyik hálózati paraméter becsléséek hibája gyakorolt agyobb befolyást a becslés teljes hibájára. agyobb heterofília a heterofília-becslés hibájáak jeletőse kisebb hatásával, míg a kisebb heterofília a heterofília-becslés jeletőse agyobb hatásával jár együtt. Emellett a fokszám-várhatóérték eltéréseiek hatása jóval csekélyebb: a magasabb fokszám-várhatóérték a fokszám átlagbecsléséek a teljes becslés szórására gyakorolt valamivel kisebb hatásával jár együtt. Végül, de em utolsósorba az, hogy egy-egy paraméterbeállítással több hálózatot szimuláltuk és egy-egy hálózato több mitavételt végeztük, lehetővé tette azt is, hogy megvizsgáljuk az azoos paraméterű, de eltérő hálózatokból származó miták külöbözőségét is. Ez alapjá azt modhatjuk, hogy a hálózat egyéb, em kotrollált tulajdoságai bár szigifikás hatást gyakoroltak modellükbe, de a hatás mértéke csekély volt, így léyegébe az egyéb hálózati téyezők hatását elhayagolhatjuk. szimulációs eredméyeik több gyakorlati javaslatot is implikálak. meyyibe azt feltételezhetjük, hogy az általuk legikább fotosak tartott változók meté klasztereződik a sokaság (azaz kicsi a heterofília), akkor érdemesebb agyobb mitaméretet tervezi már a kutatásuk elejé. Összességébe sem az

Kmetty Zoltá Simo Dávid: válaszadó-vezérelt mitavétel... 87 RDS I, sem az RDS II becslés em preferálható a másikkal szembe, ha azoba a mitavételi desig több kiidulópotot tartalmaz és rövidebb lácokat, valamit a kiidulópotok eseté megközelíthető a fokszámaráyos bekerülési valószíűség, akkor az RDS II becslés valószíűleg potosabb. További fotos eredméy, hogy em kell figyelembe vei a becslés potossága szempotjából a vizsgált célcsoport kapcsolathálózatáak sűrűségét. fet leírtako túl ics agy jeletősége (legalábbis a vizsgált tartomáyo belül és a haszált mitavétel mellett) a kiidulópotok számáak. Gyakorlati szempotból további fotos eredméy, hogy érdemes mide vizsgált változó eseté az elemzést megelőzőe becslést tei a változó értékei szerit képzett csoportok összekötöttségére, és ameyibe az összekötöttség alacsoy, akkor szélesebb kofideciaitervallumokkal érdemes számoli. gyakorlati javaslatoko túl az elemzés második részébe leírt és az RDS I becslés szórásáak összetételére voatkozó eredméyek alapjá további kutatási lehetőséget látuk. zt találtuk, hogy azokba az esetekbe, amikor az RDS I becslés szórása magasabb, az ok jeletős részbe a heterofília becsléséek a hibája. zt godoljuk, hogy további kutatások iráyulhatak arra, hogy a heterofília becslését potosítsuk és ezáltal az RDS I becslést hatékoyabbá tegyük. abstract: I our paper we summarize the results of our simulatio research coected to the method of respodet drive samplig (RDS). The goal of our simulatio was to ivestigate problems related to the reliability of the method that were metioed i recet literature. s a result we coclude that the mai factors that decrease the reliability of RDS estimators are lower levels of heterophily ad to a lesser extet the higher average degree of the etwork. We also discuss what is the share of the variace of expected value estimates that ca be explaied by the error of degree estimatio. Besides the results of our simulatio we summarise literature o the RDS methodology ad the fields of possible usage of the method. Irodalom Berát. (2006): kapcsolathálózat jeletősége a migrációba etikai metszetbe. I Némedi D. Somlai P. Szabari V. Szikra D. (szerk.): Kötő-jelek 2005. ELTE Társadalomtudomáyi Kar Szociológia Doktori Iskola. Budapest. 123 146. Bozsoyi K. Jelefi G. Kmetty Z. (2008): magyarországi aktív baki ügyökök. V. HUNNET kapcsolathálózati koferecia, Budapest. Csaády M. Kmetty Z. Kucsera T. Személyi L. Tarjá G. (2008): magyar képzett migráció a redszerváltás óta. Magyar Tudomáy, 5: 603 616. Gile, K. J. M. S. Hadcock (2009): Respodet-Drive Samplig: ssessmet of Curret Methodology. Sociological Methodology, 40(1): 285 327. Goela, S. M. J. Salgaik (2010): ssessig Respodet-Drive Samplig. Proceedigs of the Natioal cademy of Scieces, 107(15): 6743 6747.

88 Szociológiai Szemle, 2013/2 Goodma, L.. (1961): Sowball Samplig. als of Mathemathical Statistics, 32: 223 258. Hárs Á. (2009): Magyarok az osztrák mukaerőpiaco: Igázók, bevádorlók, muka erő-migrások? KOPINT Kojuktúra Kutatási lapítváy. Iteret: https://skydrive.live.com/?cid=20226f10b70b2c25&id=20226f10b70b2c25%2 1311 Hárs Á. Simo D. (2009): Igázók, bevádorlók, mukaerő-migrások? Mukaerő mobilitása koferecia Országos Foglalkoztatási lapítváy, Budapest. Heckathor, D. (1997): Respodet-Drive-Samplig. Social Problems, 44(2). Kapitáy B. (2010): Mitavételi módszerek ritka populációk eseté. Statisztikai Szemle, 88(7 8): 739 754. Salgaik, M. J. D. D, Heckathor (2004): Samplig ad Estimatio i Hidde Populatios Usig Respodet-Drive Samplig. Sociological Methodology, 34: 193 239. Simo D. (2005): Kapcsolathálózati mitavételi módszer a romák migrációs poteciáljáak vizsgálatára: módszertai megfotolások. II. HUNNET kapcsolathálózati koferecia, Budapest. Simo D. (2012): Válaszadó-vezérelt mitavétel: ritka és rejtett csoportok kvatitatív vizsgálata. Statisztikai Szemle, 90(4): 249 275. Tomas,. K. J. Gile (2010): The Effect of Differetial Recruitmet. No-respose ad No-recruitmet o Estimators for Respodet-Drive Samplig. http:// arxiv.org/abs/1012.4122v1 Verdery,. M. T. Mouw (2011): Estimated Samplig Variace i Respodet Drive Samplig: Do You Kow If You Have a Imprecise Sample? Workig Paper. Volz, E. D. D. Heckathor (2008): Probability Based Estimatio Theory for Respodet Drive Samplig. Joural of Official Statistics, 24(1): 79 97.