kutatasmodszertan:ii. KOR :27 Page 1 LÁZÁR EDE KUTATÁSMÓDSZERTAN A GYAKORLATBAN AZ SPSS PROGRAM HASZNÁLATÁVAL

Átírás

1 kutatasmodszertan:ii. KOR :27 Page 1 LÁZÁR EDE KUTATÁSMÓDSZERTAN A GYAKORLATBAN AZ SPSS PROGRAM HASZNÁLATÁVAL

2 kutatasmodszertan:ii. KOR :27 Page 2 SAPIENTIA ERDÉLYI MAGYAR TUDOMÁNYEGYETEM GAZDASÁG- ÉS HUMÁNTUDOMÁNYOK KAR, CSÍKSZEREDA ÜZLETI TUDOMÁNYOK TANSZÉK

3 kutatasmodszertan:ii. KOR :27 Page 3 LÁZÁR EDE KUTATÁSMÓDSZERTAN A GYAKORLATBAN AZ SPSS PROGRAM HASZNÁLATÁVAL Scientia Kiadó Kolozsvár 2009

4 kutatasmodszertan:ii. KOR :27 Page 4 A kiadvány megjelenését támogatta: Lektor: Sorozatborító: Miklósi Dénes Descrierea CIP a Bibliotecii Naþionale a României

5 kutatasmodszertan:ii. KOR :27 Page 5 TARTALOMJEGYZÉK Előszó Alapfogalmak A tudományos kutatás típusai és folyamata A kutatási téma, a kutatási probléma meghatározása Előzetes tájékozódás A kutatási célok és hipotézisek megfogalmazása A kutatási terv elkészítése Kutatási módszerek: szekunder kutatás Szekunder keresztmetszeti kutatás Szekunder longitudinális kutatás idősorelemzés Kutatási módszerek: primer kutatás Kvalitatív kutatás Egyéni mélyinterjú Fókuszcsoport Kvantitatív kutatás Mintavétel Kérdőívszerkesztés Adatgyűjtés, terepmunka Adatelemzés Bevezetés az SPSS program használatába Változó típusok Gyakorisági eloszlás A változók jellemzői Adattábla-műveletek 86

6 kutatasmodszertan:ii. KOR :27 Page 6 6 TARTALOMJEGYZÉK 8. Változók közötti kapcsolatok vizsgálata Kereszttábla-elemzés Nominális változók közötti kereszttábla Ordinális változók közötti kereszttábla Egymintás t-próba Független mintás t-próba Egyutas varianciaanalízis Korrelációanalízis Parciális korrelációanalízis Lineáris regresszióanalízis Kétváltozós regresszióanalízis Többváltozós regresszióanalízis Függvényillesztés Az eredmények prezentálása, a tanulmány megírása Diagramkészítés Függőleges és vízszintes oszlopdiagram Kördiagram Pontdiagram Vonal- és területdiagram Radardiagram Tanulmányírás 146 Szakirodalom 151 Kivonatok 153 A szerzőről 156

7 kutatasmodszertan:ii. KOR :27 Page 7 CONTENTS Preface Base notions The typology and process of the scientific research The define of the research theme and problema Preliminary orientation The megfogalmazása definition of the research goals and hypothesis Research planning Research methods: secondary research Secondary cross-sectional research Secondary longitudinal research - time series analysis Research methods: primary research Qualitative research Personal deep interviu Focus group Quantitative research Sampling methods Editing questionaire Data collection, fieldwork Data analysis Introduction in the use of spss program Variable types Frequency The characteristics of the variables 83

8 kutatasmodszertan:ii. KOR :27 Page 8 8 CONTENTS 7.4. Data table computations The analysis of the relations between variables Crosstab analysis Crosstab between nominal variables Crosstab between ordinal variables One sample t-test Independent sample t-test One-way anova Correlation analysis Partial correlation analysis Linear regression analysis Regression analysis Multiple regression analysis Curve estimation The presentation of the results, report writing Chart editing Column and bar chart Pie chart Scatter chart Line and area chart Radar chart Report writing 146 Bibliography 151 Abstract 153 About the author 156

9 kutatasmodszertan:ii. KOR :27 Page 9 CUPRINS Introducere Noţiuni de bază Tipologia şi procesul cercetării ştinţifice Determinarea temei şi problemei ştiinţifice Orientarea preliminară Definirea scopurilor şi ipotezelor cercetării Planificarea cercetării Metode de cercetare: cercetarea secundară Cercetarea secundară secţională Cercetarea secundară longitudinală serii de timp Metode de cercetare: cercetarea primară Cercetare calitativă Intervievare personală Grupuri de focus Cercetare cantitativă Eşantionarea Editarea chestionarului Colectarea datelor Analiza datelor Introducere în folosirea programului SPSS Tipuri de variabile Frecvenţa Caracteristicile variabilelor Comenzi referitoare la tabelul de date 86

10 kutatasmodszertan:ii. KOR :27 Page CUPRINS 8. Analiza relaţiilor între variabile Tabelul de asociere Tabelul de asociere între două variabile nominale Tabelul de asociere între două variabile ordinale Testul t cu un eşantion Testul t cu eşantioni independenţi Analiza dispersională Analiza corelaţiei Analiza corelaţiei parţiale Regresia lineară Regresia lineară unidimensională Regresia lineară multidimensională Determinarea curbei de regresie Prezentarea rezultatelor, textarea raportului Editarea diagramelor Függőleges és vízszintes oszlopdiagram Kördiagram Pontdiagram Vonal- és területdiagram Radardiagram Editarea raportului 146 Bibliografie 151 Rezumat 153 Despre autor 156

11 kutatasmodszertan:ii. KOR :27 Page 11 ELÕSZÓ Akár egy halom hasított fa, hever egymáson a világ, szorítja, nyomja, összefogja egyik dolog a másikát s így mindenik determinált. József Attila: Eszmélet Reményeim szerint e könyv segít eszmélni a minket körülvevő gazdasági, szociális világban. Megtanuljuk a módját, módszertanát, hogyan kell szétszedni és megmagyarázni az egymáson heverő gazdasági, üzleti világokat, és ez megadja a lehetőséget arra is, hogy beékeljük közéjük a számításaink szerinti kis világunkat. Ezeket a világokat ugyanis emberek alkotják a maguk motivációival, akaratával, hitével, álmaival vagy, ami mostanában hangsúlyosabb, a pánikra való hajlamával. Minden súlyos determinizmusuk mellett, ha képesek vagyunk megfigyelni, mérni és elemezni a gazdasági jelenségeket, akkor akaratunkat is érvényesíthetjük közöttük. A lírainak szánt indítás ellenére a könyv célja nagyon gyakorlatias: bevezetni az olvasót a közgazdasági kutatás módszertanába, és megismertetni azokkal az elvekkel és gyakorlati technikákkal, amelyek alapján képes lesz felismerni, megmagyarázni és akár előre jelezni a gazdasági jelenségeket. A könyv a Sapientia Erdélyi Magyar Tudományegyetem különböző gazdasági szakos hallgatói számára készült jegyzet, a Kutatásmódszertan tárgy keretén belül kerül oktatásra. Fejlett gazdaságú és gazdasági oktatású államokban a kutatás-módszertani kurzus elvégzése nem csak a diplomadolgozat megírásának, de a diplomaszerzésnek is feltétele (Majoros 2001). Figyelembe véve az erdélyi magyar gazdasági oktatást és a gazdasági szakemberek lehetőségeit, elmondható, hogy az olvasói célcsoportba tartoznak azok a kis-, középvállalati menedzserek, közgazdászok is, akik több üzleti értéket jelentő információt szeretnének kinyerni a vállalati adathalmazból, vagy a piac kutatását saját erőforrásaik alapján kénytelenek megoldani. Régebben másfél-két évtizede a vállalati belső vagy külső adatok elemzése, a közgazdasági kutatás csak néhány fehérköpenyes kiberneti-

12 kutatasmodszertan:ii. KOR :27 Page ELŐSZÓ kus drága és időigényes kiváltsága volt. Az információtechnológia, majd a különböző adatelemző programcsomagok fejlődésének köszönhetően ma a tapasztalt kutatók, kutatócégek nagyon gyorsan tudnak sokféle kutatási problémát megoldani, vagy egy okos és szorgalmas hallgató államvizsgadolgozata akár komoly üzleti értéket jelenthet a vizsgált cég számára. Több mint száz marketingkutatási és más közgazdasági kutatási projekt tagjaként és vezetőjeként szerzett tapasztalat, illetve az oktatási tapasztalat alapján, a gyakorlati alkalmazásra tettem a hangsúlyt. A könyv vezérfonala a közgazdasági kutatási folyamat, az olvasó ha elsajátítja a leírtakat képes lesz végigvinni egy kutatást a tervezéstől a tanulmányírás befejezéséig. A bemutatott módszerek, modellek elméleti alapjairól csak annyiban esik szó, amennyiben azt elengedhetetlenül szükségesnek tartottam az eredmények helyes értelmezéséhez. Magyarán szólva a mire jó? kérdésre keressük a választ, azután következik a hogyan is működik?. Ha már kezdünk belejönni az egymáson heverő világok feltárásába, akkor ajánlott, hogy utánajárjunk a részletekben rejlő finomságoknak, utánaolvassunk a bemutatott módszerek irodalmának is. Félreértjük az idézett költői hasonlat célját, ha azt hisszük, hogy a módszerek rutinos begyakorlásával szellemi favágó munkába foghatunk. A kutatási adatok elemzése, a folyamat egésze alapos ismeretek mellett kreativitást is igényel. Az elméleti részben sablonok és konzervek helyett támpontokat kívánok nyújtani a gazdasági jelenségekről való strukturált gondolkodáshoz, a gyakorlati részben pedig az egyik legelterjedtebb adatelemző szoftver, az SPSS használatával ismerkedünk. Köszönettel tartozom dr. Tóthné Lőkös Klárának és Szántó Richárdnak, akik hasznos észrevételeikkel, tanácsaikkal segítettek a könyv elkészítésében. A költői hasonlattal élve lássunk neki a farakásnak, nem feledkezve meg arról, hogy egyetlen ismeret megszerzéséhez sem vezet királyi út. Csíkszereda, május Lázár Ede

13 kutatasmodszertan:ii. KOR :27 Page FEJEZET ALAPFOGALMAK A tudományos kutatásmódszertannal való ismerkedésünket kezdjük rövid tudományelméleti alapozással, az alapfogalmak definiálásával. Tudomány A tudomány tágabb értelemben a bennünket körülvevő világ megismerésének minden formáját jelenti, szűkebb (mai) értelemben csak a tudományos módszertanon alapuló megismerési folyamatot tekintjük tudományosnak. A tudományos megismerési folyamat bárki által megismételhető (reprodukálható) és azonos eredményre vezet. A szűkebb tudománydefiníció nem tartja tudományosnak a filozófiát, teológiát és művészeteket, de a szakmai tapasztalatok, technikai ismeretek megszerzésének folyamatát sem. A tudományos megismerés folyamatának további bemutatásához szükséges definiálnunk néhány alapfogalmat: Valóság. Kétféle valóságról beszélünk: tapasztalati valóság azok a dolgok, amelyeket saját közvetlen tapasztalatunkból ismerünk, konszenzuális valóság közvetlenül tapasztalatunktól függetlenül azért fogadjuk el valóságnak, mert konszenzusos egyetértés van abban, hogy az. Megfigyelés: információk gyűjtése a valóságról. A tapasztalati valóságra vonatkozó megfigyelésünket empirikus (tapasztalati) megfigyelésnek nevezzük. Állítások: a valóságról a megfigyelés során alkotott megállapítások, kijelentések. Tény: tudományos bizonyítási eljárással igazolt állítás. Törvény: tények egy osztályára vonatkozó egyetemes állítás. Elmélet: megfigyelt tények és törvények szisztematikus magyarázata. Paradigma: a tudományos társadalom által legnagyobb konszenzussal elfogadott elmélet. Pl. a mikroökonómiában, marketingben a racionálisan döntő fogyasztó, a biológiában az evolúció elmélete stb.

14 kutatasmodszertan:ii. KOR :27 Page ALAPFOGALMAK Fogalmak: az elmélet legkisebb alkotóelemei. Változók: a valóság empirikusan mért, számszerűsített jellemzői, ismérvei. Egy tudományosan elfogadott állításnak logikailag és empirikusan (tapasztalatilag) is alátámasztottnak kell lennie, elmondhatjuk, hogy a tudományos megismerés két pillére a logika és a tapasztalati megfigyelés. A tudományos megismerésnek ezeken kívül még van néhány fontos jellemzője, amelyek azonban nem minden tudományterületen érvényesek: Reprodukálhatóság. Egy tudományos állítást akkor tekintünk ténynek, ha a tudományos bizonyítási, azaz kutatási folyamat bármenynyiszer megismételhető és az eredmények lényegében nem különböznek. Ez a feltétel érvényesül a legtöbb természettudományi területen (kivétel pl. a csillagászat), de általában nem érvényesül a társadalom- és humántudományokban (pl. történelemtudomány, szociológia, közgazdaságtudomány). Reprodukálható kutatási folyamatokkal (kísérletek) a társadalomtudományokban gyakran találkozhatunk a pszichológiában, de a közgazdaságtanon belül is előfordulnak piackutatási, gazdaságpszichológiai stb. kísérletek. Kvantitatív leírás. Általános jellemző a tudományos megállapítások, összefüggések számszerűsítése. A jelenségek kvantitatív leírása és a statisztikai, matematikai módszereket használó hipotézist megfogalmazó, tesztelő és következtetést levonó folyamat jelenti a modern tudományos megismerést. Azonban vannak tudományterületek, illetve olyan jelenségek, amelyek kutatásánál nem vagy csak részben használhatjuk a kvantitatív módszereket. Ilyenek a humán tudományok (pl. történelem), de mint látni fogjuk, a közgazdasági, üzleti kutatásokban is jól meghatározott helye és funkciója van a kvalitatív kutatásoknak. Mérés, mérőeszközök és mértékegységek használata. A kvantitatív leíráshoz szorosan kapcsolódik a megfigyelés során a mérési skálák, mérőeszközök és szükségszerűen a mértékegységek használata. Értéksemlegesség. A tudományos megismerési, kutatási folyamat végeredményének tekinthető elméletek etikai értelemben értéksemlegesek, nincs jó vagy rossz tudomány. Determinizmus, oksági kapcsolatok vizsgálata. A közgazdaságtudományi kutatásokban nagy jelentősége van az oksági kapcsolatok vizsgálatának, mivel a gazdasági kapcsolatok alapjában személyközi kapcsolatok és az empirikusan gyakran megfigyelt determinizmus szemben

15 kutatasmodszertan:ii. KOR :27 Page ALAPFOGALMAK 15 áll az emberi természet szabad akarat iránti vágyával. Kérdés, hogy cselekvésünk (pl. közgazdasági preferenciarendezésünk, fogyasztói magatartásunk stb.) saját személyes akaratunk eredménye-e, vagy olyan erők és törvények kormányozzák, amit nem tudunk befolyásolni. E két szélsőség között a sztochasztikus a hatások valószínűségét elemző kapcsolatokat vizsgáljuk leginkább a közgazdasági kutatások során. Az oksági kapcsolat kritériumai: az ok időben megelőzi az okozatot; a két tényező között tapasztalati együttjárásnak kell lennie a két tényező közötti összefüggést ne lehessen valamely harmadik tényező hatásával megmagyarázni, amely mindkettőnek közös oka. A tudományos megismerés egyik pillérét jelentő logikai következtetés két alapvető formáját még a görög filozófus, Arisztotelész fogalmazta meg: Indukció egyedi, tapasztalati megfigyelésből kiindulva vonunk le következtetést, és olyan általánosan érvényes elméletet fogalmazunk meg, ami magyarázza az egyedi megfigyelést. Dedukció valamely általános törvényből indulunk ki, és alkalmazzuk azt egy konkrét, egyedi esetre, ezáltal magyarázva azt. A modern tudomány Említettük már a tudomány fogalmát, a tudományos megismerés jellemzői után nézzük meg, hogy milyen főbb szakaszokból áll a megismerési folyamat. A modern tudomány a kutatás során a pozitivistának is nevezett módszertant követi (Drótos 2000). A modern tudományos módszertan folyamata: Hipotézisek megfogalmazása. A hipotézis egy olyan állítás, amit még bizonyítási eljárással nem fogadtunk vagy nem utasítottunk el. Az egzakt, matematikai módon megfogalmazott hipotéziseket modellnek nevezzük. Szakdolgozat-példa. Egy csíkszeredai Sapientiás diák államvizsgadolgozatában megfogalmazza azt a hipotézist, hogy az egyik helyi bankfiók ügyfélkörén belül kisebb az online banki szolgáltatások igénybevételének aránya, mint az országos átlag. Tapasztalati megfigyelés. A modern tudományszemlélet szerint a világ objektív módon létező és megismerhető, azaz minden visszavezethető a tapasztalati valóságra. A megfigyelés és kísérletezés a tudományos kutatás alapja, empirikus (tapasztalati) vizsgálatok. Lényeges, hogy a

16 kutatasmodszertan:ii. KOR :27 Page ALAPFOGALMAK megfigyelést úgy tervezzük meg, hogy az eredmények alkalmasak legyenek a hipotézisek elfogadására vagy elutasítására. Ellenőrzés. A megfigyelés és/vagy a kísérlet adatainak elemzése, az eredmények és a hipotézisek összehasonlítása. Az ellenőrzés során általában előtérbe kerülnek a kvantitatív módszerek (matematika, statisztika). Elméletalkotás. Egy új elmélet megfogalmazását vagy egy meglévő elfogadását az ellenőrzés kiértékelése mellett más elméletekkel való kapcsolata, konzisztenciája is meghatározza. A posztmodern tudomány Az 1970-es évektől kezdődően egyre szélesebb körben kezdtek posztmodernnek nevezni egy, a modern tudományszemlélettől sok szempontból élesen különböző tudományfilozófiai irányzatot, a posztmodernt. A posztmodern szerint az élet szövegekből áll, amelyeket állandóan és nagyon különböző módokon olvasunk (Drótos 2000). A posztmodern tudományos módszertan jellemzői: A posztmodern a kutatási folyamat középpontjába a jelenségek párhuzamosan érvényes olvasatainak megalkotását helyezi. A posztmodernre az egyértelmű megtagadás helyett általában jellemzőbb a különböző irányzatok tudatos keverése, a klasszikusok újraértelmezése. Valamennyi tudományterületre hatással volt, és gyakran nemcsak egy újabb elméletet alkotott a meglévő paradigma mellé, hanem újszerű megközelítése akár új diszciplínákat is eredményezett. A közgazdaságtudományon belül a szervezés és vezetéstudományok nagyon sok diszciplínájában volt és van jelentős hatással. A könyvben a továbbiakban a modern tudományos megismerési folyamatot mutatjuk be.

17 kutatasmodszertan:ii. KOR :27 Page FEJEZET A TUDOMÁNYOS KUTATÁS TÍPUSAI ÉS FOLYAMATA Az adatgyűjtési technikák és az adatelemzési módszerek változatosságának köszönhetően nagyon sokféle kutatási módszer létezik. I. A kutatási módszerek legalapvetőbb osztályozása a kutatási adatok származása alapján történik: 1. Szekunder kutatás olyan kutatás, amelynek adatait más, nem az adott kutatási probléma megoldása céljából gyűjtötték. 2. Primer kutatás adatait az adott kutatási probléma megoldására gyűjtik. II. A primer kutatások a kutatási adatok jellege szerint két nagy csoportra bonthatók: 1. Kvantitatív a kutatási adatokat számszerűsíti és általában statisztikai módszereket alkalmaz az elemzés során. 2. Kvalitatív a kutatási probléma jobb megértését szolgáló módszer, amely kis mintán alapul és az eredményei nem általánosíthatók a teljes alapsokaságra. III. A kutatás időbelisége alapján is több típusú primer kutatást különböztetünk meg: 1. Keresztmetszeti kutatás az információgyűjtés a sokaság elemeiből egyszeri alkalommal vett valamely mintán alapul. Megkülönböztetjük az egyszeri és a többszöri keresztmetszeti kutatást. 2. Longitudinális kutatás rögzített, ugyanazon a mintán szabályos időközönként megismételt kutatást jelent. IV. A kutatási probléma definiáltsága alapján (Malhotra 2001): 1. Feltáró kutatás a kutatási téma pontosabb definiálása, feltárása a cél. 2. Leíró kutatás a következtető kutatás egy fajtája, amelynek a fő célkitűzése valamely gazdasági vagy társadalmi jellemzőknek vagy funkcióknak a leírása.

18 kutatasmodszertan:ii. KOR :27 Page A TUDOMÁNYOS KUTATÁS TÍPUSAI ÉS FOLYAMATA 3. Ok-okozati ok és hatás (ok-okozat) kapcsolatáról való bizonyosság megszerzésére használják. A szakirodalom nagy része ezt a tipológiát tartja alapvetőnek és ebből vezeti le a kvalitatív, kvantitatív megosztást is. Azonban a gyakorlati kutatások során ezek együttesen is megjelenhetnek, gyakoriak az olyan kutatások, amelyben mindhárom jelleg érvényesül, és szinte valamennyi jól elvégzett kutatásban találunk leíró és ok-okozati elemeket. Például egy primer kvantitatív kutatás során nagy valószínűséggel mindhárom elem megjelenik, az utóbbi kettő biztosan. Ezért nem annyira kutatástípusokról, mint kutatási jellegről beszélhetünk. A tudományos kutatás során megfigyelni kívánt valóság-sokszínűség miatt nehéz a kutatási típusok, módszerek átfedés nélküli, következetes számbavétele. Az alábbi ábrán az előbbi három osztályozási szempont, dimenzió alapján soroljuk be a leggyakrabban használt kutatási módszereket táblázat. Kutatástípusok osztályozása Kvalitatív Kvantitatív Szekunder adat keresztmetszeti: gyakori longitudinális: gyakori Primer adat keresztmetszeti: nagyon gyakori longitudinális: nagyon ritka keresztmetszeti: nagyon gyakori longitudinális: ritka Forrás: saját szerkesztés Ezeket a későbbiekben, a kutatási folyamat tervezési szakaszában részletesen fogjuk bemutatni. 1 Léteznek szekunder adatforrásokra támaszkodó kvalitatív kutatások is, például a dokumentumelemzés különböző módszerei, de ezeket a jegyzetben nem részletezzük.

19 kutatasmodszertan:ii. KOR :27 Page A TUDOMÁNYOS KUTATÁS TÍPUSAI ÉS FOLYAMATA 19 A tudományos kutatás folyamata a következő szakaszokból áll: 1. A kutatási téma meghatározása 2. Előzetes tájékozódás 3. A kutatási célok és hipotézisek megfogalmazása 4. A kutatási terv elkészítése 5. Adatgyűjtés, terepmunka 6. Adatelemzés 7. Az eredmények prezentálása, a tanulmány megírása A primer és a szekunder kutatás folyamata a negyedik szakaszban, a kutatási terv részletes kidolgozásánál kezd eltérni egymástól. Ennek ellenére mindkét típusra érvényes a fenti folyamatábra, a tartalmi eltéréseket a későbbiekben részletezzük. A kutatási folyamat részletes ismertetése előtt nézzük meg, hogy a kutatás során milyen nehézségekkel, problémákkal kell szembenéznünk: A kutatást emberekkel végezzük, ezért: viselkedésüket sok tényező befolyásolja, amelyeket nem lehet mind figyelembe venni; gyakran nehéz vagy nagyon időigényes homogén fontos ismérvek mentén hasonló mintát venni; adatvédelmi törvények szabályozzák az adatgyűjtést. Általában nem reprodukálható (szemben a természettudományos kutatással). Nem mérhető minden ismérv (lehetnek olyan fontos ismérvek, amelyek nem számszerűsíthetők, kvantifikálhatók). Felmerülnek etikai kérdések: a részvétel önkéntességével kapcsolatban; a résztvevők jogait és biztonságát garantálni kell; senkit sem érinthet hátrányosan a kutatásban való részvétel;

20 kutatasmodszertan:ii. KOR :27 Page A TUDOMÁNYOS KUTATÁS TÍPUSAI ÉS FOLYAMATA az eredmények nem hamisíthatóak, nem tulajdoníthatóak el (plágium); az eredmények tudatosan nem értelmezhetőek félre. Időbeliség a kutatás folyamán a vizsgált személyek/megfigyelési egységek változhatnak A kutatási téma, a kutatási probléma meghatározása 1. A kutatási téma meghatározása 2. Előzetes tájékozódás 3. A kutatási célok és hipotézisek megfogalmazása 4. A kutatási terv elkészítése 5. Adatgyűjtés, terepmunka 6. Adatelemzés 7. Az eredmények prezentálása, a tanulmány megírása A kutatási folyamat első és legalapvetőbb szakasza a kutatási téma meghatározása. Ezt minden más szempontnál jobban befolyásolja, hogy milyen célból végezzük a kutatást. A kutatás célja lehet: egy tudományterület, diszciplína fejlesztése (pl. a világ 62 országára kiterjedő GLOBE kutatás jelentős eredményeket hozott a szervezeti kultúra területén); valamely gyakorlati vagy elméleti probléma megoldása (pl. egy vállalatvezető választ keres arra a kérdésre, hogy miért csökken az értékesítés, vagy például azt szeretnénk tudni, hogy a romániai vállalatvezetők vezetési stílusa miben tér el mondjuk a csehországiaktól);

21 kutatasmodszertan:ii. KOR :27 Page A KUTATÁSI TÉMA, A KUTATÁSI PROBLÉMA MEGHATÁROZÁSA 21 a tudományos munkára való alkalmasság bizonyítása értekezéssel (pl. államvizsga-dolgozat). Ezután a kutatási témát két irányból is meghatározhatjuk: egy tágabb témakör szakirodalmából, gyakorlati munkáiból keressük és jelöljük ki a problémát; a problémát az élet veti fel, és ahhoz keresik a releváns témakört, felkészültséget. Ez a két irány nem kizárólagos, általában mindkettőre figyelmet kell fordítanunk. Egy diszciplína fejlesztését célzó kutatás során főképp az előbbi, míg egy gyakorlati üzleti kutatás során inkább az utóbbi irányból indulunk ki. Az államvizsga-dolgozat szerzője számára ajánlott mindkét irányt szem előtt tartani. A kutatási téma meghatározásával egy időben meg kell fogalmaznunk azt is, hogy kikre vonatkozik a kutatásunk, ki a célcsoport. A kutatási folyamat negyedik szakaszában a kutatás megtervezésénél ezt a kérdést alaposan megvizsgáljuk, de már a téma megfogalmazása sem választható el attól a kérdéstől, hogy kire lesz érvényes a kutatási eredmény. Szakdolgozat-példa: könyvünkben a kutatás folyamatát egy államvizsga-dolgozat elkészítésének folyamatával példázzuk. Egy végzős diák úgy dönt, hogy valamilyen banki témában szeretne dolgozatot írni. Mivel tanulta és már használja az internetes banki szolgáltatásokat, ezért a kutatási témát a lakossági internetes banki szolgáltatásokra szűkíti. A célcsoport tehát a lakossági banki ügyfelek. A témaválasztás során a következőkre figyeljünk: A kutatási téma legyen érdekes, amit még mások lehetőleg nem kutattak. Legyen beazonosítható, hogy milyen tudományterület(ek)hez tartozik a témánk. Időbeli határai legyenek egyértelműek. Határozzuk meg, hogy kikre vonatkozik a kutatás. Valódi kutatási célokat és hipotéziseket fogalmazzunk meg. Készítsünk egy feltételes vázlatot, amit az előzetes tájékozódás során ellenőrizünk.

22 kutatasmodszertan:ii. KOR :27 Page A TUDOMÁNYOS KUTATÁS TÍPUSAI ÉS FOLYAMATA 2.2. Előzetes tájékozódás 1. A kutatási téma meghatározása 2. Előzetes tájékozódás 3. A kutatási célok és hipotézisek megfogalmazása 4. A kutatási terv elkészítése 5. Adatgyűjtés, terepmunka 6. Adatelemzés 7. Az eredmények prezentálása, a tanulmány megírása A kutatási témánkhoz kapcsolódó előzetes tájékozódás a következőket tartalmazza: 1. a szakirodalom megismerése; 2. szakértői megkérdezés; 3. próbakérdezés; 4. szekunder kutatási eredmények gyűjtése. 1. A szakirodalom megismerése Az előzetes tájékozódás legelső lépése a szakirodalom (bibliográfia) alapos megismerése. Természetesen a kutatási téma meghatározása már a szakirodalom valamilyen szintű ismeretét feltételezte, de ennél a pontnál a kutatási témánk legelfogadottabb elméleti modelljeivel, fogalmi keretével és legfontosabb kutatási eredményeivel ismerkedünk meg. A szakirodalom megismerése a következő forrásokból indulhat ki: Előzetes források: betűrendes, szak-, folyóirat-katalógusok; a könyvtári Egyetemes Tizedes Osztályozás (ETO) használata; referáló folyóiratok. Elsődleges forrásoknak nevezzük a különböző kutatások eredmé-

23 kutatasmodszertan:ii. KOR :27 Page ELŐZETES TÁJÉKOZÓDÁS 23 nyeiről közvetlenül beszámoló kutatási beszámolókat, monográfiákat, disszertációkat, folyóiratcikkeket. Másodlagos források. Az elsődleges források alapján készített összefoglalók, elemzések áttekinthetőbb képet adnak az adott kutatási területről. Például lexikonok, enciklopédiák, tankönyv, jegyzet, tanulmánykötetek, cikkek. A témában újdonsült kutatónak ajánlott a másodlagos források feldolgozásával kezdeni. A szakirodalom feldolgozásának különböző technikái vannak. A hagyományos technikák, mint például a jegyzetelés, cédulázás, kulcsszavak definiálása és keresése számítógépesített alkalmazása felgyorsítja a folyamatot. 2. Szakértői megkérdezés az adott kutatási téma szakértőivel folytatott interjúk, amelyek segíthetnek a kutatási téma pontosabb behatárolásában. Tőlük általában a kvalitatív kutatási módszereknél részletezett egyéni mélyinterjúhoz hasonló módszertannal, formális kérdőív nélküli személyes interjúval nyerhetünk információkat. Szakdolgozat-példa: az internetes banki szolgáltatások államvizsgatémát választó hallgatónk az egy-két szakkönyvrészletből és több jó szakfolyóiratból álló szakirodalom megismerése után interjút kér egy banki szakembertől és/vagy a témában jártas kutatótól. Hasonlóképp más kvalitatív kutatási módszert is felhasználhatunk e célra, mint például a fókuszcsoport, ami adott esetben vagy szakértőkből, vagy a megfigyelni kívánt kutatási sokaságból álló csoporttal folytatott csoportos interjút jelenti. A fókuszcsoport módszertanára vonatkozó további információt a kvalitatív kutatások leírásánál találunk. Ha lehetőségünk adódik fókuszcsoport alkalmazására, akkor eldöntendő, hogy csak az előzetes tájékozódás során részlegesen alkalmazzuk, vagy egy teljes kvalitatív kutatással alapozzuk meg a kvantitatív kutatást. 3. Próbakérdezés (pilot interjú): a kutatási téma feltárására irányuló, a célcsoportba tartozó néhány személlyel folytatott, strukturált kérdezés. Abban az esetben alkalmazzuk, ha a kutatási téma meghatározásánál nagy valószínűséggel kiderült, hogy melyek a főbb kutatási célok és milyen módszertant választunk. Próbakérdezés gyakori a kvantitatív kérdőíves kutatásoknál, főképp azoknál, amelyeket nem előzött meg

24 kutatasmodszertan:ii. KOR :27 Page A TUDOMÁNYOS KUTATÁS TÍPUSAI ÉS FOLYAMATA egy kvalitatív kutatás és ahol a kutatási hipotézisek megfogalmazásánál vannak bizonytalanságok. Itt jegyezzük meg, hogy a kvantitatív kutatás során, a kérdőív elkészítésének végén mindig van próbakérdezés, de ez általában csak a formai, logikai, szerkezeti szempontokat vizsgálja. Az előzetes tájékozódás során végzett próbakérdezés a tartalomra irányul, fő célja a kutatási téma jobb megértése. Kvalitatív kutatások során is alkalmazhatunk próbakérdezést, vagy mivel a módszerek egy része nem megkérdezéses, ezért nevezhetjük próbakutatásnak is. Például a kvalitatív kutatások körébe soroljuk az internetes honlapok tesztjét, amelynek során a célsokaságból kiválasztott mintába tartozó személyek körében vizsgáljuk a honlap funkcionális, esztétikai, ergonómiai jellemzőit, összességében azt, hogy mennyire tölti be a tervezett funkciókat. Ilyen kutatásoknál (sem) elegendő egy módszertani sablon automatikus átvétele, akár többszöri próbakérdezés során kell a kutatási módszert a vizsgált témához igazítani. 4. Szekunder kutatási eredmények gyűjtése. A szakirodalom megismeréséhez szorosan kapcsolódik, de módszertani szempontból főképp a feldolgozás, adatelemzés során különbözik a szekunder adatok elemzése. A kvalitatív módszerekhez hasonlóan, amennyiben a kutatási idő- és költségkeret engedi, akkor a szekunder kutatás teljes módszertanát alkalmazhatjuk egy primer kutatás előzetes tájékozódása során. Ennek részletes ismertetését a későbbiekben láthatjuk.

25 kutatasmodszertan:ii. KOR :27 Page A KUTATÁSI CÉLOK ÉS HIPOTÉZISEK MEGFOGALMAZÁSA A kutatási célok és hipotézisek megfogalmazása 1. A kutatási téma meghatározása 2. Előzetes tájékozódás 3. A kutatási célok és hipotézisek megfogalmazása 4. A kutatási terv elkészítése 5. Adatgyűjtés, terepmunka 6. Adatelemzés 7. Az eredmények prezentálása, a tanulmány megírása A kutatási folyamat ebben a szakaszában arra keressük a választ, hogy milyen tudományos állítást akarunk megfogalmazni, vagy milyen üzleti problémára keressük a megoldást. A kutatási célok megfogalmazása a fő kutatási téma több kutatási kérdésre való szétbontását, operacionalizálását jelenti. Továbbá egy kutatási cél egy vagy több kutatási hipotézisnek feleltethető meg. A kutatási hipotézis olyan állítás, melyben a kutatási témára, annak változóira vagy ezek kapcsolatára vonatkozó, önálló feltételezéseinket fejezzük ki. Feltételezés, amely alapulhat sejtésen vagy korábbi kutatások eredményein. Szakdolgozat-példa: államvizsgázó hallgatónk a szakirodalom átnézése és egy-két szakértői interjú után megfogalmazza a konkrét kutatási célt. A csíkszeredai X bankfiók lakossági ügyfélkörén belül az interneten keresztül elérhető banki szolgáltatások (online banking) iránti potenciális keresletet fogja felmérni és a szolgáltatást már igénybe vevők szegmensének a jellemzését vágzi el. A jó kutatási hipotézis az alábbi jellemzőkkel rendelkezik: egyértelmű kijelentő mondatban van megfogalmazva;

26 kutatasmodszertan:ii. KOR :27 Page A TUDOMÁNYOS KUTATÁS TÍPUSAI ÉS FOLYAMATA magyarázatot ad a kutatási problémára; ok-okozati kapcsolat vizsgálata esetén jelöljön egyértelmű kapcsolatot; egyszerűen és tömören van fogalmazva; a kutatás megkezdése előtt fogalmazzuk meg. A kvalitatív és kvantitatív kutatások vízválasztója a kutatási hipotézisek megfogalmazása és ellenőrzése, tesztelése. A kvantitatív kutatások során a kutatási hipotéziseket a statisztikai hipotézisvizsgálat módszereivel teszteljük, míg a kvalitatív kutatási adatok elemzésénél a kutató szubjektív elemzőképessége a döntő. Statisztikai hipotézis A kutatási hipotézis további formalizálása nyomán jutunk a statisztikai hipotézishez, ami a megfigyelt sokaság valamely ismérvére vonatkozó egyszerű matematikai formába öntött állítás. Kvantitatív kutatások során valamennyi kutatási célt és az abból következő kutatási hipotézist végső soron statisztikai hipotézisvizsgálattal ellenőrizzük. A hipotézisvizsgálat statisztikai módszer, amely segítségével eldöntjük, hogy hipotézisünket elfogadjuk vagy elutasítjuk. A hipotézisvizsgálat folyamata (Tóthné Lőkös 2008 alapján): 2 1. a statisztikai hipotézis megfogalmazása a kutatási hipotézis alapján, H 0 és H 1 felállítása; 2. a szignifikanciaszint (α) kiválasztása; 3. a próbafüggvény megválasztása és aktuális értékének kiszámítása; 4. kritikus érték kikeresése a megfelelő táblázatból; 5. döntés a hipotézis (H 0 ) elfogadásáról vagy elvetéséről; 6. szakmai következtetés levonása a hipotézisnek megfelelően. A statisztikai hipotézisvizsgálatot tehát valamennyi hipotézisünkre el kell végeznünk. Ezért annak ellenére, hogy a mai adatelemző, statisztikai programcsomagok a fenti folyamat nagyját automatikusan elvégzik, a következőkben részletesen ismertetjük a hipotézisvizsgálat folyamatát. Egy tapasztalt kutató a hipotézisvizsgálat folyamatából többnyire csak az első (a statisztikai hipotézis megfogalmazása) és az utolsó (a szakmai következtetés levonása) szakasznál dolgozik, a többi a számítógép feladata, de természetesen jó, ha ismeri a többi részfolyamatot is. 2 Az említett szakirodalomban a hipotézisvizsgálat első lépése a szakmai probléma felvetése, a kutatási hipotézis megfogalmazása, mi ezt a korábbiakban külön tárgyaltuk.

27 kutatasmodszertan:ii. KOR :27 Page A KUTATÁSI CÉLOK ÉS HIPOTÉZISEK MEGFOGALMAZÁSA A statisztikai hipotézis megfogalmazása A statisztikai hipotézist a kutatási hipotézisből vezetjük le úgy, hogy a verbális állítást matematikai, logikai formába öntjük. A statisztikai hipotézis a sokasági ismérvek (változók) eloszlásának a paramétereire (átlag, szórás vagy az eloszlás típusa) vonatkozik. A kutatási hipotézis elfogadását úgy szigorítjuk, hogy a hipotézis tagadását jelentő állítást tekintjük kiindulásként érvényesnek, ettől pedig csak akkor állunk el, ha ez a hipotézis vizsgálat alapján indokolt (Hajdu 2003). E nyakatekertnek tűnő megközelítés mögött matematikai-statisztikai indokok állnak. A kutatási hipotézis érvénytelen voltát jelentő állítást nevezzük alap- vagy nullhipotézisnek (H 0 ), az alternatíváját képező kutatási hipotézist pedig alternatív hipotézisnek (H 1 ). A nullhipotézis (H 0 ) mindig az ismérvek egyenlőségét fogalmazza meg, az alternatív hipotézis (H 1 ) pedig értelemszerűen ennek alternatíváját. A hipotézisvizsgálatot egy, illetve két változó esetén végezhetjük el, a null-, illetve az alternatív hipotézis megfogalmazását a már elkezdett szakdolgozat-példánkon keresztül mutatjuk be. Szakdolgozat-példa: megállapítottuk, hogy kutatási célunk a csíkszeredai X bankfiók lakossági ügyfélkörén belül az interneten keresztül elérhető banki szolgáltatások (online banking) iránti potenciális kereslet vizsgálata, illetve a szolgáltatást már igénybe vevők szegmensének a jellemzése. Ezek alapján az egyik kutatási hipotézisünk az, hogy a csíkszeredai X bankfiók lakossági ügyfélkörén belül az online banking szolgáltatást igénybe vevők aránya eltér az országos banktól független átlagtól. I. Egy változó esetén egy mintabeli változót össze akarunk hasonlítani egy külső, nem mintabeli értékkel. Alaphipotézis (H 0 ): Pl. a bankfiók lakossági ügyfélkörén belül az online banking szolgáltatást igénybe vevők aránya megegyezik az országos banktól független aránnyal. Alternatív hipotézis (H 1 ): Kétoldali alternatív hipotézis: Pl. a két arány nem egyenlő. Egyoldali alternatív hipotézis: bal oldali: Pl. a helyi arány nagyobb az országosnál; jobb oldali: Pl. a helyi arány kisebb az országosnál.

28 kutatasmodszertan:ii. KOR :27 Page A TUDOMÁNYOS KUTATÁS TÍPUSAI ÉS FOLYAMATA II. Két változó esetén két mintabeli változó statisztikáit (átlagát, szórását vagy eloszlását) hasonlítjuk össze egymással. Alaphipotézis (H 0 ): Pl. a bankfiók lakossági ügyfélkörén belül az online banking szolgáltatást igénybe vevő férfiak és nők aránya azonos. Alternatív hipotézis (H 1 ): Kétoldali alternatív hipotézis: Pl. a két arány nem egyenlő. Egyoldali alternatív hipotézis: bal oldali: Pl. a férfiak aránya nagyobb; jobb oldali: Pl. a férfiak aránya kisebb. A hipotézisvizsgálat során tehát a sokaság valamely ismérvéről megfogalmazott állításunk igaz voltát ellenőrizzük úgy, hogy a sokaságból vett véletlen minta statisztikáit összehasonlítjuk ún. tesztstatisztikákkal. De a véletlen minta statisztikáinak hipotézisvizsgálata során kétféle hibát is elkövethetünk: 2. táblázat. A hipotézisvizsgálat lehetséges hibái Döntés Tény Igaz Hamis Elfogadjuk Helyes döntés (1 α) Másodfajú hiba (β) Elvetjük Elsőfajú hiba (α) Helyes döntés (1 β) Forrás: Szűcs Elsőfajú hiba (α-val jelöljük): a nullhipotézis igaz, de mi elutasítjuk. Az elsőfajú hiba elkövetésének valószínűségét szignifikanciaszintnek nevezzük. A másodfajú hibát (β) akkor követjük el, ha a nullhipotézis nem igaz, de mi elfogadjuk. 2. A szignifikanciaszint (α) megválasztása a kutató szubjektív döntése, a legáltalánosabban elfogadott szignifikanciaszint az 5%. Ettől az értéktől természetesen eltérhetünk lefele vagy felfele, ezáltal fokozva, illetve lazítva a hipotézisvizsgálat szigorát. A statisztikai programcsomagokban vagy beállítható a szignifikanciaszint, vagy a teszt eredménye egy ún. empirikus szignifikanciaszinttel (P érték) számol, ami az a legkisebb valószínűség, amely mellett a H 0 elvethető H 1 -gyel szemben. Például ha az SPSS programmal vizsgáljuk két változó átlagának azonosságára vonatkozó nullhipotézist és az eredmény P = 0,02, akkor

29 kutatasmodszertan:ii. KOR :27 Page A KUTATÁSI CÉLOK ÉS HIPOTÉZISEK MEGFOGALMAZÁSA 29 98%-os biztonsági szinten állíthatjuk, hogy a két változó átlaga különbözik. Másképp fogalmazva: ha H 0 -t elutasítjuk, akkor 2% az esélye, hogy hibásan döntöttünk és 98% a valószínűsége, hogy helyes döntést hoztunk. Figyelembe véve, hogy a legáltalánosabban elfogadott szignifikanciaszint az 5%, megfogalmazhatjuk a kvantitatív elemzések leggyakrabban igénybe vett, legnépszerűbb aranyszabályát: ha az empirikus szignifikanciaszint kisebb mint 5% (P < 0,05), akkor állíthatjuk, hogy a vizsgált két érték nem azonos, eltér egymástól! 3. A próbafüggvény értékének és a kritikus értéknek a kiszámítása A mintabeli változó adatai alapján kiszámoljuk az ún. próbafüggvény értékét. A hipotézistől függően az alábbi próbafüggvényeket alkalmazzuk a leggyakrabban: 3 a változó középértékére (átlagára) vonatkozó próbák: t-próba és z- próba; szórások összehasonlítására vonatkozó próba: F-próba; eloszlásokra vonatkozó próba: Khi-négyzet próba. 4. A kritikus érték kikeresése a megfelelő táblázatból A próbafüggvény értékének kiszámítása után egy táblázatból kikeressük a kritikus értéket, amit a próbafüggvény, a választott szignifikanciaszint és a minta elemszámának ismerete alapján egyértelműen meghatározhatunk. A mintaelemszámot nem közvetlenül használjuk, hanem egyes próbafüggvényeknél, mint például a t-próba, F-próba, ez alapján számoljuk ki az úgynevezett szabadságfokot 4 (df). A különböző próbafüggvények esetében eltérő módon számoljuk ki a szabadságfok értékét, a legegyszerűbb esetben eggyel csökkentjük a mintaelemszámot (df = n 1). 5. Döntés a statisztikai hipotézis elfogadásáról vagy elvetéséről A szignifikanciaszint meghatározása, a próbafüggvény értékének kiszámolása és a kritikus érték táblázatból való kikeresése után a döntés már automatizmus, a két értéket összehasonlítva fogadjuk vagy utasítjuk el a nullhipotézist. Mérlegelnünk akkor kell, ha az előre meghatározott szignifikanciaszinten nem utasítható el a nullhipotézis, de a szignifikancia- 3 A próbafüggvények eszköztára bővülhet aszerint, hogy egy- vagy kétmintás próbákról beszélünk. 4 A szabadságfokot angol elnevezése degree of freedom alapján általában dfnek rövidítjük.

30 kutatasmodszertan:ii. KOR :27 Page A TUDOMÁNYOS KUTATÁS TÍPUSAI ÉS FOLYAMATA szint növelésével már elutasíthatóvá válik. Ez azt jelenti, hogy nem 95%- os biztonsági szinten utasítjuk el a nullhipotézist, hanem csak 90%-oson. A statisztikai programcsomagok előbb ismertetett empirikus szignifikanciaszintje megkímél attól, hogy az újabb szignifikanciaszinteknek megfelelő kritikus értéket újra és újra kikeressük addig, amíg megtaláljuk azt a legkisebb hibavalószínűséget, amely mellett a nullhipotézis elutasítható. 6. A szakmai következtetés levonása A statisztikai hipotézisvizsgálat után a statisztika területéről visszajutunk arra a tudományterületre, amelyre a kutatási témánk vonatkozik. Megvizsgáljuk, hogy a kutatási hipotézisünk elfogadása vagy elutasítása alapján az adott kutatási témához kapcsolódóan milyen szakmai következtetéseket fogalmazhatunk meg. Lehetséges, hogy a végeredményhez jutottunk és már csak az eredmények prezentálására kell figyelnünk, de az is lehet, hogy az eredmények újabb kutatási hipotéziseket vetnek fel. Szakdolgozat-példa. Azt találtuk, hogy a csíkszeredai X bank lakossági ügyfélkörének az online bankinget igénybe vevők aránya az országos átlag alatt van. Az okok kereséséhez a következő további kérdésekre kell választ találnunk: Mekkora az X bank online bankingelő ügyfeleinek országos aránya? Ezzel a külső, nem a kutatásból származó információval azt a hipotézist ellenőrizzük, hogy az X banknak általában, országosan is kevesebb internetes szolgáltatást igénybe vevő ügyfele van, mint a többi banknak. Ha igazolódott, hogy nem a bank online banking stratégiájával van a probléma, akkor a csíkszeredai ügyfélkör az országos átlag alatti keresletére kell magyarázatot találnunk: a csíkszeredai internetkapcsolattal rendelkező háztartások aránya kisebb, mint az országos átlag; a csíkszeredai X bankfiók ügyfélkörének más az online bankinget is meghatározó demográfiai összetétele, mint az országos átlag; hasonló internetpenetráció és a banki ügyfélkör hasonló demográfiai összetétele mellett is előfordulhat, hogy az online banking még nem érkezett meg, nem jutott el a fogyasztók tudatába. Megjegyzendő, hogy a kutatási hipotéziseken túl a statisztikai hipotézisvizsgálat részleteit nem minden kutató szokta feltüntetni egy

31 kutatasmodszertan:ii. KOR :27 Page A KUTATÁSI TERV ELKÉSZÍTÉSE 31 nagyobb kutatás eredményeit bemutató tanulmányában, de a kutatás módszertani felkészültségéről bizonyságot tevő egyetemi vagy doktori hallgatóknak ez mindenképp ajánlott A kutatási terv elkészítése 1. A kutatási téma meghatározása 2. Előzetes tájékozódás 3. A kutatási célok és hipotézisek megfogalmazása 4. A kutatási terv elkészítése 5. Adatgyűjtés, terepmunka 6. Adatelemzés 7. Az eredmények prezentálása, a tanulmány megírása A kutatási hipotézisek konkretizálása során olyan kérdések is felmerülnek (Kikre vonatkozik a kutatás? A teljes alapsokaságot vizsgálom vagy csak egy mintát belőle? Milyen változókkal tudom számszerűsíteni a kutatási hipotézist?), amelyek megválaszolása átvezet bennünket a kutatási folyamat következő szakaszába: a kutatási terv elkészítéséhez. A kutatási terv a kutatási hipotézisek vizsgálatához szükséges adatok megszerzésének és elemzésének a részleteit adja meg. A kutatási terv legfontosabb részei: 1. a kutatási módszer(ek) kiválasztása, 2. mintavételi terv, 3. kérdőívszerkesztés, 4. adatelemzési terv. A kutatási terv alapján nem utolsósorban képesek leszünk a kutatás idő- és költségigényét is meghatározni.

32 kutatasmodszertan:ii. KOR :27 Page A TUDOMÁNYOS KUTATÁS TÍPUSAI ÉS FOLYAMATA Kutatási módszerek A kutatás részletes tervezési szakaszában az első feladatunk a kutatási módszer vagy akár módszerek kiválasztása. A következőkben a különféle kutatási módszereket, típusokat mutatjuk be a korábban ismertetett tipológiának megfelelően. A kutatási témánk meghatározása, az előzetes tájékozódás és kutatási célok megfogalmazása után érdemes mindenekelőtt definiálnunk, hogy milyen jellegű a kutatásunk vagy milyen jelleg lesz a domináns. 1. Feltáró jellegű kutatás: a kutató az előzetes tájékozódás után is csak kevés információval rendelkezik az adott kutatási témáról, nem tud pontos kutatási hipotéziseket megfogalmazni. Az információszükségletet csak nagyvonalakban lehet meghatározni. A kiválasztott minta kicsi és nem megfelelően reprezentálja a sokaságot, egyféle betekintést nyújt a sokaság elemeibe. A feltáró kutatásokat rugalmasság és módszertani változatosság jellemzi, formális kutatási tervet nem alkalmaznak szakértői megkérdezés szükséges. 2. Leíró jellegű kutatás: fő célkitűzése valamely gazdasági vagy társadalmi jellemzőknek vagy funkcióknak a leírása. Előre megfogalmazott specifikus kutatási hipotézisek és a probléma pontos megfogalmazása jellemzi, általában nagy reprezentatív mintákon alapul, előre tervezett és jól strukturált kutatási tervvel meghatározza az információforrásokat és az adatgyűjtés módját. 3. Ok-okozati jellegű kutatás: ok és hatás (ok-okozat) kapcsolatáról való bizonyosság megszerzésére használják. Hasonlóan a leíró kutatásokhoz, az ok-okozati kutatásokat is előre tervezett módon és strukturáltan kell felépíteni. Célja annak megértése, hogy mely változók az okozók (független) és melyek az okozatok (függő változók), illetve a független változók közötti kapcsolat természetének meghatározása. Mint említettük, a gyakorlati kutatások során ezek együttesen is megjelennek, ezért nem élesen elkülönülő kutatástípusokról, hanem kutatási jellegről beszélünk. Például összetett, jól felépített kutatásoknál gyakori, hogy a kutatási téma előzetes megismerésénél alkalmazott szekunder vagy kvalitatív kutatásban egyértelműen a feltáró jelleg dominál, ezt követi egy kvantitatív kutatás, amelyben egyaránt megtaláljuk a leíró és az ok-okozati részeket. Ma már inkább minőségi szinteket jelölnek ezek, piackutatóktól nem fogadnak el olyan elemzést, amelyben leírják ugyan a gazdasági jelenséget, de nem keresnek magyarázatot, ok-okozati összefüggést a leírt jelenségekre.

33 kutatasmodszertan:ii. KOR :27 Page A KUTATÁSI TERV ELKÉSZÍTÉSE 33 A kutatási módszereket tehát a kutatási adatok származása, jellege és az időbelisége alapján csoportosítjuk. Az alábbi táblázatban e három dimenzió mellett megjelenítettük azt is, hogy a különböző módszerek mennyire jellemzőek az üzleti, a tudományos és az államvizsga-dolgozat megírása céljából végzett kutatások körében. 3. táblázat. Kutatástípusok osztályozása Szekunder adat Primer adat Kvalitatív Kvantitatív 1. szekunder-kvantitatívkeresztmetszeti üzleti: gyakori tudományos: gyakori államvizsga: gyakori 2. szekunder -kvantitatívlongitudinális: üzleti: gyakori tudományos: nagyon gyakori államvizsga: gyakori 3. primer-kvalitatívkeresztmetszetikeresztmetszeti: 5. primer-kvantitatív- üzleti: nagyon gyakori üzleti: nagyon gyakori tudományos: nagyon gyakori tudományos: nagyon gyakori államvizsga: gyakori államvizsga: gyakori 4. primer-kvalitatívlongitudinális: üzleti: ritka tudományos: nagyon ritka államvizsga: - 6. primer-kvantitatívlongitudinális üzleti: gyakori tudományos: ritka államvizsga: nagyon ritka Forrás: saját szerkesztés A kutatási módszer kiválasztásának egyik fontos szempontja, hogy a kutatási sokaságról mi gyűjtjük össze a kutatási adatokat (primer kutatás) vagy más felmérések, kutatások adataiból és eredményeiből új következtetéseket vonunk le (szekunder kutatás). Nézzük előbb a szekunder kutatások jellemzőit!

34 kutatasmodszertan:ii. KOR :27 Page 34

35 kutatasmodszertan:ii. KOR :27 Page FEJEZET KUTATÁSI MÓDSZEREK: SZEKUNDER KUTATÁS A szekunder kutatás tehát olyan kutatás, amelynek adatait más, nem az adott kutatási probléma megoldása céljából gyűjtöttek (Malhotra 2001). Hangsúlyoznunk kell, hogy annak ellenére, hogy más kutatás során létrehozott adatokat használunk, a kutatásunk nem más kutatás reprodukálása, hanem új kutatási eredmények megfogalmazását jelenti. Nem arról van szó, hogy a szekunder kutatás során nincs adatgyűjtés általában a teljes kutatási idő arányában több időt kell fordítanunk adatgyűjtésre, mint a primer kutatásnál, hanem a tapasztalati megfigyeléseket nem mi számszerűsítjük, nem mi mérjük. A piackutatásban a szekunder kutatást a terepmunka hiánya miatt íróasztal-kutatásnak (desk research-nek) nevezik. A szekunder kutatás előnyei a primer kutatáshoz képest: Idő-, munka- és pénzmegtakarítás. Valóban a primer kutatás sok közvetlen és közvetett költsége nem jelenik meg egy szekunder kutatásnál, de a munkaidő igénye a vártnál nagyobb lehet. Paradox módon a szekunder kutatás alapját képező adatforrások túláradó bősége növelheti a kutatás időigényét. Például a lehető legegzaktabban megfogalmazott internetes keresés ellenére is több ezer oldal salak közül kell kiemelnünk az újracsiszolandó gyémántunkat. Ennek ellenére ha rendelkezésünkre állnak a megfelelő adatok akkor a szekunder kutatás jóval gyorsabb és olcsóbb a primernél. Olyan adatokhoz való hozzáférés, amelyeket primer adatgyűjtéssel nem tudnánk összegyűjteni. Legfontosabb indoka a szekunder kutatásoknak az, ha a kutatási témánk szempontjából meghatározó adatok olyan jellegűek, hogy a primer adatgyűjtés lehetetlen a kutatásunk térbeli, időbeli és erőforráskorlátai miatt. Például a nemzetközi vagy akár országos összehasonlításhoz szükséges adatok vagy kutatásunk olyan megfigyelési egységekre vonatkozik, amelyek mérésére nincs lehetőségünk, ilyenek pl. a vállalati értékesítési, termelési adatok. A szekunder kutatás hátrányai: Régi adatok. Még az olyan kutatásnál is, ahol a kutatás alapvető célja a kutató felkészültségének a bizonyítása (államvizsga-dolgozat), nem aján-

36 kutatasmodszertan:ii. KOR :27 Page KUTATÁSI MÓDSZEREK: SZEKUNDER KUTATÁS lott egy-két évesnél régebbi adatokat használni, inkább váltsunk kutatási témát, vagy egy kisebb primer kutatással szerezzük be a szükséges adatokat. Pontatlan, tudománytalan források az adatok hitelességére, pontosságára nincs garancia, ezért törekedjünk neves intézményektől, kutatócégektől megszerezni az adatokat. Az adatok szerkezete nem felel meg az adatigényünknek. A leggyakoribb és legbosszantóbb problémája a szekunder kutatásnak, ha a kutatási céljainknak megfelelő friss adatokat találunk, de olyan szerkezetben, hogy nem tudjuk az elvárásainknak megfelelően átstrukturálni. Példa: a Hargita megyei vállalati szegmens egy komplex versenyképességi mutatóját szeretnénk létrehozni, de hipotézisünk szerint a versenyképességet befolyásoló alapadatok (a vállalati szegmensre, infrastruktúrára, demográfiára vonatkozó adatok stb.) nem találhatók megyei szinten, csak a Központi Régióra vonatkozó bontásban. A szekunder kutatást tehát egyaránt tekinthetjük kényszerűségnek a primer adatgyűjtés kivitelezhetetlensége miatt, és lehetőségnek is, ha találunk a kutatási témánk szempontjából releváns adatforrásokat, és nem szükséges a költségesebb primer kutatást lefolytatnunk. A gyakorlati tapasztalat alapján legtöbbször az a helyzet áll elő, hogy a szekunder adatok nem teljes mértékben felelnek meg a kutatási céljainknak, és ekkor vagy a célok kompromisszumos újratervezésére van szükség, vagy primer kutatásra törekszünk. Ezért a kutatás megtervezésének nagyon fontos eleme, hogy tisztában legyünk a kutatási célok eléréséhez szükséges adatok jellegével és begyűjtési lehetőségével. Adatgyűjtésünket is felgyorsítja, áttekinthetőbbé teszi, ha rendszerezzük a szekunder információforrásokat: 1. az adathordozó alapján, 2. az adatok tartalmi jellege alapján, 3. az adatközlő alapján. 1. A szekunder kutatás információforrásait az adathordozók alapján csoportosíthatjuk: internet, elektronikus média, nyomtatott média. Nyilvánvalóan a három közül a legfontosabb az internet, ma már nem nagyon van olyan fontos információ, amelynek ne lenne elektronikus ver-

37 kutatasmodszertan:ii. KOR :27 Page KUTATÁSI MÓDSZEREK: SZEKUNDER KUTATÁS 37 ziója és azt ne tennék fel az internetre, de a nyomtatott sajtóban, könyvekben, statisztikai kiadványokban is találhatunk kutatásunk szempontjából lényeges információkat. Az elektronikus médiára jellemző példa az üzleti kutatások alapsokasági nyilvántartását jelentő cégadatbázisok. Ezek a CD-n elérhető adatbázisok általában egy multinacionális szakosított cég termékei, és meglehetősen nagy pontossággal tartalmazzák egy országban bejegyzett valamennyi cég alapvető adatait. Ezeket az információkat leggyakrabban direkt marketingcélra használják, de a vállalati szegmensre vonatkozó kutatások során a piackutató cégek, kutatók számára a mintavétel alapja. Hasonló adatbázisokat még a statisztikai hivatalok is szolgáltatnak. De a szekunder adatok legkézenfekvőbb és legtöbb adatot tartalmazó tárhelye az internet. Adatgyűjtési szempontból fontos megkülönböztetnünk a fizetős és az ingyenes oldalakat. Fizetős adatforrások. A szekunder kutatásunk sokkal gyorsabb lehet és a kutatási céljainknak pontosabban megfelelő adatokat találhatunk, ha a különböző adatbázisok elérését lehetővé tevő internetes oldalak (portálok) szolgáltatásait vesszük igénybe. Példa. A magyar állam lehetőséget biztosít többek közt a Sapientia egyetem tanárainak és diákjainak az Elektronikus Információszolgáltatás (EISZ) program internetes portálán keresztül a világ fontosnak tartott tudományos folyóiratainak teljes vagy részleges anyagához való hozzáféléshez valamennyi tudományterületen. Mivel a hallgatók kutatásaihoz, államvizsga-dolgozatához ez az információforrás nélkülözhetetlen, ezért az alábbiakban részletesen ismertetjük. Az elérhető információforrások körébe az alábbi adatbázisok tartoznak (forrás: ): Web of Science az ISI (Institute for Scientific Information) bibliográfiai adatbázisa. Interdiszciplináris adatbázis, amelynek heti frissességgel közreadott anyaga a tudomány egész területére kiterjed. Tudományos szempontok szerint rendszerez, valamint sokoldalú keresést biztosít, körülbelül 8700, nagy hatású folyóiratot szemléz. ScienceDirect az Elsevier tudományos kiadó fulltext- és adatbázisszolgáltatása. Fő profilja a természettudományos, műszaki és orvosi folyóiratok nyomtatott és elektronikus formában való terjesztése. Teljes szövegű hozzáférést biztosít a saját kiadású papíralapú folyóiratok elektronikus változatához, illetve más kiadók e-folyóirataihoz. Az Akadémiai Kiadó Folyóirattára az Akadémiai Kiadó gondozásában megjelenő kiadványok több mint 40 tudományágban biztosítanak

38 kutatasmodszertan:ii. KOR :27 Page KUTATÁSI MÓDSZEREK: SZEKUNDER KUTATÁS lehetőséget tudósaink számára legfrissebb eredményeik publikálására, a nukleáris kémiától a mikrobiológián át a nyelvtudományig. Az Akadémiai Kiadó közel ötven tudományos folyóiratából 33-nak a Magyar Tudományos Akadémia az alapítója, főszerkesztői magyar akadémikusok, szerkesztőbizottsági tagjai többségükben magyarok. Akadémiai Elektronikus Könyvtár. A szolgáltatás az Akadémiai Kiadó Angol magyar, Magyar angol, Német magyar, Magyar német, Francia magyar és Magyar francia nagyszótárát, a Magyar értelmező kéziszótárat, az Idegen szavak és kifejezések szótárát, a Környezetvédelmi lexikont, valamint az Új magyar irodalmi lexikont tartalmazza. Ingyenes adatforrások. Az internetet nem véletlenül nevezhetjük az emberiség legdemokratikusabb intézményének, ma is nagyrészt érvényes az induláskor megfogalmazott alapelv, hogy bárki tartalmat (adatokat) tölthessen fel vagy le. Az ingyenesen elérhető adatforrásokat leginkább a bőség zavarával jellemezhetjük, nagyon időigényes megtalálni a keresett adatot és könnyen meglehet, hogy nem találjuk meg. A keresési folyamat gyorsításának és egyszerűsítésének lehetőségét kínálja a minél pontosabban fogalmazott internetes keresés. Ehhez keresőmotorok állnak rendelkezésünkre akár az internetes böngészőnkbe beépülve. A keresőmotorok használatakor ajánlott a részletes keresés-beállítási (Advanced Search) lehetőségeket maximálisan kihasználni. Gyakran igénybe vett opciók: pontos kifejezés keresése (egy mondatrész egészét keresi, nem csak a szavakat külön-külön) 5, fájltípus, dátum, nyelv, származási hely, a keresett kifejezés megjelenési helye a honlapon. Példa: tételezzük fel, hogy a könyv második felében ismertetett SPSS adatelemzési program gyakorlásához szeretnénk adatokat gyűjteni. Az SPSS adatfájlok megtalálásához a Google keresőjét úgy állítjuk be, hogy.sav kiterjesztésű fájlokat keressen, azaz beírjuk a filetype:sav kifejezést. Az eredmény 4956 találat, de az olvasó ennél már valószínűleg többet talál. Szűkítsük tovább ezt az áttekinthetetlen adathalmazt úgy, hogy biztosak legyünk abban, hogy az adatfájl gazdasági, üzleti információkat is tartalmaz. A fájltípus beállítása mellett írjuk be a keresőbe az árbevétel kifejezést angolul (turnover), így a keresés 10 találatot eredményez, ami már kényelmesen áttekinthető. 5 Ez az opció buktatja le a teljes házi dolgozatukat az internetről letöltő diákokat vagy más internetről plagizálókat.

39 kutatasmodszertan:ii. KOR :27 Page SZEKUNDER KERESZTMETSZETI KUTATÁS Az adatok tartalmi jellegük alapján nagyon sokfélék lehetnek, a kutatásunk tervezett témája határozza meg, hogy makrogazdasági, kereskedelmi, demográfiai, vállalati szintű, háztartási, egyéni fogyasztói stb. adatokra van szükségünk. 3. Az adatközlők alapján a következő felosztást tehetjük: Nemzetközi intézmények publikus adatai. Az ENSZ, EU szervezeteinek (IMF, IBRD, Eurostat stb.) nagyon sok kiadványa, statisztikai adata elérhető az interneten Belföldi országos hatáskörű intézmények publikus adatai (statisztikai hivatal, nemzeti bank, államigazgatási intézmények, kutatóintézetek stb.), egyéb belföldi intézmények: egyetemek, főiskolák, szakkönyvtárak és más nonprofit intézmények publikus adatai. Professzionális adatközlőknek nevezzük az adatgyűjtést, elemzést és közlést üzleti alapon végző cégeket. Legfontosabbak a szaklapok és azok tematikus mellékletei, mivel valamennyi eredményük nyilvános, sőt alapvető érdekük, hogy minél könnyebb legyen a hozzáférés. Ezenkívül az adatgyűjtést és kutatást üzleti alapon végző piac-, marketing- és közvélemény-kutató cégek, reklámügynökségek, pénzügyi intézetek és egyéb, az üzleti szolgáltatások területén tevékenykedő cégek is marketingcélból nyilvánossá tesznek értékes adatokat, részeredményeket. Vállalati publikus adatok. Törvényi kötelezettsége valamennyi bejegyzett cégnek nyilvánossá tenni a mérlegét, ez megtekinthető például a pénzügyminisztérium honlapján ( Vállalati belső adatok. Ha kutatásunk egy cég megbízásából történik, akkor természetesen rendelkezésünkre állhatnak a szükséges, de nem nyilvános belső adatok. Külső kutató számára ezek már csak a vállalatvezetéssel kötött egyezség alapján válnak elérhetővé Szekunder keresztmetszeti kutatás A szekunder adatforrások áttekintése után nézzük az adatelemzési módját. A kutatástípusok osztályozásánál (3. táblázat) láthattuk, hogy a szekunder kutatások körében csak a kvantitatív módszereket tüntettük fel. Viszonylag szűk körű speciális kutatások során használnak kvalitatív módszereket is (pl. dokumentumelemzés), de ezek bemutatása nem tartozik könyvünk tematikájába.

40 kutatasmodszertan:ii. KOR :27 Page KUTATÁSI MÓDSZEREK: SZEKUNDER KUTATÁS Az adatgyűjtés részfolyamatának lezárása után már nincs lényeges különbség a szekunder-kvantitatív és a primer-kvantitatív kutatások között az adatelemzés tekintetében, de a kutatás időbelisége alapján megkülönböztetett keresztmetszeti és a longitudinális kutatások már jelentősen meghatározzák az elemzés módját. A kvantitatív keresztmetszeti kutatások adatelemzési módszereiről a későbbiekben lesz szó, most a longitudinális, az időtényezőt figyelembe vevő kutatási módszer sajátosságait vizsgáljuk Szekunder longitudinális kutatás idősorelemzés Az idősorelemzés a longitudinális kutatások egy típusa, amely a megfigyelni kívánt társadalmi-gazdasági jelenségek változását, fejlődését az idő függvényében mutatja be. Általában szekunder információforrásból származó adatokkal végezünk idősorelemzést, ez az oka annak, hogy üzleti kutatások szakirodalma során ritkán foglalkozik idősorelemzéssel, de szekunder kutatásokban legyen az üzleti, tudományos vagy.államvizsga-dolgozat készítése céljából végzett kutatás. Az idősorok jellemzői (Ertsey in Szűcs 2004): Az idősorok lehetőleg minél hosszabbak legyenek, minél hosszabb időintervallumot fogjanak át. Az adatfelvételek időpontja közötti időintervallumok hossza legyen azonos (pl. nem lehetnek az adatsorunk egy részében heti, máshol havi adataink). Az adatok tartalma azonos kell legyen mindegyik időpontban, nem változhatnak az osztályozási rendszerek vagy a mértékegységek. Az adatoknak azonos megfigyelési típusból kell származniuk, nem keverhetők össze az alapsokasági adatfelvételek a különböző mintavételből származó adatokkal vagy becslésekkel. Az idősorelemzés modelljei két egymástól lényegesen különböző modellből, illetve ezek kombinációiból állnak (Hunyadi et al. 1996): a determinisztikus idősorelemzés feltételezi, hogy az idősorok előre determinált hosszú távú pályát követnek. Az elemzés fő célja, hogy ezt a pályát meghatározza, elemeire bontsa és ezek segítségével hosszabb távon is előre jelezze. A véletlen hatását az idősorokra szükséges rossznak tekinti és igyekszik kiszűrni. a sztochasztikus idősorelemzés felfogása szerint a véletlen szerves alkotórésze az idősornak, ezért a valószínűségek vizsgálata a modellezés alapja.

41 kutatasmodszertan:ii. KOR :27 Page SZEKUNDER LONGITUDINÁLIS KUTATÁS IDŐSORELEMZÉS 41 A sztochasztikus idősorelemzés modelljeinek ismerete túlmutat jegyzetünk tartalmán, a következőkben a determinisztikus modellt részletezzük. Az idősorelemzés alapvető célja, hogy az idősort felbontsuk négy összetevőjére, komponensére. Ezt az eljárást nevezzük dekompozíciónak: 1. Trend az idősorban tartósan, hosszú távon érvényesülő tendencia a fejlődés irányát és mértékét meghatározó legfontosabb komponens. 2. Szezonalitás szabályos, rövid távú, rendszeresen ismétlődő ingadozás. 3. Ciklikus komponens szabálytalan hosszabb távú ingadozás. 4. Véletlen ingadozás a zavaró hatásokat leíró véletlen változó, az előbbi három determinisztikus komponens által nem megmagyarázott érték. Az idősor additív (összegző) modellje a következő alakban írható fel, ahol a trend, S a szezonalitás, C a ciklikus komponens, a véletlen ingadozás. Az additív modellen kívül létezik multiplikatív modell is, amelyben a komponensek összeszorzódnak. Példa. Nézzünk egy rövid példát a dekompozíció jelentőségére. A csíkszeredai sörgyár számára elengedhetetlen a napi értékesítési adatok éves szintű idősorának felbontása e négy komponensre. Könnyen belátható, hogy ezek az értékvesztés nélkül sokáig nem tárolható termék értékesítési előrejelzései alapvető fontosságúak a termelésirányítás, illetve a cég több funkcionális területe számára. Empirikus tapasztalataink alapján feltételezhetjük, hogy a sörfogyasztásban jelentős szezonalitás van, nyáron sokkal többet fogyasztva. Kérdés, hogy a szezonhatást lebontva, több év átlagában milyen trend érvényesül, növekszik-e vagy csökken az értékesítés. Érdemes-e termelésbővítésbe beruháznunk, vagy csak a nyári szezonnak tulajdonítható, hogy nem tudjuk kielégíteni a keresletet és a fogyasztó a konkurens termékekre fanyalodik? És ha kivételesen nem csak egy napra esik a csíki nyár, akkor a nyári szezonhatáson túl további keresletnövekedést okozhat a harmadik komponens valamilyen turistacsalogató eseménye (somlyói búcsú, városnapok). Mindezek figyelembe vétele mellett is a véletlen meglephet egy kiadós jégesővel, ami téli szintre csökkentheti az aznapi sörfogyasztást.

42 kutatasmodszertan:ii. KOR :27 Page KUTATÁSI MÓDSZEREK: SZEKUNDER KUTATÁS 1. Trendszámítás Az idősorelemzés alapvető célja tehát meghatározni az idősor egészén uralkodó trendet. Erre alapvetően két modell áll rendelkezésünkre, mindkettőt érdemes megismernünk, mert a dekompozíció során mindkettőre szükségünk lesz Mozgó átlagolás Az idősor adataiból láncszerűen továbbhaladó átlagolással egy újabb idősort képezünk, melynek értékei jelentik a trend értékeit. A mozgó átlagolású trendszámítás lényege, hogy az idősor t-edik eleméhez úgy rendelünk trendértéket, hogy átlagoljuk az idősor t-edik elemének bizonyos környezetében lévő elemeket (Hunyadi et al. 1996). Legegyszerűbb esetben a t-edik elemet megelőző és követő értékeket vesszük figyelembe: ahol a trend, pedig az idősor t-edik eleme. A mozgó átlagolás folyamata: Meghatározzuk a mozgó átlag tagszámát. Az előbbi esetben 3 tagú mozgó átlag (m=3) képletét írtuk fel. A tagszám lehet páros vagy páratlan is. Kiszámoljuk a trend értékeit, 3 tag esetén a következő módon: Megállapíthatjuk, hogy az idősor első és utolsó értékére nem tudunk trendértéket számolni, mivel nincs azt megelőző, illetve követő érték. A trend adatsora példánkban két értékkel rövidebb, mint az eredeti idősor, és a különbség változhat a tagszám értékétől függően. A mozgóátlagolás lényege, hogy kisimítja az idősor szezonális és ciklikus hullámzásait. Minél nagyobb tagszámot választunk, azaz minél nagyobb időintervallumot helyettesítünk egyetlen értékkel, az átlagával, annál simább, kiegyenlítettebb lesz az idősorunk. Ennek azonban ára van, a tagszám növelése csökkenti a trend intervallumát. Ha az idősor grafikus képe alapján feltételezésünk lehet a szezonalitás hullámhosszára (pl. heti, havi, negyedéves stb.), akkor a tagszámot tegyük egyenlővé ezzel az értékkel. Ebben az esetben jól kisimítjuk a szezonhatást, ellenkező esetben vagy nem simít eléggé a trendünk, vagy csak,.

43 kutatasmodszertan:ii. KOR :27 Page SZEKUNDER LONGITUDINÁLIS KUTATÁS IDŐSORELEMZÉS 43 eltoljuk a szezonális hullámokat. Megfelelően kisimított szezonhatás és elég hosszú távú ciklikus komponens esetén a mozgó átlagolású adatsorunk nemcsak a trendet, hanem a ciklikus komponenst is tartalmazza 1.2 Analitikus trendszámítás Az idősor trendjét valamilyen jól illeszkedő függvénytípussal fejezzük ki. Az idősor tényleges értékeire a legkisebb négyzetek módszerével illesztjük a függvényt úgy, hogy az idősor értékei és a függvényértékek közötti távolság a lehető legkisebb legyen. Leggyakrabban alkalmazott függvénytípusok: lineáris, exponenciális, hiperbolikus, polinomiális, logisztikus. A függvényillesztésről további részleteket a jegyzet SPSS program használatáról szóló részében találunk. 2. A szezonális ingadozás mérése A szezonális ingadozás azt mutatja, hogy az idényhatás következtében az idősor értékei átlagosan milyen mértékben térnek el a trendtől. Az idősor additív alapmodellje és az alapján, hogy a mozgó átlagolású trendünk nemcsak a trendet, hanem a ciklikus komponenst is tartalmazza, ha kivonjuk az idősorból a mozgóátlagolású trend értékeit, akkor a szezonális és a véletlen ingadozás összegét kapjuk: A véletlen hatását úgy zárjuk ki (csökkentjük), hogy átlagoljuk a szezonális ingadozásokat. Ha előzetesen az idősor grafikus képe alapján felismertük, hogy mekkora a szezonális ingadozás hullámhossza, 6 akkor ezen az időintervallumon átlagoljuk a szezonális ingadozás értékeit. ahol j a szezonális ingadozások száma adott időintervallumon belül. Feltételezésünk, hogy a szabályos, szezonális ingadozások kiegyenlítik egymást, tehát az összegük, illetve az átlaguk nulla kell legyen. Ezért eze- 6 Ezt használtuk a mozgó átlagolás tagszámának a meghatározására is..,,

44 kutatasmodszertan:ii. KOR :27 Page KUTATÁSI MÓDSZEREK: SZEKUNDER KUTATÁS ket az értékeket nyers szezonális ingadozásnak nevezzük, és ha nem felelnek meg az említett feltételnek, akkor szükség van a korrigált szezonális ingadozás kiszámolására: ahol m a szezonális ingadozások száma. 3. A ciklikus komponens meghatározása A hosszú távú, szabálytalan ciklikus komponenst már könnyen meghatározhatjuk az, összefüggésből, ahol az a mozgóátlagolású és az az analitikusan meghatározott trend, a ciklikus komponens pedig a kettő különbsége.

45 kutatasmodszertan:ii. KOR :27 Page FEJEZET KUTATÁSI MÓDSZEREK: PRIMER KUTATÁS A kutatási adatok jellege szerint két nagy csoportra bontjuk a primer kutatásokat: kvalitatív és a kvantitatív kutatásokra. A módszertana alapján ez a két kutatástípus jól elkülöníthető, a gyakorlati kutatások nagy többsége jól besorolható az egyik vagy másik típusba Kvalitatív kutatás A kvalitatív kutatás feltáró jellegű, a probléma megértését szolgáló kutatási módszer. Lényeges különbség a kvantitatív kutatással szemben, hogy a kutatási adatokat kis mintából gyűjtjük és a minta nem reprezentatív, vagyis az eredményeket nem általánosíthatjuk a teljes alapsokaságra. Kvalitatív kutatást olyankor célszerű alkalmazni, amikor a kutatási témánk olyan kérdéseket tartalmaz, amelyekre az emberek közvetlenül valószínűleg nem tudnak, vagy nem akarnak válaszolni. Ilyenek lehetnek például az emberek egészségi állapotára, higiéniájára, különböző attitűdjeire, véleményére (pl. fajgyűlölet), vagyoni helyzetére, luxuscikkek vásárlására, márkahűségük okaira stb. vonatkozó kérdések. Az emberek értékeire, motivációira, érzelmi mozgatórugóira vagyunk kíváncsiak, és ezek feltárására nem vagy csak részben alkalmasak a kvantitatív kutatás direkt kérdései. A kvalitatív kutatás jellemzői: kis, nem reprezentatív minta, de kis alapsokaság esetén lehet teljes körű is; módszertani rugalmasság és változatosság; az adatok elemzése nem statisztikai módszerekkel történik, az eredmények gyakran szubjektív értelmezésen alapulnak; mélyebb, nem nyilvánvaló ok-okozati összefüggések feltárására is alkalmas; nehezen definiálható kutatási célok esetén megalapozhat egy kvantitatív kutatást; bizalmas vagy bonyolultabb témák vizsgálatára is alkalmas.

46 kutatasmodszertan:ii. KOR :27 Page KUTATÁSI MÓDSZEREK: PRIMER KUTATÁS 4. táblázat. A kvalitatív és a kvantitatív kutatás összehasonlítása Kvalitatív Kvantitatív Célkitűzés A mögöttes okok és motivációk minőségi megértése Az adatok számszerűsítése és az eredmények általánosítása a mintáról az alapsokaságra Minta Kisszámú, nem reprezentatív Nagyszámú, reprezentatív Adatgyűjtés Nem strukturált Strukturált Adatelemzés Nem statisztikai Statisztikai Forrás: Malhotra A lényeges különbségek ellenére vagy épp emiatt a két kutatástípusra nem egymást helyettesítő, hanem kiegészítő módszerekként kell tekintenünk. Egy komplex kutatási téma esetében, ha a kutatási idő- és költségkeret megengedi, akkor ideális esetben a kvalitatív kutatás megalapozza a kvantitatívot, pontosítja, hogy a kutatási témán belül milyen konkrét hipotéziseket fogalmazzunk meg és teszteljünk statisztikai módszerekkel. Azonban mint már említettük a kutatási témánk lehet olyan vagy tartalmazhat olyan részeket, ami főképp vagy kizárólag kvalitatív módszereket igényel. Ennek eldöntése a kutatás megtervezésének alapját jelenti, mivel ez a döntés meghatározza a kutatás egészének további folyamatát. Az előző fejezetben ismertetett kutatási folyamat alapvető szakaszai megegyeznek mindkét kutatástípusnál, de lényeges különbségek vannak a kutatás tervezése során a mintavétel- és a kérdőívkészítésnél, továbbá az adatgyűjtés és az adatelemzés során. A kvalitatív kutatás általunk vizsgált típusai az egyéni mélyinterjú és a fókuszcsoport Egyéni mélyinterjú Közvetlen, személyes interjú, amelyben egy képzett kérdező az interjúalany motivációit, nézeteit, attitűdjeit vizsgálja. Az interjú során nem a kvantitatív kutatások során használt strukturált kérdőívet alkalmazzuk, hanem egy olyan interjú-vezérfonalat, ami tartalmazza az elő- 7 Ezeken kívül több, speciális kvalitatív módszer létezik (lásd Malhotra 2001), amelyeket itt nem részletezünk. Ilyen például a projektív technikák csoportja, amelyek elfedik a kutatás valódi célját és a válaszadót nem arra kérik, hogy saját magatartását írja le, hanem hogy mások magatartását értelmezze.

47 kutatasmodszertan:ii. KOR :27 Page KVALITATÍV KUTATÁS 47 zetesen kigondolt kutatási kérdéseket, de lehetőséget nyújt új gondolatok, összefüggések feltárására. Az egyéni mélyinterjút gyakran használjuk az előzetes tájékozódás során a kutatási téma alaposabb feltárására, de jelentheti a kutatás fő módszerét is. Főképp kis költségvetéssel rendelkező kutatók vagy egyetemi hallgatók körében népszerű, de nem a költségvetési korlátok, hanem mindenekelőtt a kutatási témának kell megindokolnia az alkalmazását. Az interjú alanyai két fő csoportból származhatnak: a kutatási téma szakértőiből és/vagy a megfigyelni kívánt alapsokaságból. A kétféle interjúalany értelemszerűen kétféle megközelítést, kétféle strukturálatlan kérdőívet igényel ugyanannál a témánál is. A mélyinterjú jellemzői: felkészültséget, a kutatási téma nagyfokú ismeretét igényli, az interjú hossza általában fél egy óra, személyesebb vagy bonyolultabb témák is megbeszélhetők, nincs a kvantitatív kutatásokhoz hasonló strukturált kérdőív, hanem csak egy vázlat, ami kizárólag nyílt kérdéseket tartalmaz, vagyis a kérdező nem határozza meg előzetesen a kérdésre adható válaszlehetőségeket, a kérdőív vázlat ellenére a kérdések megfogalmazását és sorrendjét a válaszadó feleletei befolyásolják Fókuszcsoport A fókuszcsoport strukturálatlan és közvetlen interjú, amelyben egy jól felkészült kérdező (moderátor) beszélget a kutatási célsokaság egy csoportjával. Módszertanában nagymértékben hasonlít az egyéni mélyinterjúhoz, de kihasználja a csoportos interjú adta többletlehetőségeket. Fontos különbség, hogy a csoportos beszélgetés dinamikájának köszönhetően olyan váratlan eredmények merülhetnek fel, amire a kutatók nem is számítottak. A csoportinterjú a kutató által ellenőrzött és az interjúalanyok által kellemesnek mondható környezetben zajlik. Videófelvétel készül az interjú során, ami segíti a moderátort az interjú után a kutatási eredmények megfogalmazásában, lehetővé teszi, hogy az elhangzottakon túl figyelembe vegye az interjúalanyok hangulatát, érzelmeit, metakommunikációs jelzéseit is. Piackutató cégeknél a fókuszcsoport-terem legtöbbször olyan tükörfallal rendelkezik, ami lehetővé teszi, hogy más kutatók

48 kutatasmodszertan:ii. KOR :27 Page KUTATÁSI MÓDSZEREK: PRIMER KUTATÁS (pl. a moderátor segítsége) vagy a kutatást megrendelő cég képviselője kívülről figyelje a történéseket, sőt be is avatkozhatnak elektronikus üzeneteket küldve a moderátor számítógépére. Piackutatók körében annyira elterjedt ez a kutatási technika, hogy sokan a kvalitatív kutatás szinonimájaként használják (Malhotra 2001). A kutatócégek, illetve a moderátorok specializálódnak egy-egy kutatási területre (pl. fiatalok, háziasszonyok, vállalati közép- és felsővezetők körében végzett fókuszcsoportok, vagy téma szerinti specializáció: távközlési technológiák és szolgáltatások, egészségügy stb.). Az előzőkben említett infrastrukturális igények miatt a tudományos célú kutatások egyéni kutatói vagy a kutatói felkészültséget bizonyító hallgatók kevésbé tudják igénybe venni ezt a technikát, de egy szerényebb körülmények között lefolytatott csoportinterjú is jó eredményekkel kecsegtethet. A fizikai feltételek megteremtése mellett komoly feladat a 8 12 interjúalany meggyőzése és közös időpont egyeztetése. A fókuszcsoport alkalmazása A kutatási téma előzetes megismerésénél említettük, hogy a fókuszcsoport alkalmazható a kutatási téma alaposabb kidolgozásához, szempontokat nyújthat a kvantitatív kérdőívek szerkesztéséhez, a kvantitatív kutatási hipotézisek megfogalmazásához és korábbi kvantitatív kutatások eredményeinek értelmezéséhez. A kutatási célkitűzéseket fókuszcsoport alkalmazásával kívánjuk elérni. A piac- és marketingkutatások során a következő célokra használják rendszeresen a fókuszcsoportot: valamilyen termékkel kapcsolatos fogyasztói percepciók, preferenciák és magatartás megértése; reklám kreatív koncepcióinak és reklámszövegeknek a kialakítása; termékinnovációk tesztelése; ma már a termékinnovációs folyamat része a koncepció vagy a kész prototípus tesztelése a célpiacról származó fókuszcsoportban; adott marketingmixszel kapcsolatos fogyasztói reakciók előzetes megismerése. Szakdolgozat-példa. Esettanulmányunkat folytatva az államvizsgára készülő hallgatónk alkalmazhatja a fókuszcsoport-technikát. A helyi bankfiókok szakembereivel és/vagy külső szakértőkkel folytatott csoportinterjún a következő alapvető kérdésekről beszélhetnek: hogyan látják a lakossági

49 Az eddigiek alapján is egyértelmű, hogy a fókuszcsoportos kutatás folyamata sok részletében különbözik a kvantitatív kutatásétól (Malhotra 2001 nyomán): 1. A fókuszcsoport által megválaszolandó kérdések meghatározása az eddig definiált kutatási célok és a kutatási technika (fókuszcsoport) ismeretéből le kell vezetnünk és meg kell fogalmaznunk egy részletes listában, hogy milyen kérdésekre keressük a választ. 2. Az interjúalanyokat kiválasztó szűrő kérdőív megírása és toborzása a résztvevők során alkalmazott szűrő kérdőívvel biztosítjuk a csoport demográfiai szempontból homogén jellegét. 3. A moderátor interjú-vezérfonalának összeállítása ez a moderátor és a kutató(k) közötti szoros együttműködésen kell alapuljon. A moderátornak alaposan ismernie kell az adott témát, és hogy melyik kérdéssel milyen kutatási célt ér el. 4. A fókuszcsoport lebonyolítása az interjú elején a moderátor bemutatkozik és bemutatja a résztvevőket, ismerteti a csoportvita szabályait, meghatározza a célokat, megpróbál vitát generálni, összefoglalja a válaszokat, ha a csoporttagok egyetértésre jutottak. 5. A felvételek visszajátszása, az adatok elemzése a csoportinterjú után a moderátor és általában még egy kutató az emlékeik és a videófelkutatasmodszertan:ii. KOR :27 Page KVALITATÍV KUTATÁS 49 bankszektor fejlődését, az online banking várható keresletét, melyek a legnépszerűbb szolgáltatások és ezek igénybe vehetők-e interneten keresztül. Emellett egy másik fókuszcsoportra is szükség lenne, sőt talán az előbbinél is fontosabb információkat szolgáltathat a keresleti oldal vizsgálata. A potenciális fogyasztók köréből származó csoportban azt az alapvető kérdéskört kellene vizsgálni, hogyan vélekednek a potenciális fogyasztók a közgazdászok és programozók által létrehozott ezen új szolgáltatásról. A fókuszcsoport jellemzői: a fókuszcsoport moderátora az adott témából jól felkészült szakember, de azonkívül jó megfigyelő, kapcsolatteremtő és kommunikációs képességekkel rendelkezik; az előzetesen szelektált 8 12 fős csoportok demográfiai, társadalmi-gazdasági jellemzők alapján homogének kell legyenek; a csoportinterjú 1 3 óra időtartamú; videofelvétel segíti az interjú utáni feldolgozást.

50 kutatasmodszertan:ii. KOR :27 Page KUTATÁSI MÓDSZEREK: PRIMER KUTATÁS vétel alapján leírják a kutatási eredményeket. A megfogalmazott vélemények mellett figyelemmel vannak a vélemény erősségét kifejező verbális és metakommunikációs jelzésekre (arckifejezések, gesztusok), felismerik az új, a moderátori vezérfonalban nem érintett, de releváns gondolatokat, meghatározzák a csoportot legjobban összetartó és megosztó kérdéseket. Mindezek alapján próbálják megrajzolni azt az összképet, ami a csoport véleményét a kutatási kérdésekkel kapcsolatban legjobban kifejezi. 6. A tanulmány megírása ennek során a kis minta miatt nem számszerűsítjük az adatokat, nem használunk gyakorisági eloszlást vagy átlagokat. Például ha a tízes csoportból hatan valamilyen kérdésben egyetértettek, akkor nem a csoport 60%-áról beszélünk, hanem tipikusan olyan megfogalmazást használunk, hogy a válaszadók több mint fele vagy a résztvevők szűk többsége. A fókuszcsoport hátrányai: A kisminta alapján nem vonhatunk le általános következtetéseket az alapsokaságra nézve. A csoportos környezet bátorítóan, de fékezően is hathat a véleményalkotásban. Fennáll a veszélye annak, hogy a csoport tagjai hasonulnak egy domináns résztvevő véleményével. Kevés a jól képzett moderátor. Az adatok rendezetlensége. A csoportbeszélgetés során elhangzott vélemények nem strukturáltak, elemzésük és értelmezésük nehéz feladat. Nagy szerepet kap az elemző szubjektivitása, a kutatási adatokat könnyebben félre lehet értelmezni, mint a kvantitatív kutatások során Kvantitatív kutatás Kvantitatívnak nevezzük az olyan kutatást, amelyben a számszerűsített adatok elemzése és az eredményeknek az alapsokaságra való általánosítása során statisztikai módszereket használunk. A megfigyelni kívánt alapsokaságról előre megszerkesztett, strukturált kérdőív alkalmazásával gyűjtünk adatokat, amelyet a kvalitatív kutatástól eltérően a kutatási folyamat közben nem szabad módosítanunk. A valóság, a tapasztalati tények számszerűsítése és elemzése sokféleképp történhet, mivel a megfigyelni kívánt valóság is nagyon vál-

51 kutatasmodszertan:ii. KOR :27 Page KVANTITATÍV KUTATÁS 51 tozatos. Ezért a formalizált kvantitatív kutatások többféleképp osztályozhatók: 1. a kérdőíves megkérdezés módja alapján, 2. a kutatás időbelisége alapján. 1. A kvantitatív kutatási módszerek osztályozása a kérdőíves megkérdezés módja alapján gyakorlati szempontból nagyon lényeges: 1.1. Személyes kérdezés: 8 A személyes kérdezést nevezhetjük a klasszikus értelemben vett interjúnak, amelynek során a kérdezőbiztos személyesen találkozik az interjúalannyal. A személyes kérdezés a helyszín alapján lehet otthoni, irodai, utcai vagy újabban bevásárlóközponti kérdezés. Irodai vagy munkahelyi interjúkat olyan kutatások során folytatunk, amikor a célsokaság az intézményi vagy a vállalati szegmensből kerül ki. Az utcai kérdezés egyre inkább kezd visszaszorulni a bevásárlóközponti javára, ahol sokkal megfelelőbb körülmények adottak. Ez a típusú kutatás nyújt lehetőséget a leghosszabb és a legbonyolultabb vagy személyesebb témájú megkérdezésre Telefonos kérdezés során az interjúalanyt otthonában, üzleti kutatások esetén munkahelyén, vagy mobiltelefonon hívja a kérdezőbiztos. A telefonos kérdezések rövidebbek, mint a személyesek, a kérdezés hossza általában nem lehet hosszabb mint 15 perc, és a kutatás témája is csak kevésbé bonyolult vagy személyes lehet Internetes kérdezés alatt a webes felületen, honlapon elhelyezett és kitöltött kérdőívet értjük. Az internetes kérdezések teret nyertek az utóbbi években az internethasználat terjedésének és az internetes kutatás gyorsaságának és olcsóságának köszönhetően. Egyre gyakoribbak a specializált kutatócégek, amelyek internetes paneleket próbálnak kiépíteni, azaz a potenciális válaszadók olyan csoportját, akik hajlandóak időközönként egy felkérő hatására a kutatócég honlapján kitölteni a kérdőívet. A paneltagok toborzása és megtartása ajándékok, jutalmak kisorsolásával biztosítható Postai úton történő kérdezés során az interjúalany az önkitöltő kérdőívet postán vagy en keresztül kapja, és kitöltése után küldi vissza a feladóhoz. A szakirodalom érthető módon az ben elküldött kérdőívet az internetes kérdezések közé sorolja, azonban sokkal nagyobb különbség van a webes és az es kérdezés között kérde- 8 A kutatási szaknyelvben gyakran használják az angol megnvezését is: face to face F2F.

52 kutatasmodszertan:ii. KOR :27 Page KUTATÁSI MÓDSZEREK: PRIMER KUTATÁS zéstechnikai és egyéb kutatási szempontból, mint aközött, hogy hagyományos módon vagy elektronikusan küldjük a levelet. A postai úton történő kérdezéseket egyszerűségek és olcsóságuk ellenére ritkán használják kutatócégek, mivel nagyon kicsi a válaszadási hajlandóság, az elküldött kérdőíveknek csak töredéke érkezik vissza, ami lehetetlenné teszi a kutatás időbeni lefolytatását. Ilyen típusú adatgyűjtést a statisztikai hivatalok használnak, akik nagyobb arányban, de szintén csak részlegesen kapják vissza az elküldött kérdőíveket, annak ellenére, hogy a felmérésbe bevont cégeknek, intézményeknek törvény által előírt adatbeszámolási kötelezettségük van. Üzleti kutatások körében újságok, lapok alkalmazzák ezt a módszert, rövid, max. egyoldalas kérdőívet csatolva a laphoz. A kutatás sikerességét, a válaszadási hajlandóságot az olvasótábor lojalitása mellett jutalmak kisorsolása befolyásolják. A módszerek közötti választást az alábbi táblázatban feltüntetett szempontok alapján dönthetjük el. Ritka alkalmazásuk miatt kihagytuk a postai úton keresztüli kérdezést és a hagyományos telefonos kérdezést, ezek használata egyéni kutatók nagyon szűk anyagi keretekkel rendelkező kutatásai során fordulhatnak elő. A személyes kutatási formák közül külön jellemezzük az otthoni és a bevásárlóközponti, illetve a számítógéppel segített (CAPI) kérdezést. 5. táblázat. A primer-kvantitatív kutatási módszerek összehasonlítása. Telefonos Otthoni Bevásárlóközponti CAPI Internet CATI személyes Az adatgyűjtés közepes magas magas magas közepes rugalmassága A kérdések változatossága alacsony magas magas magas közepes, magas Fizikai ingerek alacsony közepes magas magas közepes alkalmazása A minta elérhetősége közepes magas közepes közepes alacsony közepes A kérdezés környezetének közepes közepes, magas magas alacsony ellen- őrzése magas A terepkutatók ellenőrzése közepes alacsony közepes közepes magas

53 kutatasmodszertan:ii. KOR :27 Page KVANTITATÍV KUTATÁS 53 Telefonos Otthoni Bevásárlóközponti CAPI Internet CATI személyes Az adatok, kérdések alacsony magas közepes közepes közepes mennyisége Válaszadási közepes magas magas magas alacsony arány Kényes kérdések magas alacsony alacsony alacsony magas lehetősége A kérdezőbiztosi közepes magas magas alacsony nincs torzítás lehetősége közepes Gyorsaság magas közepes közepes, közepes, nagyon magas magas magas Költségek közepes magas közepes, közepes, alacsony magas magas Forrás: Malhotra A szempontok közül vizsgáljuk meg a kevésbé egyértelműeket. Az adatgyűjtés rugalmasságát a kérdezőbiztos és az interjúalany együttműködési lehetősége határozza meg. Személyes kutatásoknál összetett, bonyolultabb kérdőíveket is le lehet kérdezni, mivel a kérdezőbiztos megmagyarázhatja a nehezebb kérdéseket. Fizikai ingerek alkalmazása alatt termékek, reklámfilmek, promóciós anyagok bemutatását vagy fizikai ingerek (pl. ízteszt) alkalmazását értjük. A válaszadási arány fontos mutatója az adatgyűjtés, a terepmunka hatékonyságának, a sikeres interjúk arányát mutatja százalékban kifejezve a megkezdett interjúk számához képest. Legmagasabb arányt a bevásárlóközponti személyes megkérdezéseknél érnek el, általában 100 megszólított potenciális interjúalanyból több mint 80-nal sikerül befejezni az interjút. A kérdezőbiztosi torzítás lehetősége sajnos többféle is lehet: nem az előírásoknak megfelelően választja ki az interjúalanyt, nem megfelelően teszi fel a kérdéseket (a későbbiekben látni fogjuk, milyen a jó kérdezés) vagy hibásan rögzíti a válaszokat. Mindezeket a potenciális hibaforrásokat kiküszöbölik a CAPI és az internetes kutatások leprogramozott kérdőívei. Végül, de nem utolsósorban a piackutatók számára talán két legfontosabb szempont a gyorsaság és a költségek, tudományos célú kutatások során kevésbé fontosak.

54 kutatasmodszertan:ii. KOR :27 Page KUTATÁSI MÓDSZEREK: PRIMER KUTATÁS 2. A kutatás időbelisége alapján is több típusú primer, kvantitatív kutatást különböztetünk meg: Keresztmetszeti kutatás: ezen belül megkülönböztetjük az egyszeri és a többszöri keresztmetszeti kutatást. Longitudinális kutatás: ugyanazon a rögzített mintán ismételten végeznek méréseket Keresztmetszeti kutatás: az adatgyűjtés az alapsokaság elemeiből egyszeri alkalommal vett valamely mintán alapul. Az egyszeri keresztmetszeti kutatásban az alapsokaságból csakis egyetlen mintát vesznek, és az információgyűjtés ebből az egyetlen mintából és csak egyszeri alkalommal történik. A többszöri keresztmetszeti kutatás során két vagy több mintát különböző időpontban vesznek az alapsokaságból. Az üzleti kutatások túlnyomó többsége egyszeri, keresztmetszeti kutatás. A kutatás alapvető célja nyilvánvalóan meghatározza a módszert, például kutatók, egyetemi vagy doktori hallgatók által végzett, a módszertani felkészültséget igazoló primer kutatások szinte kizárólag egyszeri keresztmetszeti kutatások. Cégek vagy állami intézmények által végzett/megrendelt kutatások között azonban gyakoriak a célpiac fogyasztói magatartására, társadalmi-gazdasági tényezők változására irányuló többszöri keresztmetszeti kutatások. Marketingkutatók az ugyanarra az alapsokaságra vonatkozó, de mindig más mintát vizsgáló, rendszeres időközönként (akár hetente) végzett többszöri kutatásokat trackingnek nevezik Longitudinális kutatás: ugyanazon a rögzített mintán ismételten végeznek méréseket. A primer longitudinális kutatás abban különbözik a keresztmetszeti kutatástól, hogy a minta nem változik az idő folyamán, ugyanazok a résztvevők alkotják. Az ilyen mintát panelnek nevezzük. Előnye a keresztmetszetivel szemben, hogy felfedi a változásokat, mert ugyanazokat az ismérveket ugyanazon a mintán ismételten méri. 9 Hátránya, hogy nagyon nehéz fenntartani a minta változatlanságát, kiküszöbölni a résztvevők különböző okok miatti lemorzsolódását. Példa: szinte az egész társadalmat naponta befolyásoló kereskedelmi televíziók üzleti modellje a nézettségre vonatkozó audiométernek nevezett longitudinális kutatásokon alapul. A reklámidő beárazásához mind a TV-társaság, mind a reklámidőt vásárló cég marketingeseinek ismerni- 9 A mintavételre vonatkozó részben ismertetett reprezentatív mintavétellel ez a hátrány jórészt kiküszöbölhető.

55 kutatasmodszertan:ii. KOR :27 Page KVANTITATÍV KUTATÁS 55 ük kell, hogy adott időben hányan és milyen demográfiai ismérvekkel jellemezhető személyek nézik a tévét. A kutatás e célja alapján inkább többszöri keresztmetszeti kutatásról beszélhetnénk, mivel a hangsúly nem a változáson van, hanem meghatározott időintervallumokban végzett felmérésekre van szükségünk. Azonban az adatgyűjtés technikája változatlan háztartási panelt indokol. A mérés ugyanis a háztartással kötött megállapodás alapján, egy a tévékészülékre szerelt műszer segítségével történik, ami rögzíti, hogy a család melyik tagja melyik csatornát mennyi időn keresztül nézi. A családtagok azonosítása egy speciális távirányító segítségével történik, amelyen minden családtagnak külön gombja van.

57 kutatasmodszertan:ii. KOR :27 Page FEJEZET MINTAVÉTEL A kutatási módszer kiválasztása után mutatjuk be a minta kiválasztásának folyamatát, de a gyakorlatban a kutatás tervezésénél sokszor párhuzamosan kell gondolkodnunk ezekről, a mintavételi lehetőségeink befolyásolhatják a kutatási módszer kiválasztását. Az empirikus kutatások elsődleges, már a témaválasztásnál megválaszolandó döntési kérdése, hogy kit vizsgáljon, kire/kikre legyenek érvényesek a kutatási eredmények. Mindenekelőtt eldöntendő, hogy a teljes célsokaságot (populációt) vizsgáljuk, vagy annak csak egy részét, azaz mintát veszünk az alapsokaságból. Definiáljuk a mintavételhez kapcsolódó legfontosabb fogalmakat: Célsokaság/alapsokaság: azon személyek, szervezetek stb. összessége, akikre vonatkoztatni akarjuk a kutatás eredményeit, akikre vonatkozóan állításokat akarunk megfogalmazni. Minta: az alapsokaság egy reprezentatív csoportja. Reprezentativitás: a kutatás szempontjából fontos minőségi/mennyiségi jellemzők (kulcsváltozók) mintabeli megoszlása megegyezik az alapsokaságéval. Teljes körű kutatás során a kutatás mindenkire, a teljes célsokaságra, illetve minden szituációra kiterjed. Ezzel szemben a mintavétel a populáció egy meghatározott részsokaságának bevonása a kutatásba. Célja, hogy a mintabeli információk alapján a teljes alapsokaságra tegyünk megállapításokat, vonjunk le következtetéseket. A mintavétel folyamata: 1. a célsokaság meghatározása, 2. a mintavételi keret meghatározása, 3. a mintavételi technika kiválasztása, 4. a mintanagyság meghatározása, 5. a mintavétel kivitelezése. 1. A célsokaság meghatározása A célsokaságot a kutatási téma önmagában nagymértékben meghatározza, de nem mindig magától értetődő, hogy kire vonatkozzék a kutatás.

58 kutatasmodszertan:ii. KOR :27 Page MINTAVÉTEL A téma komplexitása mellett a rendelkezésünkre álló kutatási erőforrások, lehetőségek is befolyásolhatják a kérdést, megtörténhet, hogy nem az eredeti kutatási témánk szerinti célsokaságot választjuk. Ekkor kell eldöntenünk azt is, hogy kisebb célsokaság esetén teljes körű felmérést végzünk-e vagy mintát veszünk a célsokaságból. Teljes körű felmérés esetén nem kell számolnunk a mintavételi véletlen hibával, de így sokkal költségesebb lesz a kutatás A mintavételi keret meghatározása A mintavételi keret a célsokaság elemeinek megjelenítése, egy lista vagy a sokaság beazonosítását szolgáló irányadás, például egy város háztartásainak jegyzéke, mobil- vagy vezetékes telefonkönyv, cégadatbázisok stb. Ha nem rendelkezünk a célsokaságra vonatkozó listával, akkor a véletlenszerű kiválasztást próbáljuk biztosítani valamilyen irányadással. Például egy háztartásban azzal a felnőttel készítenek interjút, akinek a születésnapja a legközelebb esik az aznapi dátumhoz, vagy a háztartások véletlenszerű kiválasztására gyakran használt egy magyar származású amerikai statisztikus, Leslie Kish algoritmusa. Ha a mintavételi keretből a sokaság néhány eleme kimarad, ez hibához, a mintavételi keretből eredő hibához vezet. Ilyen esetben a mintavételi keretnek megfelelően újra kell definiálnunk a célsokaságot. Például egy hallgatónk a csíkszeredai internetezők célsokaságára vonatkoztatná az államvizsga-dolgozatához szükséges primer kutatását. Sikerült meggyőznie a vezetékes internetkapcsolatot szolgáltató helyi cégeket, hogy a véletlenszerűen kiválasztott ügyfeleiknek elküldhesse e- mailen a kérdőívét, de a mobil internetkapcsolattal rendelkezők esetében erre esélye nincs. Ezért kénytelen módosítani a kutatás alapsokaságát. 3. A mintavételi technika kiválasztása Többféle mintavételi technika létezik, két nagy csoportba sorolva: I. Valószínűségi mintavétel az alapsokaságból véletlenszerűen választjuk ki a mintát. Feltétele, hogy az alapsokaságról legyen nyilvántartásunk, és az alapsokaság sorrendjében ne legyen semmi szisztematikusság. II. Nem valószínűségi mintavétel az alapsokaságból nem véletlenszerűen választjuk ki a mintát. 10 Ezért a nemzeti statisztikai hivatalok általában csak tízévenként végeznek népszámlálást, úgynevezett cenzust. A közbeeső években különböző becslésekkel korrigálják az adatokat.

59 kutatasmodszertan:ii. KOR :27 Page MINTAVÉTEL 59 I. Valószínűségi mintavételi módok: Egyszerű véletlen mintavétel során az alapsokaság minden egyede egyforma valószínűséggel kerülhet a mintába. Feltételei, hogy a populáció a kutatási szempontból fontos jellemzők szerint bizonyos mértékben homogén 11 legyen, és az alapsokaságról legyen olyan nyilvántartásunk, amiből véletlenszerűen kiválaszthatjuk a minta elemeit. Pl. a Sapientia hallgatóit tartalmazó adatbázisból véletlenszerűen például véletlenszám-generátor alkalmazásával veszünk egy 100-as mintát. Szisztematikus mintavétel: az ismert alapsokaság valamennyi eleme kap egy sorszámot, majd egy véletlenszerűen kiválasztott kezdőpontból kiindulva minden k-adik elemet betesszük a mintába. A k -t mintavételi intervallumnak nevezzük, és úgy határozzuk meg, hogy a populáció elemszámát elosztjuk a tervezett mintaelemszámmal. Pl. a Sapientia hallgatóit tartalmazó 928 elemű adatbázisából valamelyik véletlenszerűen kiválasztott hallgatótól kiindulva minden 9-edik hallgatót kiválasztva veszünk egy 100-as mintát. Rétegzett mintavétel: heterogén alapsokaság esetén az alapsokaságot valamelyik ismérv alapján homogén részsokaságokra bontjuk, majd ezeken belül egyszerű véletlen vagy szisztematikus mintát veszünk. A rétegképző ismérvet a kutatási téma szempontjából fontos ismérvek közül kell kiválasztani, ilyen lehet például a nem, végzettség, életkor, ágazat stb. A rétegek mintabeli aránya meg kell egyezzen az alapsokasági aránnyal. Pl. kutatási cél a Hargita megyei cégek HR menedzsmentjellemzőinek a leírása. Mintavétel: a cégek alkalmazottainak száma alapján legalább három réteget (kis-, közép- és nagyvállalatok) képezzünk. Csoportos mintavétel: ha nincs vagy nehezen kivitelezhető az alapsokasági nyilvántartásunk, de vannak listáink az alapsokaságba tartozó különböző csoportokról. Először el kell készíteni az alapsokasági csoportok listáját, majd a csoportokból mintát venni. II. Nem valószínűségi mintavételi módok: Önkényes: a válaszadókat önkényesen, a lehető legegyszerűbben választjuk ki. Nem reprezentatív, és ezért csak a feltáró jellegű kutatásoknál ajánlott használni. 11 Előzetesen nem definiálható, hogy mennyi az a bizonyos mértékű homogenitás. Tökéletes homogenitás vagyis azonosság esetén nincs mit vizsgálnunk, de nagyfokú heterogenitás, eltérések esetén nem alkalmas az egyszerű véletlen mintavételi technika.

60 kutatasmodszertan:ii. KOR :27 Page MINTAVÉTEL Szakértői: a válaszadókat valamilyen szakértői szempontoknak megfelelően választják ki, és szintén nem biztosítja a minta reprezentativitását. Főképp kvalitatív kutatások, fókuszcsoportok mintavételénél alkalmazhatók. Kvótás mintavétel. Alkalmazásának feltétele, hogy ha nem is rendelkezünk alapsokasági nyilvántartással, akkor ismerjük a kutatás célja szempontjából fontos alapsokasági jellemzők együttes megoszlását. Például kutatási célunk az ország valamennyi háztartásának tartós fogyasztási cikkek iránti keresletének vizsgálata. Az előzetes tájékozódás nyomán a téma szempontjából fontos kérdésnek tartjuk, hogy a háztartás az ország melyik régiójában és milyen típusú településén található (főváros, 50 ezer fő feletti nagyváros, kisváros, falu). A kvótás mintavételhez tehát tudnunk kell e két ismérv együttes eloszlását, például azt, hogy a teljes alapsokaság hány százaléka él a központi régió kisvárosaiban. Első lépésben tehát meghatározzuk a két fontosnak tartott ismérv együttes megoszlását az alapsokaságon belül, majd ezt az arányt a mintanagyság ismeretében leképezzük a mintára. Példánkat folytatva tételezzük fel, hogy a népszámlálási adatok alapján az összes háztartás 3,2%-a található a központi régió kisvárosaiban, és ha a tervezett mintaméret 1000 háztartás, akkor a mintánkban pontosan 32 ilyen háztartás körében végezzük el a kutatást. Az alapsokaságnak egy ilyen homogén csoportját nevezzük kvótának. A kvótából már egyszerű véletlen mintavétellel választjuk ki a mintaelemeket. Hólabda mintavételt olyankor használhatunk, ha nagyon kevés információval rendelkezünk az alapsokaságról. Egy vagy néhány interjúalannyal kezdjük az interjúkat, majd ők ajánlanak további interjúalanyokat, és ezáltal hólabdaszerűen gördül tovább a mintavétel. Például ha a csíkszeredai könyvvizsgálók körében akarunk kutatást végezni, akkor a hólabda mintavétel nagy valószínűséggel alkalmazható. 4. A mintanagyság meghatározása A mintavételi folyamat negyedik szakasza a minta nagyságának meghatározása. Ennek pontos meghatározása nemcsak módszertani szempontból, az eredmények érvényessége szempontjából fontos, hanem jelentős kihatással van a kutatás költség- és időigényére is. A gyakorlatban nagyon különböző mintanagyságokkal találkozhatunk: különböző kísérleteknél, orvosi kutatásoknál a minta nem tudja

61 kutatasmodszertan:ii. KOR :27 Page MINTAVÉTEL 61 meghaladni a as elemszámot, míg a felső határ általában A szakmai felkészültség igazolása céljából lefolytatott, az államvizsga-dolgozathoz kapcsolódó kutatások esetében a 100-as minta ajánlott, de problémásabb célsokaság, kutatási körülmények miatt még elfogadható a minimum elemből álló minta is. Ez alatti mintaelemszám már olyan virtuális kapcsolatokat eredményezhet az ismérvek (változók) között, amelyek ténylegesen nem léteznek, ezért félrevezetheti az elemzést, tönkreteheti az egész kutatást. A részletek ismerete nélkül is gyanítjuk, hogy a nagyobb, a célsokaságot minél jobban lefedő minta jobb, pontosabb becsléseket eredményez. Mi határozza meg mégis a minta nagyságát? Elméleti felső korlát természetesen a célsokaság nagysága, a gyakorlatban pedig a legmeghatározóbb tényező a kutatás költségvetése és időigénye. Az említett as mintanagyság azért felső határ, mert efölé már nem érdemes növelni az elemszámot, a költségek növekedése csak kis mértékű pontosságnövekményt eredményez. A szakirodalom sokféle többé-kevésbé bonyolult megközelítését tárgyalja a mintanagyság meghatározásának, mi az alapsokasági statisztikák (pl. valamely változó átlaga vagy aránya) becslési pontosságából indulunk ki. 12 A mintavétel nagyságának egyfajta optimalizálása, ha azt a minimális méretű mintát keressük, amelyik még szakmailag elfogadható pontosságú becsléseket eredményez. Ez a megközelítés akárcsak a többi tartalmaz egy fontos feltételezést: a különböző ismérvek alapsokasági és mintabeli eloszlása megközelítően normális eloszlású vagy legalábbis egymóduszú kell legyen. A legtöbb ismérvnek szerencsére ilyen eloszlása van, ha pedig ezt ellenőrizni akarjuk, akkor a könyv második felében bemutatott SPSS program segítségével ezt megtehetjük. Ha tehát nem az egész alapsokaságot vizsgáljuk, hanem mintát veszünk, akkor a mintavételnek egyenes következménye a mintavételi véletlen hiba. A mintavételi véletlen hiba, nevével ellentétben, nem olyan értelemben hiba, amelyet egy felkészültebb kutató kiküszöbölhet a kutatás folyamán, hanem egzakt módon meghatározható értéket jelent, amit egy alapsokasági érték becslésekor figyelembe kell vennünk. A mintavételi véletlen hiba legfőbb eleme a standard hiba, ami abból adódik, hogy nem az egész alapsokaságot vizsgáljuk, hanem egy reprezentatív 12 Gyakorló kutatók vagy módszertant tanuló hallgatók számára nem sok értelme van a szakirodalomban gyakori feltételezzük, hogy ismert a σ alapsokasági szórás kezdetű megközelítésnek.

62 kutatasmodszertan:ii. KOR :27 Page MINTAVÉTEL mintabeli érték alapján következtetünk az alapsokaságra. Egy alapsokasági ismérv egy statisztikájának (pl. arány) értékét a mintából becsüljük, és a becslés pontosságát fejezi ki a standard hiba. Egy arány standard hibáját a következő képlettel számoljuk ki: ahol p egy mintabeli változó aránya, n mintaelemszám. Alaposan megfigyelve a fenti képletet megállapíthatjuk, hogy nem számol az alapsokaság nagyságával (N). A standard hiba, végső soron a mintavételi hiba nagysága független lenne az alapsokaság nagyságától?! Itt szükséges megkülönböztetnünk a véges és a végtelen alapsokaságot. A véges alapsokaság a mintamérethez viszonyítva viszonylag kis alapsokaságot jelent, míg az ellentéte nem végtelent, hanem viszonylag nagyot, például egy ország lakosainak vagy háztartásainak számát. Pontosítható ez az arány: ha a tervezett mintanagyság nem haladja meg az alapsokaság 10%-át (n/n 0,1), akkor a standard hibát a fenti képlettel számoljuk, ami nem veszi figyelembe az alapsokasági méretet. Mivel a mintaméret ritkán haladja meg az as elemszámot, ezért a több mint ezer megfigyelési egységből álló a kutatási téma szempontjából homogén alapsokaságot már végtelennek tekintjük. Ellenben a minta tervezett nagysága meghaladja az alapsokaság 10%- át, akkor a következő szorzóval kell korrigálnunk a standard hibát: A mintavételi hiba ismeretéhez a standard hiba alapján kiszámoljuk egy becslés pontossági szintjét. A pontossági szint meghatározza, hogy az alapsokasági érték milyen intervallumba esik. Például a Sapientia csíkszeredai hallgatói körében kívánjuk vizsgálni a hallgatók internetezési szokásait. A kutatás során kiválasztottunk egy 300 fős mintát, ami reprezentatív a 980 fős alapsokaságra. Azt az eredményt kapjuk, hogy a hallgatók 31,5%-a naponta internetezik, és az ehhez az arányhoz tartozó korrigált standard hiba a fenti képlet alapján 2,2. Kutatási eredményünk úgy fogalmazható meg, hogy 95%-os biztonsággal állítható, hogy az összes csíkszeredai hallgató 27,5% és 36,5% közötti aránya naponta internetezik.,.

63 kutatasmodszertan:ii. KOR :27 Page MINTAVÉTEL 63 Ezt az intervallumot nevezzük konfidencia-intervallumnak, és úgy számoljuk ki, hogy a mintabeli statisztikához (átlaghoz, arányhoz) hozzáadjuk, illetve kivonjuk a standard hiba és egy adott megbízhatósági szinthez tartozó érték szorzatát., ahol egy változó mintabeli aránya, a konfidencia-intervallum alsó és felső határa, egy választott megbízhatósági szinthez tartozó érték, az pedig továbbra is a p arányhoz tartozó standard hiba. Láthatjuk, hogy a pontossági szint két változó szorzata ( ), tehát nagyságát mind a megbízhatósági szint, mind a standard hiba mértéke befolyásolja. A kutatón múlik, hogy milyen megbízhatósági szintet választ (pl. 90%, 95%, 99% stb.). A képlet alapján beláthatjuk, hogy ha adott konfidencia-intervallumot nagyobb megbízhatósági szinten akarunk meghatározni, akkor csökkentenünk kell a standard hibát, következésképp nagyobb mintára van szükségünk. A legáltalánosabban elfogadott a 95%- os biztonsági szint, aminek a értéke 1,96. Ajánlott tehát elfogadni ezt a biztonsági szintet és innentől kezdve konstansnak (1,96) tekinteni ezt a értéket, ezáltal leegyszerűsítve a mintavételi hiba operacionalizálásának kissé bonyolult folyamatát. A konfidencia-intervallum alsó és felső határát tehát a következő egyszerű képlettel számoljuk: 13 Érdemes ezt a képletet egy Excel fájlban rögzítenünk, így könnyedén meghatározhatjuk a számunkra elfogadható hibahatárt eredményező mintanagyságot. A fenti képletből természetesen kifejezhetjük közvetlenül is a mintanagyságot (n), de amíg a mintanagyság meghatározására csak egyszer van szükségünk a kutatás során, a fenti képletet sokszor használjuk a részletes kutatási eredmények bemutatásánál. Itt szükséges pontosítanunk egy korábbi kijelentésünket: nem a mintának van egy egységes hibája, hanem eltérő pontossági szintjei vannak a különböző mintabeli statisztikák becsléseinek. Ezért ha a kutatás rövid bemutatására van szükség, akkor a minta lehetséges maximális hibájáról beszélünk. 14 A normális eloszlásnak köszönhetően akkor maximális 13 Véges alapsokaság esetén a korrigált standard hibát használjuk (2. képlet). 14 Ilyen megjegyzéseket gyakran hallhatunk, olvashatunk a kutatási eredményeket bemutató médiákban.

64 kutatasmodszertan:ii. KOR :27 Page MINTAVÉTEL a standard hiba (és ez alapján a mintavételi véletlen hiba), ha a mintabeli statisztika (arány) értéke 50%. Például ha az ország lakosságára vonatkozó közvélemény-kutatás során az 1100 elemből álló minta egyik eredménye szerint a megkérdezettek 50%-a támogatja az államelnököt valamilyen politikai kérdésben, akkor a pontossági szint ± 3%, ha pedig egy másik eredmény 30%, akkor a pontossági szint ±2,7%. Megállapítottuk, hogy végtelen alapsokaság esetén, ha egy alapsokasági arányt a mintából kívánjuk becsülni, akkor a becslés pontosságát a minta nagysága és az arány értéke határozza meg. A következő ábrán a pontossági szint mértékét e két változó rögzített értékei mellett tüntettük fel: Forrás: saját számítás. 1. ábra. A becslési pontosság a mintanagyság függvényében A grafikon értelmezését egy példával mutatjuk be: ha egy 500-as elemű mintában egy változó értéke 30%, akkor a becslés pontossága ±4,0%, vagyis az alapsokasági érték 26% és 34% közötti konfidencia-intervallumban vehet fel értéket, de a legvalószínűbb a 30%. Láthatjuk, hogy adott mintanagyság mellett az 50%-os értéknek van a legnagyobb hibája, ezalatt és efölött pedig szimmetrikusan csökken nulláig. Megállapíthatjuk, hogy a mintaelemszám növekedésével nem lineárisan csökken a max. hibanagyság és azt is, hogy az 500-as mintaelemszám alatt olyan

65 kutatasmodszertan:ii. KOR :27 Page MINTAVÉTEL 65 mértékű lehet a hiba, hogy használhatatlanná tehetik az egész kutatást. Véges alapsokaságnál a becslés pontosságát az alapsokaság mérete is befolyásolja. A becslés pontosságát befolyásoló három tényező (az alapsokaság, a minta nagysága és a becsült statisztika értéke) közül az alábbi ábrán könnyen belátható okokból csak az előbbi két dimenziót ábrázoltuk, illetve az 50%-os arányhoz tartozó maximális hibanagyságot. Forrás: saját számítás 2. ábra. A becslési pontosság a mintanagyság és az alapsokaság függvényében Az ábrát a következőképp értelmezzük: 500-as alapsokaság (pl. egy falu háztartásainak a száma) és 100-as minta esetén az 50%-os arányhoz tartozó max. hiba ±8,8%. Tehát ha például a 100-as mintában 50 háztartásnak van vezetékes telefonkapcsolata, akkor a teljes alapsokaságra vonatkozóan megállapíthatjuk, hogy a falu háztartásainak 50%-a (41,2% 58,8%) rendelkezik ilyen kapcsolattal. Ekkora standard hiba és az ebből számolt konfidencia-intervallum láttán arra gondolhatunk, hogy hasunkra ütve sem sokkal kevésbé pontos becslésre lennénk képesek. Ez egy gyakran megfogalmazott vélemény olyanok részéről, akik először szembesülnek a viszonylag kis mintákból számolt becslések pontosságával. A két háromszáz vagy annál kevesebb elemből álló minták olyan

66 kutatasmodszertan:ii. KOR :27 Page MINTAVÉTEL mértékű mintavételi hibát tartogatnak számunkra, ami első ránézésre jelentősen csökkenti a kutatási eredmények értékét. Ha nem vagyunk tudatában, nem számszerűsítjük pontosan a mintavételi hibát, akkor könnyen előfordulhat, hogy az alapsokasági becsléseink vagy egymásnak, vagy külső, nem a kutatásból származó információknak 15 ellentmondanak. Ezért a mintanagyság meghatározása olyan kérdés, ami befolyásolja a kutatási módszer megválasztását és a kutatási eredmények értelmezését. Nagy mintavételi hiba esetén a kutatás feltáró jellegét próbáljuk kihasználni, összefüggéseket, okokat keresni, és kevésbé a leíró kutatások alapsokasági becsléseire tegyük a hangsúlyt. A megoldás nem az, hogy elutasítjuk vagy megkérdőjelezzük a primer kutatások eredményeit, hanem pontosan számszerűsítve a mintavételi hibát értelmezzük az eredményeket. 15 Az ugyanarra a tartalomra vonatkozó összehasonlításra alkalmas információt benchmark-nak nevezzük.

67 kutatasmodszertan:ii. KOR :27 Page FEJEZET KÉRDŐÍVSZERKESZTÉS A kvantitatív kutatás kérdőívének szerkesztését még az adatgyűjtés elkezdése előtt véglegesítjük, és ezt a kutatás során nem szabad módosítanunk. Ha kifelejtjük valamelyik kutatási hipotézisünk teszteléséhez szükséges kérdés(eke)t, vagy nem megfelelő mérési skálákat használtunk, akkor a kérdőívszerkesztés befejezése után már nincs alkalmunk módosítani, az adott részeredményekről le kell mondanunk, szerencsétlen esetben hiábavaló lesz az egész kutatásunk. Ezért a kérdőívszerkesztés a kutatási folyamat kiemelt fontosságú része. A következőkben csak a kvantitatív kutatás kérdőívéről lesz szó, nem értjük ide a mélyinterjú strukturálatlan kérdőívét és a fókuszcsoport moderátori vezérfonalát. A kérdőív jellemzői: A kérdőív strukturált, tehát a kutató által meghatározott szerkezetben vizsgálja az interjúalany véleményét. A kérdések logikusan követik egymást, tartalom szerint témacsoportokba sorolva, és ezek a témacsoportok is logikusan tagolják a kérdőívet. Bemutatkozó szöveggel kezdődik, amelyben a kérdezőbiztos bemutatkozik, majd közli az interjúalannyal az interjú célját és várható időtartamát. A kérdéseknek a lehető legegyszerűbbnek, közérthetőnek kell lenniük, szakkifejezéseket, homályosságot lehetőleg el kell kerülni. A kérdőívet szerkesztő kutató nem tévesztheti szem elől, hogy nem a témáról alkotott szakvéleményét kell közölnie az interjúalannyal, hanem az interjúalany véleményét mérni, rögzíteni. Az interjúalany válaszait véglegesnek kell tekinteni, hibák vagy hiányosságok esetén csak nagyon ritkán adódik az interjú kiegészítésére lehetőség. A kérdőívnek a lehető legrövidebbnek kell lennie, nem tartalmazhat ismétléseket, redundanciát. Egységes valamennyi interjúalany számára, nem módosíthatjuk az adatgyűjtés során.

68 kutatasmodszertan:ii. KOR :27 Page KÉRDŐÍVSZERKESZTÉS A kérdőív változhat a válaszok alapján. Bizonyos szűrőkérdésekre adott válaszok kizárhatják a valamilyen feltételnek nem megfelelő válaszadókat egészen vagy részlegesen az interjúból. A kiszűrt interjúalanyokat a megfelelő kérdőívrészre irányító utasítást nevezzük ugrásnak. A kérdezés során nincs lehetőségünk arra, hogy a válaszoló feleleteit megfigyelési adatokkal kiegészítsük, ilyen adatigény esetén a kvantitatív kutatásunkat ki kell egészíteni szekunder adatgyűjtéssel. A kérdőívszerkesztést jelentősen befolyásolja a kérdőív típusa. Alapvető különbség van a típusok között a kérdőív kitöltőjének személyét illetően: Segített kérdőív, az interjúkészítő (kérdezőbiztos) által kitöltött kérdőív az interjút egy kérdezőbiztos vezeti, ő olvassa a kérdéseket, és szükség szerint segít az értelmezésükben, illetve rögzíti a válaszokat. Önkitöltő kérdőív csak képletesen beszélhetünk interjúról, mert az interjúalany egymaga olvassa, értelmezi és jó esetben megválaszolja a kérdéseket. A segített kérdőíveken belül a kvantitatív kutatások kérdezési mód szerinti osztályozása meghatározza a kérdőívet is: 1. Személyes kérdezés kérdőíve. Mivel a személyes kérdezés során maximális módon adva van a közvetlen párbeszéd, a kérdezés során felmerülő problémák megoldásának lehetősége, ezért a személyes kérdőív a többi típusnál hosszabb lehet, és bonyolultabb, személyesebb témákat tartalmazhat. Az interjú helyszíne (otthoni, utcai, bevásárlóközponti) is kisebb-nagyobb mértékben meghatározhatja a kérdőív jellemzőit. A kérdőívszerkesztést a helyszínnél jobban befolyásolja, hogy a kérdőív nyomtatott formában van-e vagy számítógéppel támogatott kérdezés (CAPI) során egy kisebb laptopon le van programozva. Fontos különbség, hogy a kérdőív a számítógépen nem dokumentumként, hanem egy speciális szoftver segítségével programozva található. 2. Telefonos kérdezés során az interjúalanyt otthonában, üzleti kutatásoknál munkahelyén vagy mobiltelefonon hívja a kérdezőbiztos. 3. Internetes kérdezés alatt weblapon elhelyezett kérdőív kitöltését értjük. Azért soroljuk a segített kérdezések közé, mivel a programozás lehetővé teszi, hogy hibás válasz esetén figyelmeztessük az interjúalanyt, illetve a kérdések közötti logikai kapcsolatokat, ugrásokat automatikusan követi. A programozott kérdőív előnyei: A kérdezés témáját, a kérdést szükség esetén értelmezhetőbbé tehetjük egy kis film bemutatásával vagy más multimédiás megoldással.

69 kutatasmodszertan:ii. KOR :27 Page KÉRDŐÍVSZERKESZTÉS 69 A hagyományos, nyomtatott kérdőívet használó személyes kutatásoknál hasonló funkciót tölt be a kérdőív mellékleteként szereplő kártyafüzet, amelyben képeket lehet mutatni az interjúalanynak. A válaszlehetőségek közötti választást befolyásolhatja azok sorrendje. Például ha az interjúalanyt arra kérjük, hogy egy kérdésnél tíz válaszlehetőség közül választhatja ki a három legfontosabbat. Főképp szubjektív (pl. attitűd) kérdéseknél lényeges a válaszlehetőségek sorrendje. Bonyolultabb logikai ugrásokat, szűrőfeltételeket fogalmazhatunk meg, nem kell attól tartanunk, hogy a kérdezőbiztos nem tudja pontosan követni az utasításokat. Nem kérdőív-szerkesztési szempont, de nagymértékben meghatározza az adatminőséget, a terepmunka gyorsaságát és költségét, hogy a programozott kérdőív során közvetlenül adatbázisba kerülnek az adatok, tehát nincs szükség adatrögzítésre. Az önkitöltő kérdőíveken belül az adathordozó alapján megkülönböztethetjük a postai úton eljuttatott nyomtatott, és az elektronikus postán, e- mailen keresztül eljuttatott elektronikus kérdőíveket. Kérdőívszerkesztés szempontjából nincs nagy jelentősége a megkülönböztetésnek (a terepmunka szervezése szempontjából viszont igen), mindkét típus ugyanazokkal az előnyökkel, de főképp korlátokkal rendelkezik. A kérdezőbiztos segítsége és az általa nyújtott motiváció nélkül kitöltendő kérdőívek csak rövidek lehetnek és viszonylag egyszerű, egyértelmű témákat érinthetnek. A kérdőív szerkesztésének lépései: 1. Meg kell határozni a szükséges információk körét a kutatási céloknak megfelelő kérdések meghatározása és felsorolása. Ezt követően a kérdéseket logikailag, tartalmilag összetartozó csoportokba, blokkokba rendezzük. 2. Meg kell határozni a kérdezés módját és a kérdőív típusát ideális esetben a pénz, idő vagy egyéb erőforráskorlátok nem determinálják a kérdezés módját, hanem a témának leginkább megfelelő kérdezési módot választhatjuk. 3. Kérdések tematizálása, a témacsoportok sorrendjének kialakítása. 4. Kérdések formába öntése: szövegezés, skálák, táblázatok, kártyafüzet. 5. Formai és tartalmi ellenőrzés. A formai ellenőrzés során jó, ha nem a kérdőív készítője ellenőrzi a kérdések sorszámait, a zárt kérdések válaszlehetőségeinek kódjait, a logikai ugrások helyességét, az NT/NV válaszlehetőségek meglétét.

70 kutatasmodszertan:ii. KOR :27 Page KÉRDŐÍVSZERKESZTÉS 6. Próbakérdezés (pilot interjú), véglegesítés egy próbakérdezés során teszteljük, lekérdezzük a kérdőívet, lehetőleg a célcsoportba tartozó személlyel folytatva az interjút. Kérdéstípusok: A kérdőívszerkesztés alapelveinek és folyamatának bemutatása után vizsgáljuk meg közelebbről a kérdést. A jó kérdés jellemzői: nem fölöslegesen részletező vagy túlságosan specifikus, de túl általános sem, nem sugalmazó, nem haladja meg a válaszadók elvárható tudását, tapasztalatait, jövedelemre, fizetésre direkt módon nem szabad kérdezni, ne legyen vizsgáztató jellegű, hangneme udvarias, semleges, közérthető legyen, ne tartalmazzon homályos, idegen kifejezéseket vagy sztereotípiákat, egy kérdéssel mindig csak egy dologra kérdezzünk, a lehető legrövidebb legyen, de ez ne rontsa az érthetőségét, és mindenekelőtt legyen indokolt, ne kérdezzünk feleslegesen. A kérdéseket osztályozhatjuk funkciójuk és a válaszlehetőségek szerint. I. A funkciójuk szerint: Fő kérdések közvetlenül a kutatási témára vonatkoznak; Kiegészítő kérdések segítik a fő kérdésekből származó eredmények értelmezését, illetve a kérdőív elfogadhatóságát (pl. demográfiai adatokra vonatkozó kérdések, felvezető kérdések). II. A válaszlehetőségek szerint: Nyitott kérdés: szabad válaszkifejtés, a válaszlehetőségek nincsenek meghatározva (mit gondol róla?, mi a véleménye? stb.); Egyválaszos zárt kérdés egy válasz lehetséges az előre meghatározott lehetőségek közül: igen-nem válaszlehetőség, egyéb válaszlehetőség, skálán jelezhető a válaszerősség. Többválaszos zárt kérdés több válaszlehetőség közül egynél többet is választhat a kérdezett. A nyitott-zárt kérdések aránya egy kérdőíven belül általában 30 70% és 20 80% intervallumok között mozog. Valamennyi kérdésnél nagyon fontos, hogy a válaszmegtagadást is rögzítsük. A válaszmegtagadásnak két alapvető oka lehet: az interjúalany

71 kutatasmodszertan:ii. KOR :27 Page KÉRDŐÍVSZERKESZTÉS 71 nem tud vagy nem akar válaszolni. Ezt a két lehetőséget csak nagyon ritkán indokolt megkülönböztetni, ezért a válaszmegtagadást általában NT/NV rövidítéssel jelöljük. Ha ezt nem jelölnék, akkor az adatelemzés során nem tudnánk megkülönböztetni, hogy adott kérdés nem volt kérdezve az interjúalanytól, vagy valamilyen okból megtagadta a választ. Ennek jelentősége leginkább az adattisztítás, a kérdőív és az adattábla összhangjának az ellenőrzésénél van. Széleskörűen elfogadott gyakorlat tehát, hogy valamennyi kérdés esetében van NT/NV válaszlehetőség, amit általában 9-essel kódolnak. Előfordulnak olyan próbálkozások, hogy a kutató szándékosan nem ír a kérdőívbe ilyen válaszlehetőséget, hogy kvázi kikényszerítse a választ az interjúalanyból. Ez a trükk azonban csak nagyon nyitott, segítőkész és a kutatási témát jól ismerő interjúalanyok körében működik. Rosszabb esetben kitöltetlen kérdőívet vagy irreleváns válaszokat kapunk. A kérdésekre adott válaszokat a következő négy típusú mérési skála valamelyikének segítségével számszerűsíthetjük: 1. Nominális skála értékeinek nincs számszerű jelentésük, hanem kódként szerepelnek, és a változó értékeinek, kategóriáinak a jelentését a kódokhoz rendelt címkék (label-ek) adják. Például: a cég jogi formája (1 egyéni és családi vállalkozás, 2 kft., 3 rt., 4 egyéb), a fogyasztott üdítőital márkája (1 Coca-Cola, 2 Pepsi-Cola, 3 egyéb), az interjúalany neme (1 nő, 2 férfi). 2. Sorrendi skála. A sorrendi skálaértékeknek sincs számszerű jelentésük, jelentésüket a címkék (label-ek) adják. Az különbözteti meg a nominális skálától, hogy a skálaértékek között rangsorbeli különbség van. Például a település típusa (1 főváros, ezer lakosúnál nagyobb város, lakosú város, 4 kisváros, 5 falu, község), a fogyasztói elégedettség mértéke (1 rossz, 2 közepes, 3 jó), a gazdaság fejlődése a következő évben (1 csökkenés, 2 stagnálás, 3 növekedés). 3. Intervallumskála Az intervallumskála értéke egy szám, amelynek önmagában jelentése van, nincs szükség címkére az értelmezéséhez. A skálaértékek kezdőpontja viszonylagos, nem egyértelmű, ezért a skála értékei összegezhetők, kivonhatók, de nem képezhetünk arányokat. Legjellemzőbb példa a hőmérséklet Celsius fokban kifejezve, ahol a 0 fok megegyezéses (nem ugyanannyi, mint Fahrenheitben), és nem mondhatjuk, hogy az 5 fokos meleg ötször melegebb, mint az 1 fok.

72 kutatasmodszertan:ii. KOR :27 Page KÉRDŐÍVSZERKESZTÉS 4. Arányskála Az arányskála értékei is számok, továbbá az különbözteti meg az intervallumskálától, hogy az értékekkel bármilyen numerikus műveletet végezhetünk. Ilyen például az életkor években kifejezve, melyről elmondható, hogy egy 25 éves ötször idősebb, mint egy 5 éves. További példák: a cég árbevétele, az előállított termékek darabszáma, a szolgáltatással kapcsolatos elégedettség mértéke 1-től 5-ig terjedő skálán stb. A fenti skálákat a mérési szint növekvő sorrendjében tüntettük fel. Ez azt jelenti, hogy adatelemzési szempontból például az arányskála magasabb rendű, mint a nominális skála. 16 Ennek egyik jó példája, hogy skálatranszformációval a magasabbrendű skálákból képezhetünk alacsonyabb rendűt, de fordítva nem. Például a pontos évvel kifejezett életkorból (arányskála) képezhetünk életkor-kategóriákat (nominális skála): 1 18, 19 25, 26 35, 36 45, és 60 felett Adatgyűjtés, terepmunka 1. A kutatási téma meghatározása 2. Előzetes tájékozódás 3. A kutatási célok és hipotézisek megfogalmazása 4. A kutatási terv elkészítése 5. Adatgyűjtés, terepmunka 6. Adatelemzés 7. Az eredmények prezentálása, a tanulmány megírása 16 Megjegyzendő, hogy a különböző nemlineáris és nemparaméteres módszerek kifejlesztésével és elterjedésével ez a megközelítés egyre inkább idejétmúlt, egy nominális skála is lehet ugyanolyan értékű, mint egy arány skála.

73 kutatasmodszertan:ii. KOR :27 Page ADATGYŰJTÉS, TEREPMUNKA 73 A kutatási terv és a kérdőív szerkesztésének befejezése után indulhat a kutatás legidőigényesebb része, a terepmunka vagy az angolból átvett nevén field. A kutatási folyamatnak ebben a szakaszában a kutató általában háttérbe szorul, átengedve a terepmunkát a terepkutatóknak, kérdezőbiztosoknak. A terepmunka folyamata a következő szakaszokból áll (Malhotra 2001): 1. A terepkutatók kiválasztása; 2. Képzése; 3. Ellenőrzése; 4. A munka elfogadása; 5. Értékelés. A terepkutatók, kérdezőbiztosok képzése során megkülönböztethetjük az általános kapcsolatteremtő képesség fejlesztését adott kutatáshoz kapcsolódó ismeretek oktatásával. Olyan kutatócégeknél, ahol a folyamatos kiválasztás és képzésnek köszönhetően tapasztalt kérdezőbiztosok állnak a kutatás rendelkezésére, a terepmunka a kérdőív bemutatásával, elmagyarázásával kezdődik. A kutatás vezetője röviden bemutatja a kutatás célját, elmagyarázza a speciálisabb témákat, kérdésről kérdésre részletesen bemutatja a kérdőívet, a válaszok rögzítésének módját. Miután a kutató bemutatta a kérdőívet a kérdezőbiztosoknak, a kutatás egészének szempontjából kulcsfontosságú momentum következik: rá tudja-e venni a kérdezőbiztos az interjúalanyt a kérdőív kitöltésére? Van néhány olyan technika, amivel ennek valószínűségét növelni tudjuk. A sikeres interjú feltételei: Az interjút néhány bevezető mondattal kell kezdeni, ami a kérdezés céljára, a kérdések jellegére és a kérdezés időtartamára vonatkozik. Utaljunk az anonimitásra és a válaszadás önkéntességére. Lehetőleg udvarias, barátságos légkört kell teremteni. A kérdezőbiztos ismerje jól a kérdőívet. Az általános kérdésektől haladjunk a speciálisabb kérdések felé. Érdeklődést kell mutatni, sohasem szabad meglepetéssel vagy helytelenítőleg reagálni a válaszra. Minden kérdést pontosan úgy kell feltenni, ahogyan megfogalmazták. Ezek a technikák természetesen nem alkalmazhatók az önkitöltő kérdőív esetében. A sikeres önkitöltő kérdőív feltételei:

74 kutatasmodszertan:ii. KOR :27 Page KÉRDŐÍVSZERKESZTÉS Kísérőlevelet csatoljunk a kérdőív mellé, ami a kutatás céljait írja le. Ebben udvarias (név szerinti) megszólítást használjunk, tartalmazzon egy rövid témabemutatást, és sorolja fel a kérdőív kitöltésével járó előnyöket. Részletes útmutató a kitöltéshez. Legyen minden maximálisan egyértelmű. Az interjú megtagadása esetén a következőket tehetjük: Az elérési arány növelése érdekében: az el nem ért interjúalanyok többszöri felkeresése. A visszautasítás csökkentése érdekében: előzetes bejelentkezés általában telefonon, az interjúalanyok érdeklődésének felkeltése, ösztönzők, ajándékok használata, a kérdőív tartalmi és szerkesztési módja. Mint minden üzleti tevékenységnél, folyamatnál, itt is szükség van egy menedzsmentfunkcióra, a kontrollra. A kérdezőbiztosok ellenőrzésére a következő lehetőségek adottak: Minőség-ellenőrzés: Átnézzük a kitöltött kérdőívet, hogy az utasításoknak megfelelően van-e kitöltve. Mintavételi ellenőrzés. Személyes kérdezéseknél azt vizsgáljuk, hogy a mintavételi tervnek megfelelően választotta ki a kérdezőbiztos az interjúalanyt. Telefonos, internetes és postai kérdezéseknél különböző automatizmusok biztosítják ezt. Csalás kizárása. Előfordulhat, hogy a kérdezőbiztos a legközelebbi kávéautomata mellett tölti ki a kérdőíveket. Ennek ellenőrzése leginkább úgy történik, hogy szúrópróbaszerűen felhívják az interjúalanyokat és rákérdeznek az interjúra. Az adatok alapján történő ellenőrzés. A terepmunka lezárása és az adattábla létrehozása után a kutatónak lehetősége van az adatok konzisztenciája és az eltérések vizsgálata alapján következtetni a csalás valószínűségére. (Ehhez az adattáblának tartalmaznia kell a kérdezőbiztos nevét vagy kódját). Az adatelőkészítés a terepmunka lezárásával, a kitöltött kérdőívek visszaérkezésével kezdődik. Az adatelőkészítés folyamata a következő lépésekből áll: 1. A kérdőív-ellenőrzés során a nem megfelelő válaszokat próbáljuk kezelni: a kérdőív visszaküldése, hiányzó értékek hozzárendelése, a rossz adatok kizárása által.

75 kutatasmodszertan:ii. KOR :27 Page ADATELEMZÉS A kódolás nagyrészt a kérdőívszerkesztéskor megtörtént, de a nyílt kérdések kódolására ekkor kerül sor. 3. Adatbevitel hagyományos személyes vagy telefonos kérdezésnél és a postai úton történő lekérdezésnél szükség van a kérdőíven rögzített adatok számítógépes adatbevitelére. A legpontosabban dolgozó adatrögzítőnél is történnek elütések, ezeket a hibákat is a következő lépésben próbáljuk kiszűrni. 4. Adattisztítás alatt a hibás adatok kijavítását, vagy ha erre nincs lehetőség, akkor a törlését értjük. 5. Statisztikai adatkiigazítás: súlyozás, a változó újradefiniálása, skálatranszformáció. 6. Adatelemzési tervet a marketingkutatási folyamat korábbi szakaszai (mindenekelőtt a kutatási célok), az adatok ismert jellemzői, a statisztikai módszerek tulajdonságai és a kutató felkészültsége és felfogása határozza meg Adatelemzés 1. A kutatási téma meghatározása 2. Előzetes tájékozódás 3. A kutatási célok és hipotézisek megfogalmazása 4. A kutatási terv elkészítése 5. Adatgyűjtés, terepmunka 6. Adatelemzés 7. Az eredmények prezentálása, a tanulmány megírása A kutatási folyamatban elérkeztünk ahhoz a részhez, amit sokan a kutatás magjának tekintenek. A továbbiakban a kvantitatív kutatások adatelemzési módszereit mutatjuk be az SPSS programcsomag segítségével.

77 kutatasmodszertan:ii. KOR :27 Page FEJEZET BEVEZETÉS AZ SPSS PROGRAM HASZNÁLATÁBA Az SPSS (Statistical Package for Social Science) egy olyan statisztikai program, amely kvantitatív adatok elemzésére specializálódott. A jegyzet írásakor legfrissebb verziót, az SPSS17-est használjuk, de a bemutatott módszerek és beállításaik szinte teljesen azonosak a 9-es vagy annál újabb verziókéval. Tehát aki SPSS9-es vagy annál nagyobb verziószámú programmal rendelkezik, bátran nekivághat a jegyzetben leírtak kipróbálásának. A tanulást különböző szerkesztési trükkökkel is segíteni kívántuk: Valamennyi módszer egy gyakorlati példán keresztül kerül bemutatásra. Ennek során nem használunk olyan adattáblákat, amihez az olvasó nem juthat hozzá, valamennyi az SPSS példa adattáblái közül került ki. Ezek a program installálása után megtalálhatók a C:\Program Files\SPSS mappában. A program számára kiadott utasításainkat a következőképp tüntetjük fel: Analyze Descriptive Statistics Frequency Ezeket az utasításokat a grafikus felületnek köszönhetően a menüsorból választjuk ki, nincs szükség a parancsok begépelésére. Minden módszer bemutatásánál a parancs futtatása után az Eredmények értelmezése következik. A program ablakaiban, menüjében megjelenő beállítási lehetőségek, opciók nevét mindig aláhúzva tüntetjük fel. Kezdjük el tehát az adatelemzést az SPSS segítségével. A program több ablakot, felületet is tartalmaz, amelyek külön fájlként menthetők, kezelhetők. Alapbeállításban indításkor két ablakot nyit meg az SPSS: 1. A Data Editor (adatszerkesztő ablak) az adatokat tartalmazza, itt tudjuk az adatokat bevinni, módosítani. Más adatkezelő programokhoz hasonlóan (pl. Excel) az adatok mátrix formában vannak elrendezve, a sorokban vannak a megfigyelési egységek (pl. az interjúalanyok válaszai), és az oszlopok e megfigyelési egységek ismérveit, változóit jelentik. Az adattábla

78 kutatasmodszertan:ii. KOR :27 Page BEVEZETÉS AZ SPSS PROGRAM HASZNÁLATÁBA fájlnak.sav kiterjesztése van. Az adatszerkesztő ablaknak két nézete van, amelyek között az ablak alján levő fülekre kattintva válthatunk: az egyik a tényleges adattábla nézet (Data View), a másik pedig a változók különböző jellemzőinek beállításait lehetővé tevő változó nézet (Variable View). 3. ábra. SPSS adattábla 2. Az Output Viewer (eredménykijelző ablak) segítségével a feldolgozott statisztikai eredmények jelennek meg táblázatok, grafikonok formájában. A fájlnak.spo kiterjesztése van. Beállítástól függő, hogy a program indításakor automatikusan megnyílik-e az eredménykijelző ablak is, de bármilyen elemzési módszerre (Analyze menü) vagy grafikonkészítésre (Graphs menü) vonatkozó parancs kiadása után az eredményekkel együtt szükségszerűen megjelenik. A két ablak menüje megközelítőleg ugyanaz, viszont a menü sorban levő ikonok különböznek. További programablakokat és -funkciókat vehetnek igénybe a haladó felhasználók, például az utasítások parancssorait tartalmazó Syntax ablakot. Az SPSS legelső verziói nem tartalmaztak grafikus felületet, a parancsokat meghatározott szintakszis sze-

79 kutatasmodszertan:ii. KOR :27 Page VÁLTOZÓ TÍPUSOK 79 rint kellett begépelni. Ez a lehetőség a későbbi verzióknál is opcionálisan megmaradt, főképp gyakran ismétlődő vagy egymással összefüggő utasítássorozatok esetén jelentősen felgyorsítja az elemzők munkáját. Másik gyakran igénybe vett funkciókat tartalmazó ablak az SPSS grafikonjainak szerkesztését lehetővé tevő Chart ablak. Ezt úgy tudjuk elindítani, ha duplán kattintunk az Output-ban megjelenő grafikonra. E két programablakba tartozó funkciók részletes ismertetése nem célja a jegyzetnek, de perspektívaként szívesen ajánljuk az olvasó figyelmébe. 4. ábra. SPSS eredménykijelző ablak (Output) 7.1. Változó típusok A kvantitatív adatelemzés kiindulópontja, hogy felismerjük az adatok, a változók típusát. A mérési skálák leírásánál láthattuk, hogy négy fő típusa van a mérési skáláknak: nominális, ordinális, arány- és intervallumskála. Ennek megfelelően a változók (ismérvek) értékei e négyféle skála valamelyike közül kerülnek ki. Az adatelemzés kikerülhetetlen alapja, hogy felismerjük egy változó típusát, mivel ez meghatározza, hogy milyen statisztikai műveleteket, modelleket alkalmazhatunk. 1. Nominális skála nominális változó. A változó értékeinek nincs számszerű jelentésük, hanem kódok, és a változó kategóriáit a kódokhoz rendelt címkék (label-ek) azonosítják. Pl. a cégforma a következő értékekkel: 1 egyéni és családi vállalkozás, 2 kft., 3 rt., 4 egyéb, vagy a fogyasztott üdítőital márkája: 1 Coca-Cola, 2 Pepsi-Cola, 3 egyéb.

80 kutatasmodszertan:ii. KOR :27 Page BEVEZETÉS AZ SPSS PROGRAM HASZNÁLATÁBA A kétértékű nominális változót dichotómnak nevezzük (pl. a nem változó 1 nő, 2 férfi értékekkel), és ennek egy típusa a dummy változó, amelynek két értéke 0 és 1 (pl. a nem változó 0 nő, 1 férfi értékekkel). 2. Sorrendi skála ordinális változó. Az ordinális változó értékeinek sincs számszerű jelentésük, a változó értékeinek jelentését a címkék (label-ek) adják. Az különbözteti meg a nominális változótól, hogy a változó értékei, kategóriái között rangsorbeli különbség van. Például az iskolai végzettség (1 kevesebb mint 10 osztály; 2 szakiskola, 3 érettségi, 4 főiskola, 5 egyetemi végzettség), elégedettség mértéke (1 rossz, 2 közepes, 3 jó), a gazdaság fejlődése a következő évben (1 csökkenés, 2 stagnálás, 3 növekedés). 3. Az arány- és az intervallumskála numerikus változó. Az arányés az intervallumskála között olyan kismértékű gyakorlati különbség van, hogy az SPSS-ben történő adatelemzés során ezeket nem különböztetjük meg, hanem numerikus változótípusba soroljuk mindkettőt. A numerikus változó értéke egy szám, amelynek önmagában jelentése van, nincs szükség címkére az értelmezéséhez. Például az életkor évben kifejezve, a cég árbevétele, az előállított termékek darabszáma, a szolgáltatással kapcsolatos elégedettség mértéke 1-től 5-ig terjedő skálán stb. Ez utóbbi elégedettségre vonatkozó példa előfordulása mind az ordinális, mind a numerikus változók között jelzi, hogy nem mindig egyértelmű a változó típusának besorolása. Amennyiben a kérdőívben és az interjúalany válaszában inkább a kategóriák címkéin van az értelmi hangsúly, akkor tekintsük ordinálisnak, ha pedig az 1-től 5-ig terjedő elégedettségi skálának 17 csak a két végpontja van címkézve, akkor numerikus. Nem követünk el hibát, ha a mindkét változótípusra alkalmazható statisztikai módszereket alkalmazzuk az ilyen változókra Gyakorisági eloszlás Leggyakrabban használt SPSS funkciók közé tartozik az egy vagy több változó értékeinek gyakorisági eloszlását eredményező Frequency parancs. Nyissuk meg az SPSS példa adattáblái közül egy szervezet munkavállalói adatait tartalmazó employee data.sav fájlt. 17 Az ilyen skálát Likert skálának is nevezzük.

81 kutatasmodszertan:ii. KOR :27 Page GYAKORISÁGI ELOSZLÁS 81 Példa: gyakorisági eloszlás. Vizsgáljuk meg az employee data.sav adatfájlban a munkavállalók iskolai végzettségére (educ) és a kisebbségi státusára (minority) vonatkozó változók értékeinek gyakorisági eloszlását. Analyze Descriptive Statistics Frequency 5. ábra. Frequencies gyakorisági eloszlás A bal oldali ablak változólistájából kiválasztjuk, azaz kijelöljük és a középen látható háromszögre kattintva átvisszük a minority változót a jobb oldali ablakba. Egyelőre ne törődjünk a többi beállítási lehetőséggel, hanem kattintsunk az OK gombra. Eredmények értelmezése: A parancs futtatása után az eredmények azonnal megjelennek az Output ablakban. 6. ábra. A Frequencybe bevont változók Az első táblázat megmutatja, hogy melyik változókat vontuk be a műveletbe, és ezeknek hány valós, illetve hiányzó értékük van.

82 kutatasmodszertan:ii. KOR :27 Page BEVEZETÉS AZ SPSS PROGRAM HASZNÁLATÁBA 7. ábra. Numerikus változó gyakorisági eloszlása A következő tábla az először megjelölt EDUC változó gyakorisági eloszlását tartalmazza. Az első oszlopban találjuk a változó értékeit, a legkisebb 8, a legnagyobb 21. Megállapíthatjuk, hogy az iskolai végzettség években kifejezett változója numerikus változó. A második Frequency oszlop az abszolút gyakorisági eloszlást tartalmazza, vagyis minden érték mintabeli előfordulásának számát. A Percent oszlop a relatív gyakorisági eloszlás, az értékek mintabeli előfordulásának az aránya, egyszerűen úgy adódik, hogy elosztjuk (mármint az SPSS) az abszolút gyakoriságot a minta elemszámmal. A Valid Percent értékei ebben a táblázatban nem különböznek a Percentétől, mivel a vizsgált változó nem tartalmaz hiányzó értékeket. A Valid Percent ugyanis az a relatív gyakoriság, amely nem az adattábla teljes elemszámára arányosítja az abszolút gyakoriságot, hanem a változó valós, nem hiányzó értékeinek számára. A kumulált gyakoriság (Cumulative Percent) a Valid Percentben megjelenő relatív gyakoriság kumulálását, összegzését jelenti. A következő táblázatnak két értéke van: a 0 jelöli a Nem-et, az 1-es pedig a kisebbségi sorba tartozást. Változónknak tehát két olyan értéke van, amit teljes mértékben a címke (No vagy Yes) határoz meg, ezért ez egy nominális változó.

83 kutatasmodszertan:ii. KOR :27 Page A VÁLTOZÓK JELLEMZŐI ábra. Nominális változó gyakorisági eloszlása Ajánlott, hogy az adatelemzésünket mindig az adattáblában levő valamennyi változó gyakorisági eloszlásának a vizsgálatával kezdjük A változók jellemzői Mielőtt tovább haladunk az adatelemzési módszerek megismerése felé, nézzük meg, hogyan állíthatjuk be a változók különböző jellemzőit. Az adatszerkesztő ablak (Data Editor) két nézete közül már megismerkedtünk az adattábla nézettel (Data View), most a változó nézet (Variable View) következik. 9. ábra. Az adattábla változó nézete Name a változó neve karakterekből és számokból állhat. Korábbi SPSS verziók csak nyolc karakter hosszúságú nevet engedtek, most csak

84 kutatasmodszertan:ii. KOR :27 Page BEVEZETÉS AZ SPSS PROGRAM HASZNÁLATÁBA az a feltétel, hogy ne számmal kezdődjön, ne legyen benne szóköz, illetve a Windowsos fájlnevekben általában tilos karakterek (+-:?*, stb.) itt sem használhatók. A kutatók általában két lehetőség között választanak: vagy a változó tartalmára utaló rövidítést (pl. iskolai végzettség) használnak, vagy a kérdőív sorszámát egy karakterrel kiegészítve (pl. q1). Inkább az utóbbit ajánlhatjuk főképp sok, nál több változó esetén. Type a változó típusa. Megtévesztő elnevezés, mivel itt nem az előbb ismertetett, a mérési skáláknak megfelelő változó típusokról van szó, hanem adatbázis-programozási értelemben választhatunk a numerikus, dátum, a vesszővel, illetve ponttal elválasztott tizedes, a pénzösszeg (dollár), szöveg formátumok között. A gyakorlatban nem sokat kell törődnünk ezekkel a beállításokkal, a változóink túlnyomó többsége ebben az értelemben numerikus. Néha előfordul, hogy a változó alapbeállításban nem mutatja a szám tizedeseit, de szükség van a megjelenítésére, vagy szöveget csak akkor tudunk bevinni az adattáblába, ha előzőleg a változót szövegtípusúra (string) állítottuk. Width a változó értékeinek karakterhossza. Decimals a tizedesek száma, az előbbi teljes karakterhosszúságon belül. Label (változó címke) a változó címkéje írható ebbe a mezőbe. E címke alapján egyértelműsíthetjük, hogy pontosan mire vonatkozik a változó, milyen adatokat tartalmaz. A változó neve ugyanis csak nyolc karakter hosszúságot enged, ami ritkán elég arra, hogy bemutassa a tartalmat. Kutatók gyakran a kérdőív kérdését másolják be (copy-paste) címkeként. Values (érték címke) itt a változó értékeinek címkéit határozzuk meg. Természetesen csak a nominális és az ordinális változók értékei kódok, amelyek értelmezéséhez szükség van a szöveges címkékre, a numerikus változó értékeinek nincsenek címkéi. Missing (hiányzó érték) a legfontosabb beállítási opció, helytelen használata téves kutatási eredményekhez vezet. Az SPSS-ben két típusú hiányzó érték van: System Missing nincs semmilyen érték az adatcellában. Ennek alapvetően két oka lehet: vagy valamilyen hiba történt (kérdezési, adatrögzítési, véletlenül kitöröltük az adattáblából), vagy a kérdőív logikai ugrásait követve nem is szabad adatnak lennie. (Pédául az internetezési szokásokat csak azoktól kérdezzük, akik egy megelőző kérdésnél azt állították, hogy interneteznek.) A hiányzó értékek vizsgálata nagyon fontos az adattisztítás során, amikor a kérdőív és a nyers adattábla összhangját vizsgáljuk.

85 kutatasmodszertan:ii. KOR :27 Page A VÁLTOZÓK JELLEMZŐI 85 Missing Value ebben az esetben a kutató határozza meg, hogy adott változó mely értékeit ne vegye figyelembe a program, gyakorlatilag hiányzónak tekinti. Tipikusan ilyen érték a Nem tudom/nincs válasz (NT/NV) kódja, amely a változó karakterszámától függően a 9, 99, 999 stb. értéket szokta kapni. Az NT/NV kódját a gyakorisági eloszlásnál általában bennhagyjuk, de bármilyen változók közötti kapcsolatot vizsgáló módszer alkalmazásánál az NT/NV kódot szigorúan hiányzó értéknek kell tekinteni. Szakzsargonnal szólva az NT/NV-t kitesszük missing-re. Ennek hiányában a program NT/NV kódjával valós értékként számol, például figyelembe veszi egy numerikus változó átlagának a kiszámolásánál. Az NT/NV válaszok kizárásának módját a következő ábrán láthatjuk: 10. ábra. Változók értékeinek kizárása (Missing Values) A Missing oszlopban a vizsgált változó cellájára kattintva felugrik egy Missing Values nevű ablak, amelyben alapbeállítás szerint nincs semmilyen érték bejelölve (No missing values). Lehetőségünk van három diszkrét értékét megadni a Discrete missing values felirat alatti mezőkben (mint említettem, az NT/NV leggyakrabban használt kódja a 9-es), vagy egy -tól -ig terjedő terjedelmet a Range... mezőkben, kiegészítve egy diszkrét értékkel. Itt fontos megjegyezni, hogy egy változó értékei közül nem csak az NT/NV kódját indokolt időszakosan kizárni. Előfordulhat, hogy nincs szükségünk valamely értékekre, például egy numerikus változó gyakori-

86 kutatasmodszertan:ii. KOR :28 Page BEVEZETÉS AZ SPSS PROGRAM HASZNÁLATÁBA sági eloszlásának szélein levő nagyon nagy vagy nagyon kis értékeket nem akarjuk bevonni az átlagszámításba. Column és Align a változó oszlopszélességét és a cella értékeinek vízszintes elhelyezkedését állíthatjuk be, sok szép kutatást el lehet végezni anélkül, hogy ezekkel foglalkoznánk. Measure itt állíthatjuk be a változó típusát (nominális, ordinális, numerikus). Kezdő felhasználónak, aki még nem tudja ránézésre gyorsan és biztosan megállapítani egy változó típusát, ajánlott ezeket a beállításokat az adatelemzés elkezdése előtt megejteni. Még egyszer hangsúlyozzuk, hogy ezek a mérési skáláknak megfelelő változótípusok nem ugyanazok, mint a Type oszlopban található, adatbázis-programozási szempontból fontos típusok Adattábla-műveletek Az adattábla sorba rendezése és szelektálása A Sort parancs az adattábla sorba rendezését eredményezi egy vagy több változó értékei szerint, növekvő vagy csökkenő sorrendben. Példa: az adattábla sorba rendezése. Rendezzük sorba az employee data.sav adattáblát a fizetés nagysága szerinti növekvő sorrendbe. Data Sort Cases 11. ábra. Az adattábla sorba rendezése valamely változó értékei alapján A változólistából kiválasztjuk a salary változót, és a Sort Order résznél eldönthetjük, hogy növekvő (Ascending) vagy csökkenő (Descending) sorrendbe rendezzük az adattáblát.

87 kutatasmodszertan:ii. KOR :28 Page ADATTÁBLA-MŰVELETEK 87 Növekvő sorba rendezésnél az adott változó üres cellái, azaz hiányzó értékei (SYSTEM MISSING) a változó elejére kerülnek. E funkciónak a használatát nagyon gyakran a hiányzó vagy a hibás értékek, illetve egyéb adattisztítási műveletek indokolják. Az adattábla szűkítése, szelektálása A Select paranccsal az adattábla esetei közül ideiglenesen vagy végérvényesen kizárhatjuk azokat az eseteket, amelyek nem felelnek meg egy bizonyos szűrőfeltételnek. A szűrőfeltételeket valamely változó vagy változók értékei alapján fogalmazhatjuk meg. Példa: Tételezzük fel, hogy a cég munkavállalóinak adatait tartalmazó employee data.sav adatfájlban csak a kisebbséghez tartozó munkavállalók adataira van szükségünk. Ha megvizsgáljuk a minority változó értékeit akár a változó ablakban, akár a változó gyakorisági eloszlását vizsgálva, megállapíthatjuk, hogy az 1-es érték jelenti a kisebbségbe tartozást. Data Select Cases 12. ábra. Az adattábla szelektálása valamely változó értékei alapján

88 kutatasmodszertan:ii. KOR :28 Page BEVEZETÉS AZ SPSS PROGRAM HASZNÁLATÁBA Az If condition is satisfied rádiógombra, majd az If... gombra kattintva felugrik a Select Cases: If ablak, amelyben beállíthatjuk a szűrőfeltételt. 13. ábra. Az adattábla szelektálása valamely változó értékei alapján A bal oldali ablak változólistájából kiválasztjuk, azaz kijelöljük és a középen látható háromszögre kattintva átvisszük a minority változót a jobb oldali ablaka. A függvénylistában különböző függvények széles választéka található, de a minority=1 feltétel beírásához erre most nincs szükségünk. Ezután a Continue, majd az OK gombbal zárjuk az utasítást. A szűrőfeltételnek nem megfelelő, ideiglenesen kizárt esetek sorszáma át van húzva, illetve az adattábla végén egy új változó (filter_$) is jelzi, hogy mely esetek lettek szelektálva. Ezek után valamennyi SPSS utasítás csak a szelektált adattáblán, a szűkített mintán lesz végrehajtva, amíg a Select Cases ablakban vissza nem állítjuk az All cases opciót. Amennyiben biztosak vagyunk abban, hogy nem lesz többet szükségünk a szűrőfeltételnek nem megfelelő esetekre, szintén a Select Cases ablakban, az Unselected Cases Are résznél választhatjuk a Deleted lehetőséget.

89 kutatasmodszertan:ii. KOR :28 Page ADATTÁBLA MŰVELETEK ábra. Az adattábla szelektálása valamely változó értékei alapján Új változó képzése A Compute paranccsal egy új változót hozhatunk létre a meglévő változóink átalakítása révén. Példa: új változó képzése. Hozzunk létre egy új változót az employee data.sav adattáblában, ami az alkalmazottak fizetéseinek növekedését mutatja. Legyen az új saldif változó a jelenlegi (salary) és a kezdő fizetés (salbegin) különbsége. Transform Compute

90 kutatasmodszertan:ii. KOR :28 Page BEVEZETÉS AZ SPSS PROGRAM HASZNÁLATÁBA 15. ábra. Az adattábla szelektálása valamely változó értékei alapján A Target Variable mezőben adhatunk nevet az újonnan létrehozandó változónak. A Numeric Expression mezőben határozhatjuk meg az új változót meghatározó algoritmust, amihez a változó listából hozzuk a régi változót, a számokat, matematikai műveleteket és/vagy függvényeket vagy közvetlenül begépeléssel, vagy az ablak menüjéből választjuk ki. Jelenlegi példánkban nincs rá szükség, de az If... opciónál beállíthatunk olyan logikai feltételt, amelynek teljesülése esetén hajtódik végre csak a Compute parancs. Ez a lehetőség funkcionalitásában megegyezik az előzőekben bemutatott Select paranccsal, a teljes adattáblát leszűkítjük egy valamilyen logikai feltételnek megfelelő rész-adattáblára. Például ha a jelenlegi és a kezdő fizetés közötti különbséget csak a legalább egy éve a cégnél dolgozókra akarjuk kiszámítani, akkor az If... ablakban a jobtime<12 szűrőfeltételt kell beírnunk. A Compute parancs végeredménye egy új változó, amely valamennyi munkavállalóra (hacsak nem állítottunk be szűrőfeltételt) meghatározza, hogy a cégnél mennyit nőtt a fizetése.

91 kutatasmodszertan:ii. KOR :28 Page ADATTÁBLA MŰVELETEK 91 Feladat: az adatelemzések során az abszolút számoknál gyakran több információt hordoznak a fajlagos, valamilyen viszonyítási alapra vetített mutatók. Példánkban a fizetések növekedését nyilván nemcsak a munkavállaló teljesítményét honoráló fizetésemelések befolyásolják, hanem az is, hogy az illető mennyi ideje van a cégnél. Képezzünk egy olyan új változót, ami az egy hónapra vetített átlagos fizetésnövekedést mutatja, azaz képezzük a fizetésnövekedés (saldif) és a cégnél eltöltött idő hányadosát (jobtime). Változók újrakódolása Gyakran előfordul, hogy egy változó értékei nem az adatelemzési tervünknek megfelelő formában találhatóak. Például tételezzük fel, hogy a kérdezettek életkorára vonatkozó változónk nominális a következő 16 20, 21 25, 26 35, 36 50, 50+ életkor kategóriákkal, de más eredményekkel való összehasonlíthatóság miatt éves kategóriára lenne szükségünk. Ilyen kompatibilitási probléma oka lehet, hogy adataink szekunder adatforrásból származnak, ezért már nem tudjuk befolyásolni az ismérvek kategóriáinak a kódolását, primer adatgyűjtés esetén nem voltunk elég figyelmesek a kérdőív készítésekor, vagy csak az eredeti adatelemzési terveinkhez képest újabb ötleteink adódtak. A Recode utasítással mindhárom típusú (nominális, ordinális, numerikus) változó értékeit átalakíthatjuk, újrakódolhatjuk. Két típusa van: Recode into Same Variables: az eredeti változók értékeit kódoljuk át úgy, hogy a régi értékek nem maradnak meg. Recode into Different Variables: az új kódok egy új változóban jelennek meg, ezáltal az eredeti változó is megmarad. Példa: változó értékeinek újrakódolása. Frequency-t futtatva szintén az employee data adattábla educ változójára láthatjuk, hogy az iskolai végzettséget az elvégzett évek számával mérik, vagyis egy numerikus változóval van dolgunk, amely 8 és 21 között vesz fel értékeket.

92 kutatasmodszertan:ii. KOR :28 Page BEVEZETÉS AZ SPSS PROGRAM HASZNÁLATÁBA 16. ábra. Az iskolai végzettség változó gyakorisági eloszlása Képezzünk ebből egy új nominális változót a következő kategóriákkal: 8 1 alapfokú, 12 2 középfokú, főiskolai, egyetemi, posztgraduális. Transform Recode Into Different Variables 17. ábra. Változóképzés az értékek átkódolásával

93 kutatasmodszertan:ii. KOR :28 Page ADATTÁBLA MŰVELETEK 93 A változó listából kiválasztjuk az educ változót, az Output Variable mezőbe pedig az új változó nevét kell beírnunk. Legyen az új név educcat jelezve, hogy kategóriákat tartalmazó nominális változóval van dolgunk, majd klikkeljünk a Change gombra, hogy a NumericVariable Output Variable ablakban a régi mellett megjelenjen az új változó neve is. Az átkódolni kívánt változó és az új változó nevének meghatározása után nézzük a többi beállítást. Az If... opció választásával szűkítő feltételt lehetne megfogalmazni, ebben az esetben akárcsak a Compute utasításnál a Recode parancs csak az adott feltételnek megfelelő esetekre lesz futtatva. 18. ábra. Változóképzés az értékek átkódolásával régi és új értékek Az Old and New Values gombra kattintva megfeleltethetjük egymásnak a régi és új értékeket. Az Old Value ablakrészben az eredeti educ változó értékeit írhatjuk be. Több opció közül választhatunk: egyetlen diszkrét érték esetén a Value gombra, hiányzó érték átkódolásakor a System-missing gombra kattintunk, ha pedig a numerikus változónk folytonos értékeire -tól -ig határok közötti terjedelmet akarunk meghatározni, akkor a Range három opciója közül választhatunk. Az All other values-szal valamennyi másképp nem definiált értéket alakíthatjuk át. Példánkban tehát beírjuk a 8-as értéket az Old Value ablakrész Value mezőjébe, az új 1-es kódot pedig New Value ablakrész Value mezőjébe, majd az Add gombbal véglegesítjük a kódolást. (Ha mégis változtatni sze-

94 kutatasmodszertan:ii. KOR :28 Page BEVEZETÉS AZ SPSS PROGRAM HASZNÁLATÁBA retnénk, akkor a Change, illetve Remove funkciókkal ez lehetséges). Hasonlóképp járunk el a 12-es érték kódolásánál, a és a intervallumokat pedig a Range ablakokba visszük be. A végeredmény egy új educ nevű, nominális változó négy értékkel. Hasonlóképp kell eljárni a Recode into Same Variable utasítánál, itt kevesebb beállításra van szükségünk, mivel nem hozunk létre új változót. Feladat: hozzunk létre egy új, kétértékű változót, aminek 0 az értéke, ha a fizetés (salary változó) átlag alatti és 1, ha a fizetés átlag feletti értékű. A Recode utasítás előtt meg kell határoznunk a salary változó átlagát.

95 kutatasmodszertan:ii. KOR :28 Page FEJEZET VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA Már a könyv elején hangsúlyoztuk, hogy a gazdasági jelenségek egymást meghatározó, befolyásoló kölcsönhatásban vannak. Ezek vizsgálata az adatelemzés során a változók közötti kapcsolatok vizsgálatát jelenti. Háromféle kapcsolattípusról beszélhetünk: 1. Függetlenség: a két változó független egymástól, ha az egyik változó értékeinek (eloszlásának) ismerete nem nyújt semmilyen információt a másik változó értékeiről. 2. Sztochasztikus kapcsolat: a két változó között sztochasztikus kapcsolat van, ha az egyik változó értékeinek ismerete kisebb-nagyobb mértékben, de nem teljesen egyértelműen magyarázza a másik változó értékeit. 3. Determinisztikus kapcsolat: a két változó között determinisztikus vagy függvényszerű a kapcsolat, ha az egyik változó értékeinek ismerete alapján biztosan következtethetünk a másik változó értékeire. Empirikus kutatások adatai, ha nem függetlenek egymástól, akkor leggyakrabban sztochasztikusan kapcsolódnak. Determinisztikus kapcsolattal empirikus gazdasági vagy társadalomtudományi kutatásokban nagyon ritkán találkozunk, általában változó transzformáció során, vagy új, származtatott változók képzésekor definiálunk függvényszerű kapcsolatot két vagy több változó között. Az alábbi táblázatban a sztochasztikus kapcsolatok vizsgálatára alkalmas módszereket tüntettük fel a változók típusa szerint. 6. táblázat. A változók közötti kapcsolatok vizsgálatára használt módszerek Nominális Ordinális Numerikus Nominális Kereszttábla Kereszttábla Varianciaanalízis t-próba Varianciaanalízis Ordinális Kereszttábla Rangkorreláció t-próba Varianciaanalízis Numerikus Korrelációanalízis Regresszióanalízis Forrás: saját szerkesztés

96 kutatasmodszertan:ii. KOR :28 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA 8.1. Kereszttábla-elemzés Két nominális vagy ordinális változó közötti kapcsolat meglétének és a kapcsolat szorosságának vizsgálatára alkalmas Nominális változók közötti kereszttábla A változók közötti kapcsolatok elemzése előtt ajánlott megvizsgálni az adott változók gyakorisági eloszlását. A Frequency parancs futtatása után láthatjuk, hogy a változók között három nominális változó van: a nem (gender), munkavállalói kategóriák (jobcat) és a kisebbség (minority). Tételezzük fel, hogy nemi és nemzetiségi diszkriminanciamentes társadalmunkban (pontosabban a vizsgált munkahelyen) valakinek a neme nincs befolyással a munkahelyen betöltött munkakörére. A hipotézisünk tehát az, hogy a nem és a munkakör változók függetlenek egymástól. Hipotézisünk elfogadására vagy elutasítására a kereszttábla-analízist használjuk. Analyze Descriptive Statistics Crosstabs 19. ábra. Kereszttábla A Row(s) mezőbe bevisszük a gender, a Column(s) mezőbe pedig a jobcat változókat. Ez a választás tetszőleges, a két változó akár helyet is

97 kutatasmodszertan:ii. KOR :28 Page KERESZTTÁBLA-ELEMZÉS 97 cserélhet a kereszttáblában (matematikailag fogalmazva transzponálhatjuk a mátrixot). Az alapvető (default) beállításokat egészítsük ki a következőkkel: 20. ábra. Kereszttábla: statisztikai beállítások A Statistics ablakban állítsuk be a Chi-square opciót, ami a hipotézisünk ellenőrzésére alkalmas statisztika. 21. ábra. Kereszttábla: a cellák mutatóinak beállítása

98 kutatasmodszertan:ii. KOR :28 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA A Cells ablakban a Percentages mezőben állítsuk be a Row, Column és Total opciókat, ami a sor, oszlop és összes százalékot eredményezi, továbbá a Residuals mezőben az Adj. Standarized opciót is pipáljuk ki. Eredmények értelmezése: lassan belejövünk, hogy az Output-ban a cím után következő első táblázat arról informál, hogy az összes esetből (Total) hány valós érték (Valid) lett bevonva a műveletbe, és hány hiányzó érték (Missing) maradt ki belőle. 22. ábra. Kereszttábla: eredmények A következő táblázat a tényleges kereszttábla, ami a két változó értékeinek együttes megoszlásait tartalmazza: 23. ábra. Kereszttábla: kontingencia táblázat

99 kutatasmodszertan:ii. KOR :28 Page KERESZTTÁBLA-ELEMZÉS 99 A gender változó két értéke (kategóriája) és a jobcat változó három értéke egy hat cellából álló mátrixot eredményez, ami kiegészül egy Total oszloppal és sorral. A cellákban a következő értékeket láthatjuk: Count: abszolút gyakorisági eloszlás, azt mutatja, hogy hány eset tartozik a két kategória közös részhalmazába. Pl. az adattáblánkban 206 clerical (szellemi beosztott) beosztású female (nő) van. % within Gender: sorszázalék, a 100% az adott sorban levő változó kategóriát jelenti, a sor mentén összegezve a sorszázalékokat kapjuk a 100%-ot. Pl. a nők 95,4%-a clerical, 0%-a custodial és 4,6%-a manager beosztásban dolgozik. % within Employment: oszlopszázalék, a 100% az adott oszlopban levő változó kategóriát jelenti. Pl. a clerical 56,7%-a nő és 43,3%-a férfi. Oszlopmentén összegezve az oszlopszázalékokat kapjuk a 100%-ot. % of Total: a 100% a kereszttábla-elemzésbe bevont valamennyi esetet jelenti. Pl. a szervezet dolgozóinak 43,5%-a clerical munkakörben dolgozó female (nő). Adjusted Residual: a későbbiekben tárgyaljuk. Láttuk a két változó kategóriáinak együttes eloszlását, de még nem értük el eredeti célunkat, a két változó függetlenségét feltételező hipotézisünk ellenőrzését. Ehhez a következő táblázat vizsgálatára van szükség. 24. ábra. Kereszttábla: khi-négyzet próba A khi-négyzet teszt Pearson Chi-Square értékének szignifikanciaszintje [az Asymp. Sig. (2-sided) oszlopban] mutatja, hogy a két változó egymástól nem független. Ha a Pearson Chi-Square érték szignifikanciaszintje kisebb mint.05, akkor elutasítjuk a két változó függetlenségére vonatkozó hipotézisünket, azaz a két változó között kapcsolat van. Ez a kapcsolat statisztikailag bizonyított, vagyis szignifikáns. A.05-nél kisebb szignifikanciaszint értelmezhető úgy is, hogy kevesebb mint 5%-os biz-

100 kutatasmodszertan:ii. KOR :28 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA tonsággal fogadhatjuk el a hipotézisünket, állíthatjuk, hogy a két változó független. Ezzel egyenértékűen úgy is fogalmazhatunk, hogy több mint 95%-os biztonsággal jelenthetjük ki a két változó kapcsolatát. Megállapítottuk tehát, hogy a két változó kapcsolatban van, de még nem tudjuk, hogy a kategóriák hat kapcsolódási pontja, a kereszttábla hat cellája közül melyek okozzák ezt a kapcsolatot. Ennek meghatározására szolgál a kereszttábla celláinak utolsó értéke, az adjusztált rezidúm (Adjusted Residual). A nem túl szabadon fordított nevű mutató a következőképp jelzi a két változó kategóriái közötti kapcsolat létét: ha az adjusztált rezidúm abszolút értéke 2-nél nagyobb, akkor a két kategória között szignifikáns kapcsolat van és értelemszerűen ha az adjusztált rezidúm abszolút értéke 2-nél kisebb, akkor a két kategória között nincs szignifikáns kapcsolat. Folytatva példánkat megállapíthatjuk, hogy a két változó kategóriáinak hat kapcsolódási pontja közül valamennyiben szignifikáns a kapcsolat. A beosztások közül a nőkre átlagon felüli arányban jellemző a beosztott szellemi munkás (clerical) és szignifikáns mértékben átlag alatti a beosztott fizikai munkás (custodial) és a vezető szellemi munkás munkakörök (manager). A férfiaknál ellenkezőleg alulreprezentált a szellemi beosztott és felülreprezentált a fizikai munkás és a menedzser kategória. A kapcsolat szorossága Két nominális változó közötti kapcsolat szorosságát a Cramer V asszociációs mérőszám mutatja, amely 0 és 1 közötti értékeket vehet fel. 25. ábra. Kereszttábla: a kapcsolat erősségének mutatói Az asszociációs mérőszám es értéke közepes erősségű kapcsolatot jelez.

101 kutatasmodszertan:ii. KOR :28 Page KERESZTTÁBLA-ELEMZÉS Ordinális változók közötti kereszttábla Az ordinális változók közötti kapcsolatok a nominális változókhoz képest egy további információt hordoznak, a változó értékeinek, kategóriáinak a rangsorát. Nyissuk meg az SPSS bemutató adatfájljai közül az 1991 U.S.General Social Survey.sav fájlt. Ez az egyesült államokbeli szociológiai felmérés bőven tartalmaz ordinális változókat. Az interjúalanyok a társadalmi kapcsolataikat jellemző öt állítást kellett fontossági sorba rendezék, ezek közül hasonlítunk össze kettőt. Az engedelmesség, a társadalmi hierarchia elfogadása és a népszerűség fontosságának megítélése közötti kapcsolatot vizsgáljuk. Hipotézisünk, hogy e két attitűd változó között nincs szignifikáns kapcsolat. A nominális változók vizsgálatához hasonlóan indítjuk a kereszttáblát: Analyze Descriptive Statistics Crosstabs 26. ábra. Kereszttábla: ordinális változók A Cells-ben ezúttal nem lesz szükségünk a sor- és oszlop százalékokra, a tényleges elemszám (Observed) mellett csak az adjusztált rezidúmot (Adj. standardized) állítjuk be. A kereszttábla Statistics ablakában az ordinális változókra vonatkozó mutatókat jelöljük.

102 kutatasmodszertan:ii. KOR :28 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA Eredmények értelmezése: 27. ábra. Kereszttábla: statisztikák 28. ábra. Kereszttábla: kontingenciatábla Nincs könnyű dolgunk a táblázat értelmezésével, ugyanis a kategóriák közötti szignifikáns kapcsolatot jelző adjusztált rezidúmot vizsgálva találunk olyan értéket is, ami a két változó hasonló rangsorát (5. sor 4. oszlop cellája) és olyat is, amely fordított rangsort (1. sor 5. oszlop cellája) mutat. A főátlóban egy kivételével valamennyi cella értéke 0, mivel a vizsgált öt ordinális változót fontossági sorba kellett rendezni, ezért nincs két olyan változó közöttük, amelyek egyszerre ugyanazt az értéket vehetnék fel.

103 kutatasmodszertan:ii. KOR :28 Page KERESZTTÁBLA-ELEMZÉS 103 Mindezek alapján joggal valószínűsítjük, hogy az eddig megismert elemzési eszközökkel nem sokat tudunk mondani e két változó kapcsolatáról. A következő táblázatokban találjuk azokat a mutatókat, amelyek a két ordinális változó rangsorának hasonlóságát mutatják. 29. ábra. Kereszttábla: ordinális változók kapcsolati erősségének mutatói A Sommers`d rangkorrelációs együttható -1 és 1 között vehet fel értékeket, ahol a -1-hez közeli érték szoros, fordított arányú kapcsolatot jelez, az 1-hez közeli szoros egyenes arányú kapcsolatot, a 0-hoz közeli pedig gyenge kapcsolatot. 30. ábra. Kereszttábla: ordinális változók kapcsolati erősségének mutatói A fenti táblázatban a Kendalls tau-b mutató szimmetrikus kereszttáblák esetén értelmezhető, az adott esetben ilyen 5x5-ös táblánk van. A Sommers`d mutatóhoz hasonlóan ez is -1 és 1 értéktartománnyal rendelkezik, az 1-hez közeli érték a két változó hasonló sorrendjét jelzi. A Kendalls tau-c mutató hasonlóképp működik, de nem szimmetrikus kereszttábláknál alkalmazható.

104 kutatasmodszertan:ii. KOR :28 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA Példánk végeredménye tehát egy viszonylag gyenge, de szignifikáns negatív irányú kapcsolat az engedelmesség és a népszerűség fontosságának megítélése között, vagyis akik fontosnak tartják a társadalmi normáknak, hierarchiának való engedelmességet, azok kevésbé tartják fontosnak a népszerűséget és fordítva Egymintás t-próba Az egymintás t-próbával nyitjuk azoknak a módszereknek a sorát, amelyek numerikus változók vizsgálatát teszik lehetővé. Ezt a módszert akkor alkalmazzuk, ha egy mintabeli numerikus változó átlagát akarjuk összehasonlítani egy külső forrásból származó átlaggal, értékkel. Példa: nyissuk meg a cars.sav adatfájlt, amely egy cég autóparkjának autóira vonatkozó adatokat tartalmaz. Az autók ismérvei között van a gyártási év, ami egy numerikus változóban (year) van megjelenítve. Vizsgáljuk meg, hogy mennyi az autók átlagéletkora, pontosabban mennyi az átlagos gyártási év, és hogy ez szignifikánsan különbözik-e az 1980-tól? Analyze Compare Means One-Sample T Test 31. ábra. Egymintás t-próba A bal oldali változó listából kiválasztjuk a year változót és a Test Value mezőbe beírjuk a 80-as értéket Az autók gyártási évét tartalmazó year változó csak a két utolsó számjegyet tartalmazza, ezért írunk 80-at az 1980 helyett. Lényeges, hogy az átlaggal összehasonlítani kívánt érték ugyanolyan mértékegységben és formátumban legyen, mint a vizsgált változó.

105 kutatasmodszertan:ii. KOR :28 Page FÜGGETLEN MINTÁS T-PRÓBA 105 Eredmények értelmezése: az első eredménytábla az elemzésbe bevont változót (YEAR) és főbb statisztikáit mutatja: a változó valós értékeinek gyakoriságát (N), az átlagot, a szórást és a standard hibát. 32. ábra. Egymintás t-próba: a bevont változó A második táblázatban a t-próba eredményeit találjuk. 33. ábra. Egymintás t-próba: a bevont változó alapstatisztikái Kiderült, hogy az átlag (75.75) és a tesztelt érték (80) közötti különbség szignifikánsan különbözik 0-tól, tehát az autóparkunk átlagos gyártási éve korábbi mint Független mintás t-próba A független mintás t-próbával egy nominális vagy ordinális és egy vagy több numerikus változó közötti kapcsolatot vizsgálhatunk. A módszer a teljes mintát (adattáblát) a nominális/ordinális változó kategóriái szerint két, egymástól független részmintára bontja, majd összehasonlítja a vizsgált numerikus változó részmintabeli átlagait. Példa: folytassuk a cars.sav adatainak elemzését. Vizsgáljuk meg azt a hipotézist, hogy a mintánkban található amerikai autók gyorsulása jobb, mint az európai autóké. Az autók származásának ez a két kategóriája (amerikai, európai) egymástól független részmintákra osztja a teljes

106 kutatasmodszertan:ii. KOR :28 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA mintát, és e két részmintában található megfigyelési egységek (autók) egyik ismérvét (gyorsulását) kívánjuk összehasonlítani. Analyze Compare Means Independent-Samples T Test 34. ábra. Független mintás t-próba: változó beállítások A Test Variable(s) 19 mezőbe a numerikus változót visszük be, adott esetben a gyorsulást (accel). A Grouping Variable mezőben pedig a nominális/ordinális változót definiáljuk, példánkban az autók eredetét (origin). E változó neve után megjelenő kérdőjelek, illetve az OK gomb inaktivitása jelzi, hogy még további beállításokra van szükségünk. A Define Groups -ra kattintva beállíthatjuk, hogy a nominális változó melyik két értéke határozza meg a két részmintát. 35. ábra. Független mintás t-próba: változó beállítások 19 A többes szám jelzi, hogy akár több numerikus változó átlagait egyszerre is vizsgálhatjuk.

107 kutatasmodszertan:ii. KOR :28 Page FÜGGETLEN MINTÁS T-PRÓBA 107 Eredmények értelmezése: Az első táblázatban az alapvető statisztikákat találjuk, mindkét származási helyre vonatkozóan: N elemszám, az átlagot, a szórást és az átlag standard hibáját. 36. ábra. Független mintás t-próba: a változók átlaga és szórása Az átlagok alapján megállapíthatjuk, hogy az amerikai autók gyorsulása jobb, kevesebb másodperc alatt érik el a 60 mérföld per órás (kb. 100 km/h) sebességet. Kérdés, hogy az átlagok közötti nem túl nagynak tűnő különbség statisztikailag szignifikáns-e? A második táblázatban erre találunk választ. 37. ábra. Független mintás t-próba: a t-próba eredményei Az első két oszlopban levő Levene s teszt F próbája a varianciák egyezőségére vonatkozik, a táblázat többi részében pedig két sorban találjuk az átlagok egyezőségére vonatkozó t-test eredményeit. A felső sor (Equal variances assumed) a két részminta egyenlő varianciája, az alsó pedig eltérő varianciák esetén érvényes. A Levene s teszt alapján elutasíthatjuk az egyenlő varianciák hipotézisét, ezért a táblázat alsó sorának eredményét (Equal variances not assumed) kell figyelembe vennünk, és ez alapján megállapíthatjuk, hogy a két átlag szignifikánsan különbözik.

108 kutatasmodszertan:ii. KOR :28 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA 8.4. Egyutas varianciaanalízis Két változó közötti hasonlóságot/különbözőséget az átlagaik összehasonlításával is vizsgálhatjuk. Az egyutas varianciaanalízis (One-way ANOVA) 20 egy nominális vagy egy ordinális változó és egy numerikus változó közötti kapcsolatot vizsgálja úgy, hogy összehasonlítja a numerikus változó részátlagát a nominális/ordinális változó valamennyi kategóriája mentén. Gyakorlati eredményeit tekintve annyiban különbözik a független mintás t próbától, hogy nem csak két kategória mentén hasonlítja össze az átlagokat, hanem a nominális változó valamennyi kategóriájára kiszámítja. Az átlagok egyezőségére vonatkozó hipotézis tesztelésére azonban nem a t-próbát, hanem az F-próbát alkalmazza, ami nagy minta esetén robusztus becslést 21 eredményez. Ezeknek az előnyöknek köszönhetően a gyakorló kutatók az átlagok összehasonlítására legtöbbször ANOVA-t használnak, kis (rész)minták esetén folyamodnak a t-próbához. Példa: használjuk továbbra is a cars.sav adattáblánál. Az előzőekben tárgyalt t-próbával megállapítottuk, hogy az amerikai autók gyorsulása jobb, mint az európaiaké, most lehetőségünk van mindhárom helyről (Amerika, Európa, Japán) származó autókat összehasonlítani. Analyze Compare Means One-way ANOVA 38. ábra. Egyutas varianciaanalízis: változó beállítások 20 A magyar nyelvű szakirodalomban az egyszempontú, az egytényezős varianciaanalízis, illetve egyszerűen csak ANOVA elnevezésekkel is találkozhatunk. 21 Robusztus becslés esetén a próba korlátozó feltételeinek részleges nem teljesülése nem rontja lényegesen az eredményt.

109 kutatasmodszertan:ii. KOR :28 Page EGYUTAS VARIANCIAANALÍZIS 109 A Factor mezőbe tesszük a nominális vagy ordinális változót, a Dependent List-be pedig a numerikus változókat. Ha egyszerre több numerikus változó átlagára vagyunk kíváncsiak, akkor többet is bejelölhetünk, az eredményeket egymás után jeleníti meg az SPSS Output. 39. ábra. Egyutas varianciaanalízis: változó beállítások Az Options-ban kell beállítanunk a Descriptives funkciót, különben az átlagok nem jelennek meg, csak az F-próba és annak szignifikanciaszintje, majd Continue és OK. Eredmények értelmezése: A Descriptives táblázatban találjuk a numerikus változó különböző statisztikáit, a nominális változó valamennyi kategóriája kiszámolva. 40. ábra. Egyutas varianciaanalízis: a numerikus változó csoportonkénti statisztikái

110 kutatasmodszertan:ii. KOR :29 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA A táblázat első oszlopában láthatjuk a nominális változó (origin) három kategóriájának a kódjait és a címkéit, a második oszlopban (N) pedig a három kategóriába tartozó esetek számát. A Means oszlopban találjuk a származási hely szerinti részátlagokat, illetve valamennyi autó gyorsulásának átlagát (Total). Megállapíthatjuk, hogy az amerikai autók érik el a leghamarabb (14,93 sec) a 60 mérföld/órás sebességet, a japán autók a másodikak (16,17 sec) és az európai autók gyorsulási átlagideje a legnagyobb (16,82). A teljes minta átlaga (15,51) a fenti három részátlag súlyozott átlaga. Jogos a kérdés, hogy a három részátlag közötti kinek kicsi, kinek nagy különbségek szignifkánsak-e? Erre válaszol az Output következő, ANOVA feliratú táblázata: 41. ábra. Egyutas varianciaanalízis: szignifikanciaszint Az F-próba értéke szignifikanciaszintjének vizsgálatakor ugyanaz az aranyszabály érvényesül, mint például a kereszttábla-elemzés Chi-négyzet próbájánál; a 0,05-nél kisebb érték esetén megállapíthatjuk, hogy szignifikáns különbség van a kategóriák részátlagai között. Példánkban ez azt jelenti, hogy kapcsolat van az autók származási helye és gyorsulása között. De értelmezzük a Descriptives táblázat valamennyi eredményét: N abszolút gyakoriság, azt mutatja, hogy az adott kategória hány értékéből számoltuk a részátlagot; Mean átlag; Std. Deviation szórás; Std. Error standard hiba. Önmagában nem kell vizsgálnunk, a konfidencia-intervallum meghatározásához szükséges; 95% Confidence Interval for Mean (95%-os konfidencia-intervallum) az átlag körüli intervallum, egyenlő az átlag ±2 standard hiba (S.E.). Ha a részátlagok szignifikánsan különböznek, akkor a konfidenciaintervallumok között nincs átfedés, különben igen;

111 kutatasmodszertan:ii. KOR :29 Page EGYUTAS VARIANCIAANALÍZIS 111 Minimum és Maximum a numerikus változó minimumát és maximumát mutatja az adott kategóriára. Hasznos ezek vizsgálata, mivel így azonnal kiderül, hogy ha valamilyen szélsőséges érték is bekerült az átlagba. Például ha a válaszolni nem tudók (NT/NV) 99-es kódját nem zártuk ki ( nem tettük missing-re ), akkor jelentősen torzíthatjuk az átlagot. Megállapítottuk tehát az F-próba segítségével, hogy az átlagok között van olyan, ami eltér a többitől, és hogy az amerikai autók jobb gyorsulására vonatkozó kutatási hipotézisünk megint csak igazolódott. Kérdés azonban, hogy van-e különbség az európai és a japán autók átlagai között? Az ANOVA tábla szignifikanciaszintje csak azt mutatja, hogy az átlagok között van szignifikáns eltérés, de nem pontosítja, hogy mely kategória átlagai között. A következő paranccsal ezt megtehetjük: ha az ANOVA ablakban a Post Hoc fülre kattintunk, akkor a lehetőségek zavarba ejtő bőségével találjuk szembe magunkat. 42. ábra. Egyutas varianciaanalízis: csoportátlagok összehasonlítása Válasszuk az első, nem túl biztató nevű LSD opciót, ami az ablakban felsorolt tesztek közül a legengedékenyebb, olyan mértékű különbséget is szignifikánsnak tart, amit a többi próba még nem. Használata akkor ajánlott, ha a nominális változónak három kategóriája van. A Tukey-próbát háromnál több kategória esetén használjuk, ezúttal a gyakorlás kedvéért ezt is bejelöljük. Continue, és ha a korábbi beállításaink még megvannak, akkor jöhet az OK.

112 kutatasmodszertan:ii. KOR :29 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA Eredmények értelmezése: 43. ábra. Egyutas varianciaanalízis: csoportátlagok összehasonlítása A Multiple Comparisons nevű táblában a kategóriák részátlagai közötti különbségeket és azok szignifikanciaszintjeit (Sig.) találjuk külön a Tukey és külön az LSD próba alapján. Mindkettő ugyanazt az eredményt hozza, megállapíthatjuk, hogy az amerikai autók átlagos gyorsulása szignifikáns mértékben különbözik az európai és a japán autókétól, de e két utóbbi közt nincs szignifikáns különbség. A varianciaanalízis korlátozó feltételei A varianciaanalízis alkalmazásának van két fontos korlátozó feltétele: 1. A vizsgált numerikus változónak normális eloszlásúnak kell lennie. A szakirodalom (Sajtos Mitev 2007) szerint nem történik nagy probléma, ha a gyakorlatban ettől a matematikai-statisztikai feltételezés ellenőrzésétől eltekintünk. Ennek ellenőrzésére különben az SPSS rendelkezik megfelelő módszerrel. Az egymintás Kolmogorov-Smirnov teszt két eloszlás hasonlóságát, konkrétan a közöttük levő távolságot vizsgálja. Alkalmas arra, hogy a tényleges, numerikus változó eloszlását egy elvárt, normál eloszláshoz viszonyítsa. 2. A másik korlátozó feltétel az, hogy a nominális változó kategóriái által képzett csoportok szórásának is megközelítőleg azonosnak kell lenniük. Ennek ellenőrzésére a független mintás t-próba bemutatásánál

113 kutatasmodszertan:ii. KOR :29 Page EGYUTAS VARIANCIAANALÍZIS 113 már említett Levene-teszt áll rendelkezésünkre, amelynek nullhipotézise az, hogy a két szórás azonos. Futtassuk még egyszer a varianciaanalízist a gyorsulás (accel) és a származási hely (origin) változókkal. Analyze Compare Means One-way ANOVA Az eddig tanult beállításokon túl az Options-ban jelöljük be a Homogeneity of variance test opciót. 44. ábra. Egyutas varianciaanalízis: feltételek ellenőrzése Eredmények értelmezése: 45. ábra. Egyutas varianciaanalízis: varianciák homogenitásának ellenőrzése A szignifikanciaszint (Sig.) alapján elmondható, hogy mindössze 0,2% annak valószínűsége, hogy a három csoport varianciája azonos, tehát ez a feltétel nem teljesül. Az eddigi tesztek (t-próba, F-próba) során a változók értékei közötti különbségeket kerestük, az egyenlőségre vonat-

114 kutatasmodszertan:ii. KOR :29 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA kozó nullhipotézis elutasításához a nullához közeli szignifikanciaérték volt a jó. Ezúttal nagy, egyhez közeli értékre lett volna szükség, hogy kijelenthessük a csoportok szórásának azonosságát. Ilyen esetben, mikor nem teljesül a varianciaanalízisnek e feltétele, vissza kell térnünk a független mintás t-próbához és páronként ellenőrizni a csoport átlagok közötti különbségeket. Perspektívaként megemlíthetjük a kétutas varianciaanalízist, amelyben egy újabb nominális változót vonunk be a modellbe. A varianciaanalízis alkalmazásának kiterjesztésében érdekelt olvasó a Székelyi Barna (2002) könyvben találhatja meg a módszer alapos leírását Korrelációanalízis Két numerikus változó közötti kapcsolatot és annak szorosságát határozza meg a korrelációanalízis. A kapcsolat szorosságát kifejező Pearson-féle korrelációs együttható abszolút értéke 0 és 1 közötti értéket vehet fel, ahol a 0 érték a kapcsolat teljes hiányát jelzi, az 1-es pedig a két változó függvényszerű kapcsolatát jelenti. A kapcsolat szorossága mellett információt kapunk a kapcsolat irányáról is. Ha a korrelációs együttható előjele pozitív, akkor a két változó közötti kapcsolat egyenes arányú, negatív előjel esetén pedig fordított arányról beszélünk. Példa: Nyissuk meg újra az SPSS bemutató adattáblái közül a cars.sav adatfájlt. Teszteljük azt a nagyon valószerű hipotézist, hogy az autók teljesítménye és fogyasztása között egyenes arányú kapcsolat van. Az adattáblában a horse (lóerő) változó tartalmazza az autók teljesítményére vonatkozó információt, az mpg pedig a fogyasztásét, konkrétan azt mutatja, hogy hány mérföldet lehet megtenni egy gallon (kb. 4 liter) benzinnel. (Az amerikai autók amerikai mértékegység szerint fogyasztanak, tehát a nagyobb érték kisebb fogyasztást jelent). Analyze Correlate Bivariate

115 kutatasmodszertan:ii. KOR :29 Page KORRELÁCIÓANALÍZIS ábra. Korrelációanalízis: változók bevitele A Bivariate Correlations ablakban válasszuk ki a változó listából a horse és az mpg változókat, majd OK. Eredmények értelmezése: 47. ábra. Korrelációanalízis: korrelációs együttható Az eredmény egy szimmetrikus mátrix, amelynek főátlójában egy változó önmagával vett korrelációja látható, ezért az együttható értéke 1. A mátrix cellái három értéket tartalmaznak: az első a korrelációs együttható (Pearson Correlation), a második a szignifikanciaszint [Sig.(2-tai-

116 kutatasmodszertan:ii. KOR :29 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA led)], a harmadik a korrelációanalízisbe bevont esetek száma (N). A szignifikanciaszint.05 alatti értéke alapján szignifikáns a kapcsolat a két változó között. A korrelációs együttható negatív előjele azt jelzi, hogy ha nő az autók teljesítménye (lóerő), akkor csökken az egy gallon benzinnel megtehető mérföldek száma (magyarán nő a fogyasztás), a 0,771-es érték pedig szoros kapcsolatot mutat. A korrelációanalízisbe kettőnél több numerikus változó is bevonható, de természetesen a változók közötti kapcsolatok páronként lesznek vizsgálva. Nézzük meg, hogy az adattáblában található, autókra vonatkozó többi numerikus változó hogyan viszonyul egymáshoz. Vonjuk be tehát az elemzésbe az előző két változó mellé az ENGINE (motor űrtartalom, köb hüvelykben), WEIGHT (súly, fontban), ACCEL (gyorsulás, hány másodperc alatt éri el a 60 mérföld per órát), és a YEAR (gyártási év) változókat. Adjuk ki a következő parancsot: Analyze Correlate Bivariate 48. ábra. Korrelációanalízis: újabb változók bevitele

117 kutatasmodszertan:ii. KOR :29 Page PARCIÁLIS KORRELÁCIÓANALÍZIS 117 Eredmények értelmezése: 49. ábra. Korrelációanalízis: korrelációs együtthatók Az eredménytábla a bőség zavarával lep meg, valamennyi változó páronként szignifikáns korrelációs kapcsolatban van a másikkal. Legnagyobb korrelációs együtthatót (.933) az autó súlya és a motor hengerűrtartalma között találjuk, és erős, negatív korrelációs kapcsolat (-.807) van az autó súlya és az egy gallon benzinnel megtehető mérföldek száma (fogyasztás) között Parciális korrelációanalízis Alaposan végiggondolva az előző korrelációs táblázat valamennyi eredményét, elbizonytalaníthat néhány dolog. Például a motor hengerűrtartalma (ENGINE) és a gyorsulás (ACCEL) változók közötti korrelációs együttható (-.545) azt mutatja, hogy nagyobb motortérfogat kevesebb idő alatti, azaz jobb gyorsulást jelent. Különösebb műszaki képzettség nélkül is sejtjük, hogy ez azért van, mert a nagyobb motor nagyobb teljesítményt, több lóerőt jelent. Ezt az összefüggést meg is találjuk a gyorsulás (ACCEL) és a lóerő (HORSE) ismérvek közötti korrelációs kapcsolatban (-.701). Kérdés, hogy az előbbi összefüggés csak a gyorsulás és a lóerő közötti összefüggésnek köszönhető-e, vagy azonos teljesítmény (lóerő) mellett is a nagyobb motor-

118 kutatasmodszertan:ii. KOR :29 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA térfogat jobb gyorsulást eredményez? Úgy kellene vizsgálnunk ezt az összefüggést, hogy közben kontroll alatt tartjuk a teljesítmény indirekt hatását. A parciális korrelációanalízis úgy vizsgálja két numerikus változó közötti összefüggést, hogy kontrollálja, kiküszöböli más változók hatását. Analyze Correlate Partial 50. ábra. Parciális korrelációanalízis: változók bevitele A Variables mezőbe bevisszük azt a két változót, amelyek közötti korrelációs kapcsolatot kívánjuk vizsgálni, a Controlling for mezőbe pedig azt a változó(ka)t, amelynek a hatását kontroll alatt akarjuk tartani. Eredmények értelmezése: a parciális korrelációs analízis outputja csak annyiban módosul a kétváltozós korrelációs mátrixhoz képest, hogy fel van tüntetve a kontroll változó (horse), és a cellákban a harmadik érték nem az elemszám (N), hanem a szabadságfok (df). 51. ábra. Parciális korrelációanalízis: parciális korrelációs együttható

119 kutatasmodszertan:ii. KOR :29 Page LINEÁRIS REGRESSZIÓANALÍZIS 119 A teljesítmény indirekt hatását kiküszöbölve is, a motor hengerűrtartalma és a gyorsulás között szignifikáns, de pozitív korrelációs együtthatót (0,269) találunk. Ebből azt a némileg meglepő következtetést vonhatjuk le, hogy azonos lóerejű teljesítmény mellett a nagyobb motor térfogat hosszabb gyorsulási időt, azaz rosszabb gyorsulást jelent! Kontroll alatt tartva a teljesítmény hatását, a kétváltozós korrelációanalízis negatív korrelációs együtthatójával szemben (-0,545) most teljesen eltérő eredményt (0,269) kaptunk. A parciális korrelációanalízissel az indirekt hatásoktól megtisztítva kapjuk meg a tényleges összefüggést két változó között. Egymással összefüggő változócsoportok elemzésekor az egyszerű Pearson-féle korrelációanalízis alkalmazása tapasztalatom szerint gyakran vezet téves eredményekhez, eltúlzott vagy alulbecsült összefüggésekhez. A többváltozós, egymással összefüggő és egymást meghatározó viszonyok elemzésére a regresszióanalízis az igazán alkalmas módszer Lineáris regresszióanalízis Kétváltozós regresszióanalízis A lineáris regresszióanalízis is úgy vizsgálja a numerikus változók közötti kapcsolatot, hogy a különböző indirekt hatásokat kontroll alatt tartja, de ebben az esetben a kapcsolat nem szimmetrikus, hanem az egy vagy több független változó hatását vizsgáljuk egy függő változóra. 22 A lineáris regresszióanalízis lineáris kapcsolattal számol a függő és a független változó között, ami a következő egyszerű egyenlettel fejezhető ki: ahol y függő változó, x független változó, b 1 a független változó együtthatója, b 0 konstans. Ez a lineáris függvény akkor van meghatározva, ha ismerjük az együtthatók (paraméterek) értékeit, ekkor a függvény grafikonja is felrajzolható. A cél tehát a paraméterek becslése, erre a lineáris regresszióanalízis a legkisebb négyzetek módszerét alkalmazza. Ez a módszer úgy keresi a legjobban illeszkedő lineáris függvényt, 22 Egyenértékű szinonimaként használjuk a magyarázó, illetve a magyarázott változó kifejezéseket is.,

120 kutatasmodszertan:ii. KOR :29 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA hogy a tényleges megfigyeléseket jelentő pontok és az egyenes közötti távolságok négyzetösszege minimális legyen, magyarán mindegyik értékhez a lehető legközelebb legyen. 52. ábra. A tényleges értékek és az illesztett regressziós egyenes Példa: Nézzük a gyakorlati példát! Nyissuk meg újra a cars.sav adatfájlt és vizsgáljuk ezúttal, hogy milyen tényezők határozzák meg az autók fogyasztását. Analyze Regression Linear Modellünk függő változója a fogyasztás, vigyük be tehát az mpg nevű változót a Dependent mezőbe, magyarázó változónak (Independent(s)) pedig a teljesítményt (horse). A továbbiakban több lényeges beállítással is megismerkedünk, de most megkönnyebbülve vesszük észre, hogy az OK gomb aktív, ezért gyorsan rá is kattintunk.

121 kutatasmodszertan:ii. KOR :29 Page LINEÁRIS REGRESSZIÓANALÍZIS ábra. Lineáris regresszióanalízis: változók bevitele Eredmények értelmezése: az első táblázat azt mutatja, hogy mely változók lettek beépítve a modellbe. 54. ábra. Lineáris regresszióanalízis: eredmények A következő táblázat fontos mutatója az R négyzet (R Square) determinációs együttható.

122 kutatasmodszertan:ii. KOR :29 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA 55. ábra. Lineáris regresszióanalízis: R négyzet determinációs együttható Az R négyzet determinációs együttható azt mutatja, hogy a független változók milyen arányban magyarázzák a függő változót (pontosabban a függő változó varianciáját). Ez a 0 és 1 közötti értékeket felvevő mutató tehát a modell jóságát, magyarázó erejét jelzi. Példánkban a.595-ös érték szerint elég nagy mértékben sikerült megmagyaráznunk a függő változót, egy kis szándékos egyszerűsítéssel úgy is fogalmazhatunk, hogy az autók teljesítménye (lóerő) majd 60%-ban megmagyarázza a fogyasztást. 56. ábra. Lineáris regresszióanalízis: szignifikanciaszint Az F-próba ANOVA feliratú táblázata a regressziós modell szignifikanciáját mutatja, a regressziós eredmények értelmezését ajánlott ezzel kezdeni, mivel ha a modell nem szignifikáns, akkor felesleges a további vizsgálódás. Szignifikáns modell esetén azonban vigyázó szemeinket vessük a független változó együtthatójának (paraméterének) statisztikáit tartalmazó Coefficients nevű táblára.

123 kutatasmodszertan:ii. KOR :29 Page LINEÁRIS REGRESSZIÓANALÍZIS ábra. Lineáris regresszióanalízis: a független változók paraméterei Az utolsó oszlopban (Sig.) a lineáris regressziós egyenlet konstans tagjának és a független változó (HORSE) becsült paraméterének a szignifikanciaszintjeit találjuk, amelyekre ugyanaz a már jól ismert küszöbérték (<.05) érvényes. A táblázat első oszlopában pedig a konstans és a független változó paraméterének értékeit találjuk (Unstandardized Coefficients, B). Ezek alapján felírhatjuk a regressziós egyenletet: Y = 39,855 0,157 X, ahol Y a fogyasztás és X a teljesítmény. A lineáris egyenlet szerint, ha egy egységgel nő az X, vagyis ha egy lóerővel nagyobb az autó teljesítménye, akkor 0,157 mérfölddel kevesebbet lehet menni egy gallon benzinnel, azaz nő a fogyasztás Többváltozós regresszióanalízis A multidimenzionálisnak is nevezett regresszióanalízis során több magyarázó változót bevonunk az elemzésbe, de a modell a korrelációanalízistől eltérően nem páronként vizsgálja a változók közötti kapcsolatokat, hanem egyidejűleg valamennyi magyarázó változó a függő változóra gyakorolt hatását elemzi, úgy, hogy kontroll alatt tartja a magyarázó változók közötti hatásokat. Nagy jelentősége van kvantitatív kutatások során a multidimenzionális elemzéseknek, mivel ha nem tartjuk kontroll alatt a különböző indirekt hatásokat, könnyen félrevezető eredményekhez jutunk.

124 kutatasmodszertan:ii. KOR :29 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA Példa: a következőkben bővítsük az előző regressziós modellünket további numerikus változók bevonásával. A cars.sav adatfájl valamenynyi, összesen öt numerikus változója lesz a fogyasztás (MPG) magyarázó változója: gyártási év (YEAR), súly (WEIGHT), gyorsulás (ACCEL), teljesítmény (HORSE), motor hengerűrtartalom (ENGINE). Analyze Regression Linear 58. ábra. Többváltozós lineáris regresszióanalízis: szignifikanciaszint A többváltozós regresszióanalízis beállításait ugyanott pontosíthatjuk, mint a kétváltozós esetben, csak most több változót vonunk be az Independent(s) mezőbe. Eredmények értelmezése: az első táblázatot most nem tüntettük fel, a második táblázat már lényeges információt közöl.

125 kutatasmodszertan:ii. KOR :29 Page LINEÁRIS REGRESSZIÓANALÍZIS ábra. Többváltozós lineáris regresszióanalízis: szignifikanciaszint A determinációs együttható (R Square).794 értéke szerint nagymértékben, majdnem 80%-ban sikerült megmagyaráznunk, hogy milyen tényezők és milyen mértékben befolyásolják az autók fogyasztását. Ilyen magyarázó erő mellett meglepődnénk, ha a modellünk nem lenne szignifikáns, az alábbi táblázat szerint nem is ér ilyen meglepetés: 60. ábra. Többváltozós lineáris regresszióanalízis: szignifikanciaszint A regresszióanalízis legtöbb információját a következő, a regressziós egyenlet becsült paramétereire vonatkozó táblázat tartalmazza.

126 kutatasmodszertan:ii. KOR :29 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA 61. ábra. Többváltozós lineáris regresszióanalízis: a független változók paraméterei A becsült paraméterek szignifikanciaszintjei alapján megállapíthatjuk, hogy az autók fogyasztását szignifikáns mértékben csak a súly (WEIGHT) és a gyártási év befolyásolja (YEAR). Ez meglepő eredmény és nagy az információtartalma. Ha a gyártási év hatását akarjuk értelmezni, megállapíthatjuk, hogy azonos hengerűrtartalmú, teljesítményű, gyorsulású és súlyú, de újabb gyártású autók kevesebbet fogyasztanak, mint a régebbiek. A súly változó együtthatójának negatív az előjele, tehát a többi magyarázó változó rögzített értéke mellett a nagyobb súly kevesebb megtett mérföldet, vagyis nagyobb fogyasztást jelent. A táblázat első oszlopa (Unstandardized scoefficients, B) tartalmazza a lineáris regressziós egyenletet meghatározó paramétereket. Ezek közül csak a szignifikáns független változók együtthatóit kell vizsgálnunk. A gyártási év.54-es együtthatója szerint az egy évvel újabb autóknál 0,54-gyel nő a megtett mérföldek száma, a súly változó együtthatója szerint pedig, ha egy fonttal nő az autó súlya, akkor 0,0066 mérfölddel csökken az egy gallon benzinnel megtehető út. Az indirekt hatások kontroll alatt tartása mellett a többváltozós regressziós modell további előnyös tulajdonsága, hogy a becsült paraméterek nagysága alapján sorba rendezhetjük a vizsgált, függő változóra szignifikáns hatást gyakoroló tényezőket. Kérdés tehát, hogy az autó

127 kutatasmodszertan:ii. KOR :29 Page LINEÁRIS REGRESSZIÓANALÍZIS 127 kora (gyártási éve) vagy a súlya befolyásolja-e nagyobb mértékben a fogyasztást? Sejtésünk, hogy az eddig megismert B standardizálatlan együttható nem alkalmas erre az összehasonlításra, mivel ez a független változók eredeti mértékegységét tartalmazza. Nem hasonlítható össze a gyártási évszám változó egy évének hatása az egy font súlykülönbség hatásával. Szükség lenne egy közös mértékegységre, vagyis inkább egy, a mértékegységtől független együtthatóra. Erre alkalmas a statisztikában standardizálásnak nevezett módszer, ami az eredeti értékeket egy -1 és 1 közötti skálára transzformálja úgy, hogy az átlag 0 lesz. Az együtthatókat tartalmazó Coefficients táblázat Beta oszlopában (Standardized Coefficients) található béta értékek ilyen standardizált, mértékegységtől független együtthatók a szignifikáns magyarázó változók hatásának az összehasonlítására alkalmasak. Ezek alapján megállapíthatjuk, hogy az autó súlya nagyobb mértékben meghatározza a fogyasztást, mint a gyártási év, természetesen a többi, kontroll változó azonos szintje mellett. A lineáris regresszióanalízis alkalmazhatóságának feltételei Idáig viszonylag könnyen elsajátíthattuk ennek a nagyon hatásos adatelemzési módszernek az alkalmazását. Azonban a lineáris regressziós modellnek van néhány statisztikai feltétele, amelyek, ha nem teljesülnek, torzított becsléshez, következésképp téves kutatási eredményekhez jutunk. 1. Multikollinearitás. A multikollinearitás a többváltozós regressziómodellben a független változók közötti erős korrelációs kapcsolatot jelenti. Említettük, hogy a regresszióanalízis fontos tulajdonsága, hogy úgy vizsgálja a függő és a független változók közötti kapcsolatot, hogy kiszűri, kontroll alatt tartja a többi, modellbe bevont független változó hatását. Ez azonban nem teljes mértékben sikerül, ha a független változók között determinisztikus (függvényszerű), vagy nagyon erős sztochasztikus kapcsolat van. Függvényszerű kapcsolat esetén tökéletes multikollinearitásról beszélünk, és ilyen esetben az SPSS (és statisztikai programok) regressziómodellje automatikusan kizár egy vagy több változót a független változók közül és hibajelzéssel figyelmeztetnek. Erős sztochasztikus kapcsolat esetén a kutatóra hárul a probléma súlyosságának és kezelésének a mérlegelése, mivel nincs általánosan elfogadott szabály, illetve eljárás a multikollinearitás tesztelésére. Egy többé-kevésbé elfogadott hüvelykujjszabály szerint részleges multikollinearitásról beszélhetünk, ha két független változó közötti korrelációs együttható meghaladja a 0,7-es értéket.

128 kutatasmodszertan:ii. KOR :29 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA Az ilyen részleges multikollinearitás figyelmen kívül hagyása az alábbi következményekkel járhat (Ramanathan 2003): csökkenti a független változók becsült paramétereinek a t-értékét, így az együtthatók kevésbé szignifikánsan lesznek, vagy a ténylegesen szignifikáns független változót nem annak tünteti fel, de nem ront a modell előrejelző képességén, esetenként még javíthatja is. A multikollinearitás teszteléséhez tehát korrelációanalízissel vizsgálnunk kell a modellbe bevont független változók páronkénti korrelációit. Ha megállapítottuk a multikollinearitást vagyis ha a korrelációs együttható meghaladja a 0,7-es értéket, akkor a következő megoldási lehetőségeink vannak: Kihagyjuk a modellből az erős korrelációs kapcsolatban levő változókat. Ha csak két változó között van szoros korrelációs kapcsolat, akkor természetesen elég az egyik változót kihagynunk. Ez az egyszerű, de drasztikus megoldás akkor elfogadható, ha a kihagyott független változó nincs nagy hatással a függő változóra, vagyis a modell R négyzete csak kis mértékben csökken. ha több fontos független változó között van szoros korrelációs kapcsolat, akkor gyakran alkalmazott megoldás az ún. főkomponens-analízis. Ezzel a módszerrel a független változókból kevesebb számú, egymással nem korreláló új változót képezünk, majd ezeket építjük be a regressziós modellbe független változóként. Ennek részletes ismertetése nem célja könyvünknek. 2. Elsőrendű autokorreláció. A lineáris regressziómodell következő feltétele, hogy az adatok nem autokorrelálnak, vagyis hogy a különböző megfigyelésekhez tartozó rezidúmok között nincs függvényszerű kapcsolat. Elsőrendű autokorreláció fennállása esetén egy rezidúm függvényszerű kapcsolatban van a megelőző időponthoz tartozó rezidúmmal. Mint a definícióból is kiderül, az autokorreláció az idősoros adatokon futtatott lineáris regresszióanalízis feltétele, keresztmetszeti adatoknál ez nem okoz problémát! Idősoros adatoknál egy viszonylag egzakt próbával állapíthatjuk meg az autokorreláció létét vagy hiányát: a Durbin Watson-próbával. 23 A Durbin Watson-tesztstatisztika 0 és 4 között vehet fel értékeket, ha 1,8 és 2,2 közötti intervallumba esik, akkor az autokorreláció nem jelent problémát a modellünk számára. 23 A Durbin Watson-próba alkalmazási korlátainak és további részletek megismerése céljából ajánljuk a szakirodalomban feltüntetett Ramanathan könyvet.

129 kutatasmodszertan:ii. KOR :29 Page LINEÁRIS REGRESSZIÓANALÍZIS 129 Erre a tesztre csak idősoros adatoknál van szükség, keresztmetszeti adatoknál nincs ilyen problémánk. Erről akár meggyőződhetünk úgy is, hogyha véletlenszerűen sorba rendezzük az adattáblát és lefuttatjuk az előbbi példa regresszióanalízisét. A Durbin Watson-tesztstatisztika értéke 2-höz nagyon közeli értéket fog mutatni. 3. Homoszkedaszticitás. Ez a feltétel is a rezidúmokra vonatkozik, a hibatagok egyenlő szórását feltételezi. Magyarán úgy fogalmazhatjuk meg, hogy a regressziós modell egyformán jól magyaráz a függő változó valamennyi értéke esetén. Az előbbi példára vetítve azt mondhatjuk, hogy a lineáris regressziós modellünk azonosan magyarázza a kisebb, illetve a nagyobb fogyasztású autók fogyasztását. A feltétel nem teljesülése esetén heteroszkedaszticitásról beszélünk, és ez a regressziós együtthatók rossz becslését eredményezi. A homoszkedaszticitás feltételének elégséges ellenőrzése a rezidúmok normális eloszlásának az ellenőrzése: állítsuk be a regresszióanalízis Plots ablakában a Histogram és a Normal probability plot opciókat. 62. ábra. Lineáris regresszióanalízis: a rezidúmok grafikai vizsgálata Az eredmény egy hisztogram, ami a rezidúmok eloszlását mutatja, továbbá az ábrán fel van tüntetve folytonos vonalként a normás eloszlás függvénye.

130 kutatasmodszertan:ii. KOR :29 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA 63. ábra. Lineáris regresszióanalízis: a rezidúmok eloszlását mutató hisztogram A grafikon alapján a rezidúmok eloszlása nagyon közel van a normál eloszláshoz, és ezt igazolja az ábra jobb oldalán levő statisztika is, miszerint a szórás (Std.Dev.) megközelítőleg egyenlő eggyel és az átlag (Mean) nullával Függvényillesztés Az SPSS függvényillesztés módszerével a kutatásból származó megfigyelési adatainkra függvényt illeszthetünk. Ez az eljárás nagymértékben hasonlít a regresszióanalízisnél alkalmazott legkisebb négyzetek módszeréhez, az adatok és az illesztett függvény közötti távolság négyzetösszegét minimalizálja. A lineáris függvény esetében gyakorlatilag ugyanazt az eredményt kapjuk, de lehetőségünk van több nemlineáris függvényt is kipróbálni: másod-, harmadfokú polinomiálist, hatványkitevős, exponenciális, logisztikus stb. függvényeket. A függvényillesztésnek sokféle közgazdasági alkalmazása van: keresleti vagy termelési görbék illesztése, és ezáltal az optimális ár vagy termelési mennyiség meghatározása különböző előrejelzésekre stb. Példa: egy piackutatás során egy termékünk iránt a következő keresletet tapasztaljuk. Az alábbi táblázatban feltüntettük, hogy adott áron a

131 kutatasmodszertan:ii. KOR :29 Page FÜGGVÉNYILLESZTÉS 131 kérdezettek hány százaléka vásárolja meg a terméket. Szokatlannak tűnhet, hogy a keresletet a potenciális kereslet arányában fejezzük ki, de ezt könnyen átalakíthatjuk abszolút számokká. Ár (RON) 1 2 2,5 3 3, ,5 6 6, ,7 Mennyiség (%) Határozzuk meg az adatainkra legjobban illeszkedő keresleti görbét! Az elemzésünket kezdjük az adattábla létrehozásával, az árakat és a hozzájuk tartozó keresletet két változóba rögzítjük: 64. ábra. Függvényillesztés: adattábla Az adattábla létrehozása után kezdhetjük a függvényillesztést. Analyze Regression Curve estimation A két változónk közül értelemszerűen a termékből eladott mennyiség az ár függvénye, ezért a mennyiseg változó kerül a Dependent(s), az ar pedig az Independent mezőbe.

132 kutatasmodszertan:ii. KOR :29 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA 65. ábra. Függvényillesztés: változók bevitele és a függvénytípusok kiválasztása A függvényillesztés során 11 különféle függvénytípus közül választhatjuk ki az adatainkra legjobban illeszkedő függvényt. Egyelőre válaszszuk ki az első ötöt, mivel valamennyi egyszerre áttekinthetetlenné tenné a grafikont. A kiválasztott függvények a következő általános alakkal rendelkeznek: Lineáris (Linear) Másodfokú polinomiális (Quadratic) Exponenciális (Compound) Növekedési (Growth, az exponenciális egy típusa) Logaritmikus (Logarithmic) Eredmények értelmezése: Az adatsorunk és az öt típusú függvény grafikus ábrázolását az alábbi diagramon láthatjuk:

133 kutatasmodszertan:ii. KOR :29 Page FÜGGVÉNYILLESZTÉS ábra. Függvényillesztés: az első öt függvénytípus Karikával van jelölve az adatsorunk (Observed), és különböző módon az öt illesztett függvény. Ennek ellenére az ábra első ránézésre meglehetősen áttekinthetetlen, ezért nem ajánlott egyszerre két-három függvénytípusnál többet kipróbálni. Azonban a grafikus ábrázolás mellett egzakt mutató alapján határozhatjuk meg, melyik a legjobban illeszkedő függvénytípus. A következő táblázatban az R-négyzet (R Square) a modell illeszkedésének jóságát mutatja 0 és 1 közötti értéktartománnyal, emellett az F-próba értékét és szignifikanciaszintjét, illetve a becsült paramétereket (Parameter Estimates) találjuk. 67. ábra. Függvényillesztés: a függvénytípusok illeszkedésének jósága

134 kutatasmodszertan:ii. KOR :29 Page VÁLTOZÓK KÖZÖTTI KAPCSOLATOK VIZSGÁLATA Az R-négyzetek vizsgálata alapján megállapíthatjuk, hogy valamennyi függvénytípus nagyon jól illeszkedik 0,90 feletti mutatóval, de a legjobb értéke a másodfokú polinomiális (Quadratic) függvénynek van (.977). Nézzük a következő általános formájú függvénytípusok illeszkedését: Harmadfokú polinomiális (Cubic) S függvény (S, az exponenciális egy típusa) Exponenciális (Exponential) Inverz (Inverse) Hatványkitevős (Power) 68. ábra. Függvényillesztés: a második öt függvénytípus A grafikon alapján is láthatjuk, hogy a harmadfokú polinomiális és az exponenciális függvények illeszkednek a legjobban. Ezt igazolja a következő táblázatban feltüntetett R 2 is: 69. ábra. Függvényillesztés: a függvénytípusok illeszkedésének jósága

135 kutatasmodszertan:ii. KOR :29 Page FÜGGVÉNYILLESZTÉS 135 A harmadfokú polinomiális függvény eredményezi a legjobb illeszkedést, a keresleti görbe tehát a következő formában írható fel. Y = 0,000069X 3 0,009X2 0,116X + 61,2 A keresleti függvény a termékre vonatkozó legfontosabb információ, mely meghatározza az árat.

137 kutatasmodszertan:ii. KOR :29 Page FEJEZET AZ EREDMÉNYEK PREZENTÁLÁSA, A TANUL- MÁNY MEGÍRÁSA 1. A kutatási téma meghatározása 2. Előzetes tájékozódás 3. A kutatási célok és hipotézisek megfogalmazása 4. A kutatási terv elkészítése 5. Adatgyűjtés, terepmunka 6. Adatelemzés 7. Az eredmények prezentálása, a tanulmány megírása A kutatási folyamat legutolsó szakasza az eredmények bemutatása, prezentálása. Ennek az időben legutolsó szakasznak is nagy a jelentősége, hisz akár a jó kutatási eredményeket tönkretehetjük egy rossz prezentálással. A kutatási eredmények közlésének alapvetően két formája van: a számítógépes diavetítéssel támogatott szóbeli prezentáció és az írásbeli tanulmány. 24 Leggyakrabban mindkettőre szükség van, az államvizsga-dolgozatot is követ egy tizenöt húszperces prezentáció és védés. Mindkét esetben az eredményeket táblázatokban vagy grafikusan ábrázoljuk, ezért a következőkben a diagramkészítésről lesz szó. 24 Természetesen más, kreatív formái is vannak az eredmények bemutatásának, például a tudományos konferenciákon gyakran használt poszterek.

138 kutatasmodszertan:ii. KOR :30 Page AZ EREDMÉNYEK PREZENTÁLÁSA, A TANULMÁNY MEGÍRÁSA 9.1. Diagramkészítés A diagramok, grafikonok készítésének legfontosabb indoka, hogy egy jól választott diagrammal több és könnyebben megérthető információt tudunk közölni az olvasóval. Diagramkészítéskor sok lehetőségünk van egyéni megoldásokra, de van néhány szabály, alapelv, amit ha nem tartunk be, hiányos vagy teljesen félreértelmezhető lesz a diagramunk. Alapelvek: Az adataink szerkezetének megfelelő diagramtípust használjunk. Minden diagramnak tartalmaznia kell címet, az adatok mértékegységét a megfelelő tengely mellett, az adatok forrását és százalékok esetén a bázist, ami azt mutatja, hogy mi jelenti a 100%-ot. Egy prezentáció során ne használjunk többféle stílust a szövegeknél, és legyünk következetesek a különféle beállításoknál. Hasonlóképp lehetőleg ne használjunk 4 5 féle színnél többet. A következőkben kivételesen eltérünk az utóbbi két szabálytól, hogy az olvasó minél többféle megoldással találkozzon. Többféle széles körben elterjedt szoftver közül választhatunk, jegyzetünkben az MS Office 2007 PowerPointot használjuk. A program indítása és egy új prezentáció megnyitása után adjuk ki a következő parancsot: Insert Chart 70. ábra. Diagramszerkesztés PowerPointban

139 kutatasmodszertan:ii. KOR :30 Page DIAGRAMKÉSZÍTÉS Függőleges és vízszintes oszlopdiagram Adatábrázolási szempontból három lényeges altípusát különböztetjük meg a függőleges oszlopdiagramoknak, ezek a diagramtípusokat bemutató előbbi ábra első három diagramja. A háromdimenziós megjelenítés, illetve a különböző mértani testek közötti választásnak az adatok helyes ábrázolása szempontjából nincs jelentősége, esztétikai érzékünkre bízhatjuk a választást. A három altípussal kezdjük a diagramok részletes bemutatását. 71. ábra. Függőleges oszlopdiagram Az első típusban a vízszintes tengely kategóriáinak két egymástól független adatsorát tüntettük fel. A második függőleges oszlopdiagramtípus a kumulált oszlopdiagram. Ezt a diagramot az különbözteti meg az előzőtől, hogy a kategórián belül adatsorok összegződnek, egymástól nem függetlenek. Olyankor használjuk, ha a kategóriák komponenseinek, összetevőinek a megoszlását is fel akarjuk tüntetni. A következő, harmadik függőleges oszlopdiagram-típuson is összegződnek az adatsorok, de itt az összeg 100%.

140 kutatasmodszertan:ii. KOR :30 Page AZ EREDMÉNYEK PREZENTÁLÁSA, A TANULMÁNY MEGÍRÁSA 72. ábra. Kumulált függőleges oszlopdiagram 73. ábra. Százszázalékos függőleges oszlopdiagram

141 kutatasmodszertan:ii. KOR :30 Page DIAGRAMKÉSZÍTÉS 141 Gyakorlatilag megegyezik három kördiagrammal, de a 100%-os oszlopdiagrammal jobban tudjuk szemléltetni a kategóriák közötti különbségeket. Alkalmas két nominális változó közötti kereszttáblasor vagy -oszlop százalékainak az ábrázolására is. A következő ábránk a vízszintes oszlopdiagram. A függőleges és a vízszintes oszlopdiagram közötti választásnál néhány szempontra érdemes odafigyelni: Idősor ábrázolásakor a dátumokat a vízszintes tengelyen szokták ábrázolni, ezért függőleges oszlopdiagramot használunk, Hasonlóképp vízszintes tengelyen tüntetjük fel valamely numerikus változó folytonos értékeiből képzett intervallumokat. Például ha numerikus jövedelem változóból a következő kategóriákat képezzük: kevesebb mint 500, , , , és 5000 feletti RON. Ha 4 5-nél több kategóriánk van, akkor praktikus szempontból a vízszintes oszlopdiagram ajánlott, mivel a függőleges oszlopdiagram vízszintes tengelyén nem férnek el a kategóriák nevei. 74. ábra. Vízszintes oszlopdiagram

142 kutatasmodszertan:ii. KOR :30 Page AZ EREDMÉNYEK PREZENTÁLÁSA, A TANULMÁNY MEGÍRÁSA A vízszintes oszlopdiagramban az adatokat valamelyik ismérv szerint fentről lefelé csökkenő sorrendben ábrázoljuk. A kategóriánkénti kettő vagy annál több ismérv adatsorának feltüntetése fizikai megjelenésénél több információt eredményez. Például a fenti diagramon ránézésre is látjuk a két adatsor közötti arányokat, ami plusz információt nyújt. Megállapíthatjuk, hogy Nyugat-Európában internetorientáltabbak a számítógépet használók, mint Amerikában, lényegesen nagyobb a szélessávú internetkapcsolattal rendelkezők aránya a PC-vel rendelkezőkhöz viszonyítva Kördiagram A kördiagrammal olyan nominális változó kategóriáinak megoszlását ábrázoljuk, amelyek kumulált relatív gyakorisága 100%. 75. ábra. Kördiagram A kördiagram értékeit is csökkenő sorrendben ábrázoljuk, a legnagyobb értéket (körcikket) a függőleges, 12-es óraállásnál kezdjük. Az esetleges egyéb vagy az NT/NV kategóriákat a végére hagyjuk. Ha a kérdéstípusok alapján kívánjuk definiálni a kördiagram alkalmazhatóságát, azt mondhatjuk, hogy kördiagramot egyválaszos kérdésre adott válaszokból lehet készíteni. Többválaszos kérdésnél azért nem

143 kutatasmodszertan:ii. KOR :30 Page DIAGRAMKÉSZÍTÉS 143 alkalmazhatjuk, mert a kategóriák relatív gyakoriságainak összege ritka kivételektől eltekintve több mint 100%. Az alkalmazás egy másik, formai szempontja szerint a körcikkek száma ne haladja meg a 6 8-at, a sok kis körcikk értékei és címkéi nehezen olvashatók ki. Több kategória esetén használhatunk 100%-os oszlopábrát, amelynél jobban fel tudjuk tüntetni a kategóriák neveit (címkéit). Végső esetben használhatjuk a többválaszos kérdéseknek fenntartott vízszintes oszlopábrát, ekkor elveszítjük azt a plusz információt, hogy a kategóriák relatív gyakoriságainak összege 100%. A kördiagram további változataiként használhatjuk a kördiagram és a 100%-os oszlopdiagram kombinációját, amelyben az egyik körcikket komponenseire bontjuk. Az ilyen diagramot két egymással összefüggő ismérv adatainak ábrázolására használjuk Pontdiagram Pontdiagrammal numerikus változók értékeinek megoszlását ábrázolhatjuk. Az alábbi ábrán az SPSS bemutatása során már megismert employee data.sav adatfájl a munkavállalókra vonatkozó adatai közül a kezdő és a jelenlegi fizetés nagyságát mutatjuk be. Valamennyi pont koordinátái egy-egy munkavállaló fizetéseit határozzák meg. 76. ábra. Pontdiagram

144 kutatasmodszertan:ii. KOR :30 Page AZ EREDMÉNYEK PREZENTÁLÁSA, A TANULMÁNY MEGÍRÁSA Első ránézésre is látszik a kezdő és a jelenlegi fizetés nagysága közötti egyenes arányú kapcsolat, amit lineáris regresszióanalízis segítségével akár számszerűsíthetünk is Vonal- és területdiagram A vonaldiagramot is numerikus változókra használjuk, de az különbözteti meg a pontdiagramtól, hogy az ábrázolt értékek, pontok közötti vonalnak logikus értelme van, a két pont közötti változást jelzi. Ezért a vonaldiagram idősorok szemléltetésére alkalmas. 77. ábra. Vonaldiagram Ha pontdiagrammal ábrázoltuk volna a fenti adatsort, akkor azt sugallta volna, hogy az országos átlagbér évenként csak egyszer változik. 78. ábra. Területdiagram

145 kutatasmodszertan:ii. KOR :30 Page DIAGRAMKÉSZÍTÉS 145 A területdiagram funkciójában nem sokban különbözik a vonaldiagramtól, talán jobban kihangsúlyozza az adatsorok közötti különbséget, távolságot, és alkalmasabb az egymásra épülő adatsorok bemutatására is Radardiagram Több ismérv átlagát egyszerre ábrázolhatjuk a radardiagrammal. Előnyös tulajdonsága, hogy több adatsor (vagy minta) különböző ismérveinek (numerikus változóinak) átlagait ránézésre össze tudjuk hasonlítani, meg tudjuk állapítani, hogy melyik ismérvnél van a legnagyobb különbség. 79. ábra. Radardiagram A fenti ábra a világ 62 országában elvégzett, a szervezeti kultúrára és vezetési stílusra vonatkozó kutatássorozat (GLOBE) részeredményeit mutatja. A román és a magyar vállalatvezetők vezetési stílusát összehasonlítva az ábrán látható 5 szempont szerint, megállapíthatjuk, hogy a megkérdezett vállalati középvezetők szerint nincs eltérés. Legnagyobb különbség a vezető autonómiájának a megítélésében van, de a tanult független mintás t-próbával vagy a varianciaanalízissel kell megvizsgálnunk, hogy ez a különbség szignifikáns-e. További hasznos diagramtípusok például a két egymásba ágyazott perecdiagram, amivel a teljes összeg változása mellett az összetevők megoszlásának alakulását is ábrázolni lehet. Tőzsdei árfolyamok követői jól ismerik a tőzsde (stock) diagramot, amit más numerikus változók főbb statisztikáinak a bemutatására is használhatunk.

Több megjelenítése