137 Ketskeméty László * EGY KORSZERÛ ESZKÖZ STATISZTIKAI ELEMZÉSEKHEZ: AZ SPSS RENDSZER Az informatikai társadalomról Nem túlzás azt állítani, hogy az információ õsrobbanásának korszakában élünk. Azonos idõben óriási mennyiségû ismerethez, újdonsághoz, adathoz jutunk hozzá, akarva-akaratlanul a mobiltelefonokon, a médián vagy az interneten keresztül. A ránk zúduló információk özönébõl nem könnyû kihámozni a számunkra hasznosakat vagy felismerni az adatok hátterében meghúzódó összefüggéseket. A statisztika módszerei nagytömegû adathalmaz matematikai egzaktsággal megalapozott kiértékelését teszik lehetõvé. Egyre bõvül a statisztikát felhasználók köre, akiknek a mindennapos tevékenységük során elengedhetetlenül fontos az, hogy az adatok tömegét gyorsan és helyesen fel tudják dolgozni. A közvélemény-kutató cégeknél a felmérésekhez használt sokezres kérdõíveket, a bankoknál a számlavezetés adatait, a KSH-nál a népszámláláskor begyûjtött adatokat, a meteorológiai szolgálatoknál a mûszeres hálózatról és a mûholdakról beérkezõ mérési adatok sokaságát, az útfelügyeletnél a mûszeres mérõkocsik által a közutak állapotát minõsítõ digitális adatok gigabájtjait, a szupermarketekben a vásárlók vásárlási szokásait visszatükrözõ pénztárgépi adatokat, vagy a honlapok látogatóinak útvonalát, választásait jellemzõ a szerver gépeken folyamatosan képzõdõ logfájl adatokat kell igen rövid idõ alatt kiértékelni. Az ilyen és hasonló problémák megoldása nem képzelhetõ el valamilyen számítógépes statisztikai programcsomag nélkül. Az oktatásnak követnie kell ezt a trendet. Az egyetemeknek, fõiskoláknak olyan szakembereket kell képezniük, akiknek birtokában van a számítógépes statisztikai elemzés képessége. A felsõoktatási reform keretében megújuló tantervekben ezért helyet kell, hogy kapjanak olyan tantárgyak, amelyek lehetõvé teszik ezeknek a korszerû ismereteknek a beépülését. Az SPSS licenszelésérõl Az SPSS for Windows programrendszer a statisztikai elemzéseken alapuló adatfeldolgozások egyik nemzetközileg leginkább elterjedt eszköze. Szolgáltatásainak tág körét és magas színvonalú használhatóságát tekintve az SPSS rendszer ezen a piacon jelenleg a világ egyik vezetõ terméke. Azzal párhuzamosan, hogy az elégedett felhasználók egyre szélesedõ körének elõnyös tapasztalatai hazánkban is természetes úton terjednek, az SPSS oktatása és alkalmazása egyre nagyobb teret kap a felsõoktatásban is. A hazai felsõoktatás egésze számára a programrendszer hazai forgalmazója, az SPSS Hungary már mintegy kilenc éve egységes és nagyon kedvezõ hozzáférést biztosít a legfontosabb modulokhoz. A HUNINET-tel a magyar felsõoktatás informatikai egyesületével közösen kialakított felsõoktatási licensz programja lehetõvé teszi, hogy egy rendkívül kedvezõ részvételi díj ellenében csatlakozó 23 felsõoktatási intézmény (közöttük az ÁVF) oktatói és hallgatói korlátlanul használhassák az SPSS szoftvercsomag minden modulját oktatási, kutatási és tanulási céllal. Ez egészen pontosan azt jelenti, hogy a programban résztvevõ intézményeknél bárki hozzájuthat a szoftverhez egy licenszezési eljárást követõen, akár intézményi, akár saját tulajdonban lévõ gépre akarja azt telepíteni. Még arra vonatkozóan sincs korlátozás, hogy egy sze- * Óraadó oktató, Általános Vállalkozási Fõiskola
138 mély hány komputeren akarja az SPSS-t használni. A program számítógépre installálásakor keletkezõ ún. lock code-ot az intézmény kapcsolattartó személyén keresztül el kell e-mailen küldeni az SPSS Hungarynak, a válaszlevél pedig tartalmazza azt a licenszkódot, amivel egy évig a program használható. 1 Mivel a telepítés pillanatától kezdve 14 napig a program használata ingyenes a licensz-kérési eljárás ezalatt biztonságosan megtörténik az elsõ pillanattól kezdve folyamatos lehet a program használata. Az SPSS oktatása Az SPSS programrendszer már sok hazai felsõoktatási intézményben a különbözõ statisztikai, vagy statisztikát használó tárgyak oktatásának alapja. Például a Budapesti Mûszaki és Gazdaságtudományi Egyetemen a szerzõ munkahelyén többek között a terméktervezõ, a mûszaki menedzser, mûszaki informatikus és a közgazdász szakokon különbözõ statisztikai, marketinges, ergonómiai, termékbiztonsági és pszichológiai kurzusok oktatásában támaszkodnak az SPSS-re. Az Általános Vállalkozási Fõiskolán az oktatók egyes kutatási projektekben már évek óta használják a programot. A jövõben a gazdaságinformatika szakirány képzésében kerül majd sor arra, hogy a számítógépes statisztikai elemzés oktatott tantárggyá váljék. Az SPSS programrendszerrõl röviden Az SPSS egy moduláris, szorosan integrált teljes körû termékcsomag a folyamattervezés, az adatgyûjtés, az adatkezelés, az adatelõkészítés, az elemzés, a jelentéskészítés és a kiértékelés munkafázisok elvégzéséhez. A kiegészítõ modulok használata zökkenõmentesen kiterjeszti az alapszoftver lehetõségeit. Az intelligens kezelõfelület egyszerûen kezelhetõ, még a legösszetettebb elemzés esetén is hozzásegít az összes szükséges adatkezelési, statisztikai és riportkészítési lehetõség kihasználásához. A programrendszer legfontosabb egységei az SPSS Base for Windows, az SPSS Regression Models, az SPSS Advanced Models és az SPSS Trends. A Base for Windows alapmodulban találhatók meg a leíró statisztikákat számoló programok, az alapvetõ grafikus funkciók, és itt végezhetõk el a különbözõ statisztikai próbák. A Regression modulban különféle két- és többváltozós regressziós elemzések mellett egyéb lineáris elemzések végezhetõk el. Az Advanced Models modulban olyan többváltozós statisztikai elemzések hajthatók végre, mint a faktoranalízis, a klaszteranalízis, a diszkriminancia-analízis és a többdimenziós skálázás. A Trends modulban idõsor-elemzéseket végezhetünk. Egy rövid példa az SPSS használatára 1995-ben a WMO felmérést készített összesen 124 országban az ország egészségügyi, társadalmi, gazdasági állapotáról. Minden országból olyan statisztikai adatotokat szereztek be, mint pl. a népesség, népsûrûség, GDP, államvallás, gazdasági régióhoz tartozás, uralkodó meteorológiai klíma, férfiak, nõk várható élettartama, az aids esetek száma, a születés-halálozási ráta, a csecsemõhalandóság, az írni-olvasni tudók százaléka stb. Ezen az állományon amelyet több más fájlal együtt az SPSS könyvtára tartalmaz hajtsunk végre egy fõkomponens-elemzést. Ennek segítségével olyan adattömörítést fogunk elérni, ami révén lehetõvé válik az, hogy az országok egymáshoz képesti elhelyezkedését grafikusan szemléltethessük. Nem földrajzi természetû viszonyok lesznek láthatóak a grafikonon, hanem a gazdasági, társadalmi természetû viszonyok. Az eredeti 13 dimenziós térben nem volt esélyünk ilyen típusú ábrázolásra, a fõkomponens-térben csekély információvesztés mellett viszont ez megvalósulhat. Az elsõ táblázatból az olvasható ki, hogy a feldolgozáshoz kiválasztott 13 változót négy fõfaktorba tömörítettük úgy, hogy az információ majdnem 80%-a megmaradt. A táblázat a fõkomponenseket fontossági sorrendben mutatja. 1 Az ÁVF-en Lipka László a kapcsolattartó személy, rajta keresztül lehet telepítõ lemezhez és licenszkódhoz jutni.
139 1. ábra A FÕKOMPONENSEK ERÕSORRENDJE A második táblázatban láthatjuk azt, hogy az egyes változókat a kiválasztott négy fõkomponens milyen pontosságig magyarázza. 2. ábra A MODELL REPRODUKÁLHATÓSÁGA VÁLTOZÓNKÉNT A harmadik táblázatban az olvasható, hogy egy alkalmas elforgatás nyomán, hogyan állítják elõ a fõkomponensek lineáris kombinációval a változókat. Ezen táblázat segítségével tanulmányozható az, hogy a 13 kiválasztott változó között milyen kapcsolatok vannak.
140 3. ábra A VÁLTOZÓK ELÕÁLLÍTÁSA A FÕKOMPONENSEK SEGÍTSÉGÉVEL Az elsõ három fõkomponens által kifeszített térben az elõbbi táblázatot grafikusan is megjeleníthetjük. Szemléltethetjük az eredeti 13 változó egymáshoz képesti elhelyezkedését. (4. ábra). 4. ábra A VÁLTOZÓK ELHELYEZKEDÉSE A FÕFAKTOROK TERÉBEN
141 Végül, az elsõ három fõkomponens segítségével megadható a 124 ország pontfelhõ diagramja is. Az országokat a gazdasági régióhoz tartozás alapján színeztük ki. (5. ábra). 5. ábra AZ ORSZÁGOK ELHELYEZKEDÉSE A FÕKOMPONENSEK TERÉBEN, RÉGIÓNKÉNT SZÍNEZVE IRODALOM Ketskeméty László, Izsó Lajos (2005): Bevezetés az SPSS programrendszerbe, Módszertani útmutató és feladatgyûjtemény statisztikai elemzésekhez. Budapest. Eötvös Kiadó. http://www.huninet.hu/ http://www.spss.hu/
142