Bevezetés az IBM SPSS Statistics programrendszerbe



Hasonló dokumentumok
EGY KORSZERÛ ESZKÖZ STATISZTIKAI ELEMZÉSEKHEZ: AZ SPSS RENDSZER

Az informáci. Forczek Erzsébet SZTE, ÁOK Orvosi Informatikai Intézet május

IBM SPSS Modeler 18.2 Újdonságok

Statisztika oktatása és alkalmazása a mérnöki területen

A tantárgyelem kódja: KIT0401G. gyakorlat A tantárgyelem jellege: A tantárgyelem oktatásának ajánlott 5. félév

A statisztika oktatásának átalakulása a felsőoktatásban

A tantárgyelem kódja: KIT0402G

PIACKUTATÁS (MARKETINGKUTATÁS)

A TÉMA RÖVID FELVEZETÉSE A PÁLYÁZATI ANYAG TARTALMA ÉS FORMAI KÖVETELMÉNYEK

A tantárgyelem kódja: KIT0402G

ÓBUDAI EGYETEM Neumann János Informatikai Kar Informatikai Rendszerek Intézet Témavezető: Bringye Zsolt

Big Data az adattárházban

A DigiKresz internetes gyakorló program hatékony segítség az elméleti oktatást követő vizsga eredményességének növelésében.

Algoritmus terv 3. Fejezet: Folyamatok meghatározása

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

A tantárgyelem kódja: KIT0301G

KUTATÁSMÓDSZERTAN 4. ELŐADÁS. A minta és mintavétel

Karbantartási és diagnosztikai adatmenedzselő rendszer (KarMen)

Területi statisztikai elemzések

A MATEMATIKAI SZOFTVEREK ALKALMAZÁSI KÉSZSÉGÉT, VALAMINT A TÉRSZEMLÉLETET FEJLESZTŐ TANANYAGOK KIDOLGOZÁSA A DEBRECENI EGYETEM MŰSZAKI KARÁN

Matematikai statisztika c. tárgy oktatásának célja és tematikája

TANTÁRGYI ADATLAP I. TANTÁRGYLEÍRÁS

TANTÁRGYI ÚTMUTATÓ. Alkalmazott számítástechnika. tanulmányokhoz

1. táblázat: alapozó és törzstárgyak

Hogyan lesz adatbányából aranybánya?

Otthontérkép, segít a döntésben! április

(Prím Online, Kütyü Magazin, Prím Letöltés, Prímlista)

Oktatói Munka Hallgatói Véleményezésének eredményei 2017/18. tanév őszi félév

Access 2013 Lekérdezéstől testre szabásig TARTALOM 1

HELYI TANTERV / INFORMATIKA

A szóbeli vizsgafeladatot ha a feladat indokolja a szaktanárok által összeállított mellékletek, segédanyagként felhasználható források egészítik ki.

Moodle -egy ingyenes, sokoldalú LMS rendszer használata a felsőoktatásban

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

Mesterséges Intelligencia Elektronikus Almanach

A pedagógiai kutatás metodológiai alapjai. Dr. Nyéki Lajos 2015

Innovatív trendek a BI területén

DIGITÁLIS KOMPETENCIA FEJLESZTÉSE TANÍTÁSI ÓRÁKON

Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com

Az ErdaGIS térinformatikai keretrendszer

Kezdő lépések Microsoft Outlook

Kedves Ügyfelünk! Ezúton szeretném tájékoztatni Önt az Armada Bér modul legújabb frissítéséről:

Hitelintézeti Szemle Lektori útmutató

A TARTALOMFEJLESZTÉS ÚJ MODELLJE

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

A TERC VIP költségvetés-készítő program telepítése, Interneten keresztül, manuálisan

Elektronikus oktatástámogató rendszer bevezetésének tapasztalatai. Jókai Erika Vig Zoltán

IP Thermo for Windows

TERC V.I.P. hardverkulcs regisztráció

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

Olvass. Tanulj. Vidd magaddal.

18. modul: STATISZTIKA

Autóipari beágyazott rendszerek Dr. Balogh, András

IK Algoritmusok és Alkalmazásaik Tsz, TTK Operációkutatás Tsz. A LEMON C++ gráf optimalizálási könyvtár használata

KÉPZÉSI PROGRAM. GAZDASÁGI INFORMATIKUS OKJ azonosító: Szolnok

Elektronikus aláírás ellenőrzése PDF formátumú e-számlán

A marketing tevékenység megszervezése a sepsiszentgyörgyi kis- és közepes vállalatok keretében

Miért érdemes váltani, mikor ezeket más szoftverek is tudják?

Innováció és eredményesség az alacsony státuszú iskolákban

TANTÁRGYI ÚTMUTATÓ. Vállalatirányítási szoftverek. tanulmányokhoz

MINISZTERELNÖKI HIVATAL. Szóbeli vizsgatevékenység

Statisztika 1. Tantárgyi útmutató

Jövő Internet - kutatások az elmélettől az alkalmazásig. Eredménykommunikációs kiadvány

Bevezetés A harmadik szoftverkrízis korát éljük! Szoftverkrízisek: 1. nincs elég olcsó: hardver, szoftver, programozó 2. nincs elég olcsó: szoftver, p

A TANTÁRGY ADATLAPJA

Értékelés a BUS programhoz elkészült termékek magyar változatáról Készítette: Animatus Kft. Jókay Tamás január 07.

Ügyfél- és címadatok feldolgozása Talenddel

Gyakorlati vizsgatevékenység A

A mezőgazdasági adó-visszatérítés aktuális kérdései, valamint az ABEV rendszer működésének tapasztalatai

Alap és legfontosabb cél. Továbbtanulás szempontjából. Speciális ismeretek, képességek

Gyakorlati vizsgatevékenység B

Modellkiválasztás és struktúrák tanulása

DIGITÁLIS TEREPMODELL A TÁJRENDEZÉSBEN

TANTÁRGYI ADATLAP I. TANTÁRGYLEÍRÁS

n" - Online adatbázisok KSH honlapján Bódiné Vajda Györgyi KSH Tájékoztatási főosztály

SZÜKSÉGLETEK, TAPASZTALATOK, IGÉNYEK INTÉZMÉNYI SZINTŰ ELEKTRONIKUS TANULÁSTÁMOGATÁSI RENDSZER. Fodorné Tóth Krisztina

Összeállította Horváth László egyetemi tanár

Inczédy György Középiskola, Szakiskola és Kollégium Nyíregyháza, Árok u. 53. TANMENET. Informatika szakmacsoport

S atisztika 2. előadás

OpenCL alapú eszközök verifikációja és validációja a gyakorlatban

Számítógépes döntéstámogatás. Bevezetés és tematika

Mikrobiológia MOODLE - gyakorló és vizsgarendszer használata az ELTE TTK Biológiai Intézet E- learning felületén

BARANGOLÁS AZ E-KÖNYVEK BIRODALMÁBAN Milyen legyen az elektonikus könyv?

A statisztika oktatásáról konkrétan

Önálló labor feladatkiírásaim tavasz

A pedagógia mint tudomány. Dr. Nyéki Lajos 2015

Elektronikusan hitelesített PDF dokumentumok ellenőrzése

Infor PM10 Üzleti intelligencia megoldás

A TANTÁRGY ADATLAPJA

SZÁMALK SZAKKÖZÉPISKOLA

DigiTerra fejlesztési eredmények

Bevezető Mi a statisztika? Mérés Csoportosítás

NYF-MMFK Műszaki Alapozó és Gépgyártástechnológiai Tanszék mezőgazdasági gépészmérnöki szak III. évfolyam

Informatikai prevalidációs módszertan

A rendszer új verziója lehetőséget nyújt az erőforrások Excel táblázatba exportálására és a táblázatban elvégzett ármódosítások betöltésére.

kodolosuli.hu: Interaktív, programozást tanító portál BALLA TAMÁS, DR. KIRÁLY SÁNDOR NETWORKSHOP 2017, SZEGED

Big Data adattárházas szemmel. Arató Bence ügyvezető, BI Consulting

Gyakornoki álláslehetőségek a Robert Bosch Elektronika Kft.-nél

Adatbázis rendszerek. dr. Siki Zoltán

Tisztelt Nemzeti Média- és Hírközlési Hatóság!

A Szekszárdi I. Béla Gimnázium Helyi Tanterve

Átírás:

Ketskeméty László, Izsó Lajos, Könyves Tóth Előd Bevezetés az IBM SPSS Statistics programrendszerbe Módszertani útmutató és feladatgyűjtemény statisztikai elemzésekhez Harmadik javított, átdolgozott kiadás Artéria Stúdió Kft Budapest, 2011

AZ SPSS HUNGARY ELŐSZAVA Különös öröm, hogy újra ajánlhatom ezt a harmadik alkalommal megjelenő kiadványt a kedves Olvasónak. Az informatikában különösen kevés az olyan eszköz, amelyet már évtizedekkel ezelőtt is használtak, és várhatóan még sokáig is fognak. Ez azt jelenti, hogy a megismerésébe, tanulásába fektetett idő biztosan kamatozik hosszú távon. Az IBM SPSS programrendszer ezen ritka kivételek közé tartozik, tapasztalt felhasználói gyakran évekkel, néha évtizeddel korábban írt kódjaikat is sikerrel futtatják. Másfelől az évenkénti új szoftververziók követik a legújabb trendeket, elemzési módszereket. Az előző kiadás óta eltelt időben természetesen nagyon sok minden változott, ezeket a változásokat egy új kiadásban foglalták össze a szerzők. Ezek sok régi felhasználó számára is hasznosak lehetnek, ugyanakkor az újoncok is élvezhetik a könyv korábbiaknál is letisztultabb szerkezetét és tartalmát, amit a szoftverrendszert évtizedek óta a BME-n oktató szerzőpáros Dr. Izsó Lajos, és Dr. Ketskeméty László mellett új szerzőtársként a szoftvert az akadémiai, majd az üzleti világban 33 éve használó, és oktató kollégánk, Könyves Tóth Előd jegyez. Ajánlom tehát a könyvet kezdőnek és tapasztalt felhasználónak egyaránt, és kívánom, hogy sok eredményes elemzési munkában, kutatási projektben használják sikerrel: Körmendi György ügyvezető SPSS Hungary A SZERZŐK ELŐSZAVA A HARMADIK KIADÁSHOZ A könyv amelynek a két korábbi verziója 1996-ban és 2005-ben jelent meg az IBM SPSS Statistics programrendszerről szól, amely ma a matematikai statisztika egyik világpiacvezető szoftvercsomaga. Ugyanakkor a fejlesztő cég az SPSS, an IBM company egy másik terméke, az SPSS Modeler (korábbi nevén: Clementine) az adatbányászat területén világpiac vezető. A matematikai statisztikának és az adatbányászatnak közös vonása, hogy a valóságból származó adatok feldolgozása révén akarja jobban megismerni magát a valóságot. A valóság, illetve annak valamely meghatározott szelete megismerésének ez a két irányzata egyre inkább közelít egymáshoz. Az SPSS programcsomag (akkor még a Statistics kiegészítő szó nélkül a nevében) az 1970-es évekbeli indulásakor még klasszikus statisztikai programcsomag volt, amibe napjainkban már egyre több tipikus adatbányászati módszer is beépül. Az adatelemzés hagyományos, klasszikus ágát a matematikai statisztika jelenti, amely mindig akkora elemszámú minta begyűjtésére törekszik, ami a megfelelő becslési pontosság eléréséhez feltétlenül szükséges. A minta adatainak beszerzése néha nagyon költséges lehet. Gondoljunk pl. egy kérdőíves felmérésre, ahol kérdezőbiztosokat kell kiképezni, adatrögzítőket kell alkalmazni, költséges továbbá a kérdőívek nyomdai előállítása, a kérdezőbiztosok utaztatása, stb. is. Viszont, a jó mintából a feldolgozás során értékes összefüggéseket, törvényszerűségeket lehet felfedezni, aminek felhasználása többszörösen megtérítheti a befektetéseket. A minta az adathalmaz, amin a statisztikai elemzést végrehajtjuk tudományos elveken alapuló, gondosan megtervezett adatgyűjtés eredménye, a valóság pontos megfigyeléséből származó olyan adatok halmaza, amelyben két alapvető Ketskeméty Izsó Könyves Tóth: SPSS 2.

szempontnak, a reprezentativitásnak és a megfigyelések függetlenségének egyaránt érvényesülnie kell. Különben nincs esélyünk a jó eredményre. A jó mintában, mint ahogyan a cseppben a tenger hűen vissza kell tükröződnie a valóságnak, a tanulmányozott populáció jellemzőinek. A mintából számolt statisztikák, grafikonok, táblázatok és összefüggések, tesztek alapján meghozott döntések nem feltétlenül lesznek különben érvényesek az adott populációra. A rendelkezésre álló mintát ezért mindig fenntartással kell kezelni, ellenőrizni kell az érvényességet, komplexitást, reprezentativitást és függetlenséget. Az SPSS Statistics legújabb verzióiban már megtalálhatók azok az eszközök, amivel a mintát ellenőrizni lehet. Napjainkban az informatika és ezen belül az internet térhódításával, ha akarjuk, ha nem, folyamatosan adatok tömege zúdul ránk. Erre specializálódott szakemberek serege dolgozik azon, hogy az elszórt információk, adatok dzsungeléből hasznosítható, értékes összefüggéseket, kapcsolatokat nyerjenek ki. Az ehhez felhasznált eszköz az adatbányászat, ami az adatfeldolgozás és a statisztika módszereinek szimbiózisából keletkező, dinamikus fejlődésben lévő olyan modern tudományág, amit manapság már mindenki komolyan vesz és alkalmaz. Az informatikai eszközök képesek a valóság vizsgált szeletének a folyamatait, történéseit, tranzakcióit rögzíteni, a keletkezett adatokat tárolni, és szükség szerint elemezni. A teljesség igénye nélkül felsorolunk néhány alkalmazást, ahol nagy mennyiségű olyan adat keletkezik, amelyeket valamilyen szinten feldolgozni, elemezni kell. Egy szupermarket pénztárgépei rögzítik a napi vásárlások adatait; Egy banki információs rendszer tárolja az egyes terminálokon, ügyfélpultoknál és online kapcsolatokban végbement tranzakciók adatait; A kötvénypiacon másodpercenként rögzítik a részvények vételeit és eladásait; A korházakban tárolják a páciensek releváns adatait (pl. milyen kezelést kapott, mik voltak a laboreredmények, milyen gyógyszereket kapott, hogyan reagált és mindez mibe került, etc.). A foglalkoztatási rehabilitációban közreműködő szervezetek tárolják az érintett személyek megfelelő orvosi, képességvizsgálati, pszichológiai, szociális, etc. adatait Az integrált egyetemi információs rendszerekben tárolják az összes diák, tanár és tantárgy a képzéssel kapcsolatos adatát; Az NAV (korábban az APEH) több millió állampolgár személyi jövedelem adójának adatait tárolja éveken keresztül; Egy korszerű gépkocsi fedélzeti chipében tárolják a motor működésének fizikai adatait, amit a szervizeléskor használnak majd; A rendőrségi jegyzőkönyveket digitális formában archiválják; A NYUFI a dolgozók millióinak biztosítási adatait tárolja; A meteorológiai szolgálat automatikus mérőállomások százairól kapja online az időjárás adatokat percenkénti bontásban; Telefontársaságok elsősorban a számlakészítéshez gyűjtik ügyfeleik hívásinformációit; stb. Még sorolhatnánk tovább az olyan példákat, amelyekben az a közös, hogy a keletkezett adattömeg az azt produkáló rendszer saját rendje szerint, az elemző számára véletlenszerűnek tekinthető módon keletkezik, akár a keletkezés időpontját, akár a keletkezés körülményeit, akár a keletkezés forrását tekintjük. Ezek az adatbázisok a valóság egy-egy szeletének ugyanúgy hűséges lenyomatai, mint ahogyan a statisztikai minta is. A különbség az adatmennyiségben és az adatok spontán szervezettségében nyilvánul meg elsősorban. Az elemzőknek, kutatóknak, felhasználóknak itt az adatok sorrendjére, szerkezetére, mennyiségére szinte semmilyen befolyása nincsen. Mivel a gyakorlatban ez a két adatelemző megközelítés egyre inkább egyidejűleg, egymást kiegészítve kerül alkalmazásra, az SPSS Statistics utolsó verzióiban már tükröződik ez a konvergencia: bekerültek bizonyos adatbányászati módszerek is. Ketskeméty Izsó Könyves Tóth: SPSS 3.

Az SPSS Statistics programrendszert nagyszámú, matematikusokból, informatikusokból, közgazdászokból és egyéb szakemberekből álló fejlesztő csoportok évről-évre újabb verziót piacra dobva bővítik. Az újabb verziók általában jelentős elvi és gyakorlati többletet jelentenek a korábbiakhoz képest, ami a felhasználókat állandó továbbtanulásra késztetik. Jelen könyv előző változata több mint öt éve jelent meg. Ezalatt az SPSS formájában, tartalmában, sőt a termék tulajdonosi szerkezetében is nagy változások történtek. Az SPSS programcsomagot a 15. verzió után teljesen átdolgozták korszerűbb IT felületre. A felhasználó számára ez a kezelésben szinte észrevehetetlen. Ma már a 19. verzió működik IBM SPSS Statistics 19 néven, ezért érdemes legalább vázlatosan összefoglalni az utóbbi évek változásait, amelyek csoportosíthatók a környezeti, vezérlési, adatkezelési, kimeneti és a statisztikai eljárásokat érintő témákba, kiegészítve a megszűnt, illetve várható vonatkozásokkal. Környezet Java platform, xml támogatás, Unix, Mac Desktop verziók is Core Base szétválasztás, minden modul használható külön is Többnyelvű támogatás, a Help webes felületre került Server Linux-System Z (is), PMML 4. támogatás Vezérlés Python, R,.Net VB integráció Újabb párbeszédpanelek és menük; a párbeszédpanelek átméretezhetősége, fogd és vidd változómozgatás Egyedi dialógus- és menü-létrehozás (szintax, Python, R,.Net VB szkript kódokkal) A szintax ablakhoz új intelligens, a parancsokat automatikusan kiegészítő hibaérzékeny szerkesztő, ablak split, behúzás, Paste a kurzorhoz a dialógusból, töréspontok, könyvjelzők, ugrás hibáról hibára Adatkezelés Excel 2007, 2010, Salesforce elérés (mint SQL) Codebook (címketár), nyelvi ellenőrzés, automatikus mérési szint meghatározása Szám-szöveg formátum váltása (Alter Format), medián függvény, esetek közti értékléptető menü Automatikus adatelőkészítés prediktív eljásások előtt Kimenet Új és régi (spo és spv) output file-ok nem kompatibilisek, ezért mindkettőhöz ingyenesen letölthető az output kezelő az SPSS support oldalról (Smart Viewer és Smart Reader) Model viewer több eljáráshoz, output-vezérlés szintaxból, keres-cserél funkció Hatékonyabb xls, doc, pdf, ppt, html, xml export, gyorsabb és vázlatos (lightweight) táblák APA-style szignifikancia-jelölés (homogén alcsoportok) a Custom és Crosstab táblákon Statisztika Új Nem-Paraméteres eljárás menü Model-Viewer-rel, felújított Two Step klaszter menü Neural Network, Nearest Neighbor klaszterező eljárások Partial Least Squares (kanonikus korreláció alternatívája, ami idáig makró gyanánt létezett) Multiple Imputation (hiányzó adatok szimultán pótlása) CTables-ben saját utó-kategóriák képzése Ketskeméty Izsó Könyves Tóth: SPSS 4.

ALM, GLMM Automatikus Lineáris Modellek, Általános Kevert Többváltozós Modellek Direct Marketing felújítva, smart output és scoring funkciókkal A Scroring Wizard már nem csak server-en működik A Boostrapping, Boosting, Bagging eljárások beépültek sok eljárásba Megszűnt, vagy más lett helyette IGRAPH, Draft Viewer, MAP, Tables, Trend szintaxból a régi Tables parancsok még működnek spo helyett spv, Data Entry helyett: Data Collection Helyzetérzékeny Result Coach, de a Case Study bővült Várható Újabb modeler-szerű felületek, predikciók összehasonlításának automatizálása Egyre több nem-paraméteres eljárás, újabb cél-dialógusok nem statisztikusoknak Az SPSS könyvünk előző változata 2005-ben jelent meg, és az akkor legfrissebb programverzióra, az SPSS 14.0-ra vonatkozott. Abból a könyvből az összes példány elfogyott, de szerencsére a vásárlói igény nem szűnt meg. Interneten keresztül, SPSS fórumokon személyesen is sokan jelezték, hogy szívesen vennék az újabb kiadást. A szerzők megőrizve a korábbi mű szerkezetét, bevált példáit, gyakorlatait, kijavítva az észlelt sajtóhibákat az új könyvben végrehajtották a szükséges frissítéseket, aktualizálták a leírást a piacon kapható legfrissebb verzióhoz, az IBM SPSS Statistics 19-hez. Az új könyv nem egyszerűen a régi változat javított és bővített kiadása, hanem annak komoly átdolgozása is. Többek között megjelennek benne az új programfunkciók, bővültek az alkalmazási példák és kiegészült a szöveg a példafájlok részletes leírásával. Olyan vadonatúj részekkel bővült a könyv, mint a táblázatkezelés, a szintaxis üzemmód leírása, a Q-módszertan, az általánosított lineáris modell, a legközelebbi társ módszer és a direkt marketing. Teljesen átírtuk a neurális hálók fejezetet, miután az IBM SPSS Statistics 19-ben már új menüpontként megjelent ez a témakör. Nagyon sok eddig nem tárgyalt témakörhöz készítettünk új gyakorlatot, feladatokat. A szerzők remélik, hogy a könyv nemcsak az új, hanem a tapasztalt SPSS felhasználóknak is hasznos információkkal szolgál majd. A könyv forgatásához, a gyakorlatok végrehajtásához sok sikert és kitartást kívánunk! Az új könyv lektorálását Dr Fekete István, az ELTE informatikus-matematikusa végezte, akinek ezúton is köszönjük munkáját. Ugyancsak köszönet illeti Dr. Hercegfi Károlyt, aki rengeteg hasznos tartalmi és formai tanáccsal segítette a könyv szerkesztését. Budapest, 2011. február 28. A szerzők Ketskeméty Izsó Könyves Tóth: SPSS 5.

A SZERZŐK ELŐSZAVA A MÁSODIK KIADÁSHOZ Nem túlzás azt állítani, hogy az információ ősrobbanásának korszakában élünk. Azonos időben óriási mennyiségű ismerethez, újdonsághoz, adathoz jutunk hozzá akarva-akaratlanul a mobiltelefonokon, a médián vagy az interneten keresztül. A ránk zúduló információk özönéből nem könnyű kihámozni a számunkra hasznosakat vagy felismerni az adatok hátterében meghúzódó összefüggéseket. A statisztika módszerei nagytömegű adathalmaz matematikai egzaktsággal megalapozott kiértékelését teszik lehetővé. Egyre bővül a statisztikát felhasználók köre, akiknek a mindennapos tevékenységük során elengedhetetlenül fontos az, hogy az adatok tömegét gyorsan és helyesen fel tudják dolgozni. A közvéleménykutató cégeknél a felmérésekhez használt sokezres kérdőíveket, a meteorológiai szolgálatoknál a műszeres hálózatról és a műholdakról beérkező mérési adatok sokaságát, az útfelügyeletnél a műszeres mérőkocsik által a közutak állapotát minősítő digitális adatok gigabájtjait, a szupermarketekben a vásárlók vásárlási szokásait visszatükröző pénztárgépi adatokat, vagy a honlapok látogatóinak útvonalát, választásait jellemző a szerver gépeken folyamatosan képződő logfájl adatokat kell igen rövid idő alatt kiértékelni. Az ilyen és hasonló problémák megoldása nem képzelhető el valamilyen számítógépes statisztikai programcsomag nélkül. Ebben a könyvben a hagyományos és modern statisztikai módszerek elméletének ismertetése mellett az olvasó megtanulhatja az SPSS for Windows programrendszer kezelését is. A programrendszer felépítésének leírása mellett az olvasó valóságos esettanulmányokon és életszerű mintapéldák megoldásán keresztül tekintheti át az SPSS működését. [ ] Az SPSS for Windows programrendszer statisztikai elemzéseken alapuló adatfeldolgozások egyik nemzetközileg leginkább elterjedt eszköze. Szolgáltatásainak tág körét és magasfokú használhatóságát tekintve az SPSS rendszer különösképpen a forradalmian megújult 10-es verziótól kezdve ezen a piacon jelenleg a világ egyik vezető terméke. Azzal párhuzamosan, hogy az elégedett felhasználók egyre szélesedő körének előnyös tapasztalatai hazánkban is természetes úton terjednek, az SPSS oktatása és alkalmazása egyre nagyobb teret kap a felsőoktatásban is. A programrendszer terjedésének ezt a természetes, de a saját logikája szerint viszonylag lassú módját az SPSS Inc. és az SPSS Hungary nagyvonalú és messzetekintő üzletpolitikája nagyban felgyorsította azzal, hogy a hazai felsőoktatás egésze számára már mintegy nyolc éve egységes és nagyon kedvező hozzáférést biztosít a legfontosabb modulokhoz. Ennek következtében, a magyar felsőoktatás tanárai és hallgatói számára az egyes kijelölt modulok viszonylag olcsón hozzáférhetők. Az SPSS programrendszer ezért már sok hazai felsőoktatási intézményben a különböző statisztikai, vagy statisztikát használó tárgyak oktatásának alapja. A Budapesti Műszaki és Gazdaságtudományi Egyetemen a szerzők munkahelyén például a terméktervező, a műszaki menedzser, műszaki informatikus és a közgazdász szakokon különböző statisztikai, marketinges, ergonómiai, termékbiztonsági és pszichológiai kurzusok oktatásában támaszkodnak az SPSS-re. A szerzők elsősorban erre gondoltak, amikor az egyes témaköröket tárgyaló fejezetek harmadik részében, illetve a könyv végén egy önálló fejezetben az oktatást segítő mintapéldákat másfél évtizedes tapasztalataik alapján megszerkesztették. A könyv ugyanakkor szól a már gyakorló, sőt a gyakorlott SPSS felhasználókhoz is, akik egy-egy speciális területen elmélyíthetik tudásukat és további gyakorlati útmutatásokat is kaphatnak. A könyv első részében az SPSS for Windows programrendszer leírását adjuk meg. Röviden ismertetjük az egyes menüpontok funkcióit, ami alapján az olvasó átfogó képet kaphat a programrendszer szerkezetéről, alkalmazhatóságáról. Külön fejezetet szenteltünk az eredményeket megjelenítő ablak (Viewer) ismertetésének. Ketskeméty Izsó Könyves Tóth: SPSS 6.

A második rész tartalmazza a statisztikai módszerek elméleti hátterének megadását. Ez a rész a leíró statisztikák és grafikonok definícióit megadó fejezettel kezdődik, majd a próbákon, szórásanalízisen, regressziós elemzéseken keresztül az idősorok Box-Jenkins-féle elemzéséig eljutva valamennyi fontos módszer leírása szerepel egy-egy fejezetben. A második rész két utolsó ilyen fejezete a szabályozó diagramokkal (Control Chart) és a neurális hálókkal (Neural Connection) foglalkozik. A könyvünk gerincét alkotó második rész szerkezete minden témakör esetén alapvetően a következő három eltérő rendeltetésű és műfajú megközelítésre, illetve az azokat megvalósító fejezetekre épül: 1) A lényeg rövid összefoglalása, 2) A matematikai részletek, 3) Számítógépes gyakorlatok. A lényeg rövid összefoglalása c. alfejezetek mindössze 1-2 oldalon és szándékaink szerint igen tömören, szemléletesen és heurisztikusan világítják meg az adott problémakör lényegét. Ez az alapozás a legtöbb hallgatónak és felhasználónak gyakran elegendő is, ha a mélyebb megértésre és áttekintésre nincs szüksége vagy ideje, de az adatfeldolgozási problémákat többé-kevésbé rutinszerűen mégis meg kell oldaniuk, vagy legalább nagy vonalakban meg kell érteniük. Az ilyen felhasználók A matematikai részletek c. fejezeteket nyugodtan kihagyhatják, de a Számítógépes gyakorlatokat természetesen nekik is el kell végezniük, annak logikáját el kell sajátítaniuk, az eredmények értelmezésében pedig bizonyos jártasságot kell szerezniük. A matematikai részletek c. alfejezetek az elméleti hátteret adják, de ennek leírásakor sem törekedtünk a matematikai szakkönyvek precizitására. Az érdeklődő olvasó azonban mégis megtalálhatja a legfontosabb részleteket és az SPSS által szolgáltatott eredményeket formula-szinten, az egyes számítási lépések szintjén is átláthatja. Bár csak a módszerek megértéséhez feltétlenül szükséges matematikai ismeretek átadására szorítkoztunk, ezeknek a fejezeteknek az alapos átolvasása és megértése természetesen még így is komoly erőfeszítést igényel a nem-matematikus olvasóktól. Ez a szellemi erőfeszítés bizonyos esetekben és bizonyos témakörök vonatkozásában mégis indokolt és hasznos lehet. Tisztában vagyunk azzal, hogy viszonylag keveseknek lesz szükségük valamennyi ilyen fejezet mélyebb tanulmányozására. Véleményünk szerint azonban sokan lesznek olyanok, akik egy-egy őket érintő vagy érdeklő témakörben el fognak mélyedni. A Számítógépes gyakorlatok c. alfejezetek konkrét alkalmazási példákon keresztül heurisztikusan, lépésről lépésre mutatják be a program használatát: az egyes beépített statisztikai módszerek kiválasztását, a különböző közbenső és végső eredményeket, valamint azok statisztikai és szakmai értelmezését, matematikai leírását és a program használatának megtanulására szolgáló mintafeladatokat. A könyv harmadik része egyrészt a szerzők közel két évtizedes tapasztalatain alapuló módszertani tanácsait és az irodalomból összegyűjtött útmutatásokat adja közre. Az adatok statisztikai feldolgozása során levonható következtetések ugyanis csak akkor lesznek helyesek, mások számára publikálva meggyőzőek, ha az alkalmazott statisztikai módszerek esetében a matematikai feltételekkel körülírható körülmények legalábbis közelítőleg fennálltak. Az említett körülmények vonatkozhatnak a mintavételezés módjára, a minta elemszám nagyságára, a minta szerkezetére, eloszlására, érvényességére, megbízhatóságára, Ketskeméty Izsó Könyves Tóth: SPSS 7.

stb. A közreadott módszertani tanácsok és útmutatások ebben e vonatkozásban adnak segítséget. Ez a harmadik rész másrészt az ismereteiket tovább mélyíteni szándékozók számára még további válogatott számítógépes gyakorlatokat tartalmaz. A harmadik rész első fejezetében összefoglaló táblázatok, folyamatábrák és grafikonok segítségével adunk tanácsokat az olvasónak a kísérlettervezés során felmerülő kérdésekre. Milyen feltételek mellett melyik statisztikai módszert célszerű választani? Minimálisan mekkora minta elemszám szükséges a megfelelő pontosság eléréséhez? Mennyire érzékenyek az egyes statisztikai algoritmusok a feltételek megsértésére? A második fejezet egyrészt 15 részletesen dokumentált esettanulmányt tartalmaz, melyek többségében éles statisztikai probléma SPSS-sel történő komplex kiértékeléseinek jegyzőkönyvei. A második fejezet másrészt tartalmaz még 63 további feladatot is, melyekhez többé vagy kevésbé részletes megoldási útmutatókat adunk. Javasoljuk, hogy ezeket a feladatokat az SPSS programcsomag segítségével az olvasó maga is oldja meg, mintegy önmagát ellenőrizve, hogy mennyire jutott előre az anyag elsajátításában. A kitűzött feladatok egyrészt segítik a statisztikai módszerek jobb megértését, másrészt példát mutatnak a programrendszer ügyesebb, trükkösebb alkalmazására is. Ebben a fejezetben olvasható még a mintafeladatoknál felhasználandó példafájlok részletes leírása is. Ezek a fájlok letölthetők az internetről, a következő honlapról: http://www.szit.bme.hu/~kela/spsskönyv/példafájlok A szerzők ezen a helyen is megköszönik a két lektor Fekete István és Pröhle Tamás, mindketten az ELTE matematikusai alapos és lelkiismeretes munkáját. A szerzők remélik, hogy az olvasó a már aktív és a potenciális SPSS felhasználó egyaránt hasznos segédanyagot kap kézhez. A könyvvel kapcsolatos bármilyen kérést, észrevételt, javaslatot szívesen veszünk. Az ezzel kapcsolatos elektronikus leveleket a kela@szit.bme.hu e-mail címre kérjük. [ ] Budapest, 2005. október Ketskeméty László és Izsó Lajos Ketskeméty Izsó Könyves Tóth: SPSS 8.

Ketskeméty Izsó Könyves Tóth: SPSS 9.