A Statisztika I. tárgy eredményessége és a hallgatók csoportosítása teljesítményük alapján Ország Gáborné Szobonya Réka Kulcsszavak: statisztika, matematika, eredményesség, nyelvismeret, kapcsolatvizsgálat, klaszter statistics, mathematics, efficiency, command of language, correlation, cluster JEL: A22; C36; C38 Összefoglalás A Budapesti Gazdasági Főiskola Pénzügyi és Számviteli Karán nappali alapképzésen a 2012/2013. tanévben a Statisztika I. kötelező alapozó tárgyat a II. félév elején 737 hallgató vette fel tanrendjébe. A tárgy két egyenként 50 pontos zárthelyi dolgozat megírásával zárult. Vizsgáljuk a két zárthelyi dolgozat pontszámát, az együttes pontszámot, valamint az elért eredményeket befolyásoló tényezőket. A hallgatók előélete nagyon fontos információkat rejt, hiszen a középiskolai tanulmányok minél magasabb szintű lezárása nagyban meghatározhatja a főiskolán elért eredményeket. A rendelkezésünkre álló adatok alapján a hallgatókat egymástól jól elkülöníthető csoportokra bontjuk, hogy teljesítményük alapján jellemezni tudjuk őket. Abstract In the Budapest Business School College of Finance and Accountancy 737 students attended the compulsory course unit Statistics I. at the beginning of the Spring semester of 2012/2013 in full-time courses on bachelor level. The course ended with writing two 50 points each tests. We investigate the factors influencing the results, the points obtained in the two written tests and the total points. Studies before the college provide very important information, since the completion of high school studies at a better level can significantly influence the results at the college. On the basis of data available students are separated into groups to have the possibility to characterize them according to their performance. Bevezetés 1
Kutatásunk a 2012/13. tanév II. félévében oktatott Statisztika I. alapozó tantárgy teljesítésének eredményességére, valamint a hallgatók kategorizálására irányul. A tárgy gyakorlati jeggyel zárul, melynek feltétele a szemináriumok rendszeres látogatása és két 50 pontos zárthelyi dolgozat legalább 20 pontra történő megírása. Véleményünk szerint az érdemjegyet több tényező befolyásolja, amelyek nagy része a középiskolai tanulmányokhoz kapcsolódik. Ezért a főiskola elektronikus nyilvántartási rendszeréből származó adatbázist kibővítettük a felvételivel kapcsolatos információkkal. Előzetes feltevéseink között szerepel, hogy a matematika érettségi megléte, illetve annak emelt szinten történő teljesítése erős befolyással van a statisztika eredményekre. További feltételezésünk, hogy a hallgatók a felvételi teljesítményük, valamint a félév során nyújtott eredményük alapján kategorizálhatók. A zárthelyi dolgozatok eredményei 649 olyan hallgató volt, aki mindkét dolgozatot megírta, melyek eredményének kapcsolatát kétváltozós korreláció- és regressziószámítás segítségével vizsgáltuk. A legjobb közelítést a lineáris függvény adta, melynek magyarázóereje 40,6%. A második zárthelyi eredményének átlaga 4 ponttal alacsonyabb lett, mint az először megírté. A két dolgozat közötti kapcsolat pozitív irányú, közepes erősségű, amit az 1. ábra szemléltet. Az első negyedév végén 692 fő írt zárthelyi dolgozatot, melyek eredményeit szakok szerint összehasonlítottuk. Az első tárgyfelvevők (normál kurzusok: Emberi erőforrások, Gazdálkodási és menedzsment, Pénzügy és számvitel) pontszámai szignifikánsan nem különböznek az ún. speciális kurzus (nem első tantárgyfelvétel) hallgatóinak eredményeitől. A fenti négy kategória átlagpontszámai 1%-os szignifikanciaszint mellett még egyformáknak tekinthetők. Az első dolgozat eredményességét befolyásoló tényezők közül az alábbiakat vettük figyelembe: a két érettségi tárgy, azok szintje és eredményei (százalékos érték), a felvételi eljárás során elért hozott és többletpont, nyelvvizsgával igazolt nyelvek száma, középiskola típusa, nem, oktató, életkor. Ezekhez képeztünk még két mesterséges változót: érettségizett-e a hallgató matematikából, illetve ezt emelt szinten tette-e. A többváltozós regressziószámítás során 10 tényező bizonyult 2
szignifikánsnak, de a modell szerint a matematika érettségi emelt szintű teljesítése nem volt hatással az első dolgozat eredményére. 50 45 40 y = 0,7848x + 1,0467 R² = 0,4055 2. zh pontszáma (pont) 35 30 25 20 15 10 5 0 0 10 20 30 40 50 1. zh pontszáma (pont) 1. ábra: Az 1. és a 2. zárthelyi dolgozat eredménye közötti kapcsolat Forrás: Saját adatbázis Megvizsgáltuk, hogy a matematika érettségi léte befolyásolja-e az elért pontszám nagyságát. Az eltérés közelítőleg öt pont volt. Elgondolkodtató tény, hogy a vizsgálatba került hallgatók harmadának felvételi pontszámában nem szerepel a matematika érettségi. A következő lépésben csak a normál kurzus pontszámait elemeztük, ugyanis a speciális kurzus hallgatóinak eredményeit kevésbé befolyásolják a felvételivel kapcsolatos tényezők. Az optimális regressziófüggvény 31,1%-ot magyaráz meg az első zárthelyi dolgozat pontszámának szóródásából. A szorgalmi időszak végén 649 olyan hallgató volt, aki az első után a második dolgozatot is megírta. Az eredmény alakulását vizsgáló regressziófüggvény magyarázó változóihoz kapcsoltuk még az első zárthelyi eredményét is. Az ismérvek nagy része nem bizonyult szignifikánsnak, a magyarázóerő 40,4%-os volt. A szakok, valamint a normál és speciális kurzusok pontszámai között nem 3
tapasztaltunk eltérést. Magasabb pontszámot értek el azok a hallgatók, akik a matematika érettségi közép vagy emelt szintű teljesítményét a felvételi eljárás során elismertették. A speciális kurzus hallgatóinak eredményeit kiszűrve a többszörös determinációs együttható értéke 43,7%-ra javult. A szorgalmi időszak eredményének értékelése A Statisztika I. tantárgyat felvett 737 hallgatóból 581 fő kapott a félév végén gyakorlati jegyet. Az érdemjegy megszerzésének feltétele az órák rendszeres látogatása, valamint a két zárthelyi dolgozatból minimum 20 pont megszerzése volt. Ezen követelményeket a hallgatók 78,8%-a teljesítette. A félév végén elért összes pontszám szakonként és kurzustípusonként közel azonosnak tekinthető. A következő elemzésben csak azok a hallgatók szerepeltek, akik megszerezték az aláírást. A bevont változók kivéve a zárthelyi dolgozatok eredményeit közül csupán három nem volt szignifikáns, a többi a dolgozatok összpontszámának szóródását 25,4%-ban magyarázta. Kiemelten nagy hatása volt ismét a matematika érettségi meglétének és emelt szintjének. Az összes hallgatóra vonatkozóan 10 és 8, az érvényes gyakorlati jegyet szerzettekre pedig 6 és 10 pontos előny származott ebből. A gyakorlati jegy szorgalmi időszakban történő megszerzése a Gazdálkodási és menedzsment szakosok esetén volt a legsikeresebb. Az elégtelen gyakorlati jegy javítására a vizsgaidőszakban két lehetőségük volt a hallgatóknak, emiatt az elemzést további tényezővel bővítettük (hányadik jegyből szerezte a végső jegyet). Ezen változó alapján csoportosítottuk az adatokat. A számítások után megállapítható, hogy az év során írt két dolgozatból szerzett végső jegy átlagosan több mint egy jeggyel jobb volt a szorgalmi időszakban. A vizsgaidőszakban történt javítási lehetőségek után emelkedett a teljesítményszint, az aláírást megszerző hallgatók 69%-a sikeresen zárta a félévet. Az elégséges érdemjegyet szerzettek száma megduplázódott, a jó és jeles osztályzatok aránya 10%. A hallgatók kategorizálása teljesítményük alapján Vizsgálatunk célja az volt, hogy a fenti adatbázisban szereplő hallgatókat teljesítményük alapján jól elkülöníthető és jellemezhető csoportokba soroljuk. A klaszteranalízis megvalósításának feltétele, hogy mennyiségi ismérvek álljanak rendelkezésre, ezért az ettől eltérő változókat 4
elhagytuk, így 14 tényezőnk maradt. Elsőként az adatok alkalmasságát vizsgáltuk, az értékeket mértékegységüktől függetlenné tettük, azaz standardizáltuk (0 várható érték, egységnyi szórás) azokat. Kiugró érték nem volt az adatbázisban. A faktoranalízis segítségével megpróbáltuk tömöríteni a változók információtartalmát, de egyértelműen elkülöníthető faktorokat nem sikerült képezni. A klaszterek számának meghatározásához a hierarchikus módszert hívtuk segítségül. Az első esetben nem adtuk meg előre a csoportok számát, hanem az Agglomeration Schedule tábla koefficienseit vizsgáltuk. Az utolsó 14 adat kijelölésével készített vonaldiagram alapján hét klaszter várható. Így a következő lépésben a hierarchikus módszerrel hét kategóriába soroltuk a hallgatókat. A vizsgált egyedek eloszlása azonban nem bizonyult egyenletesnek, és két csoportban is csak egy-egy fő szerepelt. Az előző módszer sikertelensége, valamint adatbázisunk nagy mérete alapján a nem hierarchikus módszerek közül a K-közép eljárást választottuk. A klaszterek számát nem módosítottuk. A kialakult kategóriák számossága egyenletesnek mondható, kivéve az egy egyedet tartalmazó negyedik klasztert. A Final Cluster Centers tábla segítségével megállapítottuk, hogy a legidősebb hallgató képviselt egy csoportot, ezért őt kivontuk a további vizsgálat alól. Újra elvégezve az elemzést, az 1. táblázat szerinti klaszter-elemszámokat kaptuk. 1. táblázat: Klaszterek és elemszámuk Klaszterek Hallgatók száma (fő) 1 74 2 71 3 107 4 80 5 39 6 96 7 108 Érvényes 576 Hiányzó 161 Forrás: Saját adatbázis 5
A végső megoldásként elfogadott hét klaszter adatait a 2. táblázatban foglaltuk össze. A többletpontszám változót nem értékeltük, ugyanis nincs információnk arról, hogy ezt a pontot a hallgató tanulmányi teljesítménye vagy egyéb (pl. szociális) indokok alapján szerezte. Megállapítható, hogy a gyakorlati jegy eredménye és a véglegesen kialakult érdemjegy sorrendjében nincs különbség. Jellemzők 2. táblázat: A klaszterek jellemzői Klaszterek 1 2 3 4 5 6 7 Z: 1.zárthelyi dolgozat -,159,726 1,261 -,581 -,190 -,195,297 Z: 2.zárthelyi dolgozat -,487,994 1,400 -,580 -,312 -,572,201 Z: Pontszám -,195 1,025 1,493 -,439 -,113 -,258,393 Z: Gyakorlati jegy -,686,824 1,556 -,749 -,620 -,741 -,193 Z: Hányadik jegyből,978 -,250 -,250,857,915,770,128 Z: Érettségi tárgy1 (%),109 -,810,651-1,087 -,124,128,738 Z: Érettségi tárgy2 (%) -,569 -,389,582 -,775 -,218,292,801 Z: Nyelvek száma,541 -,512,777 -,796 -,176 -,457,560 Z: Életkor,225 -,032 -,110 -,076,210 -,361 -,098 Z: Felvételi pontszám,506 -,617 1,117-1,159 -,526 -,313,872 Z: Hozott pontszám,395,144,530 -,013-2,546,272,467 Z: Szerzett pontszám -,287 -,758,809-1,199 -,216,259 1,012 Z: Többletpontszám 1,034 -,302,780 -,522 -,340 -,749,254 Z: Végső jegy,046,845 1,483 -,296 -,024 -,112,158 Forrás: Saját adatbázis Az első klaszterbe ( Romlók ) azon hallgatók kerültek, akiknek felvételi eredménye közepesnek mondható (a második érettségi tárgy eredménye azonban alacsony); a szorgalmi időszakban elért teljesítményük az átlagosnál gyengébb; a vizsgaidőszakban történt próbálkozások száma itt a legmagasabb. A második csoportba ( Szorgalmasak ) 71 hallgató került, ahol a felvételi eredmények nem túl jók (kevés nyelvvizsga, alacsony felvételi pontszám), azonban a tantárgy teljesítése itt a második legsikeresebb (magas zárthelyi pontszámok, kevés utóvizsga, jó végső jegy). 6
A harmadik kategóriában ( Okosak ) találhatóak a legjobb diákok; mind a középiskolai, mind pedig a vizsgált főiskolai teljesítmény alapján itt a legkedvezőbbek az eredmények. A negyedik klaszter ( Leggyengébbek ) 80 hallgatót tartalmaz, amely szinte minden vizsgált változó tekintetében a (klaszterek között) megállapított sorrend utolsó helyén található. Az ötödik csoportban ( Közepesek ) olyan diákok vannak, akiknek a felvételi teljesítménye közepes, bár a hozott pontszám itt a legkevesebb. Az első zárthelyi eredménye a második leggyengébb, azonban a félév második részében javult a teljesítmény. A gyakorlati jegy átlagos, az utóvizsgák száma magas, a végső jegy szintén átlagos. A hatodik kategóriában ( Fiatal átlagosak ) lévő hallgatók középiskolai eredményei közepesnél jobbnak mondhatók, a tantárgy teljesítése pedig nem volt sikeres (leggyengébb első zárthelyi eredmény, második legrosszabb végső jegy). Az életkor változót nem tekintettük csoportképző ismérvnek, azonban megállapítható, hogy itt a legalacsonyabb az átlagéletkor. A hetedik klaszter ( Lusták ) hallgatóinak középiskolai előélete kedvező (mindkét érettségi tárgyból a legmagasabbak az értékek), azonban a Statisztika I. tárgy teljesítése csupán átlagosnak tekinthető. Összefoglalás Első előzetes feltevésünk igazolódott, miszerint a matematika érettségi megléte és annak emelt szintje javítja a Statisztika I. érdemjegyet. Az átalakuló felsőoktatás jelenlegi helyzetében nem javasolt a felvételi feltételeként emelt szintű érettségit előírni, bár ezt több szakember is támogatja. Egy korábbi vizsgálatunk során megállapítottuk, hogy a normál és a speciális kurzusok eredményei között szignifikáns eltérés mutatkozik. Jelen tanulmányuk során ilyen különbséget nem tapasztaltunk. A vizsgált jellemzők alapján sikerült a hallgatókat egymástól jól elkülöníthető csoportokba sorolni a klaszteranalízis segítségével. Amennyiben a későbbiekben, a Statisztika II. tárgy kurzusainak kialakítása során ezeket az eredményeket figyelembe tudnánk venni, differenciált oktatással talán kedvezőbb eredményeket érhetnénk el. 7
Köszönetnyilvánítás Köszönetet mondunk Váraljai Lászlónénak, a BGF PSZK Számítóközpont munkatársának az adatbázis elkészítésében nyújtott segítségéért. Források Jánosa András: Adatelemzés SPSS használatával, ComputerBooks Kiadó Kft, Budapest, 2011. Sajtos László, Mitlev Ariel: SPSS kutatási és adatelemzési kézikönyv, Alinea Kiadó, Budapest, 2007. Ország Gáborné, Szobonya Réka: Completion Efficiency and its Influencing Factors of Statistics I. Compulsory Course, Acta Carolus Robertus Károly Róbert Főiskola tudományos közleményei 3 (1), 2013. pp 223 228. Szerzők Ország Gáborné Adjunktus BGF PSZK Módszertani Intézeti Tanszék orszag.gaborne@pszfb.bgf.hu Szobonya Réka Tanársegéd BGF PSZK Módszertani Intézeti Tanszék szobonya.reka@pszfb.bgf.hu 8