Adattípusok, ábrák és grafikonok az excelben
Táblázatok és grafikonok Elsőként mindig érdemes táblázatokba rendezni és ábrázolni az adatokat! Miért? Ismerkedjünk az adatokkal! Milyen különbségek látszanak? Milyen irányba? A statisztika semmit nem mond, ha mindezt nem látjuk! Az soha nem elég információ, hogy szignifikánsak a különbségek!!! Bizonyos esetekben a teszt megválasztását is befolyásolhatja, amit a vizuális benyomások keltenek! (l. később az egy vagy kétoldalas tesztek)
Megakadásjelenség Amit ne Ne felejtsük el a PONTOS tengelycímeket!!! darab?? %?? Más??! Mi a dimenzió??? Se a jelmagyarázatot! (mi a két oszlop?) Kétdimenziós adatokat sose 15 ábrázoljunk 3D-ben! 2 db adatot 10 általában 5 nem ábrázolunk grafikonon 0 kutya cica tehénke
Táblázatok és grafikonok Kérdés: hogyan változik a magánhangzók azonosítása az éneklésben az f0 függvényében? (identification_test_halg.xlsx) Hipotézis: csökken az ejtési szándék szerinti azonosítás aránya, mert egyre jobban megváltozik a magánhangzók ejtése. Észlelési kísérlet (identification_test.xlsx) Excel táblázat (milyen infók vannak benne? Honnan?) Alakítsuk át a nyers adatokat! nyers_egyadatkozlo fül Hogyan elemezzem? Confusion matrices (SPSS): inger válasz párok
Táblázatok és grafikonok Kérdés: hogyan változik a magánhangzók azonosítása az éneklésben az f0 függvényében? (identification_test_halg.xlsx) Hipotézis: csökken az ejtési szándék szerinti azonosítás aránya, mert egyre jobban megváltozik a magánhangzók ejtése. Alakítsuk át a nyers adatokat! nyers_egyadatkozlo fül darab(), darab2(), darabteli(), jobb(), bal(), sorokból oszlopok Confusion matrices (SPSS): inger válasz párok Analyze > tables > Custom tables Darabszám vagy az összes válasz százalékos aránya: count + row total N %, Adatok szétszedése csoportokra: split file f0-ra és test/filler-re!!!
Táblázatok és grafikonok
Táblázatok és grafikonok Kérdés: Hogyan ítélnek meg bizonyos innovatív nyelvi formákat felnőtt magyar anyanyelvű beszélők? A nyelvi formák két változatának elfogadottsága érdekel! (innovativ_halg.xlsx) Hipotézis:? (exploratív elemzés) Elfogadható a mondat? 1: egyáltalán nem 5: teljesen Likert skálás válaszok hogyan elemezzem?
Táblázatok és grafikonok innovativ_halg.xlsx Sorsz.: adatközlő száma Valtozo: nyelvi változó, aminek a két variánsát teszteltük Valtozo variansa: a két variáns valasztipus: a két variáns a konzervatív és innovatív kategóriák szerint átkódolva (ez érdekel minket, mert ettől lesz minden nyelvi változó együtt kezelhető) Ertekeles: válasz 1-5-ig terjedő skálán
Táblázatok és grafikonok Elfogadható a mondat? 1: egyáltalán nem 5: teljesen Arra vagyok kíváncsi, hogy milyen az újabb (innovatív) vagy a régebbi (konzervatív) változó megítélése az összes változó esetben: Van eltérés köztük? Ha van, melyiket preferálják a kettőből? Boxplot (spss): clustered! Variable: ertekeles, Cathegory Axis: kerdeskategoria, Clusters by: innovkonzvalasz
Mit tehetek, ha arra vagyok kíváncsi, hogy relatíve, az összes nyelvi változóban, egymáshoz képest van-e eltérés a két változat megítélése között? ezek a relatív eltérések mekkora horderejűek azaz van-e kiugróan eltérő (jó vagy rossz) megítélésű relatíve, az átlagoshoz képest És szeretném kivonni a képletből az egyéni válaszadási stratégiákat is.
Standardizálás SPSSben & boxplot Mivel az emberek egyedi válaszadási stratégiákkal élnek, és az egy emberen belüli kiugrások érdekelnek standardizálás egyénenként. Split by subject Analyze > Descriptive Statistics > Descriptives > Variables: ertekeles > TICK boksz: save standardized values as variables egy új oszlopban elmenti a standardizált értékeket. Ábra? Boxplot: split visszavonása, clustered by innovkonz
Standardizálás: az adott érték hány szórásnyira van az átlagtól 0: átlagos Előjel: (--) kisebb vagy (+) nagyobb mint az átlag Értelmezés: Az akiami innovatív, az anema innovatív és kisebb mértékben az iknemik ikes értékelése kirívó kirívóan elutasítják.
Táblázatok és grafikonok Kérdés: Hogyan viszonyulnak a gyermekek magánhangzói a felnőtt beszélőkéhez? (gyermek_felnott.xlsx) Hipotézis: A gyermek magánhangzói magasabb frekvenciákon és nagyobb térben helyezkednek el, mert a gyermekek toldalékcsöve rövidebb. Formánsfrekvenciák Hogyan elemezzem? Első körben grafikusan excel!!!
Táblázatok és grafikonok Kérdés: Hogyan viszonyulnak a gyermekek magánhangzói a felnőtt beszélőkéhez? (gyermek_felnott.xlsx) Hipotézis: A gyermek magánhangzói magasabb frekvenciákon és nagyobb térben helyezkednek el, mert a gyermekek toldalékcsöve rövidebb. Akusztikus magánhangzótér #1 az összes adat pontdiagramon elkülönítés a Vk mentén.
F2 (Hz) Pontdiagram 3200 2700 2200 1700 1200 700 100 300 500 700 900 1100 1300 1500 F 1 (Hz) a: i: u: a: i: u: Minden V egy adatsor X-Y pontdiagram Tengelycímek!!!
Alakítsuk úgy a diagram orientációját, hogy megfeleljen az IPA konvenciónak. Mit kell ehhez tenni?
Alakítsuk úgy a diagram orientációját, hogy megfeleljen az IPA konvenciónak. Mit kell ehhez tenni? x-tengely: F2 y-tengely: F1 Tengelyek megfordítása
Akusztikus magánhangzótér #2 ugyanezen adatokkal, összekötött pontdiagram mediánokkal vagy átlagokkal elkülönítés az életkor mentén.
F2 (Hz) Összekötött pontdiagram átlagokkal 3500 3000 í 2500 2000 á 1500 ú 1000 200 400 600 800 1000 1200 F1 (Hz) gyermek felnott
Táblázatok és grafikonok Kérdés: Hogyan viszonyulnak a gyermekek magánhangzói a felnőtt beszélőkéhez? (gyermek_felnott_halg.xlsx) Hipotézis: A gyermek magánhangzói magasabb frekvenciákon és nagyobb térben helyezkednek el, mert a gyermekek toldalékcsöve rövidebb. Formánsfrekvenciák Hogyan elemezzem? Szorgalmi: centralizáció mértékének operacionalizálása az egyes V-k euklideszi távolságának kiszámítása a V-tér középpontjától
F2 (Hz) euk dist = (x 1 x 2 ) 2 + (y 1 y 2 ) 2 Ahol az egyik pont koordinátái (x 1, y 1 ), a másiké (x 2,y 2 ) V-tér középpontja pl. a szélső V-k átlaga : 3500 gyermek 3000 í felnott 2500 2000 1500 1000 ú á 200 700 1200 F1 (Hz) x centr = F1 ú + F1 á 2 y centr = F2 i + F2 ú 2
Otthoni feladat gyakorlásképpen Ugyanolyan időtartamúak a nyelvileg hosszú magánhangzók (a nyelvállástól függetlenül)? (longvow.xlsx) Hipotézis: Nem, a magánhangzók időtartama a nyelvállásfokkal változik (felső < középső < alsó és legalsó). Adatok: veláris V-k időtartamai Hogyan elemezzem (grafikusan)? Egy lehetőség: Boxplot. Adatok forrása: http://clara.nytud.hu/~mady/courses/statistics/2012tavasz/index.html
Otthoni feladat gyakorlásképpen Ugyanolyan időtartamúak a nyelvileg hosszú magánhangzók (a nyelvállástól függetlenül)? (longvow.xlsx) Hipotézis: Nem, a magánhangzók időtartama a nyelvállásfokkal változik (felső < középső < alsó és legalsó). Egy további lehetőség: átlag + szórás ábrázolása (SPSS) Adatok forrása: http://clara.nytud.hu/~mady/courses/statistics/2012tavasz/index.html
Táblázatok és grafikonok Kérdés: Átlagosan az állat vagy a növénynevek a hosszabbak? (ratings.xlsx) Hipotézis:? (exploratív) boxplot (otthon!) Hisztogram ezt csináljuk meg! Error bar (otthon!) Mi az összefüggés a szó hossza és a gyakorisága között? Lásd a folytatásban: korrelációelemzés. Adatok forrása: R, languager csomag
Összefüggés a szóhossz és gyakoriság Intuitívan: Készítsünk egy pontdiagramot, ami a két tengely a két adat között?
Érzékelünk valamiféle trendet
Érzékelünk valamiféle trendet
Házi feladat Ábrázoljuk a felnőtt nő és a gyermek magánhangzóit az akusztikus magánhangzótérben (F1 F2 tér) úgy, hogy annak állása az az IPA elrendezéssel (azaz az artikulációs V-térrel) egyezzen! Érdemes használni az adatsor hozzáadása opciót! Állítsuk az x tengelyt a (200, 1300) tartományra! Állítsuk az y tengelyt az (500, 3500) tartományra! Mindkét skálán állítsuk be fő léptéknek az 500 Hz-et, kisléptéknek a 250 Hz-et! Vegyük fel a segédrácsokat! Vegyük fel a megfelelő tengelyfeliratokat (zárójelben a mértékegységgel)! Formázzuk meg úgy az adatsorokat, hogy elkülönüljenek a gyermek és a felnőtt nő adatai, de a megfelelő magánhangzók összetarozzanak (pl. más szín, de azonos forma)! Mentsük el a grafikont pdf-ben! Készítsük el a grafikont logaritmizált skálával is! Hasonlítsuk össze a két grafikont.